CN116738981A - 基于电网标准词库的电网数据安全监控方法及系统 - Google Patents
基于电网标准词库的电网数据安全监控方法及系统 Download PDFInfo
- Publication number
- CN116738981A CN116738981A CN202310517937.5A CN202310517937A CN116738981A CN 116738981 A CN116738981 A CN 116738981A CN 202310517937 A CN202310517937 A CN 202310517937A CN 116738981 A CN116738981 A CN 116738981A
- Authority
- CN
- China
- Prior art keywords
- power grid
- word segmentation
- labeling
- corpus
- segmentation result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000011218 segmentation Effects 0.000 claims abstract description 66
- 238000002372 labelling Methods 0.000 claims abstract description 45
- 230000006870 function Effects 0.000 claims description 20
- 238000013461 design Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 claims description 7
- 238000009960 carding Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007670 refining Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000007726 management method Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013499 data model Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于电网标准词库的电网数据安全监控方法及系统,该方法包括:基于电网公司的各类文档,提取各类文档中的语料样本;基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。本发明提供一种基于电网标准词库的电网数据安全监控方法及系统,其能够建立电网行业的标准词库,并在电网标准词库的基础上,对电网数据进行安全监控。
Description
技术领域
本发明涉及电力技术领域,特别是关于一种基于电网标准词库的电网数据安全监控方法及系统。
背景技术
随着社会各行各业向数字化、网络化、智能化发展,大数据和信息技术的应用将为电力企业带来潜在机遇和广阔的应用场景。然而在把握市场机遇的同时,电力大数据也面临一些挑战,比如如何释放电力大数据价值,如何建立权威、共享、安全的大数据体系是电力大数据领域重点关注的问题。
电力企业的数据资产呈现典型的大数据特征,这些电力数据来自电力生产和电能使用的发电、输电、变电、配电和调度各个环节,包括电网运行、设备管理、营销服务和企业管理等各类数据,蕴藏着反映电力企业生产经营和客户服务状况的丰富信息。
企业数据经过多年的积累,数量庞大;同时在多级管理、多专业管控中,体现出数据口径多样、各专业口径数据差异、综合数据歧义等情况。同时上述数据分散在不同单位、不同专业应用系统中,数据基础不统一,质量参差不齐,因此为企业各级专业管理以及信息化建设带来困扰。
因此,为了对电网的数据安全进行监控,需要对电网的数据信息进行分析和提取,但这些都离不开电网标准词库,本发明实施例提供一种电网标准词库的构建方法。
发明内容
本发明的目的在于提供一种基于电网标准词库的电网数据安全监控方法及系统,其能够建立电网行业的标准词库,并在电网标准词库的基础上,对电网数据进行安全监控。
第一方面,本发明实施例提供一种基于电网标准词库的电网数据安全监控方法,包括:
基于电网公司的各类文档,提取各类文档中的语料样本;
基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;
通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;
根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。
进一步地,所述基于电网公司的各类文档,提取各类文档中的语料样本,包括:
通过识别软件系统的模型设计文件或对现有电网系统的物理模型进行逆向工程处理,获取所述电网公司的元数据定义信息;
根据所述元数据定义信息,对所述元数据信息进行解析,先收集所述电网公司的系统范围、工具范围、配合人员、系统运行环境信息,再通过元数据采集工具抽取系统运行态元数据信息,接着建立无效表过滤规则,对元数据采集结果进行有效表筛选,最后聚焦系统中的关键数据,提炼梳理系统关键数据元素,得到所述语料样本。
进一步地,所述基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注,包括:
基于人工智能引擎和NLP相关技术,结合业务术语关键词信息对所述语料样本进行分词处理,获取初始分词结果;
采用人工辅助的方式,对所述初始分词结果进行标注。
进一步地,还包括:
基于词语库发布功能,将所述分词结果进行发布。
进一步地,还包括:
通过词语库查询功能对发布后关键字进行查询。
第二方面,本发明实施例提供一种基于电网标准词库的电网数据安全监控系统,
包括:
语料模块,用于基于电网公司的各类文档,提取各类文档中的语料样本;
标注模块,用于基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;
修正模块,用于通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;
监控模块,用于根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。
进一步地,所述语料模块包括:
导入单元,用于通过识别软件系统的模型设计文件或对现有电网系统的物理模型进行逆向工程处理,获取所述电网公司的元数据定义信息;
提炼单元,用于根据所述元数据定义信息,对所述元数据信息进行解析,先收集所述电网公司的系统范围、工具范围、配合人员、系统运行环境信息,再通过元数据采集工具抽取系统运行态元数据信息,接着建立无效表过滤规则,对元数据采集结果进行有效表筛选,最后聚焦系统中的关键数据,提炼梳理系统关键数据元素,得到所述语料样本。
进一步地,所述标注模块包括:
分词单元,用于基于人工智能引擎和NLP相关技术,结合业务术语关键词信息对所述语料样本进行分词处理,获取初始分词结果;
标注单元,用于采用人工辅助的方式,对所述初始分词结果进行标注。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面提供的一种基于电网标准词库的电网数据安全监控方法。
第四方面,本发明提供一种非暂态计算机可读存储介质,其特征在于,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面提供的一种基于电网标准词库的电网数据安全监控方法。
与现有技术相比,根据本发明的一种基于电网标准词库的电网数据安全监控方法及系统,首先基于电网公司提供的各类文档,提取各类文档中的语料样本,然后对各类样本的分词结果进行标注,接着通过人工辅助的方式对分词结果的标注进行完善和修正,得到修改后的标注,将分词结果和修改后的标注加入到电网标准词库中,以根据电网标准词库,对电网公司的数据安全进行监控。
附图说明
图1为本发明实施例提供的一种基于电网标准词库的电网数据安全监控方法的流程图;
图2为本发明实施例提供的一种基于电网标准词库的电网数据安全监控系统的结构示意图;
图3为本发明实施例提供了一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书中描述的参考“一种实施方式”或“一些实施方式”等意味着在本发明的一个或多个实施方式中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
图1为本发明实施例提供的一种基于电网标准词库的电网数据安全监控方法的流程图,如图1所示,该方法包括:
S110,基于电网公司的各类文档,提取各类文档中的语料样本;
具体地,通过识别软件系统的模型设计文件或对现有电网系统的物理模型进行逆向工程处理,获取所述电网公司的元数据定义信息;
根据所述元数据定义信息,对所述元数据信息进行解析,先收集所述电网公司的系统范围、工具范围、配合人员、系统运行环境信息,再通过元数据采集工具抽取系统运行态元数据信息,接着建立无效表过滤规则,对元数据采集结果进行有效表筛选,最后聚焦系统中的关键数据,提炼梳理系统关键数据元素,得到所述语料样本。
通过识别软件系统的模型设计文件或对现有系统的物理模型进行逆向工程处理,获取系统的元数据定义信息。支持各种类型数据模型的在线导入,既包含hadoop、hive等大数据环境、也可以支持oracle、db2等传统数据库以及powerdesigner、ERWin等建模软件:
(1)支持各种类型物理模型导入。
(2)支持有效表、重点表的自动识别。
(3)支持和逻辑模型关联关系识别。
(4)支持数据标签的管理。
提供各类数据库中元数据信息的自动采集和解析,当前主要支持Oracle、mysql等数据库类型。元数据的采集按以下顺序进行:
(1)数据采集筹备
收集系统范围、工具范围、配合人员、系统运行环境信息等。
(2)元数据采集
通过元数据采集工具抽取系统运行态元数据信息。
(3)有效表识别
建立无效表过滤规则,对元数据采集结果进行有效表筛选。
(4)重点表识别
聚焦各系统中的关键数据,提炼梳理各系统关键数据元素。
并且,对已导入指定模型的可视化展示,包括实体信息、属性信息、实体关系信息、视图信息、存储过程信息及元数据对象的血缘关系信息等。展示方式包括列表、树形、关系图谱等。
通过对各类文档的标准定义,形成文档识别分析处理模块,可以提供系统中各类文档的在线导入和管理,方便系统从文档中提取各类数据的相关信息。
另外,对已导入设计文档各类数据的可视化展示,可提供对导入的设计文档中各类数据的查询和浏览功能。
S120,基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;
具体地,基于人工智能引擎和NLP相关技术,结合业务术语关键词信息对所述语料样本进行分词处理,获取初始分词结果;
采用人工辅助的方式,对所述初始分词结果进行标注。
基于行业公共词语库对电网行业相关系统的数据模型、设计文档信息进行解析,利用BM25、TextRank、LDA等NLP模型进行语料分析训练,逐步完善词汇库,构建具有电网行业特色的词汇库,提升后续元数据分词和解析的准确性。
S130,通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;
通过人工辅助的方式对于人工智能引擎的分词结果进行完善、修正,对于不正确的结果进行修改。
S140,根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。
词语库管理包含语料训练、语料标注、词语库管理、词语库发布、词语库查询5个功能。通过语料训练功能电网公司的各类文档进行关键词分析引擎的训练;基于语料标注功能采用人工辅助的方式对于分词结果进行标注;通过词语库管理对分词结果进行修改;基于词语库发布功能可将分词结果进行发布;通过词语库查询功能可对发布后关键字进行查询。
在一些实施例中,还包括:
基于词语库发布功能,将所述分词结果进行发布。
在一些实施例中,还包括:
通过词语库查询功能对发布后关键字进行查询。
与现有技术相比,根据本发明的一种基于电网标准词库的电网数据安全监控方法,首先基于电网公司提供的各类文档,提取各类文档中的语料样本,然后对各类样本的分词结果进行标注,接着通过人工辅助的方式对分词结果的标注进行完善和修正,得到修改后的标注,将分词结果和修改后的标注加入到电网标准词库中,以根据电网标准词库,对电网公司的数据安全进行监控。
图2为本发明实施例提供的一种基于电网标准词库的电网数据安全监控系统的结构示意图,如图2所示,该系统包括语料模块210、标注模块220、修正模块230和监控模块240,其中:
采集模块210用于基于电网公司的各类文档,提取各类文档中的语料样本;
词典模块220用于基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;
分词模块230用于通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;
消歧模块240用于根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。
在一些实施例中,所述语料模块包括:
导入单元,用于通过识别软件系统的模型设计文件或对现有电网系统的物理模型进行逆向工程处理,获取所述电网公司的元数据定义信息;
提炼单元,用于根据所述元数据定义信息,对所述元数据信息进行解析,先收集所述电网公司的系统范围、工具范围、配合人员、系统运行环境信息,再通过元数据采集工具抽取系统运行态元数据信息,接着建立无效表过滤规则,对元数据采集结果进行有效表筛选,最后聚焦系统中的关键数据,提炼梳理系统关键数据元素,得到所述语料样本。
在一些实施例中,所述标注模块包括:
分词单元,用于基于人工智能引擎和NLP相关技术,结合业务术语关键词信息对所述语料样本进行分词处理,获取初始分词结果;
标注单元,用于采用人工辅助的方式,对所述初始分词结果进行标注。
本实施例为与上述方法对应的系统实施例,其具体实施过程与上述方法实施例相同,详情请参考上述方法实施例,本系统实施例在此不再赘述。
图3为本发明实施例提供了一种电子设备的结构示意图,如图3所示,该设备包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303上并可在处理器301上运行的计算机程序,以执行上述各实施例提供的用于一种基于电网标准词库的电网数据安全监控方法。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的用于一种基于电网标准词库的电网数据安全监控方法。
以上所描述的电子设备等实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分方法。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
Claims (10)
1.一种基于电网标准词库的电网数据安全监控方法,其特征在于,包括:
基于电网公司的各类文档,提取各类文档中的语料样本;
基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;
通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;
根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。
2.如权利要求1所述的基于电网标准词库的电网数据安全监控方法,其特征在于,所述基于电网公司的各类文档,提取各类文档中的语料样本,包括:
通过识别软件系统的模型设计文件或对现有电网系统的物理模型进行逆向工程处理,获取所述电网公司的元数据定义信息;
根据所述元数据定义信息,对所述元数据信息进行解析,先收集所述电网公司的系统范围、工具范围、配合人员、系统运行环境信息,再通过元数据采集工具抽取系统运行态元数据信息,接着建立无效表过滤规则,对元数据采集结果进行有效表筛选,最后聚焦系统中的关键数据,提炼梳理系统关键数据元素,得到所述语料样本。
3.如权利要求2所述的基于电网标准词库的电网数据安全监控方法,其特征在于,所述基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注,包括:
基于人工智能引擎和NLP相关技术,结合业务术语关键词信息对所述语料样本进行分词处理,获取初始分词结果;
采用人工辅助的方式,对所述初始分词结果进行标注。
4.如权利要求1所述的基于电网标准词库的电网数据安全监控方法,其特征在于,还包括:
基于词语库发布功能,将所述分词结果进行发布。
5.如权利要求1所述的基于电网标准词库的电网数据安全监控方法,其特征在于,还包括:
通过词语库查询功能对发布后关键字进行查询。
6.一种基于电网标准词库的电网数据安全监控系统,其特征在于,包括:
语料模块,用于基于电网公司的各类文档,提取各类文档中的语料样本;
标注模块,用于基于语料标注功能采用人工辅助的方式对于语料样本的分词结果进行标注;
修正模块,用于通过人工辅助的方式对于分词结果的标注进行完善和修正,对于不正确的结果进行修改,获取修改后的标注;
监控模块,用于根据所述分词结果和所述分词结果对应的修改后的标注,获取电网标准词库,并基于所述电网标准词库,对所述电网公司的数据安全进行监控。
7.如权利要求6所述的基于电网标准词库的电网数据安全监控系统,其特征在于,所述语料模块包括:
导入单元,用于通过识别软件系统的模型设计文件或对现有电网系统的物理模型进行逆向工程处理,获取所述电网公司的元数据定义信息;
提炼单元,用于根据所述元数据定义信息,对所述元数据信息进行解析,先收集所述电网公司的系统范围、工具范围、配合人员、系统运行环境信息,再通过元数据采集工具抽取系统运行态元数据信息,接着建立无效表过滤规则,对元数据采集结果进行有效表筛选,最后聚焦系统中的关键数据,提炼梳理系统关键数据元素,得到所述语料样本。
8.如权利要求6所述的基于电网标准词库的电网数据安全监控系统,其特征在于,所述标注模块包括:
分词单元,用于基于人工智能引擎和NLP相关技术,结合业务术语关键词信息对所述语料样本进行分词处理,获取初始分词结果;
标注单元,用于采用人工辅助的方式,对所述初始分词结果进行标注。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如权利要求1至5任一所述的一种基于电网标准词库的电网数据安全监控方法。
10.一种非暂态计算机可读存储介质,其特征在于,其上存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1至5任一所述的一种基于电网标准词库的电网数据安全监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310517937.5A CN116738981A (zh) | 2023-05-09 | 2023-05-09 | 基于电网标准词库的电网数据安全监控方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310517937.5A CN116738981A (zh) | 2023-05-09 | 2023-05-09 | 基于电网标准词库的电网数据安全监控方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116738981A true CN116738981A (zh) | 2023-09-12 |
Family
ID=87908773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310517937.5A Pending CN116738981A (zh) | 2023-05-09 | 2023-05-09 | 基于电网标准词库的电网数据安全监控方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116738981A (zh) |
-
2023
- 2023-05-09 CN CN202310517937.5A patent/CN116738981A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
CN110909986A (zh) | 基于知识图谱的疑似实际控制人的风险识别方法及系统 | |
CN111899089A (zh) | 基于知识图谱的企业风险预警方法及系统 | |
CN113656805B (zh) | 一种面向多源漏洞信息的事件图谱自动构建方法及系统 | |
CN111708774B (zh) | 一种基于大数据的产业分析系统 | |
WO2022095385A1 (zh) | 文档知识抽取方法、装置、计算机设备及可读存储介质 | |
DE102012221251A1 (de) | Semantisches und kontextbezogenes Durchsuchen von Wissensspeichern | |
CN106844782B (zh) | 一种面向网络的多通道大数据采集系统及方法 | |
CN112000773A (zh) | 基于搜索引擎技术的数据关联关系挖掘方法及应用 | |
CN112100402A (zh) | 一种电网知识图谱构建方法及装置 | |
CN112363996B (zh) | 用于建立电网知识图谱的物理模型的方法及系统和介质 | |
CN116738981A (zh) | 基于电网标准词库的电网数据安全监控方法及系统 | |
CN111241077A (zh) | 基于互联网数据的金融欺诈行为的识别方法 | |
CN112416754B (zh) | 一种模型评测方法、终端、系统及存储介质 | |
CN112115271B (zh) | 知识图谱构建方法及装置 | |
CN115408532A (zh) | 一种面向开源情报的武器装备知识图谱构建方法、系统、装置及存储介质 | |
CN114048325A (zh) | 基于知识图谱的案件处理方法及装置、存储介质 | |
CN114722163B (zh) | 数据查询方法、装置、电子设备和存储介质 | |
CN111538813B (zh) | 一种分类检测方法、装置、设备及存储介质 | |
CN115238155A (zh) | 电力企业安全责任制数据智能化提取方法、系统及设备 | |
CN114238657A (zh) | 基于图数据库的高新技术领域企业自动归类方法及系统 | |
CN117635138A (zh) | 异常业务交易账户识别方法及系统 | |
CN117763099A (zh) | 智能客服系统的交互方法及装置 | |
CN115759256A (zh) | 一种安全生产数字化知识库构建方法、系统、介质及设备 | |
CN113283676A (zh) | 一种电网数据分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |