CN113269398A - 一种用于配网现场作业人员定制化教培方案辅助设计方法 - Google Patents
一种用于配网现场作业人员定制化教培方案辅助设计方法 Download PDFInfo
- Publication number
- CN113269398A CN113269398A CN202110453898.8A CN202110453898A CN113269398A CN 113269398 A CN113269398 A CN 113269398A CN 202110453898 A CN202110453898 A CN 202110453898A CN 113269398 A CN113269398 A CN 113269398A
- Authority
- CN
- China
- Prior art keywords
- data
- behavior
- violation
- distribution network
- abnormal behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013461 design Methods 0.000 title claims abstract description 15
- 206010000117 Abnormal behaviour Diseases 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000004140 cleaning Methods 0.000 claims abstract description 11
- 238000013145 classification model Methods 0.000 claims abstract description 10
- 230000006399 behavior Effects 0.000 claims description 35
- 238000003066 decision tree Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 5
- 230000007547 defect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
- G06Q50/2057—Career enhancement or continuing education service
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Educational Administration (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种用于配网现场作业人员定制化教培方案辅助设计方法,其中,该方法包括:将配网现场作业人员违章行为数据进行清洗,通过人工方式添加作业人员异常行为分类标记,所述行为标记至少包括异常行为标记;以所述违章行为数据构建词向量空间,并作为异常行为分类模型的输入,将人工设置的行为分类标记作为模型的输出,训练配网现场作业人员异常行为分类模型;以异常行为类别作为配网现场作业人员精准教培方案设计的参考依据,从根本上提高教培效果,助力作业现场安全高效开展。
Description
技术领域
本申请涉及安全技术领域,尤其涉及一种用于配网现场作业人员定制化教培方案辅助设计方法。
背景技术
随着经济与社会的快速发展,用电负荷不断增长,配网设备急剧增加,配网的新增、扩建、技改大修等施工不断增多,造成配网施工复杂程度高、任务重、时间短、危险点多,导致配网现场作业人员伤亡和电气设备故障风险故居不下,给现场施工作业安全管理带来很大的困难。同时配网安全作业规范要求多,若采用普适性的培训方式,难以满足个性化需求和有针对性的培训。
目前,电网公司的大多数培训都采用普适性的方式,这种方式可以极大的节省教育培训资源,在一定程度上能够提高接受培训的人员的技能,但这种方式存在着一个明显的不足,即没有针对性,部分培训内容存在重叠,容易造成培训人员的疲倦,造成培训效果不明显,现场作业人员的作业技能及安全意识得不到根据性的提升。
因此,充分利用现有数据,挖掘数据中潜在的有用信息,辅助教培人员设计有针对性的、满足个性化需求的精准教培方案是提供教培成效的一个有效途径。
发明内容
本发明的目的在于提供一种用于配网现场作业人员定制化教培方案辅助设计方法,以解决现有教培方案设计没有满足个性化需求的不足及在现场作业人员教培过程中效果不明显的问题。
为了实现上述技术效果,本发明通过以下技术方案予以实现。
一种用于配网现场作业人员定制化教培方案辅助设计方法,包括:
对配网现场作业人员行为数据添加行为标记,所述行为标记中至少包括异常行为标记;以所述的异常行为标记,训练异常行为分析模型;
根据异常行为分析模型识别作业人员异常行为类别,结合作业人员基本信息数据生成作业人员异常行为类别;
根据异常行为类别制定定制化教培方案。
在本发明的一个优选实施例中,所述作业人员行为数据包括:与作业人员相对应的作业人员基本信息数据,以及配网现场作业监督人员对作业现场监督过程中记录的违章数据。
在本发明的一个优选实施例中,对作业人员行为数据添加标记,包括:从作业现场违章数据中提出特征数据;
根据提取出的特征数据人工添加作业人员异常行为标记。
在本发明的一个优选实施例中,所述以作业人员违章数据中提取作业特征数据,并对作业异常行为添加行为标记,训练异常行为分析模型,包括:
以所述作业人员违章数据构建词向量空间;
以所述作业人员行为标记数据形成不同作业行为的标签数据;
其中,所述异常行为分析模型为决策树分类模型,所述的模型输入为违章数据构建的词向量空间,模型的输出为作业人员行为标签数据。
在本发明的一个优选实施例中,所述作业人员违章特征通过以下方式构建:
将作业训练样本的原始数据进行分类,并通过人工方式设置每个类别的类别标签;对已分类的原始数据进行清洗,得到所述作业人员违章数据,将人员违章数据与人员信息数据相对应。
在本发明的一个优选实施例中,所述对原始数据进行清洗,包括:对原始数据进行清洗过滤,以去除冗余数据,并实现数据补全;对清洗后的数据进行过滤,去除无用数据;对清洗后的数据进行补全,替换错别字及错别词;
在本发明的一个优选实施例中,所述配网现场作业人员违章数据词向量通过以下方式构建:基于序列标注的隐马尔科夫模型对违章数据进行分词,形成一个分词列表;对已分词的数据去除停用词;对去停用词后的数据进行命名体识别;基于BERT算法构建违章数据词向量。
在本发明的一个优选实施例中,所述决策树分类模型采用启发式对各节点属性进行划分。
在本发明的一个优选实施例中,构建过程如下:开始,构建根结点,将所有训练数据都放在根结点;选择一个最优特征,按照这一特征将训练数据集分割成子集,使得各个子集有一个在当前条件下最好的分类;
如果这些子集已经能够被基本正确分类,那么构建叶结点,并将这些子集分到所对应的叶结点中去,如果还有子集不能被基本正确分类,那么就对这些子集选择新的最优特征,继续对其进行分割,构建相应的结点;如此递归地进行下去,直至所有训练数据子集被基本正确分类,或者没有合适的特征为止;最后每个子集都被分到叶结点上,即都有了明确的类。
本发明将配网现场作业违章数据进行清洗,去除异常数据、对数据进行补全;对清洗后的数据通过人工方式设置行为标记,形成模型训练的基本数据;对形成的训练数据采用隐马尔科夫模型进行分词;对分词后的数据去停用词,并进行命名体识别;采用BERT算法构建违章数据词向量;采用决策树分析算法对构建的词向量数据进行训练,得到能够用于作业人员异常行为分类的推理模型;模型应用,将一段时间内作业人员的作业情况记录数据输入到模型中,模型会自动进行分类,最终得到该阶段内作业人员的作业情况分析结果,并给出相应的教培方案辅助设计建议。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图做简要介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于配网现场作业人员行为画像的精准焦教培方案辅助设计方法步骤流程图;
图2为本申请实例提供的作业人员行为特征数据预处理流程图;
图3为本申请实例提供的一种基于配网现场作业人员行为画像的精准教培方案辅助设计方法实施步骤流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步详细的说明。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清除、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都应当属于本申请保护的范围。
目前配网现场作业人员的教培通常是采用普适性的教培方式,即制定相应的计划,在指定的时间段对相关人员进行教育培训,这种教培方式在一定程度上能够对作业人员在技能及作业意识方面得到提升,但由于没有采用针对性的培训方式,部分技能、作业意识等培训存在着重复、低效的不足,由此部分参与培训的作业人员在心理上可能出现抗拒、不屑的特点,导致培训成效不够显著,浪费了相关的资源。
为了解决现有教培方式中存在的不足,实现从普适性教培向针对性教培的转变,本申请实施例提供了一种基于配网现场作业人员行为画像的精准焦教培方案辅助设计方法。
一种用于配网现场作业人员定制化教培方案辅助设计方法,包括:对配网现场作业人员行为数据添加行为标记,所述行为标记中至少包括异常行为标记;以所述的异常行为标记,训练异常行为分析模型;根据异常行为分析模型识别作业人员异常行为类别,结合作业人员基本信息数据生成作业人员异常行为类别;根据异常行为类别制定定制化教培方案。
下面是本申请的方法实施例。
图1是本申请实施例提的一种信息提取方法的流程图。该方法可以应用于配网不同场景下的现场作业人员教培方案辅助设计。
参见图1所示,该方法可以包括以下步骤:
步骤S110,获取一段时间内某作业人员的作业情况数据。
其中,作业情况数据是由现场监督人员在检查过程中记录的作业现场的违章行为,这些数据与作业单号等标识性数据相关联,通过标识数据可以定位到违章人员的人资数据。
步骤S111,对获得的数据进行清洗及分词处理。
其中,原始数据是有人工记录并上传到系统中的,这些数据存在着随意性等特点。而在文本数据处理过程中对于一些能够使句子通顺,但并没有实际含义的词进行去除是必要的,这些处理工作都可以归结到数据清洗过程中。
步骤S112,基于BERT算法构建词向量。
其中,BERT算法在NLP领域的表现优异,在此,本申请在预训练模型的基础上对原始数据进行训练得到词向量空间,用于后续的分类模型。
步骤S113,采用决策树分类模型获得作业人员画像标签。
决策树模型是一种优秀的树分类模型,采用启发式对各节点属性进行划分。构建过程如下:
开始,构建根结点,将所有训练数据都放在根结点。选择一个最优特征,按照这一特征将训练数据集分割成子集,使得各个子集有一个在当前条件下最好的分类。如果这些子集已经能够被基本正确分类,那么构建叶结点,并将这些子集分到所对应的叶结点中去,如果还有子集不能被基本正确分类,那么就对这些子集选择新的最优特征,继续对其进行分割,构建相应的结点。如此递归地进行下去,直至所有训练数据子集被基本正确分类,或者没有合适的特征为止。最后每个子集都被分到叶结点上,即都有了明确的类。这就生成了一棵决策树。
步骤S114,获得作业人员画像标签。
参照图2和图3所示,作业人员行为数据包括:与作业人员相对应的作业人员基本信息数据,以及配网现场作业监督人员对作业现场监督过程中记录的违章数据。
具体地,对作业人员行为数据添加标记,包括:从作业现场违章数据中提出特征数据;根据提取出的特征数据人工添加作业人员异常行为标记。
其中所述以作业人员违章数据中提取作业特征数据,并对作业异常行为添加行为标记,训练异常行为分析模型,包括:
以所述作业人员违章数据构建词向量空间;
以所述作业人员行为标记数据形成不同作业行为的标签数据;
其中,所述异常行为分析模型为决策树分类模型,所述的模型输入为违章数据构建的词向量空间,模型的输出为作业人员行为标签数据。
上述所述作业人员违章特征通过以下方式构建:将作业训练样本的原始数据进行分类,并通过人工方式设置每个类别的类别标签;对已分类的原始数据进行清洗,得到所述作业人员违章数据,将人员违章数据与人员信息数据相对应。
对原始数据进行清洗,包括:对原始数据进行清洗过滤,以去除冗余数据,并实现数据补全;对清洗后的数据进行过滤,去除无用数据;对清洗后的数据进行补全,替换错别字及错别词;
在本发明的一个优选实施例中,所述配网现场作业人员违章数据词向量通过以下方式构建:基于序列标注的隐马尔科夫模型对违章数据进行分词,形成一个分词列表;对已分词的数据去除停用词;对去停用词后的数据进行命名体识别;基于BERT算法构建违章数据词向量。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (9)
1.一种用于配网现场作业人员定制化教培方案辅助设计方法,其特征在于,包括:
对配网现场作业人员行为数据添加行为标记,所述行为标记中至少包括异常行为标记;以所述的异常行为标记,训练异常行为分析模型;
根据异常行为分析模型识别作业人员异常行为类别,结合作业人员基本信息数据生成作业人员异常行为类别;
根据异常行为类别制定定制化教培方案。
2.根据权利要求1所述的方法,其特征在于,所述作业人员行为数据包括:
与作业人员相对应的作业人员基本信息数据,以及配网现场作业监督人员对作业现场监督过程中记录的违章数据。
3.根据权利要求2所述的方法,其特征在于,对作业人员行为数据添加标记,包括:从作业现场违章数据中提出特征数据;
根据提取出的特征数据人工添加作业人员异常行为标记。
4.根据权利要求3所述的方法,其特征在于,所述以作业人员违章数据中提取作业特征数据,并对作业异常行为添加行为标记,训练异常行为分析模型,包括:
以所述作业人员违章数据构建词向量空间;
以所述作业人员行为标记数据形成不同作业行为的标签数据;
其中,所述异常行为分析模型为决策树分类模型,所述的模型输入为违章数据构建的词向量空间,模型的输出为作业人员行为标签数据。
5.根据权利要求4所述的方法,其特征在于,所述作业人员违章特征通过以下方式构建:
将作业训练样本的原始数据进行分类,并通过人工方式设置每个类别的类别标签;对已分类的原始数据进行清洗,得到所述作业人员违章数据,将人员违章数据与人员信息数据相对应。
6.根据权利要求5所述的方法,其特征在于,所述对原始数据进行清洗,包括:对原始数据进行清洗过滤,以去除冗余数据,并实现数据补全;对清洗后的数据进行过滤,去除无用数据;对清洗后的数据进行补全,替换错别字及错别词。
7.根据权利要4所述的方法,其特征在于,所述配网现场作业人员违章数据词向量通过以下方式构建:
基于序列标注的隐马尔科夫模型对违章数据进行分词,形成一个分词列表;
对已分词的数据去除停用词;
对去停用词后的数据进行命名体识别;基于BERT算法构建违章数据词向量。
8.根据权利要4所述的方法,其特征在于,所述决策树分类模型采用启发式对各节点属性进行划分。
9.根据权利要8所述的方法,其特征在于,构建过程如下:
开始,构建根结点,将所有训练数据都放在根结点;选择一个最优特征,按照这一特征将训练数据集分割成子集,使得各个子集有一个在当前条件下最好的分类;
如果这些子集已经能够被基本正确分类,那么构建叶结点,并将这些子集分到所对应的叶结点中去,如果还有子集不能被基本正确分类,那么就对这些子集选择新的最优特征,继续对其进行分割,构建相应的结点;如此递归地进行下去,直至所有训练数据子集被基本正确分类,或者没有合适的特征为止;最后每个子集都被分到叶结点上,即都有了明确的类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110453898.8A CN113269398A (zh) | 2021-04-26 | 2021-04-26 | 一种用于配网现场作业人员定制化教培方案辅助设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110453898.8A CN113269398A (zh) | 2021-04-26 | 2021-04-26 | 一种用于配网现场作业人员定制化教培方案辅助设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113269398A true CN113269398A (zh) | 2021-08-17 |
Family
ID=77229565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110453898.8A Pending CN113269398A (zh) | 2021-04-26 | 2021-04-26 | 一种用于配网现场作业人员定制化教培方案辅助设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113269398A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020687A (zh) * | 2019-04-10 | 2019-07-16 | 北京神州泰岳软件股份有限公司 | 基于操作人员态势感知画像的异常行为分析方法及装置 |
CN111131185A (zh) * | 2019-12-06 | 2020-05-08 | 中国电子科技网络信息安全有限公司 | 基于机器学习的can总线网络异常检测方法及装置 |
CN111984788A (zh) * | 2020-08-20 | 2020-11-24 | 广东电网有限责任公司清远供电局 | 电力系统违章管理方法、装置及电力设备 |
-
2021
- 2021-04-26 CN CN202110453898.8A patent/CN113269398A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020687A (zh) * | 2019-04-10 | 2019-07-16 | 北京神州泰岳软件股份有限公司 | 基于操作人员态势感知画像的异常行为分析方法及装置 |
CN111131185A (zh) * | 2019-12-06 | 2020-05-08 | 中国电子科技网络信息安全有限公司 | 基于机器学习的can总线网络异常检测方法及装置 |
CN111984788A (zh) * | 2020-08-20 | 2020-11-24 | 广东电网有限责任公司清远供电局 | 电力系统违章管理方法、装置及电力设备 |
Non-Patent Citations (1)
Title |
---|
张心怡: "基于本体的矿工不安全行为判识方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑(月刊)》, pages 23 - 70 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bang et al. | Explaining a black-box by using a deep variational information bottleneck approach | |
CN105930347B (zh) | 基于文本分析的停电原因识别系统 | |
CN107861942A (zh) | 一种基于深度学习的电力疑似投诉工单识别方法 | |
CN107862327B (zh) | 一种基于多特征的安全缺陷识别系统和方法 | |
CN111914550B (zh) | 一种面向限定领域的知识图谱更新方法及系统 | |
CN111428058B (zh) | 基于mcm的智适应复习资源推送方法 | |
CN111159356B (zh) | 基于教学内容的知识图谱构建方法 | |
CN114519524A (zh) | 基于知识图谱的企业风险预警方法、装置及存储介质 | |
CN109933783A (zh) | 一种不良资产经营领域的合同要素化方法 | |
CN111428480A (zh) | 简历识别方法、装置、设备及存储介质 | |
Sisovic et al. | Mining student data to assess the impact of moodle activities and prior knowledge on programming course success | |
CN116861924A (zh) | 基于人工智能的项目风险预警方法及系统 | |
JP2019144706A (ja) | 関係性推定モデル学習装置、方法、及びプログラム | |
Müller et al. | An interactive explanatory AI system for industrial quality control | |
CN110362828B (zh) | 网络资讯风险识别方法及系统 | |
CN113269398A (zh) | 一种用于配网现场作业人员定制化教培方案辅助设计方法 | |
CN111160756A (zh) | 基于二次人工智能算法的景区评估方法及模型 | |
CN111666748A (zh) | 一种自动化分类器的构造方法以及从软件开发文本类制品中识别决策的方法 | |
CN115271504A (zh) | 一种在线教学考评方法及系统 | |
CN113919567A (zh) | 一种结合知识追踪和序列标注模型的试卷成绩预测方法 | |
Vogelsang et al. | Supporting the development of cyber-physical systems with natural language processing: A report | |
CN112968941B (zh) | 一种基于边缘计算的数据采集和人机协同标注方法 | |
CN108959588A (zh) | 基于大数据的文本客服机器人智能学习方法 | |
CN108959275A (zh) | 基于在线语言翻译的人机对练系统 | |
CN110674239B (zh) | 一种地理要素自动分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |