CN111680804B - 一种运检工作票生成方法、设备以及计算机可读介质 - Google Patents
一种运检工作票生成方法、设备以及计算机可读介质 Download PDFInfo
- Publication number
- CN111680804B CN111680804B CN202010490645.3A CN202010490645A CN111680804B CN 111680804 B CN111680804 B CN 111680804B CN 202010490645 A CN202010490645 A CN 202010490645A CN 111680804 B CN111680804 B CN 111680804B
- Authority
- CN
- China
- Prior art keywords
- work
- task
- ticket
- word
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000012423 maintenance Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 10
- 230000002457 bidirectional effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 239000013589 supplement Substances 0.000 claims description 3
- 230000007257 malfunction Effects 0.000 claims description 2
- 238000007689 inspection Methods 0.000 abstract description 21
- 238000003860 storage Methods 0.000 abstract description 7
- 210000001503 joint Anatomy 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 235000010575 Pueraria lobata Nutrition 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 244000046146 Pueraria lobata Species 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 241000219781 Pueraria montana var. lobata Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种运检工作票生成方法、装置、电子设备以及存储介质,本申请通过获取包含多个检修信息的任务信息,所述检修信息中包含单次检修任务的工作地点和任务内容;针对每个所述检修信息的所述工作地点和所述任务内容,对所述所述工作地点和所述任务内容进行模式化处理得到训练集;将所述训练集输入预设的转换模型中将所述训练集中的字转化为初始向量,得到包含多个所述初始向量的初始向量集;将所述初始向量集输入实体标签确定模型中确定与所述初始向量集对应的实体标签,得到实体标签集;基于所述实体标签集生成工作票,实现工作票的智能生成,避免由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,造成检修人员不能很好的对接工作任务单的问题,提升了检修工作的精准和效率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种运检工作票生成方法、装置、电子设备以及存储介质。
背景技术
当前,电力系统中输、变、配电设备运维业务的开展主要依靠人工监视和经验分析,运检作业人员需要进行全面、系统的专业业务培训来掌握相关专业知识。运检人员对知识储备的差异性可能导致其发现、分析和处理设备潜在缺陷或故障精准度低等问题,因而有必要构建智能系统或模块用以辅助一线运检工作人员。
目前,我国电力公司已拥有输、变、配电工程运维领域知识库来支撑运检人员进行巡视、检测、维修和管理工作,但绝大多数单据仍然需要巡检班组组长进行拆分、填写。例如在电力设备运检工作中,通常由电力公司的巡检人员撰写或形成工作任务单,形成对相关电力设备故障、缺陷状态的任务描述,然后由电力公司的巡检班组会根据工作任务单的内容以及班组内检修人员的职责分工,形成分配到人的工作票。
由于专业知识的更新换代以及巡检人员撰写水平问题,造成检修人员不能很好的对接工作任务单,以至检修工作无法完成,效率低下。
发明内容
为了解决上述现有技术中由于专业知识的更新换代以及巡检人员撰写水平问题,造成检修人员不能很好的对接工作任务单,以至检修工作无法完成,效率低下的技术问题,本申请提供了一种运检工作票生成、装置、电子设备以及存储介质。
为了实现上述目的,本发明采用如下技术方案:
一种运检工作票生成方法,所述方法包括:
S101、获取包含多个检修信息的工作任务单;
S102、将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;
S103、获取嵌入层的初始化参数;
S104、将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;
S105、将步骤S104所得的预测结果进行修正;
S106、对词典中所有的词处理,输出实体类型;
S107、将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;
步骤S108,将步骤S107中相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
优选的,S101中,工作任务单的任务信息中包含多个检修信息,每个检修信息中包含的信息为:任务内容、电站|线路、编制部门、编制人中的一项或多项。
优选的,S102具体包括:将工作任务单中的任务内容按行提取到文本文件中,对该文件进行标注;将标注好的文本转换获得转换标注后的训练集;然后将转换标注后的训练集中的句子按字分词获得训练集。
优选的,步骤S102中用标注工具对该文件进行标注;步骤S102中用标注的内容包括:工作地点描述、故障或任务。
优选的,步骤S102中将标注好的文本转换成BIS标注体系或者BIES标注体系。
优选的,S103具体包括:通过语料库训练字转换为向量模型,得到每个字的向量表示,每个字的向量表示用于初始化双向长短时记忆实体抽取模型中嵌入层的参数;将语料库文本中每一条工作任务单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到字转换为向量模型中训练,获得每个字的向量表示,该向量作为嵌入层的初始化参数;
S104具体包括:将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示;将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至Softmax函数中,得出预测结果;
S106具体包括:对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将该方法标记出的标签与从CRF输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型:工作地点或工作任务;
S107具体包括:将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽;
步骤S108具体包括:将步骤S107中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
优选的,步骤S103中字转换为向量模型为word2vec模型。
优选的,步骤S106中采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与S104的预测结果进行对照匹配。
优选的,所述词典为人工从工作任务单中的工作地点以及工作内容提取出来的词库,或者电网运检班组所掌握的对工作地点以及工作内容的文档。
一种运检工作票生成设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述一种运检工作票生成方法的方法步骤。
一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行所述权利要求1至6任一所述一种运检工作票生成方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请通过获取包含多个检修信息的任务信息,所述检修信息中包含单次检修任务的工作地点和任务内容;针对每个所述检修信息的所述工作地点和所述任务内容,对所述工作地点和所述任务内容进行模式化处理得到训练集;将所述训练集输入预设的转换模型中将所述训练集中的字转化为初始向量,得到包含多个所述初始向量的初始向量集;将所述初始向量集输入实体标签确定模型中确定与所述初始向量集对应的实体标签,得到实体标签集;基于所述实体标签集生成工作票,实现工作票的智能生成,避免由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,造成检修人员不能很好的对接工作任务单的问题,提升了检修工作的精准和效率。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在实际应用中,在电力设备运检工作中,通常由电力公司的巡检人员撰写或形成工作任务单,形成对相关电力设备故障、缺陷状态的任务描述。电力公司的巡检班组会根据工作任务单的内容以及班组内检修人员的职责分工,形成分配到人的工作票。我国电力公司已拥有输、变、配电工程运维领域知识库来支撑运检人员进行巡视、检测、维修和管理工作,但绝大多数单据仍然需要巡检班组组长进行拆分、填写。上述知识库内的数据内容尽管已经通过知识采编过程进行统一的结构化处理,但受到系统架构与检索技术的限制,对于电力运检单据的实际支撑效果不甚理想,难以支撑电力运维领域经验知识的积累、固化与传承需求。亟须开展现有电力运维领域知识库的升级改造与创新使用。
本发明提出了一种面向电力运检工作任务单的一种运检工作票生成方法、装置、电子设备以及存储介质,实现工作票的智能生成,用以解决由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,进而引发的检修工作精准度低、时效性差等实际生产问题,推动大电网安全风险防控水平提升。
工作任务单主要有任务内容、电站|线路、编制部门、编制人等属性信息,例如部分相对应的内容如下:葛北务本支4#、15# 输电运维班、王兆阳。其中,各个属性信息都是实体,单划线对应工作票中的工作地点描述,双划线对应工作票中的工作内容,双划线可通过知识图谱匹配其子任务、设备部件以及解决故障方案,即有一对多或者一对一的工作内容,点划线对应工作票中的工作地点,编制部门的编制人将工作内容具体分配给相应班组成员,各司其职完成任务。
基于此,本发明提供了一种运检工作票生成方法,所述方法包括:
步骤S101,获取包含多个检修信息的工作任务单;
在本发明实施例中,工作任务单的任务信息中可以包含多个检修信息,例如在电力检修领域中一次任务信息中可能包含有多个待检修任务,每个检修信息中也可以包含多项信息,例如:任务内容、电站|线路、编制部门、编制人等属性信息等等,而本发明实施例中优选地关注检修任务中的工作地点和任务内容。
步骤S102,将工作票中的任务内容按行提取到文本文件中,用标注工具(brat标注工具)对该文件进行标注,主要标注工作地点描述、故障或任务两项。
将标注好的文本转换成BIS标注体系(B:实体第一个字,I:实体其它位置的字,S:单个字的实体,O:其它非实体部分的字)或者BIES标注(B:实体第一个字;I:实体中间位置的字;E:实体最后一个字;S:单个字的实体;O:其它非实体部分的字)。例如:“葛北务本支4#、15#搭火”的BIES标注体系如下所示:
葛 | 北 | 务 | 本 | 支 | 4 | # | 1 | 5 | # | 搭 | 火 |
O | O | O | O | O | B-de | I-de | I-de | I-de | E-de | B-ta | E-ta |
其中,‘de’表示工作地点描述实体,‘ta’表示工作任务或故障实体。将转换标注体系后的训练集中的句子按字分词获得训练集。
步骤S103,通过语料库(现成的电力领域的语料库)训练多维的word2vec(字转换为向量)模型,得到每个字的向量表示,所述每个字的向量表示用于初始化双向长短时记忆实体抽取模型中嵌入层的参数。将语料库文本中每一条工作单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到word2vec模型中训练,获得每个字的向量表示,该向量作为双向长短时记忆实体抽取模型嵌入层的初始化参数。
步骤S104,将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示。将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至softmax函数中,得出预测结果,该结果是每一个标签的预测概率值,例如对于“搭”,0.7(B-ta)、0.08(E-ta)、0.04(O)等。
步骤S105,从长短时记忆网络模型中得到的预测结果准确率很低,需要对该结果进行修正,故将步骤S104所得的结果输入到CRF模型中进行修正。例如对于文本“4#、15#搭火”,基于BI-LSTM模型输出标签是B-de、I-de、I-de、O、E-de、B-ta、E-ta。很明显,I-de后面不可能接O,按照该路径CRF会受到很大的惩罚,通过CRF模型会得到B-de、I-de、I-de、I-de、E-de、B-ta、E-ta的最优路径,这样就对基于BI-LSTM模型的预测结果进行了修正。
步骤S106,为达到更高的准确率,采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将该方法标记出的标签与从CRF输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型,即工作地点或工作任务。
步骤S107,将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽。
步骤S108,将步骤S107中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
在本发明的又一实施例中,还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现方法实施例所述的运检工作票生成方法。
在本发明的又一实施例中,还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输方法的程序,所述信息传输方法的程序被处理器执行时实现所述的运检工作票生成方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (5)
1.一种运检工作票生成方法,其特征在于,所述方法包括:
S101、获取包含多个检修信息的工作任务单;
S102、将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;
S103、获取嵌入层的初始化参数;
S104、将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;
S105、将步骤S104所得的预测结果进行修正;
S106、对词典中所有的词处理,输出实体类型;
S107、将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;
步骤S108,将步骤S107中相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票;
S101中,工作任务单的任务信息中包含多个检修信息,每个检修信息中包含的信息为:任务内容、电站|线路、编制部门、编制人中的一项或多项;
S102具体包括:将工作任务单中的任务内容按行提取到文本文件中,对该文件进行标注;将标注好的文本转换获得转换标注后的训练集;然后将转换标注后的训练集中的句子按字分词获得训练集;
步骤S102中用标注工具对该文件进行标注;步骤S102中用标注的内容包括:工作地点描述、故障或任务;
步骤S102中将标注好的文本转换成BIS标注体系或者BIES标注体系;
S103具体包括:通过语料库训练字转换为向量模型,得到每个字的向量表示,每个字的向量表示用于初始化双向长短时记忆实体抽取模型中嵌入层的参数;将语料库文本中每一条工作任务单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到字转换为向量模型中训练,获得每个字的向量表示,该向量作为嵌入层的初始化参数;
S104具体包括:将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示;将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至Softmax函数中,得出预测结果;
S106具体包括:对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将该方法标记出的标签与从CRF输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型:工作地点或工作任务;
S107具体包括:将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽;
步骤S108具体包括:将步骤S107中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
2.根据权利要求1所述的一种运检工作票生成方法,其特征在于,步骤S103中字转换为向量模型为word2vec模型。
3.根据权利要求1所述的一种运检工作票生成方法,其特征在于,步骤S106中采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与文本数据进行对照匹配。
4.一种运检工作票生成设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至3任一项所述一种运检工作票生成方法的方法步骤。
5.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至3任一所述一种运检工作票生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010490645.3A CN111680804B (zh) | 2020-06-02 | 2020-06-02 | 一种运检工作票生成方法、设备以及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010490645.3A CN111680804B (zh) | 2020-06-02 | 2020-06-02 | 一种运检工作票生成方法、设备以及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680804A CN111680804A (zh) | 2020-09-18 |
CN111680804B true CN111680804B (zh) | 2023-09-01 |
Family
ID=72452999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010490645.3A Active CN111680804B (zh) | 2020-06-02 | 2020-06-02 | 一种运检工作票生成方法、设备以及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680804B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095524A (zh) * | 2021-05-14 | 2021-07-09 | 中国电力科学研究院有限公司 | 电力设备检修工作单据智能生成方法、系统及存储介质 |
CN114462649B (zh) * | 2022-04-12 | 2022-07-22 | 泰豪软件股份有限公司 | 停电计划管理方法、系统、可读存储介质及计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510076A (zh) * | 2009-03-20 | 2009-08-19 | 西安交大辰方科技有限公司 | 一种电力工作票安全措施描述语句自动生成方法 |
CN105741051A (zh) * | 2015-04-02 | 2016-07-06 | 国网山东省电力公司青岛供电公司 | 一种操作票的智能生成方法及系统 |
CN106557909A (zh) * | 2016-11-21 | 2017-04-05 | 国网四川省电力公司眉山供电公司 | 工作票自动生成系统 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
CN110717039A (zh) * | 2019-09-17 | 2020-01-21 | 平安科技(深圳)有限公司 | 文本分类方法和装置、电子设备、计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107783960B (zh) * | 2017-10-23 | 2021-07-23 | 百度在线网络技术(北京)有限公司 | 用于抽取信息的方法、装置和设备 |
-
2020
- 2020-06-02 CN CN202010490645.3A patent/CN111680804B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510076A (zh) * | 2009-03-20 | 2009-08-19 | 西安交大辰方科技有限公司 | 一种电力工作票安全措施描述语句自动生成方法 |
CN105741051A (zh) * | 2015-04-02 | 2016-07-06 | 国网山东省电力公司青岛供电公司 | 一种操作票的智能生成方法及系统 |
CN106557909A (zh) * | 2016-11-21 | 2017-04-05 | 国网四川省电力公司眉山供电公司 | 工作票自动生成系统 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
CN110717039A (zh) * | 2019-09-17 | 2020-01-21 | 平安科技(深圳)有限公司 | 文本分类方法和装置、电子设备、计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111680804A (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111708773B (zh) | 一种多源科创资源数据融合方法 | |
CN108256074B (zh) | 校验处理的方法、装置、电子设备和存储介质 | |
US9619448B2 (en) | Automated document revision markup and change control | |
US7979793B2 (en) | Graphical creation of a document conversion template | |
US8924415B2 (en) | Schema mapping and data transformation on the basis of a conceptual model | |
US20110137923A1 (en) | Xbrl data mapping builder | |
CN111680804B (zh) | 一种运检工作票生成方法、设备以及计算机可读介质 | |
CN109977014B (zh) | 基于区块链的代码错误识别方法、装置、设备及存储介质 | |
CN113312108B (zh) | Swift报文的校验方法、装置、电子设备及存储介质 | |
CN112671734B (zh) | 面向多数据源的报文处理方法及其相关设备 | |
CN105446986A (zh) | 用于处理web页面的方法和装置 | |
CN107678943A (zh) | 抽象页面对象的页面自动化测试方法 | |
CN113536182A (zh) | 长文本网页的生成方法、装置、电子设备和存储介质 | |
CN111680803B (zh) | 一种运检工作票生成系统 | |
CN109614143B (zh) | Ietm浏览器中自动生成故障流程图的开发方法 | |
Rubasinghe et al. | Tool support for software artefact traceability in DevOps practice: SAT-Analyser | |
CN115033280A (zh) | 一种基于知识图谱的需求规格文档自动化生成方法及存储介质 | |
US10699329B2 (en) | Systems and methods for document to order conversion | |
CN113642291B (zh) | 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端 | |
US20140316830A1 (en) | Synchronized Resource Planning | |
CN111061864B (zh) | 基于特征提取的开源社区Fork摘要自动生成方法、系统及介质 | |
US20230385700A1 (en) | Artificial intelligence engine for transaction categorization and classification | |
CN112651246B (zh) | 融合深度学习和工作流模式的服务需求冲突检测方法 | |
CN116991983B (zh) | 一种面向公司资讯文本的事件抽取方法及系统 | |
US11321377B2 (en) | Storage control program, apparatus, and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |