CN111680803B - 一种运检工作票生成系统 - Google Patents

一种运检工作票生成系统 Download PDF

Info

Publication number
CN111680803B
CN111680803B CN202010490618.6A CN202010490618A CN111680803B CN 111680803 B CN111680803 B CN 111680803B CN 202010490618 A CN202010490618 A CN 202010490618A CN 111680803 B CN111680803 B CN 111680803B
Authority
CN
China
Prior art keywords
module
work
ticket
task
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010490618.6A
Other languages
English (en)
Other versions
CN111680803A (zh
Inventor
谈元鹏
彭国政
张玉天
徐会芳
赵紫璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical State Grid Corp of China SGCC
Priority to CN202010490618.6A priority Critical patent/CN111680803B/zh
Publication of CN111680803A publication Critical patent/CN111680803A/zh
Application granted granted Critical
Publication of CN111680803B publication Critical patent/CN111680803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种运检工作票生成系统,包括:工作任务单获取模块,用于获取包含多个检修信息的工作任务单;数据预处理模块,用于获得训练集;初始化参数获取模块,用于获取嵌入层的初始化参数;预测模块,用于得出预测结果;预测结果修正模块,用于将预测模块所得的预测结果进行修正;处理模块,用于对词典中所有的词处理,输出实体类型;匹配模块,用于将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;输出模块,用于将匹配模块相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。本发明提升了检修工作的精准和效率。

Description

一种运检工作票生成系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种运检工作票生成系统。
背景技术
当前,电力系统中输、变、配电设备运维业务的开展主要依靠人工监视和经验分析,运检作业人员需要进行全面、系统的专业业务培训来掌握相关专业知识。运检人员对知识储备的差异性可能导致其发现、分析和处理设备潜在缺陷或故障精准度低等问题,因而有必要构建智能系统或模块用以辅助一线运检工作人员。
目前,我国电力公司已拥有输、变、配电工程运维领域知识库来支撑运检人员进行巡视、检测、维修和管理工作,但绝大多数单据仍然需要巡检班组组长进行拆分、填写。例如在电力设备运检工作中,通常由电力公司的巡检人员撰写或形成工作任务单,形成对相关电力设备故障、缺陷状态的任务描述,然后由电力公司的巡检班组会根据工作任务单的内容以及班组内检修人员的职责分工,形成分配到人的工作票。
由于专业知识的更新换代以及巡检人员撰写水平问题,造成检修人员不能很好的对接工作任务单,以至检修工作无法完成,效率低下。
发明内容
本发明的目的在于提供一种运检工作票生成系统,以解决解决上述现有技术中由于专业知识的更新换代以及巡检人员撰写水平问题,造成检修人员不能很好的对接工作任务单,以至检修工作无法完成,效率低下的技术问题。
为了实现上述目的,本发明采用如下技术方案:
一种运检工作票生成系统,包括:
工作任务单获取模块,用于获取包含多个检修信息的工作任务单;
数据预处理模块,用于将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;
初始化参数获取模块,用于获取嵌入层的初始化参数;
预测模块,用于将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;
预测结果修正模块,用于将预测模块所得的预测结果进行修正;
处理模块,用于对词典中所有的词处理,输出实体类型;
匹配模块,用于将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;
输出模块,用于将匹配模块相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
优选的,工作任务单的任务信息中包含若干检修信息,每个检修信息中包含的信息为:任务内容、电站|线路、编制部门、编制人中的一项或多项。
优选的,数据预处理模块将工作任务单中的任务内容按行提取到文本文件中,对该文件进行标注;将标注好的文本转换获得转换标注后的训练集;然后将转换标注后的训练集中的句子按字分词获得训练集。
优选的,数据预处理模块标注的内容包括:工作地点描述、故障或任务;数据预处理模块将标注好的文本转换成BIS标注体系或者BIES标注体系。
优选的,数据预处理模块用标注工具brat将工作任务单中的任务内容进行标注。
优选的,初始化参数获取模块通过语料库训练字转换为向量模型,得到每个字的向量表示;初始化参数获取模块将语料库文本中每一条工作任务单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到字转换为向量模型中训练,获得每个字的向量表示作为嵌入层的初始化参数。
优选的,预测模块将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示;预测模块将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至Softmax函数中,得出预测结果。
优选的,处理模块对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将标记出的标签与从CRF输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型:工作地点或工作任务。
优选的,匹配模块将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽。
优选的,输出模块将匹配模块中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
优选的,字转换为向量模型为word2vec模型。
优选的,处理模块采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与预测结果进行对照匹配。
优选的,所述词典为人工从工作任务单中的工作地点以及工作内容提取出来的词库,或者电网运检班组所掌握的对工作地点以及工作内容的文档。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请通过获取包含多个检修信息的任务信息,所述检修信息中包含单次检修任务的工作地点和任务内容;针对每个所述检修信息的所述工作地点和所述任务内容,对所述工作地点和所述任务内容进行模式化处理得到训练集;将所述训练集输入预设的转换模型中将所述训练集中的字转化为初始向量,得到包含多个所述初始向量的初始向量集;将所述初始向量集输入实体标签确定模型中确定与所述初始向量集对应的实体标签,得到实体标签集;基于所述实体标签集生成工作票,实现工作票的智能生成,避免由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,造成检修人员不能很好的对接工作任务单的问题,提升了检修工作的精准和效率。
附图说明
图1为本发明一种运检工作票生成系统的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在实际应用中,在电力设备运检工作中,通常由电力公司的巡检人员撰写或形成工作任务单,形成对相关电力设备故障、缺陷状态的任务描述。电力公司的巡检班组会根据工作任务单的内容以及班组内检修人员的职责分工,形成分配到人的工作票。我国电力公司已拥有输、变、配电工程运维领域知识库来支撑运检人员进行巡视、检测、维修和管理工作,但绝大多数单据仍然需要巡检班组组长进行拆分、填写。上述知识库内的数据内容尽管已经通过知识采编过程进行统一的结构化处理,但受到系统架构与检索技术的限制,对于电力运检单据的实际支撑效果不甚理想,难以支撑电力运维领域经验知识的积累、固化与传承需求。亟须开展现有电力运维领域知识库的升级改造与创新使用。
本发明提出了一种面向电力运检工作任务单的一种运检工作票生成系统,实现工作票的智能生成,用以解决由于一线检修人员对业务领域知识获取难度大、知识掌握牢固程度低,进而引发的检修工作精准度低、时效性差等实际生产问题,推动大电网安全风险防控水平提升。
工作任务单主要有任务内容、电站|线路、编制部门、编制人等属性信息,例如部分相对应的内容如下:葛北务本支4#、15#搭火、葛北务本支、输电运维班、王兆阳。其中,各个属性信息都是实体,单划线对应工作票中的工作地点描述,双划线对应工作票中的工作内容,双划线可通过知识图谱匹配其子任务、设备部件以及解决故障方案,即有一对多或者一对一的工作内容,点划线对应工作票中的工作地点,编制部门的编制人将工作内容具体分配给相应班组成员,各司其职完成任务。
请参阅图1所示,本发明提供了一种运检工作票生成系统,包括:
工作任务单获取模块,用于获取包含多个检修信息的工作任务单;
数据预处理模块,用于将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;
初始化参数获取模块,用于获取嵌入层的初始化参数;
预测模块,用于将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;
预测结果修正模块,用于将预测模块所得的预测结果进行修正;
处理模块,用于对词典中所有的词处理,输出实体类型;
匹配模块,用于将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;
输出模块,用于将匹配模块相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
基于此,本发明一种运检工作票生成系统的工作过程,包括:
步骤S101,工作任务单获取模块采集获取包含多个检修信息的工作任务单;
在本发明实施例中,工作任务单的任务信息中可以包含多个检修信息,例如在电力检修领域中一次任务信息中可能包含有多个待检修任务,每个检修信息中也可以包含多项信息,例如:任务内容、电站|线路、编制部门、编制人等属性信息等等,而本发明实施例中优选地关注检修任务中的工作地点和任务内容。
步骤S102,数据预处理模块将工作票中的任务内容按行提取到文本文件中,用标注工具(brat标注工具)对该文件进行标注,主要标注工作地点描述、故障或任务两项。
将标注好的文本转换成BIS标注体系(B:实体第一个字,I:实体其它位置的字,S:单个字的实体,O:其它非实体部分的字)或者BIES标注(B:实体第一个字;I:实体中间位置的字;E:实体最后一个字;S:单个字的实体;O:其它非实体部分的字)。例如:“葛北务本支4#、15#搭火”的BIES标注体系如下所示:
4 # 1 5 #
O O O O O B-de I-de I-de I-de E-de B-ta E-ta
其中,‘de’表示工作地点描述实体,‘ta’表示工作任务或故障实体。将转换标注体系后的训练集中的句子按字分词获得训练集。
步骤S103,初始化参数获取模块通过语料库(现成的电力领域的语料库)训练多维的word2vec(字转换为向量)模型,得到每个字的向量表示,所述每个字的向量表示用于初始化双向长短时记忆实体抽取模型中嵌入层的参数。将语料库文本中每一条工作单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到word2vec模型中训练,获得每个字的向量表示,该向量作为双向长短时记忆实体抽取模型嵌入层的初始化参数。
步骤S104,预测模块将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示。将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至softmax函数中,得出预测结果,该结果是每一个标签的预测概率值,例如对于“搭”,0.7(B-ta)、0.08(E-ta)、0.04(O)等。
步骤S105,预测结果修正模块从长短时记忆网络模型中得到的预测结果准确率很低,需要对该结果进行修正,故将步骤S104所得的结果输入到CRF模型中进行修正。例如对于文本“4#、15#搭火”,基于BI-LSTM模型输出标签是B-de、I-de、I-de、O、E-de、B-ta、E-ta。很明显,I-de后面不可能接O,按照该路径CRF会受到很大的惩罚,通过CRF模型会得到B-de、I-de、I-de、I-de、E-de、B-ta、E-ta的最优路径,这样就对基于BI-LSTM模型的预测结果进行了修正。
步骤S106,为达到更高的准确率,处理模块采用基于词典的纠正或补充方法,对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将该方法标记出的标签与从CRF输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型,即工作地点或工作任务。
步骤S107,匹配模块将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽。
步骤S108,输出模块将步骤S107中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
在本发明的又一实施例中,还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现实施例所述的运检工作票生成系统的工作过程。
在本发明的又一实施例中,还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输方法的程序,所述信息传输方法的程序被处理器执行时实现所述的运检工作票生成系统的方法步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (3)

1.一种运检工作票生成系统,其特征在于,包括:
工作任务单获取模块,用于获取包含多个检修信息的工作任务单;
数据预处理模块,用于将工作任务单中的任务内容提取、标注、转换、分词,获得训练集;
初始化参数获取模块,用于获取嵌入层的初始化参数;
预测模块,用于将按字分词后的训练集处理、拼接、训练,得到新的向量表示,再得出预测结果;
预测结果修正模块,用于将预测模块所得的预测结果进行修正;
处理模块,用于对词典中所有的词处理,输出实体类型;
匹配模块,用于将预测的实体类型输出结果与工作票的相关的知识图谱进行匹配,将匹配结点链接的工作票内容输出填槽;
输出模块,用于将匹配模块相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票;
工作任务单的任务信息中包含若干检修信息,每个检修信息中包含的信息为:任务内容、电站|线路、编制部门、编制人中的一项或多项;
数据预处理模块将工作任务单中的任务内容按行提取到文本文件中,对该文件进行标注;将标注好的文本转换获得转换标注后的训练集;然后将转换标注后的训练集中的句子按字分词获得训练集;
初始化参数获取模块通过语料库训练字转换为向量模型,得到每个字的向量表示;初始化参数获取模块将语料库文本中每一条工作任务单任务内容用换行符分隔,字与字之间用空格分隔,然后将处理好的数据输入到字转换为向量模型中训练,获得每个字的向量表示作为嵌入层的初始化参数;
预测模块将按字分词后的训练集输入到双向长短时记忆实体抽取模型中的嵌入层,得到每个字的字向量,拼接到一起构成句子的嵌入表示;预测模块将句子的嵌入表示输入到双向长短时记忆实体抽取模型中进行训练,得到新的向量表示,再输入至Softmax函数中,得出预测结果;
处理模块对词典中所有的词按照长度从长到短与文本数据进行对照匹配,匹配成功时标出实体类型,最后将标记出的标签与从CRF输出的标签进行比对,若发生冲突,选取两种方法中长度较长的标签结果,输出实体类型:工作地点或工作任务;
匹配模块将预测的实体类型输出结果中的工作任务或设备故障与工作票的相关的知识图谱进行匹配,工作任务或设备可能有一对一或者一对多对应具体工作内容,该工作内容在知识图谱中匹配具体实际操作的工作人员结点,与此同时将工作票中的其他属性信息匹配到知识图谱中的结点中,将结点链接的工作票内容输出填槽;
输出模块将匹配模块中知识图谱匹配中的一个或多个任务以及其它属性值相匹配的文本结点,根据知识图谱中的属性标签输出到带有属性标签的文本中,形成运检工作票。
2.根据权利要求1所述的一种运检工作票生成系统,其特征在于,数据预处理模块标注的内容包括:工作地点描述、故障或任务;数据预处理模块将标注好的文本转换成BIS标注体系或者BIES标注体系。
3.根据权利要求1所述的一种运检工作票生成系统,其特征在于,数据预处理模块用标注工具brat将工作任务单中的任务内容进行标注。
CN202010490618.6A 2020-06-02 2020-06-02 一种运检工作票生成系统 Active CN111680803B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010490618.6A CN111680803B (zh) 2020-06-02 2020-06-02 一种运检工作票生成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010490618.6A CN111680803B (zh) 2020-06-02 2020-06-02 一种运检工作票生成系统

Publications (2)

Publication Number Publication Date
CN111680803A CN111680803A (zh) 2020-09-18
CN111680803B true CN111680803B (zh) 2023-09-01

Family

ID=72434480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010490618.6A Active CN111680803B (zh) 2020-06-02 2020-06-02 一种运检工作票生成系统

Country Status (1)

Country Link
CN (1) CN111680803B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510076A (zh) * 2009-03-20 2009-08-19 西安交大辰方科技有限公司 一种电力工作票安全措施描述语句自动生成方法
CN105741051A (zh) * 2015-04-02 2016-07-06 国网山东省电力公司青岛供电公司 一种操作票的智能生成方法及系统
CN106557909A (zh) * 2016-11-21 2017-04-05 国网四川省电力公司眉山供电公司 工作票自动生成系统
WO2019200806A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN110717039A (zh) * 2019-09-17 2020-01-21 平安科技(深圳)有限公司 文本分类方法和装置、电子设备、计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783960B (zh) * 2017-10-23 2021-07-23 百度在线网络技术(北京)有限公司 用于抽取信息的方法、装置和设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510076A (zh) * 2009-03-20 2009-08-19 西安交大辰方科技有限公司 一种电力工作票安全措施描述语句自动生成方法
CN105741051A (zh) * 2015-04-02 2016-07-06 国网山东省电力公司青岛供电公司 一种操作票的智能生成方法及系统
CN106557909A (zh) * 2016-11-21 2017-04-05 国网四川省电力公司眉山供电公司 工作票自动生成系统
WO2019200806A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN110717039A (zh) * 2019-09-17 2020-01-21 平安科技(深圳)有限公司 文本分类方法和装置、电子设备、计算机可读存储介质

Also Published As

Publication number Publication date
CN111680803A (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CN111708773B (zh) 一种多源科创资源数据融合方法
CN108256074B (zh) 校验处理的方法、装置、电子设备和存储介质
US8381095B1 (en) Automated document revision markup and change control
CN113177124A (zh) 一种垂直领域知识图谱构建方法及系统
CN111680804B (zh) 一种运检工作票生成方法、设备以及计算机可读介质
CN113312108B (zh) Swift报文的校验方法、装置、电子设备及存储介质
CN112732994B (zh) 网页信息的提取方法、装置、设备及存储介质
CN109740159B (zh) 用于命名实体识别的处理方法及装置
CN105446986A (zh) 用于处理web页面的方法和装置
CN112836018A (zh) 应急预案的处理方法及装置
CN111680803B (zh) 一种运检工作票生成系统
CN112417852B (zh) 一种代码片段重要性的判断方法和装置
CN109614143B (zh) Ietm浏览器中自动生成故障流程图的开发方法
WO2013054581A1 (ja) 業務仕様からワークフローを生成する方法、プログラム及びシステム
CN115033280A (zh) 一种基于知识图谱的需求规格文档自动化生成方法及存储介质
Tenier et al. Instantiation of relations for semantic annotation
CN106407271B (zh) 一种智能客服系统及其智能客服知识库的更新方法
CN113642291A (zh) 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端
US20090217156A1 (en) Method for Storing Localized XML Document Values
CN112651246B (zh) 融合深度学习和工作流模式的服务需求冲突检测方法
CN111061864B (zh) 基于特征提取的开源社区Fork摘要自动生成方法、系统及介质
CN116991983B (zh) 一种面向公司资讯文本的事件抽取方法及系统
US20230385700A1 (en) Artificial intelligence engine for transaction categorization and classification
US11321377B2 (en) Storage control program, apparatus, and method
CN113094446A (zh) 一种面向财务报表图像的科目信息提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant