CN113642835A - 一种基于数据相似度的工作票生成方法及终端 - Google Patents

一种基于数据相似度的工作票生成方法及终端 Download PDF

Info

Publication number
CN113642835A
CN113642835A CN202110743813.XA CN202110743813A CN113642835A CN 113642835 A CN113642835 A CN 113642835A CN 202110743813 A CN202110743813 A CN 202110743813A CN 113642835 A CN113642835 A CN 113642835A
Authority
CN
China
Prior art keywords
historical
similarity
work
electric power
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110743813.XA
Other languages
English (en)
Other versions
CN113642835B (zh
Inventor
张丰
陈佑健
林建森
陈励凡
陈佐健
吴文庚
李长元
陈高汝
陈余航
郭碧媛
黄敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Fujian Electric Power Co Ltd
Fuzhou Power Supply Co of State Grid Fujian Electric Power Co Ltd
Original Assignee
State Grid Fujian Electric Power Co Ltd
Fuzhou Power Supply Co of State Grid Fujian Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Fujian Electric Power Co Ltd, Fuzhou Power Supply Co of State Grid Fujian Electric Power Co Ltd filed Critical State Grid Fujian Electric Power Co Ltd
Priority to CN202110743813.XA priority Critical patent/CN113642835B/zh
Publication of CN113642835A publication Critical patent/CN113642835A/zh
Application granted granted Critical
Publication of CN113642835B publication Critical patent/CN113642835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于数据相似度的工作票生成方法及终端,接收输入信息,输入信息包括变电站信息及工作内容;将变电站信息及所述工作内容通过预设模型得到匹配的工作地点;根据变电站信息、工作内容及工作地点匹配历史电力工作票数据,得到相似度排在前预设个数的历史电力工作票数据并输出;本发明设置预设模型,输入变电站信息和工作内容就能自动匹配工作地点,最终输出相似度排在前预设个数的历史电力工作票数据,实现完整电力工作票的自动生成,只要对历史电力工作票数据进行更新,就能够输出最新的历史电力工作票数据,通过已审核并实施无误的历史电力工作票自动生成当前的电力工作票,实现了电力工作票的高效准确生成。

Description

一种基于数据相似度的工作票生成方法及终端
技术领域
本发明涉及电力管理领域,尤其涉及一种基于数据相似度的工作票生成方法及终端。
背景技术
在电力工作票中安全措施的填写是一个要求比较专业、复杂、规范的工作。而因为地域差别、人员专业水平差别、书写习惯差别等原因,导致填写的安全措施内容不规范、甚至不合格,相同内容不同用词等情况给填写、审核等带来大量重复性工作,也影响现场操作施工的规范。
故现有技术中通过计算机技术实现了电力工作票的自动开票,电力工作票自动开票主要采用的是专家系统来实现。专家系统是计算机根据相关的专业知识,学习人类经验、解决问题的方法,运用这些知识和方法进行推理和判断,模拟人类对于问题通过思考提出解决方案的过程。利用专家系统进行工作内容数据库的模糊匹配,不仅可以代替人工开票,还可以根据现场情况和有关规定,通过检索相关数据库的方式对开出的票进行安全检验、危险点分析等相关安全措施。早期对于专家系统的改进有例如基于在线网络拓扑分析的专家系统,不但改进了传统的推理机制,而且对设备模型和设备之间拓扑关系的表达方面进行了研究,使得系统的智能性、开放性等得到了进一步的提高。还有例如基于过程性、数据树等,都是在专家系统上进行开发改进得到的成果。
但是梳理专家系统的规则工作量巨大,难度很大。专家系统采用规则匹配方式,需将填写安全措施的所有流程、知识梳理成一个个具有逻辑规则的知识库。但该领域知识庞大,涉及知识方方面面,梳理过程将是个工作量巨大的工程。同时,该领域内在规则复杂,甚至即使经验丰富的专家,也很难将所有情况都采用固定规则描述完,并且,即使前期花费了大量人力物力成本构建系统,当安全措施更新时也还要付出巨大工作量,后期维护成本大,并且使用过程中人工参与程度高,需进行检索,开票效率低。
发明内容
本发明所要解决的技术问题是:提供一种基于数据相似度的工作票生成方法及终端,高效准确地生成电力工作票。
为了解决上述技术问题,本发明采用的一种技术方案为:
一种基于数据相似度的工作票生成方法,包括步骤:
S1、接收输入信息,所述输入信息包括变电站信息及工作内容;
S2、将所述变电站信息及所述工作内容通过预设模型得到匹配的工作地点;
S3、根据所述变电站信息、所述工作内容及所述工作地点匹配历史电力工作票数据,得到相似度排在前预设个数的历史电力工作票数据并输出。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种基于数据相似度的工作票生成终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、接收输入信息,所述输入信息包括变电站信息及工作内容;
S2、将所述变电站信息及所述工作内容通过预设模型得到匹配的工作地点;
S3、根据所述变电站信息、所述工作内容及所述工作地点匹配历史电力工作票数据,得到相似度排在前预设个数的历史电力工作票数据并输出。
本发明的有益效果在于:设置预设模型,输入变电站信息和工作内容就能自动匹配工作地点,并且能够自动根据输入信息及所匹配到的工作地点输出相似度排在前预设个数的历史电力工作票数据,实现完整电力工作票的自动生成,工作人员只需在所输出的历史电力工作票数据上进行改动,无需人工进行整个电力工作票的重建,实现了电力工作票的自动生成,并且,通过预设模型匹配工作地点,只要历史电力工作票数据不断更新替换,就能够输出最新的历史电力工作票数据,易于后期维护,通过已审核并实施无误的历史电力工作票自动生成当前的电力工作票,实现了电力工作票的高效准确生成。
附图说明
图1为本发明实施例的一种基于数据相似度的工作票生成方法的步骤流程图;
图2为本发明实施例的一种基于数据相似度的工作票生成终端的结构示意图;
图3为本发明实施例的一种基于数据相似度的工作票生成方法的整体流程图;
图4及图5为现有技术中的一种Transformer网络示意图;
标号说明:
1、一种基于数据相似度的工作票生成终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种基于数据相似度的工作票生成方法,包括步骤:
S1、接收输入信息,所述输入信息包括变电站信息及工作内容;
S2、将所述变电站信息及所述工作内容通过预设模型得到匹配的工作地点;
S3、根据所述变电站信息、所述工作内容及所述工作地点匹配历史电力工作票数据,得到相似度排在前预设个数的历史电力工作票数据并输出。
从上述描述可知,本发明的有益效果在于:设置预设模型,输入变电站信息和工作内容就能自动匹配工作地点,并且能够自动根据输入信息及所匹配到的工作地点输出相似度排在前预设个数的历史电力工作票数据,实现完整电力工作票的自动生成,工作人员只需在所输出的历史电力工作票数据上进行改动,无需人工进行整个电力工作票的重建,实现了电力工作票的自动生成,并且,通过预设模型匹配工作地点,只要历史电力工作票数据不断更新替换,就能够输出最新的历史电力工作票数据,易于后期维护,通过已审核并实施无误的历史电力工作票自动生成当前的电力工作票,实现了电力工作票的高效准确生成。
进一步地,所述S2之前包括:
获取历史电力工作票数据,所述历史电力工作票数据包括相匹配的历史变电站信息、历史工作内容及历史工作地点;
将所述历史变电站信息、所述历史工作内容及所述历史工作地点分别按字切分;
将切分后的所述历史变电站信息及所述历史工作内容作为Transformer网络的输入数据,将切分后的所述历史工作地点作为Transformer网络的输出数据对所述Transformer进行训练,得到目标Transformer网络;
所述S2具体为:
将所述变电站信息及所述工作内容输入所述目标Transformer网络,得到的输出数据即为匹配的所述工作地点。
由上述描述可知,通过历史电力工作票数据对Transformer网络进行训练,使得在接收到输入信息后能够通过训练完成的Transformer网络得到对应的工作地点,并且在获取到新的历史电力工作票数据之后,能够方便地对Transformer网络进行再次训练。
进一步地,所述变电站信息包括变电站名称及电压等级;
所述S1与所述S2之间包括:
验证所述变电站名称及所述电压等级是否匹配,若是,则执行所述S2,否则,输出输入信息错误提示。
由上述描述可知,在执行步骤S2之前先判断变电站名称和电压等级是否匹配,若不匹配则说明所输入的变电站名称或电压等级出现错误,避免根据错误的信息进行工作地点的匹配,保证了最终输出的历史电力工作票数据与输入信息的匹配程度,避免输出不对应的历史电力工作票数据。
进一步地,所述验证所述变电站名称及所述电压等级是否匹配之前包括:
获取历史电力工作票数据,所述历史电力工作票数据包括历史变电站名称及历史电压等级;
存储所述历史变电站名称及所述历史电压等级的对应关系;
所述验证所述变电站名称及所述电压等级是否匹配具体为:
获取与所述变电站名称相同的历史变电站名称,根据所述对应关系获取所述历史变电站名称所对应的历史电压等级;
判断所述电压等级是否与所述历史电压等级相同,若是,则述变电站名称及所述电压等级匹配。
由上述描述可知,存储历史电力工作票数据中的历史变电站名称及历史电压等级的对应关系,只需验证输入信息中的历史变电站名称与历史电压等级是否在所存储的信息中具有对应关系,就能够判断输入信息是否有误,避免出现工作地点匹配错误的现象最终导致输出的历史电力工作票数据不对应。
进一步地,所述S3具体为:
遍历所述历史电力工作票数据中的历史电力工作票;
对遍历到的目标历史电力工作票计算所述变电站信息与所述历史变电站信息的第一相似度,计算所述工作内容与每一所述历史工作内容的第二相似度及计算所述工作地点与每一所述历史工作地点的第三相似度;综合所述第一相似度、所述第二相似度及所述第三相似度得到所述目标历史电力工作票与所述输入信息的综合相似度;
按照所述综合相似度递减的顺序排列所述历史电力工作票,并输出前预设个数的历史电力工作票。
由上述描述可知,分别计算输入信息与历史电力工作票数据中每一历史电力工作票的变电站信息、工作内容及工作地点的相似度,并且将其综合得到综合相似度,根据综合相似度匹配预设个数的历史电力工作票,工作人员能够在匹配的多个历史电力工作票中进行选择,进一步减少工作人员的工作量。
进一步地,所述计算所述变电站信息与所述历史变电站信息的第一相似度具体为:
按顺序切分所述变电站信息及所述历史变电站信息,分别得到第一字符组及第二字符组;
计算所述第一字符组及所述第二字符组的重复字符数量占比;
根据所述重复字符数量占比得到所述第一相似度。
由上述描述可知,对于变电站信息,因变电站的名字和其对应的电压等级都是确定的值,故只要字符组内字符的重复字符数量占比为100%,就说明变电站信息完全一致,即字符组内字符的重复字符占比就能够反应出变电站信息与历史变电站信息之间的相似度,无需复杂的计算。
进一步地,所述计算所述工作内容与每一所述历史工作内容的第二相似度具体为:
获取所述工作内容中每一个字的第一字向量及所述历史工作内容中每一个字的第二字向量;
将所述第一字向量及所述第二字向量输入Transformer+LSTM网络的编码模块,得到所述工作内容的第一句子向量及所述历史工作内容的第二句子向量;
计算所述第一句子向量及所述第二句子向量的余弦相似度得分,作为所述第二相似度。
由上述描述可知,工作内容的描述会根据书写者和各处的不同规定而有区别,即实质相同的工作内容在具体的表述上可能出现不同,此时就需要借助神经网络的训练对工作内容的实质是否相同进行判定得到第二相似度,通过获取句子向量后计算余弦相似度得到第二相似度,能够最大程度跳过书面表达的不同提炼工作内容的实质,提高比对结果的准确性。
进一步地,所述计算所述工作地点与每一所述历史工作地点的第三相似度具体为:
根据词袋模型构建所述工作地点的第一文本向量A及所述历史工作地点的第二文本向量B;
计算所述第一文本向量A及所述第二文本向量B的余弦相似度作为所述第三相似度。
由上述描述可知,工作地点是较短的文本,用词袋模型可以最大程度获取工作地点描述的核心内容,因工作地点也可能出现不同人描述不一的情况,通过词袋模型获取其文本向量之后再计算余弦相似度,避免了不同表达方式的影响,能够提高比对结果的准确性。
进一步地,所述计算所述第一文本向量及所述第二文本向量的余弦相似度具体为:
余弦相似度
Figure BDA0003143687400000071
由上述描述可知,通过计算余弦相似度计算工作内容和历史工作内容的第二相似度及工作地点与历史工作地点的第三相似度,最大程度降低了主观描述的影响。
一种基于数据相似度的工作票生成终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于数据相似度的工作票生成方法中的各个步骤。
请参照图1,本发明的实施例一为:
一种基于数据相似度的工作票生成方法,包括步骤:
S1、接收输入信息,所述输入信息包括变电站信息及工作内容;
S2、将所述变电站信息及所述工作内容通过预设模型得到匹配的工作地点;
请参照图3,在一种可选的实施方式中,S2之前还包括:获取历史电力工作票数据,所述历史电力工作票数据包括相匹配的历史变电站信息、历史工作内容及历史工作地点,即,历史电力工作票数据包括历史电力工作票,每张历史电力工作票中的历史变电站信息、历史工作内容及历史工作地点相匹配;将所述历史变电站信息、所述历史工作内容及所述历史工作地点分别按字切分;将切分后的所述历史变电站信息及所述历史工作内容作为Transformer网络的输入数据,将切分后的所述历史工作地点作为Transformer网络的输出数据对所述Transformer进行训练,得到目标Transformer网络,该目标Transformer网络即为预设模型;
其中Transformer网络结构即为图4中所示的结构;
则S2具体为:将所述变电站信息及所述工作内容输入所述目标Transformer网络,得到的输出数据即为匹配的所述工作地点;
S3、根据所述变电站信息、所述工作内容及所述工作地点匹配历史电力工作票数据,得到相似度排在前预设个数的历史电力工作票数据并输出,具体为:
请参照图3,遍历所述历史电力工作票数据中的历史电力工作票;对遍历到的目标历史电力工作票计算所述变电站信息与所述历史变电站信息的第一相似度,计算所述工作内容与每一所述历史工作内容的第二相似度及计算所述工作地点与每一所述历史工作地点的第三相似度;综合所述第一相似度、所述第二相似度及所述第三相似度得到所述目标历史电力工作票与所述输入信息的综合相似度;按照所述综合相似度递减的顺序排列所述历史电力工作票,并输出前预设个数N项的历史电力工作票;
S4、接收用户选择信息。根据选择信息确定确定输出历史电力工作票,获取并输出该输出历史电力工作票中的安全措施。
本发明的实施例二为:
一种基于数据相似度的工作票生成方法,其与实施例一的不同之处在于:
S1具体为:接收输入信息,通过正则化获取其中的变电站信息及工作内容,其中,变电站信息包括变电站名称及电压等级;
具体的,获取以kV或V结尾的数字,与kV或V共同标记为电压等级,获取位于电压等级之后的以“变”或“变电站”结尾的词,标记为变电站名称,其余字符共同标记为工作内容;
如输入信息为“220kVB地变安全消防系统调试及接入”,其中“220kV”标记为电压等级,“B地变”标记为变电站名称,“安全消防系统调试及接入”标记为工作内容;
S1与S2之间包括:
验证所述变电站名称及所述电压等级是否匹配,若是,则执行所述S2,否则,输出输入信息错误提示;
在一种可选的实施方式中,输出历史电力工作票数据中不存在该数据的提示,并允许执行S2;
其中,验证所述变电站名称及所述电压等级是否匹配之前包括:获取历史电力工作票数据,所述历史电力工作票数据包括历史变电站名称及历史电压等级;存储所述历史变电站名称及所述历史电压等级的对应关系;
请参照图3,具体的,通过正则化获取所述历史电力工作票数据中的历史变电站名称及历史电压等级的对应关系,以二元数组(历史变电站名称,历史电压等级)的方式进行存储,得到背景知识库;其中,正则化的方式参照本实施例中S1中的正则化方式;
在一种可选的实施方式中,一个历史变电站名称对应多个电压等级,如存储的二元数组(A地变:[110kV,10kV])表示变电站A地变的电压等级有110kV和10kV;或一个历史变电站名称对应一个电压等级,如(B地变:[220kV])表示变电站B地变的电压等级有10kV;
验证所述变电站名称及所述电压等级是否匹配具体为:获取与所述变电站名称相同的历史变电站名称,根据所述对应关系获取所述历史变电站名称所对应的历史电压等级;判断所述电压等级是否与所述历史电压等级相同,若是,则述变电站名称及所述电压等级匹配;如输入信息中变电站名称A地变,电压等级10kV,则匹配;输入信息中变电站名称B地变,电压等级110kV,则不匹配;
在一种可选的实施方式中,S3中计算所述变电站信息与所述历史变电站信息的第一相似度具体为:计算变电站名称与历史变电站名称的第一子相似度T及电压等级与历史电压等级的第二子相似度U,将所述第一子相似度及所述第二子相似度加权后得到所述第一相似度:
第一相似度=T×0.5+U×0.5。
本发明的实施例三为:
一种基于数据相似度的工作票生成方法,其与其余实施例的不同之处在于:
所述计算所述变电站信息与所述历史变电站信息的第一相似度具体为:
按顺序切分所述变电站信息及所述历史变电站信息,分别得到第一字符组及第二字符组;
计算所述第一字符组及所述第二字符组的重复字符数量占比;
根据所述重复字符数量占比得到所述第一相似度;
在一种可选的实施方式中,分别计算变电站信息中变电站名称与历史变电站信息中历史变电站名称及电压等级与历史电压等级的重复字符数量占比,若重复字符数量占比为100%,则第一相似度为满分,若重复字符数量占比不为100%,则第一相似度为0分;
所述计算所述工作内容与每一所述历史工作内容的第二相似度具体为:
获取所述工作内容中每一个字的第一字向量及所述历史工作内容中每一个字的第二字向量;
利用预训练的字向量微调第一字向量及第二字向量,具体的:人工标注预设数量的分为输入组和对照组的历史工作内容,得到输入组和对照组之间的目标相似度;获取输入组的每一个字的第三字向量及对照组的每一个字的第四字向量,通过Transformer+LSTM网络得到第三句子向量及第四句子向量后计算二者的余弦相似度得分,得到实验相似度,对比实验相似度和目标相似度,利用Transformer+LSTM网络的反向传播调整第三字向量及第四字向量的表示方法,直至实验相似度和目标相似度的差小于阈值,根据该表示方法调整第一字向量及第二字向量的表示;
将调整后的所述第一字向量及所述第二字向量输入Transformer+LSTM网络的编码模块,得到所述工作内容的第一句子向量及所述历史工作内容的第二句子向量;
请参照图4及图5,即为Transformer网络的示意图;
计算所述第一句子向量及所述第二句子向量的余弦相似度得分,作为所述第二相似度Y;
所述计算所述工作地点与每一所述历史工作地点的第三相似度具体为:
根据词袋模型构建所述工作地点的第一文本向量A及所述历史工作地点的第二文本向量B;
在一种可选的实施方式中,词袋模型为TF-IDF(term frequency–inversedocument frequency,词频逆文本频率指数)词袋模型;
计算所述第一文本向量A及所述第二文本向量B的余弦相似度作为所述第三相似度G;
其中,余弦相似度的计算公式为:余弦相似度
Figure BDA0003143687400000101
在一种可选的实施方式中,综合所述第一相似度、所述第二相似度及所述第三相似度得到所述目标历史电力工作票与所述输入信息的综合相似度具体为:对第一相似度(包括第一子相似度T及第二子相似度U)、第二相似度Y及第三相似度G加权得到综合相似度,具体的:
综合相似度=0.2×T+0.2×U+0.2×G+0.2×Y。
请参照图2,本发明的实施例四为:
一种基于数据相似度的工作票生成终端1,包括处理器2、存储器3及存储在存储器3上并可在所述处理器2上运行的计算机程序,所述处理器2执行所述计算机程序时实现实施例一、实施例二或实施例三中的各个步骤。
综上所述,本发明提供了一种基于数据相似度的工作票生成方法及终端,接收输入信息,包括变电站信息及工作内容,通过预设模型得到相匹配的工作地点,根据变电站信息、工作内容和工作地点计算历史电力工作票数据中每一历史电力工作票的相似度,并输出相似度排在前预设个数的历史电力工作票,将电力工作票抽象为变电站信息、工作内容和工作地点的组合,并且找到变电站信息、工作内容和工作地点的匹配关系,减少了自动生成电力工作票时需要输入的数据,提升了开票的便捷性,并且输出相似度排在前预设个数的历史电力工作票,给工作人员提供了选择的空间,进一步提高了最终生成的电力工作票的准确性,接收输出信息之后输出对应的历史电力工作票的安全措施,只需要保证历史电力工作票数据中的安全措施经过统一,后续就能够避免实质相同的内容出现不同描述方式的情况,实现安全措施的规范化管理,并且保存经过实操检验的历史电力工作票数据,包括历史电力工作票,每张历史电力工作票包括历史变电站信息、工作内容及工作地点,根据历史电力工作票训练Transformer网络得到预设模型,若安全措施更新,只需要更新历史电力工作票中的安全措施,视具体情况可以选择重新训练得到预设模型或者沿用之前的预设模型,大大降低了后期维护的成本,实现电力工作票的高效准确自动生成。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于数据相似度的工作票生成方法,其特征在于,包括步骤:
S1、接收输入信息,所述输入信息包括变电站信息及工作内容;
S2、将所述变电站信息及所述工作内容通过预设模型得到匹配的工作地点;
S3、根据所述变电站信息、所述工作内容及所述工作地点匹配历史电力工作票数据,得到相似度排在前预设个数的历史电力工作票数据并输出。
2.根据权利要求1所述的一种基于数据相似度的工作票生成方法,其特征在于,所述S2之前包括:
获取历史电力工作票数据,所述历史电力工作票数据包括相匹配的历史变电站信息、历史工作内容及历史工作地点;
将所述历史变电站信息、所述历史工作内容及所述历史工作地点分别按字切分;
将切分后的所述历史变电站信息及所述历史工作内容作为Transformer网络的输入数据,将切分后的所述历史工作地点作为Transformer网络的输出数据对所述Transformer网络进行训练,得到目标Transformer网络;
所述S2具体为:
将所述变电站信息及所述工作内容输入所述目标Transformer网络,得到的输出数据即为匹配的所述工作地点。
3.根据权利要求1所述的一种基于数据相似度的工作票生成方法,其特征在于,所述变电站信息包括变电站名称及电压等级;
所述S1与所述S2之间包括:
验证所述变电站名称及所述电压等级是否匹配,若是,则执行所述S2,否则,输出输入信息错误提示。
4.根据权利要求3所述的一种基于数据相似度的工作票生成方法,其特征在于,所述验证所述变电站名称及所述电压等级是否匹配之前包括:
获取历史电力工作票数据,所述历史电力工作票数据包括历史变电站名称及历史电压等级;
存储所述历史变电站名称及所述历史电压等级的对应关系;
所述验证所述变电站名称及所述电压等级是否匹配具体为:
获取与所述变电站名称相同的历史变电站名称,根据所述对应关系获取所述历史变电站名称所对应的历史电压等级;
判断所述电压等级是否与所述历史电压等级相同,若是,则述变电站名称及所述电压等级匹配。
5.根据权利要求2所述的一种基于数据相似度的工作票生成方法,其特征在于,所述S3具体为:
遍历所述历史电力工作票数据中的历史电力工作票;
对遍历到的目标历史电力工作票计算所述变电站信息与所述历史变电站信息的第一相似度,计算所述工作内容与每一所述历史工作内容的第二相似度及计算所述工作地点与每一所述历史工作地点的第三相似度;综合所述第一相似度、所述第二相似度及所述第三相似度得到所述目标历史电力工作票与所述输入信息的综合相似度;
按照所述综合相似度递减的顺序排列所述历史电力工作票,并输出前预设个数的历史电力工作票。
6.根据权利要求5所述的一种基于数据相似度的工作票生成方法,其特征在于,所述计算所述变电站信息与所述历史变电站信息的第一相似度具体为:
按顺序切分所述变电站信息及所述历史变电站信息,分别得到第一字符组及第二字符组;
计算所述第一字符组及所述第二字符组的重复字符数量占比;
根据所述重复字符数量占比得到所述第一相似度。
7.根据权利要求5所述的一种基于数据相似度的工作票生成方法,其特征在于,所述计算所述工作内容与每一所述历史工作内容的第二相似度具体为:
获取所述工作内容中每一个字的第一字向量及所述历史工作内容中每一个字的第二字向量;
将所述第一字向量及所述第二字向量输入Transformer+LSTM网络的编码模块,得到所述工作内容的第一句子向量及所述历史工作内容的第二句子向量;
计算所述第一句子向量A及所述第二句子向量B的余弦相似度得分,作为所述第二相似度。
8.根据权利要求5所述的一种基于数据相似度的工作票生成方法,其特征在于,所述计算所述工作地点与每一所述历史工作地点的第三相似度具体为:
根据词袋模型构建所述工作地点的第一文本向量A及所述历史工作地点的第二文本向量B;
计算所述第一文本向量A及所述第二文本向量B的余弦相似度作为所述第三相似度。
9.根据权利要求7或8所述的一种基于数据相似度的工作票生成方法,其特征在于,所述计算所述第一文本向量及所述第二文本向量的余弦相似度具体为:
余弦相似度
Figure FDA0003143687390000031
10.一种基于数据相似度的工作票生成终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-9任一所述的一种基于数据相似度的工作票生成方法中的各个步骤。
CN202110743813.XA 2021-07-01 2021-07-01 一种基于数据相似度的工作票生成方法及终端 Active CN113642835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110743813.XA CN113642835B (zh) 2021-07-01 2021-07-01 一种基于数据相似度的工作票生成方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110743813.XA CN113642835B (zh) 2021-07-01 2021-07-01 一种基于数据相似度的工作票生成方法及终端

Publications (2)

Publication Number Publication Date
CN113642835A true CN113642835A (zh) 2021-11-12
CN113642835B CN113642835B (zh) 2022-09-27

Family

ID=78416662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110743813.XA Active CN113642835B (zh) 2021-07-01 2021-07-01 一种基于数据相似度的工作票生成方法及终端

Country Status (1)

Country Link
CN (1) CN113642835B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115330285A (zh) * 2022-10-17 2022-11-11 广东电网有限责任公司佛山供电局 一种变电站数据处理方法及系统
CN117436703A (zh) * 2023-11-27 2024-01-23 国网江苏省电力有限公司扬州供电分公司 一种基于遗传算法的输电工作票安全措施生成方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259540A1 (en) * 2011-04-07 2012-10-11 Infosys Technologies Limited Methods and systems for workforce management
CN106557909A (zh) * 2016-11-21 2017-04-05 国网四川省电力公司眉山供电公司 工作票自动生成系统
CN110399463A (zh) * 2019-07-29 2019-11-01 国网河北省电力有限公司 工作票的相似度匹配方法及装置
CN110956031A (zh) * 2019-11-13 2020-04-03 广州供电局有限公司 文本相似度匹配的方法、装置及系统
CN111668935A (zh) * 2020-06-15 2020-09-15 广东电网有限责任公司 一种基于eim的变电站作业准备管理方法及系统
CN112256872A (zh) * 2020-10-19 2021-01-22 国网浙江杭州市萧山区供电有限公司 一种变电站检修工作票的智能开票方法
CN112883693A (zh) * 2021-02-23 2021-06-01 国网福建省电力有限公司 一种自动生成电力工作票的方法及终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259540A1 (en) * 2011-04-07 2012-10-11 Infosys Technologies Limited Methods and systems for workforce management
CN106557909A (zh) * 2016-11-21 2017-04-05 国网四川省电力公司眉山供电公司 工作票自动生成系统
CN110399463A (zh) * 2019-07-29 2019-11-01 国网河北省电力有限公司 工作票的相似度匹配方法及装置
CN110956031A (zh) * 2019-11-13 2020-04-03 广州供电局有限公司 文本相似度匹配的方法、装置及系统
CN111668935A (zh) * 2020-06-15 2020-09-15 广东电网有限责任公司 一种基于eim的变电站作业准备管理方法及系统
CN112256872A (zh) * 2020-10-19 2021-01-22 国网浙江杭州市萧山区供电有限公司 一种变电站检修工作票的智能开票方法
CN112883693A (zh) * 2021-02-23 2021-06-01 国网福建省电力有限公司 一种自动生成电力工作票的方法及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方惠如等: "电力系统网络工作票的功能及实现", 《广东输电与变电技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115330285A (zh) * 2022-10-17 2022-11-11 广东电网有限责任公司佛山供电局 一种变电站数据处理方法及系统
CN117436703A (zh) * 2023-11-27 2024-01-23 国网江苏省电力有限公司扬州供电分公司 一种基于遗传算法的输电工作票安全措施生成方法

Also Published As

Publication number Publication date
CN113642835B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN112465393B (zh) 基于关联分析FP-Tree算法的企业风险预警方法
CN113642835B (zh) 一种基于数据相似度的工作票生成方法及终端
CN108717433A (zh) 一种面向程序设计领域问答系统的知识库构建方法及装置
CN106022614A (zh) 一种基于最近邻聚类的神经网络数据挖掘方法
CN113342842A (zh) 基于计量知识的语义查询方法、装置和计算机设备
CN104536881A (zh) 基于自然语言分析的众测错误报告优先级排序方法
CN111738462A (zh) 电力计量装置故障抢修主动服务预警方法
CN113095050A (zh) 一种智能成票方法、系统、设备及存储介质
CN114913729A (zh) 一种选题方法、装置、计算机设备和存储介质
CN110489142A (zh) 设备软件升级的评估方法及装置、存储介质、终端
CN118069797A (zh) 一种基于大语言模型的防洪调度规则问答推荐方法及系统
Glauner Artificial intelligence for the detection of electricity theft and irregular power usage in emerging markets
CN117874200A (zh) 风电运维数据的答案文本生成方法、装置、设备及介质
CN116561288B (zh) 事件查询方法、装置、计算机设备、存储介质及程序产品
CN117909464A (zh) 一种用于电力设备监测数据查询的智能问答方法及系统
CN103019924A (zh) 输入法智能性评测系统和方法
CN110188800A (zh) 一种基于智能分配算法的数据标注系统及方法
Dong et al. Research on academic early warning model based on improved SVM algorithm
CN115510205A (zh) 一种问句生成的方法、系统及存储介质
CN114912460A (zh) 基于文本挖掘的精细化拟合识别变压器故障方法及设备
CN112396399A (zh) 基于自然语言处理技术的配网操作票拟票方法
CN115619192B (zh) 一种面向需求计划规则的混合式关系提取方法
CN114862369A (zh) 配网自动化厂家资料整理分析方法、装置和存储介质
Wang Research on Campus Digital Teaching System of Smart u Based on Data Mining Algorithm
CN117611007A (zh) 一种星级班组智能化评价系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant