CN111222313A - 一种安全措施的审核方法、装置及设备 - Google Patents

一种安全措施的审核方法、装置及设备 Download PDF

Info

Publication number
CN111222313A
CN111222313A CN201911309784.5A CN201911309784A CN111222313A CN 111222313 A CN111222313 A CN 111222313A CN 201911309784 A CN201911309784 A CN 201911309784A CN 111222313 A CN111222313 A CN 111222313A
Authority
CN
China
Prior art keywords
audited
similarity
word
equipment
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911309784.5A
Other languages
English (en)
Other versions
CN111222313B (zh
Inventor
谢鹏飞
崔朝辉
赵立军
张霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201911309784.5A priority Critical patent/CN111222313B/zh
Publication of CN111222313A publication Critical patent/CN111222313A/zh
Application granted granted Critical
Publication of CN111222313B publication Critical patent/CN111222313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开一种安全措施的审核方法、装置及设备,所述方法包括:对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果;提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词;分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量;基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度;基于所述第一相似度,确定所述待审核安全措施的审核结果。本申请能够自动化的对安全措施进行审核,提高审核效率和准确性。

Description

一种安全措施的审核方法、装置及设备
技术领域
本申请涉及数据通信领域,具体涉及一种安全措施的审核方法、装置及设备。
背景技术
消缺检修是火电领域的重要任务之一,也是最危险的任务之一。在消缺检修工作中,最重要的安全保障手段是通过工作票来确保检修作业人员可以正确识别安全措施和危险源。
目前,普遍采用人工填写工作票中的安全措施的方式,再将填写好的工作票带入工作现场,由检修作业人员按照工作票中的安全措施进行工作,从而保证施工的安全顺利进行。
但是,在人工填写工作票时,常常因填写的安全措施的内容过多等原因,使得工作票中的安全措施出现不易察觉的错误,从而导致施工安全得不到保障,因此,需要提前对填写在工作票中的安全措施进行审核,以确保基于工作票中的安全措施进行施工的安全能够得到保障。
目前,通常由有经验人员对填写的安全措施进行审核,显然人工审核的方式不仅效率较低,而且准确性得不到保证。
发明内容
有鉴于此,本申请提供了一种安全措施的审核方法,能够自动化的对安全措施进行审核,提高审核效率和准确性。
第一方面,为实现上述发明目的,本申请提供了一种安全措施的审核方法,所述方法包括:
对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果;
提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词;
分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量;
基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度;
基于所述第一相似度,确定所述待审核安全措施的审核结果。
一种可选的实施方式中,所述基于所述第一相似度,确定所述待审核安全措施的审核结果之前,还包括:
基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度;
相应的,所述基于所述第一相似度,确定所述待审核安全措施的审核结果,具体为:
结合所述第一相似度和所述第二相似度,确定所述待审核安全措施的审核结果。
一种可选的实施方式中,所述分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量,包括:
基于所述待审核安全措施的分词结果中的设备名称的个数和剩余词的个数,以及各个设备名称对应的设备在预先建立的设备树中的层级,为各个设备名称分别设置权重值;
基于所述权重值,对所述待审核安全措施的分词结果中的设备名称进行向量化表示,得到所述设备名称对应的第一向量;
以及,对所述剩余词进行向量化表示,得到所述剩余词对应的第二向量。
一种可选的实施方式中,所述基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度,包括:
按照预设标识,将所述待审核安全措施划分成短句;
提取所述短句中的动词和设备名称,构成所述短句对应的词序关系集合;
分别将各个短句对应的词序关系集合与所述标准安全措施的标准词序关系集合进行匹配;
基于匹配成功的词序关系集合的个数和所述待审核安全措施的短句总个数,计算所述待审核安全措施和所述标准安全措施的第二相似度。
一种可选的实施方式中,所述短句对应的词序关系集合包括至多一个设备名称;
所述提取所述短句中的动词和设备名称,构成所述短句对应的词序关系集合,包括:
提取所述短句中的动词,以及基于预先建立的设备树的层级关系,提取所述短句中的设备名称;
利用所述动词和所述设备名称,构成所述短句对应的词序关系集合。
第二方面,本申请提供了一种安全措施的审核装置,所述装置包括:
分词模块,用于对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果;
提取模块,用于提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词;
向量化模块,用于分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量;
第一计算模块,用于基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度;
确定模块,用于基于所述第一相似度,确定所述待审核安全措施的审核结果。
一种可选的实施方式中,所述装置还包括:
第二计算模块,用于基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度;
相应的,所述确定模块,具体用于:
结合所述第一相似度和所述第二相似度,确定所述待审核安全措施的审核结果。
一种可选的实施方式中,所述向量化模块,包括:
设置子模块,用于基于所述待审核安全措施的分词结果中的设备名称的个数和剩余词的个数,以及各个设备名称对应的设备在预先建立的设备树中的层级,为各个设备名称分别设置权重值;
第一向量化子模块,用于基于所述权重值,对所述待审核安全措施的分词结果中的设备名称进行向量化表示,得到所述设备名称对应的第一向量;
第二向量化子模块,用于对所述剩余词进行向量化表示,得到所述剩余词对应的第二向量。
第三方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现上述任一项所述的方法。
第四方面,本申请提供了一种设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述任一项所述的方法。
本申请实施例提供的安全措施的审核方法中,首先对待审核安全措施进行分词处理,得到分词结果,其次,提取分词结果中的设备名称后,得到分词结果中的剩余词。再次,分别对设备名称和剩余词进行向量化表示,得到设备名称对应的第一向量和剩余词对应的第二向量。然后,基于第一向量、第二向量、标准安全措施的设备名称向量和剩余词向量,计算待审核安全措施和标准安全措施的第一相似度。最终,基于第一相似度,确定待审核安全措施的审核结果。显然,与现有技术中的人工审核方式相比,本申请能够提高安全措施的审核效率以及审核结果的准确性。
另外,本申请实施例还能够结合基于整句相似度计算得到的第一相似度和基于动词和设备名称的词序关系计算得到的第二相似度,确定待审核安全措施的审核结果,因此,本申请实施例能够进一步的提高安全措施的审核结果的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种安全措施的审核方法流程图;
图2为本申请实施例提供的另一种安全措施的审核方法流程图;
图3为本申请实施例提供的一种第二相似度的计算方法流程图;
图4为本申请实施例提供的一种安全措施的审核装置结构示意图;
图5为本申请实施例提供的一种安全措施的审核设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在火电领域,对于工作票中由人工填写的安全措施,需要在被带入工作现场之前进行准确性审核。相比现有技术的人工审核方式,本申请提供了一种自动化的安全措施审核方式,能够提高审核效率和审核结果的准确性。
具体的,本申请提供的安全措施的审核方法中,首先对待审核安全措施进行分词处理,得到分词结果,其次,提取分词结果中的设备名称后,得到分词结果中的剩余词。再次,分别对设备名称和剩余词进行向量化表示,得到设备名称对应的第一向量和剩余词对应的第二向量。然后,基于第一向量、第二向量、标准安全措施的设备名称向量和剩余词向量,计算待审核安全措施和标准安全措施的第一相似度。最终,基于第一相似度,确定待审核安全措施的审核结果。显然,与现有技术中的人工审核方式相比,本申请能够提高安全措施的审核效率以及审核结果的准确性。
以下本申请提供了一种安全措施的审核方法,参考图1,为本申请实施例提供的一种安全措施的审核方法流程图,所述方法包括:
S101:对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果。
在火电领域中,当任一张工作票完成安全措施的填写后,需要对该工作票中的每一条安全措施进行审核,只有在该工作票中的所有安全措施均通过审核后,才能将该工作票带入工作现场使用,以保证基于该工作票施工的安全性。
本申请实施例中,将工作票中的每一条安全措施作为审核对象,分别利用本申请提供的安全措施的审核方法对其进行审核。一种可选的实施方式中,可以按照填写顺序分别对工作票中的安全措施进行审核,也可以并行对工作票中每条安全措施进行审核。具体的审核顺序本申请不作限定。
本申请实施例中,针对工作票中的每一条安全措施,首先将其确定为待审核安全措施,然后,对该待审核安全措施进行分词处理,得到该待审核安全措施的分词结果。具体的分词处理方式不申请不作限制。
实际应用中,在确定待审核安全措施之后,获取与该待审核安全措施对应的标准安全措施,利用该标准安全措施对该待审核安全措施进行审核。标准安全措施通常为历史数据中已经成功完成消缺检修工作的安全措施。一种可选的实施方式中,在确定需要审核的工作票之后,从历史数据中已经完成消缺工作的工作票中查找与需要审核的工作票属于相同任务的历史工作票,以该历史工作票中的安全措施作为该需要审核的工作票的标准安全措施。具体的,从该历史工作票中获取与该需要审核的工作票中的待审核安全措施对应的标准安全措施。例如,按照填写顺序,从历史工作票中获取与该待审核安全措施的填写顺序相同的安全措施作为该待审核安全措施的标准安全措施。
对于标准安全措施的处理与待审核安全措施的处理方式相同,具体的,对标准安全措施进行分词处理,得到标准安全措施的分词结果。一种可选的实施方式中,对标准安全措施的处理可以是预先完成的。
另外,由于属于相同任务的工作票中的安全措施的条数应该相同,因此,本申请实施例可以在对每一条安全措施进行审核之前,首先确定需要审核的工作票中安全措施的条数,与对应的历史工作票中安全措施的条数是否相等,如果相等,则继续对工作票中的每一条安全措施进行审核,否则可以直接确定工作票中的安全措施未通过审核。
S102:提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词。
本申请实施例中,待审核安全措施的分词结果中通常包括设备名称,在得到待审核安全措施的分词结果之后,可以通过与预先建立的设备名称词典进行匹配,以提取该待审核安全措施的分词结果中的设备名称。其中,设备名称词典中可以预先存储有火电领域常见的设备名称,具体的,可以依据火电领域工作现场的设备树获得设备名称,并存储于设备名称词典中。
本申请实施例中,从待审核安全措施的分词结果中提取到设备名称之后,对于分词结果中除所述设备名称之外的其他词,可以称为该分词结果中的剩余词。
另外,为了提高安全措施审核的准确性,本申请实施例还可以将分词结果中的停用词剔除。具体的,预先设置停用词表,用于记录停用词,然后,将分词结果中的各个分词分别与停用词表进行匹配,如果匹配成功,则将该分词从分词结果中剔除;否则,对其进行保留。其中,停用词可以为无实际意义的预设语气助词、预设标点符号等。
S103:分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量。
本申请实施例中,从分词结果中提取到的设备名称可以携带该设备名称的词频,其中,设备名称的词频是指该设备名称在待审核安全措施中出现的次数。假设将从分词结果中提取到的设备名称记为td=[(td1,fd1),(td2,fd2),......,(tdm,fdm)],其中,tdm表示任一设备名称,fdm表示tdm对应的词频,m为分词结果中包含的设备名称的个数。对td进行向量化表示得到其对应的第一向量vd=[(td1:fd1),(td2:fd2),......,(tdm:fdm)]。
为了体现各个设备名称对应的设备之间的权重关系,以及设备名称与剩余词之间的权重关系,从而进一步细化安全措施的审核精度,提高审核结果的准确性,本申请实施例还可以为各个设备名称分别设置权重值。
一种可选的实施方式中,基于待审核安全措施的分词结果中的设备名称的个数和剩余词的个数,以及各个设备名称对应的设备在预先建立的设备树中的层级,为各个设备名称分别设置权重值。具体的,各个设备名称的权重值的设置可以采用以下公式(1):
wdx=Cdhdxm/n (1);
其中,wdx表示设备名称的权重值,m表示待审核安全措施的分词结果中的设备名称的个数,n表示待审核安全措施的分词结果中的剩余词的个数,hdx表示设备名称对应的设备在设备树中的层级,其中,设备树中的父设备的层级小于子设备的层级,Cd为设备权重常量,为预先设置的常数。
基于上述方式为各个设备名称分别设置权重值之后,基于权重值对待审核安全措施的分词结果中的设备名称进行向量化表示,得到设备名称对应的第一向量。
以上述td为例,分别为td中的各个设备名称设置权重值wd1,wd2,......wdm,然后基于上述权重值对td进行向量化表示,得到td对应的第一向量vd=[(td1:wd1fd1),(td2:wd2fd2),......,(td1:wdmfdm)]。
另外,本申请实施例对待审核安全措施的分词结果中的剩余词进行向量化表示,得到该待审核安全措施的分词结果中的剩余词对应的第二向量。假设将分词结果中的剩余词记为tre=[(tre1,fre1),(tre2,fre2),......,(tren,fren)],其中,tren表示任一剩余词,fren表示tren对应的词频,n为分词结果中包含的剩余词的个数。对tre进行向量化表示得到其对应的第二向量vre=[(tre1:fre1),(tre2:fre2),......,(tren:fren)]。
S104:基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度。
本申请实施例中,预先对待审核安全措施对应的标准安全措施进行分词处理,得到标准安全措施的分词结果,在提取分词结果中的设备名称后,得到分词结果的剩余词,然后分别对标准安全措施的分词结果中的设备名称和剩余词分别进行向量化表示,得到标准安全措施的设备名称向量和剩余词向量。具体的,对标准安全措施的处理方式可以参考上述对待审核安全措施的处理方式,在此不再赘述。
本申请实施例中,在得到待审核安全措施的第一向量和第二向量之后,基于第一向量和第二向量,以及标准安全措施的设备名称向量和剩余词向量,计算待审核安全措施和标准安全措施的第一相似度。
一种可选的实施方式中,第一相似度可以为余弦相似度,具体的,可以通过以下公式(2)计算待审核安全措施和标准安全措施的第一相似度sim:
Figure BDA0002324203820000081
其中,vre1和vd1分别表示待审核安全措施的第一向量和第二向量,vre2和vd2分别表示标准安全措施的剩余词向量和设备名称向量。
S105:基于所述第一相似度,确定所述待审核安全措施的审核结果。
本申请实施例中,在得到待审核安全措施和标准安全措施之间的第一相似度之后,通过将第一相似度与预设第一阈值进行比较,确定待审核安全措施的审核结果。具体的,如果第一相似度大于预设第一阈值,则说明待审核安全措施与标准安全措施之间的相似度较高,可以确定待审核安全措施通过审核;如果第一相似度不大于预设第一阈值,则说明待审核安全措施与标准安全措施之间的相似度较低,可以确定待审核安全措施未通过审核。
实际应用中,如果任一条待审核安全措施未通过审核,则可以说明该待审核安全措施所属的工作票未通过审核,需要对其进行更正修改。
本申请实施例提供的安全措施的审核方法中,首先对待审核安全措施进行分词处理,得到分词结果,其次,提取分词结果中的设备名称后,得到分词结果中的剩余词。再次,分别对设备名称和剩余词进行向量化表示,得到设备名称对应的第一向量和剩余词对应的第二向量。然后,基于第一向量、第二向量、标准安全措施的设备名称向量和剩余词向量,计算待审核安全措施和标准安全措施的第一相似度。最终,基于第一相似度,确定待审核安全措施的审核结果。显然,与现有技术中的人工审核方式相比,本申请能够提高安全措施的审核效率以及审核结果的准确性。
实际应用中,对于某些待审核安全措施,虽然得到的第一相似度大于预设第一阈值,但是事实上该待审核安全措施是不合格的,理论上应该将其审核结果确定为审核未通过。
例如,待审核安全措施“停止#1炉1D磨煤机润滑油站运行,1#、2#油泵电机停电,挂“禁止合闸,有人工作”牌”与其对应的标准安全措施“停止1#、2#油泵电机运行,#1炉1D磨煤机润滑油站停电,挂“禁止合闸,有人工作”牌”,采用上述实施例提供的方法计算得到的第一相似度sim为1,明显大于预设第一阈值,但是事实上二者的真实含义完全不同,显然待审核安全措施不应该通过审核。
针对上述情况,为了进一步提高安全措施的审核结果的准确性,本申请实施例还提供了一种安全措施的审核方法。参考图2,为本申请实施例提供的另一种安全措施的审核方法流程图,该方法包括:
S201:对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果。
S202:提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词。
S203:分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量。
S204:基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度。
对于S201-S204可以参照上述实施例中的S101-S104的描述进行理解,在此不再赘述。
S205:基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度。
由于工作票中的安全措施中的动词和设备名称之间的词序关系,也能够体现安全措施本身的特征。例如,上述例子中的待审核安全措施的第一个短句中包括动词“停止”和“运行”,以及设备名称“#1炉1D磨煤机润滑油站”;而标准安全措施中并不存在同时包括动词“停止”和“运行”,以及设备名称“#1炉1D磨煤机润滑油站”的短句,因此,待审核安全措施的第一个短句不能被匹配成功。相同的,待审核安全措施的第二个短句中包括动词“停电”和设备名称“1#、2#油泵电机”,而标准安全措施中也不存在同时包括动词“停电”和设备名称“1#、2#油泵电机”的短句,因此,待审核安全措施的第二个短句也不能被匹配。显然,可以通过上述基于动词和设备名称的词序关系,以短句为匹配单位的方式,进一步对待审核安全措施进行审核,能够在上述实施例中仅通过计算第一相似度的审核方式的基础上,进一步提高审核结果的准确性。
因此,本申请实施例可以基于动词和设备名称的词序关系,计算待审核安全措施和标准安全措施的第二相似度,用于确定待审核安全措施的审核结果。具体的,本申请实施例提供了一种可选的计算第二相似度的方式,参考图3,为本申请实施例提供的一种第二相似度的计算方法流程图,该方法包括:
S301:按照预设标识,将所述待审核安全措施划分成短句。
由于动词和设备名称的词序关系可以通过将安全措施划分成短句,以每个短句中包含的动词和设备名称作为匹配对象的方式体现,因此,本申请实施例可以将待审核安全措施划分为短句,然后以每个短句中包含的动词和设备名称作为匹配对象,实现对待审核安全措施的审核。
实际应用中,可以按照预设标识,将待审核安全措施划分为短句。其中,预设标识可以为预设标点符号“,”、“;”、“。”、“!”、“,”、“.”等。
S302:提取所述短句中的动词和设备名称,构成所述短句对应的词序关系集合。
本申请实施例中,在将待审核安全措施划分成若干短句之后,分别提取各个短句中的动词和设备名称,用于构成对应的短句的词序关系集合。也就是说,待审核安全措施中的每个短句对应的词序关系集合中包括该短句中的动词和设备名称。
假设待审核安全措施M经过短句划分后,得到x个短句,记为[m1,m2......mx],其中,短句mx对应的词序关系集合记为[tvx1,......ddmx],则[m1,m2......mx]中每个短句对应的词序关系集合共同组成[(tv11,......ddm1)......(tvx1,......ddmx)];其中,tv11......tvx1分别表示动词,ddm1......ddmx分别表示设备名称。
本申请实施例中,每个短句对应的词序关系集合中可能包括多个动词和多个设备名称,为了提高后续对各个词序关系集合的匹配效率,对于包括一个以上设备名称的词序关系集合,可以基于预先建立的设备树的层级关系,从该一个以上设备名称中选择一个保留在该词序关系集合中。
由于层级越高的设备越能够体现短句的特征,因此,可以将短句中层级最高的设备对应的设备名称加入该短句的词序关系集合。具体的,设备树中的父设备的层级低于子设备的层级,因此,将短句中的最高层级的子设备对应的设备名称加入该短句中的词序关系集合。
一种可选的具体实施方式中,首先提取待审核安全措施的各个短句中的动词,以及基于预先建立的设备树的层级关系,提取各个短句中的设备名称。然后,利用提取到的动词和设备名称,构成对应的短句的词序关系集合。具体的,对于短句中设备名称的提取方式,可以仅提取各个短句中层级最高的设备对应的设备名称。
S303:分别将各个短句对应的词序关系集合与所述标准安全措施的标准词序关系集合进行匹配。
本申请实施例中,可以以与待审核安全措施相同的处理方式,得到标准安全措施的各个短句分别对应的标准词序关系集合,用于作为待审核安全措施的匹配标准。一种可选的实施方式中,为了调高待审核安全措施的审核效率,本申请实施例可以预先得到标准安全措施的标准词序关系集合,以便用于本申请的安全措施的审核方法中。
本申请实施例中,在得到待审核安全措施的各个短句分别对应的词序关系集合之后,分别将各个词序关系集合与标准安全措施的标准词序关系集合进行匹配。具体的,如果任一词序关系集合中的动词和设备名称与该标准安全措施的某个标准词序关系集合中的动词和设备名称均相同,则可以确定该词序关系集合匹配成功;否则可以确定该词序关系集合匹配失败。
实际应用中,通过上述方式完成待审核安全措施的所有短句对应的词序关系集合的匹配之后,统计匹配成功的词序关系集合的个数,以及待审核安全措施的短句总个数,用于计算待审核安全措施和标准安全措施的第二相似度。
S304:基于匹配成功的词序关系集合的个数和所述待审核安全措施的短句总个数,计算所述待审核安全措施和所述标准安全措施的第二相似度。
一种可选的实施方式中,可以将匹配成功的词序关系集合的个数与待审核安全措施的短句总个数的比值,作为待审核安全措施和标准安全措施的第二相似度。
S206:结合所述第一相似度和所述第二相似度,确定所述待审核安全措施的审核结果。
本申请实施例中,在得到待审核安全措施与标准安全措施的第一相似度和第二相似度之后,结合第一相似度和第二相似度,确定待审核安全措施的审核结果。
一种可选的实施方式中,可以计算第一相似度和第二相似度的乘积,将该乘积作为最终相似度,并判断最终相似度是否大于预设第二阈值,如果最终相似度大于预设第二阈值,则确定待审核安全措施的审核结果为通过审核;否则确定待审核安全措施的审核结果为未通过审核。
另一种可选的实施方式中,在得到待审核安全措施与标准安全措施的第一相似度和第二相似度之后,可以先判断第一相似度是否大于预设第一阈值,如果大于,则计算第一相似度和第二相似度的乘积,将该乘积作为最终相似度,并判断最终相似度是否大于预设第二阈值,如果最终相似度大于预设第二阈值,则确定待审核安全措施的审核结果为通过审核;否则确定待审核安全措施的审核结果为未通过审核。另外,如果第一相似度不大于预设第一阈值,则直接确定待审核安全措施的审核结果为未通过审核。
一种具体的实现方式中,可以利用以下公式(3)计算最终相似度S:
Figure BDA0002324203820000131
其中,sim表示第一相似度,
Figure BDA0002324203820000132
表示第二相似度,y表示匹配成功的词序关系集合的个数,x表示待审核安全措施的短句总个数,Csim为第一相似度的权重值,为预设常量。
本申请实施例提供的安全措施的审核方法,能够结合基于整句相似度计算得到的第一相似度和基于动词和设备名称的词序关系计算得到的第二相似度,确定待审核安全措施的审核结果,因此,本申请实施例能够进一步的提高安全措施的审核结果的准确性。
与上述方法实施例相对应的,本申请还提供了一种安全措施的审核装置,参考图4,为本申请实施例提供的一种安全措施的审核装置结构示意图,所述装置包括:
分词模块401,用于对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果;
提取模块402,用于提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词;
向量化模块403,用于分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量;
第一计算模块404,用于基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度;
确定模块405,用于基于所述第一相似度,确定所述待审核安全措施的审核结果。
一种可选的实施方式中,所述装置还包括:
第二计算模块,用于基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度;
相应的,所述确定模块,具体用于:
结合所述第一相似度和所述第二相似度,确定所述待审核安全措施的审核结果。
一种可选的实施方式中,所述向量化模块,包括:
设置子模块,用于基于所述待审核安全措施的分词结果中的设备名称的个数和剩余词的个数,以及各个设备名称对应的设备在预先建立的设备树中的层级,为各个设备名称分别设置权重值;
第一向量化子模块,用于基于所述权重值,对所述待审核安全措施的分词结果中的设备名称进行向量化表示,得到所述设备名称对应的第一向量;
第二向量化子模块,用于对所述剩余词进行向量化表示,得到所述剩余词对应的第二向量。
一种可选的实施方式中,所述第二计算模块,包括:
划分子模块,用于按照预设标识,将所述待审核安全措施划分成短句;
第一提取子模块,用于提取所述短句中的动词和设备名称,构成所述短句对应的词序关系集合;
匹配子模块,用于分别将各个短句对应的词序关系集合与所述标准安全措施的标准词序关系集合进行匹配;
计算子模块,用于基于匹配成功的词序关系集合的个数和所述待审核安全措施的短句总个数,计算所述待审核安全措施和所述标准安全措施的第二相似度。
一种可选的实施方式中,所述短句对应的词序关系集合包括至多一个设备名称;
所述第一提取子模块,包括:
第二提取子模块,用于提取所述短句中的动词,以及基于预先建立的设备树的层级关系,提取所述短句中的设备名称;
构成子模块,用于利用所述动词和所述设备名称,构成所述短句对应的词序关系集合。
本申请实施例提供的安全措施的审核装置,对待审核安全措施进行分词处理,得到分词结果,提取分词结果中的设备名称后,得到分词结果中的剩余词。分别对设备名称和剩余词进行向量化表示,得到设备名称对应的第一向量和剩余词对应的第二向量。基于第一向量、第二向量、标准安全措施的设备名称向量和剩余词向量,计算待审核安全措施和标准安全措施的第一相似度。基于第一相似度,确定待审核安全措施的审核结果。显然,与现有技术中的人工审核方式相比,本申请能够提高安全措施的审核效率以及审核结果的准确性。
另外,本申请实施例还能够结合基于整句相似度计算得到的第一相似度和基于动词和设备名称的词序关系计算得到的第二相似度,确定待审核安全措施的审核结果,因此,本申请实施例能够进一步的提高安全措施的审核结果的准确性。
另外,本申请实施例还提供了一种安全措施的审核设备,参见图5所示,可以包括:
处理器501、存储器502、输入装置503和输出装置504。安全措施的审核设备中的处理器501的数量可以一个或多个,图5中以一个处理器为例。在本发明的一些实施例中,处理器501、存储器502、输入装置503和输出装置504可通过总线或其它方式连接,其中,图5中以通过总线连接为例。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行安全措施的审核设备的各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置503可用于接收输入的数字或字符信息,以及产生与安全措施的审核设备的用户设置以及功能控制有关的信号输入。
具体在本实施例中,处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现上述安全措施的审核设备的各种功能。
另外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现安全措施的审核功能。
可以理解的是,对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请实施例所提供的一种安全措施的审核方法、装置及设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种安全措施的审核方法,其特征在于,所述方法包括:
对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果;
提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词;
分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量;
基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度;
基于所述第一相似度,确定所述待审核安全措施的审核结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一相似度,确定所述待审核安全措施的审核结果之前,还包括:
基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度;
相应的,所述基于所述第一相似度,确定所述待审核安全措施的审核结果,具体为:
结合所述第一相似度和所述第二相似度,确定所述待审核安全措施的审核结果。
3.根据权利要求1所述的方法,其特征在于,所述分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量,包括:
基于所述待审核安全措施的分词结果中的设备名称的个数和剩余词的个数,以及各个设备名称对应的设备在预先建立的设备树中的层级,为各个设备名称分别设置权重值;
基于所述权重值,对所述待审核安全措施的分词结果中的设备名称进行向量化表示,得到所述设备名称对应的第一向量;
以及,对所述剩余词进行向量化表示,得到所述剩余词对应的第二向量。
4.根据权利要求2所述的方法,其特征在于,所述基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度,包括:
按照预设标识,将所述待审核安全措施划分成短句;
提取所述短句中的动词和设备名称,构成所述短句对应的词序关系集合;
分别将各个短句对应的词序关系集合与所述标准安全措施的标准词序关系集合进行匹配;
基于匹配成功的词序关系集合的个数和所述待审核安全措施的短句总个数,计算所述待审核安全措施和所述标准安全措施的第二相似度。
5.根据权利要求4所述的方法,其特征在于,所述短句对应的词序关系集合包括至多一个设备名称;
所述提取所述短句中的动词和设备名称,构成所述短句对应的词序关系集合,包括:
提取所述短句中的动词,以及基于预先建立的设备树的层级关系,提取所述短句中的设备名称;
利用所述动词和所述设备名称,构成所述短句对应的词序关系集合。
6.一种安全措施的审核装置,其特征在于,所述装置包括:
分词模块,用于对待审核安全措施进行分词处理,得到所述待审核安全措施的分词结果;
提取模块,用于提取所述待审核安全措施的分词结果中的设备名称后,得到所述分词结果中的剩余词;
向量化模块,用于分别对所述设备名称和所述剩余词进行向量化表示,得到所述设备名称对应的第一向量和所述剩余词对应的第二向量;
第一计算模块,用于基于所述第一向量、所述第二向量、预先获取的标准安全措施的设备名称向量和剩余词向量,计算所述待审核安全措施与所述标准安全措施的第一相似度;
确定模块,用于基于所述第一相似度,确定所述待审核安全措施的审核结果。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二计算模块,用于基于动词和设备名称的词序关系,计算所述待审核安全措施和所述标准安全措施的第二相似度;
相应的,所述确定模块,具体用于:
结合所述第一相似度和所述第二相似度,确定所述待审核安全措施的审核结果。
8.根据权利要求6所述的装置,其特征在于,所述向量化模块,包括:
设置子模块,用于基于所述待审核安全措施的分词结果中的设备名称的个数和剩余词的个数,以及各个设备名称对应的设备在预先建立的设备树中的层级,为各个设备名称分别设置权重值;
第一向量化子模块,用于基于所述权重值,对所述待审核安全措施的分词结果中的设备名称进行向量化表示,得到所述设备名称对应的第一向量;
第二向量化子模块,用于对所述剩余词进行向量化表示,得到所述剩余词对应的第二向量。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现如权利要求1-5任一项所述的方法。
10.一种设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5任一项所述的方法。
CN201911309784.5A 2019-12-18 2019-12-18 一种安全措施的审核方法、装置及设备 Active CN111222313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911309784.5A CN111222313B (zh) 2019-12-18 2019-12-18 一种安全措施的审核方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911309784.5A CN111222313B (zh) 2019-12-18 2019-12-18 一种安全措施的审核方法、装置及设备

Publications (2)

Publication Number Publication Date
CN111222313A true CN111222313A (zh) 2020-06-02
CN111222313B CN111222313B (zh) 2023-08-18

Family

ID=70830860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911309784.5A Active CN111222313B (zh) 2019-12-18 2019-12-18 一种安全措施的审核方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111222313B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018040503A1 (zh) * 2016-08-30 2018-03-08 北京百度网讯科技有限公司 获取搜索结果的方法和装置
CN107862477A (zh) * 2017-12-05 2018-03-30 广东电网有限责任公司江门供电局 一种线路第一种工作票安全措施的自动审核方法
CN110399463A (zh) * 2019-07-29 2019-11-01 国网河北省电力有限公司 工作票的相似度匹配方法及装置
CN110580308A (zh) * 2018-05-22 2019-12-17 北京京东振世信息技术有限公司 信息审核方法及装置、电子设备、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018040503A1 (zh) * 2016-08-30 2018-03-08 北京百度网讯科技有限公司 获取搜索结果的方法和装置
CN107862477A (zh) * 2017-12-05 2018-03-30 广东电网有限责任公司江门供电局 一种线路第一种工作票安全措施的自动审核方法
CN110580308A (zh) * 2018-05-22 2019-12-17 北京京东振世信息技术有限公司 信息审核方法及装置、电子设备、存储介质
CN110399463A (zh) * 2019-07-29 2019-11-01 国网河北省电力有限公司 工作票的相似度匹配方法及装置

Also Published As

Publication number Publication date
CN111222313B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN107491536B (zh) 一种试题校验方法、试题校验装置及电子设备
CN111046142A (zh) 文本审查方法、装置、电子设备及计算机存储介质
CN110147926A (zh) 一种业务类型的风险等级计算方法、存储介质及终端设备
CN111798123A (zh) 基于人工智能的合规性评价方法、装置、设备及介质
CN110472866A (zh) 一种工单质检分析方法及装置
CN112613321A (zh) 一种抽取文本中实体属性信息的方法及系统
CN112507073A (zh) 配电网作业文件的内容校验方法及相关设备
CN113628043B (zh) 基于数据分类的投诉有效性判断方法、装置、设备及介质
CN113344125B (zh) 长文本匹配识别方法、装置、电子设备及存储介质
CN114372082A (zh) 基于人工智能的数据查询方法、装置、电子设备及介质
CN112579794B (zh) 一种为中英文单词对预测义原树的方法及系统
CN109871540B (zh) 一种文本相似度的计算方法以及相关设备
CN112395866A (zh) 报关单数据匹配方法及装置
CN112579781A (zh) 文本归类方法、装置、电子设备及介质
CN112069808A (zh) 融资风控方法、装置、计算机设备及存储介质
CN112597748A (zh) 语料生成方法、装置、设备及计算机可读存储介质
CN109766527B (zh) 一种文本相似度的计算方法以及相关设备
CN111222313A (zh) 一种安全措施的审核方法、装置及设备
CN110852893A (zh) 基于海量数据的风险识别方法、系统、设备及存储介质
CN113807975B (zh) 一种校验信息的方法、装置、计算机设备及存储介质
CN113282709B (zh) 文本匹配方法、装置、设备及计算机可读存储介质
CN114443493A (zh) 一种测试案例生成方法、装置、电子设备和存储介质
CN112115212B (zh) 参数识别方法、装置和电子设备
CN114398676A (zh) 基于人工智能的数据安全分级方法、装置、设备及介质
CN114064893A (zh) 一种异常数据审核方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant