发明内容
针对现有技术中未能有效识别承包商问题的技术问题,本发明提供了一种承包商问题预警方法、一种承包商问题预警装置及一种承包商问题预警系统,采用该方法能够实现对承包商问题的高效多层次自动分类分析,从而指导管理人员,明确管控重点。
为实现上述目的,本发明一方面提供一种承包商问题预警方法,预警方法包括以下步骤:持续获取承包商问题,利用承包商问题分类模型确定每一承包商问题的不同问题分类的类别概率,其中,所述问题分类包括负面类别和正面类别;根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题;利用负面问题分类模型对负面问题进行不同负面问题分类;针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警。
进一步地,所述承包商问题分类模型通过以下方式构建:获取不同历史问题的历史问题表述和问题分类;按照不同历史问题的问题分类对历史问题表述进行顺序数值编码,组成相应的键值对字典,生成问题字典模型;对所述历史问题表述进行分词处理,生成问题描述分词列表;将所述问题描述分词列表转化为问题向量矩阵;利用所述问题字典模型和所述问题向量矩阵构建所述承包商问题分类模型。
进一步地,所述根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题,包括:针对每一承包商问题,确定该承包商问题的问题分类的类别概率的最大值,将类别概率的最大值对应的问题分类作为该承包商问题的问题分类。
进一步地,所述负面问题分类模型根据以下方式构建:获取不同历史负面问题的历史负面问题表述和负面问题分类;按照不同历史负面问题的负面问题分类对历史负面问题表述进行顺序数值编码,组成相应的键值对字典,生成负面字典模型;对所述历史负面问题表述进行分词处理,生成负面描述分词列表;将所述负面描述分词列表转化为负面向量矩阵;利用所述负面字典模型和所述负面向量矩阵构建所述负面问题分类模型。
进一步地,所述利用负面问题分类模型对负面问题进行不同负面问题分类,包括:利用所述负面问题分类模型确定负面问题的不同负面问题分类的类别概率;根据每一负面问题的负面问题分类的类别概率确定该负面问题的负面问题分类。
进一步地,针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警,包括:在负面问题为重复性问题的情况下,若该重复性问题平均出现间隔时间大于第一设定时间,输出预警信息;在负面问题为共性问题的情况下,若该共性问题在检测时间段内的出现次数大于第一设定次数,输出预警信息;在负面问题为个性问题的情况下,若该个性问题在检测时间段内的出现次数大于第二设定次数,输出预警信息。
本发明第二方面提供一种承包商问题预警装置,所述承包商问题预警装置包括:类别概率确定模块,用于持续获取承包商问题,利用承包商问题分类模型确定每一承包商问题的不同问题分类的类别概率,其中,所述问题分类包括负面类别和正面类别;负面问题确定模块,用于根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题;负面问题分类模块,用于利用负面问题分类模型对负面问题进行不同负面问题分类;预警模块,用于针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警。
进一步地,所述承包商问题分类模型通过以下方式构建:获取不同历史问题的历史问题表述和问题分类;按照不同历史问题的问题分类对历史问题表述进行顺序数值编码,组成相应的键值对字典,生成问题字典模型;对所述历史问题表述进行分词处理,生成问题描述分词列表;将所述问题描述分词列表转化为问题向量矩阵;利用所述问题字典模型和所述问题向量矩阵构建所述承包商问题分类模型。
进一步地,所述根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题,包括:针对每一承包商问题,确定该承包商问题的问题分类的类别概率的最大值,将类别概率的最大值对应的问题分类作为该承包商问题的问题分类。
进一步地,所述负面问题分类模型根据以下方式构建:获取不同历史负面问题的历史负面问题表述和负面问题分类;按照不同历史负面问题的负面问题分类对历史负面问题表述进行顺序数值编码,组成相应的键值对字典,生成负面字典模型;对所述历史负面问题表述进行分词处理,生成负面描述分词列表;将所述负面描述分词列表转化为负面向量矩阵;利用所述负面字典模型和所述负面向量矩阵构建所述负面问题分类模型。
进一步地,所述利用负面问题分类模型对负面问题进行不同负面问题分类,包括:利用所述负面问题分类模型确定负面问题的不同负面问题分类的类别概率;根据每一负面问题的负面问题分类的类别概率确定该负面问题的负面问题分类。
进一步地,针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警,包括:在负面问题为重复性问题的情况下,若该重复性问题平均出现间隔时间大于第一设定时间,输出预警信息;在负面问题为共性问题的情况下,若该共性问题在检测时间段内的出现次数大于第一设定次数,输出预警信息;在负面问题为个性问题的情况下,若该个性问题在检测时间段内的出现次数大于第二设定次数,输出预警信息。
本发明第三方面提供一种承包商问题预警系统,包括:上文所述的承包商问题预警装置。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当其在计算机上运行时,使得计算机执行上文所述的承包商问题预警方法。
通过本发明提供的技术方案,本发明至少具有如下技术效果:
本发明的承包商问题预警方法,持续获取承包商问题,利用承包商问题分类模型确定每一承包商问题的负面类别和正面类别的类别概率,从承包商问题中确定出负面问题。然后利用负面问题分类模型对负面问题进行不同负面问题分类,针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警。通过本发明提供的包商问题预警方法,能够实现对承包商问题的高效多层次自动分类分析,从而指导管理人员,明确管控重点。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明中,在未作相反说明的情况下,使用的方位词如“上、下、顶、底”通常是针对附图所示的方向而言的或者是针对竖直、垂直或重力方向上而言的各部件相互位置关系描述用词。
下面将参考附图并结合实施例来详细说明本发明。
请参考图1,本发明实施例提供一种化工装置危险预警方法,该方法包括以下步骤:S101:持续获取承包商问题,利用承包商问题分类模型确定每一承包商问题的不同问题分类的类别概率,其中,所述问题分类包括负面类别和正面类别;S102:根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题;S103:利用负面问题分类模型对负面问题进行不同负面问题分类;S104:针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警。
具体地,本发明实施方式中,通过企业安全检查系统持续获取承包商问题数据,每一条承包商问题数据包括企业名称、检查时间、问题描述、整改状态等字段。对于每一个获取的承包商问题的问题描述,利用承包商问题分类模型确定每一承包商问题的负面类别和正面类别的类别概率,根据类别概率从承包商问题中确定出负面问题。然后利用负面问题分类模型对负面问题进行细分类,确定负面问题的负面问题分类,对每一负面问题分类,根据该类负面问题在检测时间段内的出现次数进行预警。
根据本发明提供的承包商问题预警方法,能够实现对承包商问题的高效多层次自动分类分析,从而指导管理人员,明确管控重点。
进一步地,所述承包商问题分类模型通过以下方式构建:获取不同历史问题的历史问题表述和问题分类;按照不同历史问题的问题分类对历史问题表述进行顺序数值编码,组成相应的键值对字典,生成问题字典模型;对所述历史问题表述进行分词处理,生成问题描述分词列表;将所述问题描述分词列表转化为问题向量矩阵;利用所述问题字典模型和所述问题向量矩阵构建所述承包商问题分类模型。
具体地,本发明实施方式中,获取多个历史问题,包括历史问题的历史问题表述和对应的问题分类,按照不同历史问题的问题分类对历史问题表述进行顺序数值编码,组成相应的键值对字典,生成问题字典模型。采用分词工具对历史问题表述进行分词处理,并去除标点符号、停用词,生成问题描述分词列表。本发明实施例中,可以采用jieba分词工具。然后通过词频逆序文档(TF-IDF)公式,计算计算承包商问题列表中每个词对应的TF-IDF值,可以使用TfidfVectorizer等工具获得每个词的TF-IDF对应的权重矩阵,并保存为TF-IDF文本向量模型,并通过该向量模型将问题描述分词列表转化为问题向量矩阵。将问题字典模型和问题向量矩阵按照一定比例拆分为训练集、测试集。采用机器学习方法对包含问题字典模型和问题向量矩阵的训练集合进行训练,得到承包商问题分类模型。
进一步地,所述根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题,包括:针对每一承包商问题,确定该承包商问题的问题分类的类别概率的最大值,将类别概率的最大值对应的问题分类作为该承包商问题的问题分类。
具体地,本发明实施方式中,将每一承包商问题输入承包商问题分类模型,得到该承包商问题的负面类别的概率和正面类别的概率,选择数值最大的问题分类作为该该承包商问题的问题分类。
根据本发明提供的承包商问题预警方法,能够精确判断承包商问题的问题分类,有助于对承包商问题进行细分类,能够精确管控,准确预警。
进一步地,所述负面问题分类模型根据以下方式构建:获取不同历史负面问题的历史负面问题表述和负面问题分类;按照不同历史负面问题的负面问题分类对历史负面问题表述进行顺序数值编码,组成相应的键值对字典,生成负面字典模型;对所述历史负面问题表述进行分词处理,生成负面描述分词列表;将所述负面描述分词列表转化为负面向量矩阵;利用所述负面字典模型和所述负面向量矩阵构建所述负面问题分类模型。
具体地,本发明实施方式中,获取多个历史负面问题,包括历史负面问题的历史负面问题表述和对应的负面问题分类,按照不同历史负面问题的负面问题分类对历史负面问题表述进行顺序数值编码,组成相应的键值对字典,生成负面字典模型。采用分词工具对历史负面问题表述进行分词处理,并去除标点符号、停用词,生成负面描述分词列表。本发明实施例中,可以采用jieba分词工具。然后通过词频逆序文档(TF-IDF)公式,计算计算承包商问题列表中每个词对应的TF-IDF值,可以使用TfidfVectorizer等工具获得每个词的TF-IDF对应的权重矩阵,并保存为TF-IDF文本向量模型,并通过该向量模型将负面描述分词列表转化为负面向量矩阵。将负面字典模型和负面向量矩阵按照一定比例拆分为训练集、测试集。采用机器学习方法对包含负面字典模型和负面向量矩阵的训练集合进行训练,得到负面问题分类模型。
进一步地,所述利用负面问题分类模型对负面问题进行不同负面问题分类,包括:利用所述负面问题分类模型确定负面问题的不同负面问题分类的类别概率;根据每一负面问题的负面问题分类的类别概率确定该负面问题的负面问题分类。
具体地,本发明实施方式中,将每一负面问题输入负面问题分类模型,得到不同负面问题分类的类别概率,选择概率最大值对应的负面问题分类作为该负面问题的负面问题分类。
根据本发明提供的承包商问题预警方法,能够精确对负面问题进行分类,保证准确预警和管控。
进一步地,针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警,包括:在负面问题为重复性问题的情况下,若该重复性问题平均出现间隔时间大于第一设定时间,输出预警信息;在负面问题为共性问题的情况下,若该共性问题在检测时间段内的出现次数大于第一设定次数,输出预警信息;在负面问题为个性问题的情况下,若该个性问题在检测时间段内的出现次数大于第二设定次数,输出预警信息。
具体地,本发明实施方式中,如果该类负面问题为重复性问题,计算该重复性问题的平均出现间隔时间,如果平均出现间隔时间大于第一设定时间,输出预警信息。如果该类负面问题为共性问题,计算该共性问题在检测时间段内的出现次数,如果检测时间段内的出现次数大于第一设定次数,输出预警信息。如果该类负面问题为个性问题,计算该个性问题在检测时间段内的出现次数,如果检测时间段内的出现次数大于第二设定次数,输出预警信息。
实施例一
通过企业安全检查系统持续获取承包商问题数据,每一条承包商问题数据包括企业名称、检查时间、问题描述、整改状态等字段,如下表所示:
表1
获取多个历史问题,其来源可以是人工手动标注或者人员录入检查系统自带的标注数据,每一条数据包括历史问题的历史问题表述和对应的问题分类。
表2
按照不同历史问题的问题分类对历史问题表述进行顺序数值编码,组成相应的键值对字典,生成问题字典模型,{0:“安全行为”,1:“负面行为”}。采用jieba分词工具对历史问题表述进行分词处理,并去除标点符号、停用词,生成问题描述分词列表。然后通过词频逆序文档(TF-IDF)公式,计算计算承包商问题列表中每个词对应的TF-IDF值,可以使用TfidfVectorizer等工具获得每个词的TF-IDF对应的权重矩阵,并保存为TF-IDF文本向量模型,并通过该向量模型将问题描述分词列表转化为问题向量矩阵。将问题字典模型和问题向量矩阵采用sklearn中的train_test_split按照一定比例(20%-30%)拆分为训练集、测试集。采用随机森林、朴素贝叶斯等机器学习方法对测试集合进行训练,得到承包商问题分类模型。
对于每一个获取的承包商问题的问题描述,利用承包商问题分类模型确定每一承包商问题的负面类别和正面类别的类别概率(请参考表3),根据类别概率从承包商问题中确定出负面问题(请参考表4)。
表3
表4
然后利用负面问题分类模型对负面问题进行不同负面问题分类,针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警。
请参考表5,重复性问题预警通过选择某一企业,筛选不同类型负面问题,按照日期顺序分别计算该类负面问题每次出现的日期,剔除其中重复出现的日期,计算所有相邻两个日期之间间隔的天数,而后求间隔天数的平均值,最终可以计算获得每类负面问题出现的平均间隔天数,对于间隔天数较短的进行预警。
表5
请参考表6,共性问题预警通过筛选设定时间范围内的问题,计算每类负面问题在各个企业中出现的次数,若该次数超过第一设定次数,这里设置为1,且超过设定次数阈值的企业数量占比大于设定的比例阈值80%,则对满足条件的负面问题进行共性问题预警。
表6
请参考表7,个性问题预警通过筛选设定时间范围内的问题,计算每类负面问题在各个企业中出现的次数,若面问题分类出现的次数超过第二设定次数100次,则对满足条件的负面问题分类进行个性问题预警。
表7
请参考图2,本发明第二方面提供一种承包商问题预警装置,所述承包商问题预警装置包括:类别概率确定模块,用于持续获取承包商问题,利用承包商问题分类模型确定每一承包商问题的不同问题分类的类别概率,其中,所述问题分类包括负面类别和正面类别;负面问题确定模块,用于根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题;负面问题分类模块,用于利用负面问题分类模型对负面问题进行不同负面问题分类;预警模块,用于针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警。
进一步地,所述承包商问题分类模型通过以下方式构建:获取不同历史问题的历史问题表述和问题分类;按照不同历史问题的问题分类对历史问题表述进行顺序数值编码,组成相应的键值对字典,生成问题字典模型;对所述历史问题表述进行分词处理,生成问题描述分词列表;将所述问题描述分词列表转化为问题向量矩阵;利用所述问题字典模型和所述问题向量矩阵构建所述承包商问题分类模型。
进一步地,所述根据每一承包商问题的问题分类的类别概率,从承包商问题中确定出负面问题,包括:针对每一承包商问题,确定该承包商问题的问题分类的类别概率的最大值,将类别概率的最大值对应的问题分类作为该承包商问题的问题分类。
进一步地,所述负面问题分类模型根据以下方式构建:获取不同历史负面问题的历史负面问题表述和负面问题分类;按照不同历史负面问题的负面问题分类对历史负面问题表述进行顺序数值编码,组成相应的键值对字典,生成负面字典模型;对所述历史负面问题表述进行分词处理,生成负面描述分词列表;将所述负面描述分词列表转化为负面向量矩阵;利用所述负面字典模型和所述负面向量矩阵构建所述负面问题分类模型。
进一步地,所述利用负面问题分类模型对负面问题进行不同负面问题分类,包括:利用所述负面问题分类模型确定负面问题的不同负面问题分类的类别概率;根据每一负面问题的负面问题分类的类别概率确定该负面问题的负面问题分类。
进一步地,针对每一负面问题分类,根据该类负面问题的平均出现间隔时间或在检测时间段内的出现次数进行预警,包括:在负面问题为重复性问题的情况下,若该重复性问题平均出现间隔时间大于第一设定时间,输出预警信息;在负面问题为共性问题的情况下,若该共性问题在检测时间段内的出现次数大于第一设定次数,输出预警信息;在负面问题为个性问题的情况下,若该个性问题在检测时间段内的出现次数大于第二设定次数,输出预警信息。
本发明第三方面提供一种承包商问题预警系统,包括:上文所述的承包商问题预警装置。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当其在计算机上运行时,使得计算机执行上文所述的承包商问题预警方法。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。