CN113487223A - 一种基于信息融合的风险评估方法和评估系统 - Google Patents
一种基于信息融合的风险评估方法和评估系统 Download PDFInfo
- Publication number
- CN113487223A CN113487223A CN202110839127.2A CN202110839127A CN113487223A CN 113487223 A CN113487223 A CN 113487223A CN 202110839127 A CN202110839127 A CN 202110839127A CN 113487223 A CN113487223 A CN 113487223A
- Authority
- CN
- China
- Prior art keywords
- result
- data
- sample data
- fusion
- risk assessment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012502 risk assessment Methods 0.000 title claims abstract description 47
- 238000011156 evaluation Methods 0.000 claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000012706 support-vector machine Methods 0.000 claims description 42
- 230000009467 reduction Effects 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 235000008216 herbs Nutrition 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000139306 Platt Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000012843 least square support vector machine Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000000246 remedial effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于信息融合的风险评估方法和评估系统,通过获取m个探测器连续采集n次的运行数据,并构建成维度为m×n的数据矩阵,其中m,n为正整数;利用预设的风险评估模型基于数据矩阵生成运行数据的多个分类结果;使用证据理论融合多个分类结果得到融合结果;根据融合结果的冲突系数对融合结果进行校准,并生成评估结果。本发明提供的技术方案提高了风险评估结果的准确性。
Description
技术领域
本发明涉及安全检测技术领域,具体涉及一种基于信息融合的风险评估方法和评估系统。
背景技术
基础设施结构健康监测是指对工程结构进行结构损伤识别、检测和量化的测量,目的是通过在线评估结构的状态性能,及时采取适当措施预防结构破坏。传统的结构健康监测技术是在基础设施的不同位置安装或嵌入多个传感器,实时收集基础设施的性能数据。由于现场一般存在监测点数量多、检测周期长、不同类型数据存在耦合等问题,传统数据挖掘技术基于大量风险数据使用机器学习算法训练检测模型,其结果一般为硬输出结果,对于风险的判别过于绝对,容易影响技术人员进一步地分析和判断。因此,如何进一步提高风险数据分析的结果准确度是有待解决的难题。
发明内容
有鉴于此,本发明实施方式提供了一种基于信息融合的风险评估方法和评估系统,从而提高了根据风险数据识别风险类型的准确性。
根据第一方面,一种基于信息融合的风险评估方法,所述方法包括:
获取m个探测器连续采集n次的运行数据,并构建成维度为m×n的数据矩阵,其中m,n为正整数;
利用预设的风险评估模型基于所述数据矩阵生成所述运行数据的多个分类结果;所述预设的风险评估模型是基于不同预设类的历史样本数据对支持向量机模型进行训练得到的;
使用证据理论融合所述多个分类结果得到融合结果;
根据所述融合结果的冲突系数对所述融合结果进行校准,并生成评估结果。
可选地,所述使用证据理论融合所述多个分类结果得到融合结果,包括:
将所述多个分类结果分别映射为概率分类结果;
分别构建所述概率分类结果的基本概率指派;
利用Dempster规则合成各所述基本概率指派得到融合结果。
可选地,所述根据所述融合结果的冲突系数对融合结果进行校准,并生成评估结果,包括:
当所述冲突系数小于预设值时,则判定所述融合结果为合理,将所述融合结果作为所述评估结果;
当所述冲突系数在所述预设值以上时,则判定所述融合结果为不合理,使用重新合成规则合成各所述基本概率指派得到所述评估结果。
可选地,所述重新合成规则公式为:
其中,A1,A2等分别代表不同支持向量机的概率分类结果,即两个证据源,m1()、m2()代表经支持向量机输出的基本概率指派,m合()代表重新合成后得到的评估结果,A代表合成后命题,Θ代表命题识别框架,Φ代表空集。
可选地,所述方法还包括:
使用置信度指标b评价所述评估结果的可信度,其中:
当所述置信度指标b大于预设指标值时,接受所述评估结果。
可选地,训练生成所述预设的风险评估模型的步骤包括:
由所述探测器获取具有不同预设类的历史样本数据,并针对所述历史样本数据分别进行降维处理生成多个降维样本数据;
使用多个不同的支持向量机分别生成各降维样本数据的预分类结果;
分别计算所述预分类结果和与其对应的所述预设类之间的误差,并根据所述误差校正与其对应的支持向量机的模型权系数,以生成所述风险评估模型。
可选地,所述历史样本数据是维度为m×n的矩阵,m和n为正整数,针对任意一预设类的历史样本数据,所述对所述历史样本数据分别进行降维处理生成多个降维样本数据中的,包括:
将所述历史样本数据归一化;
计算所述历史样本数据中m个主成分的贡献率,历史样本数据矩阵的m个行向量为所述主成分;
以从大到小的顺序筛选出所述贡献率大于预设贡献率的前p个主成分,其中p为正整数;
利用所述前p个主成分生成的系数矩阵对原m×n维度的历史样本数据矩阵进行线性变换得到所述降维样本数据。
可选地,所述方法还包括:
利用网格搜索法对支持向量机内部用于调整其性能的核函数参数和惩罚因子进行寻优。
根据第二方面,一种基于信息融合的风险评估系统,其特征在于,所述系统包括:
数据采集模块,用于获取m个探测器连续采集n次的运行数据,以构建维度为m×n的数据矩阵,其中m,n为正整数;
预分类模块,用于利用预设的风险评估模型基于所述数据矩阵生成所述运行数据的多个分类结果;
信息融合模块,用于使用证据理论融合所述多个分类结果得到融合结果;
校正模块,用于根据所述融合结果的冲突系数对所述融合结果进行校准,并生成评估结果。
根据第四方面,一种电子设备,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面和第二方面,或者第一方面和第二方面中任意一种可选实施方式中所述的方法。
本发明技术方案,具有如下优点:
本发明实施例提供的一种基于信息融合的风险评估方法和评估系统。其中该方法的训练步骤具体包括:对历史样本数据降维处理后消除无关数据分量和白噪声,先一步提高数据准确程度,之后使用多个不同的支持向量机对降维后的数据进行训练得到训练好的风险评估模型,使用该模型输出多个分类结果使得整体分类结果更具有分析和参考价值。其中,该方法的评估步骤包括:采集多个探测器的运行数据,使用训练方法得到的风险评估模型对采集到的运行数据降维并输出分类结果后,采用改进的证据理论对多分类结果进行信息融合,从而得到准确性和可靠度更高的分类结果,之后根据冲突系数进一步对分类结果进行评估和校正,从而提高了风险评估结果的准确度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的一种基于信息融合的风险评估方法的步骤示意图;
图2为本发明实施例的一种基于信息融合的风险评估方法的风险评估模型训练步骤示意图;
图3为本发明实施例的一种基于信息融合的风险评估系统的结构示意图;
图4为本发明实施例的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
请参阅图1,本发明实施例提供的一种基于信息融合的风险评估方法,具体包括如下步骤:
步骤S1:获取m个探测器连续采集n次的运行数据,以构建维度为m×n的数据矩阵,其中m,n为正整数。步骤S2:利用预设的风险评估模型基于数据矩阵生成运行数据的多个分类结果;其中预设的风险评估模型是基于不同预设类的历史样本数据对支持向量机模型进行训练得到的。步骤S3:使用证据理论融合多个分类结果得到融合结果。步骤S4:根据融合结果的冲突系数对融合结果进行校准,并生成评估结果。
其中,步骤S1:获取m个探测器连续采集n次的运行数据,并构建成维度为m×n的数据矩阵,其中m,n为正整数。具体地,在一实施例中,在实际预测阶段,通过预设m个包括但不限于压力传感器、湿度传感器的探测器,以1秒为间隔采集1分钟数据(n=60),得到的运行数据为m×n的矩阵。
其中,步骤S2:利用预设的风险评估模型基于数据矩阵生成运行数据的多个分类结果;其中预设的风险评估模型是基于不同预设类的历史样本数据对支持向量机模型进行训练得到的。具体地,通过预先训练好的风险评估模型将运行数据进行分类后得到多个支持向量机的分类结果,该分类结果为“硬分类结果”形式,其中传统支持向量机的分类结果为“非黑即白”的形式,即对于某一类数据,该分类结果表现形式只有“是”或“不是”两类,或者直接判定为该数据属于某一类的分类结果。因此在本发明实施例中,称这种形式的分类结果为“硬分类结果”,在进行信息融合时,还需进行步骤S3中的概率形式转换,将硬分类结果映射为概率分类结果。
其中,如图2所示,步骤S2中预设的风险评估模型训练步骤S21~S23如下:
步骤S21:由探测器获取具有不同预设类的历史样本数据,并针对历史样本数据分别进行降维处理生成多个降维样本数据。具体地,在实际的基础设施风险监测过程中,例如:在一个建筑的支撑结构上包含多个探测器,其每个探测器的位置和/或类型均有差别,在本发明中,探测器的类型包括但不限于:压力传感器和湿度传感器。而由于建筑结构每次开始发生损坏的具体位置不同,相对于各个探测器的夹角和距离也不同,因此距离近的探测器所采集的数据可信度更高,距离远的探测器采集的数据可靠程度较低。在模型训练过程中使用训练数据均是大量的历史真实数据,其中包括了代表各种风险类型的历史样本数据,这些历史样本数据均是多个探测器采集得到,因此考虑到探测器不同的位置类型因素,为排除其位置干扰,首先对历史样本数据进行降维处理。本发明采用PCA(主成分分析)方法对历史样本数据进行降维处理,通过PCA筛选历史样本数据的多个主成分中贡献率较高的前几位重新组成风险数据,不仅去掉了历史样本数据中的无关数据分量,还过滤了白噪声,提高了历史样本数据的可靠性,并且对数据降维还提高了计算机的计算速度,减少了分类时间。
其中PCA降维处理的具体步骤如下:
历史样本数据是维度为m×n的矩阵,其中m和n为正整数,m对应了m个探测器,每个探测器的向量数据即为一个主成分,历史样本数据矩阵中各个行向量即为主成分,n代表了在一段时间内采集了n次数据,具体地,在本发明实施例中,采用1秒为间隔,采集60秒时间长度的数据,因此n=60。之后,因不同传感器的采集数据表现类型各不相同,在开展模型训练之前,对历史样本数据进行标准化预处理,标准化处理手段包括但不限于:最值归一化、标准分数值归一化及中值归一化。本发明实施例中,采用最值归一化方法将历史样本数据归一化,归一化函数为:
式中,X代表进行归一化处理的历史样本数据,Xmax代表样本数据的最大值,Xmin代表样本数据的最大小值,X′代表归一化后的历史样本数据。
之后,计算历史样本数据中m个主成分的贡献率,并以从大到小的顺序筛选出贡献率大于预设贡献率的前p个主成分,其中p为正整数。用特征值累计贡献率计算预设贡献率,一般大于85%,在风险评估中建议取值95%,筛选出贡献率大于95%的所有主成分之后,在本实施例中,再选取其中贡献率排前2的两个向量数据,即p=2。之后利用前p个主成分生成的系数矩阵对原m×n维度的历史样本数据矩阵线性变换得到降维样本数据,从而完成历史样本数据的降维处理。
步骤S22:使用多个不同的支持向量机分别生成各降维样本数据的预分类结果。具体地,传统技术使用支持向量机模型对不同类型的数据进行分类,但大多都是单一模型进行类型的判断,其最终结果难免存在绝对性,导致准确率不高。为了提高分类结果的可靠性,将多种不同支持向量机的分类结果进行融合是一种很好的办法,因此在这之前,需要获取不同类型支持向量机的预分类结果,在本发明实施中采用支持向量机中的线性支持向量机和最小二乘支持向量机。除此之外,本发明技术方案还有一优选方案,对于同种风险,可以通过分别设置多组不同类型的m个探测器,将每类探测器的数据对应使用一个支持向量机来分类,也可以得到多个支持向量机的结果。例如:对于某一个风险,其风险标签为二级风险,表示二级风险的风险数据可以从压力角度描述,也可以从湿度角度描述,那么分别设置m个压力探测器和m个湿度探测器,使用两个支持向量机分别训练这两类风险数据,也可以得到表示同一种结果的两种支持向量机。在本发明实施例中,使用多个不同的支持向量机,对各个类型的降维样本数据均进行训练,例如:向量机1和向量机2均对风险1和风险2的降维样本数据进行训练,即通过向量机1分别训练风险1和风险2得到预分类结果1和预分类结果2,通过向量机2分别训练风险1和风险2得到预分类结果3和预分类结果4,在风险评估模型的训练过程中,预分类结果1~4组成的集合用于后续参数校正,若在预测过程中,预分类结果1~4组成的集合用于后续证据理论步骤的融合。
步骤S23:分别计算预分类结果和与其对应的预设类之间的误差,并根据误差校正与其对应的支持向量机的模型权系数,以生成风险评估模型。具体地,支持向量机是一种有监督的训练模型,因此通过各个历史样本数据对应的预设类别标签,和训练过程中各支持向量机识别的预分类结果进行误差判断,可采用支持向量机常用的损失函数法进行误差计算。例如,如步骤S22例子中提到的风险1和风险2的预分类结果分别是预分类结果1、3和预分类结果2、4。将预分类结果1、3与风险1的预设类1进行误差比较,通过计算损失函数的值是否小于规定阈值来调整向量机1的模型权系数,同理向量机2的模型参数调整步骤如上。
具体地,在一实施例中,一种优选方案,对支持向量机除模型权系数以外的核函数参数以及惩罚因子进行寻优,在构建SVM模型时,其分类性能受到核函数参数γ以及惩罚因子C的影响。其中C是代表对误差的宽容度,C越大,说明越不能容忍出现误差,容易过拟合;C越小,容易欠拟合。C过大或过小,泛化能力变差。γ隐含地决定了数据映射到新的特征空间后的分布,γ越大,支持向量越少,γ越小,支持向量越多。支持向量的个数影响训练与预测的速度。采用网格搜索法可对参数γ和C进行全面的参数寻优,获取使得交叉验证精度最高的参数组合。网格搜索法复杂度低、并行性高、获取参数结果准确,该算法为现有技术,本发明不再赘述。
其中,步骤S3:使用证据理论融合多个分类结果得到融合结果。具体地,由于步骤S2得到的支持向量机硬分类结果,过于绝对化,并且不利于后期的分析和使用,因此希望在硬分类的基础上,将该分类结果表现为概率形式,不仅使得结果形式更加容易接受,便于后期分析,而且方便了证据理论规则的融合。例如:对于称为风险1的数据,其实际标签是二级数据(全部标签一共三级数据),支持向量机可对其的分类结果判定为二级数据或NULL,具体地,如果在一实施例中,对其判定二级数据,未免过于生硬与武断,将该结果映射为概率的表现形式为:风险1判定为二级数据的可能性是70%;判定为一级数据的可能性为10%;判定为三级数据的可能性为20%。因此,在使用证据理论融合处理之前,需先将多个硬分类结果分别映射为多个概率分类结果。本技术方案采用Platt提出的sigmoid连接函数将向量机硬输出结果映射至[0,1]模型,输出为如下形式:
之后,在一实施例中,分别构建多个概率分类结果的基本概率指派。具体地,由于支持向量机的概率分类结果的形式并不标准,无法直接应用于证据理论规则的融合,因此需要构建各个概率分类结果的基本概率指派。换句话说,对于支持向量机的概率结果很可能是如下表现形式:风险1判定为二级数据的可能性是70%;判定为一级数据的可能性为40%;判定为三级数据的可能性为50%。其概率和并不为1,因此需要进行数值归一化得到符合概率和为1的标准形式,即基本概率指派。对于有集函数m:2Θ→[0,1],满足:
其中,m(A)为A在命题框架Θ上的mass函数,也称为基本概率指派(BPA)。
之后,将得到的多个支持向量机的基本概率指派,利用Dempster规则合成得到融合结果,其合成公式为:
其中,K为冲突系数,取值在[0,1]范围内,表示多个证据之间的冲突程度,m合(A)表示最终融合结果,m1(A1)…mk(Ak)表示需要合并的k个基本概率指派,A是各个证据命题
其得到的最终结果以概率形式展现,不仅方便的技术人员的数据分析,并且多个模型融合结果使得风险的判定更有说服力。
其中,步骤S4:根据融合结果的冲突系数对融合结果进行校准,并生成评估结果。具体地,在本步骤中,具体包括如下步骤:
步骤S41:当冲突系数小于预设值时,则判定融合结果合理,将融合结果作为评估结果。
步骤S42:当冲突系数在预设值以上时,则判定融合结果为不合理,使用重新合成规则合成各基本概率指派得到评估结果。
具体地,在运用证据理论融合时,当K的值更接近1时,会发生矛盾。特别是当K=1时,证据完全冲突(产生悖论),步骤S3中的合成规则公式右侧的分母1-K为零,其等式没有意义。换句话说,这些高度冲突的证据往往产生反直觉的结果,即更大的K代表更高的冲突,更有可能产生更少的信息组合,当完全冲突发生时,得不到任何有效的融合结果。为了最小化高冲突证据的负面影响,本当冲突程度较低(K≤0.95)时,采用Dempster合成规则得到融合结果认为合理,该融合结果即为本发明风险评估方法的评估结果。当K>0.95时,表示在不可接受的高冲突的假设下,使用重新合成规则对冲突证据进行重新合成,或得一个相对精确性不太高但是合理的结果,进一步提高证据融合结果的可靠性。其中重新合成规则的公式如下:
其中,A1,A2等分别代表不同支持向量机的概率分类结果,即两个证据源,m1()、m2()代表经支持向量机输出的基本概率指派,m合()代表重新合成后得到的评估结果,A代表合成后命题,Θ代表命题识别框架,Φ代表空集。
具体地,在一实施例中,一种基于信息融合的风险评估方法,还包括如下步骤:
步骤S5:使用置信度指标b评价评估结果的可信度,其中:
当置信度指标b大于预设指标值时,接受评估结果。
具体地,通过给出一个复合决策规则,用于评估融合结果的可信度。在一个评估结果中,其最高的风险概率值如果远远大于其他概率值,即可认为此评估结果是好的,若评估结果中各风险概率值均很相近,会容易产生混淆,那么该评估结果出错的可能性较高。因此设置置信度指标b,如果评估结果中最高风险概率值和第二高风险概率值的差值程度较大,在评估标准的可接受程度内,那么其他风险概率值的数据不论是多少,都不影响最高风险概率值的在所有概率值中凸显。在本发明实施例中,置信度指标b的预设阈值设为50%,例如,评估一共分3个风险等级,某区域的一个评估结果为:风险等级1的风险概率值是30%,风险等级2的风险概率值是70%,风险等级3的风险概率值是0。那么根据置信度指标b公式得b=(0.7-0.3)/0.7=0.571,大于50%,即认为该区域被评估为风险等级2是可信的。如果风险评估结果的可信度高,则立即采取补救或缓解措施,如果可信度低,则进一步通过其他间接措施确认是否存在风险。
通过执行上述各个步骤,本发明实施例提供的一种基于信息融合的风险评估方法。其中该方法的训练步骤具体包括:对历史样本数据降维处理后消除无关样本数据分量和白噪声,先一步提高数据样本准确程度,之后使用多个不同的支持向量机对降维后的数据进行训练得到训练好的风险评估模型,使用该模型输出多个分类结果使得整体分类结果更具有分析和参考价值。其中,该方法的评估步骤包括:采集多个探测器的运行数据,使用训练方法得到的风险评估模型对采集到的运行数据降维并输出分类结果后,采用改进的证据理论对多分类结果进行信息融合,从而得到准确性和可靠度更高的分类结果,之后根据冲突系数进一步对分类结果进行评估和校正,从而提高了风险评估结果的准确度。
如图3所示,本发明实施例还提供了一种基于信息融合的风险评估系统,应用于电子设备,该系统包括:
数据采集模块101,用于获取m个探测器连续采集n次的运行数据,以构建维度为m×n的数据矩阵,其中m,n为正整数。详细内容参见上述方法实施例中步骤S1的相关描述,在此不再进行赘述。
预分类模块102,用于利用预设的风险评估模型基于数据矩阵生成运行数据的多个分类结果。详细内容参见上述方法实施例中步骤S2的相关描述,在此不再进行赘述。
信息融合模块103,用于使用证据理论融合多个分类结果得到融合结果。详细内容参见上述方法实施例中步骤S3的相关描述,在此不再进行赘述。
校正模块104,用于根据融合结果的冲突系数对融合结果进行校准,并生成评估结果。详细内容参见上述方法实施例中步骤S4的相关描述,在此不再进行赘述。
本发明实施例提供的基于信息融合的风险评估系统,用于执行上述实施例提供的基于信息融合的风险评估方法,其实现方式与原理相同,详细内容参见上述方法实施例的相关描述,不再赘述。
图4示出了本发明实施例的一种电子设备,该设备包括:处理器901和存储器902,可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器901可以为中央处理器(Central Processing Unit,CPU)。处理器901还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器902作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如上述方法实施例中的方法所对应的程序指令/模块。处理器901通过运行存储在存储器902中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器901所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至处理器901。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器902中,当被处理器901执行时,执行上述方法实施例中的方法。
上述电子设备具体细节可以对应参阅上述方法实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,实现的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种基于信息融合的风险评估方法,其特征在于,所述方法包括:
获取m个探测器连续采集n次的运行数据,并构建成维度为m×n的数据矩阵,其中m,n为正整数;
利用预设的风险评估模型基于所述数据矩阵生成所述运行数据的多个分类结果;所述预设的风险评估模型是基于不同预设类的历史样本数据对支持向量机模型进行训练得到的;
使用证据理论融合所述多个分类结果得到融合结果;
根据所述融合结果的冲突系数对所述融合结果进行校准,并生成评估结果。
2.根据权利要求1所述的方法,其特征在于,所述使用证据理论融合所述多个分类结果得到融合结果,包括:
将所述多个分类结果分别映射为概率分类结果;
分别构建所述概率分类结果的基本概率指派;
利用Dempster规则合成各所述基本概率指派得到融合结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述融合结果的冲突系数对融合结果进行校准,并生成评估结果,包括:
当所述冲突系数小于预设值时,则判定所述融合结果为合理,将所述融合结果作为所述评估结果;
当所述冲突系数在所述预设值以上时,则判定所述融合结果为不合理,使用重新合成规则合成各所述基本概率指派得到所述评估结果。
6.根据权利要求1-5中任一项所述的方法,其特征在于,训练生成所述预设的风险评估模型的步骤包括:
由所述探测器获取具有不同预设类的历史样本数据,并对所述历史样本数据分别进行降维处理生成多个降维样本数据;
使用多个不同的支持向量机分别生成各降维样本数据的预分类结果;
分别计算所述预分类结果和与其对应的所述预设类之间的误差,并根据所述误差校正与其对应的支持向量机的模型权系数,以生成所述风险评估模型。
7.根据权利要求6所述的方法,其特征在于,所述历史样本数据是维度为m×n的矩阵,m和n为正整数,针对任意一预设类的历史样本数据,所述对所述历史样本数据分别进行降维处理生成多个降维样本数据中的,包括:
将所述历史样本数据归一化;
计算所述历史样本数据中m个主成分的贡献率,历史样本数据矩阵的m个行向量为所述主成分;
以从大到小的顺序筛选出所述贡献率大于预设贡献率的前p个主成分,其中p为正整数;
利用所述前p个主成分生成的系数矩阵对原m×n维度的历史样本数据矩阵进行线性变换得到所述降维样本数据。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
利用网格搜索法对支持向量机内部用于调整其性能的核函数参数和惩罚因子进行寻优。
9.一种基于信息融合的风险评估系统,其特征在于,所述系统包括:
数据采集模块,用于获取m个探测器连续采集n次的运行数据,以构建维度为m×n的数据矩阵,其中m,n为正整数;
预分类模块,利用预设的风险评估模型基于所述数据矩阵生成所述运行数据的多个分类结果;
信息融合模块,用于使用证据理论融合所述多个分类结果得到融合结果;
校正模块,用于根据所述融合结果的冲突系数对所述融合结果进行校准,并生成评估结果。
10.一种电子设备,其特征在于,所述设备包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110839127.2A CN113487223B (zh) | 2021-07-23 | 2021-07-23 | 一种基于信息融合的风险评估方法和评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110839127.2A CN113487223B (zh) | 2021-07-23 | 2021-07-23 | 一种基于信息融合的风险评估方法和评估系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113487223A true CN113487223A (zh) | 2021-10-08 |
CN113487223B CN113487223B (zh) | 2024-04-30 |
Family
ID=77942388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110839127.2A Active CN113487223B (zh) | 2021-07-23 | 2021-07-23 | 一种基于信息融合的风险评估方法和评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113487223B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114374561A (zh) * | 2022-01-13 | 2022-04-19 | 潍坊学院 | 一种网络安全状态评估方法、装置及可存储介质 |
CN117010697A (zh) * | 2023-09-25 | 2023-11-07 | 山东财经大学 | 一种基于人工智能的可视化企业风险评估方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996157A (zh) * | 2010-10-23 | 2011-03-30 | 山东科技大学 | 证据高冲突环境下多源信息融合方法 |
CN102034023A (zh) * | 2010-12-07 | 2011-04-27 | 上海交通大学 | 基于证据理论的多源信息融合风险分析方法 |
CN106650785A (zh) * | 2016-11-09 | 2017-05-10 | 河南大学 | 基于证据分类和冲突衡量的加权证据融合方法 |
CN107704992A (zh) * | 2017-08-31 | 2018-02-16 | 广州供电局有限公司 | 输电线路雷击风险评估的方法及装置 |
CN109242223A (zh) * | 2018-11-26 | 2019-01-18 | 武汉理工光科股份有限公司 | 城市公共建筑火灾风险的量子支持向量机评估与预测方法 |
CN110009251A (zh) * | 2019-04-15 | 2019-07-12 | 西安邮电大学 | 一种农田多源信息动态调节融合方法及系统 |
-
2021
- 2021-07-23 CN CN202110839127.2A patent/CN113487223B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996157A (zh) * | 2010-10-23 | 2011-03-30 | 山东科技大学 | 证据高冲突环境下多源信息融合方法 |
CN102034023A (zh) * | 2010-12-07 | 2011-04-27 | 上海交通大学 | 基于证据理论的多源信息融合风险分析方法 |
CN106650785A (zh) * | 2016-11-09 | 2017-05-10 | 河南大学 | 基于证据分类和冲突衡量的加权证据融合方法 |
CN107704992A (zh) * | 2017-08-31 | 2018-02-16 | 广州供电局有限公司 | 输电线路雷击风险评估的方法及装置 |
CN109242223A (zh) * | 2018-11-26 | 2019-01-18 | 武汉理工光科股份有限公司 | 城市公共建筑火灾风险的量子支持向量机评估与预测方法 |
CN110009251A (zh) * | 2019-04-15 | 2019-07-12 | 西安邮电大学 | 一种农田多源信息动态调节融合方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114374561A (zh) * | 2022-01-13 | 2022-04-19 | 潍坊学院 | 一种网络安全状态评估方法、装置及可存储介质 |
CN114374561B (zh) * | 2022-01-13 | 2023-10-24 | 潍坊学院 | 一种网络安全状态评估方法、装置及可存储介质 |
CN117010697A (zh) * | 2023-09-25 | 2023-11-07 | 山东财经大学 | 一种基于人工智能的可视化企业风险评估方法 |
CN117010697B (zh) * | 2023-09-25 | 2023-12-19 | 山东财经大学 | 一种基于人工智能的可视化企业风险评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113487223B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
WO2019051941A1 (zh) | 车型识别方法、装置、设备及计算机可读存储介质 | |
CN115412455B (zh) | 一种基于时间序列的服务器多性能指标异常检测方法及装置 | |
CN113487223B (zh) | 一种基于信息融合的风险评估方法和评估系统 | |
CN109188502B (zh) | 一种基于自编码器的束流位置监测器异常检测方法及装置 | |
CN116910493B (zh) | 基于多源特征提取的设备故障诊断模型的构建方法及装置 | |
CN116595463A (zh) | 窃电识别模型的构建方法、窃电行为识别方法及装置 | |
CN114048468A (zh) | 入侵检测的方法、入侵检测模型训练的方法、装置及介质 | |
CN114037478A (zh) | 广告异常流量检测方法、系统、电子设备及可读存储介质 | |
WO2023207557A1 (zh) | 评估业务预测模型鲁棒性的方法、装置及计算设备 | |
CN115169430A (zh) | 基于多尺度解码的云网端资源多维时间序列异常检测方法 | |
CN115980050A (zh) | 排水口的水质检测方法、装置、计算机设备及存储介质 | |
CN114333317B (zh) | 一种交通事件的处理方法、装置、电子设备及存储介质 | |
CN116702090A (zh) | 一种多模态数据融合与不确定估计的水位预测方法及系统 | |
CN115051864A (zh) | 基于pca-mf-wnn的网络安全态势要素提取方法及系统 | |
CN116994044A (zh) | 一种基于掩码多模态生成对抗网络的图像异常检测模型的构建方法 | |
CN114913487A (zh) | 一种基于多模态学习的目标识别检测方法及相关组件 | |
CN112784494B (zh) | 假阳性识别模型的训练方法、目标识别方法及装置 | |
CN117272145A (zh) | 转辙机的健康状态评估方法、装置和电子设备 | |
CN113553319A (zh) | 基于信息熵加权的lof离群点检测清洗方法、装置、设备及存储介质 | |
CN117079005A (zh) | 一种光缆故障监测方法、系统、装置及可读存储介质 | |
CN116451081A (zh) | 数据漂移的检测方法、装置、终端及存储介质 | |
CN116188445A (zh) | 一种产品表面缺陷的检测定位方法、装置及终端设备 | |
CN115758086A (zh) | 卷烟烘丝机故障检测的方法、装置、设备及可读存储介质 | |
CN115278757A (zh) | 一种检测异常数据的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |