CN110245693B - 结合混合随机森林的关键信息基础设施资产识别方法 - Google Patents

结合混合随机森林的关键信息基础设施资产识别方法 Download PDF

Info

Publication number
CN110245693B
CN110245693B CN201910459868.0A CN201910459868A CN110245693B CN 110245693 B CN110245693 B CN 110245693B CN 201910459868 A CN201910459868 A CN 201910459868A CN 110245693 B CN110245693 B CN 110245693B
Authority
CN
China
Prior art keywords
sample
random forest
expert
key
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910459868.0A
Other languages
English (en)
Other versions
CN110245693A (zh
Inventor
罗森林
门元昊
潘丽敏
陈传涛
秦枭喃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201910459868.0A priority Critical patent/CN110245693B/zh
Publication of CN110245693A publication Critical patent/CN110245693A/zh
Application granted granted Critical
Publication of CN110245693B publication Critical patent/CN110245693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。

Description

结合混合随机森林的关键信息基础设施资产识别方法
技术领域
本发明涉及一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。
背景技术
关键信息基础设施在国民经济和社会发展中具有举足轻重的地位,是重要的国家战略资产。因此,很多国家都十分重视对关键信息基础设施的保护,而识别认定该流量是否为关键信息基础设施是对其进行安全保护的前提,同时也是实践中的难点之一。目前为止,业界对于关键信息基础设施的识别方法,主要是基于人为标定或规则匹配的识别认定方法,取得了一定的成果,但也存在这较多问题。
1.基于人为标定的识别认定方法
基于人为标定的识别认定算法在关键信息基础设施定义模糊、分类标准较为宏观的时期应用较多。这一方法借助了主观评价的手段,能够减轻关键信息基础设施定义模糊对识别认定的负面影响。但是这种方法的泛化能力较弱,且效率低。
2.基于规则匹配的识别认定方法
规则匹配是人为标定方法的改进。根据已知关键信息基础设施的通信协议、IP、端口、域名等重要信息生成规则,再根据已有的规则对未知设施进行识别认定。这一方法能够实现对资产的自动化识别,提高了识别效率。但是由于识别规则的固定,此方法依然存在泛化能力差、识别准确率低的问题。
3.结合混合专家模型的识别认定方法
混合专家模型能够根据已有的关键信息基础设施数据分离训练多个识别模型,并通过门控模块对各个模型进行取舍,最后的输出为各模型的加权组合。该方法具有较强的泛化能力,且识别准确率也高于前两种方法。
综上所述,由于关键信息基础设施资产数量大、种类多,基于人为标定或规则匹配的识别认定方法无法对关键信息基础设施资产进行快速、全面、准确的识别认定。因此,本发明将提供结合混合随机森林的关键信息基础设施资产识别方法,来提高关键信息基础设施资产识别的准确率。
发明内容
本发明的目的是为多种类、大数量条件下快速、准确识别认定此流量数据是否是关键信息基础设施资产的问题,提出结合混合随机森林的关键信息基础设施资产识别认定方法。
本发明的设计原理为:本发明的设计原理包含三个部分,设施资产数据高维特征构建及优化表达,资产数据识别的关键影响因素提取,结合混合随机森林的设施资产识别。设施资产数据高维特征构建模块中首先通过对基础设施的设备日志、网络流量等复杂数据进行清洗和结构化处理获得原始资产数据,基于《关键信息基础设施确定指南》获取该资产是否为关键信息基础设施的标签,若是则标注其下属的子类标签。之后从关键字、时段节点、行为组合、地理关联四个方面构建4类特征向量,最后顺序拼接获得高维扩展向量。关键影响因素提取部分,建立在德尔菲专家咨询法和主成分分析法上,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重集Weight(N)={w1,w2,...wk...,wN},其中wk表示第k个特征的权重大小, wk∈[0,1],并结合专家经验,进行关键影响因素分析获得最终关键特征向量,兼顾关键特征向量的客观性和完备性。结合混合随机森林的设施资产识别是通过设定样本挑选概率,依概率迭代的挑选样本作为中心样本赋予样本权重训练多个随机森林模型,在每次迭代中根据设定的公式将每个样本赋予权重,以训练擅长区分此区域数据的随机森林模型,并依据一个门控函数将多个随机森林相结合获得混合随机森林模型。最后依靠此混合随机森林模型实现资产数据的识别。
本发明的技术方案是通过如下步骤实现的:
步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量。
步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据
步骤1.2,从关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量,
步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量。
步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量。
步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重。
步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对特征进行多轮经验分析,得到特征的重要性权重
步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,进行关键影响因素提取,获得最终的关键特征向量。
步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型。
步骤3.1,初始化设定每个样本被挑选为中心概率为并设定专家模型的数量为K。
步骤3.2,依样本概率挑选其中的一个样本,并通过公式 赋予每个样本的权重。
步骤3.3,将赋权后的样本训练擅长识别此区域下的随机森林。
步骤3.4,依据公式更新下一次迭代中每个样本被挑选为中心样本的概率值,将其归一化。
步骤3.5,判定混合专家模型数量是否达标,若达标则训练完毕到达步骤3.6,若未达标到则继续挑选中心点,回到步骤3.2训练一个新的专家模型。
步骤3.6,完成混合随机森林的构建,并设定其判决函数为
步骤4,基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。
有益效果
相对于一般采用的基于人为标定和规则匹配的方法,本发明采用的结合混合随机森林模型的关键信息基础设施资产识别认定方法,能够充分利用已有的数据信息,在特征工程阶段采用多种机器学习方法获得的融合特征权重,并设定阈值剔除冗余特征和混淆特征实现有效的特征选择,实现设施资产的关键因素提取,在识别阶段通过迭代赋予样本权重的方式训练多个擅长不同区域下的随机森林判决模型,并利用一个门控函数与之结合获得混合随机森林模型,解决了由于数据量大导致数据中存在异质性而影响识别性能的问题,有效的提升识别的准确率和召回率。
与基于人为标定和规则匹配的方法相比,本发明采用方法的准确性以及科学性都更强,能够提取关键有效的特征,在保证识别方法的准确、快速的同时,也提高了模型的泛化能力。
附图说明
图1为本发明的结合混合专家模型的关键信息基础设施资产识别认定方法原理图。
图2为步骤3所述的混合随机森林模型构建流程图。
具体实施方式
为了更好的说明本发明的目的和优点,下面结合实例对本发明方法的实施方式做进一步详细说明。
具体流程为:
步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量。
步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据
步骤1.2,以关键字、时段节点、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量,
步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量。
步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量。
步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重集Weight(N)={w1,w2,...wk...,wN},其中wk表示第k个特征的权重大小,wk∈[0,1]。
步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对 N个特征进行多轮经验分析,得到特征的重要性权重集Votes(N)= {v1,v2,...vk...,vN}
步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,计算Importance(N)={w1*v1,w2*v2,...wk*vk...,wN*vN},进行关键影响因素提取,剔除掉非法特征和混淆特征,重点保留关键特征信息,获得最终的关键特征向量。
步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合专家模型,在混合模型的训练过程中。
步骤3.1,初始化参数,假设数据为X∈RN*D,Xi为第i个样本的特征向量,其中N为数据数量,D为数据的维度,标签Y=(Y0,Y1...Yj...YN),其中 i∈[1,2...N],手动设定K个混合专家模型,构建权重矩阵 W=(W0,W1...Wj...WK),j∈[1,2...K],其中Wj代表第j个混合专家模型全部样本权重向量,Wj=(Wj0,Wj1...Wji...WjN),其中Wji代表着第i个样本在第j 个混合专家模型的样本权重。设立每个样本被挑选作为中心的概率集合设为其中 代表第j个样本在第j次迭代时被选作中心的概率。初始时,每个样本被挑选为中心的概率为
步骤3.2,依据每个样本的概率值随机选取1个样本为中心点μ0=Xi
步骤3.3,依据公式(1)设定为样本i属于第j个模型的权重Wji。距离越远,则权重越小,距离越近,则权重越大。
步骤3.4,依据公式(2)更新下一次迭代中每个样本被挑选为中心样本的概率值,并依据公式(3)将其归一化。实现被选中的样本和离选中样本较近的样本被挑选为中心点的概率值降低,而远离中心点的样本被挑选为中心点的概率值升高。
步骤3.5,将每个样本赋予权重Wji,训练1个随机森林分类模型fj作为第j个专家模型。
步骤3.6,判定混合专家模型数量j是否到达设定值,若到达K个则训练完毕到达步骤3.7,若未达到则继续依据每个样本的概率值挑选第k+1个中心点,回到步骤3.2训练一个新的专家模型。
步骤3.7,设定输入新样本Xin时的预测函数为公式(4),其中ym表示标签m,fj(X)表示第j个专家模型,I(ym=fj(Xin))表示若第j个专家模型预测标签若与ym相等则为1,若不等则为0。最终计算每个标签的预测值F(ym),取处最大值下的ym为最终判断类别。
步骤4,基于构建的混合模型实现对流量是否为关键资产基础设施的识别。
如上所述,便可较好地实现本发明。
本发明通过使用混合专家模型进行关键信息基础设施资产识别认定,在保证了识别方法的准确性、效率的同时,也避免了基于人为标定和规则匹配方法泛化能力低下的问题。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.结合混合随机森林的关键信息基础设施资产识别方法,其特征在于所述方法包括如下步骤:
步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;
步骤1.1,将采集到的基础设施的设备日志、网络流量数据进行清洗优化获得原始资产数据;
步骤1.2,以关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量;
步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量;
步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量;
步骤2.1,基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重;
步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对特征进行多轮经验分析,得到特征的重要性权重;
步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,进行关键影响因素提取,获得最终的关键特征向量;
步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;
步骤3.1,初始化设定每个样本被挑选为中心概率为
Figure FDA0003994213000000011
N为数据数量,并设定专家模型的数量为K;
步骤3.2,依样本概率挑选其中的一个样本,并通过公式
Figure FDA0003994213000000012
Figure FDA0003994213000000013
赋予每个样本的权重,Wji为第i个样本在第j个混合专家模型的样本权重;
步骤3.3,将赋权后的样本训练擅长识别此区域下的随机森林;
步骤3.4,依据公式
Figure FDA0003994213000000014
Figure FDA0003994213000000015
Figure FDA0003994213000000021
更新下一次迭代中每个样本被挑选为中心样本的概率值,将其归一化;
步骤3.5,判定混合专家模型数量是否达标,若达标则训练完毕到达步骤3.6,若未达标到则继续挑选中心点,回到步骤3.2训练一个新的专家模型;
步骤3.6,完成混合随机森林的构建,并设定其判决函数为
Figure FDA0003994213000000022
其中ym表示标签m,fj(X)表示第j个专家模型,I(ym=fj(Xin)) 表示若第j个专家模型预测标签若与ym相等则为1,若不等则为0;
步骤4,基于构建的混合随机森林模型实现对设备流量的识别,判定设备是否为关键资产基础设施设备。
2.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤1.2中从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量,顺序拼接获得高维特征向量。
3.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤3.2中依据每次的中心点μj赋予样本的权重的公式为
Figure FDA0003994213000000023
此专家模型下的样本权重将随着远离此中心样本而减小,并在赋予每个样本权重后训练一个随机森林判决模型作为此区域下的专家模型。
4.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤3.4中,设立每个样本被挑选作为中心的概率集合,在每次循环中迭代依据概率更新公式
Figure FDA0003994213000000024
Figure FDA0003994213000000025
Figure FDA0003994213000000026
更新每个样本的概率值,以选取多个不同区域下的样本作为中心点;实现在每次迭代中将已选中的样本和离选中样本较近的样本被挑选为中心点的概率值降低,而远离中心点的样本被挑选为中心点的概率值升高。
5.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤3.6中,设定输入新样本Xin时的预测函数为
Figure FDA0003994213000000031
其中ym表示标签m,fj(X)表示第j个专家模型,I(ym=fj(Xin)) 表示若第j个专家模型预测标签若与ym相等则为1,若不等则为0;最终计算每个标签的预测值F(ym),取最大值下的ym为最终判断类别Y。
CN201910459868.0A 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法 Active CN110245693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910459868.0A CN110245693B (zh) 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910459868.0A CN110245693B (zh) 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法

Publications (2)

Publication Number Publication Date
CN110245693A CN110245693A (zh) 2019-09-17
CN110245693B true CN110245693B (zh) 2023-04-07

Family

ID=67885372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910459868.0A Active CN110245693B (zh) 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法

Country Status (1)

Country Link
CN (1) CN110245693B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111510422B (zh) * 2020-01-09 2021-07-09 中国石油大学(华东) 一种基于端信息扩展序列与随机森林模型的身份认证方法
CN112199287B (zh) * 2020-10-13 2022-03-29 北京理工大学 基于强化混合专家模型的跨项目软件缺陷预测方法
CN112422505A (zh) * 2020-10-13 2021-02-26 北京理工大学 基于高维扩展关键特征向量的网络恶意流量识别方法
CN115146712B (zh) * 2022-06-15 2023-04-28 北京天融信网络安全技术有限公司 物联网资产识别方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557451A (zh) * 2015-09-30 2017-04-05 日本电气株式会社 一种用于分层混合专家系统构建的特征选择的方法和设备
CN107766883A (zh) * 2017-10-13 2018-03-06 华中师范大学 一种基于加权决策树的优化随机森林分类方法及系统
CN108776820A (zh) * 2018-06-07 2018-11-09 中国矿业大学 一种利用宽度神经网络改进的随机森林集成方法
CN109142317A (zh) * 2018-08-29 2019-01-04 厦门大学 一种基于随机森林模型的拉曼光谱物质识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306942B2 (en) * 2008-05-06 2012-11-06 Lawrence Livermore National Security, Llc Discriminant forest classification method and system
US9147129B2 (en) * 2011-11-18 2015-09-29 Honeywell International Inc. Score fusion and training data recycling for video classification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557451A (zh) * 2015-09-30 2017-04-05 日本电气株式会社 一种用于分层混合专家系统构建的特征选择的方法和设备
CN107766883A (zh) * 2017-10-13 2018-03-06 华中师范大学 一种基于加权决策树的优化随机森林分类方法及系统
CN108776820A (zh) * 2018-06-07 2018-11-09 中国矿业大学 一种利用宽度神经网络改进的随机森林集成方法
CN109142317A (zh) * 2018-08-29 2019-01-04 厦门大学 一种基于随机森林模型的拉曼光谱物质识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
OUTRAGEOUSLY LARGE NEURAL NETWORKS:THE SPARSELY-GATED MIXTURE-OF-EXPERTS LAYER;Noam Shazeer等;《arXiv》;第1-19页 *
基于主成分分析和随机森林的恶意网站评估与识别;陈远等;《数据分析与知识发现》(第04期);第75-84页 *
基于分类精度和相关性的随机森林算法改进;王日升等;《科学技术与工程》;第17卷(第20期);第67-72页 *
基于自回归模型和关联向量机的癫痫脑电信号自动分类;韩敏等;《中国生物医学工程学报》(第06期);第67-73 *

Also Published As

Publication number Publication date
CN110245693A (zh) 2019-09-17

Similar Documents

Publication Publication Date Title
CN110245693B (zh) 结合混合随机森林的关键信息基础设施资产识别方法
CN109299741B (zh) 一种基于多层检测的网络攻击类型识别方法
CN110659207B (zh) 基于核谱映射迁移集成的异构跨项目软件缺陷预测方法
CN109934269B (zh) 一种电磁信号的开集识别方法和装置
CN108304316B (zh) 一种基于协同迁移的软件缺陷预测方法
CN109491914B (zh) 基于不平衡学习策略高影响缺陷报告预测方法
CN109872162A (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN109376766B (zh) 一种画像预测分类方法、装置及设备
CN113326377A (zh) 一种基于企业关联关系的人名消歧方法及系统
CN108805142A (zh) 一种犯罪高危人员研判方法及系统
CN111970400B (zh) 骚扰电话识别方法及装置
CN111047173A (zh) 基于改进d-s证据理论的社团可信度评估方法
CN107368526A (zh) 一种数据处理方法及装置
CN113641906A (zh) 基于资金交易关系数据实现相似目标人员识别处理的系统、方法、装置、处理器及其介质
CN113177101A (zh) 用户轨迹识别方法、装置、设备及存储介质
CN110716957B (zh) 类案可疑对象智能挖掘分析方法
CN115577357A (zh) 一种基于堆叠集成技术的Android恶意软件检测方法
CN114897085A (zh) 一种基于封闭子图链路预测的聚类方法及计算机设备
CN117235560A (zh) 一种基于som-gmm-rf的建筑施工企业活跃度预测方法
CN117114105B (zh) 基于科研大数据信息的目标对象推荐方法和系统
CN112200862B (zh) 目标检测模型的训练方法、目标检测方法及装置
CN117633666A (zh) 网络资产识别方法、装置、电子设备和存储介质
CN113469288A (zh) 融合多个机器学习算法的高危人员预警方法
CN117372144A (zh) 应用于小样本场景的风控策略智能化方法及系统
CN113159441A (zh) 银行业务项目实施情况的预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant