CN110245693A - 结合混合随机森林的关键信息基础设施资产识别方法 - Google Patents

结合混合随机森林的关键信息基础设施资产识别方法 Download PDF

Info

Publication number
CN110245693A
CN110245693A CN201910459868.0A CN201910459868A CN110245693A CN 110245693 A CN110245693 A CN 110245693A CN 201910459868 A CN201910459868 A CN 201910459868A CN 110245693 A CN110245693 A CN 110245693A
Authority
CN
China
Prior art keywords
sample
random forest
key
model
key message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910459868.0A
Other languages
English (en)
Other versions
CN110245693B (zh
Inventor
罗森林
门元昊
潘丽敏
陈传涛
秦枭喃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201910459868.0A priority Critical patent/CN110245693B/zh
Publication of CN110245693A publication Critical patent/CN110245693A/zh
Application granted granted Critical
Publication of CN110245693B publication Critical patent/CN110245693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。

Description

结合混合随机森林的关键信息基础设施资产识别方法
技术领域
本发明涉及一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。
背景技术
关键信息基础设施在国民经济和社会发展中具有举足轻重的地位,是重要的国家战略资产。因此,很多国家都十分重视对关键信息基础设施的保护,而识别认定该流量是否为关键信息基础设施是对其进行安全保护的前提,同时也是实践中的难点之一。目前为止,业界对于关键信息基础设施的识别方法,主要是基于人为标定或规则匹配的识别认定方法,取得了一定的成果,但也存在这较多问题。
1.基于人为标定的识别认定方法
基于人为标定的识别认定算法在关键信息基础设施定义模糊、分类标准较为宏观的时期应用较多。这一方法借助了主观评价的手段,能够减轻关键信息基础设施定义模糊对识别认定的负面影响。但是这种方法的泛化能力较弱,且效率低。
2.基于规则匹配的识别认定方法
规则匹配是人为标定方法的改进。根据已知关键信息基础设施的通信协议、IP、端口、域名等重要信息生成规则,再根据已有的规则对未知设施进行识别认定。这一方法能够实现对资产的自动化识别,提高了识别效率。但是由于识别规则的固定,此方法依然存在泛化能力差、识别准确率低的问题。
3.结合混合专家模型的识别认定方法
混合专家模型能够根据已有的关键信息基础设施数据分离训练多个识别模型,并通过门控模块对各个模型进行取舍,最后的输出为各模型的加权组合。该方法具有较强的泛化能力,且识别准确率也高于前两种方法。
综上所述,由于关键信息基础设施资产数量大、种类多,基于人为标定或规则匹配的识别认定方法无法对关键信息基础设施资产进行快速、全面、准确的识别认定。因此,本发明将提供结合混合随机森林的关键信息基础设施资产识别方法,来提高关键信息基础设施资产识别的准确率。
发明内容
本发明的目的是为多种类、大数量条件下快速、准确识别认定此流量数据是否是关键信息基础设施资产的问题,提出结合混合随机森林的关键信息基础设施资产识别认定方法。
本发明的设计原理为:本发明的设计原理包含三个部分,设施资产数据高维特征构建及优化表达,资产数据识别的关键影响因素提取,结合混合随机森林的设施资产识别。设施资产数据高维特征构建模块中首先通过对基础设施的设备日志、网络流量等复杂数据进行清洗和结构化处理获得原始资产数据,基于《关键信息基础设施确定指南》获取该资产是否为关键信息基础设施的标签,若是则标注其下属的子类标签。之后从关键字、时段节点、行为组合、地理关联四个方面构建4类特征向量,最后顺序拼接获得高维扩展向量。关键影响因素提取部分,建立在德尔菲专家咨询法和主成分分析法上,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重集Weight(N)={w1,w2,...wk...,wN},其中wk表示第k个特征的权重大小, wk∈[0,1],并结合专家经验,进行关键影响因素分析获得最终关键特征向量,兼顾关键特征向量的客观性和完备性。结合混合随机森林的设施资产识别是通过设定样本挑选概率,依概率迭代的挑选样本作为中心样本赋予样本权重训练多个随机森林模型,在每次迭代中根据设定的公式将每个样本赋予权重,以训练擅长区分此区域数据的随机森林模型,并依据一个门控函数将多个随机森林相结合获得混合随机森林模型。最后依靠此混合随机森林模型实现资产数据的识别。
本发明的技术方案是通过如下步骤实现的:
步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量。
步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据
步骤1.2,从关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量,
步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量。
步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量。
步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重。
步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对特征进行多轮经验分析,得到特征的重要性权重
步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,进行关键影响因素提取,获得最终的关键特征向量。
步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型。
步骤3.1,初始化设定每个样本被挑选为中心概率为并设定专家模型的数量为K。
步骤3.2,依样本概率挑选其中的一个样本,并通过公式 赋予每个样本的权重。
步骤3.3,将赋权后的样本训练擅长识别此区域下的随机森林。
步骤3.4,依据公式更新下一次迭代中每个样本被挑选为中心样本的概率值,将其归一化。
步骤3.5,判定混合专家模型数量是否达标,若达标则训练完毕到达步骤3.6,若未达标到则继续挑选中心点,回到步骤3.2训练一个新的专家模型。
步骤3.6,完成混合随机森林的构建,并设定其判决函数为
步骤4,基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。
有益效果
相对于一般采用的基于人为标定和规则匹配的方法,本发明采用的结合混合随机森林模型的关键信息基础设施资产识别认定方法,能够充分利用已有的数据信息,在特征工程阶段采用多种机器学习方法获得的融合特征权重,并设定阈值剔除冗余特征和混淆特征实现有效的特征选择,实现设施资产的关键因素提取,在识别阶段通过迭代赋予样本权重的方式训练多个擅长不同区域下的随机森林判决模型,并利用一个门控函数与之结合获得混合随机森林模型,解决了由于数据量大导致数据中存在异质性而影响识别性能的问题,有效的提升识别的准确率和召回率。
与基于人为标定和规则匹配的方法相比,本发明采用方法的准确性以及科学性都更强,能够提取关键有效的特征,在保证识别方法的准确、快速的同时,也提高了模型的泛化能力。
附图说明
图1为本发明的结合混合专家模型的关键信息基础设施资产识别认定方法原理图。
图2为步骤3所述的混合随机森林模型构建流程图。
具体实施方式
为了更好的说明本发明的目的和优点,下面结合实例对本发明方法的实施方式做进一步详细说明。
具体流程为:
步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量。
步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据
步骤1.2,以关键字、时段节点、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量,
步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量。
步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量。
步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重集Weight(N)={w1,w2,...wk...,wN},其中wk表示第k个特征的权重大小,wk∈[0,1]。
步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对 N个特征进行多轮经验分析,得到特征的重要性权重集Votes(N)= {v1,v2,...vk...,vN}
步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,计算Importance(N)={w1*v1,w2*v2,...wk*vk...,wN*vN},进行关键影响因素提取,剔除掉非法特征和混淆特征,重点保留关键特征信息,获得最终的关键特征向量。
步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合专家模型,在混合模型的训练过程中。
步骤3.1,初始化参数,假设数据为X∈RN*D,Xi为第i个样本的特征向量,其中N为数据数量,D为数据的维度,标签Y=(Y0,Y1...Yj...YN),其中 i∈[1,2...N],手动设定K个混合专家模型,构建权重矩阵 W=(W0,W1...Wj...WK),j∈[1,2...K],其中Wj代表第j个混合专家模型全部样本权重向量,Wj=(Wj0,Wj1...Wji...WjN),其中Wji代表着第i个样本在第j 个混合专家模型的样本权重。设立每个样本被挑选作为中心的概率集合设为其中 代表第j个样本在第j次迭代时被选作中心的概率。初始时,每个样本被挑选为中心的概率为
步骤3.2,依据每个样本的概率值随机选取1个样本为中心点μ0=Xi
步骤3.3,依据公式(1)设定为样本i属于第j个模型的权重Wji。距离越远,则权重越小,距离越近,则权重越大。
步骤3.4,依据公式(2)更新下一次迭代中每个样本被挑选为中心样本的概率值,并依据公式(3)将其归一化。实现被选中的样本和离选中样本较近的样本被挑选为中心点的概率值降低,而远离中心点的样本被挑选为中心点的概率值升高。
步骤3.5,将每个样本赋予权重Wji,训练1个随机森林分类模型fj作为第j个专家模型。
步骤3.6,判定混合专家模型数量j是否到达设定值,若到达K个则训练完毕到达步骤3.7,若未达到则继续依据每个样本的概率值挑选第k+1个中心点,回到步骤3.2训练一个新的专家模型。
步骤3.7,设定输入新样本Xin时的预测函数为公式(4),其中ym表示标签m,fj(X)表示第j个专家模型,I(ym=fj(Xin))表示若第j个专家模型预测标签若与ym相等则为1,若不等则为0。最终计算每个标签的预测值F(ym),取处最大值下的ym为最终判断类别。
步骤4,基于构建的混合模型实现对流量是否为关键资产基础设施的识别。
如上所述,便可较好地实现本发明。
本发明通过使用混合专家模型进行关键信息基础设施资产识别认定,在保证了识别方法的准确性、效率的同时,也避免了基于人为标定和规则匹配方法泛化能力低下的问题。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.结合混合随机森林的关键信息基础设施资产识别方法,其特征在于所述方法包括如下步骤:
步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;
步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据;
步骤1.2,以关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量;
步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量;
步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量;
步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重;
步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对特征进行多轮经验分析,得到特征的重要性权重;
步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,进行关键影响因素提取,获得最终的关键特征向量;
步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;
步骤3.1,初始化设定每个样本被挑选为中心概率为并设定专家模型的数量为K;
步骤3.2,依样本概率挑选其中的一个样本,并通过公式 赋予每个样本的权重;
步骤3.3,将赋权后的样本训练擅长此识别此区域下的随机森林;
步骤3.4,依据公式更新下一次迭代中每个样本被挑选为中心样本的概率值,将其归一化;
步骤3.5,判定混合专家模型数量是否达标,若达标则训练完毕到达步骤3.6,若未达标到则继续挑选中心点,回到步骤3.2训练一个新的专家模型;
步骤3.6,完成混合随机森林的构建,并设定其判决函数为
步骤4,基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。
2.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤1.2中从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量,顺序拼接获得高维特征向量。
3.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤3.2中依据每次的中心点μj赋予样本的权重的公式为此专家模型下的样本权重将随着远离此中心样本而减小,并在赋予每个样本权重后训练一个随机森林判决模型作为此区域下的专家模型。
4.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤3.4中,设立每个样本被挑选作为中心的概率集合,在每次循环中迭代的依据概率更新公式更新每个样本的概率值,以选取多个不同区域下的样本作为中心点;实现在每次迭代中将已选中的样本和离选中样本较近的样本被挑选为中心点的概率值降低,而远离中心点的样本被挑选为中心点的概率值升高。
5.根据权利要求1所述的结合混合随机森林的关键信息基础设施资产识别方法,其特征在于:步骤3.6中,设定输入新样本Xin时的预测函数为其中ym表示标签m,fj(X)表示第j个专家模型,I(ym=fj(Xin))表示若第j个专家模型预测标签若与ym相等则为1,若不等则为0;最终计算每个标签的预测值F(ym),取处最大值下的ym为最终判断类别Y。
CN201910459868.0A 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法 Active CN110245693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910459868.0A CN110245693B (zh) 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910459868.0A CN110245693B (zh) 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法

Publications (2)

Publication Number Publication Date
CN110245693A true CN110245693A (zh) 2019-09-17
CN110245693B CN110245693B (zh) 2023-04-07

Family

ID=67885372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910459868.0A Active CN110245693B (zh) 2019-05-30 2019-05-30 结合混合随机森林的关键信息基础设施资产识别方法

Country Status (1)

Country Link
CN (1) CN110245693B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111510422A (zh) * 2020-01-09 2020-08-07 中国石油大学(华东) 一种基于端信息扩展序列与随机森林模型的身份认证方法
CN112199287A (zh) * 2020-10-13 2021-01-08 北京理工大学 基于强化混合专家模型的跨项目软件缺陷预测方法
CN112422505A (zh) * 2020-10-13 2021-02-26 北京理工大学 基于高维扩展关键特征向量的网络恶意流量识别方法
CN115146712A (zh) * 2022-06-15 2022-10-04 北京天融信网络安全技术有限公司 物联网资产识别方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090281981A1 (en) * 2008-05-06 2009-11-12 Chen Barry Y Discriminant Forest Classification Method and System
US20130132311A1 (en) * 2011-11-18 2013-05-23 Honeywell International Inc. Score fusion and training data recycling for video classification
CN106557451A (zh) * 2015-09-30 2017-04-05 日本电气株式会社 一种用于分层混合专家系统构建的特征选择的方法和设备
CN107766883A (zh) * 2017-10-13 2018-03-06 华中师范大学 一种基于加权决策树的优化随机森林分类方法及系统
CN108776820A (zh) * 2018-06-07 2018-11-09 中国矿业大学 一种利用宽度神经网络改进的随机森林集成方法
CN109142317A (zh) * 2018-08-29 2019-01-04 厦门大学 一种基于随机森林模型的拉曼光谱物质识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090281981A1 (en) * 2008-05-06 2009-11-12 Chen Barry Y Discriminant Forest Classification Method and System
US20130132311A1 (en) * 2011-11-18 2013-05-23 Honeywell International Inc. Score fusion and training data recycling for video classification
CN106557451A (zh) * 2015-09-30 2017-04-05 日本电气株式会社 一种用于分层混合专家系统构建的特征选择的方法和设备
CN107766883A (zh) * 2017-10-13 2018-03-06 华中师范大学 一种基于加权决策树的优化随机森林分类方法及系统
CN108776820A (zh) * 2018-06-07 2018-11-09 中国矿业大学 一种利用宽度神经网络改进的随机森林集成方法
CN109142317A (zh) * 2018-08-29 2019-01-04 厦门大学 一种基于随机森林模型的拉曼光谱物质识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NOAM SHAZEER等: "OUTRAGEOUSLY LARGE NEURAL NETWORKS:THE SPARSELY-GATED MIXTURE-OF-EXPERTS LAYER", 《ARXIV》 *
王日升等: "基于分类精度和相关性的随机森林算法改进", 《科学技术与工程》 *
陈远等: "基于主成分分析和随机森林的恶意网站评估与识别", 《数据分析与知识发现》 *
韩敏等: "基于自回归模型和关联向量机的癫痫脑电信号自动分类", 《中国生物医学工程学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111510422A (zh) * 2020-01-09 2020-08-07 中国石油大学(华东) 一种基于端信息扩展序列与随机森林模型的身份认证方法
CN112199287A (zh) * 2020-10-13 2021-01-08 北京理工大学 基于强化混合专家模型的跨项目软件缺陷预测方法
CN112422505A (zh) * 2020-10-13 2021-02-26 北京理工大学 基于高维扩展关键特征向量的网络恶意流量识别方法
CN112199287B (zh) * 2020-10-13 2022-03-29 北京理工大学 基于强化混合专家模型的跨项目软件缺陷预测方法
CN115146712A (zh) * 2022-06-15 2022-10-04 北京天融信网络安全技术有限公司 物联网资产识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110245693B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110245693A (zh) 结合混合随机森林的关键信息基础设施资产识别方法
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN110347839A (zh) 一种基于生成式多任务学习模型的文本分类方法
CN109582949A (zh) 事件元素抽取方法、装置、计算设备及存储介质
CN110168535A (zh) 一种信息处理方法及终端、计算机存储介质
CN109446331A (zh) 一种文本情绪分类模型建立方法及文本情绪分类方法
CN108804677A (zh) 结合多层级注意力机制的深度学习问题分类方法及系统
CN108647595B (zh) 基于多属性深度特征的车辆重识别方法
CN108572967A (zh) 一种创建企业画像的方法及装置
CN110457677B (zh) 实体关系识别方法及装置、存储介质、计算机设备
CN109872162A (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN105046673B (zh) 基于自学习的高光谱图像和可见光图像融合分类方法
CN103186538A (zh) 一种图像分类方法和装置、图像检索方法和装置
CN110490238A (zh) 一种图像处理方法、装置及存储介质
CN107545038B (zh) 一种文本分类方法与设备
CN104216876A (zh) 信息文本过滤方法及系统
CN108491388A (zh) 数据集获取方法、分类方法、装置、设备及存储介质
CN109784368A (zh) 一种应用程序分类的确定方法和装置
CN108765383A (zh) 基于深度迁移学习的视频描述方法
CN112989761B (zh) 文本分类方法及装置
CN110209841A (zh) 一种基于诈骗案件案情的诈骗分析方法及装置
CN113177101B (zh) 用户轨迹识别方法、装置、设备及存储介质
CN109214407A (zh) 事件检测模型、方法、装置、计算设备及存储介质
CN108959474A (zh) 实体关系提取方法
CN108549723A (zh) 一种文本概念分类方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant