CN110032596B - 流量异常用户识别方法及系统 - Google Patents
流量异常用户识别方法及系统 Download PDFInfo
- Publication number
- CN110032596B CN110032596B CN201910309782.XA CN201910309782A CN110032596B CN 110032596 B CN110032596 B CN 110032596B CN 201910309782 A CN201910309782 A CN 201910309782A CN 110032596 B CN110032596 B CN 110032596B
- Authority
- CN
- China
- Prior art keywords
- user
- flow
- data set
- usage
- traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013145 classification model Methods 0.000 claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 5
- 238000007477 logistic regression Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000013501 data transformation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种流量异常用户识别方法及系统,该方法包括:基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中;将添加完的所述用户数据集按照数量的不同划分为训练集和测试集;采用所述训练集训练分类模型库,并在训练完成分类模型后,采用所述测试集对所述分类模型库进行验证,得到最优模型库;由所述最优模型库,确定流量异常用户。通过本发明,可以快速、有效地识别流量异常用户,保障了电信运营商的利益。
Description
技术领域
本发明涉及计算机技术领域,具体地,涉及一种流量异常用户识别方法及系统。
背景技术
目前,在运营商的用户中,会出现话费很少,但用的流量远远超出用户套餐内的流量的用户,他们有些采用免流量欺诈达到免流量的目的,免流量欺诈是一种利用运营商流量计费漏洞,通过搭建私有恶意流量转发代理平台,绕过电信运营商流量计费系统,达到免费使用流量目的电信欺诈行为,如何发现流量异常用户,并将他们找出来,对减少运营商损失非常有利。而目前电信运营商主要通过对网关设备部署相关策略来对用户流量进行识别,如对用户流量类型、大小进行判别,并过滤非正常流量,对正常流量进行计费。但是由于大部分免流量欺诈均表现为不计费流量类型和正常流量类型或访问请求,电信运营商很难通过策略判断进行识别与处理。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一,提出了一种流量异常用户识别方法及系统。
为实现本发明的目的而提供一种流量异常用户识别方法,包括:
基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中;
将添加完的所述用户数据集按照数量的不同划分为训练集和测试集;
采用所述训练集训练分类模型库,并在训练完成分类模型后,采用所述测试集对所述分类模型库进行验证,得到最优模型库;
由所述最优模型库,确定流量异常用户。
优选地,在所述的基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中的步骤之前,所述方法还包括:
根据用户属性的相关性对所述用户数据集进行特征选择。
优选地,所述基于用户每月的流量使用量,计算用户流量使用的稳定度值包括:采用稳定度公式计算所述稳定度值;
所述稳定度公式为:
优选地,在所述将添加完的所述用户数据集按照数量的不同划分为训练集和测试集的步骤之前,且在所述基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中的步骤之后,还包括:
采用用户平均流量费用公式计算用户平均流量费用,并将所述用户平均流量费用增加到所述用户数据集的特征中;
用户平均流量费用公式为:(每月的总费用-语音费用-第三方会员数据费用-短信使用费用)/(每月总的流量使用量-套餐内流量的使用量)。
优选地,所述用户数据集包括:
话费数据、流量数据、用户的入网时长以及套餐类型。
优选地,所述根据用户属性的相关性对所述用户数据集进行特征选择的步骤之前,还包括:
对所述用户数据集进行数据转换、数据探索以及数据标准化处理。
优选地,所述分类模型库通过逻辑回归、决策树、随机森林以及XGBoost算法中任意一种及多种得到。
一种流量异常用户识别系统,包括:
计算模块,用于基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中;
训练模块,用于将添加完的所述用户数据集按照数量的不同划分为训练集和测试集;采用所述训练集训练分类模型库,并在训练完成分类模型后,采用所述测试集对所述分类模型库进行验证,得到最优模型库;
堆叠模块,用于由所述最优模型库,确定流量异常用户。
优选地,所述用户数据集包括:
话费数据、流量数据、用户的入网时长以及套餐类型。
优选地,还包括:预处理模块;
所述预处理模块还包括:
第一模块,用于对所述用户数据集进行数据转换;
第二模块,用于对所述用户数据集进行数据探索;
第三模块,用于对所述用户数据集进行数据标准化;
第四模块,用于根据用户属性的相关性对所述用户数据集进行特征选择。
本发明具有以下有益效果:
本发明提供的流量异常用户识别方法及系统,基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中,通过用户数据集训练最优模型库,由最优模型库确定流量异常用户,通过本发明,将用户流量使用的稳定度值作为用户流量使用情况参考,可以快速、有效地识别流量异常用户,保障电信运营商的利益。
附图说明
图1为本发明实施例提供的流量异常用户识别方法的第一种流程图;
图2为本发明实施例提供的流量异常用户识别方法的第二种流程图;
图3为本发明实施例提供的流量异常用户识别方法的第三种流程图;
图4为本发明实施例提供的流量异常用户识别系统的一种结构示意图;
图5为本发明实施例提供的流量异常用户识别系统的另一种结构示意图;
图6为本发明实施例中预处理模块的一种结构示意图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图来对本发明提供的流量异常用户识别方法及系统进行详细描述。
实施例一
如图1所示为本发明实施例提供的流量异常用户识别方法的第一种流程图,本实施例中流量异常用户识别方法包括以下步骤:
步骤101:基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中。
具体地,用户数据集包括:话费数据、流量数据、用户的入网时长以及套餐类型。
需要说明的是,本发明另一个实施例中,在步骤101之前,还具有数据准备的步骤,该数据准备步骤可以根据建立分类模型的需求,从数据库、HDFS((Hadoop DistributedFile System,分布式文件系统)、HIVE(hivehadoophbase云计算数据仓库)等数据仓库中获取用户数据,对用户数据进行处理后,将与用户终端换机周期相关的字段进行整理得到用户数据集,并将用户数据集放到HDFS上。
步骤102:将添加完的用户数据集按照数量的不同划分为训练集和测试集。
具体地,划分训练集和测试集目的是为了对后续的分类模型进行交叉验证,进一步,可以利用spark对用户数据集进行7:3的分割,其中70%的数据为训练集,用于模型的训练,训练集的数据中有一个标签用来标识用户是否为异常用户;其中30%的数据为测试集,用于分类模型的验证。
步骤103:采用训练集训练分类模型库,并在训练完成分类模型后,采用测试集对分类模型库进行验证,得到最优模型库。
具体地,分类模型库通过逻辑回归、决策树、随机森林以及XGBoost算法中任意一种及多种得到。
为了提高分类模型库的准确性,防止过拟合。可以利用spark将训练样本分为10个子样本,分别随机取8个样本。将随机取的8个样本分别输入四个分类模型(比如四个分类模型是由逻辑回归、决策树、随机森林以及XGBoost算法得到的模型)中,利用Grid Search(网格搜索)进行调优,得到最优的模型库。
Grid Search:一种调参手段;穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。
步骤104:由最优模型库,确定流量异常用户。
具体地,最优模型库中可以包括一个分类模型,也可以是多个分类模型,每个分类模型都会对用户是否是流量异常用户有一个标识,比如,最优模型库中有四个分类模型,四个模型通过投票的方式来获取用户最终是否为异常用户的结果。当然,还可以通过其他方式得到异常用户的结果,比如,通过平均、加权平均等计算方式。
本发明提供的流量异常用户识别方法及系统,基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中,通过用户数据集训练最优模型库,由最优模型库确定流量异常用户,通过本发明,将用户流量使用的稳定度值作为用户流量使用情况参考,可以快速、有效地识别流量异常用户,保障电信运营商的利益。
实施例二
如图2所示为本发明实施例提供的流量异常用户识别方法的第二种流程图,本实施例中流量异常用户识别方法包括以下步骤:
步骤201:根据用户属性的相关性对用户数据集进行特征选择。
具体地,这里的用户属性是指每个用户的年龄、入网时长等物体性质。相关性是指计算两个不同属性的相关程度,如果两个属性很相关,可以去除一个属性,不相关就可以保留,最后保留完成的属性中进行用户特征选择。
步骤202:基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中。
具体地,本发明的另一个实施例中,可以采用稳定度公式计算稳定度值;而稳定度公式为:
步骤203:将添加完的用户数据集按照数量的不同划分为训练集和测试集。
步骤204:采用训练集训练分类模型库,并在训练完成分类模型后,采用测试集对分类模型库进行验证,得到最优模型库。
步骤205:由最优模型库,确定流量异常用户。
本发明实施例提供的流量异常用户识别方法,根据用户属性的相关性对用户数据集进行特征选择,可以舍去无关的特征,使用户数据集具有较高的有效性,保障了流量异常用户识别的可靠度比较高。
实施例三
如图3所示为本发明实施例提供的流量异常用户识别方法的第三种流程图,本实施例中流量异常用户识别方法包括以下步骤:
步骤301:对用户数据集进行数据转换、数据探索以及数据标准化处理。
具体地,可以利用spark对用户数据集进行数据转换、数据探索以及数据标准化处理。其中,数据转换是将不同类型的数据进行转换,用户数据集可能是以字符串的形式存储的,对数字类型的数据需要转化为数字类型,数据转换的主要目的是将不同的数据类型转化为分类模型库可以使用的数据类型;数据探索是对用户数据集进行探索并根据探索结果,对异常值和缺失值进行去除或补充;数据标准化是将格式不同的用户数据集进行相同格式的转换。
Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是:工作中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
步骤302:根据用户属性的相关性对用户数据集进行特征选择。
具体地,这里的用户属性是指每个用户的年龄、入网时长等物体性质。相关性是指计算两个不同属性的相关程度,如果两个属性很相关,可以去除一个属性,不相关就可以保留,最后保留完成的属性中进行用户特征选择。
步骤303:基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中。
步骤304:采用用户平均流量费用公式计算用户平均流量费用,并将用户平均流量费用增加到用户数据集的特征中。
具体地,用户平均流量费用公式为:(每月的总费用-语音费用-第三方会员数据费用-短信使用费用)/(每月总的流量使用量-套餐内流量的使用量)。
步骤305:将添加完的用户数据集按照数量的不同划分为训练集和测试集。
步骤306:采用训练集训练分类模型库,并在训练完成分类模型后,采用测试集对分类模型库进行验证,得到最优模型库。
具体地,
步骤307:由最优模型库,确定流量异常用户。
本发明实施例提供的流量异常用户识别方法,通过对用户数据集进行数据转换、数据探索以及数据标准化,可以保障用户数据集的有效性;进一步,在用户数据集的特征中增加用户平均流量费用,可以提高分类模型库以及最优模型库的准确性。
实施例四
针对上述流量异常用户识别方法,本发明还提供了一种流量异常用户识别系统,如图4所示为本发明实施例提供的流量异常用户识别系统的一种结构示意图,本实施例中流量异常用户识别系统包括:计算模块、训练模块以及堆叠模块。
其中,计算模块用于基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中。
具体地,用户数据集包括:话费数据、流量数据、用户的入网时长以及套餐类型。
具体地,可以采用稳定度公式计算得到稳定度值。
本发明的另一个实施例中,为了增加分类模型库的准确性,还可以将用户平均流量费用添加到用户数据集的特征中。而用户平均流量费用可以采用用户平均流量费用公式计算得出。
训练模块用于将添加完的用户数据集按照数量的不同划分为训练集和测试集;采用训练集训练分类模型库,并在训练完成分类模型后,采用测试集对分类模型库进行验证,得到最优模型库。
堆叠模块用于由最优模型库,确定流量异常用户。
本发明实施例提供的流量异常用户识别系统,计算模块基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将稳定度值添加到用户数据集的特征中,训练模块通过用户数据集训练最优模型库,堆叠模块由最优模型库确定流量异常用户,通过本发明,将用户流量使用的稳定度值作为用户流量使用情况参考,可以快速、有效地识别流量异常用户,保障电信运营商的利益。
实施例五
如图5所示为本发明实施例提供的流量异常用户识别系统的另一种结构示意图,相对于图4所示的实施例,本实施例中流量异常用户识别系统还包括:预处理模块。
本发明一个实施例中,预处理模块可以用于根据用户属性的相关性对用户数据集进行特征选择。
具体地,这里的用户属性是指每个用户的年龄、入网时长等物体性质。相关性是指计算两个不同属性的相关程度,如果两个属性很相关,可以去除一个属性,不相关就可以保留,最后保留完成的属性中进行用户特征选择。
而本发明另一个实施例中,如图6所示,预处理模块还可以包括:第一模块、第二模块以及第三模块。
其中,第一模块,用于对用户数据集进行数据转换;
第二模块,用于对用户数据集进行数据探索;
第三模块,用于对用户数据集进行数据标准化,以及根据用户属性的相关性对用户数据集进行特征选择。
具体地,可以利用spark对用户数据集进行数据转换、数据探索以及数据标准化处理。其中,数据转换是将不同类型的数据进行转换,用户数据集可能是以字符串的形式存储的,对数字类型的数据需要转化为数字类型,数据转换的主要目的是将不同的数据类型转化为分类模型库可以使用的数据类型;数据探索是对用户数据集进行探索并根据探索结果,对异常值和缺失值进行去除或补充;数据标准化是将格式不同的用户数据集进行相同格式的转换。
本实施例中预处理模块具有的功能更多,可以对用户数据集进行数据转换、数据探索以及数据标准化处理。
综上,本发明实施例提供的流量异常用户识别系统,预处理模块通过对用户数据集进行数据转换、数据探索以及数据标准化,可以保障用户数据集的有效性;进一步,预处理模块根据用户属性的相关性对用户数据集进行特征选择,可以舍去无关的特征,使用户数据集具有较高的有效性。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (8)
1.一种流量异常用户识别方法,其特征在于,包括:
基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中;
将添加完的所述用户数据集按照数量的不同划分为训练集和测试集;
采用所述训练集训练分类模型库,并在训练完成分类模型后,采用所述测试集对所述分类模型库进行验证,得到最优模型库;
由所述最优模型库,确定流量异常用户;
所述分类模型库通过逻辑回归、决策树、随机森林以及XGBoost算法中任意一种及多种得到;
所述基于用户每月的流量使用量,计算用户流量使用的稳定度值包括:采用稳定度公式计算所述稳定度值;
所述稳定度公式为:
2.根据权利要求1所述的流量异常用户识别方法,其特征在于,在所述的基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中的步骤之前,所述方法还包括:
根据用户属性的相关性对所述用户数据集进行特征选择。
3.根据权利要求1所述的流量异常用户识别方法,其特征在于,在所述将添加完的所述用户数据集按照数量的不同划分为训练集和测试集的步骤之前,且在所述基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中的步骤之后,还包括:
采用用户平均流量费用公式计算用户平均流量费用,并将所述用户平均流量费用增加到所述用户数据集的特征中;
用户平均流量费用公式为:(每月的总费用-语音费用-第三方会员数据费用-短信使用费用)/(每月总的流量使用量-套餐内流量的使用量)。
4.根据权利要求1-3任一项所述的流量异常用户识别方法,其特征在于,所述用户数据集包括:
话费数据、流量数据、用户的入网时长以及套餐类型。
5.根据权利要求2所述的流量异常用户识别方法,其特征在于,所述根据用户属性的相关性对所述用户数据集进行特征选择的步骤之前,还包括:
对所述用户数据集进行数据转换、数据探索以及数据标准化处理。
6.一种流量异常用户识别系统,其特征在于,包括:
计算模块,用于基于用户每月的流量使用量,计算用户流量使用的稳定度值,并将所述稳定度值添加到用户数据集的特征中;
训练模块,用于将添加完的所述用户数据集按照数量的不同划分为训练集和测试集;采用所述训练集训练分类模型库,并在训练完成分类模型后,采用所述测试集对所述分类模型库进行验证,得到最优模型库;
堆叠模块,用于由所述最优模型库,确定流量异常用户;
所述分类模型库通过逻辑回归、决策树、随机森林以及XGBoost算法中任意一种及多种得到;
所述基于用户每月的流量使用量,计算用户流量使用的稳定度值包括:采用稳定度公式计算所述稳定度值;
所述稳定度公式为:
7.根据权利要求6所述的流量异常用户识别系统,其特征在于,所述用户数据集包括:
话费数据、流量数据、用户的入网时长以及套餐类型。
8.根据权利要求6所述的流量异常用户识别系统,其特征在于,还包括:预处理模块;
所述预处理模块还包括:
第一模块,用于对所述用户数据集进行数据转换;
第二模块,用于对所述用户数据集进行数据探索;
第三模块,用于对所述用户数据集进行数据标准化,以及根据用户属性的相关性对用户数据集进行特征选择。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910309782.XA CN110032596B (zh) | 2019-04-17 | 2019-04-17 | 流量异常用户识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910309782.XA CN110032596B (zh) | 2019-04-17 | 2019-04-17 | 流量异常用户识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110032596A CN110032596A (zh) | 2019-07-19 |
CN110032596B true CN110032596B (zh) | 2021-07-27 |
Family
ID=67238903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910309782.XA Active CN110032596B (zh) | 2019-04-17 | 2019-04-17 | 流量异常用户识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110032596B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111314869B (zh) * | 2020-02-18 | 2021-06-29 | 中国联合网络通信集团有限公司 | 流量配额分配方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101841435A (zh) * | 2010-01-18 | 2010-09-22 | 中国科学院计算机网络信息中心 | Dns查询流量异常的检测方法、装置和系统 |
US8676964B2 (en) * | 2008-07-31 | 2014-03-18 | Riverbed Technology, Inc. | Detecting outliers in network traffic time series |
CN109522304A (zh) * | 2018-11-23 | 2019-03-26 | 中国联合网络通信集团有限公司 | 异常对象识别方法及装置、存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8381299B2 (en) * | 2006-02-28 | 2013-02-19 | The Trustees Of Columbia University In The City Of New York | Systems, methods, and media for outputting a dataset based upon anomaly detection |
CN106411597A (zh) * | 2016-10-14 | 2017-02-15 | 广东工业大学 | 一种网络流量异常检测方法及系统 |
CN109462521B (zh) * | 2018-11-26 | 2020-11-20 | 华北电力大学 | 一种适用于源网荷互动工控系统的网络流量异常检测方法 |
-
2019
- 2019-04-17 CN CN201910309782.XA patent/CN110032596B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8676964B2 (en) * | 2008-07-31 | 2014-03-18 | Riverbed Technology, Inc. | Detecting outliers in network traffic time series |
CN101841435A (zh) * | 2010-01-18 | 2010-09-22 | 中国科学院计算机网络信息中心 | Dns查询流量异常的检测方法、装置和系统 |
CN109522304A (zh) * | 2018-11-23 | 2019-03-26 | 中国联合网络通信集团有限公司 | 异常对象识别方法及装置、存储介质 |
Non-Patent Citations (1)
Title |
---|
基于机器学习的异常流量检测系统的设计与实现;何珊珊;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180315(第3期);I140-181 * |
Also Published As
Publication number | Publication date |
---|---|
CN110032596A (zh) | 2019-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111565205B (zh) | 网络攻击识别方法、装置、计算机设备和存储介质 | |
US20200389495A1 (en) | Secure policy-controlled processing and auditing on regulated data sets | |
CN111104521B (zh) | 一种基于图分析的反欺诈检测方法及检测系统 | |
CN106254321A (zh) | 一种全网络异常数据流分类方法 | |
CN111199474A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN111222976A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN110019519A (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN114726823B (zh) | 一种基于生成对抗网络的域名生成方法、装置和设备 | |
CN114841789B (zh) | 基于区块链的审计审价故障数据在线编辑方法及系统 | |
CN114338064A (zh) | 识别网络流量类型的方法、装置、设备和存储介质 | |
CN106603538A (zh) | 一种入侵检测方法及系统 | |
CN114511330B (zh) | 一种基于改进的cnn-rf的以太坊庞氏骗局检测方法及系统 | |
CN117221087A (zh) | 告警根因定位方法、装置及介质 | |
CN111639230A (zh) | 一种相似视频的筛选方法、装置、设备和存储介质 | |
CN110032596B (zh) | 流量异常用户识别方法及系统 | |
CN112822121A (zh) | 流量识别方法、流量确定方法、知识图谱建立方法 | |
CN112235254B (zh) | 一种高速主干网中Tor网桥的快速识别方法 | |
CN114463011A (zh) | 基于区块链的异常交易检测方法、装置、设备及存储介质 | |
CN117081801A (zh) | 网站的内容管理系统的指纹识别方法、装置及介质 | |
Ozkan-Okay et al. | A new feature selection approach and classification technique for current intrusion detection system | |
CN112688897A (zh) | 一种流量识别的方法、装置、存储介质及电子设备 | |
CN113313505B (zh) | 异常定位方法、装置及计算设备 | |
CN105095752A (zh) | 病毒数据包的识别方法、装置及系统 | |
CN114465875A (zh) | 故障处理方法及装置 | |
CN104615605B (zh) | 用于预测数据对象的类目的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |