CN107092827A - 一种基于改进森林算法的Android恶意软件检测方法 - Google Patents

一种基于改进森林算法的Android恶意软件检测方法 Download PDF

Info

Publication number
CN107092827A
CN107092827A CN201710202794.3A CN201710202794A CN107092827A CN 107092827 A CN107092827 A CN 107092827A CN 201710202794 A CN201710202794 A CN 201710202794A CN 107092827 A CN107092827 A CN 107092827A
Authority
CN
China
Prior art keywords
stages
decision tree
characteristic vector
algorithm
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710202794.3A
Other languages
English (en)
Inventor
杨宏宇
徐晋
李爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation University of China
Original Assignee
Civil Aviation University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation University of China filed Critical Civil Aviation University of China
Priority to CN201710202794.3A priority Critical patent/CN107092827A/zh
Publication of CN107092827A publication Critical patent/CN107092827A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/562Static detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于改进森林算法的Android恶意软件检测方法包括获取数据集的S01阶段、逆向处理的S02阶段、提取特征向量的S03阶段、对特征向量进行优化的S04阶段、生成决策树集的S05阶段、计算决策树权重的S06阶段、生成最终分类结果的S07阶段和对分类结果进行评估的S08阶段;该基于改进森林算法的Android恶意软件检测方法与传统的检测方法相比具有更高的分类精度,提高了恶意软件检测的正确率,降低了由于检测错误而导致Android系统遭受攻击的概率。

Description

一种基于改进森林算法的Android恶意软件检测方法
技术领域
本发明涉及软件安全技术领域,特别涉及一种基于改进森林算法的Android恶意软件检测方法。
背景技术
Android系统是一款基于Linux内核的开源操作系统,已经成为目前市场占有量最大的移动设备终端平台,然而它的开放性也使它成为恶意软件最大的发展平台;针对应用市场上海量的移动应用软件,单纯依靠人来进行检测分类早已过时,机器学习已经成为主流。
目前机器学习中的很多分类算法被应用于Android恶意软件检测中。张怡婷等人提出一种基于朴素贝叶斯(Bayes,NB)的Android应用恶意行为识别方法,抽取软件是否申请过多权限、是否存在敏感权限组合等作为分类属性,通过对Android安全框架的扩展,实现了对恶意行为的实时分析和处理;张锐和杨吉云利用Android权限间、Android权限和软件恶意倾向间的相关性,通过改进贝叶斯算法实现了恶意软件的检测;许艳萍等使用Android权限信息作为特征并采用信息增益(IG,information gain)算法对其进行优化选择,再利用拉普拉斯校准和乘数取自然对数对NB算法进行改进,从而对Android恶意应用进行分析检测。
然而,上述研究只针对Android应用的权限信息进行检测分析,检测范围不够全面。Li W等利用危险API调用和权限组合创建了SVM分类器,从而自动的将恶意软件分辨出来。Feizollah A等应用K均值(K-means)算法和微小批处理K均值算法(mini batch K-means)两种聚类算法实现对恶意软件的分类。上述两人的研究虽然实现了对Android恶意软件的检测,但是检测精度都不够高。
Yuan Z等利用深度学习算法实现了一个在线恶意软件检测工具Droid Detector,实现了Android应用的在线检测分析,但是其算法复杂度较高,对计算机内存消耗较大。文伟平等提出了基于手机端和服务器端的协作恶意代码检测方案,杭欢等设计了一种三层混合系综算法(THEA)综合评判Android应用的恶意行为,但这两个方法在技术实现方面相对比较复杂。
综上所述,目前采用机器学习算法的检测研究成果已经比较成熟,但是在检测精度和检测效率、实现复杂度等方面还存在诸多不足,而这些问题的解决必然需要对检测算法进行研究和改进。
发明内容
本发明的目的是提供一种基于改进森林算法的Android恶意软件检测方法。
为此,本发明技术方案如下:
一种基于改进森林算法的Android恶意软件检测方法,包括按顺序进行的下列步骤:
1)获取数据集的S01阶段:从应用商店、其他网络论坛或者研究机构中获取良性软件和恶意软件的安装包文件,然后进入S02阶段;
2)逆向处理的S02阶段:将步骤1)中获得的每一个安装包文件分别反编译得到一个含AndroidManifest.xml文件的反编译文件夹,并使用Python语言中的xml.dom模块和IO模块对AndroidManifest.xml文件进行解析,得到Permission标签和Intent标签的属性,然后进入S03阶段;
3)提取特征向量的S03阶段:统计所有安装包文件中每个属性出现的次数,并选取出现次数大于安装包文件总数20%的属性组成特征属性集;利用匹配算法,判断每一个安装包文件是否含有特征属性集对应的元素,根据判断结果生成对应每一个安装包文件的特征向量,并将所有的特征向量形成特征向量集合,然后进入S04阶段;
4)对特征向量进行优化的S04阶段:采用特征选择算法对特征向量集合中的特征属性进行优化排序,并根据排序结果重新组合形成优化特征向量,并将此优化特征向量随机抽取10%作为测试集,剩余的90%作为训练集合,然后进入S05阶段;
5)生成决策树集的S05阶段:对步骤4)中生成的训练集合采用bagging方法进行抽样,将抽取到的样本作为待训练子集,未被抽到的样本形成OOB数据集,训练待训练子集按照决策树生成算法生成K棵决策树,K棵决策树形成决策树集合,然后进入S06阶段;
6)计算决策树权重的S06阶段:将OOB数据集输入决策树集合中得出每棵决策树的分类正确率,以此作为每棵决策树的权重,然后进入S07阶段;
7)生成最终分类结果的S07阶段:将步骤4)中得到的测试集输入决策树集合中生成分类结果,并利用决策树权重对分类结果进行加权投票,形成得出最终分类结果,然后进入S08阶段;
8)对分类结果进行评估的S08阶段:从真正率、假正率、分类精度对分类结果进行评估,判断该基于改进森林算法的用于生成Android恶意软件检测模型是否符合检测要求。
所述的步骤2)中在反编译生成的每个文件夹下新建permission.txt、action.txt和category.txt文档,用于存储该安装包文件的属性值。
所述的步骤3)中对所有安装包文件的特征向量取并集得到特征向量集合。
所述的步骤3)中每一个特征向量末位均为安装文件包类别标志位。
所述的步骤4)中的特征向量选择算法为信息增益算法或ReliefF算法。
所述的步骤5)中bagging方法进行抽样时采用有放回的抽样方式。
所述的步骤5)利用决策树生成过程中选择最优属性进行节点分裂,分裂过程完全分裂不进行剪枝。
与现有技术相比,该基于改进森林算法的Android恶意软件检测方法与传统的检测方法相比具有更高的分类精度,提高了恶意软件检测的正确率,降低了由于检测错误而导致Android系统遭受攻击的概率。
附图说明
图1为本发明提供的基于改进森林算法的Android恶意软件检测方法流程图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步的说明,但下述实施例绝非对本发明有任何限制。
如图1所示,该基于改进森林算法的Android恶意软件检测方法,包括按顺序进行的下列步骤:
1)获取数据集的S01阶段:从应用商店、其他网络论坛或者研究机构中获取良性软件和恶意软件的安装包文件,然后进入S02阶段;
2)逆向处理的S02阶段:将步骤1)中获得的每一个安装包文件分别反编译得到一个含AndroidManifest.xml文件的反编译文件夹,并使用Python语言中的xml.dom模块和IO模块对AndroidManifest.xml文件进行解析,得到Permission标签和Intent标签的属性,然后进入S03阶段;
3)提取特征向量的S03阶段:统计所有安装包文件中每个属性出现的次数,并选取出现次数大于安装包文件总数20%的属性组成特征属性集;利用匹配算法,判断每一个安装包文件是否含有特征属性集对应的元素,根据判断结果生成对应每一个安装包文件的特征向量,并将所有的特征向量形成特征向量集合,然后进入S04阶段;
4)对特征向量进行优化的S04阶段:采用特征选择算法对特征向量集合中的特征属性进行优化排序,并根据排序结果重新组合形成优化特征向量,并将此优化特征向量随机抽取10%作为测试集,剩余的90%作为训练集合,然后进入S05阶段;
5)生成决策树集的S05阶段:对步骤4)中生成的训练集合采用bagging方法进行抽样,将抽取到的样本作为待训练子集,未被抽到的样本形成OOB数据集,训练待训练子集按照决策树生成算法生成K棵决策树,K棵决策树形成决策树集合,然后进入S06阶段;
6)计算决策树权重的S06阶段:将OOB数据集输入决策树集合中得出每棵决策树的分类正确率,以此作为每棵决策树的权重,然后进入S07阶段;
7)生成最终分类结果的S07阶段:将步骤4)中得到的测试集输入决策树集合中生成分类结果,并利用决策树权重对分类结果进行加权投票,得出最终分类结果,然后进入S08阶段;
8)对分类结果进行评估的S08阶段:从真正率、假正率、分类精度对分类结果进行评估,判断该基于改进森林算法的用于生成Android恶意软件检测模型是否符合检测要求。
所述的步骤2)中在反编译生成的每个文件夹下新建permission.txt、action.txt和category.txt文档,用于存储该安装包文件的属性值。
所述的步骤3)中对所有安装包文件的特征向量取并集得到特征向量集合。
所述的步骤3)中每一个特征向量末位均为安装文件包类别标志位。
所述的步骤4)中的特征向量选择算法为信息增益算法或ReliefF算法。
所述的步骤5)中bagging方法进行抽样时采用有放回的抽样方式。
所述的步骤5)利用决策树生成过程中选择最优属性进行节点分裂,分裂过程完全分裂不进行剪枝。
本发明提供的基于改进森林算法的Android恶意软件检测方法的实施过程如下:
首先,从应用商店、其他网络论坛或者研究机构中获取良性软件和恶意软件的安装包文件,并将获得的每一个安装包文件反分别编译得到一个含有AndroidManifest.xml文件的反编译文件夹,并在反编译文件夹新建permission.txt、action.txt和category.txt文档,用于存储该安装包文件的属性值,使用Python语言中的xml.dom模块和IO模块对AndroidManifest.xml文件进行解析,得到Permission标签属性permission及Intent标签属性action和category;并将得到的permission、action和category属性分别存储到permission.txt、action.txt和category.txt文档中;
其次,统计所有安装包文件中permission、action和category属性出现的次数,并选取出现次数大于安装包文件总数20%的属性组成特征属性集,利用匹配算法,判断每一个安装包文件是否含有特征属性集对应的元素,根据判断结果生成对应每一个安装包文件的特征向量,特征向量中的元素可以取值“1”或“0”,“1”表示该安装包文件含有对应属性,“0”则表示该安装包文件不含有对应属性,与此同时,在特征向量末尾添加一标志位,标志位可以取值“Ben”或“Mal”,“Ben”表示该应用为良性软件,“Mal”表示该Apk应用为恶意软件;且将所有的特征向量形成特征向量集合;
再次,采用信息增益算法或ReliefF算法对特征向量集合中的特征属性进行优化排序,并根据优化排序结果重新组合形成优化特征向量,并将此优化特征向量随机抽取10%作为测试集,剩余的90%形成训练集;
然后,对上述生成的训练集合采用bagging方法进行有放回地抽样,将抽取到的样本作为待训练子集,未被抽到的样本形成OOB数据集;训练待训练子集并按照C4.5决策树生成算法或CART决策树生成算法选择最优属性进行节点分裂,分裂过程完全分裂不进行剪枝,从而生成一棵决策树,重复上面的决策树生成步骤K次,生成K棵决策树,K棵决策树形成决策树集合;
接着,将OOB数据集输入决策树集合中得出每棵决策树的分类正确率,以此作为每棵决策树的权重;
紧接着,将从优化特征向量中抽取得到的测试集输入决策树集合中生成分类结果,并利用决策树权重对分类结果进行加权投票,得出最终分类结果;
最后,从真正率、假正率、分类精度对分类结果进行评估,判断该基于改进森林算法是否符合检测要求;其中,真正性(True Positive,TP)指的是实际为恶意软件,被识别为恶意软件;假正性(False Positive,FP)指的是实际为良性软件,被识别为恶意软件;真负性(True Negative,TN)指的是实际为良性软件,被识别为良性软件;假负性(FalseNegative,FN)指的是实际为恶意软件,被识别为良性软件;真正率(True Positive Rate,TPR)=TP/(TP+FN),表示识别出的恶意软件占实际恶意软件的比例;假正率(FalsePositive Rate,FPR)=FP/(FP+TN),表示所识别出的恶意软件占实际良性软件的比例;分类精度(Accuracy,ACC)=(TP+TN)/(TP+TN+FP+FN),用来衡量总体分类精度,该值越高则分类效果越好。
表1为不同分类算法的分类效果对比表;从表1中可以看出,本发明提出的改进森林算法的分类精度高达98%,优于传统森林算法,并且分类精度明显高于其他几类分类算法;表2为不同分类算法的建模时间对比表,从表2中可以看出在建模时间上,改进的森林算法的处理时间与其他几类算法相比时间较长;理由是:首先,森林算法本身是一种集成学习算法,与单个分类器相比,具有更好的分类效果;其次,改进的森林算法对森林算法的投票原则进行了改进,对强分类器赋予较高的权重值,而对弱分类器赋予较低的权重值,导致分类效果提高,但建模时间相对增加。
表1
表2

Claims (7)

1.一种基于改进森林算法的Android恶意软件检测方法,其特征在于,包括按顺序进行的下列步骤:
1)获取数据集的S01阶段:从应用商店、其他网络论坛或者研究机构中获取良性软件和恶意软件的安装包文件,然后进入S02阶段;
2)逆向处理的S02阶段:将步骤1)中获得的每一个安装包文件分别反编译得到一个含AndroidManifest.xml文件的反编译文件夹,并使用Python语言中的xml.dom模块和IO模块对AndroidManifest.xml文件进行解析,得到Permission标签和Intent标签的属性,然后进入S03阶段;
3)提取特征向量的S03阶段:统计所有安装包文件中每个属性出现的次数,并选取出现次数大于安装包文件总数20%的属性组成特征属性集;利用匹配算法,判断每一个安装包文件是否含有特征属性集对应的元素,根据判断结果生成对应每一个安装包文件的特征向量,并将所有的特征向量形成特征向量集合,然后进入S04阶段;
4)对特征向量进行优化的S04阶段:采用特征选择算法对特征向量集合中的特征属性进行优化排序,并根据排序结果重新组合形成优化特征向量,并将此优化特征向量随机抽取10%作为测试集,剩余的90%作为训练集合,然后进入S05阶段;
5)生成决策树集的S05阶段:对步骤4)中生成的训练集合采用bagging方法进行抽样,将抽取到的样本作为待训练子集,未被抽到的样本形成OOB数据集,训练待训练子集按照决策树生成算法生成K棵决策树,K棵决策树形成决策树集合,然后进入S06阶段;
6)计算决策树权重的S06阶段:将OOB数据集输入决策树集合中得出每棵决策树的分类正确率,以此作为每棵决策树的权重,然后进入S07阶段;
7)生成最终分类结果的S07阶段:将步骤4)中得到的测试集输入决策树集合中生成分类结果,并利用决策树权重对分类结果进行加权投票,得出最终分类结果,然后进入S08阶段;
8)对分类结果进行评估的S08阶段:从真正率、假正率、分类精度对分类结果进行评估,判断该基于改进森林算法的用于生成Android恶意软件检测模型是否符合检测要求。
2.根据权利要求1所述的基于改进森林算法的Android恶意软件检测方法,其特征在于,所述的步骤2)中在反编译生成的每个文件夹下新建permission.txt、action.txt和category.txt文档,用于存储该安装包文件的属性值。
3.根据权利要求1所述的基于改进森林算法的Android恶意软件检测方法,其特征在于,所述的步骤3)中对所有安装包文件的特征向量取并集得到特征向量集合。
4.根据权利要求1所述的基于改进森林算法的Android恶意软件检测方法,其特征在于,所述的步骤3)中每一个特征向量末位均为安装文件包类别标志位。
5.根据权利要求1所述的基于改进森林算法的Android恶意软件检测方法,其特征在于,所述的步骤4)中的特征向量选择算法为信息增益算法或ReliefF算法。
6.根据权利要求1所述的基于改进森林算法的Android恶意软件检测方法,其特征在于,所述的步骤5)中bagging方法进行抽样时采用有放回的抽样方式。
7.根据权利要求1所述的基于改进森林算法的Android恶意软件检测方法,其特征在于,所述的步骤5)利用决策树生成过程中选择最优属性进行节点分裂,分裂过程完全分裂不进行剪枝。
CN201710202794.3A 2017-03-30 2017-03-30 一种基于改进森林算法的Android恶意软件检测方法 Pending CN107092827A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710202794.3A CN107092827A (zh) 2017-03-30 2017-03-30 一种基于改进森林算法的Android恶意软件检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710202794.3A CN107092827A (zh) 2017-03-30 2017-03-30 一种基于改进森林算法的Android恶意软件检测方法

Publications (1)

Publication Number Publication Date
CN107092827A true CN107092827A (zh) 2017-08-25

Family

ID=59649322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710202794.3A Pending CN107092827A (zh) 2017-03-30 2017-03-30 一种基于改进森林算法的Android恶意软件检测方法

Country Status (1)

Country Link
CN (1) CN107092827A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090216A (zh) * 2017-12-29 2018-05-29 咪咕文化科技有限公司 一种标签预测方法、装置及存储介质
CN109165510A (zh) * 2018-09-04 2019-01-08 中国民航大学 基于双通道卷积神经网络的Android恶意应用程序检测方法
CN109657467A (zh) * 2018-11-26 2019-04-19 北京兰云科技有限公司 一种网页后门检测方法和装置、计算机可读存储介质
CN109670310A (zh) * 2019-01-28 2019-04-23 杭州师范大学 一种基于半监督K-Means聚类算法的Android恶意软件检测方法
CN109858247A (zh) * 2018-12-26 2019-06-07 江苏博智软件科技股份有限公司 一种基于XGBoost的静态三特征模型的恶意软件分类方法
CN110264342A (zh) * 2019-06-19 2019-09-20 深圳前海微众银行股份有限公司 一种基于机器学习的业务审核方法及装置
CN111310185A (zh) * 2020-03-11 2020-06-19 合肥工业大学 一种基于改进stacking算法的Android恶意软件检测方法
CN117081858A (zh) * 2023-10-16 2023-11-17 山东省计算中心(国家超级计算济南中心) 一种基于多决策树入侵行为检测方法、系统、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377378A (zh) * 2012-04-26 2013-10-30 富士通株式会社 生成组合分类器的方法和装置以及图像检索方法和装置
CN105320887A (zh) * 2015-10-12 2016-02-10 湖南大学 一种基于静态特征提取和选择的Android恶意应用检测方法
CN105550583A (zh) * 2015-12-22 2016-05-04 电子科技大学 基于随机森林分类方法的Android平台恶意应用检测方法
CN106228068A (zh) * 2016-07-21 2016-12-14 江西师范大学 基于混合特征的Android恶意代码检测方法
CN106355030A (zh) * 2016-09-20 2017-01-25 浙江大学 一种基于层次分析法和加权投票决策融合的故障检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377378A (zh) * 2012-04-26 2013-10-30 富士通株式会社 生成组合分类器的方法和装置以及图像检索方法和装置
CN105320887A (zh) * 2015-10-12 2016-02-10 湖南大学 一种基于静态特征提取和选择的Android恶意应用检测方法
CN105550583A (zh) * 2015-12-22 2016-05-04 电子科技大学 基于随机森林分类方法的Android平台恶意应用检测方法
CN106228068A (zh) * 2016-07-21 2016-12-14 江西师范大学 基于混合特征的Android恶意代码检测方法
CN106355030A (zh) * 2016-09-20 2017-01-25 浙江大学 一种基于层次分析法和加权投票决策融合的故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MOHAMMED S. ALAM,SON T. VUONG: "Random Forest Classification for Detecting Android Malware", 《2013 IEEE INTERNATIONAL CONFERENCE ON GREEN COMPUTING AND COMMUNICATIONS AND IEEE INTERNET OF THINGS AND IEEE CYBER, PHYSICAL AND SOCIAL COMPUTING》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090216A (zh) * 2017-12-29 2018-05-29 咪咕文化科技有限公司 一种标签预测方法、装置及存储介质
CN109165510A (zh) * 2018-09-04 2019-01-08 中国民航大学 基于双通道卷积神经网络的Android恶意应用程序检测方法
CN109165510B (zh) * 2018-09-04 2021-03-26 中国民航大学 基于双通道卷积神经网络的Android恶意应用程序检测方法
CN109657467A (zh) * 2018-11-26 2019-04-19 北京兰云科技有限公司 一种网页后门检测方法和装置、计算机可读存储介质
CN109858247A (zh) * 2018-12-26 2019-06-07 江苏博智软件科技股份有限公司 一种基于XGBoost的静态三特征模型的恶意软件分类方法
CN109670310A (zh) * 2019-01-28 2019-04-23 杭州师范大学 一种基于半监督K-Means聚类算法的Android恶意软件检测方法
CN110264342A (zh) * 2019-06-19 2019-09-20 深圳前海微众银行股份有限公司 一种基于机器学习的业务审核方法及装置
CN111310185A (zh) * 2020-03-11 2020-06-19 合肥工业大学 一种基于改进stacking算法的Android恶意软件检测方法
CN111310185B (zh) * 2020-03-11 2022-10-04 合肥工业大学 一种基于改进stacking算法的Android恶意软件检测方法
CN117081858A (zh) * 2023-10-16 2023-11-17 山东省计算中心(国家超级计算济南中心) 一种基于多决策树入侵行为检测方法、系统、设备及介质
CN117081858B (zh) * 2023-10-16 2024-01-19 山东省计算中心(国家超级计算济南中心) 一种基于多决策树入侵行为检测方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN107092827A (zh) 一种基于改进森林算法的Android恶意软件检测方法
US9910985B2 (en) Apparatus and method for identifying similarity via dynamic decimation of token sequence N-grams
CN107835496B (zh) 一种垃圾短信的识别方法、装置和服务器
Demir et al. Batch-mode active-learning methods for the interactive classification of remote sensing images
CN106296195A (zh) 一种风险识别方法及装置
US20210216443A1 (en) Automatic parameter value resolution for api evaluation
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN103886108B (zh) 一种不均衡文本集的特征选择和权重计算方法
CN104217160A (zh) 一种中文钓鱼网站检测方法及系统
CN105897517A (zh) 一种基于svm的网络流量异常检测方法
WO2019179010A1 (zh) 数据集获取方法、分类方法、装置、设备及存储介质
WO2020177365A1 (zh) 基于数据挖掘的社保数据处理方法、装置和计算机设备
CN111460446A (zh) 基于模型的恶意文件检测方法及装置
CN108418777A (zh) 一种钓鱼邮件检测方法、装置及系统
CN112733146B (zh) 基于机器学习的渗透测试方法、装置、设备及存储介质
CN107665164A (zh) 安全数据检测方法和装置
Shevtsov et al. Identification of twitter bots based on an explainable machine learning framework: the US 2020 elections case study
KR20200075120A (ko) 기업 부도 예측 시스템 및 이의 동작 방법
US20230410221A1 (en) Information processing apparatus, control method, and program
CN113722438A (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
US20230214415A1 (en) Text classification system based on feature selection and method thereof
CN113052577A (zh) 一种区块链数字货币虚拟地址的类别推测方法及系统
CN105468972B (zh) 一种移动终端文件检测方法
CN112231696B (zh) 恶意样本的识别方法、装置、计算设备以及介质
CN114064893A (zh) 一种异常数据审核方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170825

WD01 Invention patent application deemed withdrawn after publication