CN114547616A - 检测垃圾软件的方法、装置及电子设备 - Google Patents
检测垃圾软件的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114547616A CN114547616A CN202210193533.0A CN202210193533A CN114547616A CN 114547616 A CN114547616 A CN 114547616A CN 202210193533 A CN202210193533 A CN 202210193533A CN 114547616 A CN114547616 A CN 114547616A
- Authority
- CN
- China
- Prior art keywords
- software
- detected
- detection result
- features
- feature extractor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000001514 detection method Methods 0.000 claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000007477 logistic regression Methods 0.000 claims abstract description 10
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 9
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 30
- 238000003860 storage Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000006872 improvement Effects 0.000 abstract description 4
- 230000001965 increasing effect Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 34
- 230000006854 communication Effects 0.000 description 34
- 238000012545 processing Methods 0.000 description 17
- 238000007726 management method Methods 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 12
- 238000010295 mobile communication Methods 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 11
- 210000000988 bone and bone Anatomy 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003068 static effect Effects 0.000 description 6
- 238000000513 principal component analysis Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000036772 blood pressure Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/56—Computer malware detection or handling, e.g. anti-virus arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Security & Cryptography (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Computer Hardware Design (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Virology (AREA)
- Stored Programmes (AREA)
Abstract
本申请实施例提出了一种检测垃圾软件的方法、装置及电子设备,所述方法包括:从待检测软件中提取出待检测特征;利用预设规则对所述待检测特征进行检测,得到第一检测结果;将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到;根据所述第一检测结果和所述第二检测结果得到最终的检测结果,上述方法实现了在不大幅增加耗时和训练代价的情况下提高检测效率。
Description
【技术领域】
本申请实施例涉及软件检测技术领域,尤其涉及一种检测垃圾软件的方法、装置及电子设备。
【背景技术】
现有技术的检测垃圾软件的方法大致可以分为三类,第一类是基于规则的检测方法,存在准确率不高的问题;第二类是基于人工智能等特征学习的检测方法,存在训练代价大,耗时长等缺点;第三类是对简单模型改进后的检测方法,例如组合CNN、DNN的方式,但是适用范围有限,CNN的卷积核更擅长于捕捉图像类的特征,RNN更擅长捕获语音、文本等连续序列的特征,而在其他领域表现效果并不是很突出,而且训练的参数量也较高,训练代价大。
因此,针对智能设备中侵害用户隐私和设备安全的垃圾软件,提供一种不大幅增加耗时和训练代价,还能提高检测效率的检测方法,是目前亟需解决的问题。
【发明内容】
本申请实施例提供了一种检测垃圾软件的方法,实现了在不大幅增加耗时和训练代价的情况下提高检测效率。
第一方面,本申请实施例提供一种检测垃圾软件的方法,应用于电子设备,包括:从待检测软件中提取出待检测特征;利用预设规则对所述待检测特征进行检测,得到第一检测结果,所述第一检测结果用于指示所述待检测软件是否为垃圾软件;将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,所述第二检测结果用于指示所述待检测软件是否为垃圾软件,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到;根据所述第一检测结果和所述第二检测结果得到最终的检测结果。
第一方面的有益效果,结合基于规则判断和基于人工智能的特征提取与训练方法进行分类预测的两种检测结果进行垃圾软件识别,其中分类预测方式中采用三种不同类型的特征提取器对特征进行捕获并对多种特征进行组合训练的方法,时间与空间复杂度低、运算速度快,且由于训练的参数量较少还能够保证结果的快速迭代与响应,另外在检测准确率上也得到了优化。
在一种可能的实现方式中,所述待检测特征包含权限特征、意图特征、应用程序编程接口API特征和系统签名特征中至少一个。
在一种可能的实现方式中,所述根据所述第一检测结果和所述第二检测结果得到最终的检测结果,包括:将所述第一检测结果和所述第二检测结果求并集,得到最终的检测结果。
在一种可能的实现方式中,所述分类预测模型的训练过程,包括:获取多个软件样本,所述软件样本包括标注信息,所述标注信息用于指示所述软件样本为正常软件或者垃圾软件;获取所述软件样本的待检测特征;将所述软件样本的待检测特征输入LR特征提取器,获得第一输出;将所述软件样本的待检测特征输入FFM特征提取器,获得第二输出;将所述软件样本的待检测特征输入DNN特征提取器,获得第三输出;将所述第一输出取对数后乘以预设第一权重得到的结果、所述第二输出取对数后乘以预设第二权重得到的结果、以及所述第三输出取对数后乘以预设第三权重得到的结果相加,再通过回归损失函数进行合并训练。
在一种可能的实现方式中,所述获取所述软件样本的待检测特征,包括:对获取的所述软件样本的待检测特征进行数据清洗和特征筛选。
在一种可能的实现方式中,所述FFM特征提取器对提取的交叉特征进行了归一化处理,所述归一化处理采用Sigomoid函数。
在一种可能的实现方式中,所述FFM特征提取器的公式为: 其中,y2表示第二输出,σ表示Sigmoid函数,xi,xj表示输入特征,b表示偏差项,w0表示常数项,wi表示一次项系数,vi,vj分别为xi,xj的稠密表达。
在一种可能的实现方式中,所述DNN特征提取器的公式为:y3=hl+1,hl+1=f(Wlhl+bl),其中y3表示第三输出,hl+1表示当前层的输出,Wl表示上一层的权重矩阵,hl表示上一层隐藏层的权重激活值,bl表示上一层的权重偏差。
第二方面,本申请实施例提供一种检测垃圾软件的装置,应用于电子设备,包括:特征提取模块,用于从待检测软件中提取出待检测特征;第一结果模块,用于利用预设规则对所述待检测特征进行检测,得到第一检测结果,所述第一检测结果用于指示所述待检测软件是否为垃圾软件;第二结果模块,用于将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,所述第二检测结果用于指示所述待检测软件是否为垃圾软件,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到;结果生成模块,用于根据所述第一检测结果和所述第二检测结果得到最终的检测结果。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面提供的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面提供的方法。
应当理解的是,本申请实施例的第二~四方面与本申请实施例的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
【附图说明】
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种检测垃圾软件的方法的流程示意图;
图2为本申请实施例提供的一种分类预测模型的训练过程的流程示意图;
图3为本申请实施例提供的一种检测垃圾软件的装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
【具体实施方式】
为了更好的理解本说明书的技术方案,下面结合附图对本申请实施例进行详细描述。
应当明确,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本说明书保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
为便于本领域技术人员对本申请的技术方案进行理解,下面对本申请所涉及的技术术语进行说明。
(1)LR:逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。
(2)FFM:域分解机模型FFM(Field-aware Factorization Machines)是一种捕获交叉特征的方法,每一维特征(feature)都归属于一个特定的field,field和feature是一对多的关系。
(3)DNN:深度神经网络(Deep Neural Network)一种常用的深度学习方法,通过多个的隐藏层的学习可以更好的捕获隐藏特征。
(4)CNN:卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。
(5)RNN:循环神经网络(Recurrent Neural Network,RNN)是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。
(6)PCA:Principal Component Analysis,即主成分分析技术,又称主分量分析技术,旨在利用降维的思想,把多指标转化为少数几个综合指标。
现有技术中的垃圾软件检测方法大致可以分为三类,一类是基于规则的检测方法,例如市面许多常见的检测方法便是通过脚本语言与正则表达式的组合来匹配有潜在风险的垃圾软件。这种方式比较快捷,但是由于规则有限无法学习隐藏特征,存在准确率不高的问题,一些垃圾软件很容易通过一些加密方式来隐瞒过检测。另一类是基于人工智能等特征学习的方法,如在学术界中常常采用图神经网络、构建知识图谱、预训练模型等方法对隐藏特征进行复杂的推理与学习,这类方法往往相比规则准确率要更高,但是由于模型过于复杂,常常需要极长的时间进行训练,而且参数量甚至达到上亿,存在训练代价大,耗时长等缺点。第三类检测方法是对于简单模型的改进,如组合了CNN、DNN的方式,组合了RNN与DNN的方式等,该类方法适用范围有限,CNN的卷积核更擅长于捕捉图像类的特征,RNN更擅长捕获语音、文本等连续序列的特征,在其他领域表现效果并不突出,而且训练的参数量也会提高。
基于以上问题,本申请实施例提供一种检测垃圾软件的方法,对目前智能设备中侵害用户隐私和设备安全的垃圾软件进行检测,在不大幅度增加耗时和训练代价的基础上,相比简单的模型提高一些效率。
图1为本申请实施例提供的一种检测垃圾软件的方法的流程示意图,如图1所示,所述检测垃圾软件的方法,应用于电子设备,包括:
步骤101:从待检测软件中提取出待检测特征。
其中,所述待检测特征包含权限特征、意图特征、应用程序编程接口API特征和系统签名特征中至少一个。
需要说明的是,当我们获取到一些待识别的APK时,例如安卓系统中的APK时,可以通过反编译安卓的APK文件,得到反编译的中间文件,与检测垃圾软件相关的待检测特征可以包括静态特征,静态特征可以包括权限设置(如设置可以获取用户隐私信息、收发信息等权限)、意图Intent设置(如在TelephoneManager、Location、SmsManager等类中自动调用获取用户信息的方法)、API组件、系统签名等。可以理解的是,待检测特征并不仅限于上面描述的类型,还可以包括其他类型的特征,本申请实施例对待检测特征的类型和数量不作限定。
步骤102:利用预设规则对所述待检测特征进行检测,得到第一检测结果,所述第一检测结果用于指示所述待检测软件是否为垃圾软件。
需要说明的是,在提取出待检测特征后,可以通过一些自动化的方法对待检测特征进行分析识别出可能具有恶意行为的APK。例如利用预设规则对待检测特征进行检测,得到指示所述待检测软件是否为垃圾软件第一检测结果。利用预设规则对所述待检测特征进行检测能够非常快捷的通过显性特征确定带检测软件是否为垃圾软件的检测结果。
步骤103:将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,所述第二检测结果用于指示所述待检测软件是否为垃圾软件,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到。
需要说明的是,在提取出待检测特征后,将待检测特征输入训练好的分类预测模型,分类预测模型输出指示所述待检测软件是否为垃圾软件的第二检测结果。其中,训练好的预测模型包括三个特征提取器,分别是逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器,将通过三个特征提取器提取的多种特征进行组合用于三个特征提取器的训练,能够更好的挖掘出深层特征,提高检测垃圾软件的准确率。
步骤104:根据所述第一检测结果和所述第二检测结果得到最终的检测结果。
其中,所述根据所述第一检测结果和所述第二检测结果得到最终的检测结果,可以包括:将所述第一检测结果和所述第二检测结果求并集,得到最终的检测结果。
需要说明的是,为了进一步提高检测的准确率,我们可以将得到的根据规则筛选出来的垃圾软件集合和经过特征学习预测出的垃圾软件集合取并集,作为最终的识别结果。
本发明将基于规则判断和基于人工智能的特征提取与训练方法进行分类预测两种方式的检测结果结合起来对垃圾软件进行识别,并且分类预测模型结合了三种不同类型的特征提取器对两类特征(记忆特征、泛化特征)进行捕获,并将捕获的多种特征进行组合训练的方法,相比学术界复杂的神经网络模型,本发明的时间与空间复杂度低,运算速度快,且训练的参数量较少,能够保证结果的快速迭代与响应,相比于工业界简单的神经网络与召回方法,本发明融合了多种类型的信息,在准确率上也得到了优化。
可以理解的是,本申请实施例提供的检测垃圾软件的方法可以应用于智能手机、平板电脑、车载设备或其他基于Android平台的电子设备。
图2为本申请实施例提供的一种分类预测模型的训练过程的流程示意图,如图2所示,所述分类预测模型的训练过程,包括:
步骤201:获取多个软件样本,所述软件样本包括标注信息,所述标注信息用于指示所述软件样本为正常软件或者垃圾软件。
其中,本申请实施例可以通过标注的方式来对目前市场上可以获取到的一些APK进行识别,其中0代表不具有垃圾软件信息,1代表具有垃圾软件信息。为了能更好的挖掘出垃圾软件信息的深层特征,进一步可以通过将这些信息输入到需要训练的识别垃圾软件的分类预测模型中进行训练。
步骤202:获取所述软件样本的待检测特征。
其中,所述待检测特征包含权限特征、意图特征、应用程序编程接口API特征和系统签名特征中至少一个。
需要说明的是,当我们获取到一些待识别的APK时,例如安卓系统中的APK时,可以通过反编译安卓的APK文件,得到反编译的中间文件,与检测垃圾软件相关的待检测特征可以包括静态特征,静态特征可以包括权限设置(如设置可以获取用户隐私信息、收发信息等权限)、意图Intent设置(如在TelephoneManager、Location、SmsManager等类中自动调用获取用户信息的方法)、API组件、系统签名等。可以理解的是,待检测特征并不仅限于上面描述的类型,还可以包括其他类型的特征,本申请实施例对待检测特征的类型和数量不作限定。
其中,所述获取所述软件样本的待检测特征,包括:对获取的所述软件样本的待检测特征进行数据清洗和特征筛选。
需要说明的是,通过自动化方法获取的信息往往会掺杂许多脏数据,因此在进行整合前需要对数据进行简单的清洗,对于连续性特征去除明显不在合理范围内的值,对于离散型特征去掉不在合理集合中的值,并去除数据中的乱码不合理标识符等数据。为了方便LR和FFM等特征提取器的训练,可以进一步考虑将一些连续特征离散化,无论是计算时间还是交叉特征的学习上都有很好的效果。
数据清洗后进一步可以进行特征选择,本申请实施例可以采用主成分分析技术PCA这种比较简单的方式来投影数据到特征向量张成的空间之中选取特征值较高的前10-20种特征,减少特征数既减轻了训练压力,又可以让相关特征有着更大的话语权。在特征选择过后便可以将数据输入到分类预测模型中进行训练。
步骤203:将所述软件样本的待检测特征输入LR特征提取器,获得第一输出。
需要说明的是,模型总体可以分为三种特征提取器,分别为LR特征提取器,FFM特征提取器和DNN特征提取器。考虑更好的处理离散稀疏特征,首先可以将提取的静态特征输入到LR特征提取器中,LR为广义线性模型,其中,所述LR特征提取器的公式为:其中y1表示第一输出,x表示原始特征,表示交叉特征,WT表示权重矩阵,b表示偏差。该方法快速高效且特征重要度易于分析。
步骤204:将所述软件样本的待检测特征输入FFM特征提取器,获得第二输出。
需要说明的是,为了更好的捕获不同特征之间的交叉特征,接着可以将提取的静态特征输入到FFM特征提取器中。由于实际情况中特征往往不会独立存在,通常会存在与其他特征的交叉,FM是一种很轻量级的交叉特征提取器,即其中x为输入特征,v为模型参数,在FM中所有的特征共享参数v,为了细化更细化交叉特征的归属,FFM将每一维特征都归属于一个特定的域,域和特征是一对多的关系。为了区分不同的域,因此在提取交叉特征时不再共享参数v,即
进一步的,本申请实施例对FFM特征提取器基于FFM的思想进行了改进,对交叉特征进行提取,改进后的FFM特征提取器的公式为: 其中,y2表示第二输出,σ表示Sigomoid函数,xi,xj表示输入特征,b表示偏差项,w0表示常数项,wi表示一次项系数,由于二次项系数矩阵Wn×n为对称方阵,可以对其进行矩阵分解来减少需要训练的参数量:其中每个系数wi,j=<vi,vj>,其中因此vi,vj分别为xi,xj的稠密表达,或称第i个特征的隐向量。其中σ为Sigomoid函数,表达式为通过将特征进行归一化,能够得到更准确快速的训练。
步骤205:将所述软件样本的待检测特征输入DNN特征提取器,获得第三输出。
需要说明的是,为了进一步提高模型的泛化能力,第三特征提取器采用深度前馈神经网络DNN,通过将稀疏的高维特征转换成低维的稠密向量,在训练的过程中能够挖掘出许多隐藏的深层特征,对于每一层网络的计算方式为:hl+1=f(Wlhl+bl),其中hl+1表示当前层的输出,Wl表示上一层的权重矩阵,hl表示上一层隐藏层的权重激活值,bl表示上一层的权重偏差。DNN特征提取器将原始特征x输入至模型中,通过h2=f(W1x+b1)输入至下层网络中,经过l层DNN传播后,提取最后一层的结果作为DNN特征提取器的输出,即y3=hl+1。
步骤206:将所述第一输出取对数后乘以预设第一权重得到的结果、所述第二输出取对数后乘以预设第二权重得到的结果、以及所述第三输出取对数后乘以预设第三权重得到的结果相加,再通过回归损失函数进行合并训练。
需要说明的是,通过训练得到三类不同的特征后,本申请实施例将三个输出分别取对数后按预设权重相加,然后通过回归损失函数进行合并训练,涉及到的参数也均可以在训练的同时得到学习和更新。最终组合公式为:其中,分别表示LR特征提取器、FFM特征提取器和DNN特征提取器的系数矩阵,b表示偏差项,σ为Sigmoid函数,将输出值归一化至(0,1)区间,P(Y=1|x)表示分类预测模型预测为真值的概率。最终的预测结果可以通过将概率离散化处理为0或1来判断是否是垃圾软件。
本申请实施例中,对于记忆特征,即可以直接解释与获取的特征,通过LR特征提取器提取,LR是在工业界广泛使用的特征提取器,运算速度快且能够达到不错的准确率,本申请实施例用此方法对特征进行了简单的召回。此外,为了捕获特征之间的交互,采用了FFM特征提取器的改进,将特征进行二次筛选,尽可能多的捕获特征的一阶信息与高阶信息,提升模型的训练效果。对于泛化特征,即无法直接解释与获取的特征,本申请实施例采用了DNN特征提取器来捕获特征中的隐藏信息,经过多层隐藏层的学习能够抽取出最优特征,再进一步与记忆特征进行融合达到本发明的最好效果。
图3为本申请实施例提供的一种检测垃圾软件的装置的结构示意图,如图3所示,所述装置包括:特征提取模块301、第一结果模块302、第二结果模块303和结果生成模块304,其中,
特征提取模块301,用于从待检测软件中提取出待检测特征;
第一结果模块302,用于利用预设规则对所述待检测特征进行检测,得到第一检测结果,所述第一检测结果用于指示所述待检测软件是否为垃圾软件;
第二结果模块303,用于将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,所述第二检测结果用于指示所述待检测软件是否为垃圾软件,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到;
结果生成模块304,用于根据所述第一检测结果和所述第二检测结果得到最终的检测结果。
图3所示实施例提供的检测垃圾软件的装置可用于执行本说明书图1所示方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
可以理解的是,所述检测垃圾软件的方法可以通过以下装置来执行:芯片、或者芯片模组。关于上述实施例中描述的各个装置、产品包含的各个模块/子模块/单元,其可以是软件模块/子模块/单元,也可以是硬件模块/子模块/单元,或者也可以部分是软件模块/子模块/单元,部分是硬件模块/子模块/单元。例如,对于应用于或集成于芯片的各个装置、产品,其包含的各个模块/子模块/单元可以都采用电路等硬件的方式实现,或者,至少部分模块/子模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片内部集成的处理器,剩余的(如果有)部分模块/子模块/单元可以采用电路等硬件方式实现;对于应用于或集成于芯片模组的各个装置、产品,其包含的各个模块/子模块/单元可以都采用电路等硬件的方式实现,不同的模块/子模块/单元可以位于芯片模组的同一组件(例如芯片、电路模块等)或者不同组件中,或者,至少部分模块/子模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片模组内部集成的处理器,剩余的(如果有)部分模块/子模块/单元可以采用电路等硬件方式实现;对于应用于或集成于终端的各个装置、产品,其包含的各个模块/子模块/单元可以都采用电路等硬件的方式实现,不同的模块/子模块/单元可以位于终端内同一组件(例如,芯片、电路模块等)或者不同组件中,或者,至少部分模块/子模块/单元可以采用软件程序的方式实现,该软件程序运行于终端内部集成的处理器,剩余的(如果有)部分模块/子模块/单元可以采用电路等硬件方式实现。
图4为本申请实施例提供的一种电子设备的结构示意图,图4可以为应用本申请实施例提供的检测垃圾软件的方法的电子设备的结构示意图,如图4所示,上述电子设备可以包括至少一个处理器;以及与上述处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,上述处理器调用上述程序指令能够执行本说明书图1~图2所示实施例提供的检测垃圾软件的方法。
其中,上述电子设备可以为智能手机、平板电脑或笔记本电脑等智能电子设备,本实施例对上述电子设备的形式不作限定。
示例性的,图4以智能手机为例示出了终端设备的结构示意图,如图4所示,电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universalserial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。进一步的,当所述终端设备为手机时,所述终端设备还可以包括:天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及用户标识模块(subscriberidentification module,SIM)卡接口195等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是终端设备的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera seria l interfa ce,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I15c接口,I14S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他终端设备,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为终端设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(globalsy stem for mobil ecommunications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband codedivision multipleaccess,WCDMA),时分码分多址(time-division code divisionmultiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenithsatellite system,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dotlightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备的显示屏194上可以显示一系列图形用户界面(graphicaluserinterface,GUI),这些GUI都是该终端设备的主屏幕。一般来说,终端设备的显示屏194的尺寸是固定的,只能在该终端设备的显示屏194中显示有限的控件。控件是一种GUI元素,它是一种软件组件,包含在应用程序中,控制着该应用程序处理的所有数据以及关于这些数据的交互操作,用户可以通过直接操作(direct manipulation)来与控件交互,从而对应用程序的有关信息进行读取或者编辑。一般而言,控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。例如,在本申请实施例中,显示屏194可以显示虚拟按键。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别终端设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
其中,本申请实施例所涉及的终端设备,可安装有操作系统,在该操作系统上可以安装运行应用程序,本申请实施例对此不作限定。
需要说明的,本申请实施例中提及的顶端、底端、左端、右端,以及上方、下方均是相对的,是具体实现方式中的示例性地描述,不应对本申请实施例构成限定。
本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本说明书图1~图2所示实施例提供的检测垃圾软件的方法。
上述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(readonly memory,ROM)、可擦式可编程只读存储器(erasable programmable read onlymemory,EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、射频(radio frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本说明书操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(localarea network,LAN)或广域网(wide area network,WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本发明实施例的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本说明书的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本说明书的实施例所属技术领域的技术人员所理解。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(personal computer,PC)、个人数字助理(personal digital assistant,PDA)、无线手持设备、平板电脑(tablet computer)、手机、MP3播放器、MP4播放器等。
在本说明书所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本说明书各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本说明书各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
Claims (11)
1.一种检测垃圾软件的方法,其特征在于,应用于电子设备,包括:
从待检测软件中提取出待检测特征;
利用预设规则对所述待检测特征进行检测,得到第一检测结果,所述第一检测结果用于指示所述待检测软件是否为垃圾软件;
将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,所述第二检测结果用于指示所述待检测软件是否为垃圾软件,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到;
根据所述第一检测结果和所述第二检测结果得到最终的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述待检测特征包含权限特征、意图特征、应用程序编程接口API特征和系统签名特征中至少一个。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一检测结果和所述第二检测结果得到最终的检测结果,包括:
将所述第一检测结果和所述第二检测结果求并集,得到最终的检测结果。
4.根据权利要求1所述的方法,其特征在于,所述分类预测模型的训练过程,包括:
获取多个软件样本,所述软件样本包括标注信息,所述标注信息用于指示所述软件样本为正常软件或者垃圾软件;
获取所述软件样本的待检测特征;
将所述软件样本的待检测特征输入LR特征提取器,获得第一输出;
将所述软件样本的待检测特征输入FFM特征提取器,获得第二输出;
将所述软件样本的待检测特征输入DNN特征提取器,获得第三输出;
将所述第一输出取对数后乘以预设第一权重得到的结果、所述第二输出取对数后乘以预设第二权重得到的结果、以及所述第三输出取对数后乘以预设第三权重得到的结果相加,再通过回归损失函数进行合并训练。
5.根据权利要求4所述的方法,其特征在于,所述获取所述软件样本的待检测特征,包括:对获取的所述软件样本的待检测特征进行数据清洗和特征筛选。
6.根据权利要求4所述的方法,其特征在于,所述FFM特征提取器对提取的交叉特征进行了归一化处理,所述归一化处理采用Sigomoid函数。
8.根据权利要求4所述的方法,其特征在于,所述DNN特征提取器的公式为:y3=hl+1,hl+1=f(Wlhl+bl),其中y3表示第三输出,hl+1表示当前层的输出,Wl表示上一层的权重矩阵,hl表示上一层隐藏层的权重激活值,bl表示上一层的权重偏差。
9.一种检测垃圾软件的装置,其特征在于,应用于电子设备,包括:
特征提取模块,用于从待检测软件中提取出待检测特征;
第一结果模块,用于利用预设规则对所述待检测特征进行检测,得到第一检测结果,所述第一检测结果用于指示所述待检测软件是否为垃圾软件;
第二结果模块,用于将所述待检测特征输入训练好的分类预测模型进行检测,得到第二检测结果,所述第二检测结果用于指示所述待检测软件是否为垃圾软件,其中,所述训练好的分类预测模型是由逻辑回归模型LR特征提取器、域分解机模型FFM特征提取器和深度神经网络模型DNN特征提取器提取的多种特征进行组合训练得到;
结果生成模块,用于根据所述第一检测结果和所述第二检测结果得到最终的检测结果。
10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210193533.0A CN114547616A (zh) | 2022-03-01 | 2022-03-01 | 检测垃圾软件的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210193533.0A CN114547616A (zh) | 2022-03-01 | 2022-03-01 | 检测垃圾软件的方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114547616A true CN114547616A (zh) | 2022-05-27 |
Family
ID=81661851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210193533.0A Pending CN114547616A (zh) | 2022-03-01 | 2022-03-01 | 检测垃圾软件的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114547616A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662638A (zh) * | 2022-09-06 | 2023-08-29 | 荣耀终端有限公司 | 数据采集方法及相关装置 |
-
2022
- 2022-03-01 CN CN202210193533.0A patent/CN114547616A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662638A (zh) * | 2022-09-06 | 2023-08-29 | 荣耀终端有限公司 | 数据采集方法及相关装置 |
CN116662638B (zh) * | 2022-09-06 | 2024-04-12 | 荣耀终端有限公司 | 数据采集方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113704014B (zh) | 日志获取系统、方法、电子设备及存储介质 | |
CN110114747B (zh) | 一种通知处理方法及电子设备 | |
CN110347269B (zh) | 一种空鼠模式实现方法及相关设备 | |
WO2021135707A1 (zh) | 机器学习模型的搜索方法及相关装置、设备 | |
CN110032307A (zh) | 一种应用图标的移动方法及电子设备 | |
WO2020259554A1 (zh) | 可进行学习的关键词搜索方法和电子设备 | |
CN110851067A (zh) | 屏幕显示模式的切换方法、装置及电子设备 | |
CN114070928B (zh) | 一种防误触的方法及电子设备 | |
CN111147667A (zh) | 一种熄屏控制方法及电子设备 | |
CN113992663B (zh) | 发送文件的方法、电子设备及可读存储介质 | |
CN114242037A (zh) | 一种虚拟人物生成方法及其装置 | |
CN115589051B (zh) | 充电方法和终端设备 | |
CN112651510A (zh) | 模型更新方法、工作节点及模型更新系统 | |
CN113934330A (zh) | 一种截屏方法及电子设备 | |
CN114005016A (zh) | 一种图像处理方法、电子设备、图像处理系统及芯片系统 | |
CN113467735A (zh) | 图像调整方法、电子设备及存储介质 | |
CN112256868A (zh) | 零指代消解方法、训练零指代消解模型的方法及电子设备 | |
CN113971271A (zh) | 一种指纹解锁的方法、装置、终端以及存储介质 | |
CN110058729B (zh) | 调节触摸检测的灵敏度的方法和电子设备 | |
CN114547616A (zh) | 检测垃圾软件的方法、装置及电子设备 | |
CN115543145A (zh) | 一种文件夹管理方法及装置 | |
CN114661258A (zh) | 自适应显示方法、电子设备及存储介质 | |
CN114089902A (zh) | 手势交互方法、装置及终端设备 | |
CN113506566B (zh) | 声音检测模型训练方法、数据处理方法以及相关装置 | |
CN113380240B (zh) | 语音交互方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |