CN110580171B - App分类方法、相关装置及产品 - Google Patents
App分类方法、相关装置及产品 Download PDFInfo
- Publication number
- CN110580171B CN110580171B CN201910874986.8A CN201910874986A CN110580171B CN 110580171 B CN110580171 B CN 110580171B CN 201910874986 A CN201910874986 A CN 201910874986A CN 110580171 B CN110580171 B CN 110580171B
- Authority
- CN
- China
- Prior art keywords
- feature vector
- target app
- app
- library
- development information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种APP分类方法、相关装置及产品,应用于电子设备,方法包括:获取目标APP的开发信息,开发信息包括以下至少一种:目标APP的当前申请权限、大小以及使用信息,使用信息包括目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;根据开发信息得到目标APP的特征向量;将特征向量输入到预先训练的应用分类器得到目标APP的分类结果。本申请实施例有利于提升APP分类的精确度。
Description
技术领域
本申请涉及电子技术领域,具体涉及一种APP分类方法、相关装置及产品。
背景技术
随着科技的发展,电子设备中安装着各种APP,在APP运行的过程中,因为本端内存有限,电子设备会对不同的APP进行不同的处理,此时,APP分类尤为重要,目前,市面上的一些电子设备支持应用程序APP分类功能。现有技术中,电子设备在进行分类时往往是通过网络搜索获取APP关键词、用户群体、日志信息等信息,再对上述信息进行分析分类,这样的分类方式,难以保证分类的精准性。
发明内容
本申请实施例提供了一种APP分类方法、相关装置及产品,以期拓展APP分类的机制,提升APP分类的精确性。
第一方面,本申请实施例提供一种应用程序APP分类方法,应用于电子设备,所述方法包括:
获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;
根据所述开发信息得到所述目标APP的特征向量;
将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。
第二方面,本申请实施例提供一种应用程序APP分类装置,应用于电子设备,包括处理单元和通信单元,其中,
所述处理单元,用于获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;以及用于通过所述通信单元传递开发信息信号,根据所述开发信息得到所述目标APP的特征向量;以及用于将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第二方面任一方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第二方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,电子设备首先获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源,其次,根据所述开发信息得到所述目标APP的特征向量,最后,将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。可见,本申请实施例的电子设备能够通过解析APP的开发信息获取特征向量,再采用分类器处理该特征向量,避免用户数据对APP分类造成影响,提高电子设备对应用程序APP分类的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种APP界面示意图;
图2是本申请实施例提供的一种APP分类方法的流程示意图;
图3是本申请实施例提供的另一种APP分类方法的流程示意图;
图4是本申请实施例提供的再一种APP分类方法的流程示意图;
图5是本申请实施例提供的一种电子设备的结构示意图;
图6是本申请实施例提供的一种APP分类装置的功能单元组成框图。
具体实施方式
下面对本申请实施例进行详细介绍。
APP分类技术是指能够对不同的APP进行类型划分的技术,在对APP进行分类后,可根据APP的类型,对不同的APP进行进程控制操作。示例性的,如图1所示,图1是本申请实施例提供的一种APP界面示意图,电子设备101为具备应用程序APP分类功能的设备,当电子设备在后台运行包括APP界面上展示的APP时,电子设备通过APP分类技术对APP进行分类后,可以根据该APP分类结果进行进程保活、APP等级划分等后续操作。
本申请实施例所涉及到的电子设备可以是具备APP分类能力的电子设备,该电子设备可以包括各种具有APP分类功能的飞行控制器、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(UserEquipment,UE),移动台(MobileStation,MS),电子设备(terminaldevice)等等。
本申请实施例提出一种应用程序APP分类方法,下面结合附图对本申请实施例进行详细介绍。
请参阅图2,图2是本申请实施例提供的一种APP分类方法的流程示意图,应用于电子设备,所述电子设备设置有窄带通信单元,如图2所示,本APP分类方法包括:
S201,电子设备获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源。
其中,so库是Linux下共享库,是应用程序层Java层和本地框架层Native层进行交互的库,很多游戏引擎、推荐算法都是so库,所述工具代码包jar包是封装好的工具代码,多媒体资源是指是指APP使用的图片,动画和声音文件等资源。
可见,本示例中,电子设备通过分析APP本身的数据或者使用的数据,可以更好的对APP的类型进行划分。
S202,所述电子设备根据所述开发信息得到所述目标APP的特征向量。
其中,当电子设备获取目标APP的开发信息为所述目标APP的当前申请权限、大小以及使用信息中的其中一种时,所述电子设备根据所述开发信息得到所述目标APP的特征向量的实现方式可以是:所述电子设备获取与所述开发信息对应的初始特征向量集或初始特征向量,所述初始特征向量集包括至少一个特征向量,所述至少一个特征向量包括至少一个参数,所述初始特征向量包括至少一个参数;所述电子设备根据所述开发信息对应的更新策略更新所述原始特征向量集或原始特征向量得到所述目标APP的特征向量,此处,不同的开发信息对应不同的原始特征向量集或原始特征向量以及更新策略。
其中,当电子设备获取目标APP的开发信息为所述目标APP的当前申请权限、大小以及使用信息中的至少两种时,所述电子设备根据所述开发信息得到所述目标APP的特征向量的实现方式可以是:所述电子设备根据所述开发信息的种类获取对应的至少两个原始特征向量信息,所述原始特征向量信息包括原始特征向量集或原始特征向量,所述原始特征向量集包括至少一个特征向量,所述特征向量包括至少一个参数,所述原始特征向量包括至少一个参数;所述电子设备根据所述开发信息更新所述至少两个原始特征向量信息;所述电子设备任意组合所述至少两个原始特征向量信息得到所述目标APP的特征向量。
可见,电子设备能够根据APP的开发信息得到目标APP的特征向量,提升APP分类的智能性。
S203,所述电子设备将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。
其中,预先训练的应用分类器可以是采用卷积神经网络训练得到的分类器。
可以看出,本申请实施例中,电子设备首先获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源,其次,根据所述开发信息得到所述目标APP的特征向量,最后,将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。可见,本申请实施例的电子设备能够通过解析APP的开发信息获取特征向量,再采用分类器处理该特征向量,避免用户数据对APP分类造成影响,提高电子设备对应用程序APP分类的准确性。
在一个可能的示例中,所述开发信息包括所述so库和所述jar包;所述电子设备根据所述开发信息得到所述目标APP的特征向量,包括:
所述电子设备获取预先配置的第一特征向量集,所述第一特征向量集包括多个第一特征向量,所述多个第一特征向量中每个第一特征向量包括第一参数和第二参数,所述第一参数和所述第二参数用于表征APP应用开发过程中所用到的so库和jar包;
所述电子设备更新所述第一特征向量集中包含所述so库和所述jar包的第一特征向量的值,得到更新后的第一特征向量集,所述更新后的第一特征向量集为所述目标APP的特征向量。
其中,所述电子设备更新所述第一特征向量集中包含所述so库和所述jar包的第一特征向量的值,得到更新后的第一特征向量集的实现方式可以是:所述电子设备获取参考数据库,所述参考数据库包括特定数量的参考so库和参考jar包,所述参考数据库为与所述第一特征向量集对应的数据库;将所述so库与所述参考so库一一比对,若所述so库与所述参考so库匹配,则更新所述第一特征向量集中匹配成功的so库对应的向量值,得到第一中间特征向量集;将所述jar包与所述参考jar包一一比对,若所述jar包与所述参考jar包匹配,则更新所述第一中间特征向量集中匹配成功jar包对应的向量值,得到所述更新后的第一特征向量集。需要说明的是,此处,也可以先将所述jar包与所述参考jar包一一比对,若所述jar包与所述参考jar包匹配,则更新所述第一中间特征向量集中匹配成功jar包对应的向量值,得到所述第一中间特征向量集,再将所述so库与所述参考so库一一比对,若所述so库与所述参考so库匹配,则更新所述第一中间特征向量集中匹配成功的so库对应的向量值,得到所述更新后的第一特征向量集,原理相同,不作具体限定。
举例来说,所述参考数据库为APP应用开发中最常用的100个so库和jar包组成的数据库,所述参考数据库对应的第一特征向量集为该100个so库和jar包构成的一个100维度的特征向量集,默认的向量值可以全为0,将所述so库与所述参考so库一一比对,若所述so库与所述参考so库匹配,则更新所述第一特征向量集中匹配成功的so库对应的向量值为1,得到第一中间特征向量集,再将所述jar包与所述参考jar包一一比对,若所述jar包与所述参考jar包匹配,则更新所述第一中间特征向量集中匹配成功jar包对应的向量值为1,得到所述目标APP的特征向量。
可见,本示例中,电子设备能够根据APP使用的so库和jar包得到APP的分类结果,使得APP分类更加准确。
在一个可能的示例中,所述开发信息包括所述目标APP的当前申请权限;所述电子设备根据所述开发信息得到所述目标APP的特征向量,包括:
所述电子设备获取预先配置的第二特征向量集,所述第二特征向量集包括多个第二特征向量,所述多个第二特征向量中每个第二特征向量包括第三参数,所述第三参数用于表征本端定义的、应用可申请的权限;
所述电子设备更新所述第二特征向量集中包含所述当前申请权限的第二特征向量的值,得到更新后的第二特征向量集,所述更新后的第二特征向量集为所述目标APP的特征向量。
其中,所述电子设备更新所述第二特征向量集中包含所述当前申请权限的第二特征向量,得到更新后的第二特征向量集的实现方式可以是:所述电子设备获取参考权限,所述参考权限为与所述第二特征向量集对应的权限,所述参考权限为本端定义的、应用可申请的权限;所述电子设备判断所述当前申请权限是否为所述参考权限中的一种权限;若所述当前申请权限为所述参考权限中的一种权限,则更新所述第二特征向量集中所述当前申请权限对应的向量值得到所述更新后的第二特征向量集。
举例来说,所述第二特征向量集中所有向量的初始值均为0,若所述当前申请权限为所述参考权限中的一种权限,则更新所述第二特征向量集中所述当前申请权限对应的向量值为1,得到所述目标APP的特征向量。
可见,本示例中,电子设备能够根据APP的当前申请权限得到APP的分类结果,提高APP分类的灵活性。
在一个可能的示例中,所述开发信息包括所述目标APP的大小;所述电子设备根据所述开发信息得到所述目标APP的特征向量,包括:
所述电子设备获取预先配置的第三特征向量,所述第三特征向量包括第四参数,所述第四参数用于表征所述目标APP的大小;
所述电子设备根据预设的函数获取所述大小对应的目标向量值,更新所述第四参数的向量值为所述目标向量值,得到更新后的第三特征向量,所述更新后的第三特征向量为所述目标APP的特征向量。
其中,所述预设的函数为:其中,x为文件大小,单位为GB,y为向量值,a为系数,可以是0到1之间的任意数。举例来说,所述电子设备获取预先配置的第三特征向量,所述第三特征向量包括第四参数,所述第四参数用于表征所述目标APP的大小,初始量为0,当a为0.5,所述目标APP的大小为0.65GB时,第四参数对应的向量值为0.325,即更新后的第三特征向量对应的向量值为0.325。
可见,本示例中,电子设备能够根据APP的大小得到APP的分类结果,提高APP分类的针对性。
在一个可能的示例中,所述开发信息包括所述目标APP使用的多媒体资源;所述电子设备根据所述开发信息得到所述目标APP的特征向量,包括:
所述电子设备获取预先配置的第四特征向量,所述第四特征向量包括第五参数,所述第五参数用于表征所述多媒体资源对应的文件数量,所述多媒体资源包括图片文件、动画文件和声音文件;
所述电子设备获取所述多媒体资源中的文件数量值,更新所述第五参数的向量值为所述文件数量值,得到更新后的第四特征向量,所述更新后的第四特征向量为所述目标APP的特征向量。
其中,所述预先配置的第四特征向量的向量初始值可以是0,举例来说,所述预先配置的第四特征向量的向量初始值为0,当检测所述APP包括1个图片文件、2个动画文件和3个声音文件时,更新所述第四特征向量的向量初始值为6,即更新后的更新后的第四特征对应的向量值为6。
可见,本示例中,电子设备能够根据APP使用的多媒体资源得到APP的分类结果,提高APP分类的可靠性。
在一个可能的示例中,所述电子设备所述获取目标APP的开发信息,包括:
所述电子设备获取所述目标APP的应用程序安装包APK包;
所述电子设备对所述APK包进行解析得到所述目标APP的开发信息。
其中,所述电子设备对所述APK包进行解析得到所述目标APP的开发信息是APP打包的逆向过程,通过解析,可以获取APP开发过程中使用的so库、jar包、图片、动画等资源。
可见,本示例中,电子设备能够通过解析APP的APK包得到APP的开发信息,提高APP开发信息获取的智能性。
在一个可能的示例中,所述电子设备将所述特征向量输入到应用分类器得到分类结果之前,所述方法还包括:
所述电子设备采用卷积神经网络进行模型训练,得到所述应用分类器。
其中,所述电子设备采用卷积神经网络进行模型训练,得到所述应用分类器的实现方式可以是:将预先配置的第一特征向量集作为输入向量;采用3种不同大小的窗口,分别为3×k、4×k、5×k,同一窗口大小设置100个卷积核,则每个卷积核会产生一个fl维的卷积特征向量(fl=l-2、l-3或l-4),共300个卷积特征向量;采用Max-Pooling-Over-Time池化策略,即每个卷积特征向量只保留最大的那个值,拼接对所有卷积特征向量的池化结果得到一个300维的特征向量;采用“全连接层+Softmax”作为输出层,全连接层中采用Dropout机制防止过拟合。
可见,本示例中,电子设备能够采用卷积神经网络进行模型训练,得到应用分类器,提升分类结果输出的智能性。
在一个可能的示例中,所述电子设备采用卷积神经网络训练,得到所述应用分类器,包括:
所述电子设备采用十折交叉验证检测分类准确度和分类误差;
所述电子设备当所述分类误差小于预设阈值时,结束训练。
其中,十折交叉验证10-foldcross-validation,用来测试算法准确性,将分类数据分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率),10次的结果的正确率(或差错率)的平均值作为对算法精度的估计。
可见,本示例中,电子设备采用十折交叉法提升分类准确度和分类误差,提升APP分类的准确性。
与上述图2所示的实施例一致的,请参阅图3,图3是本申请实施例提供的另一种APP分类方法的流程示意图,如图所示,本APP分类方法包括:
S301,电子设备获取目标APP的应用程序安装包APK包;
S302,所述电子设备对所述APK包进行解析得到所述目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;
S303,所述电子设备根据所述开发信息得到所述目标APP的特征向量;
S304,所述电子设备将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。
可以看出,本申请实施例中,电子设备首先获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源,其次,根据所述开发信息得到所述目标APP的特征向量,最后,将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。可见,本申请实施例的电子设备能够通过解析APP的开发信息获取特征向量,再采用分类器处理该特征向量,避免用户数据对APP分类造成影响,提高电子设备对应用程序APP分类的准确性。
与上述图2所示的实施例一致的,请参阅图4,图4是本申请实施例提供的再一种APP分类方法的流程示意图,如图所示,本APP分类方法包括:
S401,电子设备获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;
S402,所述电子设备获取与所述开发信息对应的初始特征向量集或初始特征向量,所述初始特征向量集包括至少一个特征向量,所述至少一个特征向量包括至少一个参数,所述初始特征向量包括至少一个参数;
S403,所述电子设备根据所述开发信息对应的更新策略更新所述原始特征向量集或原始特征向量得到所述目标APP的特征向量;
S404,所述电子设备采用卷积神经网络进行模型训练,得到应用分类器;
S405,所述电子设备将所述特征向量输入到所述应用分类器得到所述目标APP的分类结果。
可以看出,本申请实施例中,电子设备首先获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源,其次,根据所述开发信息得到所述目标APP的特征向量,最后,将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。可见,本申请实施例的电子设备能够通过解析APP的开发信息获取特征向量,再采用分类器处理该特征向量,避免用户数据对APP分类造成影响,提高电子设备对应用程序APP分类的准确性。
可见,本示例中,电子设备能够采用卷积神经网络进行模型训练,得到应用分类器,提升分类结果输出的智能性。
与上述图2、图3以及图4所示的实施例一致的,请参阅图5,图5是本申请实施例提供的一种电子设备500的结构示意图,如图所示,所述电子设备500包括应用处理器510、存储器520、通信接口530以及一个或多个程序521,其中,所述一个或多个程序521被存储在上述存储器520中,并且被配置由上述应用处理器510执行,所述一个或多个程序521包括用于执行以下步骤的指令;
获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;
根据所述开发信息得到所述目标APP的特征向量;
将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。
可以看出,本申请实施例中,电子设备首先获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源,其次,根据所述开发信息得到所述目标APP的特征向量,最后,将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。可见,本申请实施例的电子设备能够通过解析APP的开发信息获取特征向量,再采用分类器处理该特征向量,避免用户数据对APP分类造成影响,提高电子设备对应用程序APP分类的准确性。
在一个可能的示例中,所述开发信息包括所述so库和所述jar包;在所述根据所述开发信息得到所述目标APP的特征向量方面,所述程序中的指令具体用于执行以下操作:获取预先配置的第一特征向量集,所述第一特征向量集包括多个第一特征向量,所述多个第一特征向量中每个第一特征向量包括第一参数和第二参数,所述第一参数和所述第二参数用于表征APP应用开发过程中所用到的so库和jar包;
更新所述第一特征向量集中包含所述so库和所述jar包的第一特征向量的值,得到更新后的第一特征向量集,所述更新后的第一特征向量集为所述目标APP的特征向量。
在一个可能的示例中,所述开发信息包括所述目标APP的当前申请权限;在所述根据所述开发信息得到所述目标APP的特征向量方面,所述程序中的指令具体用于执行以下操作:获取预先配置的第二特征向量集,所述第二特征向量集包括多个第二特征向量,所述多个第二特征向量中每个第二特征向量包括第三参数,所述第三参数用于表征本端定义的、应用可申请的权限;
更新所述第二特征向量集中包含所述当前申请权限的第二特征向量的值,得到更新后的第二特征向量集,所述更新后的第二特征向量集为所述目标APP的特征向量。
在一个可能的示例中,所述开发信息包括所述目标APP的大小,在所述根据所述开发信息得到所述目标APP的特征向量方面,所述程序中的指令具体用于执行以下操作:获取预先配置的第三特征向量,所述第三特征向量包括第四参数,所述第四参数用于表征所述目标APP的大小;
根据预设的函数获取所述大小对应的目标向量值,更新所述第四参数的向量值为所述目标向量值,得到更新后的第三特征向量,所述更新后的第三特征向量为所述目标APP的特征向量。
在一个可能的示例中,所述开发信息包括所述目标APP使用的多媒体资源;在根据所述开发信息得到所述目标APP的特征向量方面,所述程序中的指令具体用于执行以下操作:获取预先配置的第四特征向量,所述第四特征向量包括第五参数,所述第五参数用于表征所述多媒体资源对应的文件数量,所述多媒体资源包括图片文件、动画文件和声音文件;
获取所述多媒体资源中的文件数量值,更新所述第五参数的向量值为所述文件数量值,得到更新后的第四特征向量,所述更新后的第四特征向量为所述目标APP的特征向量。
在一个可能的示例中,在获取目标APP的开发信息方面,所述程序中的指令具体用于执行以下操作:
获取所述目标APP的应用程序安装包APK包;
对所述APK包进行解析得到所述目标APP的开发信息。
在一个可能的示例中,所述程序还包括用于执行以下操作的指令:所述将所述特征向量输入到应用分类器得到分类结果之前,采用卷积神经网络进行模型训练,得到所述应用分类器。
在一个可能的示例中,在采用卷积神经网络训练,得到所述应用分类器方面,所述程序中的指令具体用于执行以下操作:采用十折交叉检测分类准确度和分类误差;
当所述分类误差小于预设阈值时,结束训练。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件单元。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图6,图6是本申请实施例中所涉及的APP分类装置600的功能单元组成框图。该APP分类装置600应用于电子设备,包括处理单元601和通信单元602,其中,
所述处理单元601,用于获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;以及用于通过所述通信单元传递开发信息信号,根据所述开发信息得到所述目标APP的特征向量;以及用于将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。
其中,所述APP分类600还可以包括存储单元603,用于存储电子设备的程序代码和数据。所述处理单元601可以是处理器,所述通信单元602可以是触控显示屏或者收发器,存储单元603可以是存储器。
可以看出,本申请实施例中,电子设备首先获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源,其次,根据所述开发信息得到所述目标APP的特征向量,最后,将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果。可见,本申请实施例的电子设备能够通过解析APP的开发信息获取特征向量,再采用分类器处理该特征向量,避免用户数据对APP分类造成影响,提高电子设备对应用程序APP分类的准确性。
在一个可能的示例中,所述开发信息包括所述so库和所述jar包;在所述根据所述开发信息得到所述目标APP的特征向量方面,所述处理单元601具体用于:获取预先配置的第一特征向量集,所述第一特征向量集包括多个第一特征向量,所述多个第一特征向量中每个第一特征向量包括第一参数和第二参数,所述第一参数和所述第二参数用于表征APP应用开发过程中所用到的so库和jar包;
更新所述第一特征向量集中包含所述so库和所述jar包的第一特征向量的值,得到更新后的第一特征向量集,所述更新后的第一特征向量集为所述目标APP的特征向量。
在一个可能的示例中,所述开发信息包括所述目标APP的当前申请权限;在所述根据所述开发信息得到所述目标APP的特征向量方面,所述处理单元601具体用于:获取预先配置的第二特征向量集,所述第二特征向量集包括多个第二特征向量,所述多个第二特征向量中每个第二特征向量包括第三参数,所述第三参数用于表征本端定义的、应用可申请的权限;
更新所述第二特征向量集中包含所述当前申请权限的第二特征向量的值,得到更新后的第二特征向量集,所述更新后的第二特征向量集为所述目标APP的特征向量。
在一个可能的示例中,所述开发信息包括所述目标APP的大小,在所述根据所述开发信息得到所述目标APP的特征向量方面,所述处理单元601具体用于:获取预先配置的第三特征向量,所述第三特征向量包括第四参数,所述第四参数用于表征所述目标APP的大小;
根据预设的函数获取所述大小对应的目标向量值,更新所述第四参数的向量值为所述目标向量值,得到更新后的第三特征向量,所述更新后的第三特征向量为所述目标APP的特征向量。
在一个可能的示例中,所述开发信息包括所述目标APP使用的多媒体资源;在根据所述开发信息得到所述目标APP的特征向量方面,所述处理单元601具体用于:获取预先配置的第四特征向量,所述第四特征向量包括第五参数,所述第五参数用于表征所述多媒体资源对应的文件数量,所述多媒体资源包括图片文件、动画文件和声音文件;
获取所述多媒体资源中的文件数量值,更新所述第五参数的向量值为所述文件数量值,得到更新后的第四特征向量,所述更新后的第四特征向量为所述目标APP的特征向量。
在一个可能的示例中,在获取目标APP的开发信息方面,所述处理单元601具体用于:获取所述目标APP的应用程序安装包APK包;
对所述APK包进行解析得到所述目标APP的开发信息。
在一个可能的示例中,所述处理单元601将所述特征向量输入到应用分类器得到分类结果之前,还用于:采用卷积神经网络进行模型训练,得到所述应用分类器。
在一个可能的示例中,在采用卷积神经网络训练,得到所述应用分类器方面,所述处理单元601具体用于:采用十折交叉检测分类准确度和分类误差;
当所述分类误差小于预设阈值时,结束训练。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-OnlyMemory,简称:ROM)、随机存取器(英文:RandomAccessMemory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有该变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种应用程序APP分类方法,其特征在于,应用于电子设备,所述方法包括:
获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;
根据所述开发信息得到所述目标APP的特征向量;
将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果;
其中,若所述开发信息包括所述so库和所述jar包,则所述根据所述开发信息得到所述目标APP的特征向量,包括:
获取预先配置的第一特征向量集,所述第一特征向量集包括多个第一特征向量,所述多个第一特征向量中每个第一特征向量包括第一参数和第二参数,所述第一参数和所述第二参数用于表征APP应用开发过程中所用到的so库和jar包;获取参考数据库,所述参考数据库包括特定数量的参考so库和参考jar包,所述参考数据库为与所述第一特征向量集对应的数据库;将所述so库与所述参考so库一一比对,若所述so库与所述参考so库匹配,则更新所述第一特征向量集中匹配成功的so库对应的向量值,得到第一中间特征向量集;将所述jar包与所述参考jar包一一比对,若所述jar包与所述参考jar包匹配,则更新所述第一中间特征向量集中匹配成功jar包对应的向量值,得到更新后的第一特征向量集,所述更新后的第一特征向量集为所述目标APP的特征向量。
2.根据权利要求1所述的方法,其特征在于,若所述开发信息包括所述目标APP的当前申请权限,则所述根据所述开发信息得到所述目标APP的特征向量,包括:
获取预先配置的第二特征向量集,所述第二特征向量集包括多个第二特征向量,所述多个第二特征向量中每个第二特征向量包括第三参数,所述第三参数用于表征本端定义的、应用可申请的权限;
更新所述第二特征向量集中包含所述当前申请权限的第二特征向量的值,得到更新后的第二特征向量集,所述更新后的第二特征向量集为所述目标APP的特征向量。
3.根据权利要求1所述的方法,其特征在于,若所述开发信息包括所述目标APP的大小,则所述根据所述开发信息得到所述目标APP的特征向量,包括:
获取预先配置的第三特征向量,所述第三特征向量包括第四参数,所述第四参数用于表征所述目标APP的大小;
根据预设的函数获取所述大小对应的目标向量值,更新所述第四参数的向量值为所述目标向量值,得到更新后的第三特征向量,所述更新后的第三特征向量为所述目标APP的特征向量。
4.根据权利要求1所述的方法,其特征在于,若所述开发信息包括所述目标APP使用的多媒体资源,则所述根据所述开发信息得到所述目标APP的特征向量,包括:
获取预先配置的第四特征向量,所述第四特征向量包括第五参数,所述第五参数用于表征所述多媒体资源对应的文件数量,所述多媒体资源包括图片文件、动画文件和声音文件;
获取所述多媒体资源中的文件数量值,更新所述第五参数的向量值为所述文件数量值,得到更新后的第四特征向量,所述更新后的第四特征向量为所述目标APP的特征向量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取目标APP的开发信息,包括:
获取所述目标APP的应用程序安装包APK包;
对所述APK包进行解析得到所述目标APP的开发信息。
6.根据权利要求5所述的方法,其特征在于,所述将所述特征向量输入到应用分类器得到分类结果之前,所述方法还包括:
采用卷积神经网络进行模型训练,得到所述应用分类器。
7.根据权利要求6所述的方法,其特征在于,所述采用卷积神经网络训练,得到所述应用分类器,包括:
采用十折交叉检测分类准确度和分类误差;
当所述分类误差小于预设阈值时,结束训练。
8.一种APP分类装置,其特征在于,应用于电子设备,包括处理单元和通信单元,其中,
所述处理单元,用于获取目标APP的开发信息,所述开发信息包括以下至少一种:所述目标APP的当前申请权限、大小以及使用信息,所述使用信息包括所述目标APP使用的共享库so库、工具代码包jar包以及多媒体资源;以及用于通过所述通信单元传递开发信息信号,根据所述开发信息得到所述目标APP的特征向量;以及用于将所述特征向量输入到预先训练的应用分类器得到所述目标APP的分类结果;
其中,若所述开发信息包括所述so库和所述jar包,则在所述根据所述开发信息得到所述目标APP的特征向量方面,所述处理单元用于:
获取预先配置的第一特征向量集,所述第一特征向量集包括多个第一特征向量,所述多个第一特征向量中每个第一特征向量包括第一参数和第二参数,所述第一参数和所述第二参数用于表征APP应用开发过程中所用到的so库和jar包;获取参考数据库,所述参考数据库包括特定数量的参考so库和参考jar包,所述参考数据库为与所述第一特征向量集对应的数据库;将所述so库与所述参考so库一一比对,若所述so库与所述参考so库匹配,则更新所述第一特征向量集中匹配成功的so库对应的向量值,得到第一中间特征向量集;将所述jar包与所述参考jar包一一比对,若所述jar包与所述参考jar包匹配,则更新所述第一中间特征向量集中匹配成功jar包对应的向量值,得到更新后的第一特征向量集,所述更新后的第一特征向量集为所述目标APP的特征向量。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910874986.8A CN110580171B (zh) | 2019-09-17 | 2019-09-17 | App分类方法、相关装置及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910874986.8A CN110580171B (zh) | 2019-09-17 | 2019-09-17 | App分类方法、相关装置及产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110580171A CN110580171A (zh) | 2019-12-17 |
CN110580171B true CN110580171B (zh) | 2023-06-09 |
Family
ID=68811428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910874986.8A Active CN110580171B (zh) | 2019-09-17 | 2019-09-17 | App分类方法、相关装置及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110580171B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340344B (zh) * | 2020-02-20 | 2022-04-15 | 支付宝(杭州)信息技术有限公司 | 类型确定方法及装置 |
CN112100386B (zh) * | 2020-11-12 | 2021-02-05 | 北京云真信科技有限公司 | 目标类型app的确定方法、电子设备和介质 |
CN113010671B (zh) * | 2021-02-22 | 2022-04-29 | 杭州西湖数据智能研究院 | 一种app分类系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967482A (zh) * | 2017-10-24 | 2018-04-27 | 广东中科南海岸车联网技术有限公司 | 图标识别方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101203847B (zh) * | 2005-03-11 | 2010-05-19 | 雅虎公司 | 用于管理列表的系统和方法 |
US9152694B1 (en) * | 2013-06-17 | 2015-10-06 | Appthority, Inc. | Automated classification of applications for mobile devices |
GB2542173B (en) * | 2015-09-10 | 2019-08-14 | Openwave Mobility Inc | Method and apparatus for categorising a download of a resource |
CN105550583B (zh) * | 2015-12-22 | 2018-02-13 | 电子科技大学 | 基于随机森林分类方法的Android平台恶意应用检测方法 |
CN106845240A (zh) * | 2017-03-10 | 2017-06-13 | 西京学院 | 一种基于随机森林的Android恶意软件静态检测方法 |
-
2019
- 2019-09-17 CN CN201910874986.8A patent/CN110580171B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967482A (zh) * | 2017-10-24 | 2018-04-27 | 广东中科南海岸车联网技术有限公司 | 图标识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于支持向量机的Android恶意软件静态检测技术的研究;苗发彪;王晴;;网络空间安全(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110580171A (zh) | 2019-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062495B (zh) | 机器学习方法及相关装置 | |
US10943091B2 (en) | Facial feature point tracking method, apparatus, storage medium, and device | |
EP3951646B1 (en) | Image recognition network model training method, image recognition method and device | |
EP3944147A1 (en) | Target detection method, model training method, device, apparatus and storage medium | |
CN110580171B (zh) | App分类方法、相关装置及产品 | |
US20200134506A1 (en) | Model training method, data identification method and data identification device | |
CN110929807B (zh) | 图像分类模型的训练方法、图像分类方法及装置 | |
CN111078479A (zh) | 一种内存检测模型训练的方法、内存检测的方法及装置 | |
US12047395B2 (en) | Cybersecurity investigation tools utilizing information graphs | |
CN108229673B (zh) | 卷积神经网络的处理方法、装置和电子设备 | |
US20230281310A1 (en) | Systems and methods of uncertainty-aware self-supervised-learning for malware and threat detection | |
US20210014124A1 (en) | Feature-based network embedding | |
CN114722937B (zh) | 一种异常数据检测方法、装置、电子设备和存储介质 | |
CN113190646B (zh) | 一种用户名样本的标注方法、装置、电子设备及存储介质 | |
CN111447107A (zh) | 网络状态确定方法、装置、存储介质及电子设备 | |
CN117616424A (zh) | 用于平衡权重中的稀疏性以用于加速深度神经网络的系统和方法 | |
CN114692889A (zh) | 用于机器学习算法的元特征训练模型 | |
EP4354348A1 (en) | Sparsity processing on unpacked data | |
WO2020258509A1 (zh) | 终端设备异常访问的隔离方法和装置 | |
CN110069997B (zh) | 场景分类方法、装置及电子设备 | |
KR102192461B1 (ko) | 불확정성을 모델링할 수 있는 뉴럴네트워크 학습 장치 및 방법 | |
CN115629930A (zh) | 基于dsp系统的故障检测方法、装置、设备及存储介质 | |
US20230041338A1 (en) | Graph data processing method, device, and computer program product | |
CN115314239A (zh) | 基于多模型融合的隐匿恶意行为的分析方法和相关设备 | |
US11544620B2 (en) | System and method for context-based training of a machine learning model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |