CN104182470A - 一种基于svm的移动终端应用分类系统和方法 - Google Patents

一种基于svm的移动终端应用分类系统和方法 Download PDF

Info

Publication number
CN104182470A
CN104182470A CN201410361685.2A CN201410361685A CN104182470A CN 104182470 A CN104182470 A CN 104182470A CN 201410361685 A CN201410361685 A CN 201410361685A CN 104182470 A CN104182470 A CN 104182470A
Authority
CN
China
Prior art keywords
application
data
mobile terminal
svm
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410361685.2A
Other languages
English (en)
Other versions
CN104182470B (zh
Inventor
孙知信
谷华
宫婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DRAGONFLY AGRICULTURAL RESEARCH INSTITUTE (JIANGSU) Co.,Ltd.
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201410361685.2A priority Critical patent/CN104182470B/zh
Publication of CN104182470A publication Critical patent/CN104182470A/zh
Application granted granted Critical
Publication of CN104182470B publication Critical patent/CN104182470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明公开了一种基于SVM的移动终端应用分类系统和方法,该系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成;终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,包括电量、流量、权限开放情况、测试时延、丢包率、延时抖动等作为应用分类的基础;数据类型指标模块提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分,并且为每一个采集到的数据按照分类作用的程度提供权重值;基于SVM的分类模块将处理后的终端数据利用向量机实现最终的分类;本发明为动态的应用分类机制,分类的种类在服务器端能动态的控制。

Description

一种基于SVM的移动终端应用分类系统和方法
技术领域
本发明涉及一种基于SVM的移动终端应用分类系统和方法,属于移动通讯技术领域。
背景技术
在全球智能终端发展迅猛潮流和移动应用传播日益广泛的今天,移动终端上的应用无论从数量水平还是功能水平上都有了很大的提高。但是随着移动终端应用地增多,用户对移动终端应用地管理就显得不能得心应手。通常的移动终端都提供了应用程序分类的功能,对于移动终端出厂定制的应用程序已经被分类完成,而对于用户在使用过程中获取的其他应用程序,例如:用户从互联网上面下载的自己喜欢的应用程序,却只能在安装过程中由用户进行人工指定分类,由于对应用程序本身应该所属的分类的认识有误,会造成软件被安装到了不恰当的分类中。所以对于移动终端应用分类前需要合理的分析和判断,才能将应用做出准确的分类。当前,已存在一些很多移动终端应用分类技术,包括1.利用移动终端所附带的Manifest文件,获取Manifest文件包含的权限许可标识,进而对比许可标识分类表来获取对应的分类。而这种分类方法操作简单,分类结果存在很大的不可靠性。由于应用的分类完全由Manifest文件来控制,一旦Manifest文件是被更改过的,对应的应用分类也就随之改变,很容易造成分类错误。2.一种基于功耗的应用分类方法,移动终端启动飞行模式,保持屏幕常亮,获取并记录电池的初始电压和初始时间,打开被测应用后每隔预设时间获取一次电池电压及时间,并判断当前的时间是否为被测应用的功耗稳定时间点;若是,则记录当前的电池电压和时间;根据当前的电池电压和时间,初始电压和初始时间计算出被测应用的功耗值,根据该功耗值对被测应用进行功耗级别分类。但是由于是以功耗值的大小对应用进行分类,这种分类方法还是有一定的局限性,将应用的分类完全由功耗来决定,虽然易于操作,但分类效果不是非常好。3.移动终端连接应用商店服务器,获取并存储应用商店服务器提供的应用类别与应用特征数据库。移动终端分析应用附带的配置文件,获取配置文件包含的特征信息。将获取的特征信息和应用类别与应用特征数据库中存储的特征信息比对,根据比对结果将应用显示到所属应用类别文件夹中,实现应用的自动分类,但是这种分类方法也需要依据应用的配置文件包含的特征信息,并且这种分类方法影响了分类结果的准确性。而本发明能够很好地解决上面的问题。
发明内容
本发明目的在于解决了针对当前移动终端应用种类繁多,对用户的使用和应用的管理产生极大不便的问题,提出了一种基于SVM(即:支持向量机)的移动终端应用分类方法和系统。
本发明解决其技术问题所采取的技术方案是:本发明提供一种基于SVM(即:支持向量机)的移动终端应用分类方法和系统,该系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成。终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,包括电量、流量、权限开放情况、测试时延、丢包率、延时抖动等作为应用分类的基础。数据类型指标模块是提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分。并且为每一个采集到的数据按照分类作用的程度提供权重值。基于SVM的分类模块将处理后的终端数据利用向量机进行最终的分类。
本发明采用移动应用特征识别分类技术,是基于多种类型的移动终端应用,结合现有的特征识别和分类技术,支持向量机技术,对移动应用进行特征识别并实现聚类,从而将现有的智能终端移动应用划分为不同业务类型。本发明以即时通讯为主的带来信令影响的业务应用、以浏览类为主的与传统业务类似的业务应用、以流媒体、下载为主的带来流量影响的业务。在移动应用是属于某一测试的前提下,对移动应用进行分类。
本发明还提供一种基于SVM的移动终端应用分类系统的实现方法,该方法包括如下步骤:
步骤1:移动终端在采集模块采集被测试应用软硬件消耗数据之前,需要确保测试时长,测试内容都必须是在同一指标下。确保所有测试应用的在测试基本消耗数据时都在同一条件下。
步骤2:移动终端在测试前提条件下通过采集模块采集应用的各项基本软硬件消耗数据,再由数据发送模块将采集数据发送到服务端。
步骤3:服务端通过数据接收模块从移动终端获取基本的测试应用的采集数据,并发送到数据存储中心。
步骤4:数据中心主要保存着所有已被测试应用的基本消耗数据,所以对于第一次测试的应用可以直接将测试的消耗数据存储到数据存储中心,对于在数据中心存在对当前测试应用的历史记录则将新旧记录通过2:8的原则(即:原有测试记录数据的占8,新的测试记录数据的占2的比例)替换原有的数据记录。
步骤5:将数据中心最新的被测试应用的测试数据提取出来,而且需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内,再转换成测试应用的特征数据记录文件,最后发送到SVM分类中心。
步骤6:在SVM分类模块用于分类测试应用的采集数据之前,需要定义一个类库,用于存储已分类的应用的特征数据。所以创建一个特征类库文件。
步骤7:SVM分类模块通过特征库文件和新采集的应用测试记录文件得出应用的类型,最后将应用类型通过服务器端的发送模块发送到移动终端。
步骤8:移动终端接收模块获取服务器端的运行结果,最终给测试应用分类。
有益效果:
1、本发明是基于SVM的应用分类,构造移动应用的分类向量机,采用移动终端应用的软硬件消耗数据对应用分类。
2、本发明在服务器端增加数据存储中心,可使移动终端的新旧软硬件消耗数据通过数据存储中心整合,形成更合理的测试数据来提高分类的准确度。
3、本发明为动态的应用分类机制,分类的种类在服务器端能动态的控制。
附图说明
图1为本发明的方法流程图。
图2为本发明的系统结构示意图。
图3为本发明SVM工作原理图。
具体实施方式
下面结合说明书附图对本发明作进一步地详细说明。
如图2和图3所示,本发明提供一种基于SVM的移动终端应用分类系统,该系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成。终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,包括电量、流量、权限开放情况、测试时延、丢包率、延时抖动等作为应用分类的基础。数据类型指标模块是提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分。并且为每一个采集到的数据按照分类作用的程度提供权重值。基于SVM的分类模块将处理后的终端数据利用向量机进行最终的分类。
本发明采用移动应用特征识别分类技术,是基于多种类型的移动终端应用,结合现有的特征识别和分类技术,支持向量机技术,对移动应用进行特征识别并实现聚类,从而将现有的智能终端移动应用划分为不同业务类型。本发明以即时通讯为主而带来信令影响的业务应用、以浏览类为主而与传统业务类似的业务应用、以流媒体、下载为主的带来流量影响的业务。在移动应用是属于某一测试的前提下,对移动应用进行分类。
本发明的具体实施方式进一步包括如下:
1.客户端和服务器端的模型
本发明客户端负责被测试应用的软硬件消耗数据的采集和最终的分类结果显示,采集的数据交由服务器进行处理,包括数据中心新旧数据创建和合并替换,并进行归一化处理,分类的主要核心是使用SVM的支持向量技术,利用预先创建的分类特征文件,对测试数据分类,分类特征文件则是在整个分类系统分类高准确性的核心,需要通过测试大量各类不同的优秀应用获取的基本消耗数据来创建,保证了分类的准确度和对未来移动应用的友好性提供指导性的支持。
2.SVM的分类模块
本发明为了取得理想的分类结果,采用以径向基为核函数的SVM分类模型,并用交叉验证法对模型参数进行优化。将测试得到的移动应用的耗电量、软硬件消耗量、隐私安全等基本数据作为模型的特征输入值,将大量的测试数据作为训练集,由于这些参数值不是同一量纲,因此在进行训练之前,需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内。然后对支持向量机进行训练,用得到的模型对实时监测的数据进行分类,模型建立的整体流程如图所示。
因为移动应用种类的数目有限且可数,适合先采用静态分类方法。按照现有的移动应用业务不同,预先分为下面五类应用:网络浏览器类应用,即时通信类应用,社交网络、信息管理类应用,音视频分享类应用,游戏类应用。这样也能方便移动应用业务的拓展。对需要分析的移动应用可以使用向量机的分类算法,划分到上述的几大类的应用当中。
本发明为了识别应用的分类,需要先定义一个类库,用于存储已分类的应用的特征数据。所以创建一个特征类库文件。
文件格式:
[label] [index1]:[value1] [index2]:[value2]...
[label] [index1]:[value1] [index2]:[value2]...
一行一条记录数据,如:
+1 1:0.708 2:1 3:1 4:0.320 5:0.105 6:1
label或者说是class,就是要分类的种类,都设定为整数。
index是有顺序的索引,通常是连续的整数。
value就是用来测试的数据,都是一堆实数。
在本发明中label代表移动应用的分类如上所示,预分为五类,用各种不同的整数代表不同的种类,value则代表对每个应用测试所得的数据,将这些准备的特征数据生成model文件,则可用于对新输入的数据进行预测数据的类别。
综上所述,本发明基于SVM的应用分类,构造移动应用的分类向量机,采用移动终端应用的软硬件消耗数据对应用分类;本发明在服务器端增加数据存储中心,可使移动终端的新旧软硬件消耗数据通过数据存储中心整合,形成更合理的测试数据来提高分类的准确度;本发明为动态的应用分类机制,分类的种类在服务器端能动态的控制。
如图1所示,本发明还提供一种基于SVM的移动终端应用分类系统的实现方法,该方法包括如下步骤:
步骤1:移动终端在采集模块采集被测试应用软硬件消耗数据之前,需要确保测试时长,测试内容都必须是在同一指标下。确保所有测试应用的在测试基本消耗数据时都在同一条件下。
步骤2:移动终端在测试前提条件下通过采集模块采集应用的各项基本软硬件消耗数据,再由数据发送模块将采集数据发送到服务端。
步骤3:服务端通过数据接收模块从移动终端获取基本的测试应用的采集数据,并发送到数据存储中心。
步骤4:数据中心主要保存着所有已被测试应用的基本消耗数据,所以对于第一次测试的应用可以直接将测试的消耗数据存储到数据存储中心,对于在数据中心存在对当前测试应用的历史记录则将新旧记录通过2:8的原则(即:原有测试记录数据的占8,新的测试记录数据的占2的比例)替换原有的数据记录。
步骤5:将数据中心最新的被测试应用的测试数据提取出来,而且需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内,再转换成测试应用的特征数据记录文件,最后发送到SVM分类中心。
步骤6:在SVM分类模块用于分类测试应用的采集数据之前,需要定义一个类库,用于存储已分类的应用的特征数据。所以创建一个特征类库文件。
步骤7:SVM分类模块通过特征库文件和新采集的应用测试记录文件得出应用的类型,最后将应用类型通过服务器端的发送模块发送到移动终端。
步骤8:移动终端接收模块获取服务器端的运行结果,最终给测试应用分类。

Claims (8)

1.一种基于SVM的移动终端应用分类系统,其特征在于:所述系统是由终端应用消耗数据采集模块、数据类型指标模块、基于SVM的分类模块组成,终端应用消耗数据采集模块是检测应用在特定环境中消耗的各类资源数量,数据类型指标模块是提供一个指标类型库,为前面采集到的数据处理提供依据,也是联接数据采集模块和分类模块的重要部分,并且为每一个采集到的数据按照分类作用的程度提供权重值,基于SVM的分类模块将处理后的终端数据利用向量机进行最终的分类。
2.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于,所述系统终端应用消耗数据采集模块的各类资源包括:电量、流量、权限开放情况、测试时延、丢包率、延时抖动作为应用分类的基础。
3.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统是采用移动应用特征识别分类技术;是基于多种类型的移动终端应用,支持向量机技术,对移动应用进行特征识别和聚类。
4.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统是基于SVM的应用分类,构造移动应用的分类向量机,采用移动终端应用的软硬件消耗数据对应用分类。
5.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统为动态的应用分类机制,分类的种类在服务器端能动态的控制。
6.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于,所述系统还包括:在服务器端增加数据存储中心,可使移动终端的新旧软硬件消耗数据通过数据存储中心整合。
7.根据权利要求1所述的一种基于SVM的移动终端应用分类系统,其特征在于:所述系统需要先定义一个类库,用于存储已分类的应用的特征数据。
8.一种基于SVM的移动终端应用分类系统的实现方法,其特征在于,所述方法包括如下步骤:
步骤1:移动终端在采集模块采集被测试应用软硬件消耗数据之前,需要确保测试时长,测试内容都必须是在同一指标下,确保所有测试应用的在测试基本消耗数据时都在同一条件下;
步骤2:移动终端在测试前提条件下通过采集模块采集应用的各项基本软硬件消耗数据,再由数据发送模块将采集数据发送到服务端;
步骤3:服务端通过数据接收模块从移动终端获取基本的测试应用的采集数据,并发送到数据存储中心;
步骤4:数据中心保存着所有已被测试应用的基本消耗数据,对于第一次测试的应用直接将测试的消耗数据存储到数据存储中心,对于在数据中心存在对当前测试应用的历史记录则将新旧记录通过2:8的原则替换原有的数据记录;
步骤5:将数据中心最新的被测试应用的测试数据提取出来,需要对数据进行归一化预处理,即把原始数据规整到[0,1]范围内,再转换成测试应用的特征数据记录文件,最后发送到SVM分类中心;
步骤6:在SVM分类模块用于分类测试应用的采集数据之前,需要定义一个类库,用于存储已分类的应用的特征数据;
步骤7:SVM分类模块通过特征库文件和新采集的应用测试记录文件得出应用的类型,最后将应用类型通过服务器端的发送模块发送到移动终端;
步骤8:移动终端接收模块获取服务器端的运行结果,最终给测试应用分类。
CN201410361685.2A 2014-07-25 2014-07-25 一种基于svm的移动终端应用分类系统和方法 Active CN104182470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410361685.2A CN104182470B (zh) 2014-07-25 2014-07-25 一种基于svm的移动终端应用分类系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410361685.2A CN104182470B (zh) 2014-07-25 2014-07-25 一种基于svm的移动终端应用分类系统和方法

Publications (2)

Publication Number Publication Date
CN104182470A true CN104182470A (zh) 2014-12-03
CN104182470B CN104182470B (zh) 2019-02-19

Family

ID=51963510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410361685.2A Active CN104182470B (zh) 2014-07-25 2014-07-25 一种基于svm的移动终端应用分类系统和方法

Country Status (1)

Country Link
CN (1) CN104182470B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105072259A (zh) * 2015-07-20 2015-11-18 清华大学深圳研究生院 一种移动终端防范地理位置泄露的方法
CN106170791A (zh) * 2016-01-20 2016-11-30 马岩 一种基于app的信息分类方法及系统
CN108519869A (zh) * 2018-03-29 2018-09-11 联想(北京)有限公司 信息处理方法和系统
CN109522276A (zh) * 2018-09-27 2019-03-26 努比亚技术有限公司 应用图标管理方法、终端及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025835A (zh) * 2010-12-06 2011-04-20 华为终端有限公司 一种移动终端中的应用程序自动分类的方法和装置
CN102930444A (zh) * 2012-09-25 2013-02-13 中兴通讯股份有限公司 一种移动终端及其应用分类管理方法和系统
CN103336090A (zh) * 2013-05-14 2013-10-02 湖南中烟工业有限责任公司 一种预测卷烟感官质量指标的支持向量机svm方法
CN103391362A (zh) * 2013-07-11 2013-11-13 Tcl通讯(宁波)有限公司 一种基于功耗的应用分类方法及移动终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025835A (zh) * 2010-12-06 2011-04-20 华为终端有限公司 一种移动终端中的应用程序自动分类的方法和装置
CN102930444A (zh) * 2012-09-25 2013-02-13 中兴通讯股份有限公司 一种移动终端及其应用分类管理方法和系统
CN103336090A (zh) * 2013-05-14 2013-10-02 湖南中烟工业有限责任公司 一种预测卷烟感官质量指标的支持向量机svm方法
CN103391362A (zh) * 2013-07-11 2013-11-13 Tcl通讯(宁波)有限公司 一种基于功耗的应用分类方法及移动终端

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105072259A (zh) * 2015-07-20 2015-11-18 清华大学深圳研究生院 一种移动终端防范地理位置泄露的方法
CN106170791A (zh) * 2016-01-20 2016-11-30 马岩 一种基于app的信息分类方法及系统
WO2017124314A1 (zh) * 2016-01-20 2017-07-27 马岩 一种基于app的信息分类方法及系统
CN108519869A (zh) * 2018-03-29 2018-09-11 联想(北京)有限公司 信息处理方法和系统
CN109522276A (zh) * 2018-09-27 2019-03-26 努比亚技术有限公司 应用图标管理方法、终端及计算机可读存储介质

Also Published As

Publication number Publication date
CN104182470B (zh) 2019-02-19

Similar Documents

Publication Publication Date Title
CN103117903B (zh) 上网流量异常检测方法及装置
CN110362544A (zh) 日志处理系统、日志处理方法、终端及存储介质
CN112114986B (zh) 数据异常识别方法、装置、服务器和存储介质
CN106354797B (zh) 数据推荐方法和装置
CN108462888A (zh) 用户电视及上网行为的智能关联分析方法及系统
CN110347716A (zh) 日志数据处理方法、装置、终端及存储介质
CN104182470A (zh) 一种基于svm的移动终端应用分类系统和方法
CN103258027A (zh) 基于智能终端的情境感知服务平台
CN108304432A (zh) 信息推送处理方法、信息推送处理装置及存储介质
CN109002810A (zh) 模型评价方法、雷达信号识别方法及对应装置
CN105354293A (zh) 一种移动终端上进行播放对象推送的辅助实现方法及装置
CN108768695A (zh) Kqi的问题定位方法及装置
CN110109899A (zh) 物联网数据填补方法、装置及系统
CN113688490A (zh) 网络共建共享处理方法、装置、设备及存储介质
Ko et al. Network prediction with traffic gradient classification using convolutional neural networks
CN112202849A (zh) 内容分发方法、装置、电子设备和计算机可读存储介质
CN113660687B (zh) 网络差小区处理方法、装置、设备及存储介质
CN103634470A (zh) 一种基于终端移动数据接入网Qos的人机交互预测方法
CN105808580B (zh) 一种基于先验模型的信息判定方法及设备
CN103220555B (zh) 一种数字电视用户的分类方法、装置及系统
Qiao et al. Trace-driven optimization on bitrate adaptation for mobile video streaming
CN103226577A (zh) 一种新闻聚类方法
CN108924915A (zh) 基于飞行模式的数据更新方法及装置
CN104301170A (zh) 基于特征分类的移动终端应用友好性评判方法
CN109756762A (zh) 一种终端类别的确定方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 210003 new model road 66, Gulou District, Nanjing, Jiangsu

Applicant after: Nanjing Post & Telecommunication Univ.

Address before: 210023 9 Wen Yuan Road, Ya Dong new town, Nanjing, Jiangsu.

Applicant before: Nanjing Post & Telecommunication Univ.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201230

Address after: 210000 unit B, 6th floor, building 3, No.68 Aoti street, Jianye District, Nanjing City, Jiangsu Province

Patentee after: DRAGONFLY AGRICULTURAL RESEARCH INSTITUTE (JIANGSU) Co.,Ltd.

Address before: 210003, 66 new model street, Gulou District, Jiangsu, Nanjing

Patentee before: NANJING University OF POSTS AND TELECOMMUNICATIONS

TR01 Transfer of patent right