CN107943582A - 特征处理方法、装置、存储介质及电子设备 - Google Patents
特征处理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN107943582A CN107943582A CN201711122527.1A CN201711122527A CN107943582A CN 107943582 A CN107943582 A CN 107943582A CN 201711122527 A CN201711122527 A CN 201711122527A CN 107943582 A CN107943582 A CN 107943582A
- Authority
- CN
- China
- Prior art keywords
- characteristic
- application
- initial characteristics
- characteristics set
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000004140 cleaning Methods 0.000 claims abstract description 106
- 230000015654 memory Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 13
- 235000013399 edible fruits Nutrition 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 36
- 230000000875 corresponding effect Effects 0.000 description 23
- 238000000034 method Methods 0.000 description 23
- 230000003247 decreasing effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000003066 decision tree Methods 0.000 description 7
- 230000005611 electricity Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 238000012512 characterization method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101150053844 APP1 gene Proteins 0.000 description 1
- 101100055496 Arabidopsis thaliana APP2 gene Proteins 0.000 description 1
- 101100264195 Caenorhabditis elegans app-1 gene Proteins 0.000 description 1
- 101100189105 Homo sapiens PABPC4 gene Proteins 0.000 description 1
- 102100039424 Polyadenylate-binding protein 4 Human genes 0.000 description 1
- 101100016250 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GYL1 gene Proteins 0.000 description 1
- 102100038359 Xaa-Pro aminopeptidase 3 Human genes 0.000 description 1
- 101710081949 Xaa-Pro aminopeptidase 3 Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000013488 ordinary least square regression Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5022—Mechanisms to release resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种特征处理方法、装置、存储介质及电子设备,其中,本申请实施例从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合;根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件;当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行从特征信息选取步骤直到出现误差信息满足预设条件为止;当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。该方案可以提升了应用清理预测的速度,从而提升了应用清理的速度。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种特征处理方法、装置、存储介质及电子设备。
背景技术
目前,智能手机等电子设备上,通常会有多个应用同时运行,其中,一个应用在前台运行,其他应用在后台运行。如果长时间不清理后台运行的应用,则会导致电子设备的可用内存变小、中央处理器(central processing unit,CPU)占用率过高,导致电子设备出现运行速度变慢,卡顿,耗电过快等问题。
目前应用清理方式采集应用的特征,然后,输入到预测模型输出预测结果,当预测结果为可清理时,对应用进行清理。然而,目前应用清理方式需要采集应用大量的特征作为模型输入,导致模型运算量较大,降低了应用预测和清理的速度。
发明内容
本申请实施例提供了一种特征处理方法、装置、存储介质及电子设备,能够提升应用清理的速度。
第一方面,本申请实施例了提供了的一种特征处理方法,包括:
从应用的初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,所述候选特征集合的特征信息数量小于所述初始特征集合的特征信息数量;
根据所述候选特征集合以及应用清理预测模型获取所述应用的当前预测结果;
判断所述当前预测结果与参考预测结果之间的误差信息是否满足预设条件,所述参考预测结果为基于所述初始特征集合以及应用清理预测模型得到的预测结果;
当所述误差信息不满足预设条件时,将所述初始特征集合更新为当前的候选特征集合以及将所述参考预测结果更新为所述当前预测结果,并返回执行从所述初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;
当出现误差信息满足预设条件时,将当前的初始特征集合作为所述应用清理预测模型的基准特征集合。
第二方面,本申请实施例了提供了的一种特征处理装置,包括:
特征选取单元,用于从应用的初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,所述候选特征集合的特征信息数量小于所述初始特征集合的特征信息数量;
结果获取单元,用于根据所述候选特征集合以及应用清理预测模型获取所述应用的当前预测结果;
判断单元,用于判断所述当前预测结果与参考预测结果之间的误差信息是否满足预设条件,所述参考预测结果为基于所述初始特征集合以及应用清理预测模型得到的预测结果;
更新单元,用于当所述误差信息不满足预设条件时,将所述初始特征集合更新为当前的候选特征集合以及将所述参考预测结果更新为所述当前预测结果,并触发所述特征选取单元执行从所述初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;
确定单元,用于当出现误差信息满足预设条件时,将当前的初始特征集合作为所述应用清理预测模型的基准特征集合。
第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的特征处理方法。
第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的特征处理方法。
本申请实施例从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,该候选特征集合的特征信息数量小于初始特征集合的特征信息数量;根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件,其中,该参考预测结果为基于初始特征集合以及应用清理预测模型得到的预测结果;当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行从初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。该方案可以依次递减应用清理预测模型的特征数量,得到特征数量相对于初始特征集合较少的基准特征集合,在保证应用清理预测的准确性的前提下,减少模型输入特征的数量,降低了预测模型的计算量,提升了应用清理预测的速度,从而提升了应用清理的速度、效率以及节省了资源。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的特征处理方法的应用场景示意图。
图2是本申请实施例提供的特征处理方法的一个流程示意图。
图3是本申请实施例提供的应用清理方法的一个流程示意图。
图4是本申请实施例提供的特征处理装置的一个结构示意图。
图5是本申请实施例提供的特征处理装置的另一结构示意图。
图6是本申请实施例提供的特征处理装置的另一结构示意图。
图7是本申请实施例提供的电子设备的一个结构示意图。
图8是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例提供一种特征处理方法,该特征处理方法的执行主体可以是本申请实施例提供的特征处理装置,或者集成了该特征处理装置的电子设备,其中该特征处理装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。
请参阅图1,图1为本申请实施例提供的特征处理方法的应用场景示意图,以特征处理装置集成在电子设备中为例,电子设备可以根据应用的初始特征集合以及应用清理预测模型获取应用的参考预测结果;从初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,候选特征集合的特征信息数量小于初始特征集合的特征信息数量;根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件;当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行从初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。此外,电子设备还可以根据基准特征集合采集应用的特征信息,根据采集到的特征信息以及应用清理预测模型预测应用是否可清理,然后,清理可清理的应用。
具体地,例如图1所示,以判断后台运行的应用程序a(如邮箱应用、游戏应用等)是否可以清理为例,可以采集应用a的多个特征信息即多维特征(例如应用a在后台运行的时长、应用a运行的时间信息、次数等),得到应用a的初始特征集合;从初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,候选特征集合的特征信息数量M小于初始特征集合的特征信息数量N;根据候选特征集合以及应用清理预测模型(如决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等)获取应用a的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件;当误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。电子设备可以根据基准特征集合获取应用a的特征信息,然后,根据应用清理模型及获取到的特征信息预测应用a是否可清理,当预测后台应用a可清理时,电子设备可以对应用a进行清理。
请参阅图2,图2为本申请实施例提供的特征处理方法的流程示意图。本申请实施例提供的特征处理方法的具体流程可以如下:
201、从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,候选特征集合的特征信息数量小于初始特征集合的特征信息数量。
本申请实施例涉及到应用可以安装在电子设备上的应用程序,如办公应用、通信应用、游戏应用、购物应用等。该应用可以前台应用或者后台应用。
其中,应用的多个特征信息为应用的多维特征信息,可以在应用的使用过程中采集。
应用的多维特征具有一定长度的维度,其每个维度上的参数均对应表征应用的一种特征信息,即该多维特征息由多种特征构成。该多个特征信息可以包括应用自身相关的特征信息,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长;应用进入前台的次数;应用处于前台的时间;应用进入后台的方式,例如被主页键(home键)切换进入、被返回键切换进入,被其他应用切换进入等;应用的类型,包括一级(常用应用)、二级(其他应用);应用在后台停留时长直方图信息,如应用在后台停留时间直方图第一个bin(0-5分钟对应的次数占比)等。
该多个特征信息还可以包括应用所在的电子设备的相关特征信息,例如:电子设备的灭屏时间、亮屏时间、当前电量,电子设备的无线网络连接状态,电子设备是否在充电状态等。
比如,可以在历史时间段内,按照预设频率采集应用的多个特征信息。历史时间段,例如可以是过去7天、10天;预设频率,例如可以是每10分钟采集一次、每半小时采集一次。
在一实施例中,为便于应用清理,可以将应用的多维特征信息中,未用数值直接表示的特征信息用具体的数值量化出来,例如针对电子设备的无线网连接状态这个特征信息,可以用数值1表示正常的状态,用数值0表示异常的状态(反之亦可);再例如,针对电子设备是否在充电状态这个特征信息,可以用数值1表示充电状态,用数值0表示未充电状态(反之亦可)。
其中,电子设备可以各时间段内采集应用的多个特征信息,并保存在特征数据库中,因此,本申请实施例可以从特征数据库中提取应用的多个特征信息。
比如,初始特征集合的特征数量为N,可以从初始特征集合中选取相应数量的特征信息,得到候选特征集合。该候选特征集合的特征数量可以为M,M小于N。
其中,特征选取的方式可以有多种,比如,为了提升应用清理预测的准确性以及特征选取速度;可以基于特征类型选取。在一实施例中,步骤“从初始特征集合中选取若干特征信息”,包括:
从初始特征集合的特征类型中选取相应的目标特征类型;
根据目标特征类型从初始特征集合中选取若干特征信息。
其中,初始特征集合的特征类型为初始特征集合所包含的特征类型。目标特征类型的数量小于初始特征集合的特征类型数量。例如,初始特征集合包括5种特征,那么可以从中选取3种特征。
例如,初始特征集合包含特征类型1、特征类型2、特征类型3……特征类型n,此时,可以选取特征类型1、特征类型2、特征类型3……特征类型i为目标特征类型;然后,从初始特征集合中选取目标特征类型的特征信息,组成候选特征集合。
其中,特征类型可以根据实际需求设定,比如,可以将特征类型划分成:应用自身的特征、应用所在电子设备的特征。
又比如,还可以根据特征信息的属性将特征划分成:时间特征(如,应用在前台或后台的使用时长,应用进入后台的时间、应用在后台停留时间等等)、次数特征(如应用进入后台、前台的次数等等)、应用切换特征(如应用被切换的方式)等等。此外,还可以将特征划分成电子亮屏特征、熄屏特征、电量特征、网络特征等等。
例如,初始特征集合包括特征类型为:时间特征、应用切换特征、电子设备亮屏特征、网络特征、电量特征,此时,可以选取时间特征、应用切换特征、电子设备亮屏特征、网络特征为目标特征类型。
在一实施例中,考虑到不同类型的预测模型对特征类型要求不相同,精确度也不一样,为能够保证预测模型预测的准确性,可以基于预测模型的模型类型来选取特征类型。比如,步骤“从初始特征集合的特征类型中选取相应的目标特征类型”可以包括:
获取应用清理预测模型的模型类型;
根据应用清理预测模型的模型类型从初始特征集合的特征类型中选取相应的目标特征类型。
比如,可以预选设置不同模型类型与不同特征类型的映射关系(即对应关系),这样后续在获取模型类型后,可以基于映射关系从初始特征集合的特征类型中选取与该模型类型对应的特征类型作为目标特征类型。
例如,初始特征集合包括特征类型为:时间特征、应用切换特征、电子设备亮屏特征等,此时,假设应用清理预测模型为预测模型1(如决策树)、此时,可以选取时间特征、应用切换特征等;假设应用清理预测模型为预测模型2(如贝叶斯模型)可以选取应用切换特征、电子设备亮屏特征等。
在一实施例中,每种预测模型类型可以对应一种或者多种特征类型,比如,监督式学习算法可以对于时间特征、频率特征、电量特征等。
其中,预测模型为机器学习算法,机器学习算法,可以通过不断特征学习来预测某个事件的发生,比如,可以预测应用是否可清理等。该机器学习算法可以包括:决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等等。
本申请实施例中,机器学习算法的算法类型可以根据各种情况划分,比如,可以基于学习方式可以将机器学习算法划分成:监督式学习算法、非监控式学习算法、半监督式学习算法、强化学习算法等等。
在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1”,“2”,“3”,“4”等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(LogisticRegression)和反向传递神经网络(Back Propagation Neural Network)。
在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。
半监督式学习算法,在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM)等。
强化学习算法,在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning)。
此外,在一实施例中,还可以基于根据算法的功能和形式的类似性将机器学习算法划分成:
回归算法,常见的回归算法包括:最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(LocallyEstimated Scatterplot Smoothing)。
基于实例的算法,包括k-Nearest Neighbor(KNN),学习矢量量化(LearningVector Quantization,LVQ),以及自组织映射算法(Self-Organizing Map,SOM)。
正则化方法,常见的算法包括:Ridge Regression,Least Absolute Shrinkageand Selection Operator(LASSO),以及弹性网络(Elastic Net)。
决策树算法,常见的算法包括:分类及回归树(Classification And RegressionTree,CART),ID3(Iterative Dichotomiser 3),C4.5,Chi-squared AutomaticInteraction Detection(CHAID),Decision Stump,随机森林(Random Forest),多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine,GBM)。
贝叶斯方法算法,包括:朴素贝叶斯算法,平均单依赖估计(Averaged One-Dependence Estimators,AODE),以及Bayesian Belief Network(BBN)。
……。
在一实施例中,还可以先确定需要选取的特征信息数量,然后,基于该数量选取特征信息。比如,步骤“从初始特征集合中选取若干特征信息,得到应用的候选特征集合”,可以包括:
根据预设规则确定需要选取的目标特征信息数量,目标特征信息数量小于初始特征集合的特征信息数量;
根据目标特征信息数量从初始特征集合中选取若干特征信息,得到应用的候选特征集合。
其中,目标特征信息数量M小于初始特征集合的特征信息数量N。
其中,预设规则可以根据实际需求设定,在一实施例中,为能够确保预测模型的预测准确性,目标特征信息数量M不能比初始特征集合的特征信息数量N小太多。比如,M=N-1,或者,M=N-2等等。
在得到目标特征信息数量M后,可以从初始特征集合中选取M个特征信息,便可以得到应用的候选特征集合。
在一实施例中,为了保证特征类型的足够多,提升预测模型的预测准确性,可以选取应用的多个备选特征集合,然后,基于特征类型选取候选特征集合。比如,步骤“根据目标特征信息数量从初始特征集合中选取若干特征信息,得到应用的候选特征集合”可以包括:
根据特征信息数量多次从初始特征集合中选取若干特征信息,得到应用的多个备选特征集合;
根据备选特征集合所包含的特征类型从多个备选特征集合选取应用的候选特征集合。
比如,目标特征信息数量为M,初始特征集合的特征信息数量N,那么有选取CN M种选取方法,此时,备选特征集合的数量可以为CN M,如备选特征集合1、……备选特征集合CN M。之后,便可以基于备选特征集合所包含的特征类型选取应用的候选特征集合。
例如,可以选取特征类型最多的备选特征集合作为应用的候选集合,保证预测模型输入的特征类型最够多,提升预测准确性。
202、根据候选特征集合以及应用清理预测模型获取应用的当前预测结果。
其中,应用清理预测模型为一种机器学习算法,用于预测应用是否可清理等。该预测模型可以包括:决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等等。
比如,可以根据候选特征集合以及逻辑回归模型获取应用的预测结果。例如,初始特征集合为A,候选特征集合A1,A1的特征数量小于A。此时,可以根据A1以及应用清理预测模型计算应用的当前预测结果。
本申请实施例中,预测结果可以包括预测值,该预测值可以包括应用可清理的概率等。
203、判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件,若否,则执行步骤204,若是,则执行步骤205。
其中,参考预测结果为基于初始特征集合以及应用清理预测模型得到的预测结果。比如,初始特征集合为A,该参考预测结果可以为基于初始特征集合A与应用清理预测模型得到的预测结果。
具体地,可以获取当前预测结果与参考预测结果之间的误差信息,判断误差信息是否满足预设条件。
其中,预设条件可以根据实际需求设定,该预设条件可以表征当前预测结果与参考预测结果之间的误差很大。
比如,在一实施例中,当预测结果包括预测值时,也即参考预测结果包括参考预测值,当前预测结果包括当前预测值,预设条件可以包括:当前预测值与参考预测值之间的差值大于预设阈值。也即步骤“判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件”可以包括:
获取当前预测值与参考预测值之间的差值;
判断差值是否大于预设阈值;
若是,则确定当前预测结果与参考预测结果之间的误差信息满足预设条件。
若差值不大于预设阈值,则确定当前预测结果与参考预测结果之间的误差信息满足预设条件。
204、将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行步骤202直到出现误差满足预设条件为止。
本申请实施例可以在误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,以便可以依次递减特征集合的特征数量,直到递减后特征集合的预测结果与参考预测结果之间的误差信息满足预设条件为止,从而选取出既能保证预测准确性又具有较少特征数量的特征集合。
例如,初始特征集合为A,特征数量为N,可以依次递减集合A的特征数量,如每次减少一个特征,得到候选特征集合A1、特征数量为N-1,根据候选特征集合A1与应用清理预测模型输出应用的当前预测结果。如果当前预测结果与参考预测结果之间的误差信息不满足预设条件,则再次减少一个特征,得到候选特征集合A2、特征数量为N-2,根据候选特征集合A2与应用清理预测模型输出应用的当前预测结果,如果当前预测结果与前一个预测结果之间的误差信息不满足预设条件,再次减少一个特征N-3,……依次类推直到递减后特征集合的预测结果与前一个预测结果之间的误差信息满足预设条件。
205、当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。
在出现误差信息满足预设条件时,表明根据当前的候选特征集合和预测模型得到的预测结果与参考预测结果之间的误差较大,预测结果产生跳跃。那么此时,减少的特征数量为初始特征集合可减少的特征数量的极限值,如果再继续递减下去,得到的候选特征集合,其产生的预测结果将会不准确。因此,此时,可以根据当前的候选特征集合确定应用清理预测模型的基准特征集合。
比如,在一实施例中,可以将当前的候选特征集合作为应用清理预测模型的基准特征集合。
在一实施例中,在减少特征数量的同时能够保证预测结果的准确性,还可以将当前的候选特征集合的上一个候选特征集合,也即当前的初始特征集合作为应用清理预测模型的基准特征集合。
例如,初始特征集合A经过j次特征递减后得到候选特征集合A1、A2、A3……Aj,假设递减到Aj时,Aj与参考预测结果之间的误差信息满足预设条件,此时,可以选取候选特征集合Aj-1,也即当前的初始特征集合作为应用清理预测模型的基准特征集合。
其中,应用清理预测模型的基准特征集合为应用清理预测模型的基准输入特征,该基准特征集合指示应用清理预测模型所需的特征。
在对应用进行清理预测时,可以采集基础特征集合内的特征。比如,基准特征集合包括:应用处于前台的时间;应用进入后台的方式,例如被主页键(home键)切换进入、被返回键切换进入,被其他应用切换进入等;应用的类型,包括一级(常用应用)、二级(其他应用);应用在后台停留时长直方图信息,如应用在后台停留时间直方图第一个bin(0-5分钟对应的次数占比)等特征时。在预测时便可采集或获取前述特征输入到应用清理预测模型进行预测。
在一实施例中,还可以包括:根据基准特征集合获取应用的多个特征信息,得到应用的预测特征集合;根据预测特征集合以及应用清理预测模型预测该应用是否可清理。
例如,根据预测特征集合以及逻辑回归模型(或者贝叶斯模型)计算应用可清理概率,然后,当概率大于预设概率时,确定应用可清理,反之不可清理。
在一实施例中,还可以当预测应用可清理时,对应用进行清理,如关闭该应用等。
由上可知,本申请实施例从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,该候选特征集合的特征信息数量小于初始特征集合的特征信息数量;根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件,其中,该参考预测结果为基于初始特征集合以及应用清理预测模型得到的预测结果;当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行从初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。该方案可以依次递减应用清理预测模型的特征数量,得到特征数量相对于初始特征集合较少的基准特征集合,在保证应用清理预测的准确性的前提下,减少模型输入特征的数量,降低了预测模型的计算量,提升了应用清理预测的速度,从而提升了应用清理的速度、效率以及节省了资源。
进一步地,由于特征集合中,包括了反映用户使用应用的行为习惯的多个特征信息,因此本申请实施例可以使得对对应应用的清理更加个性化和智能化。
下面将在上述实施例描述的方法基础上,对本申请的特征处理方法做进一步介绍。参考图3,提供了一种应用清理方法可以包括:
301、获取应用的多个特征信息,得到应用的初始特征集合。
本申请实施例涉及到应用可以安装在电子设备上的应用程序,如办公应用、通信应用、游戏应用、购物应用等。该应用可以前台应用或者后台应用。
其中,应用的多个特征信息为应用的多维特征信息,可以在应用的使用过程中采集。
应用的多维特征具有一定长度的维度,其每个维度上的参数均对应表征应用的一种特征信息,即该多维特征息由多种特征构成。该多个特征信息可以包括应用自身相关的特征信息,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长;应用进入前台的次数;应用处于前台的时间;应用进入后台的方式,例如被主页键(home键)切换进入、被返回键切换进入,被其他应用切换进入等;应用的类型,包括一级(常用应用)、二级(其他应用);应用在后台停留时长直方图信息,如应用在后台停留时间直方图第一个bin(0-5分钟对应的次数占比)等。
该多个特征信息还可以包括应用所在的电子设备的相关特征信息,例如:电子设备的灭屏时间、亮屏时间、当前电量,电子设备的无线网络连接状态,电子设备是否在充电状态等。
比如,应用的多个特征信息可以包括如下30维特征,即初始特征集合包括如下30个特征。需要说明的是,如下所示的特征信息仅为举例,实际中所包含的特征信息的数量,可以多于比如下所示信息的数量,也可以少于如下所示信息的数量,所取的具体特征信息也可以与如下所示不同,此处不作具体限定。30维特征包括:
APP上一次切入后台到现在的时长;
APP上一次切入后台到现在的时长;
APP一天里(按每天统计)进入前台的次数;
APP一天里(休息日按工作日、休息日分开统计)进入前台的次数,比如若当前预测时间为工作日,则该特征使用数值为工作日统计到的平均每个工作日在前台使用次数;
APP一天中(按每天统计)处于前台的时间;
该后台APP紧跟当前前台APP后被打开次数,不分工作日休息日统计所得;
该后台APP紧跟当前前台APP后被打开次数,分工作日休息日统计;
目标APP被切换的方式,分为被home键切换、被recent键切换、被其他APP切换;
目标APP一级类型(常用应用);
目标APP二级类型(其他应用);
手机屏幕灭屏时间;
手机屏幕亮屏时间;
当前屏幕亮灭状态;
当前的电量;
当前wifi状态;
App上一次切入后台到现在的时长;
APP上一次在前台被使用时长;
APP上上一次在前台被使用时长;
APP上上上一次在前台被使用时长;
若一天分了6个时间段,每段4小时,当前预测时间点为早上8:30,则处于第3段,则该特征表示的是目标app每天在8:00~12:00这个时段被使用的时间长度;
当前前台APP进入后台到目标APP进入前台按每天统计的平均间隔时间;
当前前台APP进入后台到目标APP进入前台期间按每天统计的平均屏幕熄灭时间;
目标APP在后台停留时间直方图第一个bin(0-5分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(5-10分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(10-15分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(25-30分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(30分钟以后对应的次数占比);
当前是否有在充电。
302、根据初始特征集合以及应用清理预测模型获取应用的参考预测结果。
其中,预测模型为一种机器学习算法,用于预测某个事件的发生,比如,可以预测应用是否可清理等。该预测模型可以包括:决策树模型、逻辑回归模型、贝叶斯模型、神经网络模型、聚类模型等等。
其中,预测结果可以包括预测值,如应用可清理的概率、分数等等。
303、从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,候选特征集合的特征信息数量小于初始特征集合的特征信息数量。
在一实施例中,考虑到不同类型的预测模型对特征类型要求不相同,精确度也不一样,为能够保证预测模型预测的准确性,可以基于预测模型的模型类型来选取特征类型。具体地,获取应用清理预测模型的模型类型;根据应用清理预测模型的模型类型从初始特征集合的特征类型中选取相应的目标特征类型。
本申请实施例中,机器学习算法的算法类型可以根据各种情况划分,比如,可以基于学习方式可以将机器学习算法划分成:监督式学习算法、非监控式学习算法、半监督式学习算法、强化学习算法等等。
如,初始特征集合包括特征类型为:时间特征、应用切换特征、电子设备亮屏特征等,此时,假设应用清理预测模型为预测模型1(如决策树)、此时,可以选取时间特征、应用切换特征等;假设应用清理预测模型为预测模型2(如贝叶斯模型)可以选取应用切换特征、电子设备亮屏特征等。
此外,在一实施例中,还可以先确定需要选取的特征信息数量,然后,基于该数量选取特征信息。具体地,据预设规则确定需要选取的目标特征信息数量,目标特征信息数量小于初始特征集合的特征信息数量;根据目标特征信息数量从初始特征集合中选取若干特征信息,得到应用的候选特征集合。
其中,预设规则可以根据实际需求设定,在一实施例中,为能够确保预测模型的预测准确性,目标特征信息数量M不能比初始特征集合的特征信息数量N小太多。比如,M=N-1,或者,M=N-2等等。
又比如,在一实施例中,为了保证特征类型的足够多,提升预测模型的预测准确性,可以选取应用的多个备选特征集合,然后,基于特征类型选取候选特征集合。根据特征信息数量多次从初始特征集合中选取若干特征信息,得到应用的多个备选特征集合;根据备选特征集合所包含的特征类型从多个备选特征集合选取应用的候选特征集合
比如,目标特征信息数量为M,初始特征集合的特征信息数量N,那么有选取CN M种选取方法,此时,备选特征集合的数量可以为CN M,如备选特征集合1、……备选特征集合CN M。之后,便可以选取包含的特征类型选取应用的集合作为候选特征集合。
304、根据候选特征集合以及应用清理预测模型获取应用的当前预测结果。
比如,可以根据候选特征集合以及逻辑回归模型获取应用的预测结果。例如,初始特征集合为A,候选特征集合A1,A1的特征数量小于A。此时,可以根据A1以及应用清理预测模型计算应用的当前预测结果。
305、获取当前预测结果与参考预测结果之间的误差信息。
在一实施例中,当预测结果包括预测值时,也即参考预测结果包括参考预测值,误差信息包括当前预测值与参考预测值之间的差值。
306、判断该误差信息是否满足预设条件,若否,则执行步骤307,若是
其中,预设条件可以根据实际需求设定,该预设条件可以表征当前预测结果与参考预测结果之间的误差很大。
在一实施例中,当预测结果包括预测值时,也即参考预测结果包括参考预测值,当前预测结果包括当前预测值,预设条件可以包括:当前预测值与参考预测值之间的差值大于预设阈值。也即:
判断差值是否大于预设阈值;
若是,则确定当前预测结果与参考预测结果之间的误差信息满足预设条件。
若差值不大于预设阈值,则确定当前预测结果与参考预测结果之间的误差信息满足预设条件。
307、将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果;并返回执行步骤303。
本申请实施例可以在误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,以便可以依次递减特征集合的特征数量,直到递减后特征集合的预测结果与参考预测结果之间的误差信息满足预设条件为止,从而选取出既能保证预测准确性又具有较少特征数量的特征集合。
308、将当前的初始特征集合作为应用清理预测模型的基准特征集合。
在出现误差信息满足预设条件时,表明根据当前的候选特征集合和预测模型得到的预测结果与参考预测结果之间的误差较大,预测结果产生跳跃。那么此时,减少的特征数量为初始特征集合可减少的特征数量的极限值,如果再继续递减下去,得到的候选特征集合,其产生的预测结果将会不准确。因此,此时,可以将当前的候选特征集合的上一个候选特征集合,也即当前的初始特征集合作为应用清理预测模型的基准特征集合。
例如,初始特征集合A经过j次特征递减后得到候选特征集合A1、A2、A3……Aj,假设递减到Aj时,Aj与参考预测结果之间的误差信息满足预设条件,此时,可以选取候选特征集合Aj-1,也即当前的初始特征集合作为应用清理预测模型的基准特征集合。
309、根据基准特征集合获取应用的多个特征信息,得到应用的预测特征集合。
比如,在需要清理应用是,可以根据基准特征集合采集应用的多个特征信息。
其中,预测特征集合与基准特征集合所包含的特征是一致的。
比如,根据基准特征集合和预测时间获取应用的多个特征信息。其中,预测时间可以当前时间等。
310、根据预测特征集合以及应用清理预测模型预测该应用是否可清理。
例如,根据预测特征集合以及逻辑回归模型(或者贝叶斯模型)计算应用可清理概率,然后,当概率大于预设概率时,确定应用可清理,反之不可清理。
在一实施例中,还可以当预测应用可清理时,对应用进行清理,如关闭该应用等。
在一个具体的例子中,可以利用本申请实施例方法预测后台运行的多个应用是否可清理,如表1所示,则确定可以清理后台运行的应用APP 1和应用APP 3,而保持应用APP 2在后台运行的状态不变。
应用 | 预测结果 |
APP1 | 可清理 |
APP2 | 不可清理 |
APP3 | 可清理 |
表1
由上可知,本申请实施例从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,该候选特征集合的特征信息数量小于初始特征集合的特征信息数量;根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件,其中,该参考预测结果为基于初始特征集合以及应用清理预测模型得到的预测结果;当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行从初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。该方案可以依次递减应用清理预测模型的特征数量,得到特征数量相对于初始特征集合较少的基准特征集合,在保证应用清理预测的准确性的前提下,减少模型输入特征的数量,降低了预测模型的计算量,提升了应用清理预测的速度,从而提升了应用清理的速度、效率以及节省了资源。
进一步地,由于特征集合中,包括了反映用户使用应用的行为习惯的多个特征信息,因此本申请实施例可以使得对对应应用的清理更加个性化和智能化。
在一实施例中还提供了一种特征处理装置。请参阅图4,图4为本申请实施例提供的特征处理装置的结构示意图。其中该特征处理装置应用于电子设备,该特征处理装置包括特征选取单元401、结果获取单元402、判断单元403、更新单元404和确定单元405,如下:
特征选取单元401,用于从应用的初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,所述候选特征集合的特征信息数量小于所述初始特征集合的特征信息数量;
结果获取单元402,用于根据所述候选特征集合以及应用清理预测模型获取所述应用的当前预测结果;
判断单元403,用于判断所述当前预测结果与参考预测结果之间的误差信息是否满足预设条件,所述参考预测结果为基于所述初始特征集合以及应用清理预测模型得到的预测结果;
更新单元404,用于当所述误差信息不满足预设条件时,将所述初始特征集合更新为当前的候选特征集合以及将所述参考预测结果更新为所述当前预测结果,并触发所述特征选取单元401执行从所述初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;
确定单元405,用于当出现误差信息满足预设条件时,将当前的初始特征集合作为所述应用清理预测模型的基准特征集合。
在一实施例中,所述参考预测结果包括参考预测值,所述当前预测结果包括当前预测值;所述判断单元403,具体可以用于:
获取所述当前预测值与所述参考预测值之间的差值;
判断所述差值是否大于预设阈值;
若是,则确定所述当前预测结果与所述参考预测结果之间的误差信息满足预设条件。
在一实施例中,参考图5,其中,特征选取单元401,可以包括:
类型选取子单元4011,用于从所述初始特征集合的特征类型中选取相应的目标特征类型;
第一特征选取子单元4012,用于根据所述目标特征类型从所述初始特征集合中选取若干特征信息。
在一实施例中,类型选取子单元4011,可以具体用于:
获取所述应用清理预测模型的模型类型;
根据应用清理预测模型的模型类型从所述初始特征集合的特征类型中选取相应的目标特征类型。
在一实施例中,参考图6,其中,特征选取单元401,可以包括:
数量确定子单元4013,用于根据预设规则确定需要选取的目标特征信息数量,所述目标特征信息数量小于所述初始特征集合的特征信息数量;
第二特征选取子单元4014,用于根据所述目标特征信息数量从所述初始特征集合中选取若干特征信息,得到所述应用的候选特征集合。
在一实施例中,第二特征选取子单元4014,可以用于:
根据所述特征信息数量多次从所述初始特征集合中选取若干特征信息,得到所述应用的多个备选特征集合;
根据所述备选特征集合所包含的特征类型从多个备选特征集合选取所述应用的候选特征集合。
其中,特征处理装置中各单元执行的步骤可以参考上述方法实施例描述的方法步骤。该特征处理装置可以集成在电子设备中,如手机、平板电脑等。
具体实施时,以上各个单元可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单位的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例特征处理装置可以由特征选取单元401从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,该候选特征集合的特征信息数量小于初始特征集合的特征信息数量;由结果获取单元402根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;由判断单元403判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件,其中,该参考预测结果为基于初始特征集合以及应用清理预测模型得到的预测结果;由更新单元404当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并触发特征选取单元401执行从初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;由确定单元405当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。该方案可以依次递减应用清理预测模型的特征数量,得到特征数量相对于初始特征集合较少的基准特征集合,在保证应用清理预测的准确性的前提下,减少模型输入特征的数量,降低了预测模型的计算量,提升了应用清理预测的速度,从而提升了应用清理的速度、效率以及节省了资源。
本申请实施例还提供一种电子设备。请参阅图7,电子设备500包括处理器501以及存储器502。其中,处理器501与存储器502电性连接。
所述处理器500是电子设备500的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器502内的计算机程序,以及调用存储在存储器502内的数据,执行电子设备500的各种功能并处理数据,从而对电子设备500进行整体监控。
所述存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
在本申请实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中,并由处理器501运行存储在存储器502中的计算机程序,从而实现各种功能,如下:
从应用的初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,所述候选特征集合的特征信息数量小于所述初始特征集合的特征信息数量;
根据所述候选特征集合以及应用清理预测模型获取所述应用的当前预测结果;
判断所述当前预测结果与参考预测结果之间的误差信息是否满足预设条件,所述参考预测结果为基于所述初始特征集合以及应用清理预测模型得到的预测结果;
当所述误差信息不满足预设条件时,将所述初始特征集合更新为当前的候选特征集合以及将所述参考预测结果更新为所述当前预测结果,并返回执行从所述初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;
当出现误差信息满足预设条件时,将当前的初始特征集合作为所述应用清理预测模型的基准特征集合。
在某些实施方式中,所述参考预测结果包括参考预测值,所述当前预测结果包括当前预测值;在判断所述当前预测结果与所述参考预测结果之间的误差信息是否满足预设条件时,处理器501可以具体执行以下步骤:
获取所述当前预测值与所述参考预测值之间的差值;
判断所述差值是否大于预设阈值;
若是,则确定所述当前预测结果与所述参考预测结果之间的误差信息满足预设条件。
在某些实施方式中,在从所述初始特征集合中选取若干特征信息时,处理器501可以具体执行以下步骤:
从所述初始特征集合的特征类型中选取相应的目标特征类型;
根据所述目标特征类型从所述初始特征集合中选取若干特征信息。
在某些实施方式中,在从所述初始特征集合的特征类型中选取相应的目标特征类型时,处理器501还可以具体执行以下步骤:
获取所述应用清理预测模型的模型类型;
根据应用清理预测模型的模型类型从所述初始特征集合的特征类型中选取相应的目标特征类型。
在某些实施方式中,在从所述初始特征集合中选取若干特征信息,得到应用的候选特征集合时,处理器501可以具体执行以下步骤:
根据预设规则确定需要选取的目标特征信息数量,所述目标特征信息数量小于所述初始特征集合的特征信息数量;
根据所述目标特征信息数量从所述初始特征集合中选取若干特征信息,得到所述应用的候选特征集合。
在某些实施方式中,在根据所述目标特征信息数量从所述初始特征集合中选取若干特征信息,得到所述应用的候选特征集合时,处理器501可以具体执行以下步骤:
根据所述特征信息数量多次从所述初始特征集合中选取若干特征信息,得到所述应用的多个备选特征集合;
根据所述备选特征集合所包含的特征类型从多个备选特征集合选取所述应用的候选特征集合。
由上述可知,本申请实施例电子设备可以依次递减应用清理预测模型的特征数量,得到特征数量相对于初始特征集合较少的基准特征集合,在保证应用清理预测的准确性的前提下,减少模型输入特征的数量,降低了预测模型的计算量,提升了应用清理预测的速度,从而提升了应用清理的速度、效率以及节省了资源。
请一并参阅图8,在某些实施方式中,电子设备500还可以包括:显示器503、射频电路504、音频电路505以及电源506。其中,其中,显示器503、射频电路504、音频电路505以及电源506分别与处理器501电性连接。
所述显示器503可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器503可以包括显示面板,在某些实施方式中,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
所述射频电路504可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
所述音频电路505可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
所述电源506可以用于给电子设备500的各个部件供电。在一些实施例中,电源506可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图8中未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例还提供一种存储介质,所述存储介质存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述任一实施例中的特征处理方法,比如:从应用的初始特征集合中选取若干特征信息,得到应用的候选特征集合,其中,该候选特征集合的特征信息数量小于初始特征集合的特征信息数量;根据候选特征集合以及应用清理预测模型获取应用的当前预测结果;判断当前预测结果与参考预测结果之间的误差信息是否满足预设条件,其中,该参考预测结果为基于初始特征集合以及应用清理预测模型得到的预测结果;当误差信息不满足预设条件时,将初始特征集合更新为当前的候选特征集合以及将参考预测结果更新为当前预测结果,并返回执行从初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;当出现误差信息满足预设条件时,将当前的初始特征集合作为应用清理预测模型的基准特征集合。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM,)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的特征处理方法而言,本领域普通测试人员可以理解实现本申请实施例的特征处理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如特征处理方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的特征处理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种特征处理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (13)
1.一种特征处理方法,其特征在于,包括:
从应用的初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,所述候选特征集合的特征信息数量小于所述初始特征集合的特征信息数量;
根据所述候选特征集合以及应用清理预测模型获取所述应用的当前预测结果;
判断所述当前预测结果与参考预测结果之间的误差信息是否满足预设条件,所述参考预测结果为基于所述初始特征集合以及应用清理预测模型得到的预测结果;
当所述误差信息不满足预设条件时,将所述初始特征集合更新为当前的候选特征集合以及将所述参考预测结果更新为所述当前预测结果,并返回执行从所述初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;
当出现误差信息满足预设条件时,将当前的初始特征集合作为所述应用清理预测模型的基准特征集合。
2.如权利要求1所述的特征处理方法,其特征在于,所述参考预测结果包括参考预测值,所述当前预测结果包括当前预测值;
判断所述当前预测结果与所述参考预测结果之间的误差信息是否满足预设条件,包括:
获取所述当前预测值与所述参考预测值之间的差值;
判断所述差值是否大于预设阈值;
若是,则确定所述当前预测结果与所述参考预测结果之间的误差信息满足预设条件。
3.如权利要求1所述的特征处理方法,其特征在于,从所述初始特征集合中选取若干特征信息,包括:
从所述初始特征集合的特征类型中选取相应的目标特征类型;
根据所述目标特征类型从所述初始特征集合中选取若干特征信息。
4.如权利要求3所述的特征处理方法,其特征在于,从所述初始特征集合的特征类型中选取相应的目标特征类型,包括:
获取所述应用清理预测模型的模型类型;
根据应用清理预测模型的模型类型从所述初始特征集合的特征类型中选取相应的目标特征类型。
5.如权利要求1所述的特征处理方法,其特征在于,从所述初始特征集合中选取若干特征信息,得到应用的候选特征集合,包括:
根据预设规则确定需要选取的目标特征信息数量,所述目标特征信息数量小于所述初始特征集合的特征信息数量;
根据所述目标特征信息数量从所述初始特征集合中选取若干特征信息,得到所述应用的候选特征集合。
6.如权利要求5所述的特征处理方法,其特征在于,根据所述目标特征信息数量从所述初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,包括:
根据所述特征信息数量多次从所述初始特征集合中选取若干特征信息,得到所述应用的多个备选特征集合;
根据所述备选特征集合所包含的特征类型从多个备选特征集合选取所述应用的候选特征集合。
7.一种特征处理装置,其特征在于,包括:
特征选取单元,用于从应用的初始特征集合中选取若干特征信息,得到所述应用的候选特征集合,所述候选特征集合的特征信息数量小于所述初始特征集合的特征信息数量;
结果获取单元,用于根据所述候选特征集合以及应用清理预测模型获取所述应用的当前预测结果;
判断单元,用于判断所述当前预测结果与参考预测结果之间的误差信息是否满足预设条件,所述参考预测结果为基于所述初始特征集合以及应用清理预测模型得到的预测结果;
更新单元,用于当所述误差信息不满足预设条件时,将所述初始特征集合更新为当前的候选特征集合以及将所述参考预测结果更新为所述当前预测结果,并返回触发所述选取单元执行从所述初始特征集合中选取若干特征信息的步骤直到出现误差信息满足预设条件为止;
确定单元,用于当出现误差信息满足预设条件时,将当前的初始特征集合作为所述应用清理预测模型的基准特征集合。
8.如权利要求7所述的特征处理装置,其特征在于,所述参考预测结果包括参考预测值,所述当前预测结果包括当前预测值;所述判断单元,用于:
获取所述当前预测值与所述参考预测值之间的差值;
判断所述差值是否大于预设阈值;
若是,则确定所述当前预测结果与所述参考预测结果之间的误差信息满足预设条件。
9.如权利要求7所述的特征处理装置,其特征在于,所述特征选取单元,包括:
类型选取子单元,用于从所述初始特征集合的特征类型中选取相应的目标特征类型;
第一特征选取子单元,用于根据所述目标特征类型从所述初始特征集合中选取若干特征信息。
10.如权利要求9所述的特征处理装置,其特征在于,所述类型选取子单元,用于:
获取所述应用清理预测模型的模型类型;
根据应用清理预测模型的模型类型从所述初始特征集合的特征类型中选取相应的目标特征类型。
11.如权利要求7所述的特征处理装置,其特征在于,所述特征选取单元,包括:
数量确定子单元,用于根据预设规则确定需要选取的目标特征信息数量,所述目标特征信息数量小于所述初始特征集合的特征信息数量;
第二特征选取子单元,用于根据所述目标特征信息数量从所述初始特征集合中选取若干特征信息,得到所述应用的候选特征集合。
12.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至6任一项所述的特征处理方法。
13.一种电子设备,包括处理器和存储器,所述存储器有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至6任一项所述的特征处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711122527.1A CN107943582B (zh) | 2017-11-14 | 2017-11-14 | 特征处理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711122527.1A CN107943582B (zh) | 2017-11-14 | 2017-11-14 | 特征处理方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107943582A true CN107943582A (zh) | 2018-04-20 |
CN107943582B CN107943582B (zh) | 2020-08-04 |
Family
ID=61934053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711122527.1A Expired - Fee Related CN107943582B (zh) | 2017-11-14 | 2017-11-14 | 特征处理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107943582B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753163A (zh) * | 2020-07-08 | 2020-10-09 | 北京鼎泰智源科技有限公司 | 一种数据采集方法 |
CN112256354A (zh) * | 2020-11-25 | 2021-01-22 | Oppo(重庆)智能科技有限公司 | 应用启动方法、装置、存储介质及电子设备 |
CN113191824A (zh) * | 2021-05-24 | 2021-07-30 | 北京大米科技有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
CN113439253A (zh) * | 2019-04-12 | 2021-09-24 | 深圳市欢太科技有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN114268625A (zh) * | 2020-09-14 | 2022-04-01 | 腾讯科技(深圳)有限公司 | 特征选择方法、装置、设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040221121A1 (en) * | 2003-04-30 | 2004-11-04 | International Business Machines Corporation | Method and system for automated memory reallocating and optimization between logical partitions |
US20130332431A1 (en) * | 2012-06-12 | 2013-12-12 | International Business Machines Corporation | Closed itemset mining using difference update |
CN104200216A (zh) * | 2014-09-02 | 2014-12-10 | 武汉大学 | 一种多特征提取逐步求精的高速移动目标跟踪算法 |
CN104254848A (zh) * | 2011-08-19 | 2014-12-31 | 哈佛蒸汽锅炉检验和保险公司 | 动态离群值偏倚减少系统和方法 |
CN104573741A (zh) * | 2014-12-24 | 2015-04-29 | 杭州华为数字技术有限公司 | 一种特征选择方法及装置 |
US9036196B2 (en) * | 2009-04-20 | 2015-05-19 | Kabushiki Kaisha Toshiba | Method for setting a processing condition in an image processing apparatus |
CN105528652A (zh) * | 2015-12-03 | 2016-04-27 | 北京金山安全软件有限公司 | 一种预测模型的建立方法及终端 |
CN105893153A (zh) * | 2016-03-31 | 2016-08-24 | 北京百纳威尔无线通信设备有限公司 | 移动终端的内存清理方法和装置 |
CN106095942A (zh) * | 2016-06-12 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 强变量提取方法及装置 |
CN106775809A (zh) * | 2016-11-15 | 2017-05-31 | 北京奇虎科技有限公司 | 一种移动终端内存清理的方法、装置及移动终端 |
US9772886B2 (en) * | 2013-01-28 | 2017-09-26 | Hewlett Packard Enterprise Development Lp | Optimizing execution and resource usage in large scale computing |
-
2017
- 2017-11-14 CN CN201711122527.1A patent/CN107943582B/zh not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040221121A1 (en) * | 2003-04-30 | 2004-11-04 | International Business Machines Corporation | Method and system for automated memory reallocating and optimization between logical partitions |
US9036196B2 (en) * | 2009-04-20 | 2015-05-19 | Kabushiki Kaisha Toshiba | Method for setting a processing condition in an image processing apparatus |
CN104254848A (zh) * | 2011-08-19 | 2014-12-31 | 哈佛蒸汽锅炉检验和保险公司 | 动态离群值偏倚减少系统和方法 |
US20130332431A1 (en) * | 2012-06-12 | 2013-12-12 | International Business Machines Corporation | Closed itemset mining using difference update |
US9772886B2 (en) * | 2013-01-28 | 2017-09-26 | Hewlett Packard Enterprise Development Lp | Optimizing execution and resource usage in large scale computing |
CN104200216A (zh) * | 2014-09-02 | 2014-12-10 | 武汉大学 | 一种多特征提取逐步求精的高速移动目标跟踪算法 |
CN104573741A (zh) * | 2014-12-24 | 2015-04-29 | 杭州华为数字技术有限公司 | 一种特征选择方法及装置 |
CN105528652A (zh) * | 2015-12-03 | 2016-04-27 | 北京金山安全软件有限公司 | 一种预测模型的建立方法及终端 |
CN105893153A (zh) * | 2016-03-31 | 2016-08-24 | 北京百纳威尔无线通信设备有限公司 | 移动终端的内存清理方法和装置 |
CN106095942A (zh) * | 2016-06-12 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 强变量提取方法及装置 |
CN106775809A (zh) * | 2016-11-15 | 2017-05-31 | 北京奇虎科技有限公司 | 一种移动终端内存清理的方法、装置及移动终端 |
Non-Patent Citations (2)
Title |
---|
冯宗翰,: "特征选择新算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 * |
苏映雪: "特征选择算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113439253A (zh) * | 2019-04-12 | 2021-09-24 | 深圳市欢太科技有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN113439253B (zh) * | 2019-04-12 | 2023-08-22 | 深圳市欢太科技有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN111753163A (zh) * | 2020-07-08 | 2020-10-09 | 北京鼎泰智源科技有限公司 | 一种数据采集方法 |
CN114268625A (zh) * | 2020-09-14 | 2022-04-01 | 腾讯科技(深圳)有限公司 | 特征选择方法、装置、设备及存储介质 |
CN114268625B (zh) * | 2020-09-14 | 2024-01-02 | 腾讯科技(深圳)有限公司 | 特征选择方法、装置、设备及存储介质 |
CN112256354A (zh) * | 2020-11-25 | 2021-01-22 | Oppo(重庆)智能科技有限公司 | 应用启动方法、装置、存储介质及电子设备 |
CN112256354B (zh) * | 2020-11-25 | 2023-05-16 | Oppo(重庆)智能科技有限公司 | 应用启动方法、装置、存储介质及电子设备 |
CN113191824A (zh) * | 2021-05-24 | 2021-07-30 | 北京大米科技有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107943582B (zh) | 2020-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107943582A (zh) | 特征处理方法、装置、存储介质及电子设备 | |
CN108337358B (zh) | 应用清理方法、装置、存储介质及电子设备 | |
Azeem et al. | A churn prediction model for prepaid customers in telecom using fuzzy classifiers | |
CN107678799B (zh) | 应用程序管控方法、装置、存储介质及电子设备 | |
CN107678845A (zh) | 应用程序管控方法、装置、存储介质及电子设备 | |
CN108764304A (zh) | 场景识别方法、装置、存储介质及电子设备 | |
CN107870810A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN105320957A (zh) | 分类器训练方法和装置 | |
CN107894827A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107678800A (zh) | 后台应用清理方法、装置、存储介质及电子设备 | |
CN107704289A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN109961077A (zh) | 性别预测方法、装置、存储介质及电子设备 | |
CN107632697A (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
CN107678531B (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107943534A (zh) | 后台应用程序的关闭方法、装置、存储介质及电子设备 | |
CN108108455A (zh) | 目的地的推送方法、装置、存储介质及电子设备 | |
CN107748697A (zh) | 应用关闭方法、装置、存储介质及电子设备 | |
CN107807730A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107643925A (zh) | 后台应用清理方法、装置、存储介质及电子设备 | |
CN107943571A (zh) | 后台应用管控方法、装置、存储介质及电子设备 | |
CN109961075A (zh) | 用户性别预测方法、装置、介质及电子设备 | |
CN107704364B (zh) | 后台应用程序管控方法、装置、存储介质及电子设备 | |
CN107861769A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107943537A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN109961163A (zh) | 性别预测方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200804 |
|
CF01 | Termination of patent right due to non-payment of annual fee |