CN106681716B - 智能终端及其应用程序的自动分类方法 - Google Patents

智能终端及其应用程序的自动分类方法 Download PDF

Info

Publication number
CN106681716B
CN106681716B CN201611139789.4A CN201611139789A CN106681716B CN 106681716 B CN106681716 B CN 106681716B CN 201611139789 A CN201611139789 A CN 201611139789A CN 106681716 B CN106681716 B CN 106681716B
Authority
CN
China
Prior art keywords
probability
classification
feature
classified
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611139789.4A
Other languages
English (en)
Other versions
CN106681716A (zh
Inventor
叶锌尧
王兵
冯科
赖一骏
胡亚军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Internet Service Co ltd
Original Assignee
Jiekai Communications Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiekai Communications Shenzhen Co Ltd filed Critical Jiekai Communications Shenzhen Co Ltd
Priority to CN201611139789.4A priority Critical patent/CN106681716B/zh
Publication of CN106681716A publication Critical patent/CN106681716A/zh
Priority to PCT/CN2017/113012 priority patent/WO2018107953A1/zh
Application granted granted Critical
Publication of CN106681716B publication Critical patent/CN106681716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种智能终端及其应用程序的自动分类方法,只需采样智能终端中多个应用程序的配置文件的特征,并结合朴素贝叶斯算法即可对待分类的应用程序进行分类,无需依赖于云端服务器的大数据支持,也无需将这部分大数据内置于智能终端,并且可表现为纯软件算法实现分类,维护简单,可移植性较强,且分类结果准确。

Description

智能终端及其应用程序的自动分类方法
技术领域
本发明涉及智能电子设备技术领域,具体涉及一种智能终端及其应用程序的自动分类方法。
背景技术
随着电子技术的快速发展以及智能终端的大规模普及应用,可被智能终端安装的应用程序达到了百亿量级,因此如何对所要下载及安装的应用程序进行有效的分类与管理显得越来越重要。当前市场上的应用程序分类方法一般是基于云端服务器的大数据支持,或者将这部分大数据内置于智能终端。不过这类方法运算量大,维护复杂,可移植性较弱。
发明内容
鉴于此,本发明实施例提供一种智能终端及其应用程序的自动分类方法,无需依赖于云端服务器的大数据支持,也无需将这部分大数据内置于智能终端,维护简单,可移植性较强,且分类结果准确。
本发明一实施例的应用程序的自动分类方法,包括:从已划分为至少两个分类的多个应用程序的配置文件中提取有效特征;计算每个有效特征在各个分类中出现的概率;根据每个有效特征在各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器;从待分类的应用程序的配置文件中提取特征,并计算特征在各个分类中出现的概率;将特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
可选地,所述从已分类的多个应用程序的配置文件中提取有效特征的步骤,包括:从已分类的多个应用程序的配置文件中提取初始特征;获取每个分类中正向概率与逆向概率比值最大的初始特征,并将所述比值最大的初始特征作为有效特征。
可选地,所述初始特征的语种包括多类语种中的至少一类。
可选地,所述从待分类的应用程序的配置文件中提取特征的步骤,包括:对待分类的应用程序的配置文件进行语种识别,并对识别出的同一语种采用相同特征提取方法以得到特征。
可选地,所述根据每个有效特征在各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器的步骤,包括:将每个有效特征在各个分类中出现的概率转变为对数形式;所述得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个的步骤,包括:获取对数形式的特征在各个分类中出现的概率;将对数形式的特征在各个分类中出现的概率相加,并比较得到相加之和最大的一个。
本发明一实施例的智能终端,包括:提取模块,用于从已划分为至少两个分类的多个应用程序的配置文件中提取有效特征;计算模块,用于计算每个有效特征在各个分类中出现的概率;训练生成模块,用于根据每个有效特征在各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器;提取模块还用于从待分类的应用程序的配置文件中提取特征,计算模块还用于计算所述特征在各个分类中出现的概率;应用管理模块,用于将所述特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
可选地,提取模块从已分类的多个应用程序的配置文件中提取初始特征,并获取每个分类中正向概率与逆向概率比值最大的初始特征,从而将所述比值最大的初始特征作为有效特征。
可选地,所述初始特征的语种包括多类语种中的至少一类。
可选地,提取模块包括语言识别单元,用于对待分类的应用程序的配置文件进行语种识别,所述提取模块对识别出的同一语种采用相同特征提取方法以得到特征。
可选地,训练生成模块将每个有效特征在各个分类中出现的概率转变为对数形式;应用管理模块获取对数形式的所述特征在各个分类中出现的概率,并将对数形式的特征在各个分类中出现的概率相加,比较得到相加之和最大的一个,从而得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个。
有益效果:本发明实施例只需采样智能终端中多个应用程序的配置文件的特征,并结合朴素贝叶斯算法即可对待分类的应用程序进行分类,无需依赖于云端服务器的大数据支持,也无需将这部分大数据内置于智能终端,并且可表现为纯软件算法实现分类,维护简单,可移植性较强,且分类结果准确。
附图说明
图1是本发明的应用程序的自动分类方法一实施例的流程图;
图2是本发明的有效特征的提取方法一实施例的流程图;
图3是本发明的初始特征的提取方法一实施例的流程图;
图4是本发明的有效特征在分类中出现的概率的获取方法一实施例的流程图;
图5是本发明训练生成朴素贝叶斯分类器方法一实施例的流程图;
图6是本发明的未知应用程序的分类识别方法一实施例的流程图;
图7是本发明的应用程序的自动分类方法另一实施例的流程图;
图8是本发明的智能终端一实施例的原理框示意图;
图9是本发明的智能终端一实施例的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明所提供的各个示例性的实施例的技术方案进行清楚、完整地描述。在不冲突的情况下,下述各个实施例以及实施例中的特征可以相互组合。
请参阅图1,为本发明一实施例的应用程序的自动分类方法。所述应用程序的自动分类方法可以包括步骤S11~S15。
S11:从已划分为至少两个分类的多个应用程序的配置文件中提取有效特征。
S12:计算每个有效特征在各个分类中出现的概率。
S13:根据每个有效特征在各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器。
S14:从待分类的应用程序的配置文件中提取特征,并计算特征在各个分类中出现的概率。
S15:将特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
本发明实施例相当于为智能终端增加了一项未知应用程序自动分类的功能,所述未知应用程序可理解为从互联网上下载及所要安装的应用程序。在现实应用场景中,实现该功能的方式包括但不限于:以智能手机为例,首先,预先编程一脚本或程序,以在智能手机的设置界面中增加“未知应用程序自动分类”选项;然后,用户通过滑动滑块开启该选项。也就是说,本发明实施例可以通过能够在智能终端的操作系统上运行的脚本或程序自动进行上述步骤S11~S15。
上述方法可以分为三个阶段:第一阶段,建立特征库,包括步骤S11和S12;第二阶段,训练生成朴素贝叶斯分类器,包括步骤S13;第三阶段,识别未知应用程序的分类,包括步骤S14和S15。
第一阶段
本实施例可以从多个应用程序的配置文件中提取有效特征。参阅图2,提取有效特征的方法可以包括步骤S21和S22。
S21:从已分类的多个应用程序的配置文件中提取初始特征。
所述已分类的多个应用程序包括但不限于PMS(Plant Management System,设备管理系统)获取的终端已经下载及安装的应用程序,这些应用程序可视为已知分类的应用程序。
所述配置文件中包含有各个应用程序的ID(Identification,身份标识号)信息,例如labelRes(应用名地址)、descriptionRes(应用描述信息地址),从中获取应用程序的基准地址(又称首地址),并将其作为有效地址。而对于未能从ID中获取基准地址的情况,终端可以根据操作系统地址规则遍历该应用程序可能的地址,从而获取有效地址。
所述有效地址实际上就是一段字符串,终端提取其中的字符以作为初始特征。在提取过程中,终端可以对不同语种采用相对应的提取方法。具体地,终端可以采用ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)识别英语与其他语种的区别,以此筛选出配置文件中相同语种的有效地址。而后,针对不同语种使用不同的分词算法,分词后即可得到所述初始特征。也就是说,本实施例的初始特征的语种包括多类语种中的至少一类。
请结合图3,为本发明的提取初始特征一具体应用例,该具体应用实现本发明前述实施例的整个过程,在此不作赘述。
S22:获取每个分类中正向概率与逆向概率比值最大的初始特征,并将所述比值最大的初始特征作为有效特征。
鉴于采样的为已知分类的多个应用程序,即多个应用程序已经提前分类,本实施例可以建立多个文件夹,各个文件夹的命名为应用程序的包名,并建立多个文件夹与各个分类的一一映射关系。
对于通过分词算法得到的初始特征(字符串),本实施例计算每个分类的应用程序拥有某一初始特征的概率,即每个有效特征在各个分类中出现的概率,以作为该初始特征的正向概率,并且,计算不是该分类的应用程序拥有该初始特征的概率,以作为该初始特征的逆向概率。举例而言,以分类为Music的应用程序、初始特征为song为例,正向概率可理解为分类Music中拥有字符song的概率,逆向概率可理解为除分类Music之外的分类中拥有字符song的概率。正向概率和逆向概率是统计学领域普遍采用的概率统计方式,其计算原理及过程可参阅现有技术,此处不予以赘述。
进一步,对于各个分类中的各个初始特征,本实施例计算每一初始特征的正向概率与逆向概率的比值,并选取其中比值最大的初始特征作为该分类的有效特征。此步骤能够避免某一字符串作为有效特征在多个分类中重复出现,以减少后续对未知应用程序的分类的影响。
请结合图4,为本发明的计算每个有效特征在各个分类中出现的概率一具体应用例。在前述步骤S22之后,该具体应用将每个有效特征的正向概率作为其在各个分类中出现的概率。
第二阶段
结合图5所示,本实施可以以列表形式显示前述有效特征,以及统计的每个有效特征在各个分类中出现的概率。
结合朴素贝叶斯算法的关系式如下:
P(C│F1F2…Fn)=P(F1F2…Fn│C)*P(C)/P(F1F2…Fn)
P(F1F2…Fn│C)=P(F1│C)*P(F2│C)…P(Fn│C)
结合上述关系式,即可得到如下朴素贝叶斯关系式:
P(C│F1F2…Fn)=P(F1│C)*P(F2│C)…P(Fn│C)*P(C)/P(F1F2…Fn)
其中,F1,F2,…Fn表示各个有效特征,C表示其中一个分类,P(C│F1F2…Fn)表示当一个未知应用程序拥有F1,F2,…Fn这些特征时它是分类C的概率,P(F1F2…Fn│C)表示分类C拥有有效特征F1,F2,…Fn的概率,P(C)表示所有分类中为分类C的概率,P(F1F2…Fn)表示所有分类拥有有效特征F1,F2,…Fn的概率,P(F1│C)表示分类C中拥有有效特征F1的概率,P(F2│C)表示分类C中拥有有效特征F2的概率,P(Fn│C)表示分类C中拥有有效特征Fn的概率。
由于采样的有效特征较多,且计算得到的上述概率均小于1,上述多个概率相乘会出现尾数丢失的问题,因此本实施例优选将每个有效特征在各个分类中出现的概率转变为对数形式。也就是说,将上述朴素贝叶斯关系式进行对数转换,以得到如下对数关系式:
log(P(C│F1F2…Fn))=log(P(F1│C))+log(P(F2│C))…+log(P(Fn│C))+log(P(C))-log(P(F1F2…Fn))
该对数关系式即可视为朴素贝叶斯分类器。在该对数关系式中,多个分类中的各分类的log(P(C))和log(P(F1F2…Fn))相等,因此只需将以对数形式表示的各个分类中分别拥有有效特征F1,F2,…Fn的概率相加,并比较得到相加之和最大的一个,即可将未知应用程序划分为相加之和最大的分类。换言之,通过该关系式,本实施例可以得到在拥有有效特征F1,F2,…Fn时未知应用程序为相加之和最大的分类的正向概率,反言之,将关系式中的分类C换为多个分类中的其他分类,得到不是该相加之和最大的分类拥有有效特征F1,F2,…Fn的概率,即相加之和最大的分类的逆向概率。
第三阶段
结合图6所示,从待分类的应用程序的配置文件中提取特征,所述特征的提取方法与第一阶段的初始特征的提取方法相同,例如,首先从配置文件中包含的应用程序的ID信息中提取有效地址,而后对其进行语种识别,最后采用与识别的语种相对应的分词算法对有效地址的字符串进行分词,从而得到至少一个特征。进一步地,本阶段提取的特征属于第一阶段采样的有效特征的一部分,通过结合上述有效特征的正向概率即可得到本阶段提取的每个特征在各个分类中出现的概率。
如果本阶段提取的特征为F1,F3,F6,Fn,多个分类C包括A,B,D,则上述朴素贝叶斯分类器的对数关系式即可表示为:
log(P(C│F1F3F6Fn))=log(P(F1│C))+log(P(F3│C))+log(P(F6│C))+log(P(Fn│C))+log(P(C))-log(P(F1F3F6Fn))
将已知的特征在各个分类A,B,D中出现的概率log(P(F1│C))、log(P(F3│C))、log(P(F6│C))、log(P(Fn│C)),作为参数输入朴素贝叶斯分类器,基于前述中log(P(C))-log(P(F1F2…Fn))相等,因此只需比较log(P(F1│A))+log(P(F3│A))+log(P(F6│A))+log(P(Fn│A))、log(P(F1│B))+log(P(F3│B))+log(P(F6│B))+log(P(Fn│B))、log(P(F1│D))+log(P(F3│D))+log(P(F6│D))+log(P(Fn│D))中最大的一个,即可将待分类的应用程序划分为该相加之和最大的分类。
请参阅图7,为本发明的应用程序的自动分类方法一具体应用例。该应用例实现本发明前述实施例的整个过程,在此不作赘述。
由上述可知,本发明实施例只需采样智能终端中多个应用程序的配置文件的特征,并结合朴素贝叶斯算法即可对待分类的应用程序进行分类,无需依赖于云端服务器的大数据支持,也无需将这部分大数据内置于智能终端,也可以实现准确分类,维护方便,成本较低,并且可以适用于不同语种,通用性很高,另外上述各个步骤可由纯软件算法实现,即通过纯软件算法实现分类,维护简单,可移植性较强。
应该理解到,上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可存储在一个电子设备可读取存储介质中,即本发明实施例可以以软件产品的形式体现出来,其包括若干指令用以使得一台智能终端执行本发明各实施例所述方法的全部或部分步骤。
请参阅图8,为本发明一实施例的智能终端。所述终端80可以包括提取模块81、计算模块82、训练生成模块83和应用管理模块84。提取模块81用于从已划分为至少两个分类的多个应用程序的配置文件中提取有效特征。计算模块82用于计算每个有效特征在各个分类中出现的概率。训练生成模块83用于根据每个有效特征在各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器。提取模块81还用于从待分类的应用程序的配置文件中提取特征。计算模块82还用于计算所述特征在各个分类中出现的概率。应用管理模块84用于将所述特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
为了避免某一字符串作为有效特征在多个分类中重复出现,以减少后续对未知应用程序的分类的影响,所述提取模块81可以从已分类的多个应用程序的配置文件中提取初始特征,并获取每个分类中正向概率与逆向概率比值最大的初始特征,从而将所述比值最大的初始特征作为有效特征。
其中,初始特征的语种包括多类语种中的至少一类。提取模块81可以对不同语种采用相对应的提取方法,具体地,提取模块81的语言识别单元811对多个应用程序的配置文件进行语种识别,而后提取模块81采用相对应的分词算法得到初始特征。基于此,语言识别单元811可以对待分类的应用程序的配置文件进行语种识别,所述提取模块81对识别出的同一语种采用相同特征提取方法以得到特征。
由于采样的有效特征较多,且计算得到的上述概率均小于1,上述多个概率相乘会出现尾数丢失的问题,因此本实施例优选训练生成模块83将每个有效特征在各个分类中出现的概率转变为对数形式。对应地,在对未知应用程序进行分类时,应用管理模块84获取对数形式的所述特征在各个分类中出现的概率,并将对数形式的特征在各个分类中出现的概率相加,比较得到相加之和最大的一个,从而得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个。
本发明实施例的智能终端80的上述模块对应执行上述各个实施例的应用程序的自动分类方法,具有与其相同的技术效果。
应该理解到,上述模块的划分为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如两个模块可以集成到另一个系统中,或一些特征可以忽略,或不执行。另外,模块相互之间的连接可以通过一些接口,也可以是电性或其它形式。上述模块既可以采用软件功能框的形式实现,也可以采用例如图9所示的硬件的形式实现。
参阅图9,所述智能终端80包括至少一个处理器91、至少一个存储器92以及至少一个通信总线93,通信总线93用于处理器91调用各种数据,存储器92用于存储程序指令。为了方便说明,图9所示处理器91、存储器92以及通信总线93的数量为一个。
其中,所述处理器91用于:
执行程序指令以从已划分为至少两个分类的多个应用程序的配置文件中提取有效特征,并计算每个有效特征在各个分类中出现的概率;
执行程序指令以根据每个有效特征在各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器;
执行程序指令以从待分类的应用程序的配置文件中提取特征,并计计算所述特征在各个分类中出现的概率;
执行程序指令以将所述特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
为了避免某一字符串作为有效特征在多个分类中重复出现,以减少后续对未知应用程序的分类的影响,处理器91可以从已分类的多个应用程序的配置文件中提取初始特征,并获取每个分类中正向概率与逆向概率比值最大的初始特征,从而将比值最大的初始特征作为有效特征。
其中,初始特征的语种包括多类语种中的至少一类。处理器91可以对不同语种采用相对应的提取方法,具体地,处理器91对多个应用程序的配置文件进行语种识别,而后采用相对应的分词算法得到初始特征。基于此,处理器91可以对待分类的应用程序的配置文件进行语种识别,并对识别出的同一语种采用相同特征提取方法以得到特征。
由于采样的有效特征较多,且计算得到的上述概率均小于1,上述多个概率相乘会出现尾数丢失的问题,因此本实施例优选处理器91将每个有效特征在各个分类中出现的概率转变为对数形式。对应地,在对未知应用程序进行分类时,处理器91获取对数形式的所述特征在各个分类中出现的概率,并将对数形式的特征在各个分类中出现的概率相加,比较得到相加之和最大的一个,从而得到在具有所述特征时待分类的应用程序为各个分类的概率中最大的一个。
本发明实施例全文所述的终端(包括智能终端80)可以为智能手机、PDA(PersonalDigital Assistant,个人数字助理或平板电脑)等移动终端,也可以是佩戴于肢体或者嵌入于衣物、首饰、配件中的可穿戴设备,还可以是其他具有应用程序下载及安装的智能电子设备。
需要说明,以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,例如各实施例之间技术特征的相互结合,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种应用程序的自动分类方法,其特征在于,所述方法包括:
从已划分为至少两个分类的多个应用程序的配置文件中提取有效特征,其中,从已分类的多个应用程序的配置文件中提取初始特征,获取每个分类中正向概率与逆向概率比值最大的初始特征,并将所述比值最大的初始特征作为所述有效特征,所述初始特征的语种包括多类语种中的至少一类;
计算每个有效特征在所述各个分类中出现的概率;
根据每个有效特征在所述各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器;
对待分类的应用程序的配置文件进行语种识别,并对识别出的同一语种采用相同特征提取方法以得到特征,并计算所述特征在所述各个分类中出现的概率;
将所述特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时所述待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
2.根据权利要求1所述的方法,其特征在于,
所述根据每个有效特征在所述各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器的步骤,包括:
将每个有效特征在所述各个分类中出现的概率转变为对数形式;
所述得到在具有所述特征时所述待分类的应用程序为各个分类的概率中最大的一个的步骤,包括:
获取对数形式的所述特征在各个分类中出现的概率;
将对数形式的所述特征在同一个分类中出现的概率相加,并比较得到相加之和最大的一个。
3.一种智能终端,其特征在于,所述智能终端包括:
提取模块,用于从已分类的多个应用程序的配置文件中提取初始特征,并获取每个分类中正向概率与逆向概率比值最大的初始特征,从而将所述比值最大的初始特征作为有效特征,所述初始特征的语种包括多类语种中的至少一类;
计算模块,用于计算每个有效特征在所述各个分类中出现的概率;
训练生成模块,用于根据每个有效特征在所述各个分类中出现的概率以及朴素贝叶斯算法训练生成朴素贝叶斯分类器;
所述提取模块包括语言识别单元,所述语言识别单元用于对待分类的应用程序的配置文件进行语种识别,所述提取模块对识别出的同一语种采用相同特征提取方法以得到特征,所述计算模块还用于计算所述特征在所述各个分类中出现的概率;
应用管理模块,用于将所述特征在各个分类中出现的概率作为朴素贝叶斯分类器的输入参数,以得到在具有所述特征时所述待分类的应用程序为各个分类的概率中最大的一个,从而将待分类的应用程序划分为概率最大的分类。
4.根据权利要求3所述的智能终端,其特征在于,所述训练生成模块将每个有效特征在所述各个分类中出现的概率转变为对数形式;所述应用管理模块获取对数形式的所述特征在各个分类中出现的概率,并将对数形式的所述特征在同一个分类中出现的概率相加,比较得到相加之和最大的一个,从而得到在具有所述特征时所述待分类的应用程序为各个分类的概率中最大的一个。
CN201611139789.4A 2016-12-12 2016-12-12 智能终端及其应用程序的自动分类方法 Active CN106681716B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201611139789.4A CN106681716B (zh) 2016-12-12 2016-12-12 智能终端及其应用程序的自动分类方法
PCT/CN2017/113012 WO2018107953A1 (zh) 2016-12-12 2017-11-27 智能终端及其应用程序的自动分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611139789.4A CN106681716B (zh) 2016-12-12 2016-12-12 智能终端及其应用程序的自动分类方法

Publications (2)

Publication Number Publication Date
CN106681716A CN106681716A (zh) 2017-05-17
CN106681716B true CN106681716B (zh) 2020-05-22

Family

ID=58868050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611139789.4A Active CN106681716B (zh) 2016-12-12 2016-12-12 智能终端及其应用程序的自动分类方法

Country Status (2)

Country Link
CN (1) CN106681716B (zh)
WO (1) WO2018107953A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106681716B (zh) * 2016-12-12 2020-05-22 捷开通讯(深圳)有限公司 智能终端及其应用程序的自动分类方法
CN109144956A (zh) * 2018-08-27 2019-01-04 Tcl移动通信科技(宁波)有限公司 移动终端多文件分类处理方法、移动终端及存储介质
CN109214445A (zh) * 2018-08-27 2019-01-15 陆柒(北京)科技有限公司 一种基于人工智能的多标签分类方法
CN111597947A (zh) * 2020-05-11 2020-08-28 浙江大学 一种基于电源功率因数矫正噪声的应用程序推断方法
CN111880872A (zh) * 2020-06-28 2020-11-03 华为技术有限公司 一种管理应用程序app的方法、终端设备、服务器和系统
CN113656801B (zh) * 2021-08-19 2023-06-09 建信金融科技有限责任公司 Android恶意应用家族分类方法、服务器、终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361141A (zh) * 2014-12-11 2015-02-18 北京邮电大学 软件标识库的建立方法
CN104424307A (zh) * 2013-09-04 2015-03-18 腾讯科技(深圳)有限公司 一种智能终端应用程序分类方法、系统及智能终端
CN105468977A (zh) * 2015-12-14 2016-04-06 厦门安胜网络科技有限公司 一种基于朴素贝叶斯的Android恶意软件分类方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023974B1 (en) * 2007-02-15 2011-09-20 Trend Micro Incorporated Lightweight SVM-based content filtering system for mobile phones
CN102591983A (zh) * 2012-01-10 2012-07-18 凤凰在线(北京)信息技术有限公司 一种广告过滤系统及其过滤方法
CN106156120B (zh) * 2015-04-07 2020-02-28 阿里巴巴集团控股有限公司 对字符串进行分类的方法和装置
CN105956083A (zh) * 2016-04-29 2016-09-21 广州优视网络科技有限公司 应用软件分类系统、应用软件分类方法及服务器
CN106681716B (zh) * 2016-12-12 2020-05-22 捷开通讯(深圳)有限公司 智能终端及其应用程序的自动分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424307A (zh) * 2013-09-04 2015-03-18 腾讯科技(深圳)有限公司 一种智能终端应用程序分类方法、系统及智能终端
CN104361141A (zh) * 2014-12-11 2015-02-18 北京邮电大学 软件标识库的建立方法
CN105468977A (zh) * 2015-12-14 2016-04-06 厦门安胜网络科技有限公司 一种基于朴素贝叶斯的Android恶意软件分类方法和装置

Also Published As

Publication number Publication date
WO2018107953A1 (zh) 2018-06-21
CN106681716A (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN106681716B (zh) 智能终端及其应用程序的自动分类方法
US10796224B2 (en) Image processing engine component generation method, search method, terminal, and system
CN110046254B (zh) 用于生成模型的方法和装置
US9830316B2 (en) Content availability for natural language processing tasks
CN110162657B (zh) 一种基于高层语义特征和颜色特征的图像检索方法及系统
CN110321562B (zh) 一种基于bert的短文本匹配方法及装置
US10417285B2 (en) Corpus generation based upon document attributes
CN113221918B (zh) 目标检测方法、目标检测模型的训练方法及装置
CN112988753A (zh) 一种数据搜索方法和装置
CN107506407B (zh) 一种文件分类、调用的方法及装置
CN117743577A (zh) 文本分类方法、装置、电子设备及存储介质
CN111949766A (zh) 一种文本相似度的识别方法、系统、设备和存储介质
CN114970470B (zh) 文案信息处理方法、装置、电子设备和计算机可读介质
CN111949793A (zh) 用户意图识别方法、装置及终端设备
CN111783433A (zh) 一种文本检索纠错方法和装置
CN114444514B (zh) 语义匹配模型训练、语义匹配方法及相关装置
CN111460214B (zh) 分类模型训练方法、音频分类方法、装置、介质及设备
CN111079185B (zh) 数据库信息处理的方法、装置、存储介质及电子设备
CN114398484A (zh) 一种舆情分析方法、装置、设备及存储介质
CN113792876A (zh) 骨干网络的生成方法、装置、设备以及存储介质
CN107368597B (zh) 信息输出方法和装置
CN111444319A (zh) 文本匹配方法、装置和电子设备
CN112784596A (zh) 一种识别敏感词的方法和装置
US20200034439A1 (en) Image-Based Domain Name System
CN104484414A (zh) 一种收藏夹信息的处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230831

Address after: Room 1203, No. 2 Houkenanli, Haicang District, Xiamen City, Fujian Province, 361000

Patentee after: Xiamen Luan Chuang Technology Co.,Ltd.

Address before: 518063 16 floor, block B, North TCL building, Nanshan District science and technology south ten road, Shenzhen, Guangdong.

Patentee before: JRD COMMUNICATION (SHENZHEN) Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231115

Address after: Room 606-609, Compound Office Complex Building, No. 757, Dongfeng East Road, Yuexiu District, Guangzhou, Guangdong Province, 510699

Patentee after: China Southern Power Grid Internet Service Co.,Ltd.

Address before: Room 1203, No. 2 Houkenanli, Haicang District, Xiamen City, Fujian Province, 361000

Patentee before: Xiamen Luan Chuang Technology Co.,Ltd.