CN108255522A - 一种应用程序分类方法及装置 - Google Patents

一种应用程序分类方法及装置 Download PDF

Info

Publication number
CN108255522A
CN108255522A CN201611223923.9A CN201611223923A CN108255522A CN 108255522 A CN108255522 A CN 108255522A CN 201611223923 A CN201611223923 A CN 201611223923A CN 108255522 A CN108255522 A CN 108255522A
Authority
CN
China
Prior art keywords
application program
feature
value
program
characteristic value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611223923.9A
Other languages
English (en)
Inventor
孙楠
侯婉瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd, Beijing Kingsoft Cloud Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN201611223923.9A priority Critical patent/CN108255522A/zh
Publication of CN108255522A publication Critical patent/CN108255522A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种应用程序分类方法及装置,该方法包括:获取目标应用程序针对各类预设程序特征的程序特征值;根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得目标应用程序的目标综合程序特征值;根据目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定目标应用程序的相似应用程序;根据相似应用程序所属的分类,确定目标应用程序的分类。应用本发明实施例,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。

Description

一种应用程序分类方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种应用程序分类方法及装置。
背景技术
应用程序与系统程序相对应,是用户可以使用的各种程序设计语言、以及用各种程序设计语言编制的应用程序的集合,分为应用程序包和用户程序。应用程序包是利用计算机解决某类问题而设计的程序的集合,供多用户使用。
随着手机等移动终端性能的提高和可下载的应用程序规模的极速增长,用户在选择应用程序时将面对更大的噪声,有效的对大规模应用程序进行分类并打上标签从而提高用户的体验成为占据市场的重要技术手段。目前对于新应用的分类,是由运营人员以逐个审核的方式进行分类,这种分类方式主要依赖运营人员的主观判断,受运营人员工作经验影响较大,可能会导致分类存在较大误差,且运营人员工作压力大,工作效率低下。
发明内容
本发明实施例的目的在于提供一种应用程序分类方法及装置,以实现自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。具体技术方案如下:
第一方面,为达到上述目的,本发明实施例提供一种应用程序分类分类方法,方法包括:
获取目标应用程序针对各类预设程序特征的程序特征值;
根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值;
根据所述目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定所述目标应用程序的相似应用程序,其中,每一应用程序的综合程序特征值为:根据所述各类预设程序特征的权重对该应用程序针对各类预设特征的特征值进行加权计算得到的;
根据所述相似应用程序所属的分类,确定所述目标应用程序的分类。
较佳的,在所述相似应用程序包括至少两个应用程序时,在所述根据所述相似应用程序所属的分类,确定所述目标应用程序的分类之前,所述方法还包括:
根据所述目标综合程序特征值与所述相似应用程序的综合程序特征值,获得各个相似应用程序与所述目标应用程序的相似概率;
分别计算所获得的每两个相似概率之间的差值的绝对值;
确定计算得到的绝对值中的最大值,在所述最大值大于预设指标值的情况下,重新获取所述目标应用程序针对各个预设特征的程序特征值,并返回执行根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值的步骤。
较佳的,所述预设程序特征包括以下特征中的一种:
应用程序的画风特征;
应用程序的运行方式特征;
应用程序的网络连接状态特征;
应用程序的操作方式特征。
较佳的,在所述预设程序特征包括应用程序的画风特征时,所述获取目标应用程序针对各类预设程序特征的程序特征值,包括:
获得所述目标应用程序的目标画面;
在第二数据库中搜索与所述目标画面相似的第一画面,其中,所述第二数据库,用于存储各个应用程序的画面;
确定搜索到的第一画面所对应的第一应用程序;
根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
较佳的,所述在第二数据库中搜索与所述目标画面相似的第一画面,包括:
获取所述目标画面针对各类预设画面特征的画面特征值;
根据预先设置的各类预设画面特征的权重,对所获取的画面特征值进行加权计算,获得所述目标画面的目标综合画面特征值;
根据所述目标综合画面特征值和第二数据库中各个画面的综合画面特征值,通过第一启发式搜索算法,在所述第二数据库中搜索与所述目标画面相似的第一画面,其中,每一应用程序的综合画面特征值为:根据各类预设画面特征的权重对该应用程序针对各类预设画面特征进行加权计算得到的。
较佳的,在所述预设程序特征包括应用程序的运行方式特征时,所述获取目标应用程序针对各类预设程序特征的程序特征值,包括:
判断所述目标应用程序是否存在服务端;
如果是,确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值;
如果否,确定所述目标应用程序针对运行方式特征的特征值为表示单机版运行方式的特征值。
较佳的,在所述预设程序特征包括应用程序的网络连接状态特征时,在所述确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值之后,还包括:
根据所述目标应用程序所采用的传输控制协议,确定所述目标应用程序的目标计费方式;
根据所述目标计费方式,确定所述目标应用程序针对网络连接状态特征的特征值。
较佳的,在所述预设程序特征包括应用程序的操作方式特征时,所述获取目标应用程序针对各类预设特征的特征值,包括:
获取所述目标应用程序的目标操作数据;
对所述目标操作数据进行统计分析,确定所述目标操作数据与时间的关联关系;
将所述目标操作数据和所述关联关系输入到预先建立的操作方式分类模型,获得所述目标应用程序针对操作方式的分类结果,其中,所述操作方式分类模型为:预先训练得到的操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系的模型;
根据所述分类结果,获得所述目标应用程序针对操作方式特征的特征值。
较佳的,所述操作方式分类模型为:采用第二启发式搜索算法进行求解的分类模型。
第二方面,为达到上述目的,本发明实施例还提供了一种应用程序分类装置,所述装置包括:
获取模块,用于获取目标应用程序针对各类预设程序特征的程序特征值;
第一获得模块,用于根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值;
第一确定模块,用于根据所述目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定所述目标应用程序的相似应用程序,其中,每一应用程序的综合程序特征值为:根据所述各类预设程序特征的权重对该应用程序针对各类预设特征的特征值进行加权计算得到的;
第二确定模块,用于根据所述相似应用程序所属的分类,确定所述目标应用程序的分类。
较佳的,在所述相似应用程序包括至少两个应用程序时,所述装置还包括:
第二获得模块,用于根据所述目标综合程序特征值与所述相似应用程序的综合程序特征值,获得各个相似应用程序与所述目标应用程序的相似概率;
计算模块,用于分别计算所获得的每两个相似概率之间的差值的绝对值;
重新获取模块,用于确定计算得到的绝对值中的最大值,在所述最大值大于预设指标值的情况下,重新获取所述目标应用程序针对各类预设程序特征的程序特征值,并返回执行所述第一获得模块。
较佳的,所述预设程序特征包括以下特征中的一种:
应用程序的画风特征;
应用程序的运行方式特征;
应用程序的网络连接状态特征;
应用程序的操作方式特征。
较佳的,在所述预设程序特征包括应用程序的画风特征时,所述获取模块,包括:
第一获得子模块,用于获得所述目标应用程序的目标画面;
搜索子模块,用于在第二数据库中搜索与所述目标画面相似的第一画面,其中,所述第二数据库,用于存储各个应用程序的画面;
第一确定子模块,用于确定搜索到的第一画面所对应的第一应用程序;
第一获取子模块,用于根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
较佳的,所述搜索子模块,包括:
获取单元,用于获取所述目标画面针对各类预设画面特征的画面特征值;
获得单元,用于根据预先设置的各类预设画面特征的权重,对所获取的画面特征值进行加权计算,获得所述目标画面的目标综合画面特征值;
搜索单元,用于根据所述目标综合画面特征值和第二数据库中各个画面的综合画面特征值,通过第一启发式搜索算法,在所述第二数据库中搜索与所述目标画面相似的第一画面,其中,所述每一应用程序的综合画面特征值为:根据各类预设画面特征的权重对该应用程序针对各类预设画面特征进行加权计算得到的。
较佳的,在所述预设程序特征包括应用程序的运行方式特征时,所述获取模块,包括:
判断子模块,用于判断所述目标应用程序是否存在服务端;
第二确定子模块,用于在所述判断子模块的判断结果为是的情况下,确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值;
第三确定子模块,用于在所述判断子模块的判断结果为否的情况下,确定所述目标应用程序针对运行方式特征的特征值为表示单机版运行方式的特征值。
较佳的,在所述预设程序特征包括应用程序的网络连接状态特征时,所述获取模块,还包括:
第四确定子模块,用于根据所述目标应用程序所采用的传输控制协议,确定所述目标应用程序的目标计费方式;
第五确定子模块,用于根据所述目标计费方式,确定所述目标应用程序针对网络连接状态特征的特征值。
较佳的,在所述预设程序特征包括应用程序的操作方式特征时,所述获取模块,包括:
第二获取子模块,用于获取所述目标应用程序的目标操作数据;
第六确定子模块,用于对所述目标操作数据进行统计分析,确定所述目标操作数据与时间的关联关系;
第二获得子模块,用于将所述目标操作数据和所述关联关系输入到预先建立的操作方式分类模型,获得所述目标应用程序针对操作方式的分类结果,其中,所述操作方式分类模型为:预先训练得到的操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系的模型;
第三获得子模块,用于根据所述分类结果,获得所述目标应用程序针对操作方式特征的特征值。
较佳的,所述操作方式分类模型为:采用第二启发式搜索算法进行求解的分类模型。
本发明实施例提供的应用程序分类方法及装置,可以根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,本发明实施例实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的应用程序分类方法的第一种流程示意图;
图2为本发明实施例提供的应用程序分类方法的第二种流程示意图;
图3为本发明实施例提供的应用程序分类方法的第三种流程示意图;
图4为本发明实施例提供的应用程序分类方法的第四种流程示意图;
图5为本发明实施例提供的应用程序分类方法的第五种流程示意图;
图6为本发明实施例提供的应用程序分类方法的第六种流程示意图;
图7为本发明实施例提供的应用程序分类方法的第七种流程示意图;
图8为本发明实施例提供的应用程序分类装置的第一种结构示意图;
图9为本发明实施例提供的应用程序分类装置的第二种结构示意图;
图10为本发明实施例提供的应用程序分类装置的第三种结构示意图;
图11为本发明实施例提供的应用程序分类装置的第四种结构示意图;
图12为本发明实施例提供的应用程序分类装置的第五种结构示意图;
图13为本发明实施例提供的应用程序分类装置的第六种结构示意图;
图14为本发明实施例提供的应用程序分类装置的第七种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决现有技术中存在的技术问题,本发明实施例提供了一种应用程序分类方法及装置,下面首先对应用程序分类方法进行说明。
图1为本发明实施例提供的应用程序分类方法的第一种流程示意图,方法包括:
S101:获取目标应用程序针对各类预设程序特征的程序特征值。
具体的,所述预设程序特征可以包括以下特征中的一种:
应用程序的画风特征;
应用程序的运行方式特征;
应用程序的网络连接状态特征;
应用程序的操作方式特征。
需要说明的是,这里所说的画风是指应用程序场景中的画面的笔法和构图,可以理解为画面的美术风格,示例性的,游戏是一类应用程序,以游戏为例,游戏的画风特征可以包括:武侠写实画风、仙侠唯美画风、卡通Q版画风、西式魔幻画风、日式动漫画风等等;阅读类的应用程序的画风可以包括:写实画风、卡通画风、水墨画风等等。
示例性的,应用程序的运行方式特征可以包括:单机版运行方式和网络版运行方式,单机版运行方式可以理解为具有单机版运行方式的应用程序,不需要专门的服务器就可以正常运行;网络版运行方式可以为具有理解为具有网络版运行方式的应用程序,需要依赖专门的服务器才可以正常运行。
示例性的,应用程序的网络联网状态特征包括:强联网和弱联网,强联网是在应用程序的运行过程中,实时与专门的服务器保持连接,进行数据的交换,以便应用程序的正常运行;弱联网是在应用程序的运行过程中,与专门的服务器连接主要为了数据存盘、计费等操作,可以理解为在与专门的服务器断开连接时,该应用程序可以运行;在与专门的服务器连接时,可以实现特定的功能或运行特定的内容。可以理解的是,弱联网的应用程序,在网络环境不稳定的情况下,也可以运行。这里所说的专门的服务器为应用程序运营商专门为该应用程序配置的服务器,使得应用程序可以通过网络与专门的服务器远程连接。
示例性的,应用程序的操作方式特征可以包括:鼠标操作方式、键盘操作方式、触控操作方式、手柄操作方式等等。需要说明的是,鼠标操作方式是指应用程序的运行主要通过鼠标对应用程序进行操作;键盘操作方式是指应用程序的运行主要通过键盘对应用程序进行操作;触控操作方式是指应用程序的运行主要通过触控方式实现对应用程序进行操作;例如,触屏手机中安装有目标应用程序,在该目标应用程序运行时,可以在触屏手机的屏幕上进行点击、滑动、拖动等操作实现对目标应用程序的控制;手柄操作方式是通过应用程序对应的手柄对应用程序进行操作。
需要说明的是,同一种应用程序,安装在不同的设备上,操作方式可能不同,例如,安装在触摸设置上,该应用程序的操作方式特征可以为触控操作方式,安装在电脑上,该应用程序的操作方式特征可以为鼠标操作方式、键盘操作方式或手柄操作方式;安装在电视机上,该应用程序的操作方式特征可以为手柄操作方式。
需要说明的是,当确定目标应用程序的各类预设程序特征后,可以根据预设程序特征与程序特征值之间的对应关系,获取目标应用程序针对各类预设应用程序的程序特征值,示例性的,目标应用程序的画风特征为武侠写实画风,则可以获取该武侠写实画风对应的程序特征值。需要说明的是,每一类预设程序特征可以包括多个程序子特征,对每个子程序特征均设置了权重,这样实现对目标综合程序特征值更加精准地计算,示例性的,预设程序特征为画风特征,则画风特征对应的画风子特征为:场景子特征、人物形象子特征等等。
标签可以理解为事物的分类标记,从应用程序的角度而言,标签则是对应用程序的某些功能或内容的分类标记。可以理解的是,在本发明实施例中,每一类预设程序特征对应着一类标签,例如,应用程序的画风是武侠写实画风,则该应用程序的画风标签可以为武侠写实画风。在本发明实施例,对应用程序进行分类,即可以理解为根据分类结果,给应用程序添加上标签,以使得用户可以根据应用程序的标签选择心仪的应用程序,提高用户体验。
S102:根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值。
需要说明的是,针对不同的预设程序特征,可以设置相同的权重,也可以设置不同的权重,在实际应用中,针对各类程序特征设置的权重进行归一化处理之后,所有权重的总和等于1。
加权计算是统计学中的一个概念,可以根据各类预设程序特征的程序特征值和该预设程序特征对应的权重,可以计算得到目标应用应用程序的目标综合程序特征值。
S103:根据所述目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定所述目标应用程序的相似应用程序,其中,每一应用程序的综合程序特征值为:根据所述各类预设程序特征的权重对该应用程序针对各类预设特征的特征值进行加权计算得到的。
需要说明的是,各个应用程序的综合程序特征值可以预先进行加权计算并存储到第一数据库中,也可以在获取该应用程序的综合程序特征值的时候,进行加权计算得到的。各个应用程序的综合程序特征值的计算方法与目标应用程序的目标综合程序特征值的计算方法相同,在这里不进行赘述。
在实际应用中,可以将目标综合程序特征值逐个与各个应用程序的综合程序特征值进行比较,计算目标综合程序特征值与每一综合程序特征值的差值的绝对值,将在预设阈值之内的绝对值对应的应用程序确定为相似应用程序。当然,还可以根据启发式搜索算法,将搜索到的应用程序的综合程序特征值与目标综合程序特征值进行对比,并记录该综合程序特征值与目标综合程序特征值的差值的绝对值,重复进行搜索、对比及记录的步骤,直至搜索完成,根据所记录的绝对值,确定相似应用程序。
可以理解的是,启发式搜索算法是在状态空间中的搜索对每一个搜索的位置进行评估,得到最好的位置,再从这个位置进行搜索直到目标的算法,这样可以省略大量无谓的搜索路径,提高了效率。启发式搜索算法包括:蚁群算法,遗传算法、模拟退火算法等,蚁群算法是一种来自大自然的随机搜索寻优方法,是生物界的群体启发式行为,现己陆续应用到组合优化、人工智能、通讯等多个领域;遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法;模拟退火算法是通过赋予搜索过程一种时变且最终趋于零的概率突跳性,从而可有效避免陷入局部极小并最终趋于全局最优的串行结构的优化算法。
S104:根据所述相似应用程序所属的分类,确定所述目标应用程序的分类。
可以理解的是,在第一数据库中每个应用程序都存在其所属的分类,将相似应用程序的分类确定为目标应用程序的分类。示例性的,相似应用程序为游戏A,游戏A所属的分类为MMO(Massive Multiplayer Online,大型多人在线)类型,则目标应用程序的分类为MMO类型;相似应用程序是应用程序A,应用程序A所属的分类为团购,则目标应用程序的分类为团购类型。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,本发明实施例实现了自动对应用程序进行分类。
图2为本发明实施例所提供的任务应用程序分类的第二种流程示意图。基于图1所提供的实施例,本发明实施例所提供的应用程序分类方法,在所述相似应用程序包括至少两个应用程序时,在S104之前,还包括S105、S106和S107,其中,
S105:根据所述目标综合程序特征值与所述相似应用程序的综合程序特征值,获得各个相似应用程序与所述目标应用程序的相似概率。
在实际应用中,相似概率可以根据以下计算公式计算得到:
示例性的,目标综合程序特征值为50,相似应用程序为应用程序1,应用程序1的综合程序特征值为40,则目标应用程序与目标应用程序的相似概率为80%。当然,并不仅限于上述确定相似概率的方法,在这里不进行一一列举。
S106:分别计算所获得的每两个相似概率之间的差值的绝对值。
示例性的,假设相似应用程序为应用程序1、应用程序2和应用程序3,这三个应用程序与目标应用程序的相似概率如表1所示。
表1
应用程序 相似概率
应用程序1 80%
应用程序2 85%
应用程序3 82%
分别计算这三个相似概率每两个相似概率之间的差值的绝对值,获得的绝对值,如表2所示。
表2
差值绝对值
应用程序1与应用程序2 5%
应用程序1与应用程序3 2%
应用程序2与应用程序3 3%
S107:确定计算得到的绝对值中的最大值,在所述最大值大于预设指标值的情况下,重新获取所述目标应用程序针对各类预设程序特征的程序特征值,并返回S102。
示例性的,根据表2可知,差值中的最大值为5%,如果预设指标值为3%,则重新获取目标应用程序针对各类预设程序特征的程序特征值,并返回执行S102。如果差值中的最大值不大于预设指标值,则根据相似应用程序所属的分类,确定目标应用程序的分类,即执行S104。在本发明实施例中,还可以根据目标应用程序与相似应用程序的相似概率,为目标应用程序添加上分类结果和相似概率的标签。
在本发明实施例中,可以对目标应用程序的类别自动分辨,实现针对应用程序的智能分类。同时,由于是自动对应用程序进行分类,不再需要运营依据工作经验进行手工分类,减轻了运维人员的工作压力,也降低了对运营人员工作经验的依赖,提高了工作效率。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
图3为本发明实施例所提供的应用程序分类方法的第三种流程示意图。与图1所提供的实施例相比,在本发明实施例中,在所述预设程序特征包括应用程序的画风特征时,获取目标应用程序针对各类预设程序特征的程序特征值(S101)包括:
S1011:获得所述目标应用程序的目标画面。
在实际应用中,可以抓取目标应用程序不同场景中的画面作为目标画面,具体的,可以在不同的场景中,间隔相同的时间抓取画面;也可以实时对目标应用程序中的不同场景中的画面进行抓取,将抓取到的画面作为目标画面。进一步地,需要对抓取的画面进行预处理,将抓取的画面中重复的画面去除,将抓取的画面中不清楚或画质不符合预设要求的画面去除,这样去除了干扰画面,使得确定出的目标应用程序针对画风特征的特征值更加精确。需要说明的是,目标画面中包含了至少一个画面。
S1012:在第二数据库中搜索与所述目标画面相似的第一画面,其中,所述第二数据库,用于存储各个应用程序的画面。
需要说明的是,这里所说的第二数据库与上述所说的第一数据库可以为同一个数据库,也可以为不同的数据库。在实际应用中,可以在第二数据库存储的画面中进行搜索,将搜索到画面与目标画面进行对比,从而确定第一画面,这里所说的搜索可以是逐个搜索,也可以是按照一定的规则进行搜索,当然,并不不仅限于上述搜索的方法,在这里不进行一一列举。
S1013:确定搜索到的第一画面所对应的第一应用程序。
在实际应用中,画面与应用程序之间存在对应关系,当其中的一者确定,另一者也随之确定,可以根据该对应关系,确定第一画面所对应的第一应用程序。
S1014:根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
由于第一画面是目标画面的相似画面,所以第一应用程序与目标应用程序针对画面特征的特征值相似的概率较高,因此,可以根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
第一应用程序的画风特征是预先确定的,在本发明实施例中,如果第一应用程序一个时,则该第一应用程序针对画风特征的特征值,即为目标应用程序针对画风的特征值,示例性的,第一应用程序的画风特征为仙侠唯美画风,根据画风特征与特征值之间的关系,假设确定仙侠唯美画风对应的特征值为10,则目标应用程序的画风特征为仙侠唯美画风,针对画风特征的特征值为10。如果第一应用程序有多个时,可以针对每一应用程序的画风特征的特征值设置一个权重,对各个应用程序的画风特征的特征值进行加权计算,获得第一应用程序的综合画风特征值;目标应用程序针对画风的特征值为该综合画风特征值;还可以在第一应用程序中选择一个与目标应用程序相似程度最高的应用程序,目标应用程序针对画风的特征值为所选择的应用程序的画风特征的特征值,当然,并不仅限于上述确定目标应用程序针对画风的特征值的方法,在这里不进行一一列举。
在本发明实施例中,可以确定目标应用程序的画风特征,以及针对该画风特征的特征值。确定目标应用程序的画风特征,可以基于画风特征维度对目标应用程序的分类,即对目标与应用程序添加上画风特征的标签,实现对应用程序进行详细分类。同时,用户可以根据画风特征的标签选择感兴趣的应用程序,提高用户体验。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类。
图4为本发明实施例所提供的应用程序分类方法的第四种流程示意图。与图3所提供的实施例相比,在本发明实施例中在第二数据库中搜索与所述目标画面相似的第一画面(S1011)包括:
S1011A:获取所述目标画面针对各类预设画面特征的画面特征值。
画面特征为具有感染价值并可以体现设计内涵的基本元素。示例性的,目标应用程序为游戏,预设画面特征可以包括:游戏场景、特效、道具、角色或UI(User Interface,用户界面)设计等等,目标应用程序为阅读应用程序时,预设画面特征可以包括:背景、字体、按钮、交互方式等等。当目标画面确定之后,各类预设画面特征具体的内容也随之确定,可以根据各类预设画面特征与画面特征值的对应关系,获取目标画面针对各类预设画面特征的画面特征值。
S1011B:根据预先设置的各类预设画面特征的权重,对所获取的画面特征值进行加权计算,获得所述目标画面的目标综合画面特征值。
需要说明的是,针对不同的预设画面特征,可以设置相同的权重,也可以设置不同的权重,在实际应用中,针对各类画面特征设置的权重进行归一化处理之后,所有权重的总和等于1。
具体的,获得目标综合画面特征值的原理与上述获得目标综合程序特征值的原理相似,在这里不赘述。
S1011C:根据所述目标综合画面特征值和第二数据库中各个画面的综合画面特征值,通过第一启发式搜索算法,在所述第二数据库中搜索与所述目标画面相似的第一画面,其中,每一应用程序的综合画面特征值为:根据各类预设画面特征的权重对该应用程序针对各类预设画面特征进行加权计算得到的。
需要说明的是,在本发明实施例中,是通过图像识别算法识别出搜索到的画面中各类预设画面特征,根据识别出的各类预设画面特征与特征值之间的对应关系,确定搜索到画面对应的应用程序的综合画面特征值,图像识别算法为图像识别算法,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的算法。
具体的,搜索得到第一画面的原理与获取相似应用程序的原理相似,在这里不进行赘述。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
图5为本发明实施例所提供的应用程序分类方法的第五种流程示意图。与图1所提供的实施例相比,在本发明实施例中,在所述预设程序特征包括应用程序的运行方式特征时,获取目标应用程序针对各类预设程序特征的程序特征值(S101)包括:
S1015:判断所述目标应用程序是否存在服务端。
在实际应用中,可以针对目标应用程序各类数据进行采集并记录,记录的数据中存在用于测试目标应用程序有无服务端程序的回调值,根据该回调值,判断目标应用程序是否存在服务端。在判断目标应用程序存在服务端的情况下,执行S1016;在判断目标应用程序不存在服务端的情况下,执行S1017。
S1016:确定所述目标程序针对运行方式特征的特征值为表示网络版运行方式的特征值。
在实际应用中,如果该回调值为预设值时,可以判断该目标应用程序存在服务器,则确定该目标应用程序的运行方式特征为网络版运行方式,同时根据预先设置的网络版运行方式对应的特征值,确定目标应用程序针对运行方式特征的特征值。
S1017:确定所述目标应用程序针对运行方式特征的特征值为表示单机版运行方式的特征值。
在实际应用中,如果该回调值为非预设值时,可以判断该目标应用程序不存在服务器,则确定该目标应用程序的运行方式特征为单机版运行方式,同时根据预先设置的单机版运行方式对应的特征值,确定目标应用程序针对运行方式特征的特征值。
在本发明实施例中,可以确定目标应用程序的运行方式特征,以及针对该运行方式特征的特征值。确定目标应用程序的运行方式特征,可以基于运行方式特征维度对目标应用程序的分类,即对目标与应用程序添加上运行方式特征的标签,实现对应用程序进行详细分类。同时,用户可以根据运行方式特征的标签选择感兴趣的应用程序,提高用户体验。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类。
图6为本发明实施例所提供的应用程序分类方法的第六种流程示意图。与图5所提供的实施例相比,在本发明实施例中,所述预设程序特征包括应用程序的网络连接状态特征时,在所述确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值之后,获取目标应用程序针对各类预设程序特征的程序特征值(S101)还包括:
S1018:根据所述目标应用程序所采用的传输控制协议,确定所述目标应用程序的目标计费方式。
传输控制协议(Transmission Control Protocol,TCP)是一种面向连接的、可靠的、基于字节流的传输层通信协议。根据TCP协议,通过判断是目标应用程序是否实时与专门的服务器进行数据传输,确定目标计费方式,如果是,则可以确定目标计费方式为WIFI(WIreless-Fidelity,无线保真)或GPRS(General Packet Radio Service,通用分组无线服务)稳定情况下计费,如果否,则可以确定目标计费方式为短信计费。这里所说的计费为目标应用程序与专门的服务器进行数据传输的花费,示例性的,花费可以为网络流量的消耗,短信计费可以为将网络流量的消耗转换为金钱上的费用,通过短信向目标应用程序的用户收取该费用。需要说明的是,如果WIFI或GPRS不稳定,目标应用程序与专门的服务器之间的数据传输不能正常地进行,则目标应用程序不能正常地运行。
S1019:根据所述目标计费方式,确定所述目标应用程序针对网络连接状态特征的特征值。
在实际应用中,如果目标计费方式是短信计费,则说明目标应用程序不需要实时与专门的服务器进行数据交换,可以确定目标应用程序针对网络连接状态特征为弱联网特征;如果目标计费方式是WIFI或GPRS稳定情况下计费,则说明目标应用程序需要实时与专门的服务器进行数据交换,可以确定目标应用程序针对网络连接状态特征为强联网特征。
强联网特征与弱联网特征分别对应着预先设置的特征值,一旦目标应用程序针对网络连接状态特征确定,针对网络连接状态特征的特征值也随之确定。
在本发明实施例中,可以确定目标应用程序的网络连接状态特征,以及针对该网络连接状态特征的特征值。确定目标应用程序的网络连接状态特征,可以基于网络连接状态特征维度对目标应用程序的分类,即对目标与应用程序添加上网络连接状态特征的标签,实现对应用程序进行详细分类。同时,用户可以根据网络连接状态特征的标签选择感兴趣的应用程序,提高用户体验。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
图7为本发明实施例所提供的应用程序分类方法的第七种流程示意图。与图1所提供的实施例相比,在本发明实施例中,在所述预设程序特征包括应用程序的操作方式特征时,获取目标应用程序针对各类预设程序特征的程序特征值(S101)还包括:
S10110:获取所述目标应用程序的目标操作数据。
操作数据是对正在运行的应用程序进行操作,产生的数据。具体的,操作数据的获取方法为:通过应用程序采集系统获取应用程序的使用者、手机端测试机及电脑模拟器运行目标应用程序时的操作数据,
在本发明实施例中,可以通过应用程序信息过滤系统提取应用程序采集系统采集的操作数据,对所提取的操作数据进行预处理,将重复的操作数据剔除,将与提取的操作数据中与所需要的操作数据明显不相关的操作数据剔除,从而,获得目标操作数据。需要说明的是,采集数据、存储数据及提取数据均是现有技术,在这里不进行赘述。
示例性的,获取的目标操作数据可以为:鼠标点击、拖动频率和拖动速率、键盘的敲打频率和高频率键盘键以及特定时间戳内鼠标点击速率、点击次数、拖动频率和拖动次数,这里所说的高频率键盘键是在统计的时间段内,使用次数排在预设排名之前或超过预设阈值的键盘键。
S10111:对所述目标操作数据进行统计分析,确定所述目标操作数据与时间的关联关系。
在本发明实施例中,在目标操作数据包括多个类型的数据时,可以统计在一个固定时间间隔内,各个类型的数据出现的次数、频率、速率等等,示例性的,在目标操作数据包括鼠标点击次数时,可以统计在2秒内鼠标点击的次数。在对目标操作数据进行统计之后,分析统计之后的目标操作数据与时间的关系,示例性的,分析统计后的目标操作数据随时间的变化趋势。具体的,建立统计后的目标操作数据与时间的曲线图,根据该曲线图,分析目标操作数据与时间的关系,从而确定目标操作数据与时间的关联关系,当然,并不仅限于上述确定关联关系的方法,在这里不进行一一列举。需要说明的是,可以利用现有的统计分析方法对目标操作数据进行统计分析,也可以设计统计分析方法对对目标操作数据进行统计分析,在本发明实施例中,并不限定对目标操作数据进行统计分析,只要确定目标操作数据与时间的关联关系即可。
S10112:将所述目标操作数据和所述关联关系输入到预先建立的操作方式分类模型,获得所述目标应用程序针对操作方式的分类结果,其中,所述操作方式分类模型为:预先训练得到的操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系的模型。
具体的,所述操作方式分类模型为:采用第二启发式搜索算法进行求解的分类模型。
需要说明的是,操作方式分类模型可以是一种数学模型,是依据预先训练得到的操作数据、操作数据与时间、操作方式分类三者之间对应关系建立的,不同类型的应用程序所采用的操作方式分类模型可以相同也可以不同,主要由操作方式决定的。同一个应用程序,在不同的应用场景下,因为操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系不同,可以采用不同的操作方式分类模型。
S10113:根据所述分类结果,获得所述目标应用程序针对操作方式特征的特征值。
在实际应用中,分类结果与操作方式特征之间存在对应关系,可以理解为每一种操作方式特征对应着一个数值范围,将分类结果与操作方式特征的数值范围进行匹配,将匹配到的操作方式特征确定为目标应用程序的操作方式特征。每一种操作方式特征均预先设置一个特征值,在确定了目标应用程序的操作方式特征之后,目标应用程序针对操作方式特征的特征值也随之确定。
在本发明实施例中,可以确定目标应用程序的操作方式特征,以及针对该操作方式特征的特征值。确定目标应用程序的操作方式特征,可以基于操作方式特征维度对目标应用程序的分类,即对目标与应用程序添加上操作方式特征的标签,实现对应用程序进行详细分类。同时,用户可以根据运行方式特征的标签选择感兴趣的应用程序,提高用户体验。
需要说明的是,在本发明实施例中,对应用程序进行分类,可以根据实际情况选择不同维度分类的结果,根据分类结果,给应用程序添加上标签,以使得用户可以根据标签选择自身感兴趣的应用程序。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图1所示的方法实施例相对应,图8为本发明实施例提供的应用程序分类装置的第一种结构示意图,装置包括:获取模块201、第一获得模块202、第一确定模块203和第二确定模块204。
获取模块201,用于获取目标应用程序针对各类预设程序特征的程序特征值。
第一获得模块202,用于根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值。
具体的,所述预设程序特征包括以下特征中的一种:
应用程序的画风特征;
应用程序的运行方式特征;
应用程序的网络连接状态特征;
应用程序的操作方式特征。
第一确定模块203,用于根据所述目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定所述目标应用程序的相似应用程序,其中,每一应用程序的综合程序特征值为:根据所述各类预设程序特征的权重对该应用程序针对各类预设特征的特征值进行加权计算得到的。
第二确定模块204,用于根据所述相似应用程序所属的分类,确定所述目标应用程序的分类。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图2所示的方法实施例相对应,图9为本发明实施例提供的应用程序分类装置的第二种结构示意图,装置还可以包括:第二获得模块205、计算模块206和重新获取模块207。
第二获得模块205,用于根据所述目标综合程序特征值与所述相似应用程序的综合程序特征值,获得各个相似应用程序与所述目标应用程序的相似概率;
计算模块206,用于分别计算所获得的每两个相似概率之间的差值的绝对值;
重新获取模块,用于确定计算得到的绝对值中的最大值,在所述最大值大于预设指标值的情况下,重新获取所述目标应用程序针对各个预设特征的特征值,并返回执行所述第一获得模块202。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图3所示的方法实施例相对应,图10为本发明实施例提供的应用程序分类装置的第三种结构示意图,在所述预设程序特征包括应用程序的画风特征时,所述获取模块201,包括第一获得子模块2011、搜索子模块2012、第一确定子模块2013和第一获取子模块2014。
第一获得子模块2011,用于获得所述目标应用程序的目标画面;
搜索子模块2012,用于在第二数据库中搜索与所述目标画面相似的第一画面,其中,所述第二数据库,用于存储各个应用程序的画面;
第一确定子模块2013,用于确定搜索到的第一画面所对应的第一应用程序;
第一获取子模块2014,用于根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图4所示的方法实施例相对应,图11为本发明实施例提供的应用程序分类装置的第四种结构示意图,所述搜索子模块2012,包括获取单元2012A、获得单元2012B和搜索单元2012C,其中,
获取单元2012A,用于获取所述目标画面针对各类预设画面特征的画面特征值;
获得单元2012B,用于根据预先设置的各类预设画面特征的权重,对所获取的画面特征值进行加权计算,获得所述目标画面的目标综合画面特征值;
搜索单元2012C,用于根据所述目标综合画面特征值和第二数据库中各个画面的综合画面特征值,通过第一启发式搜索算法,在所述第二数据库中搜索与所述目标画面相似的第一画面,其中,所述每一应用程序的综合画面特征值为:根据各类预设画面特征的权重对该应用程序针对各类预设画面特征进行加权计算得到的。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图5所示的方法实施例相对应,图12为本发明实施例提供的应用程序分类装置的第五种结构示意图,在所述预设程序特征包括应用程序的运行方式特征时,所述获取模块201,包括判断子模块2015、第二确定子模块2016和第三确定子模块2017。
判断子模块2015,用于判断所述目标应用程序是否存在服务端;
第二确定子模块2016,用于在所述判断子模块2015的判断结果为是的情况下,确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值;
第三确定子模块2017,用于在所述判断子模块2015的判断结果为是的情况下,确定所述目标应用程序针对运行方式特征的特征值为表示单机版运行方式的特征值。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图6所示的方法实施例相对应,图13为本发明实施例提供的应用程序分类装置的第六种结构示意图,在所述预设程序特征包括应用程序的网络连接状态特征时,所述获取模块201,还包括第四确定子模块2018和第五确定子模块2019。
第四确定子模块2018,用于根据所述目标应用程序所采用的传输控制协议,确定所述目标应用程序的目标计费方式;
第五确定子模块2019,用于根据所述目标计费方式,确定所述目标应用程序针对网络连接状态特征的特征值。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
与图7所示的方法实施例相对应,图14为本发明实施例提供的应用程序分类装置的第七种结构示意图,在所述预设程序特征包括应用程序的操作方式特征时,所述获取模块,包括第二获取子模块20110、第六确定子模块20111、第二获得子模块20112和第三获得子模块20113。
第二获取子模块20110,用于获取所述目标应用程序的目标操作数据;
第六确定子模块20111,用于对所述目标操作数据进行统计分析,确定所述目标操作数据与时间的关联关系;
第二获得子模块20112,用于将所述目标操作数据和所述关联关系输入到预先建立的操作方式分类模型,获得所述目标应用程序针对操作方式的分类结果,其中,所述操作方式分类模型为:预先训练得到的操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系的模型;
具体的,所述操作方式分类模型为:采用第二启发式搜索算法进行求解的分类模型。
第三获得子模块20113,用于根据所述分类结果,获得所述目标应用程序针对操作方式特征的特征值。
应用本发明实施例,根据目标应用程序的目标综合程序特征值和各个应用程序的综合程序特征值,确定目标应用程序员的相似应用程序,根据相似应用程序所属的分类,确定目标应用程序的分类,相较于现有技术中手动地对应用程序进行分类,实现了自动对应用程序进行分类,降低对运营人员工作经验的依赖,减轻运营人员的工作压力,提高工作效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (18)

1.一种应用程序分类方法,其特征在于,所述方法包括:
获取目标应用程序针对各类预设程序特征的程序特征值;
根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值;
根据所述目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定所述目标应用程序的相似应用程序,其中,每一应用程序的综合程序特征值为:根据所述各类预设程序特征的权重对该应用程序针对各类预设特征的程序特征值进行加权计算得到的;
根据所述相似应用程序所属的分类,确定所述目标应用程序的分类。
2.根据权利要求1所述的方法,其特征在于,在所述相似应用程序包括至少两个应用程序时,在所述根据所述相似应用程序所属的分类,确定所述目标应用程序的分类之前,所述方法还包括:
根据所述目标综合程序特征值与所述相似应用程序的综合程序特征值,获得各个相似应用程序与所述目标应用程序的相似概率;
分别计算所获得的每两个相似概率之间的差值的绝对值;
确定计算得到的绝对值中的最大值,在所述最大值大于预设指标值的情况下,重新获取所述目标应用程序针对各类预设程序特征的程序特征值,并返回执行根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值的步骤。
3.根据权利要求1或2所述的方法,其特征在于,所述预设程序特征包括以下特征中的一种:
应用程序的画风特征;
应用程序的运行方式特征;
应用程序的网络连接状态特征;
应用程序的操作方式特征。
4.根据权利要求3所述的方法,其特征在于,在所述预设程序特征包括应用程序的画风特征时,所述获取目标应用程序针对各类预设程序特征的程序特征值,包括:
获得所述目标应用程序的目标画面;
在第二数据库中搜索与所述目标画面相似的第一画面,其中,所述第二数据库,用于存储各个应用程序的画面;
确定搜索到的第一画面所对应的第一应用程序;
根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
5.根据权利要求4所述的方法,其特征在于,所述在第二数据库中搜索与所述目标画面相似的第一画面,包括:
获取所述目标画面针对各类预设画面特征的画面特征值;
根据预先设置的各类预设画面特征的权重,对所获取的画面特征值进行加权计算,获得所述目标画面的目标综合画面特征值;
根据所述目标综合画面特征值和第二数据库中各个画面的综合画面特征值,通过第一启发式搜索算法,在所述第二数据库中搜索与所述目标画面相似的第一画面,其中,每一应用程序的综合画面特征值为:根据各类预设画面特征的权重对该应用程序针对各类预设画面特征进行加权计算得到的。
6.根据权利要求3所述的方法,其特征在于,在所述预设程序特征包括应用程序的运行方式特征时,所述获取目标应用程序针对各类预设程序特征的程序特征值,包括:
判断所述目标应用程序是否存在服务端;
如果是,确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值;
如果否,确定所述目标应用程序针对运行方式特征的特征值为表示单机版运行方式的特征值。
7.根据权利要求6所述的方法,其特征在于,在所述预设程序特征包括应用程序的网络连接状态特征时,在所述确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值之后,还包括:
根据所述目标应用程序所采用的传输控制协议,确定所述目标应用程序的目标计费方式;
根据所述目标计费方式,确定所述目标应用程序针对网络连接状态特征的特征值。
8.根据权利要求4-7中任一项所述的方法,其特征在于,在所述预设程序特征包括应用程序的操作方式特征时,所述获取目标应用程序针对各类预设特征的特征值,包括:
获取所述目标应用程序的目标操作数据;
对所述目标操作数据进行统计分析,确定所述目标操作数据与时间的关联关系;
将所述目标操作数据和所述关联关系输入到预先建立的操作方式分类模型,获得所述目标应用程序针对操作方式的分类结果,其中,所述操作方式分类模型为:预先训练得到的操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系的模型;
根据所述分类结果,获得所述目标应用程序针对操作方式特征的特征值。
9.根据权利要求8所述的方法,其特征在于,
所述操作方式分类模型为:采用第二启发式搜索算法进行求解的分类模型。
10.一种应用程序分类装置,其特征在于,所述装置包括:
获取模块,用于获取目标应用程序针对各类预设程序特征的程序特征值;
第一获得模块,用于根据预先设置的各类预设程序特征的权重,对所获取的程序特征值进行加权计算,获得所述目标应用程序的目标综合程序特征值;
第一确定模块,用于根据所述目标综合程序特征值、第一数据库中已记录程序信息的各个应用程序的综合程序特征值,从各个应用程序中确定所述目标应用程序的相似应用程序,其中,每一应用程序的综合程序特征值为:根据所述各类预设程序特征的权重对该应用程序针对各类预设特征的特征值进行加权计算得到的;
第二确定模块,用于根据所述相似应用程序所属的分类,确定所述目标应用程序的分类。
11.根据权利要求10所述的装置,其特征在于,在所述相似应用程序包括至少两个应用程序时,所述装置还包括:
第二获得模块,用于根据所述目标综合程序特征值与所述相似应用程序的综合程序特征值,获得各个相似应用程序与所述目标应用程序的相似概率;
计算模块,用于分别计算所获得的每两个相似概率之间的差值的绝对值;
重新获取模块,用于确定计算得到的绝对值中的最大值,在所述最大值大于预设指标值的情况下,重新获取所述目标应用程序针对各个预设特征的特征值,并返回执行所述第一获得模块。
12.根据权利要求10或11所述的装置,其特征在于,所述预设程序特征包括以下特征中的一种:
应用程序的画风特征;
应用程序的运行方式特征;
应用程序的网络连接状态特征;
应用程序的操作方式特征。
13.根据权利要求12所述的装置,其特征在于,在所述预设程序特征包括应用程序的画风特征时,所述获取模块,包括:
第一获得子模块,用于获得所述目标应用程序的目标画面;
搜索子模块,用于在第二数据库中搜索与所述目标画面相似的第一画面,其中,所述第二数据库,用于存储各个应用程序的画面;
第一确定子模块,用于确定搜索到的第一画面所对应的第一应用程序;
第一获取子模块,用于根据所确定的第一应用程序针对画风特征的特征值,获取所述目标应用程序针对画风特征的特征值。
14.根据权利要求13所述的装置,其特征在于,所述搜索子模块,包括:
获取单元,用于获取所述目标画面针对各类预设画面特征的画面特征值;
获得单元,用于根据预先设置的各类预设画面特征的权重,对所获取的画面特征值进行加权计算,获得所述目标画面的目标综合画面特征值;
搜索单元,用于根据所述目标综合画面特征值和第二数据库中各个画面的综合画面特征值,通过第一启发式搜索算法,在所述第二数据库中搜索与所述目标画面相似的第一画面,其中,所述每一应用程序的综合画面特征值为:根据各类预设画面特征的权重对该应用程序针对各类预设画面特征进行加权计算得到的。
15.根据权利要求12所述的装置,其特征在于,在所述预设程序特征包括应用程序的运行方式特征时,所述获取模块,包括:
判断子模块,用于判断所述目标应用程序是否存在服务端;
第二确定子模块,用于在所述判断子模块的判断结果为是的情况下,确定所述目标应用程序针对运行方式特征的特征值为表示网络版运行方式的特征值;
第三确定子模块,用于在所述判断子模块的判断结果为否的情况下,确定所述目标应用程序针对运行方式特征的特征值为表示单机版运行方式的特征值。
16.根据权利要求15所述的装置,其特征在于,在所述预设程序特征包括应用程序的网络连接状态特征时,所述获取模块,还包括:
第四确定子模块,用于根据所述目标应用程序所采用的传输控制协议,确定所述目标应用程序的目标计费方式;
第五确定子模块,用于根据所述目标计费方式,确定所述目标应用程序针对网络连接状态特征的特征值。
17.根据权利要求13-16中任一项所述的装置,其特征在于,在所述预设程序特征包括应用程序的操作方式特征时,所述获取模块,包括:
第二获取子模块,用于获取所述目标应用程序的目标操作数据;
第六确定子模块,用于对所述目标操作数据进行统计分析,确定所述目标操作数据与时间的关联关系;
第二获得子模块,用于将所述目标操作数据和所述关联关系输入到预先建立的操作方式分类模型,获得所述目标应用程序针对操作方式的分类结果,其中,所述操作方式分类模型为:预先训练得到的操作数据、操作数据与时间的关联关系及操作方式分类三者之间对应关系的模型;
第三获得子模块,用于根据所述分类结果,获得所述目标应用程序针对操作方式特征的特征值。
18.根据权利要求17所述的装置,其特征在于,
所述操作方式分类模型为:采用第二启发式搜索算法进行求解的分类模型。
CN201611223923.9A 2016-12-27 2016-12-27 一种应用程序分类方法及装置 Pending CN108255522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611223923.9A CN108255522A (zh) 2016-12-27 2016-12-27 一种应用程序分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611223923.9A CN108255522A (zh) 2016-12-27 2016-12-27 一种应用程序分类方法及装置

Publications (1)

Publication Number Publication Date
CN108255522A true CN108255522A (zh) 2018-07-06

Family

ID=62719280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611223923.9A Pending CN108255522A (zh) 2016-12-27 2016-12-27 一种应用程序分类方法及装置

Country Status (1)

Country Link
CN (1) CN108255522A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190635A (zh) * 2020-01-03 2020-05-22 拉扎斯网络科技(上海)有限公司 确定应用程序的特征数据的方法、装置、设备及存储介质

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101788987A (zh) * 2009-01-23 2010-07-28 北京大学 一种网络资源类别的自动判定方法
CN103020845A (zh) * 2012-12-14 2013-04-03 百度在线网络技术(北京)有限公司 一种移动应用的推送方法及系统
CN103176688A (zh) * 2011-12-26 2013-06-26 腾讯科技(深圳)有限公司 分类应用的方法和装置
CN103577252A (zh) * 2012-07-26 2014-02-12 腾讯科技(深圳)有限公司 一种软件分类的方法及装置
CN103577462A (zh) * 2012-08-02 2014-02-12 北京百度网讯科技有限公司 一种文档分类方法及装置
CN103955536A (zh) * 2014-05-15 2014-07-30 深圳市中兴移动通信有限公司 应用程序的分类方法和装置
CN104504140A (zh) * 2015-01-04 2015-04-08 中国联合网络通信集团有限公司 终端桌面图标的分类方法和装置
CN104750798A (zh) * 2015-03-19 2015-07-01 腾讯科技(深圳)有限公司 一种应用程序的推荐方法和装置
CN104899009A (zh) * 2014-03-03 2015-09-09 可牛网络技术(北京)有限公司 一种安卓应用的识别方法及装置
CN105446592A (zh) * 2015-11-11 2016-03-30 北京麒麟合盛网络技术有限公司 一种应用图标的分类显示方法和设备
CN105488084A (zh) * 2014-12-24 2016-04-13 哈尔滨安天科技股份有限公司 基于树同构的软件安装包分类方法及系统
CN105528138A (zh) * 2015-12-01 2016-04-27 小米科技有限责任公司 应用程序图标分组方法及装置
CN105630975A (zh) * 2015-12-24 2016-06-01 联想(北京)有限公司 一种信息处理方法和电子设备
CN105677695A (zh) * 2015-09-28 2016-06-15 杭州圆橙科技有限公司 一种基于内容的计算移动应用相似性的方法
CN105843637A (zh) * 2016-03-18 2016-08-10 广东欧珀移动通信有限公司 一种应用程序的分类方法及用户终端
CN105893470A (zh) * 2016-03-28 2016-08-24 乐视控股(北京)有限公司 终端、服务器及软件分类方法
CN105956083A (zh) * 2016-04-29 2016-09-21 广州优视网络科技有限公司 应用软件分类系统、应用软件分类方法及服务器
CN106156401A (zh) * 2016-06-07 2016-11-23 西北工业大学 基于多组合分类器的数据驱动系统状态模型在线辨识方法
CN106202427A (zh) * 2016-07-12 2016-12-07 腾讯科技(深圳)有限公司 应用处理方法及装置

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101788987A (zh) * 2009-01-23 2010-07-28 北京大学 一种网络资源类别的自动判定方法
CN103176688A (zh) * 2011-12-26 2013-06-26 腾讯科技(深圳)有限公司 分类应用的方法和装置
CN103577252A (zh) * 2012-07-26 2014-02-12 腾讯科技(深圳)有限公司 一种软件分类的方法及装置
CN103577462A (zh) * 2012-08-02 2014-02-12 北京百度网讯科技有限公司 一种文档分类方法及装置
CN103020845A (zh) * 2012-12-14 2013-04-03 百度在线网络技术(北京)有限公司 一种移动应用的推送方法及系统
CN104899009A (zh) * 2014-03-03 2015-09-09 可牛网络技术(北京)有限公司 一种安卓应用的识别方法及装置
CN103955536A (zh) * 2014-05-15 2014-07-30 深圳市中兴移动通信有限公司 应用程序的分类方法和装置
CN105488084A (zh) * 2014-12-24 2016-04-13 哈尔滨安天科技股份有限公司 基于树同构的软件安装包分类方法及系统
CN104504140A (zh) * 2015-01-04 2015-04-08 中国联合网络通信集团有限公司 终端桌面图标的分类方法和装置
CN104750798A (zh) * 2015-03-19 2015-07-01 腾讯科技(深圳)有限公司 一种应用程序的推荐方法和装置
CN105677695A (zh) * 2015-09-28 2016-06-15 杭州圆橙科技有限公司 一种基于内容的计算移动应用相似性的方法
CN105446592A (zh) * 2015-11-11 2016-03-30 北京麒麟合盛网络技术有限公司 一种应用图标的分类显示方法和设备
CN105528138A (zh) * 2015-12-01 2016-04-27 小米科技有限责任公司 应用程序图标分组方法及装置
CN105630975A (zh) * 2015-12-24 2016-06-01 联想(北京)有限公司 一种信息处理方法和电子设备
CN105843637A (zh) * 2016-03-18 2016-08-10 广东欧珀移动通信有限公司 一种应用程序的分类方法及用户终端
CN105893470A (zh) * 2016-03-28 2016-08-24 乐视控股(北京)有限公司 终端、服务器及软件分类方法
CN105956083A (zh) * 2016-04-29 2016-09-21 广州优视网络科技有限公司 应用软件分类系统、应用软件分类方法及服务器
CN106156401A (zh) * 2016-06-07 2016-11-23 西北工业大学 基于多组合分类器的数据驱动系统状态模型在线辨识方法
CN106202427A (zh) * 2016-07-12 2016-12-07 腾讯科技(深圳)有限公司 应用处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190635A (zh) * 2020-01-03 2020-05-22 拉扎斯网络科技(上海)有限公司 确定应用程序的特征数据的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111522733B (zh) 众包测试人员推荐与众包测试方法及电子装置
CN109409677A (zh) 企业信用风险评估方法、装置、设备及存储介质
CN108416198A (zh) 人机识别模型的建立装置、方法及计算机可读存储介质
CN103902597B (zh) 确定目标关键词所对应的搜索相关性类别的方法和设备
CN107391760A (zh) 用户兴趣识别方法、装置及计算机可读存储介质
CN108229341A (zh) 分类方法和装置、电子设备、计算机存储介质、程序
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN110610193A (zh) 标注数据的处理方法及装置
CN108280458A (zh) 群体关系类型识别方法及装置
CN110163647A (zh) 一种数据处理方法及装置
CN110349000A (zh) 基于用户分群的提额策略确定方法、装置和电子设备
CN109978033A (zh) 同操作人识别模型的构建与同操作人识别的方法和装置
CN109522692B (zh) 网页机器行为检测方法及系统
CN110490625A (zh) 用户偏好确定方法及装置、电子设备、存储介质
CN110096681A (zh) 合同条款分析方法、装置、设备及可读存储介质
CN107918825A (zh) 一种基于应用安装偏好判定用户年龄段的方法和装置
CN107273979A (zh) 基于服务级别来执行机器学习预测的方法及系统
CN109858482A (zh) 一种图像关键区域检测方法及其系统、终端设备
CN109508879A (zh) 一种风险的识别方法、装置及设备
CN106605219B (zh) 用于对移动应用程序进行分析的方法及系统
CN110415103A (zh) 基于变量影响度指标进行用户分群提额的方法、装置和电子设备
CN110349007A (zh) 基于变量区分度指标进行用户分群提额的方法、装置和电子设备
CN109412839A (zh) 一种异常账户的识别方法、装置、设备及存储介质
CN109602421A (zh) 健康监测方法、装置及计算机可读存储介质
CN108960884A (zh) 信息处理方法、模型构建方法及装置、介质和计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180706