CN107657054A - 一种应用软件的筛选方法及服务设备 - Google Patents

一种应用软件的筛选方法及服务设备 Download PDF

Info

Publication number
CN107657054A
CN107657054A CN201710965327.6A CN201710965327A CN107657054A CN 107657054 A CN107657054 A CN 107657054A CN 201710965327 A CN201710965327 A CN 201710965327A CN 107657054 A CN107657054 A CN 107657054A
Authority
CN
China
Prior art keywords
application software
unloading
software
service equipment
popular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710965327.6A
Other languages
English (en)
Inventor
梁金宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201710965327.6A priority Critical patent/CN107657054A/zh
Publication of CN107657054A publication Critical patent/CN107657054A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及互联网技术领域,公开了一种应用软件的筛选方法及服务设备,包括:服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对上述应用软件的卸载次数,根据上述应用软件的卸载次数形成应用软件的卸载指数,并根据上述应用软件的卸载指数判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件,并将非热门应用软件的身份标识保存在数据库中。本发明实施例能够通过应用软件的卸载指数快速筛选出非热门应用软件,提高筛选应用软件的筛选效率。

Description

一种应用软件的筛选方法及服务设备
技术领域
本发明涉及互联网技术领域,具体涉及一种应用软件的筛选方法及服务设备。
背景技术
随着移动互联网的高速发展,移动终端上的应用软件越来越多,功能也越来越丰富,给移动终端的用户带来了许多便利。然而,随着应用软件的不断增多,应用软件的质量变得良莠不齐,部分应用软件在运行过程中存在广告和不健康等低质量内容,这不仅降低了用户在使用应用软件过程中的使用体验,还破坏了和谐的互联网环境。针对上述情况,目前主要采用人工的方式对应用软件进行筛选,即筛选人员对服务设备采集到的针对应用软件的反馈评价进行人工识别,以筛选出存在广告和不健康等低质量内容的非热门应用软件,但是由于应用商店上的应用软件数量庞大,导致人工筛选的速度缓慢,筛选效率低下。
发明内容
本发明实施例公开一种应用软件的筛选方法及服务设备,能够提高筛选非热门应用软件的筛选效率。
本发明实施例第一方面公开了一种应用软件的筛选方法,所述方法包括:
服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,所述卸载信息至少包括针对所述应用软件的卸载次数;
所述服务设备根据所述应用软件的卸载次数形成所述应用软件的卸载指数,所述卸载指数用于反映所述应用软件的热门程度;
所述服务设备根据所述应用软件的所述卸载指数,判断所述应用软件是否为热门应用软件,如果否,将所述应用软件确定为非热门应用软件,并将所述非热门应用软件的身份标识保存在数据库中。
作为一种可选的实施方式,在本发明实施例第一方面中,所述服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,包括:
所述服务设备从多个应用商店获取海量用户针对某一应用软件的行为数据;
所述服务设备对所述行为数据进行大数据分析,得到所述行为数据的大数据分析结果;
所述服务设备从所述大数据分析结果中提取海量用户针对某一应用软件的卸载信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述服务设备将所述非热门应用软件的身份标识保存在数据库中,包括:
所述服务设备提取所述非热门应用软件的身份标识中的文本信息,其中,所述文本信息至少包括所述非热门应用软件的名称;
所述服务设备处理所述文本信息,得到每个所述身份标识对应的所述非热门应用软件的特征向量;
所述服务设备根据所述特征向量对所述身份标识进行聚类,获得聚类结果并保存至数据库中。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
所述服务设备接收用户设备发出的识别请求,所述识别请求包括所述用户设备上所有应用软件的软件标识,所述识别请求是由所述用户设备在检测到所述用户设备的用户存在卸载应用软件的需求时触发的;
所述服务设备判断所述所有应用软件的软件标识中是否存在与所述非热门应用软件的身份标识相匹配的目标软件标识;
如果存在,则所述服务设备将所述目标软件标识对应的应用软件确定为所述非热门应用软件,并将所述目标软件标识发送至所述用户设备供用户参考。
作为一种可选的实施方式,在本发明实施例第一方面中,所述服务设备根据所述应用软件的卸载次数形成所述应用软件的卸载指数,包括:
所述服务设备获取海量用户针对所述应用软件的评价信息;
所述服务设备建立相关语料库对所述评价信息进行过滤,得到有效的评价信息;
所述服务设备根据所述应用软件的卸载次数和所述有效的评价信息综合计算得到所述应用软件的卸载指数。
本发明实施例第二方面公开了一种服务设备,所述服务设备包括:
获取单元,用于从多个应用商店获取海量用户针对某一应用软件的卸载信息,所述卸载信息至少包括针对所述应用软件的卸载次数;
形成单元,用于根据所述获取单元获取到的所述应用软件的卸载次数形成所述应用软件的卸载指数,所述卸载指数用于反映所述应用软件的热门程度;
第一判断单元,用于根据所述形成单元形成的所述应用软件的所述卸载指数,判断所述应用软件是否为热门应用软件;
保存单元,用于在所述判断单元判断出所述应用软件不是热门应用软件时,将所述应用软件确定为非热门应用软件,并将所述非热门应用软件的身份标识保存在数据库中。
作为一种可选的实施方式,在本发明实施例第二方面中,所述获取单元包括:
第一获取子单元,用于从多个应用商店获取海量用户针对某一应用软件的行为数据;
分析子单元,用于对所述获取子单元获取到的所述行为数据进行大数据分析,获得所述行为数据的大数据分析结果;
第一提取子单元,用于根据所述分析子单元获得的所述大数据分析结果中提取所述海量用户针对某一应用软件的卸载信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述保存单元包括:
确定子单元,用于将所述应用软件确定为非热门应用软件;
第二提取子单元,用于提取所述非热门应用软件的身份标识中的文本信息,其中,所述文本信息至少包括所述非热门应用软件的名称;
处理子单元,用于处理所述文本信息,得到每个所述身份标识对应的所述非热门应用软件的特征向量;
保存子单元,用于根据所述特征向量对所述身份标识进行聚类,获得聚类结果并保存至数据库中。
作为一种可选的实施方式,在本发明实施例第二方面中,所述服务设备还包括:
接收单元,用于接收用户设备发出的识别请求,所述识别请求包括所述用户设备上所有应用软件的软件标识,所述识别请求是由所述用户设备在检测到所述用户设备的用户存在卸载应用软件的需求时触发的;
第二判断单元,用于判断所述所有应用软件的软件标识中是否存在与所述非热门应用软件的身份标识相匹配的目标软件标识;
发送单元,用于在所述第二判断单元判断出所述所有应用软件的软件标识中存在与所述非热门应用软件的身份标识相匹配的目标软件标识时,将所述目标软件标识对应的应用软件确定为所述非热门应用软件,并将所述目标软件标识发送至所述用户设备供用户参考。
作为一种可选的实施方式,在本发明实施例第二方面中,所述形成单元包括:
第二获取子单元,用于获取海量用户针对所述应用软件的评价信息;
过滤子单元,用于建立相关语料库对所述评价信息进行过滤,得到有效的评价信息;
计算子单元,用于根据所述应用软件的卸载次数和所述有效的评价信息综合计算得到所述应用软件的卸载指数。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对上述应用软件的卸载次数,根据上述应用软件的卸载次数形成应用软件的卸载指数,并根据上述应用软件的卸载指数判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件,并将非热门应用软件的身份标识保存在数据库中。相比现有技术中筛选非热门应用软件需要效率低下的人工筛选方法,本发明实施例可以通过应用软件的卸载指数快速筛选出非热门应用软件,可见,本发明实施例能够提高筛选应用软件的筛选效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种应用软件的筛选方法的流程示意图;
图2是本发明实施例公开的另一种应用软件的筛选方法的流程示意图;
图3是本发明实施例公开的另一种应用软件的筛选方法的流程示意图;
图4本发明实施例公开的一种服务设备的结构示意图;
图5本发明实施例公开的另一种服务设备的结构示意图;
图6本发明实施例公开的另一种服务设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开一种应用软件的筛选方法及服务设备,能够提高筛选应用软件的筛选效率。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种应用软件的筛选方法的流程示意图。如图1所示,该应用软件的筛选方法可以包括以下操作:
101、服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对上述应用软件的卸载次数。
本发明实施例中,上述应用软件的卸载信息可以包括上述应用软件被海量用户卸载的次数以及海量用户在卸载上述应用软件时输入的卸载原因。
需要说明的是,服务设备中可以存储有预设数量,当服务设备从多个应用商店获取海量用户针对上述应用软件的卸载信息的数量达到预设数量时,再触发执行步骤102,这样能够提高步骤102形成的上述应用软件的卸载指数的准确性。
102、服务设备根据上述应用软件的卸载次数形成应用软件的卸载指数,该卸载指数用于反映应用软件的热门程度。
作为一种可选的实施方式,服务设备根据应用软件的卸载次数形成应用软件的卸载指数可以包括:
服务设备获取海量用户针对上述应用软件的评价信息;
服务设备建立相关语料库对上述评价信息进行过滤,得到有效的评价信息;
服务设备根据上述应用软件的卸载次数和上述有效的评价信息综合计算得到应用软件的卸载指数。
本发明实施例中,服务设备在获取到上述应用软件的卸载信息之后,对获取到的上述应用软件的卸载信息进行处理,得到上述应用软件的卸载指数,具体来说,上述应用软件的卸载信息中可以包括上述应用软件的卸载次数,服务设备对该卸载次数进行大数据分析,得到上述应用软件的卸载热度指数;以及,服务设备还可以从多个应用商店中获取海量用户针对上述应用软件的评价信息,并对该评价信息进行数据预处理,其中,数据预处理的具体方式为:服务设备建立相关语料库对该评价信息中包含的关键词进行过滤,得到与上述应用软件相关度高于某一预设阈值的有效关键词,由得到的有效关键词形成针对上述应用软件的有效的评价信息,服务设备将有效的评价信息的数量代入预设的函数公式进行函数计算,得到上述应用软件的评价热度指数;
其中,预设的函数公式可以为:
评价热度指数=((某一应用的有效评价信息数量-平均每个应用的有效评价信息数量)/(平均每个应用的有效评价信息数量-有效评价信息数量最少的应用的有效评价信息数量))
需要说明的是,应用软件的有效评价信息的数量与该应用软件的评价热度指数成正比,应用软件的有效评价信息的数量越多,评价热度指数越高;反之,应用软件的有效评价信息的数量越少,评价热度指数越低。举例说明,应用软件A的有效评价信息的数量为10条,平均每个应用的有效评价信息数量为5条,有效评价信息数量最少的应用的有效评价信息数量为3条,那么代入上述公式,可以得到上述应用软件A的评价热度指数为2.5;应用软件B的有效评价信息的数量为4条,平均每个应用的有效评价信息数量为5条,有效评价信息数量最少的应用的有效评价信息数量为3条,那么代入上述公式,可以得到上述应用软件B的评价热度指数为-0.5。
服务设备将上述应用软件的卸载热度指数和评价热度指数进行加权计算,得到上述应用软件的卸载指数。
其中,卸载指数的计算公式如下:
卸载指数=(卸载热度指数×卸载热度指数权重+评价热度指数×评价热度指数权重)
需要说明的是,卸载热度指数权重和评价热度指数权重的和为1,可选的,卸载热度指数权重为0.7,评价热度指数权重为0.3,本发明不做限定。另外,上述应用软件的卸载指数的高低用于反映应用软件的热门程度,应用软件的卸载指数越高,该应用软件越热门;反之,应用软件的卸载指数越低,该应用软件越冷门。
需要说明的是,上述应用软件的卸载信息可以来自提供上述应用软件的各个应用商店,服务设备分析来自不同应用商店中不同用户针对不同供应商提供的上述应用软件的卸载信息,按照一定的权值比重对上述应用软件的卸载信息中包括的卸载次数进行处理,得到上述应用软件的卸载热度指数。举例来说,上述应用软件的供应商可以有多个,其中一部分供应商为知名度较高的供应商,一部分供应商为知名度不高的供应商,在对获取到的上述应用软件的卸载信息中包括的卸载次数进行大数据分析时,服务设备可以按照预设比例从海量用户针对知名度较高的供应商提供的上述应用软件的卸载信息中获取第一数量的卸载信息以及从海量用户针对知名度不高的供应商提供的上述应用软件的卸载信息中获取第二数量的卸载信息,并将第一数量的卸载信息以及第二数量的卸载信息确定为获取到的针对上述应用软件的卸载信息,其中,该预设比例等于第一数量与第二数量的比值,如7:3等。
103、服务设备根据上述应用软件的卸载指数,判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件,并将非热门应用软件的身份标识保存在数据库中。
本发明实施例中,服务设备中预先存储有针对某一应用软件的预设条件要求,其中,不同类型的应用软件对应不同的预设条件要求,在分析得到上述某一应用软件的卸载指数之后,服务设备获取上述某一应用软件的类型以及与该类型对应的预设条件要求,进而判断上述某一应用软件的卸载指数是否满足上述某一应用软件的类型对应的预设条件要求。可见,通过本发明实施例,可以有针对性的对不同类型的应用软件设置不同的条件要求,从而提高判断应用软件是否属于热门应用软件的准确性。
在图1所描述的方法中,服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对上述应用软件的卸载次数,根据上述应用软件的卸载次数形成应用软件的卸载指数,并根据上述应用软件的卸载指数判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件,并将非热门应用软件的身份标识保存在数据库中。可见,通过图1所描述的方法能够更加准确的获取针对某一应用软件的卸载指数,并根据获取到的卸载指数快速判断出某一应用软件是否为非热门应用软件,大大提高了筛选应用软件的筛选效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种应用软件的筛选方法的流程示意图。如图2所示,该应用软件的筛选方法可以包括以下步骤:
在本发明实施例中,该应用软件的筛选方法还包括步骤201~203,针对步骤201~203的描述,请参照实施例一中针对步骤101~103的详细描述,本发明实施例不再赘述。
204、服务设备接收用户设备发出的识别请求,该识别请求包括用户设备上所有应用软件的软件标识,该识别请求是由用户设备在检测到用户存在卸载应用软件的需求时触发的。
本发明实施例中,上述识别请求可以包括用户设备上所有应用软件的软件标识,该识别请求用于请求服务设备根据所有应用软件的软件标识确定所有应用软件中存在的非热门应用软件,该识别请求是由用户设备在检测到用户设备的用户存在卸载应用软件的需求时触发的,如当用户设备检测到用户触发针对用户设备上应用软件的卸载指令时触发的,或者当用户设备检测到用户触发存储空间清理指令时触发的,本发明实施例不做限定。
205、服务设备判断所有应用软件的软件标识中是否存在与非热门应用软件的身份标识相匹配的目标软件标识,如果存在,则触发执行步骤206,反之,如果不存在,结束本流程。
206、服务设备将上述的目标软件标识对应的应用软件确定为非热门应用软件,并将目标软件标识发送至用户设备供用户参考。
本发明实施例中,需要说明的是,服务设备在将上述目标软件标识对应的应用软件确定为非热门应用软件之后,可以直接将上述目标软件标识发送至用户设备供用户参考,以触发用户设备执行以下操作:
由用户设备接收服务设备发送的上述至少一个目标软件标识,并根据预先统计出的每个应用软件的使用频率,识别出上述至少一个目标软件标识对应的应用软件中存在的使用频率低于预设的使用频率阈值的应用软件,并输出该使用频率低于预设的使用频率阈值的应用软件的标识,以告知用户在用户设备中存在的非热门应用软件。
需要说明的是,服务设备在将上述的目标软件标识对应的应用软件确定为非热门应用软件之后,还可以根据上述目标软件标识对应的应用软件的使用频率判断该应用软件是否均低于预设的使用频率阈值,如果上述目标软件标识对应的应用软件中每个应用软件的使用频率均低于使用频率阈值,服务设备将上述至少一个目标软件标识发送至用户设备供用户参考,如果上述目标软件标识对应的应用软件中存在使用频率不低于预设的使用频率阈值的高使用频率应用软件,则服务设备将上述目标软件标识对应的应用软件中除该高使用频率应用软件之外的其它非热门应用软件的目标软件标识发送至终端设备供用户参考。
在图2所描述的方法中,服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对上述应用软件的卸载次数,根据上述应用软件的卸载次数形成应用软件的卸载指数,并根据上述应用软件的卸载指数判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件,并将非热门应用软件的身份标识保存在数据库中,这样可以更加准确的获取针对某一应用软件的卸载指数,并根据获取到的卸载指数快速判断出某一应用软件是否为非热门应用软件;进一步地,服务设备接收用户设备发出的识别请求,该识别请求包括用户设备上所有应用软件的软件标识,该识别请求是由用户设备在检测到用户存在卸载应用软件的需求时触发的,服务设备判断所有应用软件的软件标识中是否存在与非热门应用软件的身份标识相匹配的目标软件标识,如果存在,将上述的目标软件标识对应的应用软件确定为非热门应用软件,并将目标软件标识发送至用户设备供用户参考。可见,通过图2所描述的方法,不仅能够快速的根据应用软件的卸载指数判断该应用软件是否为热门应用软件,还能够根据筛选结果为用户设备的用户提供参考建议,以告知用户设备的用户哪些应用软件为非热门应用软件,提高了用户设备的用户的使用体验。
实施例三
请参阅图3,图3是本发明实施例公开的又一种应用软件的筛选方法的流程示意图。其中,图3是图2公开的一种应用软件的筛选方法的进一步优化。如图3所示,该应用软件的筛选方法可以包括以下步骤:
301、服务设备从多个应用商店获取海量用户针对某一应用软件的行为数据。
本发明实施例中,海量用户针对某一应用软件的行为数据可以包括海量用户针对某一应用软件的搜索量、下载量、安装量、卸载量、使用频次以及使用时长等。
302、服务设备对行为数据进行大数据分析,得到该行为数据的大数据分析结果。
本发明实施例中,服务设备在对上述行为数据进行大数据分析之前,筛选出上述行为数据中数据信息不完整的无效用户行为数据,举例来说,无效用户行为数据可以是缺少针对某一应用软件的卸载量的行为数据,或者,来自应用商店的未注册用户的行为数据,服务设备可以选择将上述无效用户行为数据去除之后,再对去除无效用户行为数据之后的有效的行为数据进行大数据分析,得到该行为数据的大数据分析结果,可以提高大数据分析结果的准确性。
303、服务设备从上述大数据分析结果中提取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对应用软件的卸载次数。
步骤304,其中,针对步骤304的描述请参照实施例中针对步骤102的描述,本发明实施例不再赘述。
305、服务设备根据应用软件的卸载指数,判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件。
306、服务设备提取上述非热门应用软件的身份标识中的文本信息,其中,该文本信息至少包括非热门应用软件的名称。
307、服务设备处理上述文本信息,得到每个身份标识对应的非热门应用软件的特征向量。
本发明实施例中,服务设备处理上述非热门应用软件的身份标识中的文本信息,举例来说,服务设备可以对上述每一个非热门应用软件的身份标识中的文本信息进行分词处理,得到分词处理之后的分词结果,并对该分词结果进行过滤,以及对过滤后的分词结果进行处理,其中,对过滤后的分词结果进行处理的具体方式为:计算分词结果中的每一个分词在所处文本信息中出现的词频,以及计算每一分词的逆向文件频率,并计算每一分词的词频与逆向文件频率之积。服务设备根据每一分词的词频与逆向文件频率之积得到上述每一个非热门应用软件的特征向量。
308、服务设备根据上述特征向量对身份标识进行聚类,获得聚类结果并保存至数据库中。
在本发明实施例中,服务设备根据上述特征向量对身份标识进行聚类,具体来说,就是服务设备将上述多个非热门应用软件中的每一个非热门应用软件归为一个类,计算任意两个类之间的最小距离,得到类与类之间距离最小的两个类,并将上述类与类之间距离最小的两个类合并成一个新类,合并成的新类继续与距离该新类的距离最小的类进行合并,合并成为新新类,直到服务设备检测到剩余的所有类的数量为预设的数量时停止合并,服务设备按照得到预设数量的类保存上述的身份标识至数据库中。
在本发明实施例中,该应用软件的筛选方法还包括步骤309~311,针对步骤309~311的描述,请参照实施例二中针对步骤204~206的详细描述,本发明实施例不再赘述。
在图3所描述的方法中,服务设备从多个应用商店获取海量用户针对某一应用软件的行为数据,对行为数据进行大数据分析,得到该行为数据的大数据分析结果,提取分析结果中海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对应用软件的卸载次数,服务设备根据上述应用软件的卸载次数形成应用软件的卸载指数,并根据应用软件的卸载指数判断该应用软件是否为热门应用软件,如果否,将该应用软件确定为非热门应用软件,以及提取并处理上述非热门应用软件的身份标识中的文本信息,得到每个身份标识对应的非热门应用软件的特征向量,根据上述特征向量对身份标识进行聚类,获得聚类结果并保存至数据库中,通过聚类的方式保存应用软件的身份标识,可以在无需预先设置分类标准的情况下使应用软件快速、合理化的分类,提高查找标识的效率。进一步地,服务设备接收用户设备发出的识别请求,该识别请求包括用户设备上所有应用软件的软件标识,该识别请求是由用户设备在检测到用户存在卸载应用软件的需求时触发的,服务设备判断所有应用软件的软件标识中是否存在与非热门应用软件的身份标识相匹配的目标软件标识,如果存在,将上述的目标软件标识对应的应用软件确定为非热门应用软件,并将目标软件标识发送至用户设备供用户参考。可见,通过图3所描述的方法不仅能够快速对非热门应用软件的标识进行识别并智能分类保存,提高了识别和分类标识的效率,更进一步地,在还能够根据筛选结果为用户设备的用户提供参考建议,以告知用户设备的用户哪些应用软件为非热门应用软件,提高了用户设备的用户的使用体验。
实施例四
请参阅图4,图4是本发明实施例公开的一种服务设备的结构示意图。如图4所示,该服务设备可以包括:
获取单元401,用于从多个应用商店获取海量用户针对某一应用软件的卸载信息,该卸载信息至少包括针对上述应用软件的卸载次数。
形成单元402,用于根据获取单元401获取到的应用软件的卸载次数形成应用软件的卸载指数,该卸载指数用于反映上述应用软件的热门程度。
第一判断单元403,用于根据形成单元402形成的应用软件的卸载指数,判断该应用软件是否为热门应用软件。
保存单元404,用于在判断单元403判断出上述应用软件不是热门应用软件时,将该应用软件确定为非热门应用软件,并将非热门应用软件的身份标识保存在数据库中。
可见,通过图4所描述的服务设备能够更加准确的获取针对某一应用软件的卸载指数,并根据获取到的卸载指数快速判断出某一应用软件是否为非热门应用软件,大大提高了筛选应用软件的筛选效率。
实施例五
请参阅图5,图5是本发明实施例提供的另一种服务设备的结构示意图,其中,图5所示的服务设备是由图4所示的服务设备进一步进行优化得到的。与图4所示的服务设备相比较,图5所示的服务设备还可以包括:
接收单元405,用于接收用户设备发出的识别请求,该识别请求包括用户设备上所有应用软件的软件标识,该识别请求是由用户设备在检测到该用户设备的用户存在卸载应用软件的需求时触发的。
具体的,接收单元405接收用户设备发出的识别请求之后,还可以向第二判断单元406发送启动指令,用于触发启动第二判断单元406。
第二判断单元406,用于判断接收单元405接收到的所有应用软件的软件标识中是否存在与保存单元404中保存的非热门应用软件的身份标识相匹配的目标软件标识。
发送单元407,用于在第二判断单元406判断出上述所有应用软件的软件标识中存在与非热门应用软件的身份标识相匹配的目标软件标识时,将目标软件标识对应的应用软件确定为非热门应用软件,并将该目标软件标识发送至用户设备供用户参考。
可见,通过图5所描述的服务设备,不仅能够快速的根据应用软件的卸载指数判断该应用软件是否为热门应用软件,还能够根据筛选结果为用户设备的用户提供参考建议,以告知用户设备的用户哪些应用软件为非热门应用软件,提高了用户设备的用户的使用体验。
实施例六
请参阅图6,图6是本发明实施例提供的另一种服务设备的结构示意图,其中,图6所示的服务设备是由图5所示的服务设备进一步进行优化得到的。与图5所示的服务设备相比较,获取单元401可以包括:
第一获取子单元4011,用于从多个应用商店获取海量用户针对某一应用软件的行为数据。
分析子单元4012,用于对获取子单元4011获取到的行为数据进行大数据分析,获得该行为数据的大数据分析结果。
本发明实施例中,分析子单元4012在对上述行为数据进行大数据分析之前,筛选出上述行为数据中数据信息不完整的无效用户行为数据,举例来说,无效用户行为数据可以是缺少针对某一应用软件的卸载量的行为数据,或者,来自应用商店的未注册用户的行为数据,分析子单元4012可以选择将上述无效用户行为数据去除之后,再对去除无效用户行为数据之后的有效的行为数据进行大数据分析,得到该行为数据的大数据分析结果,并提供给第一提取子单元4013。分析子单元4012在对上述行为数据进行大数据分析之前筛选出无效用户行为数据,可以提高大数据分析结果的准确度。
第一提取子单元4013,用于根据分析子单元4012获得的大数据分析结果中提取海量用户针对某一应用软件的卸载信息。
以及,形成单元402可以包括:
第二获取子单元4021,用于获取海量用户针对应用软件的评价信息,并将该评价信息提供给过滤子单元4022。
过滤子单元4022,用于建立相关语料库对上述评价信息进行过滤,得到有效的评价信息。
计算子单元4023,用于根据应用软件的卸载次数和有效的评价信息综合计算得到应用软件的卸载指数。
其中,上述应用软件的卸载次数是由获取单元401提供的,上述有效的评价信息是由过滤子单元4022提供的。
在本发明实施例中,第二获取子单元4021可以从多个应用商店中获取海量用户针对上述应用软件的评价信息,将该评价信息提供给过滤子单元4022,由过滤子单元4022对该评价信息进行数据预处理,其中,过滤子单元4022对该评价信息进行数据预处理的具体方式为:服务设备建立相关语料库对该评价信息中包含的关键词进行过滤,得到与上述应用软件相关度高于某一预设阈值的有效关键词,由得到的有效关键词形成针对上述应用软件的有效的评价信息,并提供给计算子单元4023。计算子单元4023将有效的评价信息的数量代入预设的函数公式进行函数计算,得到上述应用软件的评价热度指数;
其中,预设的函数公式可以为:
评价热度指数=((某一应用的有效评价信息数量-平均每个应用的有效评价信息数量)/(平均每个应用的有效评价信息数量-有效评价信息数量最少的应用的有效评价信息数量))
需要说明的是,应用软件的有效评价信息的数量与该应用软件的评价热度指数成正比,应用软件的有效评价信息的数量越多,评价热度指数越高;反之,应用软件的有效评价信息的数量越少,评价热度指数越低。举例说明,应用软件A的有效评价信息的数量为10条,平均每个应用的有效评价信息数量为5条,有效评价信息数量最少的应用的有效评价信息数量为3条,那么代入上述公式,可以得到上述应用软件A的评价热度指数为2.5;应用软件B的有效评价信息的数量为4条,平均每个应用的有效评价信息数量为5条,有效评价信息数量最少的应用的有效评价信息数量为3条,那么代入上述公式,可以得到上述应用软件B的评价热度指数为-0.5。
另外,计算子单元4023对获取单元401提供的上述应用软件的卸载信息进行处理,得到上述应用软件的卸载指数,具体来说,上述应用软件的卸载信息中可以包括上述应用软件的卸载次数,计算子单元4023对该卸载次数进行大数据分析,得到上述应用软件的卸载热度指数。
计算子单元4023将上述应用软件的卸载热度指数和评价热度指数进行加权计算,得到上述应用软件的卸载指数。
其中,卸载指数的计算公式如下:
卸载指数=(卸载热度指数×卸载热度指数权重+评价热度指数×评价热度指数权重)
需要说明的是,卸载热度指数权重和评价热度指数权重的和为1,可选的,卸载热度指数权重为0.7,评价热度指数权重为0.3,本发明不做限定。另外,上述应用软件的卸载指数的高低用于反映应用软件的热门程度,应用软件的卸载指数越高,该应用软件越热门;反之,应用软件的卸载指数越低,该应用软件越冷门。
以及,保存单元404可以包括:
确定子单元4041,用于将应用软件确定为非热门应用软件,并将确定的非热门应用软件提供给第二提取子单元4042。
第二提取子单元4042,用于提取非热门应用软件的身份标识中的文本信息,其中,该文本信息至少包括非热门应用软件的名称。
处理子单元4043,用于处理第二提取子单元4042提取的文本信息,得到每个身份标识对应的非热门应用软件的特征向量,并将得到的特征向量提供给保存子单元4044。
本发明实施例中,处理子单元4043处理上述非热门应用软件的身份标识中的文本信息,举例来说,处理子单元4043可以对上述每一个非热门应用软件的身份标识中的文本信息进行分词处理,得到分词处理之后的分词结果,并对该分词结果进行过滤,以及对过滤后的分词结果进行处理,其中,处理子单元4043对过滤后的分词结果进行处理的具体方式为:计算分词结果中的每一个分词在所处文本信息中出现的词频,以及计算每一分词的逆向文件频率,并计算每一分词的词频与逆向文件频率之积。处理子单元4043根据每一分词的词频与逆向文件频率之积得到上述每一个非热门应用软件的特征向量,并将上述每一个非热门应用软件的特征向量提供给保存子单元4044。
保存子单元4044,用于根据上述特征向量对身份标识进行聚类,获得聚类结果并保存至数据库中。
在本发明实施例中,保存子单元4044根据处理子单元4043提供的上述特征向量对身份标识进行聚类,具体来说,就是保存子单元4044将上述多个非热门应用软件中的每一个非热门应用软件归为一个类,计算任意两个类之间的最小距离,得到类与类之间距离最小的两个类,并将上述类与类之间距离最小的两个类合并成一个新类,合并成的新类继续与距离该新类的距离最小的类进行合并,合并成为新新类,直到保存子单元4044检测到剩余的所有类的数量为预设的数量时停止合并,并按照得到预设数量的类保存上述的身份标识至数据库中。
可见,通过图6所描述的服务设备不仅能够快速对非热门应用软件的标识进行识别并智能分类保存,提高了识别和分类标识的效率,更进一步地,在还能够根据筛选结果为用户设备的用户提供参考建议,以告知用户设备的用户哪些应用软件为非热门应用软件,提高了用户设备的用户的使用体验。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种应用软件的筛选方法及服务设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种应用软件的筛选方法,其特征在于,所述方法包括:
服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,所述卸载信息至少包括针对所述应用软件的卸载次数;
所述服务设备根据所述应用软件的卸载次数形成所述应用软件的卸载指数,所述卸载指数用于反映所述应用软件的热门程度;
所述服务设备根据所述应用软件的所述卸载指数,判断所述应用软件是否为热门应用软件,如果否,将所述应用软件确定为非热门应用软件,并将所述非热门应用软件的身份标识保存在数据库中。
2.根据权利要求1所述的方法,其特征在于,所述服务设备从多个应用商店获取海量用户针对某一应用软件的卸载信息,包括:
所述服务设备从多个应用商店获取海量用户针对某一应用软件的行为数据;
所述服务设备对所述行为数据进行大数据分析,得到所述行为数据的大数据分析结果;
所述服务设备从所述大数据分析结果中提取海量用户针对某一应用软件的卸载信息。
3.根据权利要求1所述的方法,其特征在于,将所述非热门应用软件的身份标识保存在数据库中,包括:
所述服务设备提取所述非热门应用软件的身份标识中的文本信息,其中,所述文本信息至少包括所述非热门应用软件的名称;
所述服务设备处理所述文本信息,得到每个所述身份标识对应的所述非热门应用软件的特征向量;
所述服务设备根据所述特征向量对所述身份标识进行聚类,获得聚类结果并保存至数据库中。
4.根据权利要求1、2或3所述的方法,其特征在于,所述方法还包括:
所述服务设备接收用户设备发出的识别请求,所述识别请求包括所述用户设备上所有应用软件的软件标识,所述识别请求是由所述用户设备在检测到所述用户设备的用户存在卸载应用软件的需求时触发的;
所述服务设备判断所述所有应用软件的软件标识中是否存在与所述非热门应用软件的身份标识相匹配的目标软件标识;
如果存在,则所述服务设备将所述目标软件标识对应的应用软件确定为所述非热门应用软件,并将所述目标软件标识发送至所述用户设备供用户参考。
5.根据权利要求4所述的方法,其特征在于,所述服务设备根据所述应用软件的卸载次数形成所述应用软件的卸载指数,包括:
所述服务设备获取海量用户针对所述应用软件的评价信息;
所述服务设备建立相关语料库对所述评价信息进行过滤,得到有效的评价信息;
所述服务设备根据所述应用软件的卸载次数和所述有效的评价信息综合计算得到所述应用软件的卸载指数。
6.一种服务设备,其特征在于,包括:
获取单元,用于从多个应用商店获取海量用户针对某一应用软件的卸载信息,所述卸载信息至少包括针对所述应用软件的卸载次数;
形成单元,用于根据所述获取单元获取到的所述应用软件的卸载次数形成所述应用软件的卸载指数,所述卸载指数用于反映所述应用软件的热门程度;
第一判断单元,用于根据所述形成单元形成的所述应用软件的所述卸载指数,判断所述应用软件是否为热门应用软件;
保存单元,用于在所述判断单元判断出所述应用软件不是热门应用软件时,将所述应用软件确定为非热门应用软件,并将所述非热门应用软件的身份标识保存在数据库中。
7.根据权利要求6所述的服务设备,其特征在于,所述获取单元包括:
第一获取子单元,用于从多个应用商店获取海量用户针对某一应用软件的行为数据;
分析子单元,用于对所述获取子单元获取到的所述行为数据进行大数据分析,获得所述行为数据的大数据分析结果;
第一提取子单元,用于根据所述分析子单元获得的所述大数据分析结果中提取所述海量用户针对某一应用软件的卸载信息。
8.根据权利要求6所述的服务设备,其特征在于,所述保存单元包括:
确定子单元,用于将所述应用软件确定为非热门应用软件;
第二提取子单元,用于提取所述非热门应用软件的身份标识中的文本信息,其中,所述文本信息至少包括所述非热门应用软件的名称;
处理子单元,用于处理所述文本信息,得到每个所述身份标识对应的所述非热门应用软件的特征向量;
保存子单元,用于根据所述特征向量对所述身份标识进行聚类,获得聚类结果并保存至数据库中。
9.根据权利要求6、7或8所述的服务设备,其特征在于,所述服务设备还包括:
接收单元,用于接收用户设备发出的识别请求,所述识别请求包括所述用户设备上所有应用软件的软件标识,所述识别请求是由所述用户设备在检测到所述用户设备的用户存在卸载应用软件的需求时触发的;
第二判断单元,用于判断所述所有应用软件的软件标识中是否存在与所述非热门应用软件的身份标识相匹配的目标软件标识;
发送单元,用于在所述第二判断单元判断出所述所有应用软件的软件标识中存在与所述非热门应用软件的身份标识相匹配的目标软件标识时,将所述目标软件标识对应的应用软件确定为所述非热门应用软件,并将所述目标软件标识发送至所述用户设备供用户参考。
10.根据权利要求9所述的服务设备,其特征在于,所述形成单元包括:
第二获取子单元,用于获取海量用户针对所述应用软件的评价信息;
过滤子单元,用于建立相关语料库对所述评价信息进行过滤,得到有效的评价信息;
计算子单元,用于根据所述应用软件的卸载次数和所述有效的评价信息综合计算得到所述应用软件的卸载指数。
CN201710965327.6A 2017-10-17 2017-10-17 一种应用软件的筛选方法及服务设备 Pending CN107657054A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710965327.6A CN107657054A (zh) 2017-10-17 2017-10-17 一种应用软件的筛选方法及服务设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710965327.6A CN107657054A (zh) 2017-10-17 2017-10-17 一种应用软件的筛选方法及服务设备

Publications (1)

Publication Number Publication Date
CN107657054A true CN107657054A (zh) 2018-02-02

Family

ID=61118431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710965327.6A Pending CN107657054A (zh) 2017-10-17 2017-10-17 一种应用软件的筛选方法及服务设备

Country Status (1)

Country Link
CN (1) CN107657054A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871243A (zh) * 2019-02-22 2019-06-11 苏州迈荣祥信息科技有限公司 智能终端多应用软件控制方法与系统
CN109885771A (zh) * 2019-02-26 2019-06-14 苏州华盖信息科技有限公司 一种应用软件的筛选方法及服务设备
CN109976826A (zh) * 2019-02-26 2019-07-05 苏州宏裕千智能设备科技有限公司 一种应用软件处理方法、移动终端及云服务器
CN111340583A (zh) * 2020-02-13 2020-06-26 北京字节跳动网络技术有限公司 信息获取方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104267987A (zh) * 2014-09-26 2015-01-07 广州金山网络科技有限公司 一种应用程序app更新的检测方法、检测装置以及终端
CN105956083A (zh) * 2016-04-29 2016-09-21 广州优视网络科技有限公司 应用软件分类系统、应用软件分类方法及服务器
WO2017036551A1 (en) * 2015-09-04 2017-03-09 Arcelik Anonim Sirketi Image display device with automatic memory unit capacity management function
CN107179930A (zh) * 2017-06-12 2017-09-19 广东小天才科技有限公司 一种应用卸载推荐方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104267987A (zh) * 2014-09-26 2015-01-07 广州金山网络科技有限公司 一种应用程序app更新的检测方法、检测装置以及终端
WO2017036551A1 (en) * 2015-09-04 2017-03-09 Arcelik Anonim Sirketi Image display device with automatic memory unit capacity management function
CN105956083A (zh) * 2016-04-29 2016-09-21 广州优视网络科技有限公司 应用软件分类系统、应用软件分类方法及服务器
CN107179930A (zh) * 2017-06-12 2017-09-19 广东小天才科技有限公司 一种应用卸载推荐方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871243A (zh) * 2019-02-22 2019-06-11 苏州迈荣祥信息科技有限公司 智能终端多应用软件控制方法与系统
CN109871243B (zh) * 2019-02-22 2021-12-21 山东诺蓝信息科技有限公司 智能终端多应用软件控制方法与系统
CN109885771A (zh) * 2019-02-26 2019-06-14 苏州华盖信息科技有限公司 一种应用软件的筛选方法及服务设备
CN109976826A (zh) * 2019-02-26 2019-07-05 苏州宏裕千智能设备科技有限公司 一种应用软件处理方法、移动终端及云服务器
CN109976826B (zh) * 2019-02-26 2020-07-17 合肥智圣新创信息技术有限公司 一种应用软件处理方法、移动终端及云服务器
CN111340583A (zh) * 2020-02-13 2020-06-26 北京字节跳动网络技术有限公司 信息获取方法、装置、计算机设备和存储介质
CN111340583B (zh) * 2020-02-13 2023-05-23 北京字节跳动网络技术有限公司 信息获取方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN107657054A (zh) 一种应用软件的筛选方法及服务设备
CN112926990B (zh) 欺诈识别的方法和装置
CN107291737B (zh) 敏感图像识别方法及装置
CN106933947B (zh) 一种搜索方法及装置、电子设备
CN105045831B (zh) 一种消息推送方法及装置
CN106973305A (zh) 一种视频中不良内容的检测方法及装置
CN109784391A (zh) 基于多模型的样本标注方法及装置
CN106033393B (zh) 一种应用程序测试方法及系统以及移动终端
CN103854063B (zh) 一种基于互联网开放信息的事件发生风险预测并预警方法
CN107291672A (zh) 数据表的处理方法和装置
CN109582773B (zh) 智能问答匹配方法及装置
CN101187959A (zh) 基于决策树的游戏作弊检测方法
WO2020125477A1 (zh) 一种提升爬虫识别召回率的方法、装置、介质及设备
CN110008976A (zh) 一种网络行为分类方法和装置
Ulrich et al. Environmentally and behaviourally mediated co‐occurrence of functional traits in bird communities of tropical forest fragments
CN109615009A (zh) 一种学习内容推荐方法及电子设备
CN109345332A (zh) 一种航空订票恶意行为的智能检测方法
CN111160797A (zh) 风控模型的构建方法、装置、存储介质及终端
CN111125694A (zh) 基于蚁群算法的威胁情报分析方法及系统
CN107797900A (zh) 一种应用信息显示方法及服务设备
CN108038418A (zh) 垃圾清理方法和装置
CN107193498A (zh) 一种对数据进行去重复处理的方法及装置
CN110427971A (zh) 用户及ip的识别方法、装置、服务器和存储介质
CN113935832A (zh) 一种异常行为检测处理方法及装置
CN108776681A (zh) 一种基于语音搜索的生字词学习巩固方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180202