CN110675205B - 基于应用的竞品分析方法、装置及存储介质 - Google Patents

基于应用的竞品分析方法、装置及存储介质 Download PDF

Info

Publication number
CN110675205B
CN110675205B CN201810711508.0A CN201810711508A CN110675205B CN 110675205 B CN110675205 B CN 110675205B CN 201810711508 A CN201810711508 A CN 201810711508A CN 110675205 B CN110675205 B CN 110675205B
Authority
CN
China
Prior art keywords
application
information
meta
candidate
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810711508.0A
Other languages
English (en)
Other versions
CN110675205A (zh
Inventor
马宇峰
王晓元
叶峻
沈璠
余韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810711508.0A priority Critical patent/CN110675205B/zh
Publication of CN110675205A publication Critical patent/CN110675205A/zh
Application granted granted Critical
Publication of CN110675205B publication Critical patent/CN110675205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提出一种基于应用的竞品分析方法、装置及计算机可读存储介质。其中基于应用的竞品分析方法包括:确定指定应用的候选竞品;获取用户的应用安装信息;根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息。本发明实施例依靠用户安装数据,客观地挖掘出对应的竞品情况,全面了解应用市场上所有的竞争对手,该方法依据可靠且数据全面,有利于帮助公司扩大其服务品种,增长其服务目标。

Description

基于应用的竞品分析方法、装置及存储介质
技术领域
本发明涉及信息技术领域,尤其涉及一种基于应用的竞品分析方法、装置及计算机可读存储介质。
背景技术
随着互联网时代的极速发展,越来越多的互联网公司倾向于扩大其服务品种,增长其服务目标。在这样的前提下,互联网公司都希望了解其竞品的情况。目前竞品的发现依赖于人工编辑,业界对于竞品挖掘的方法,还停留在人工浏览、编辑、访谈的流程中,没有系统化的竞品挖掘方法。这种依赖于人工的挖掘方法除了耗时繁重、比较主观的缺陷外,竞争程度也不容易量化。而竞争者随着时间的推移随时可能发生改变,想要维护竞品列表,需要依赖于大量的专家知识,以及需要始终保持在市场一线的专家实时跟踪的时间成本,还有可能产生大量的遗漏竞品。
发明内容
本发明实施例提供一种基于应用的竞品分析方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种基于应用的竞品分析方法,包括:确定指定应用的候选竞品;获取用户的应用安装信息;根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,确定指定应用的候选竞品,包括:获取各个应用的元信息;计算所述指定应用的元信息与各个应用的元信息之间的相似度;根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品。
结合第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,获取各个应用的元信息,包括:在应用展示平台中获取各个应用的描述信息,从所述描述信息中提取各个应用的网址;和/或,在搜索引擎上搜索各个应用的网址;爬取所述网址的网页数据,从所述网页数据中提取第一元信息,所述第一元信息包括网页中Meta标签上的关键词信息和/或网页描述信息。
结合第一方面的第二种实现方式,本发明实施例在第一方面的第三种实现方式中,获取各个应用的元信息,还包括:在搜索引擎和/或应用展示平台中搜索各个应用的第二元信息,所述第二元信息包括各个应用的描述信息。
结合第一方面的第三种实现方式,本发明实施例在第一方面的第四种实现方式中,计算所述指定应用的元信息与各个应用的元信息之间的相似度,包括:在获取所述第一元信息失败的情况下,根据所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
结合第一方面的第三种实现方式,本发明实施例在第一方面的第五种实现方式中,计算所述指定应用的元信息与各个应用的元信息之间的相似度,包括:为所述第一元信息和所述第二元信息设置权重;根据所述第一元信息和所述第二元信息的权重,使用所述第一元信息和所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
结合第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式,本发明实施例在第一方面的第六种实现方式中,计算所述指定应用的元信息与各个应用的元信息之间的相似度,还包括:通过切词算法和word2vec模型计算所述指定应用与各个应用的元信息之间的相似度。
结合第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式,本发明实施例在第一方面的第七种实现方式中,根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品,包括:将所述指定应用与其它应用之间的相似度按照相似度的高低进行排序;将与所述指定应用之间的相似度大于预先设置的相似度阈值且排序在前Y位的应用作为所述指定应用的候选竞品,其中,Y为预先设置的竞品待选值。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式,本发明实施例在第一方面的第八种实现方式中,根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度,包括:根据获取的所述应用安装信息,统计在设定周期内安装了所述指定应用的用户个数;统计所述指定应用与某个候选竞品的交集个数,所述交集个数是在设定周期内安装了所述指定应用且安装了所述某个候选竞品的用户个数;将所述交集个数与所述安装了所述指定应用的用户个数之比,作为所述某个候选竞品对所述指定应用的侵占度。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式,本发明实施例在第一方面的第九种实现方式中,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息,包括:根据获取的所述应用安装信息,获取设定周期内卸载所述指定应用的用户;统计所述卸载所述指定应用的用户中安装了某个候选竞品的安装数;根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息。
结合第一方面的第九种实现方式,本发明实施例在第一方面的第十种实现方式中,根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息,包括:若设定周期内卸载所述指定应用的某一用户安装了N个所述候选竞品,则将N分之一记为该用户从所述指定应用到所述某个候选竞品的流向值;将所有用户的从所述指定应用到所述某个候选竞品的流向值之和,作为从所述指定应用到所述某个候选竞品的流向信息。
第二方面,本发明实施例提供了一种基于应用的竞品分析装置,包括:候选竞品确定单元,用于确定指定应用的候选竞品;安装信息获取单元,用于获取用户的应用安装信息;竞品分析单元,用于:根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息。
结合第二方面,本发明实施例在第二方面的第一种实现方式中,所述候选竞品确定单元包括:元信息获取子单元,用于获取各个应用的元信息;相似度计算子单元,用于计算所述指定应用的元信息与各个应用的元信息之间的相似度;确定子单元,用于根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品。
结合第二方面的第一种实现方式,本发明实施例在第二方面的第二种实现方式中,所述元信息获取子单元包括第一获取子单元,用于:在应用展示平台中获取各个应用的描述信息,从所述描述信息中提取各个应用的网址;和/或,在搜索引擎上搜索各个应用的网址;爬取所述网址的网页数据,从所述网页数据中提取第一元信息,所述第一元信息包括网页中Meta标签上的关键词信息和/或网页描述信息。
结合第二方面的第二种实现方式,本发明实施例在第二方面的第三种实现方式中,所述元信息获取子单元还包括第二获取子单元,用于:在搜索引擎和/或应用展示平台中搜索各个应用的第二元信息,所述第二元信息包括各个应用的描述信息。
结合第二方面的第三种实现方式,本发明实施例在第二方面的第四种实现方式中,所述相似度计算子单元还用于:在获取所述第一元信息失败的情况下,根据所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
结合第二方面的第三种实现方式,本发明实施例在第二方面的第五种实现方式中,所述相似度计算子单元还用于:为所述第一元信息和所述第二元信息设置权重;根据所述第一元信息和所述第二元信息的权重,使用所述第一元信息和所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
结合第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式,本发明实施例在第二方面的第六种实现方式中,所述相似度计算子单元还用于:通过切词算法和word2vec模型计算所述指定应用与各个应用的元信息之间的相似度。
结合第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式,本发明实施例在第二方面的第七种实现方式中,所述候选竞品确定单元还用于:将所述指定应用与其它应用之间的相似度按照相似度的高低进行排序;将与所述指定应用之间的相似度大于预先设置的相似度阈值且排序在前Y位的应用作为所述指定应用的候选竞品,其中,Y为预先设置的竞品待选值。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式,本发明实施例在第二方面的第八种实现方式中,所述竞品分析单元包括侵占度分析子单元,用于:根据获取的所述应用安装信息,统计在设定周期内安装了所述指定应用的用户个数;统计所述指定应用与某个候选竞品的交集个数,所述交集个数是在设定周期内安装了所述指定应用且安装了所述某个候选竞品的用户个数;将所述交集个数与所述安装了所述指定应用的用户个数之比,作为所述某个候选竞品对所述指定应用的侵占度。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式,本发明实施例在第二方面的第九种实现方式中,所述竞品分析单元包括用户流向分析子单元,所述用户流向分析子单元包括:卸载用户获取子单元,用于根据获取的所述应用安装信息,获取设定周期内卸载所述指定应用的用户;安装数统计子单元,用于统计所述卸载所述指定应用的用户中安装了某个候选竞品的安装数;流向信息计算子单元,用于根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息。
结合第二方面的第九种实现方式,本发明实施例在第二方面的第十种实现方式中,所述流向信息计算子单元还用于:若设定周期内卸载所述指定应用的某一用户安装了N个所述候选竞品,则将N分之一记为该用户从所述指定应用到所述某个候选竞品的流向值;将所有用户的从所述指定应用到所述某个候选竞品的流向值之和,作为从所述指定应用到所述某个候选竞品的流向信息。
在一个可能的设计中,基于应用的竞品分析装置的结构中包括处理器和存储器,所述存储器用于存储支持基于应用的竞品分析装置执行上述第一方面中基于应用的竞品分析方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述基于应用的竞品分析装置还可以包括通信接口,用于基于应用的竞品分析装置与其他设备或通信网络通信。
第三方面,本发明实施例提供了一种基于应用的竞品分析装置,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述第一方面中任一所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一所述的方法。
上述技术方案具有如下优点或有益效果:依靠公司的元信息和用户安装数据,客观地挖掘出对应的竞品情况,全面了解应用市场上所有的竞争对手,该方法依据可靠且数据全面,有利于帮助公司扩大其服务品种,增长其服务目标。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施例提供的基于应用的竞品分析方法的流程图;
图2为本发明实施例提供的基于应用的竞品分析方法中确定候选竞品的流程图;
图3为本发明实施例提供的基于应用的竞品分析方法中获取元信息的流程图;
图4为本发明实施例提供的基于应用的竞品分析方法中计算侵占度的流程图;
图5为本发明实施例提供的基于应用的竞品分析方法中计算流向信息的流程图;
图6为本发明实施例提供的基于应用的竞品分析装置的结构框图;
图7为本发明实施例提供的基于应用的竞品分析装置中候选竞品确定单元的结构框图;
图8为本发明实施例提供的基于应用的竞品分析装置中元信息获取子单元的结构框图;
图9为本发明实施例提供的基于应用的竞品分析装置中竞品分析单元的结构框图;
图10为本发明实施例提供的基于应用的竞品分析装置中用户流向分析子单元的结构框图;
图11为本发明另一实施例提供的基于应用的竞品分析装置的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1为本发明实施例提供的基于应用的竞品分析方法的流程图。如图1所示,本发明实施例的基于应用的竞品分析方法包括:步骤S130,确定指定应用的候选竞品;步骤S140,获取用户的应用安装信息;步骤S150,根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息。
本发明实施例基于互联网公司元数据相似度和用户的应用安装信息进行竞品的挖掘和分析。该方法主要包括两个部分,第一部分是圈定可能的竞品范围,可根据公司的元信息来计算相似度以圈定可能的竞品范围;第二部分是根据用户的应用安装信息,分析各个应用的竞品之间的彼此侵占度和用户的流向情况,统计当前用户卸载和安装了哪些应用,分析出当前用户是从哪些竞品中来,到哪些竞品中去,其中差距可以用来量化竞争的程度。
另外,也可针对指定应用进行竞品分析。计算指定应用的元信息与其候选竞品的元信息之间的相似度,以确定指定应用的候选竞品;也可根据各种渠道获取的应用信息直接确定指定应用的候选竞品。然后根据用户的应用安装信息,分析候选竞品对指定应用的侵占度和候选竞品与指定应用之间的用户流向情况。图2为本发明实施例提供的基于应用的竞品分析方法中确定候选竞品的流程图。如图2所示,在一种可能的实现方式中,图1中的步骤S130,确定指定应用的候选竞品,包括:步骤S131,获取各个应用的元信息;步骤S132,计算所述指定应用的元信息与各个应用的元信息之间的相似度;步骤S133,根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品。
本发明实施例可以依赖分析的数据中的主要信息包括各个应用的Meta信息。Meta是元素可提供相关页面的元信息(meta-information),比如针对搜索引擎和更新频度的描述和关键词。
一般来说,在移动互联网时代,很多互联网公司所谓的竞品,是指旗下某一个APP(Application,应用程序)在市场上的竞品。而APP的背后一般也对应着描述网站。描述网站一方面可供一些没有安装APP的用户正常使用服务,另一方面仅仅是一个APP的介绍页面。APP的对应网站一般可以通过搜索引擎、应用下载商店浏览得到。在本发明实施例提供的基于应用的竞品分析方法中,将公司的APP在市场上的竞品作为竞品挖掘的对象。表1是互联网公司及应用、网站、描述信息一览表。表1中示出了各互联网公司及公司旗下的APP名称、APP对应的描述网站域名、网络站点的Meta信息。可爬取网址的网页数据,从网页数据中提取网页中Meta标签上的关键词信息,根据应用的元信息之间的相似度,圈定可能的竞品范围。
表1互联网公司及应用、网站、描述信息一览表
Figure BDA0001716729750000081
Figure BDA0001716729750000091
Figure BDA0001716729750000101
图3为本发明实施例提供的基于应用的竞品分析方法中获取元信息的流程图。如图3所示,根据本发明基于应用的竞品分析方法的一种实施方式,图2中的步骤S131,获取各个应用的元信息,可包括:步骤S210,在应用展示平台中获取各个应用的描述信息,从所述描述信息中提取各个应用的网址;和/或,在搜索引擎上搜索各个应用的网址;步骤S220,爬取所述网址的网页数据,从所述网页数据中提取第一元信息,所述第一元信息包括网页中Meta标签上的关键词信息和/或网页描述信息。
其中,应用展示平台可包括应用商店、应用下载平台等。从应用展示平台和/或搜索引擎上获取各个应用的网址,例如获取官网的网址,从网页的Meta标签中提取关键词信息和/或网页描述信息,作为第一元信息。
具体地,步骤S131,获取各个应用的元信息,操作步骤如下:
11)针对每一个APP,可在应用商店中搜索该APP名字,抽取应用商店中对该APP的描述,并提取描述中的该APP官网地址。
12)针对在步骤11)中没有提取到官网地址的APP,在搜索引擎上搜索,例如使用关键词“该APP+官网”,搜索该APP的官网。
13)对前两个步骤产出的APP官网,爬取官网网页信息,例如,提取首页Meta标签上的keywords信息和/或description信息。
其中,Meta标签用来描述一个HTML(HyperText Markup Language,超级文本标记语言)网页文档的属性,例如作者、日期和时间、网页描述、关键词、页面刷新等;meta标签的Keywords信息参数,用来说明网站的关键词是什么;meta标签的Description信息参数,用来说明网站的主要内容,是对一个网页概况的介绍。
在一种可能的实现方式中,获取各个应用的元信息,还包括:在搜索引擎和/或应用展示平台中搜索各个应用的第二元信息,所述第二元信息包括各个应用的描述信息。例如可搜索引擎内APP百科信息。
具体地,在上述步骤13)之后,还可包括:
步骤14)继续获取应用商店内APP描述信息、搜索引擎内APP百科信息,作为描述信息的补充。
如步骤11)-13)所述,获取各应用的元信息的一种实施方式是获取官网内Meta信息,即获取第一元信息;如步骤14)所述,获取各应用的元信息的另一种实施方式是获取应用展示平台上的APP描述信息、搜索引擎内的应用的描述信息,即获取第二元信息。各应用的元信息以第一元信息(官网内Meta信息)为主要信息,另外以第二元信息作为补充信息。
根据本发明基于应用的竞品分析方法的一种实施方式,步骤S132,计算所述指定应用的元信息与各个应用的元信息之间的相似度,可包括:在获取所述第一元信息失败的情况下,根据所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。在这种实施方式中,仅在没有获取主要信息的情况下,使用补充信息。
根据本发明基于应用的竞品分析方法的一种实施方式,步骤S132,计算所述指定应用的元信息与各个应用的元信息之间的相似度,可包括:为所述第一元信息和所述第二元信息设置权重;根据所述第一元信息和所述第二元信息的权重,使用所述第一元信息和所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。在这种实施方式中,可设置主要信息与补充信息的权重,根据权重利用主要信息与补充信息计算语义相关度。
根据本发明基于应用的竞品分析方法的一种实施方式,步骤S132,计算所述指定应用的元信息与各个应用的元信息之间的相似度,还包括:通过切词算法和word2vec模型计算所述指定应用与各个应用的元信息之间的相似度。
在这种实施方式中,通过切词、word2vec向量化等文本相似度计算步骤,最终产出APP之间的语义相关度。以中文切词为例,中文切词是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。
Word2vec,是为一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。词向量具有良好的语义特性,是表示词语特征的常用方式。词向量每一维的值代表一个具有一定的语义和语法上解释的特征。所以,可以将词向量的每一维称为一个词语特征。
根据本发明基于应用的竞品分析方法的一种实施方式,步骤S133,根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品,包括:将所述指定应用与其它应用之间的相似度按照相似度的高低进行排序;将与所述指定应用之间的相似度大于预先设置的相似度阈值X且排序在前Y位的应用作为所述指定应用的候选竞品,其中,Y为预先设置的竞品待选值。
具体地,限定语义相关度阈值X以及竞品待选值Y,只有相关度超过阈值X的,且排名在前Y位的,才作为该APP的候选竞品。
以上步骤基于各个应用的元信息,确定了指定应用的候选竞品,圈定了可能的竞品范围,接下来需要分析候选竞品的竞争程度,包括计算候选竞品对指定应用的侵占度和/或候选竞品与指定应用之间的用户流向信息。分析候选竞品的竞争程度所依赖分析的数据是用户的应用安装信息。因此需要执行步骤S140,获取用户的应用安装信息,例如用户手机上的安装列表。
目前手机应用的安装列表获取已有多种方法,例如:
对于安卓系统,一个方法是读取系统里保存当前系统安装和卸载信息的日志文件。
对于IOS系统,虽然禁止应用之间互相访问,但可以用探测的方法,也就是在一个应用中调取另一个应用,比如在使用聊天工具时可能会需要调用浏览器。例如:在应用A中调取应用B,如果调取成功则认为该设备上安装了应用B,如果调取失败则认为该设备上没有安装应用B。
可利用用户手机上安装的至少一个APP获取手机上的安装列表,将安装列表传给后台服务器,在服务器统计分析,进行竞品挖掘。
获取用户的应用安装信息,最终获取的数据是单一设备每日的安装列表。使用diff(文本文件比较命令)命令比较文本文件,通过比较安装列表的变化情况,即可获得设备当日新增、卸载的APP列表信息。设定某固定时间为一个周期(如7天),在7天内,用户如果有卸载APP1,安装APP2行为,则认为该用户从APP1流向APP2,通过这样的信息可以获取到一系列的用户流向内容,用来识别竞品竞争的程度。此外如果在7天内,用户的安装列表里面同时安装了APP1与APP2,认为是APP1与APP2的交集,该交集与安装了APP1的总的用户个数之比,可表示APP2对APP1的侵占程度,以此来量化两者的竞争性。
上述步骤中,基于搜索引擎与应用展示平台,可以获取APP对应的官方网站,进而获取网站的元信息和其他描述信息。接下来通过APP安装列表,可以获取APP间用户流向信息与APP间彼此侵占信息。可设计候选竞品分析模块,该模块的输入是前述产生的APP安装列表,输出的语义内容是:某APP的竞品列表为何,以及竞品与本品的竞争性、当前竞争胜负情况排名。该模块执行的计算步骤可包括竞品之间的侵占度计算和用户流向信息计算。
图4为本发明实施例提供的基于应用的竞品分析方法中计算侵占度的流程图。如图4所示,在一种可能实现方式中,图1中的步骤S150中的根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度,可包括:步骤S310,根据获取的所述应用安装信息,统计在设定周期内安装了所述指定应用的用户个数;步骤S320,统计所述指定应用与某个候选竞品的交集个数,所述交集个数是在设定周期内安装了所述指定应用且安装了所述某个候选竞品的用户个数;步骤S330,将所述交集个数与所述安装了所述指定应用的用户个数之比,作为所述某个候选竞品对所述指定应用的侵占度。
APP2对APP1的侵占度也可以用以下公式(1)表示:
(APP1+APP2)交集/A的总数(1)
其中,“APP1+APP2”是APP1与APP2的交集,也就是用户的安装列表里面同时安装了APP1与APP2的设备个数,“A的总数”表示安装了APP1的总的设备个数。
具体地,APP安装列表是逐日获取的,获取了一段时间的APP列表后,即可计算任意两个APP之间在某天的彼此侵占度,单日的侵占度具体的计算步骤如下:
21)针对APP1,获取在某一设定周期范围内(如当前日期的前后各3天,合计7天)所有安装了APP1的用户列表,得到安装了APP1的总的设备个数count(APP1),这里将安装了APP1的总的设备个数作为安装了APP1的用户个数。其中,设定周期范围也可以只包括当前日期(合计24小时)的时间范围,即只统计当天的数据。
22)针对该部分用户列表,汇总计算在该周期内用户的安装列表里面同时安装了APP1与APP2的设备个数,也就是针对APP1的每一个潜在竞品APP2,产出APP1与APP2的交集个数count(APP2)。
23)用以下公式(2)表示APP2对APP1的侵占度:
count(APP2)/count(APP1)(2)
其中,“count(APP2)”是APP1与APP2的交集,也就是用户的安装列表里面同时安装了APP1与APP2的设备个数,“count(APP1)”表示安装了APP1的总的设备个数。侵占度越高,说APP1有更多的用户安装了APP2,侵占度越高的候选竞品越值得重点关注。如果侵占度在短时间内大幅提升,则说明该候选竞品是需要优先考虑的竞品。可见公式(2)与公式(1)的含义是相同的。
图5为本发明实施例提供的基于应用的竞品分析方法中计算流向信息的流程图。如图5所示,在一种可能实现方式中,图1中的步骤S150中的根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息,可包括:步骤S410,根据获取的所述应用安装信息,获取设定周期内卸载所述指定应用的用户;步骤S420,统计所述卸载所述指定应用的用户中安装了某个候选竞品的安装数;步骤S430,根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息。
根据本发明基于应用的竞品分析方法的一种实施方式,根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息,包括:若设定周期内卸载所述指定应用的某一用户安装了N个所述候选竞品,则将N分之一记为该用户从所述指定应用到所述某个候选竞品的流向值;将所有用户的从所述指定应用到所述某个候选竞品的流向值之和,作为从所述指定应用到所述某个候选竞品的流向信息。
具体地,从APP列表中的信息中还可以提取出APP间用户流向信息。如果在某一周期内,用户卸载APP1而安装APP2,这种流失状态下,APP1显然应该将APP2作为高优先级的竞品;而对APP2而言,APP1可能就没有很高的优先级。计算APP间用户流向步骤如下:
31)指定扫描周期(可选择当前日期+前后3天为周期,合计7天),扫描该周期内用户群体所有的卸载、新增安装行为。
32)针对每一次卸载行为,例如卸载了APP1,可以认为该卸载是由于周期内新增的竞品导致的结果。如果同时有多个竞品安装,如卸载APP1的周期内,新增安装了APP1的竞品APP2和APP3,则所有竞品均分该用户流向权重。在此例中可表示为:流失内容:(APP1-APP2:0.5;APP1-APP3:0.5);反过来,流入内容:(APP2-APP1:-0.5;APP3-APP1:-0.5)。在这一步骤中,新增竞品均分这次流失的权重并产出对称数据。
33)通过这样的方式,即可构建APP1的所有流向信息,其中正值表示APP1的用户流失到其他竞品如APP2、APP3中,负值表示竞品用户流入到APP1中来。据此统计结果可产出单个APP对应的竞品流入流出信息。
依据流入流出信息还可产出竞争胜负指标。可用流出的正值和流入的负值表示竞品之间竞争胜负的情况。设备周期内的流向信息可能是双向的,可能有一部分用户从APP1流向APP2,还有一部分用户从APP2流向APP1。据此还可计算绝对流失情况,即计算流失量与流入量的差值,从而找出绝对流出的竞品。
进一步地,可将APP1流向其它候选竞品的所有流向权重汇总统计,挖掘出APP的竞品列表,可将指定APP的侵占度和流入流出情况排序列出,也可通过图表的形式展示出来,可以直观地看到竞品之间的竞争结果。
综上所述,对于一个指定的APP,通过该APP对应的官网元信息等描述内容,寻找可能的竞品范围;进而通过挖掘设定周期内APP安装列表,来获取这些竞品对指定APP的侵占程度,确定当前APP与竞品的侵占关系;最后通过用户的流入流出状态,指明APP当前最需要关注的竞品流入流出情况。据此可以挖掘出一个APP的竞品列表,以及每个竞品对于当前APP的竞争程度,产出当前最需要关注的竞品排名,包括侵占度排序、流出排序和流入排序等。本发明实施例依靠安装数据,可客观地挖掘其对应的竞品情况,并且了解产品目前侵占度最大的竞争对手,以及当前的胜负情况,让运营人员不再依赖繁琐的专家知识。
上述技术方案具有如下优点或有益效果:依靠公司的元信息和用户安装数据,客观地挖掘出对应的竞品情况,全面了解应用市场上所有的竞争对手,并且了解产品目前侵占度最大的竞争对手,以及当前的胜负情况,产出当前最需要关注的竞品排名,该方法依据可靠且数据全面,有利于帮助公司扩大其服务品种,增长其服务目标。
图6为本发明实施例提供的基于应用的竞品分析装置的结构框图。如图6所示,本发明实施例的基于应用的竞品分析装置包括:候选竞品确定单元300,用于确定指定应用的候选竞品;安装信息获取单元400,用于获取用户的应用安装信息;竞品分析单元500,用于:根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息。
图7为本发明实施例提供的基于应用的竞品分析装置中候选竞品确定单元的结构框图。如图7所示,根据本发明基于应用的竞品分析装置的一种实施方式,所述候选竞品确定单元300包括:元信息获取子单元310,用于获取各个应用的元信息;相似度计算子单元320,用于计算所述指定应用的元信息与各个应用的元信息之间的相似度;确定子单元330,用于根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品。
图8为本发明实施例提供的基于应用的竞品分析装置中元信息获取子单元的结构框图。如图8所示,根据本发明基于应用的竞品分析装置的一种实施方式,所述元信息获取子单元310包括第一获取子单元311,用于:在应用展示平台中获取各个应用的描述信息,从所述描述信息中提取各个应用的网址;和/或,在搜索引擎上搜索各个应用的网址;爬取所述网址的网页数据,从所述网页数据中提取第一元信息,所述第一元信息包括网页中Meta标签上的关键词信息和/或网页描述信息。
根据本发明基于应用的竞品分析装置的一种实施方式,所述元信息获取子单元310还包括第二获取子单元312,用于:在搜索引擎和/或应用展示平台中搜索各个应用的第二元信息,所述第二元信息包括各个应用的描述信息。
根据本发明基于应用的竞品分析装置的一种实施方式,所述相似度计算子单元320还用于:在获取所述第一元信息失败的情况下,根据所述第二元信息计算所述各个应用的元信息之间的相似度。
根据本发明基于应用的竞品分析装置的一种实施方式,所述相似度计算子单元320还用于:为所述第一元信息和所述第二元信息设置权重;根据所述第一元信息和所述第二元信息的权重,使用所述第一元信息和所述第二元信息计算所述各个应用的元信息之间的相似度。
根据本发明基于应用的竞品分析装置的一种实施方式,所述相似度计算子单元320还用于:通过切词算法和word2vec模型计算所述各个应用的元信息之间的相似度。
根据本发明基于应用的竞品分析装置的一种实施方式,所述候选竞品确定单元300还用于:将所述指定应用与其它应用之间的相似度按照相似度的高低进行排序;将与所述指定应用之间的相似度大于预先设置的相似度阈值且排序在前Y位的应用作为所述指定应用的候选竞品,其中,Y为预先设置的竞品待选值。
图9为本发明实施例提供的基于应用的竞品分析装置中竞品分析单元的结构框图。如图9所示,根据本发明基于应用的竞品分析装置的一种实施方式,所述竞品分析单元500包括侵占度分析子单元510,用于:根据获取的所述应用安装信息,统计在设定周期内安装了所述指定应用的用户个数;统计所述指定应用与某个候选竞品的交集个数,所述交集个数是在设定周期内安装了所述指定应用且安装了所述某个候选竞品的用户个数;将所述交集个数与所述安装了所述指定应用的用户个数之比,作为所述某个候选竞品对所述指定应用的侵占度。
图10为本发明实施例提供的基于应用的竞品分析装置中用户流向分析子单元的结构框图。如图9和图10所示,根据本发明基于应用的竞品分析装置的一种实施方式,所述竞品分析单元500包括用户流向分析子单元520,所述用户流向分析子单元520包括:卸载用户获取子单元521,用于根据获取的所述应用安装信息,获取设定周期内卸载所述指定应用的用户;安装数统计子单元522,用于统计所述卸载所述指定应用的用户中安装了某个候选竞品的安装数;流向信息计算子单元523,用于根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息。
根据本发明基于应用的竞品分析装置的一种实施方式,所述流向信息计算子单元523还用于:若设定周期内卸载所述指定应用的某一用户安装了N个所述候选竞品,则将N分之一记为该用户从所述指定应用到所述某个候选竞品的流向值;将所有用户的从所述指定应用到所述某个候选竞品的流向值之和,作为从所述指定应用到所述某个候选竞品的流向信息。
本发明实施例的基于应用的竞品分析装置中各单元的功能可以参见上述方法的相关描述,在此不再赘述。
在一个可能的设计中,基于应用的竞品分析装置的结构中包括处理器和存储器,所述存储器用于存储支持基于应用的竞品分析装置执行上述基于应用的竞品分析方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述基于应用的竞品分析装置还可以包括通信接口,用于基于应用的竞品分析装置与其他设备或通信网络通信。
图11为本发明另一实施例提供的基于应用的竞品分析装置的结构框图。如图11所示,该装置包括:存储器101和处理器102,存储器101内存储有可在处理器102上运行的计算机程序。所述处理器102执行所述计算机程序时实现上述实施例中基于应用的竞品分析方法。所述存储器101和处理器102的数量可以为一个或多个。
该装置还包括:
通信接口103,用于与外界设备进行通信,进行数据交互传输。
存储器101可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器101、处理器102和通信接口103独立实现,则存储器101、处理器102和通信接口103可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器101、处理器102及通信接口103集成在一块芯片上,则存储器101、处理器102及通信接口103可以通过内部接口完成相互间的通信。
又一方面,本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述基于应用的竞品分析方法中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (22)

1.一种基于应用的竞品分析方法,其特征在于,包括:
获取各个应用的元信息,利用所述各个应用的元信息之间的相似度确定指定应用的候选竞品;所述元信息包括网页标签的关键词信息、网页描述信息以及应用描述信息中的至少一种;
获取用户的应用安装信息;
根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息;所述侵占度用于量化所述候选竞品对目标应用的竞争性;
其中,所述根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息,包括:
根据获取的所述应用安装信息,获取设定周期内卸载所述指定应用的用户;统计所述卸载所述指定应用的用户中安装了某个候选竞品的安装数;根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息。
2.根据权利要求1所述的方法,其特征在于,确定指定应用的候选竞品,包括:
计算所述指定应用的元信息与各个应用的元信息之间的相似度;
根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品。
3.根据权利要求2所述的方法,其特征在于,获取各个应用的元信息,包括:
在应用展示平台中获取各个应用的描述信息,从所述描述信息中提取各个应用的网址;和/或,在搜索引擎上搜索各个应用的网址;
爬取所述网址的网页数据,从所述网页数据中提取第一元信息,所述第一元信息包括网页中Meta标签上的关键词信息和/或网页描述信息。
4.根据权利要求3所述的方法,其特征在于,获取各个应用的元信息,还包括:在搜索引擎和/或应用展示平台中搜索各个应用的第二元信息,所述第二元信息包括各个应用的描述信息。
5.根据权利要求4所述的方法,其特征在于,计算所述指定应用的元信息与各个应用的元信息之间的相似度,包括:
在获取所述第一元信息失败的情况下,根据所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
6.根据权利要求4所述的方法,其特征在于,计算所述指定应用的元信息与各个应用的元信息之间的相似度,包括:
为所述第一元信息和所述第二元信息设置权重;
根据所述第一元信息和所述第二元信息的权重,使用所述第一元信息和所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
7.根据权利要求2-6中任一项所述的方法,其特征在于,计算所述指定应用的元信息与各个应用的元信息之间的相似度,还包括:通过切词算法和word2vec模型计算所述指定应用与各个应用的元信息之间的相似度。
8.根据权利要求2-6中任一项所述的方法,其特征在于,根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品,包括:
将所述指定应用与其它应用之间的相似度按照相似度的高低进行排序;
将与所述指定应用之间的相似度大于预先设置的相似度阈值且排序在前Y位的应用作为所述指定应用的候选竞品,其中,Y为预先设置的竞品待选值。
9.根据权利要求1-6中任一项所述的方法,其特征在于,根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度,包括:
根据获取的所述应用安装信息,统计在设定周期内安装了所述指定应用的用户个数;
统计所述指定应用与某个候选竞品的交集个数,所述交集个数是在设定周期内安装了所述指定应用且安装了所述某个候选竞品的用户个数;
将所述交集个数与所述安装了所述指定应用的用户个数之比,作为所述某个候选竞品对所述指定应用的侵占度。
10.根据权利要求1-6中任一项所述的方法,其特征在于,根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息,包括:
若设定周期内卸载所述指定应用的某一用户安装了N个所述候选竞品,则将N分之一记为该用户从所述指定应用到所述某个候选竞品的流向值;
将所有用户的从所述指定应用到所述某个候选竞品的流向值之和,作为从所述指定应用到所述某个候选竞品的流向信息。
11.一种基于应用的竞品分析装置,其特征在于,包括:
候选竞品确定单元,用于获取各个应用的元信息,利用所述各个应用的元信息之间的相似度确定指定应用的候选竞品;所述元信息包括网页标签的关键词信息、网页描述信息以及应用描述信息中的至少一种;
安装信息获取单元,用于获取用户的应用安装信息;
竞品分析单元,用于:根据获取的所述应用安装信息,计算所述候选竞品对所述指定应用的侵占度;和/或,根据获取的所述应用安装信息,计算所述指定应用与所述候选竞品之间的用户流向信息;所述侵占度用于量化所述候选竞品对目标应用的竞争性;
其中,所述用户流向分析子单元包括:卸载用户获取子单元,用于根据获取的所述应用安装信息,获取设定周期内卸载所述指定应用的用户;安装数统计子单元,用于统计所述卸载所述指定应用的用户中安装了某个候选竞品的安装数;流向信息计算子单元,用于根据所述安装数,计算从所述指定应用到所述某个候选竞品的流向信息。
12.根据权利要求11所述的装置,其特征在于,所述候选竞品确定单元包括:
相似度计算子单元,用于计算所述指定应用的元信息与各个应用的元信息之间的相似度;
确定子单元,用于根据所述指定应用的元信息与各个应用的元信息之间的相似度,确定所述指定应用的候选竞品。
13.根据权利要求12所述的装置,其特征在于,所述元信息获取子单元包括第一获取子单元,用于:
在应用展示平台中获取各个应用的描述信息,从所述描述信息中提取各个应用的网址;和/或,在搜索引擎上搜索各个应用的网址;
爬取所述网址的网页数据,从所述网页数据中提取第一元信息,所述第一元信息包括网页中Meta标签上的关键词信息和/或网页描述信息。
14.根据权利要求13所述的装置,其特征在于,所述元信息获取子单元还包括第二获取子单元,用于:在搜索引擎和/或应用展示平台中搜索各个应用的第二元信息,所述第二元信息包括各个应用的描述信息。
15.根据权利要求14所述的装置,其特征在于,所述相似度计算子单元还用于:在获取所述第一元信息失败的情况下,根据所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
16.根据权利要求14所述的装置,其特征在于,所述相似度计算子单元还用于:
为所述第一元信息和所述第二元信息设置权重;
根据所述第一元信息和所述第二元信息的权重,使用所述第一元信息和所述第二元信息计算所述指定应用与各个应用的元信息之间的相似度。
17.根据权利要求12-16中任一项所述的装置,其特征在于,所述相似度计算子单元还用于:通过切词算法和word2vec模型计算所述指定应用与各个应用的元信息之间的相似度。
18.根据权利要求12-16中任一项所述的装置,其特征在于,所述候选竞品确定单元还用于:
将所述指定应用与其它应用之间的相似度按照相似度的高低进行排序;
将与所述指定应用之间的相似度大于预先设置的相似度阈值且排序在前Y位的应用作为所述指定应用的候选竞品,其中,Y为预先设置的竞品待选值。
19.根据权利要求11-16中任一项所述的装置,其特征在于,所述竞品分析单元包括侵占度分析子单元,用于:
根据获取的所述应用安装信息,统计在设定周期内安装了所述指定应用的用户个数;
统计所述指定应用与某个候选竞品的交集个数,所述交集个数是在设定周期内安装了所述指定应用且安装了所述某个候选竞品的用户个数;
将所述交集个数与所述安装了所述指定应用的用户个数之比,作为所述某个候选竞品对所述指定应用的侵占度。
20.根据权利要求11-16中任一项所述的装置,其特征在于,所述流向信息计算子单元还用于:
若设定周期内卸载所述指定应用的某一用户安装了N个所述候选竞品,则将N分之一记为该用户从所述指定应用到所述某个候选竞品的流向值;
将所有用户的从所述指定应用到所述某个候选竞品的流向值之和,作为从所述指定应用到所述某个候选竞品的流向信息。
21.一种基于应用的竞品分析装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-10中任一所述的方法。
22.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的方法。
CN201810711508.0A 2018-07-03 2018-07-03 基于应用的竞品分析方法、装置及存储介质 Active CN110675205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810711508.0A CN110675205B (zh) 2018-07-03 2018-07-03 基于应用的竞品分析方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810711508.0A CN110675205B (zh) 2018-07-03 2018-07-03 基于应用的竞品分析方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110675205A CN110675205A (zh) 2020-01-10
CN110675205B true CN110675205B (zh) 2022-11-29

Family

ID=69065834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810711508.0A Active CN110675205B (zh) 2018-07-03 2018-07-03 基于应用的竞品分析方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110675205B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781076A (zh) * 2020-06-29 2021-12-10 北京沃东天骏信息技术有限公司 提示方法、装置、设备及可读存储介质
CN112100044B (zh) * 2020-09-01 2023-03-24 广州掌淘网络科技有限公司 一种识别游戏相似程度的方法与设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107481066A (zh) * 2017-08-29 2017-12-15 艾普英捷(北京)智能科技股份有限公司 一种基于大数据的竞品分析方法及系统
CN108073613A (zh) * 2016-11-14 2018-05-25 腾讯科技(深圳)有限公司 信息发送方法及装置
CN108197106A (zh) * 2017-12-29 2018-06-22 深圳市中易科技有限责任公司 一种基于深度学习的产品竞争分析方法、装置及系统
CN108229999A (zh) * 2016-12-21 2018-06-29 百度在线网络技术(北京)有限公司 竞品评估方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10600017B2 (en) * 2015-12-14 2020-03-24 International Business Machines Corporation Co-opetition index based on rival behavior in social networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073613A (zh) * 2016-11-14 2018-05-25 腾讯科技(深圳)有限公司 信息发送方法及装置
CN108229999A (zh) * 2016-12-21 2018-06-29 百度在线网络技术(北京)有限公司 竞品评估方法及装置
CN107481066A (zh) * 2017-08-29 2017-12-15 艾普英捷(北京)智能科技股份有限公司 一种基于大数据的竞品分析方法及系统
CN108197106A (zh) * 2017-12-29 2018-06-22 深圳市中易科技有限责任公司 一种基于深度学习的产品竞争分析方法、装置及系统

Also Published As

Publication number Publication date
CN110675205A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
US8949227B2 (en) System and method for matching entities and synonym group organizer used therein
CN104573054A (zh) 一种信息推送方法和设备
JP6053131B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN106874253A (zh) 识别敏感信息的方法及装置
US20080162528A1 (en) Content Management System and Method
CN109670101B (zh) 爬虫调度方法、装置、电子设备及存储介质
CN105069103A (zh) App搜索引擎利用用户评论的方法及系统
CN108959550B (zh) 用户关注点挖掘方法、装置、设备及计算机可读介质
CN104933044A (zh) 应用卸载原因的分类方法及分类装置
CN110675205B (zh) 基于应用的竞品分析方法、装置及存储介质
CN111259220A (zh) 一种基于大数据的数据采集方法和系统
CN109657043B (zh) 自动生成文章的方法、装置、设备及存储介质
CN106919593B (zh) 一种搜索的方法和装置
CN107908649B (zh) 一种文本分类的控制方法
CN104462556A (zh) 问答页面相关问题推荐方法和装置
CN111488510A (zh) 小程序相关词的确定方法、装置、处理设备及搜索系统
CN114265777B (zh) 应用程序的测试方法、装置、电子设备及存储介质
CN106445934A (zh) 一种数据处理方法和装置
CN110825976B (zh) 网站页面的检测方法、装置、电子设备及介质
JP5912813B2 (ja) 特許調査結果評価装置、特許調査結果評価方法、およびプログラム
CN111310016B (zh) 标签挖掘方法、装置、服务器和存储介质
US20120047128A1 (en) Open class noun classification
CN113656575A (zh) 训练数据的生成方法、装置、电子设备及可读介质
CN104657397B (zh) 一种信息处理方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant