CN108132940A - 一种应用程序数据提取方法及装置 - Google Patents

一种应用程序数据提取方法及装置 Download PDF

Info

Publication number
CN108132940A
CN108132940A CN201611087034.4A CN201611087034A CN108132940A CN 108132940 A CN108132940 A CN 108132940A CN 201611087034 A CN201611087034 A CN 201611087034A CN 108132940 A CN108132940 A CN 108132940A
Authority
CN
China
Prior art keywords
target
application
data
labels
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611087034.4A
Other languages
English (en)
Other versions
CN108132940B (zh
Inventor
孙楠
侯婉瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd, Beijing Kingsoft Cloud Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN201611087034.4A priority Critical patent/CN108132940B/zh
Publication of CN108132940A publication Critical patent/CN108132940A/zh
Application granted granted Critical
Publication of CN108132940B publication Critical patent/CN108132940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种应用程序数据提取方法及装置,该方法中首先获得目标应用程序的目标标识以及目标应用程序的目标标签;然后从预设的标签列表中,确定目标标签对应的目标数据库字段;最后从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。本发明实施例提供的方案可以基于上述目标标签自动提取应用程序数据,与现有技术相比,本发明实施例提供的方案不需要人工从应用程序数据库中收集应用程序数据,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。

Description

一种应用程序数据提取方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种应用程序数据提取方法及装置。
背景技术
应用程序评测报告是应用程序评测结果的一种书面表达,在应用程序评测报告中,通常是会针对某些应用程序的标签进行评测,而上述标签对应有多个评测项,例如,对于工具类应用程序,功能性可以是一个标签,该应用程序标签对应的评测项可以有功能逻辑以及功能漏洞等,再如,对于一款游戏,画风可以是一个标签,该标签对应的评测项可以有画面质量、画面流畅度、画面风格等。上述每个评测项中以静态图片、常量数据、文档片段、统计分析图以及二维表格等数据信息展现各评测项的直观评测结果。
应用程序数据库是针对应用程序生成的富含大量应用程序数据的数据库,其中,应用程序数据可以包括:应用程序自身信息,例如操作系统类型、内存需求等等;以及用户数据和用户使用应用程序过程产生的运行数据,例如用户个人信息、用户活跃度和用户等级信息等等。运营商可以根据上述应用程序数据来对应用程序生成评测报告,以方便评测应用程序的竞争力,方便对应用程序进行后期规划设计。
现有技术中,在制作应用程序评测报告时,需要评测人员从应用程序数据库中人工收集大量的数据信息;但是,人工的收集方式,获取到的数据量有限,导致获取的应用程序数据不够全面,进而影响应用程序评测的准确性。
发明内容
本发明实施例公开了一种应用程序数据提取方法及装置,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。技术方案如下:
为达上述目的,第一方面,本发明实施例提供一种应用程序数据提取方法,所述方法包括:
获得目标应用程序的目标标识以及所述目标应用程序的目标标签;
从预设的标签列表中,确定所述目标标签对应的目标数据库字段,其中,所述标签列表中存储有应用程序的标签与数据库字段的对应关系;
从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
优选的,所述获得目标应用程序的目标标识以及所述目标应用程序的目标标签,包括:
获得目标应用程序的目标标识;
确定所述目标标识对应的所有标签;
将所确定的所有标签显示在用户界面;
根据用户在所述用户界面的选择操作,从所确定的所有标签中获得所述目标应用程序的目标标签。
优选的,所述从预设的标签列表中,确定所述目标标签对应的目标数据库字段,包括:
查询预设的标签列表中是否记录有所述目标标签;
如果是,确定对应所述目标标签的数据库字段为目标数据库字段;
如果否,生成针对所述目标标签的错误提示信息。
优选的,所述从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据,包括:
在应用程序数据库中,确定对应所述目标数据库字段的目标搜索节点;
确定所述目标数据库字段所对应的应用程序数据的目标数据类型;
根据所述目标数据类型确定目标搜索引擎;
通过所述目标搜索引擎,从所述目标搜索节点中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
优选的,所述从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据,包括:
根据以下信息中的至少一种确定所述目标应用程序的数据提取条件,并根据所述数据提取条件,从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据:
已发布过所述目标应用程序的目标渠道;
所述目标应用程序的目标运行时间段;
所述目标应用程序所运行终端的类型。
优选的,所述方法还包括:
对提取的所述应用程序数据进行数据分析,获得用于生成应用程序评测报告的目标数据。
第二方面,本发明实施例提供了一种应用程序数据提取装置,所述装置包括:
获得模块,用于获得目标应用程序的目标标识以及所述目标应用程序的目标标签;
确定模块,用于从预设的标签列表中,确定所述目标标签对应的目标数据库字段,其中,所述标签列表中存储有应用程序的标签与数据库字段的对应关系;
提取模块,用于从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
优选的,所述获得模块,包括:
第一获得子模块,用于获得目标应用程序的目标标识;
第一确定子模块,用于确定所述目标标识对应的所有标签;
显示子模块,用于将所确定的所有标签显示在用户界面;
第二获得子模块,用于根据用户在所述用户界面的选择操作,从所确定的所有标签中获得所述目标应用程序的目标标签。
优选的,所述确定模块,包括:
查询子模块,用于查询预设的标签列表中是否记录有所述目标标签;
第二确定子模块,用于在所述查询子模块的查询结果为是的情况下,确定对应所述目标标签的数据库字段为目标数据库字段;
生成子模块,用于在所述查询子模块的查询结果为否的情况下,生成针对所述目标标签的错误提示信息。
优选的,所述提取模块,包括:
第三确定子模块,用于在应用程序数据库中,确定对应所述目标数据库字段的目标搜索节点;
第四确定子模块,用于确定所述目标数据库字段所对应的应用程序数据的目标数据类型;
第五确定子模块,用于根据所述目标数据类型确定目标搜索引擎;
提取子模块,用于通过所述目标搜索引擎,从所述目标搜索节点中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
优选的,所述提取模块,具体用于:
根据以下信息中的至少一种确定所述目标应用程序的数据提取条件,并根据所述数据提取条件,从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据:
已发布过所述目标应用程序的目标渠道;
所述目标应用程序的目标运行时间段;
所述目标应用程序所运行终端的类型。
优选的,所述装置还包括:
数据分析模块,用于对提取的所述应用程序数据进行数据分析,获得用于生成应用程序评测报告的目标数据。
由以上可见,本发明实施例提供的方案中,首先获得目标应用程序的目标标识以及目标应用程序的目标标签;然后从预设的标签列表中,确定目标标签对应的目标数据库字段;最后从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。本发明实施例提供的方案中,上述标签列表中存储有应用程序的标签与数据库字段的对应关系,因此,本发明实施例提供的方案可以基于上述目标标签自动提取应用程序数据,与现有技术相比,本发明实施例提供的方案不需要人工从应用程序数据库中收集应用程序数据,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的应用程序数据提取方法的流程示意图;
图2为本发明另一实施例提供的应用程序数据提取方法的流程示意图;
图3为本发明又一实施例提供的应用程序数据提取方法的流程示意图;
图4为本发明再一实施例提供的应用程序数据提取方法的流程示意图;
图5为本发明一实施例提供的应用程序数据提取装置的结构示意图;
图6为本发明另一实施例提供的应用程序数据提取装置的结构示意图;
图7为本发明又一实施例提供的应用程序数据提取装置的结构示意图;
图8为本发明再一实施例提供的应用程序数据提取装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面首先对本发明实施例涉及的技术术语进行简单介绍。
标签,可以理解为事物的分类标记,从应用程序的角度而言,标签则是对应用程序的某些功能或内容的分类标记。例如,对于工具类应用程序,其对应的功能、界面风格可以作为标签;对于游戏而言,游戏的画风、有无服务端、游戏类型等都可以是标签,如,对于画风,更具体及细化的标签可以有:2D画风、3D画风等。
应用程序数据,如上背景技术所述,应用程序数据库是针对应用程序生成的富含大量应用程序数据的数据库,而应用程序数据可以包括:应用程序自身信息,例如操作系统类型、内存需求等等;以及用户数据和用户使用应用程序过程产生的运行数据,例如用户个人信息、用户活跃度和用户等级信息等等。
可以理解,由于应用程序的标签是对应用程序的某些功能或内容的分类标记,标签对于应用程序而言有这十分重要的作用,换言之,标签对应的功能或内容对于应用程序而言是十分重要的,而标签对应的功能或内容的优劣可以通过上述应用程序数据表现出来,所以标签与应用程序数据之间也存在的一定的对应关系。
下面通过具体实施例来对本发明进行详细介绍。
应该说明的是,本发明实施例提供的一种应用程序数据提取方法,可以应用于下述应用程序数据库对应的服务器上,该服务器可以读取应用程序数据库中的应用程序数据。
图1为本发明一实施例提供的应用程序数据提取方法的流程示意图,如图1所示,上述一种应用程序数据提取方法包括:
S101:获得目标应用程序的目标标识以及目标应用程序的目标标签。
可以理解,标识是针对上述服务器而言的,标识与应用程序是一一对应的关系,服务器在得到目标标识时,可以唯一确定该目标标识对应的目标应用程序;例如,每一个应用程序对应的应用程序数据第一次向应用程序数据库中存储时,服务器为该应用程序分配一个唯一的序列号作为标识。
在本发明实施例中,一种可行的情况下:可以为服务器对应配置图形用户界面,例如,设置一游戏管理信息系统,操作者可以登录游戏管理信息系统,该操作者可以通过该图形用户界面输入上述目标标识以及目标标签,进而让服务器获得由操作者输入的目标标识以及目标标签;例如,操作者输入目标标识:剑侠情缘123,以及目标标签:画风、游戏类型;再如,操作者输入目标标识:金山毒霸,以及目标标签:界面风格、功能性。
应该说明的是,上述操作者是指在上述图形用户界面输入目标标识以及目标标签的人,应该与应用程序的用户区分开。
另一种可行的情况下,可以针对该服务器配置客户端,此类客户端配合该服务器,可以提供提取应用程序数据的服务,此类客户端的用户可以通过客户端向服务器发送相应的应用程序数据提取请求,而该应用程序数据提取请求中至少包含有上述目标标识以及目标标签,进而使得服务器获得目标标识以及目标标签。
此外,在本发明实施例中,为了避免操作者输入的标签不规范,如图2所示的本发明另一实施例提供的应用程序数据提取方法的流程示意图,上述获得目标应用程序的目标标识以及目标应用程序的目标标签(S101),可以包括下述步骤S1011~S1014:
S1011:获得目标应用程序的目标标识。
类似的,第一种可行的实施方式中,该目标标识可以是:由操作者通过该专为服务器配置的图形用户界面输入的;第二种可行的实施方式中,该目标标识还可以是由该服务器对应的客户端发送的应用程序数据提取请求中所包含的。
S1012:确定该目标标识对应的所有标签。
该目标标识对应目标应用程序,所以上述目标标识对应的所有标签,可以理解为:目标应用程序对应的所有标签。当然,所确定的任意一个标签,在应用程序数据库中,都应该对应存储有该标签对应的应用程序数据。
S1013:将所确定的所有标签显示在用户界面。
可以理解,在上述第一种可行的实施方式中,此处所述的用户界面为专为服务器配置的图形用户界面,而在第二种可行的实施方式中,此处所述的用户界面为服务器对应的客户端的图形用户界面。
例如,此处所述的用户界面为服务器对应的客户端的图形用户界面,某一目标客户端发送一应用程序数据提取请求,该应用程序数据提取请求中包含有目标标识x,服务器确定该目标标识x所对应的可选标签包括:标签1~10;则此时,服务器将标签1~10发送给该目标客户端,该目标客户端将标签1~10展示在目标客户端的用户界面上。
S1014:根据用户在该用户界面的选择操作,从所确定的所有标签中获得该目标应用程序的目标标签。
结合上述步骤S1013,可以理解,用户界面上显示有可选的所有标签,上述操作者或者客户端的用户可以按照自身需求,从显示的所有标签中选择一部分标签,则服务器将所选择的标签作为目标标签。
例如,用户界面中显示可点击的标签按钮1~10,分别对应标签1~10,操作者或者客户端的用户点击了标签按钮3、5、7、9,则服务器将标签3、5、7、9作为目标标签。
再如,用户界面显示提示信息:可选择的标签有标签1~10。界面下部设置有一文本框,以及对应的“提交”按钮,操作者或者客户端的用户在文本框中输入了标签2、4、6、8,并点击了“提交”按钮,则服务器将标签2、4、6、8作为目标标签。
S102:从预设的标签列表中,确定目标标签对应的目标数据库字段。其中,该标签列表中存储有应用程序的标签与数据库字段的对应关系。
可以理解,在大多数数据库中,数据库表的“列”称为“字段”,每个字段包含某一专题的信息。例如,“通讯录”数据库中,“姓名”、“联系电话”这些都是表中所有行共有的属性,所以把这些列称为“姓名”字段和“联系电话”字段。
在本发明实施例中,上述对应关系中,一个标签可以对应有多个数据库字段,例如,该标签为适用人群,则数据库字段可以有“性别”、“年龄”、“职业”、“所在城市”等。
可以理解,上述步骤S101中所获得的目标标签可以直接由操作者或者客户端的用户直接手动输入,而所输入的目标标签未必记录在上述标签列表中。所以,在本发明实施例中,如图3所示,上述从预设的标签列表中,确定目标标签对应的目标数据库字段(S102),可以包括:
S1021:查询预设的标签列表中是否记录有目标标签。
如果是,执行步骤S1022:确定对应目标标签的数据库字段为目标数据库字段。
例如,标签列表中记录有标签1~20,现服务器获得标签3、5、7和9,由于标签列表中记录有标签3、5、7和9,则此时服务器可以将标签3、5、7和9确定为目标标签。
如果否,执行步骤S1023:生成针对目标标签的错误提示信息。
例如,标签列表中记录有标签1~20,现服务器获得标签21、25和39,由于标签列表中未记录有标签21、25和39,则此时服务器不会将标签21、25和39确定为目标标签,而是仅生成针对目标标签的错误提示信息。
应该说明的是,上述生成的错误提示信息中应该包含有上述操作者或者客户端的用户输入的标签,而服务器可以将生成的错误提示信息推送到服务器对应的图形用户界面,或者客户端的用户输入界面。另一方面,该错误提示信息还可以反馈给服务器的运行维护人员,运行维护人员可以在上述标签列表中,为错误提示信息中的标签建立新的对应关系,以使得之后再次接收到同样的标签时,服务器可以提取到该标签对应的应用程序数据。
例如,运行维护人员发现错误提示信息中包含有标签x,并且该标签x可以对应数据库字段3、4和5,则运维人员可以在上述标签列表中建立:该标签x与数据库字段3、4和5的对应关系。
此外,在本发明实施例中,在执行完步骤S101后,可以先查询应用程序数据库中是否存在对应该目标标识的应用程序数据。
如果是,执行从预设的标签列表中,确定目标标签对应的目标数据库字段(S102)。
如果否,执行步骤:生成针对目标标识的错误提示信息。
可以理解,如果应用程序数据库中为存储有目标标识对应的应用程序数据,服务器必然无法完成提取应用程序数据的任务,所以在应用程序数据库中不存在对应该目标标识的应用程序数据的情况下,应该生成针对目标标识的错误提示信息。
同样的,所生成的针对目标标识的错误提示信息会及时反馈给上述操作者或者客户端的用户;另一方面,该错误提示信息还可以反馈给服务器的运行维护人员,运行维护人员可以根据实际需要,在应用程序数据库中录入关于上述目标标识对应的应用程序数据,以使得之后再次接收到同样的目标标识时,服务器可以提取到该目标标识对应的应用程序数据。
S103:从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。
首先,服务器需要调用对应于应用程序数据库的开发接口,然后从应用程序数据库中,搜索到与该目标标识和目标数据库字段相匹配的应用程序数据,在本发明实施例中,可以用预设的搜索算法,例如遍历算法和寻址算法等,搜索与该目标标识和目标数据库字段相匹配的应用程序数据,最后再将搜索到的应用程序数据提取出来。
在本发明实施例中,上述从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据(S103),可以包括下述四步:
第一步:在应用程序数据库中,确定对应目标数据库字段的目标搜索节点。
可以理解,由于当前数据库所存储的数据量极为庞大,所以应用程序数据库可以由多个搜索节点构成,例如常见的Hadoop架构(一种分布式系统基础架构),而且,服务器可以记录每个搜索节点所存储的数据内容,所以,服务器可以确定目标数据库字段对应的目标搜索节点,即确定目标标签所对应的目标搜索节点。
例如,应用程序数据库是由搜索节点1~5所组成,当前确定的目标数据库字段对应的数据内容存储在搜索节点3,则将搜索节点3确定为目标搜索节点。
第二步:确定目标数据库字段所对应的应用程序数据的目标数据类型。
可以理解,应用程序数据库中的应用程序数据可以有着不同的数据类型,而上述目标数据库字段所对应的应用程序数据的目标数据类型可以通过现有技术确定,在本发明实施例中,服务器可以通过查询数据字典确定该目标数据类型。
数据字典可以是在数据库设计时用到的一种工具,用来描述数据库中基本表的设计,主要包括数据库字段、数据类型、主键、外键等描述表的属性的内容。所以在本发明实施例中,一旦确定了目标数据库字段,就可以通过数据字典查询到具体的目标数据库字段对应的目标数据类型。
第三步:根据目标数据类型确定目标搜索引擎。
在本发明实施例中,可以设置有多类搜索引擎,例如:通用搜索引擎、专业搜索引擎以及图像搜索引擎;并采用搜索引擎适配器适配选择对应类别的搜索引擎。例如,目标数据类型为图像数据类型,则可以确定图像搜索引擎为目标搜索引擎;目标数据类型为日期时间数据类型,则可以确定专业搜索引擎为目标搜索引擎;而目标数据类型为通常的整数型、文本型、浮点型,则可以确定通用搜索引擎为目标搜索引擎。
第四步:通过目标搜索引擎,从上述目标搜索节点中提取与该目标标识和目标数据库字段相匹配的应用程序数据。
可以理解,上述四步可以加快应用程序数据的提取速度,而且,不同数据类型的应用程序数据可以适配不同的搜索引擎进行搜索,所以确保数据搜索的准确度。
另外,应该注意的是,上述从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据(S103),可以包括:
根据以下信息中的至少一种确定该目标应用程序的数据提取条件,并根据该数据提取条件从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据:
已发布过该目标应用程序的目标渠道;
该目标应用程序的目标运行时间段;
该目标应用程序所运行终端的类型。
可以理解,本发明实施例中的数据提取条件是由上述信息所组成确定的。
上述已发布过该目标应用程序的目标渠道作为构成数据提取条件的一种信息,可以理解为:可以提取已发布过该目标应用程序的目标渠道所对应的应用程序数据,例如,该数据提取条件可以为仅提取从安卓市场这一渠道下载安装的目标应用程序所对应的应用程序数据。
上述该目标应用程序的目标运行时间段作为构成数据提取条件的一种信息,可以理解为:服务器仅提取目标运行时间段内,应用程序运行时产生的数据。
例如,对于工具类应用程序而言,可以对应提取每天8:00~10:00,以及每天16:30~19:00应用程序运行时产生的数据,以获知不同时间段内应用程序的用户所使用的具体功能。再如,对于游戏而言,可以对应提取每天9:00~11:00,以及每天19:00~22:00应用程序运行时产生的数据,以获知不同时间段内应用程序的用户行为特征。
上述该目标应用程序所运行终端的类型作为构成数据提取条件的一种信息,可以理解为:服务器仅提取某一类型或者某几种类型的终端上,应用程序运行时产生的数据。例如,服务器仅提取安装在手机以及平板电脑上的应用程序运行时产生的数据。
应该说明的是,本发明实施例中,上述信息不限于所给出的三种,还可以是其他的信息,例如,对于运营商来说,该信息还可以是目标应用程序的运营时间段,如,游戏运营商从2016年5月3号开始运营该目标应用程序,假设当前时间为2016年11月8号,该游戏运营过程中产生大量的游戏数据,很显然的,有些数据是已经不具有时效性了,只具有一定的历史参考价值,当需要提取近期产生的游戏数据或是需要提取实时的游戏数据时,可以设置数据提取条件:提取2016年11月2号至2016年11月8号所产生的游戏数据。
应该说明的是,在本发明实施例中,上述信息可以是由上述操作者或者客户端的用户输入的,例如,用户界面显示可点击的信息按钮1~8,分别对应信息1~8,操作者或者客户端的用户点击了信息按钮2、6和7,则服务器根据信息2、6和7,从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。
由以上可见,本实施例提供的方案中,首先获得目标应用程序的目标标识以及目标应用程序的目标标签;然后从预设的标签列表中,确定目标标签对应的目标数据库字段;最后从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。本实施例提供的方案中,上述标签列表中存储有应用程序的标签与数据库字段的对应关系,因此,本实施例提供的方案可以基于上述目标标签自动提取应用程序数据,与现有技术相比,本实施例提供的方案不需要人工从应用程序数据库中收集应用程序数据,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。
在应用程序的评测领域,从应用程序数据库中提取所需数据目前正处于空白状态,而随着应用程序的快速发展,基础数据来源复杂,数量庞大,应用程序数据的提取方法的选择更为重要。本发明实施例填补了从应用程序数据库中通过标签自动提取应用数据的空白,避免手工收集数据时获得大量无用的应用程序数据,更好地支持了应用程序的管理人员的决策。例如在游戏领域,随着游戏数据的数据量的不断增长,数据类型的不断扩张,对游戏数据统计和实时提取的需求不断增大,游戏数据的提取方法的选择极为重要,而游戏数据提取对游戏评测、运营、升级、转型具有重大意义。
下面通过一个具体实例来对本发明实施例进行简单介绍。
服务器对应配置图形用户界面,操作者通过该图形用户界面输入目标标识:标识x,以及数据提取条件:运行于电脑终端的应用程序产生的应用程序数据。
服务器确定该标识x对应的应用程序所对应的所有可选标签包括:标签1~8,并将所确定的可选标签显示在图形用户界面上,操作者选择了标签1和标签2,则服务器将标签1和标签2确定为目标标签。
然后,服务器查询标签列表中,确定标签1对应的目标数据库字段:字段3~8,标签1对应的目标数据库字段:字段9~13。
在应用程序数据库中,服务器确定字段3~13对应于同一个目标搜索节点:节点X,并且通过查询数据字典,确定字段5对应的应用程序数据的数据类型为图像数据类型,字段6对应的应用程序数据的数据类型为日期时间数据类型,其余的字段对应的应用程序数据的数据类型为通常的整数型、文本型或浮点型。
最终,在搜索节点X中,服务器通过图像搜索引擎搜索:对应于标识x、字段5,并且运行于电脑终端的应用程序产生的应用程序数据;通过专业搜索引擎搜索:对应于标识x、字段6,并且运行于电脑终端的应用程序产生的应用程序数据;通过通用搜索引擎搜索:对应于标识x、字段3、4和7~13,并且运行于电脑终端的应用程序产生的应用程序数据。
最终,服务器提取出各个搜索引擎搜索到的应用程序数据。
图4为本发明再一实施例提供的应用程序数据提取方法的流程示意图,在图1~3所示的任意一种实施例的基础上,如图4所示,该方法还可以包括:
S104:对提取的应用程序数据进行数据分析,获得用于生成应用程序评测报告的目标数据。
从应用程序数据库中提取的应用程序数据并不一定是可以直接用于生成应用程序评测报告的目标数据,而需要通过相应的数据统计分析,才能获得此处所述的目标数据。本领域技术人员清楚的是,针对不同的目标数据,采用不同的数据分析方法,本发明实施例在此不做详细介绍,仅以下述两种目标数据做示例性介绍。
用户留存率:在互联网行业中,用户在某段时间内开始使用应用程序,经过一段时间后,仍然继续使用该应用程序的用户,被认作是留存用户,这部分用户占当时新增用户的比例即是用户留存率。用户留存率体现了应用程序的质量和保留用户的能力,是应用程序评测过程中十分重要的一个目标数据。
用户留存率的计算公式一般如下:
用户留存率=新增用户中登录用户数/新增用户数*100%;
其中,新增用户数为在某个时间段,一般为第一整天,新登录应用的用户数;登录用户数为登录应用后至当前时间,至少登录过一次的用户数。
常见的用户留存率包括:次日留存率、第3日留存率、第7日留存率和第30日留存率。假设在本发明实施例中,对于某一工具类应用程序,需要求得第7日留存率,则第7日留存率的计算公式如下:
第7日留存率=(第一天新增的用户中,在注册的第7天还有登录的用户数)/第一天新增总用户数。
转化率(Take Rates,又叫Conversions Rates):是指在一个统计周期内,完成转化行为的次数占总点击次数的比率。其计算公式可以为:转化率=进行了相应的动作的访问量/总访问量;转化率的指标意义在与:衡量应用程序内容对用户的吸引程度。
以游戏的付费转化率为例,该转化率的计算公式可以是:
转化率=付费用户总数/游戏注册用户总数×100%。
从上述两个示例可以看出,上述目标数据并不能直接从应用程序数据库中提取出来,而是要对从应用程序数据库中提取出来的应用程序数据进行统计分析后,才能确定。
由以上可见,本实施例提供的方案中,首先获得目标应用程序的目标标识以及目标应用程序的目标标签;然后从预设的标签列表中,确定目标标签对应的目标数据库字段;最后从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。本实施例提供的方案中,上述标签列表中存储有应用程序的标签与数据库字段的对应关系,因此,本实施例提供的方案可以基于上述目标标签自动提取应用程序数据,与现有技术相比,本实施例提供的方案不需要人工从应用程序数据库中收集应用程序数据,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。
相应于图1所示方法实施例,如图5所示,本发明实施例还提供了一种应用程序数据提取装置,所述装置包括:
获得模块110,用于获得目标应用程序的目标标识以及所述目标应用程序的目标标签;
确定模块120,用于从预设的标签列表中,确定所述目标标签对应的目标数据库字段,其中,所述标签列表中存储有应用程序的标签与数据库字段的对应关系;
提取模块130,用于从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
相应于图2所示方法实施例,如图6所示,在实际应用中,具体的,所述获得模块110,可以包括:
第一获得子模块1101,用于获得目标应用程序的目标标识;
第一确定子模块1102,用于确定所述目标标识对应的所有标签;
显示子模块1103,用于将所确定的所有标签显示在用户界面;
第二获得子模块1104,用于根据用户在所述用户界面的选择操作,从所确定的所有标签中获得所述目标应用程序的目标标签。
相应于图3所示方法实施例,如图7所示,在实际应用中,具体的,所述确定模块120,可以包括:
查询子模块1201,用于查询预设的标签列表中是否记录有所述目标标签;
第二确定子模块1202,用于在所述查询子模块的查询结果为是的情况下,确定对应所述目标标签的数据库字段为目标数据库字段;
生成子模块1203,用于在所述查询子模块的查询结果为否的情况下,生成针对所述目标标签的错误提示信息。
在实际应用中,具体的,所述提取模块130,可以包括:第三确定子模块、第四确定子模块、第五确定子模块和提取子模块(图中未示出),
该第三确定子模块,用于在应用程序数据库中,确定对应所述目标数据库字段的目标搜索节点;
该第四确定子模块,用于确定所述目标数据库字段所对应的应用程序数据的目标数据类型;
该第五确定子模块,用于根据所述目标数据类型确定目标搜索引擎;
该提取子模块,用于通过所述目标搜索引擎,从所述目标搜索节点中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
在实际应用中,具体的,所述提取模块130,可以具体用于:
根据以下信息中的至少一种确定所述目标应用程序的数据提取条件,并根据所述数据提取条件,从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据:
已发布过所述目标应用程序的目标渠道;
所述目标应用程序的目标运行时间段;
所述目标应用程序所运行终端的类型。
由以上可见,本实施例提供的方案中,首先获得目标应用程序的目标标识以及目标应用程序的目标标签;然后从预设的标签列表中,确定目标标签对应的目标数据库字段;最后从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。本实施例提供的方案中,上述标签列表中存储有应用程序的标签与数据库字段的对应关系,因此,本实施例提供的方案可以基于上述目标标签自动提取应用程序数据,与现有技术相比,本实施例提供的方案不需要人工从应用程序数据库中收集应用程序数据,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。
相应于图4所示方法实施例,在图5~7所示装置实施例的基础上,如图8所示,所述装置还可以包括:
数据分析模块140,用于对提取的所述应用程序数据进行数据分析,获得用于生成应用程序评测报告的目标数据。
由以上可见,本实施例提供的方案中,首先获得目标应用程序的目标标识以及目标应用程序的目标标签;然后从预设的标签列表中,确定目标标签对应的目标数据库字段;最后从应用程序数据库中提取与该目标标识和目标数据库字段相匹配的应用程序数据。本实施例提供的方案中,上述标签列表中存储有应用程序的标签与数据库字段的对应关系,因此,本实施例提供的方案可以基于上述目标标签自动提取应用程序数据,与现有技术相比,本实施例提供的方案不需要人工从应用程序数据库中收集应用程序数据,以保证提取的应用程序数据的全面性,进而保证应用程序评测的准确性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种应用程序数据提取方法,其特征在于,所述方法包括:
获得目标应用程序的目标标识以及所述目标应用程序的目标标签;
从预设的标签列表中,确定所述目标标签对应的目标数据库字段,其中,所述标签列表中存储有应用程序的标签与数据库字段的对应关系;
从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
2.根据权利要求1所述的方法,其特征在于,所述获得目标应用程序的目标标识以及所述目标应用程序的目标标签,包括:
获得目标应用程序的目标标识;
确定所述目标标识对应的所有标签;
将所确定的所有标签显示在用户界面;
根据用户在所述用户界面的选择操作,从所确定的所有标签中获得所述目标应用程序的目标标签。
3.根据权利要求1所述的方法,其特征在于,所述从预设的标签列表中,确定所述目标标签对应的目标数据库字段,包括:
查询预设的标签列表中是否记录有所述目标标签;
如果是,确定对应所述目标标签的数据库字段为目标数据库字段;
如果否,生成针对所述目标标签的错误提示信息。
4.根据权利要求1所述的方法,其特征在于,所述从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据,包括:
在应用程序数据库中,确定对应所述目标数据库字段的目标搜索节点;
确定所述目标数据库字段所对应的应用程序数据的目标数据类型;
根据所述目标数据类型确定目标搜索引擎;
通过所述目标搜索引擎,从所述目标搜索节点中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
5.据权利要求1所述的方法,其特征在于,所述从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据,包括:
根据以下信息中的至少一种确定所述目标应用程序的数据提取条件,并根据所述数据提取条件,从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据:
已发布过所述目标应用程序的目标渠道;
所述目标应用程序的目标运行时间段;
所述目标应用程序所运行终端的类型。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述方法还包括:
对提取的所述应用程序数据进行数据分析,获得用于生成应用程序评测报告的目标数据。
7.一种应用程序数据提取装置,其特征在于,所述装置包括:
获得模块,用于获得目标应用程序的目标标识以及所述目标应用程序的目标标签;
确定模块,用于从预设的标签列表中,确定所述目标标签对应的目标数据库字段,其中,所述标签列表中存储有应用程序的标签与数据库字段的对应关系;
提取模块,用于从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
8.根据权利要求7所述的装置,其特征在于,所述获得模块,包括:
第一获得子模块,用于获得目标应用程序的目标标识;
第一确定子模块,用于确定所述目标标识对应的所有标签;
显示子模块,用于将所确定的所有标签显示在用户界面;
第二获得子模块,用于根据用户在所述用户界面的选择操作,从所确定的所有标签中获得所述目标应用程序的目标标签。
9.根据权利要求7所述的装置,其特征在于,所述确定模块,包括:
查询子模块,用于查询预设的标签列表中是否记录有所述目标标签;
第二确定子模块,用于在所述查询子模块的查询结果为是的情况下,确定对应所述目标标签的数据库字段为目标数据库字段;
生成子模块,用于在所述查询子模块的查询结果为否的情况下,生成针对所述目标标签的错误提示信息。
10.根据权利要求7所述的装置,其特征在于,所述提取模块,包括:
第三确定子模块,用于在应用程序数据库中,确定对应所述目标数据库字段的目标搜索节点;
第四确定子模块,用于确定所述目标数据库字段所对应的应用程序数据的目标数据类型;
第五确定子模块,用于根据所述目标数据类型确定目标搜索引擎;
提取子模块,用于通过所述目标搜索引擎,从所述目标搜索节点中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据。
11.据权利要求7所述的装置,其特征在于,所述提取模块,具体用于:
根据以下信息中的至少一种确定所述目标应用程序的数据提取条件,并根据所述数据提取条件,从应用程序数据库中提取与所述目标标识和所述目标数据库字段相匹配的应用程序数据:
已发布过所述目标应用程序的目标渠道;
所述目标应用程序的目标运行时间段;
所述目标应用程序所运行终端的类型。
12.根据权利要求7~11任一项所述的装置,其特征在于,所述装置还包括:
数据分析模块,用于对提取的所述应用程序数据进行数据分析,获得用于生成应用程序评测报告的目标数据。
CN201611087034.4A 2016-12-01 2016-12-01 一种应用程序数据提取方法及装置 Active CN108132940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611087034.4A CN108132940B (zh) 2016-12-01 2016-12-01 一种应用程序数据提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611087034.4A CN108132940B (zh) 2016-12-01 2016-12-01 一种应用程序数据提取方法及装置

Publications (2)

Publication Number Publication Date
CN108132940A true CN108132940A (zh) 2018-06-08
CN108132940B CN108132940B (zh) 2020-10-02

Family

ID=62387494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611087034.4A Active CN108132940B (zh) 2016-12-01 2016-12-01 一种应用程序数据提取方法及装置

Country Status (1)

Country Link
CN (1) CN108132940B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558462A (zh) * 2018-11-02 2019-04-02 深圳智链物联科技有限公司 数据统计方法及装置
CN110968608A (zh) * 2018-09-27 2020-04-07 飞狐信息技术(天津)有限公司 一种游戏任务的统计方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667179A (zh) * 2008-09-03 2010-03-10 华为技术有限公司 移动搜索方法及其系统、搜索服务器同步搜索能力的方法
US20130318568A1 (en) * 2008-10-21 2013-11-28 Lookout Inc. Assessing a data object based on application data associated with the data object
CN103425574A (zh) * 2012-05-25 2013-12-04 腾讯科技(深圳)有限公司 一种测试应用程序的方法及装置
CN103942136A (zh) * 2014-04-21 2014-07-23 百度在线网络技术(北京)有限公司 日志统计策略配置方法和装置、日志统计方法和装置
CN104536863A (zh) * 2014-12-08 2015-04-22 广东欧珀移动通信有限公司 一种应用程序的测试方法及装置
CN105095081A (zh) * 2015-08-06 2015-11-25 小米科技有限责任公司 应用程序的功能测试方法及装置
CN105095207A (zh) * 2014-04-18 2015-11-25 阿里巴巴集团控股有限公司 检索、获取应用软件内容的方法和装置
CN105204970A (zh) * 2014-06-30 2015-12-30 北京金山安全软件有限公司 检测app的cpu占用率异常的方法、装置及移动终端
CN105279079A (zh) * 2014-06-25 2016-01-27 腾讯科技(深圳)有限公司 应用程序性能估测方法、装置和系统
CN105302706A (zh) * 2014-06-05 2016-02-03 腾讯科技(深圳)有限公司 应用程序测试方法和装置
CN106033393A (zh) * 2015-03-13 2016-10-19 展讯通信(天津)有限公司 一种应用程序测试方法及系统以及移动终端

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667179A (zh) * 2008-09-03 2010-03-10 华为技术有限公司 移动搜索方法及其系统、搜索服务器同步搜索能力的方法
US20130318568A1 (en) * 2008-10-21 2013-11-28 Lookout Inc. Assessing a data object based on application data associated with the data object
CN103425574A (zh) * 2012-05-25 2013-12-04 腾讯科技(深圳)有限公司 一种测试应用程序的方法及装置
CN105095207A (zh) * 2014-04-18 2015-11-25 阿里巴巴集团控股有限公司 检索、获取应用软件内容的方法和装置
CN103942136A (zh) * 2014-04-21 2014-07-23 百度在线网络技术(北京)有限公司 日志统计策略配置方法和装置、日志统计方法和装置
CN105302706A (zh) * 2014-06-05 2016-02-03 腾讯科技(深圳)有限公司 应用程序测试方法和装置
CN105279079A (zh) * 2014-06-25 2016-01-27 腾讯科技(深圳)有限公司 应用程序性能估测方法、装置和系统
CN105204970A (zh) * 2014-06-30 2015-12-30 北京金山安全软件有限公司 检测app的cpu占用率异常的方法、装置及移动终端
CN104536863A (zh) * 2014-12-08 2015-04-22 广东欧珀移动通信有限公司 一种应用程序的测试方法及装置
CN106033393A (zh) * 2015-03-13 2016-10-19 展讯通信(天津)有限公司 一种应用程序测试方法及系统以及移动终端
CN105095081A (zh) * 2015-08-06 2015-11-25 小米科技有限责任公司 应用程序的功能测试方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
汤奕: ""基于Android平台的移动应用数据统计分析工具的设计与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110968608A (zh) * 2018-09-27 2020-04-07 飞狐信息技术(天津)有限公司 一种游戏任务的统计方法及装置
CN109558462A (zh) * 2018-11-02 2019-04-02 深圳智链物联科技有限公司 数据统计方法及装置

Also Published As

Publication number Publication date
CN108132940B (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
US7942319B2 (en) Location information management
JP4980395B2 (ja) データ分析システム及び方法
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN106663104A (zh) 学习和使用用于查询消歧的上下文内容检索规则
US20150161555A1 (en) Scheduling tasks to operators
CN106095842B (zh) 在线课程搜索方法和装置
CN111709613A (zh) 基于数据统计的任务自动分配方法、装置及计算机设备
CN110472163A (zh) 地图搜索结果的展现确定方法、装置、电子设备和介质
CN111177544A (zh) 一种基于用户行为数据和用户画像数据的运营系统及方法
US20110184815A1 (en) System and method for sharing profits with one or more content providers
CN108074033A (zh) 指标数据的处理方法、系统、电子设备和存储介质
US10698904B1 (en) Apparatus and method for acquiring, managing, sharing, monitoring, analyzing and publishing web-based time series data
CN103246963A (zh) 基于物联网的员工培训系统
KR101762720B1 (ko) 포탈 기반 물관련 정보 제공 시스템
CN107491463B (zh) 数据查询的优化方法和系统
CN115081414B (zh) 基于数据模型的电子表格生成方法、装置、设备及介质
CN108681568A (zh) 一种搜索排序方法、装置、设备及计算机可读存储介质
CN111913954A (zh) 智能数据标准目录生成方法和装置
CN104834730B (zh) 数据分析系统和方法
JP2006268690A (ja) Faq提示・改善方法、faq提示・改善装置およびfaq提示・改善プログラム
US11308102B2 (en) Data catalog automatic generation system and data catalog automatic generation method
CN105373872A (zh) 工作发布者识别
CN108132940A (zh) 一种应用程序数据提取方法及装置
CN109544271A (zh) 一种交易管理系统
JP6338758B1 (ja) 配信システム、配信方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant