CN105956050A - 一种数据收集方法、装置及设备 - Google Patents

一种数据收集方法、装置及设备 Download PDF

Info

Publication number
CN105956050A
CN105956050A CN201610267162.0A CN201610267162A CN105956050A CN 105956050 A CN105956050 A CN 105956050A CN 201610267162 A CN201610267162 A CN 201610267162A CN 105956050 A CN105956050 A CN 105956050A
Authority
CN
China
Prior art keywords
file
store path
url link
history
related information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610267162.0A
Other languages
English (en)
Other versions
CN105956050B (zh
Inventor
李文靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Baoqu Technology Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201610267162.0A priority Critical patent/CN105956050B/zh
Publication of CN105956050A publication Critical patent/CN105956050A/zh
Application granted granted Critical
Publication of CN105956050B publication Critical patent/CN105956050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种数据收集方法、装置及设备。其中,该方法包括:获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。通过本发明实施例,可以收集目标浏览器的用户下载文件的信息。

Description

一种数据收集方法、装置及设备
技术领域
本发明涉及数据分析技术领域,具体涉及一种数据收集方法、装置及设备。
背景技术
随着网络技术的迅速发展,浏览器的应用越来越广泛,各种类型的浏览器应运而生,因此,不同浏览器之间不可避免的会产生竞争。如何分析竞争对手的浏览器的数据下载情况,来提升自身浏览器的性能,改善自身网站的用户体验,是一个亟待解决的技术问题。
发明内容
本发明实施例提供了一种数据收集方法、装置及设备,可以收集竞争对手浏览器的用户下载文件的信息。
本发明实施例第一方面提供了一种数据收集方法,包括:
获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符(英文:Uniform ResourceLocator,URL)链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
结合本发明实施例的第一方面的实施方式,在第一方面的第一种可能的实施方式中,所述存储路径表中还包括身份标识,所述URL链接表中还包括身份标识;所述将所述存储路径和所述URL链接进行关联,包括:
按照身份标识将所述存储路径和所述URL链接进行关联。
结合本发明实施例的第一方面的实施方式,在第一方面的第二种可能的实施方式中,所述存储路径包括用于指示所述历史下载文件的类型的信息;所述将所述存储路径和所述URL链接进行关联,得到关联信息表之后,所述方法还包括:
按照所述历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
结合本发明实施例的第一方面、第一方面的第一种或第二种可能的实施方式,在第一方面的第三种可能的实施方式中,所述方法还包括:
判断当前时刻是否到达预设时刻,若是,执行所述获取目标浏览器的历史数据库文件的步骤。
结合本发明实施例的第一方面、第一方面的第一种或第二种可能的实施方式,在第一方面的第四种可能的实施方式中,所述方法还包括:
判断目标浏览器的历史下载文件的个数是否大于或等于预设个数阈值,若是,执行所述获取目标浏览器的历史数据库文件的步骤。
第二方面,本发明实施例提供了一种数据收集装置,包括:
获取单元,用于获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
关联单元,用于将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
结合本发明实施例的第二方面的实施方式,在第二方面的第一种可能的实施方式中,所述存储路径表中还包括身份标识,所述URL链接表中还包括身份标识;所述关联单元具体用于:
按照身份标识将所述存储路径和所述URL链接进行关联,得到关联信息表。
结合本发明实施例的第二方面的实施方式,在第二方面的第二种可能的实施方式中,所述存储路径包括用于指示所述历史下载文件的类型的信息;所述装置还包括:
归类单元,用于在所述关联单元将所述存储路径和所述URL链接进行关联,得到关联信息表之后,按照所述历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
结合本发明实施例的第二方面、第二方面的第一种或第二种可能的实施方式,在第二方面的第三种可能的实施方式中,所述装置还包括:
第一判断单元,用于判断当前时刻是否到达预设时刻,若是,触发所述获取单元执行所述获取目标浏览器的历史数据库文件的操作。
结合本发明实施例的第二方面、第二方面的第一种或第二种可能的实施方式,在第二方面的第四种可能的实施方式中,所述装置还包括:
第二判断单元,用于判断目标浏览器的历史下载文件的个数是否大于或等于预设个数阈值,若是,触发所述获取单元执行所述获取目标浏览器的历史数据库文件的操作。
本发明实施例第三面提供了一种数据收集设备,包括:处理器、存储器、通信接口和总线;
所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信;所述存储器存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行一种数据收集方法;其中,所述方法包括:
获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
本发明实施例第四方面提供一种存储介质,其中,该存储介质用于存储应用程序,所述应用程序用于在运行时执行本发明实施例的所述的一种数据收集方法。
本发明实施例第五方面提供一种应用程序,其中,该应用程序用于在运行时执行本发明实施例所述的一种数据收集方法。
实施本发明实施例,具有如下有益效果:
获取目标浏览器的历史数据库文件,将历史数据库文件中的存储路径和URL链接进行关联,得到关联信息表,关联信息表中包括存储路径和URL链接的映射关系。根据关联信息表中的内容可以获知用户针对目标浏览器的文件下载信息,进而分析出用户基于目标浏览器的文件下载喜好。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据收集方法的流程示意图;
图1A是本发明实施例提供的存储路径表的数据结构示意图;
图1B是本发明实施例提供的URL链接表的数据结构示意图;
图1C是本发明实施例提供的一种关联信息表的示意图;
图2是本发明实施例提供的另一种数据收集方法的流程示意图;
图3是本发明实施例提供的另一种数据收集方法的流程示意图;
图4是本发明实施例提供的另一种数据收集方法的流程示意图;
图5是本发明实施例提供的一种数据收集装置的结构示意图;
图6是本发明实施例提供的另一种数据收集装置的结构示意图;
图7是本发明实施例提供的另一种数据收集装置的结构示意图;
图8是本发明实施例提供的另一种数据收集装置的结构示意图;
图9是本发明实施例提供的一种数据收集设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下各发明实施例所描述的设备可以是终端或服务器,所述终端包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(Mobile Internet Devices,MID)或穿戴式设备等。
请参见图1,图1是本发明实施例提供的一种数据收集方法的流程示意图。如图1所示,该数据收集方法可以包括但不限于以下步骤。
S101、获取目标浏览器的历史数据库文件。
本发明实施例中,终端获取用户通过目标浏览器下载到本地的历史数据库文件;或者,终端将用户通过目标浏览器下载到本地的历史数据库文件上传至后台服务器,服务器接收终端发送的历史数据库文件。其中,所述目标浏览器包括但不限于:谷歌浏览器。所述服务器为与所述目标浏览器不同的其他浏览器对应的服务器,其他浏览器包括但不限于猎豹浏览器。所述历史数据库文件至少包括至少一个历史下载文件对应的存储路径表和所述至少一个历史下载文件对应的URL链接表,每个URL链接对应一个历史下载文件,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接。
例如,终端将用户采用谷歌浏览器下载的文件保存在本地目录下的\\Google\\Chrome\\User Data\\Default\\History,其中,History文件就是历史数据库文件。具体的,请参见图1A,是本发明实施例提供的存储路径表的数据结构示意图。请参见图1B,是本发明实施例提供的URL链接表的数据结构示意图。图1A和图1B是通过SQLite Expert数据库查看工具获得的History文件中的存储路径表和URL链接表的表结构。该History文件中包括多个表,其中包括downloads表(即历史下载文件的存储路径表)和download_url_chains表(即历史下载文件的URL链接表),downloads表包含的target_path字段即为历史下载文件的存储路径,downloads表中还包含start_time字段,即历史下载文件的下载时间,download_url_chains表中包含url字段,即历史下载文件的下载地址。其中,download_url_chains表中一个URL链接对应一个历史下载文件,download_url_chains表中共记录有5个历史下载文件各自对应的存储路径以及URL链接,其中URL链接http://www.xuetr.com/download/PCHunter_free.zip对应的历史下载文件为PCHunter_free。
S102、将存储路径和URL链接进行关联,得到关联信息表。
本发明实施例中,各个终端将所述历史下载文件的存储路径和所述历史下载文件的URL链接进行关联,得到关联信息表,进而将得到的关联信息表发送给后台服务器,由服务器来根据大量的关联信息表分析大量用户针对目标浏览器的文件下载喜好。或者,服务器获取到每个终端发送的历史数据库文件后,将每个终端发送的历史下载文件的存储路径和URL链接进行关联,得到关联信息表,最终得到大量用户的文件下载信息,进而分析大量用户针对目标浏览器的文件下载喜好。其中,所述关联信息表中包括存储路径集合和URL链接集合的映射,所述存储路径集合包括至少一个存储路径,所述URL链接集合包括至少一个URL链接,其中,存储路径中包含有描述历史下载文件的属性的字段,该属性可以是文件类型。URL链接是历史下载文件的下载地址,根据该地址在后续可以进行软件推广等。通过上述得到的关联信息表可以分析出用户针对所述目标浏览器的文件下载喜好。
作为一种可选的实施方式,所述存储路径表中还包括身份标识,所述URL链接表中还包括身份标识;所述将存储路径和URL链接进行关联具体为:
按照身份标识将存储路径和URL链接进行关联。
具体的,请参见图1C,图1C是本发明实施例提供的一种关联信息表的示意图。其中,按照id字段将History文件中的downloads表和download_url_chains表进行关联,将id相同的存储路径和URL链接进行关联,其中存储路径是终端中的存储目录,其中包含有描述历史下载文件属性的字段信息,例如,存储路径为C:\Users\oxzxm\Downloads\setup_533hrN4.exe,其中的字段“oxzxm”即可表明用户的身份、用户所在的公司名称等等。或者,存储路径为C:\Users\oxzxm\Downloads\mp3,其中的字段“mp3”可表明下载文件的类型为音乐类型。服务器根据这些用户身份信息、文件描述信息等即可分析出用户的下载喜好,进而通过获取大量用户的下载数据信息来分析全网用户的普遍下载喜好信息,从而为后续自身浏览器的升级改造等提供支持,还可以在进行软件推广时根据统计到的用户下载量高的URL,来推广自身的产品。
可选的,关联信息表中还可以包括文件类型字段,用于记录各个存储路径对应的文件类型。
可见,在图1所描述的方法中,获取目标浏览器的历史数据库文件,将历史数据库文件中的存储路径和URL链接进行关联,得到关联信息表,关联信息表中包括存储路径和URL链接的映射关系。根据关联信息表中的内容可以获知用户针对目标浏览器的文件下载信息,进而分析出用户基于目标浏览器的文件下载喜好,为后续自身浏览器产品的升级改造,软件推广等提供数据支持,更精准把控用户需求。
请参见图2,图2是本发明实施例提供的另一种数据收集方法的流程示意图。如图2所示,该数据收集方法可以包括但不限于以下步骤。
S201、获取目标浏览器的历史数据库文件。
本发明实施例中,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接。
S202、将存储路径和URL链接进行关联,得到关联信息表。
本发明实施例中的步骤S201和S202可参见图1所示实施例中的S101和S102,此处不再赘述。
S203、按照历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
本发明实施例中,所述存储路径包括用于指示所述历史下载文件的类型的信息,所述类型包括但不限于:音乐、视频、安装包、常用软件、安全软件等等。终端或者服务器将按照身份标识归类的关联信息表再按照历史下载文件的类型再次进行归类,将类型相同的历史下载文件的存储路径以及对应的URL链接集合到一起。例如,以图1C为例,若id为1的存储路径和id为3的存储路径对应的历史下载文件的类型相同,则将id为1的三条记录与id为3的一条记录进行归类,排列在一起,将id为2的一条记录单独归类。
可见,在图2所描述的方法中,获取目标浏览器的历史数据库文件,将历史数据库文件中的存储路径和URL链接进行关联,得到关联信息表,关联信息表中包括存储路径和URL链接的映射关系,再按照历史下载文件的类型将关联信息表进行归类,便于服务器分析用户的文件下载行为。根据关联信息表中的内容可以获知用户针对目标浏览器的文件下载信息,进而分析出用户基于目标浏览器的文件下载喜好,为后续自身浏览器产品的升级改造,软件推广等提供数据支持,更精准把控用户需求。
请参见图3,图3是本发明实施例提供的另一种数据收集方法的流程示意图。如图3所示,该数据收集方法可以包括但不限于以下步骤。
S301、判断当前时刻是否到达预设时刻,若是,执行步骤S302;若否,结束本流程。
本发明实施例中,对历史数据库文件进行获取不是每时每刻都在进行的,而是定时来获取用户的历史数据库文件,其中预设时刻可由终端的系统默认设定,也可以由用户手动设置,本发明实施例不作具体限定。例如,预设时刻为晚上10点整,那么在每天晚上的10点时终端进行历史数据库文件的获取操作,终端进行定时,当判断出当前时刻是晚上10点时,才会执行获取目标浏览器的历史数据库文件的步骤,而在其他时间段内不进行该操作,可以节省终端的电量、内存消耗等。
S302、获取目标浏览器的历史数据库文件。
本发明实施例中,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接。
S303、将存储路径和URL链接进行关联,得到关联信息表。
本发明实施例中的步骤S302和S303可参见图1所示实施例中的S101和S102,此处不再赘述。
可见,在图3所描述的方法中,当到达预设时刻时,获取目标浏览器的历史数据库文件,将历史数据库文件中的存储路径和URL链接进行关联,得到关联信息表,关联信息表中包括存储路径和URL链接的映射关系,再按照文件类型将关联信息表进行归类,便于服务器分析用户的文件下载行为。根据关联信息表中的内容可以获知用户针对目标浏览器的文件下载信息,进而分析出用户基于目标浏览器的文件下载喜好,为后续自身浏览器产品的升级改造,软件推广等提供数据支持,更精准把控用户需求。
请参见图4,图4是本发明实施例提供的另一种数据收集方法的流程示意图。如图4所示,该数据收集方法可以包括但不限于以下步骤。
S401、判断目标浏览器的历史下载文件的个数是否大于或等于预设个数阈值,若是,执行步骤S402;若否,结束本流程。
本发明实施例中,历史数据库文件中包括至少一个历史下载文件的存储路径以及至少一个历史下载文件的URL链接,其中,每个URL链接对应一个历史下载文件。对历史数据库文件进行获取不是一直进行的,而是在终端判断出通过目标浏览器下载的历史下载文件达到预设个数时,才会执行获取用户的历史数据库文件的步骤,其中预设个数阈值可由终端的系统默认设定,也可以由用户手动设置,本发明实施例不作具体限定。例如,预设个数阈值为20个,那么当终端判断出用户通过目标浏览器下载到本地的历史下载文件个数大于或等于20个时,才会执行获取目标浏览器的历史数据库文件的步骤,而在下载个数小于20个时不进行该操作,可以节省终端的电量、内存消耗等。
S402、获取目标浏览器的历史数据库文件。
本发明实施例中,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接。
S403、将存储路径和URL链接进行关联,得到关联信息表。
本发明实施例中的步骤S402和S403可参见图1所示实施例中的S101和S102,此处不再赘述。
可见,在图4所描述的方法中,在判断出目标浏览器的历史下载文件达到预设个数时,获取目标浏览器的历史数据库文件,将历史数据库文件中的存储路径和URL链接进行关联,得到关联信息表,关联信息表中包括存储路径和URL链接的映射关系。根据关联信息表中的内容可以获知用户针对目标浏览器的文件下载信息,进而分析出用户基于目标浏览器的文件下载喜好,为后续自身浏览器产品的升级改造,软件推广等提供数据支持,更精准把控用户需求。
上述详细阐述了本发明实施例的方法,下面为了便于更好地实施本发明实施例的上述方案,相应地,下面还提供用于配合实施上述方案的相关装置。
请参见图5,图5是本发明实施例提供的一种数据收集装置的结构示意图。如图5所示,该数据收集装置50包括:获取单元501和关联单元502,其中,
获取单元501,用于获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
关联单元502,用于将存储路径和URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
可选的,所述关联单元502具体用于:
按照身份标识将存储路径和URL链接进行关联,得到关联信息表。
可理解的是,本实施例的数据收集装置50的各功能单元的功能可根据上述图1方法实施例的方法具体实现,此处不再赘述。
请一并参见图6,图6是本发明实施例提供的另一种数据收集装置的结构示意图。其中,图6所示的数据收集装置50是由图5所示的数据收集装置50进行优化得到的。与图5相比,图6所描述的数据收集装置50包括获取单元501和关联单元502以外,还包括:归类单元503,其中,
归类单元503,用于在所述关联单元502将存储路径和URL链接进行关联,得到关联信息表之后,按照所述历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
可理解的是,本实施例的数据收集装置50的各功能单元的功能可根据上述图2方法实施例的方法具体实现,此处不再赘述。
请一并参见图7,图7是本发明实施例提供的另一种数据收集装置的结构示意图。其中,图7所示的数据收集装置50是由图5所示的数据收集装置50进行优化得到的。与图5相比,图7所描述的数据收集装置50包括获取单元501和关联单元502以外,还包括:第一判断单元504,其中,
第一判断单元504,用于判断当前时刻是否到达预设时刻,若是,触发所述获取单元501执行所述获取目标浏览器的历史数据库文件的操作。
可理解的是,本实施例的数据收集装置50的各功能单元的功能可根据上述图3方法实施例的方法具体实现,此处不再赘述。
请一并参见图8,图8是本发明实施例提供的另一种数据收集装置的结构示意图。其中,图8所示的数据收集装置50是由图5所示的数据收集装置50进行优化得到的。与图5相比,图8所描述的数据收集装置50包括获取单元501和关联单元502以外,还包括:第二判断单元505,其中,
第二判断单元505,用于判断目标浏览器的历史下载文件的个数是否大于或等于预设个数阈值,若是,触发所述获取单元501执行所述获取目标浏览器的历史数据库文件的操作。
可理解的是,本实施例的数据收集装置50的各功能单元的功能可根据上述图4方法实施例的方法具体实现,此处不再赘述。
请参见图9,是本发明提供的一种数据收集设备的结构示意图。本实施例中所描述的数据收集设备900包括:至少一个处理器901、通信接口902、用户接口903和存储器904,处理器901、通信接口902、用户接口903和存储器904可通过总线或者其它方式连接,本发明实施例以通过总线905连接为例。其中,
处理器901可以是通用处理器,例如中央处理器(Central Processing Unit,CPU)。
通信接口902可以为有线接口(例如以太网接口)或无线接口(例如蜂窝网络接口或使用无线局域网接口),用于与其他设备或服务器进行通信。
用户接口903具体可为触控面板,包括触摸屏和触控屏,用于检测触控面板上的操作指令,用户接口903也可以是物理按键或者鼠标。本发明实施例中,用户接口903具体用于接收用户下载文件时输入的指令。用户接口903还可以为显示屏,用于输出、显示图像或数据。
存储器904可以包括易失性存储器(Volatile Memory),例如随机存取存储器(Random Access Memory,RAM);存储器也可以包括非易失性存储器(Non-Volatile Memory),例如只读存储器(Read-Only Memory,ROM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-StateDrive,SSD);存储器904还可以包括上述种类的存储器的组合。存储器904用于存储一组程序代码,处理器901用于调用存储器904中存储的程序代码,执行如下操作:
处理器901获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
处理器901将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
可选的,所述存储路径表中还包括身份标识,所述URL链接表中还包括身份标识;所述处理器901将所述存储路径和所述URL链接进行关联,包括:
处理器901按照身份标识将所述存储路径和所述URL链接进行关联。
可选的,所述存储路径包括用于指示所述历史下载文件的类型的信息;所述处理器901将所述存储路径和所述URL链接进行关联,得到关联信息表之后,所述处理器901还用于执行:
处理器901按照所述历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
可选的,处理器901还用于执行:
判断当前时刻是否到达预设时刻,若是,处理器901执行所述获取目标浏览器的历史数据库文件的步骤。
可选的,处理器901还用于执行:
判断目标浏览器的历史下载文件的个数是否大于或等于预设个数阈值,若是,处理器901执行所述获取目标浏览器的历史数据库文件的步骤。
可理解的是,处理器901的执行步骤具体可参见图1或图2或图3或图4实施例所述的内容,此处不再赘述。
综上所述,通过实施本发明实施例,获取目标浏览器的历史数据库文件,将历史数据库文件中的存储路径和URL链接进行关联,得到关联信息表,关联信息表中包括存储路径和URL链接的映射关系。根据关联信息表中的内容可以获知用户针对目标浏览器的文件下载信息,进而分析出用户基于目标浏览器的文件下载喜好,为后续自身浏览器产品的升级改造,软件推广等提供数据支持,更精准把控用户需求。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、ROM或RAM等。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例数据收集装置中的单元可以根据实际需要进行合并、划分和删减。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1.一种数据收集方法,其特征在于,包括:
获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
2.根据权利要求1所述的方法,其特征在于,所述存储路径表中还包括身份标识,所述URL链接表中还包括身份标识;所述将所述存储路径和所述URL链接进行关联,包括:
按照身份标识将所述存储路径和所述URL链接进行关联。
3.根据权利要求1所述的方法,其特征在于,所述存储路径包括用于指示所述历史下载文件的类型的信息;所述将所述存储路径和所述URL链接进行关联,得到关联信息表之后,所述方法还包括:
按照所述历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
判断当前时刻是否到达预设时刻,若是,执行所述获取目标浏览器的历史数据库文件的步骤。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
判断目标浏览器的历史下载文件的个数是否大于或等于预设个数阈值,若是,执行所述获取目标浏览器的历史数据库文件的步骤。
6.一种数据收集装置,其特征在于,包括:
获取单元,用于获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
关联单元,用于将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
7.根据权利要求6所述的装置,其特征在于,所述存储路径表中还包括身份标识,所述URL链接表中还包括身份标识;所述关联单元具体用于:
按照身份标识将所述存储路径和所述URL链接进行关联,得到关联信息表。
8.根据权利要求6所述的装置,其特征在于,所述存储路径包括用于指示所述历史下载文件的类型的信息;所述装置还包括:
归类单元,用于在所述关联单元将所述存储路径和所述URL链接进行关联,得到关联信息表之后,按照所述历史下载文件的类型将所述关联信息表中类型相同的历史下载文件的URL链接进行归类。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述装置还包括:
第一判断单元,用于判断当前时刻是否到达预设时刻,若是,触发所述获取单元执行所述获取目标浏览器的历史数据库文件的操作。
10.一种数据收集设备,其特征在于,包括:处理器、存储器、通信接口和总线;
所述处理器、所述存储器和所述通信接口通过所述总线连接并完成相互间的通信;所述存储器存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行一种数据收集方法;其中,所述方法包括:
获取目标浏览器的历史数据库文件,所述历史数据库文件包括历史下载文件的存储路径表和所述历史下载文件的统一资源定位符URL链接表,所述存储路径表中包括存储路径,所述URL链接表中包括URL链接;
将所述存储路径和所述URL链接进行关联,得到关联信息表,所述关联信息表中包括存储路径集合和URL链接集合的映射。
CN201610267162.0A 2016-04-26 2016-04-26 一种数据收集方法、装置及设备 Active CN105956050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610267162.0A CN105956050B (zh) 2016-04-26 2016-04-26 一种数据收集方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610267162.0A CN105956050B (zh) 2016-04-26 2016-04-26 一种数据收集方法、装置及设备

Publications (2)

Publication Number Publication Date
CN105956050A true CN105956050A (zh) 2016-09-21
CN105956050B CN105956050B (zh) 2019-07-23

Family

ID=56916692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610267162.0A Active CN105956050B (zh) 2016-04-26 2016-04-26 一种数据收集方法、装置及设备

Country Status (1)

Country Link
CN (1) CN105956050B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034319A (zh) * 2018-09-06 2018-12-18 Oppo广东移动通信有限公司 下载信息处理方法、电子装置及计算机可读存储介质
CN113537529A (zh) * 2021-07-30 2021-10-22 国能铁路装备有限责任公司 货车轴承关联数据生成方法、装置和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663073A (zh) * 2012-03-31 2012-09-12 奇智软件(北京)有限公司 基于被下载文件进行推荐的方法及系统
CN103034643A (zh) * 2011-09-29 2013-04-10 富泰华工业(深圳)有限公司 文件下载方法及装置
CN104182529A (zh) * 2014-08-28 2014-12-03 陈包容 一种移动终端对待下载文件进行识别、保存以及文件下载后对其查找的方法及装置
CN105095211A (zh) * 2014-04-22 2015-11-25 北大方正集团有限公司 多媒体数据的获取方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034643A (zh) * 2011-09-29 2013-04-10 富泰华工业(深圳)有限公司 文件下载方法及装置
CN102663073A (zh) * 2012-03-31 2012-09-12 奇智软件(北京)有限公司 基于被下载文件进行推荐的方法及系统
CN105095211A (zh) * 2014-04-22 2015-11-25 北大方正集团有限公司 多媒体数据的获取方法和装置
CN104182529A (zh) * 2014-08-28 2014-12-03 陈包容 一种移动终端对待下载文件进行识别、保存以及文件下载后对其查找的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034319A (zh) * 2018-09-06 2018-12-18 Oppo广东移动通信有限公司 下载信息处理方法、电子装置及计算机可读存储介质
CN113537529A (zh) * 2021-07-30 2021-10-22 国能铁路装备有限责任公司 货车轴承关联数据生成方法、装置和计算机设备

Also Published As

Publication number Publication date
CN105956050B (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
CN103618774B (zh) 一种基于网络行为的资源推荐方法及装置、系统
CN107133165B (zh) 浏览器兼容性检测方法及装置
CN102077201A (zh) 用于网页的动态及实时归类的系统及方法
US10073886B2 (en) Search results based on a search history
CN108563680A (zh) 资源推荐方法及装置
CN112491602A (zh) 行为数据的监控方法、装置、计算机设备及介质
CN110516173B (zh) 一种非法网站识别方法、装置、设备及介质
CN105243058A (zh) 一种网页内容翻译方法及电子设备
CN105183295A (zh) 一种应用图标的归类方法及终端
CN114461869B (zh) 业务特征数据处理方法、装置、电子设备及存储介质
CN112328802A (zh) 数据处理方法、装置和服务器
CN111355628A (zh) 一种模型训练方法、业务识别方法、装置和电子装置
CN109062799A (zh) 广告场景的回归测试方法、装置及系统
CN105956050A (zh) 一种数据收集方法、装置及设备
CN111062736A (zh) 模型训练、线索排序方法、装置及设备
Werneck et al. A reproducible POI recommendation framework: Works mapping and benchmark evaluation
CN106372158A (zh) 用户行为数据的处理方法及装置
CN110020297A (zh) 一种网页内容的加载方法、装置及系统
CN111444447A (zh) 内容推荐页面的展现方法及装置
CN111597557A (zh) 恶意应用程序的检测方法、系统、装置、设备及存储介质
CN105094810B (zh) 基于通用网关接口插件的数据处理方法和装置
CN109684844B (zh) 一种webshell检测方法、装置以及计算设备、计算机可读存储介质
CN111126653B (zh) 用户职住地预测方法、装置及存储介质
CN108520012B (zh) 基于机器学习的移动互联网用户评论挖掘方法
CN107807993B (zh) 一种网页历史记录功能的实现方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20181129

Address after: Room 105-53811, No. 6 Baohua Road, Hengqin New District, Zhuhai City, Guangdong Province

Applicant after: Zhuhai Leopard Technology Co.,Ltd.

Address before: 100085 East District, Second Floor, 33 Xiaoying West Road, Haidian District, Beijing

Applicant before: BEIJING KINGSOFT INTERNET SECURITY SOFTWARE Co.,Ltd.

GR01 Patent grant
GR01 Patent grant