CN106649477A - 痕迹数据获取方法和系统、痕迹插件和数据获取方法 - Google Patents

痕迹数据获取方法和系统、痕迹插件和数据获取方法 Download PDF

Info

Publication number
CN106649477A
CN106649477A CN201610865691.0A CN201610865691A CN106649477A CN 106649477 A CN106649477 A CN 106649477A CN 201610865691 A CN201610865691 A CN 201610865691A CN 106649477 A CN106649477 A CN 106649477A
Authority
CN
China
Prior art keywords
data
trace data
trace
unit
vestige
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610865691.0A
Other languages
English (en)
Inventor
唐贵明
陶永红
胡文秀
王智骞
王岩龙
夏永宏
李惠梅
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Win Technology Co Ltd
Original Assignee
Beijing Win Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Win Technology Co Ltd filed Critical Beijing Win Technology Co Ltd
Priority to CN201610865691.0A priority Critical patent/CN106649477A/zh
Publication of CN106649477A publication Critical patent/CN106649477A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种痕迹数据获取方法和系统、痕迹插件和数据获取方法。其中,痕迹数据获取方法包括:将痕迹数据划分为多个类型;根据痕迹数据的类型,通过痕迹插件获取符合预设要求痕迹数据;根据将符合预设要求的痕迹数据异步发送至处理单元;接收处理单元按照系统需求处理后的痕迹数据。该方案将痕迹数据分类后,通过痕迹插件从页面中获取符合预设要求的痕迹数据,解决了现有的痕迹数据获取方法中存在的页面代码注入量大、资源消耗大且部署复杂的技术问题,实现了简单部署且高效获取符合预设要求的痕迹数据的技术效果。

Description

痕迹数据获取方法和系统、痕迹插件和数据获取方法
技术领域
本发明涉及互联网技术领域,特别涉及一种痕迹数据获取方法和系统、痕迹插件和数据获取方法。
背景技术
在互联网技术领域中,为了分析用户需求,更好地改善商品,常常需要获取用户访问网页页面的痕迹数据,以根据该痕迹数据进行相应的处理和分析。目前,采用比较多的是通过代码注入的方法获取所需要的痕迹数据。例如,先向待获取痕迹数据的网页页面注入相应代码,在执行页面加载时,通过上述代码将大量需要记录的痕迹数据写入规定好的文件中,并且进行读取。
但是,随着互联网技术的发展,用户数据的私有化程度越来越高,对数据收集的自定义化要求也越来越高,相应地获取规定的用户痕迹数据的过程也越来越复杂。采用现有的痕迹数据获取方法往往会存在:页面代码注入量大、资源消耗大、部署复杂和痕迹数据获取效率低的技术问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种痕迹数据获取方法和系统、痕迹插件和数据获取方法,以解决现有的痕迹数据获取方法存在的页面代码注入量大、资源消耗大、部署复杂和痕迹数据获取效率低的技术问题。
本申请提供了一种痕迹数据获取方法,包括:
将痕迹数据划分为多个类型;
根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据;
根据所述痕迹插件的内部封装的异步方法,将所述符合预设要求的痕迹数据异步发送至处理单元;
接收所述处理单元按照系统需求处理后的痕迹数据。
在一个实施方式中,所述类型包括以下至少之一:用户的基本信息数据、用户的设备数据、用户的位置数据和用户的行为操作数据。
在一个实施方式中,在所述根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据之前,将所述痕迹插件部署在待获取痕迹数据的页面中。
在一个实施方式中,所述根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据,包括:
加载生成待获取痕迹数据的页面;
控制所述痕迹插件从所述待获取痕迹数据的页面中获取符合预设要求的痕迹数据。
在一个实施方式中,控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据,包括:通过向所述待获取痕迹数据的页面注入预设痕迹标记,根据所述预设痕迹标记,控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据。
本申请还提供了一种痕迹数据获取系统,包括:
分类模块,用于将痕迹数据划分为多个类型;
获取模块,用于根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据;
发送模块,用于根据所述痕迹插件的内部封装的异步方法,将所述符合预设要求的痕迹数据异步发送至处理单元;
接收模块,用于接收所述处理单元按照系统需求处理后的痕迹数据。
在一个实施方式中,所述获取包括:
页面加载单元,用于加载生成待获取痕迹数据的页面;
痕迹数据获取单元,用于控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据。
在一个实施方式中,所述痕迹数据获取单元包括:
注入子单元,用于向所述待获取痕迹数据的页面注入预设痕迹标记;
数据获取子单元,用于根据所述预设痕迹标记,从所述页面中获取符合预设要求的痕迹数据,并将所述符合预设要求的痕迹数据发送至所述发送模块。
本申请还提供一种痕迹收集插件,包括:
痕迹数据为划分单元,用于将痕迹数据划分多个类型;
痕迹数据收集单元,用于根据预设要求,向待获取痕迹数据的页面注入预设痕迹标记,并根据所述预设痕迹标记获取符合预设要求的痕迹数据。
本申请还提供了一种数据获取方法,包括:
将数据划分为多个类型;
根据数据的类型,通过预设数据标记,获取符合预设要求的数据;
将所述符合预设要求的数据发送至处理单元;
接收所述处理单元按照系统需求处理后的痕迹数据。
在本申请实施例中,先将痕迹数据进行分类,再通过痕迹插件根据预设数据标记获取符合预设要求的痕迹数据,解决了现有的痕迹数据获取方法中存在的页面代码注入量大、资源消耗大、部署复杂和痕迹数据获取效率低的技术问题,实现了简单部署且高效获取符合预设要求的痕迹数据的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1是根据本申请实施例提供的痕迹数据获取方法的处理流程图;
图2是根据本申请实施例提供的痕迹数据获取系统的结构示意图;
图3是根据本申请实施例提供的痕迹插件的结构示意图;
图4是根据本申请实施例提供的数据获取方法的处理流程图;
图5是根据本申请实施例应用痕迹数据获取方法/系统获取痕迹数据的处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本发明做进一步详细说明。在此,本发明的示意性实施方式及其说明用于解释本发明,但并不作为对本发明的限定。
考虑到现有的痕迹数据获取方法,通常是采用向待获取痕迹数据的网页页面注入代码获取痕迹数据。这种方法,本身就存在部署不方便的技术问题。而且,随着互联网技术的发展,用户数据私有化程度的提高,以及对痕迹数据获取自定义化的要求提高,采用现有的痕迹数据方法需要对页面注入大量的相关代码,实施过程繁琐。同时,由于存在大量的代码,加载页面、获取痕迹数据所占用的资源就比较大,进而还造成采用现有的痕迹数据方法获取痕迹数据的效率低,且部署复杂。针对产生上述技术问题的根本原因,本申请考虑先将痕迹数据进行分类,按照具体要求,通过痕迹插件根据痕迹数据的类型获取符合预设要求的痕迹数据,从而可以避免通过代码获取痕迹数据。这样,可以方便将痕迹插件部署在任一待获取痕迹数据的页面中获取规定的痕迹数据,同时也可以按照具体要求通过调整痕迹插件以获取不同类型的痕迹数据。
基于上述考虑,本申请提供了一种痕迹数据获取方法。请参阅图1,该方法可以包括以下步骤。
步骤101:将痕迹数据划分为多个类型。
在本实施方式中,所述痕迹数据可以是用户访问浏览某网站页面时产生的数据信息。具体地,上述痕迹数据可以包括以下多个类型:用户的基本信息数据、用户的设备数据、用户的位置数据和用户的行为操作数据。值得注意的是,上述所列举的4种痕迹数据类型只是为了更好地说明本申请实施例。痕迹数据类型还可以包括除上述列举的4种痕迹数据类型以外的其他类型的痕迹数据。具体实施时,可以根据具体情况,按照具体要求,灵活选择。对此,本申请不作限定。
在本实施方式中,所述将痕迹数据划分为多个类型。具体可以为根据痕迹数据的内容或形式,先将待获取痕迹数据页面中的痕迹数据划分成多个不同的类型。这样做可以为后续,简单快速、有针对性地获取符合预设要求的痕迹数据作准备。例如,某网站要获取用户关于该网站A页面的痕迹数据。其中,用户关于该网站A页面的痕迹数据包括许多杂乱无章的痕迹数据。这时,可以将该网站A页面的痕迹数据按照数据内容划分为浏览A页面的用户的基本信息数据、浏览A页面的用户的设备数据、浏览A页面的用户的位置数据和浏览A页面的用户的行为操作数据。
步骤102:根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据。
在本实施方式中,所述痕迹插件可以是一种具体用于识别并收集符合预设要求的痕迹数据的装置。具体地,该装置可以是内嵌于某网站浏览器中的应用插件,也可以是独立于该浏览器的能够独立运行,根据指令获取痕迹数据的应用插件。
在本实施方式中,所述符合预设要求的痕迹数据可以是为了得到某种结果,从页面痕迹数据中得到的需要分析、处理的痕迹数据。例如,某网站要对访问该网站用户的地域位置作统计分析,以便在用户量相对比较少的地方加大宣传。这时可以针对该网站主页的痕迹数据进行获取预设要求的痕迹数据。其中,该网站主页的痕迹数据的类型包括:访问该网站用户的基本信息数据、访问该网站用户的位置数据和访问该网站用户的行为操作数据。针对该网站用户的地域位置的统计分析,这里的符合预设要求的痕迹数据就可以是访问该网站用户的位置数据。对于其他不符合预设要求的痕迹数据,例如这里的访问该网站用户的基本信息数据和访问该网站用户的行为操作数据可以不获取。从而,可以通过只获取符合预设要求的痕迹数据,减少占用的资源,提高获取痕迹数据的效率。
在本实施方式中,所述根据痕迹数据的类型,通过痕迹插件获取符合预设要求的痕迹数据。具体可以为按照预设要求,对于不同类型的痕迹数据,通过痕迹插件选择性地获取符合预设要求的痕迹数据,其中,所述符合预设要求的痕迹数据的数据类型符合预设要求。例如,某网站要对访问该网站用户的地域位置作统计分析时,只要获取用户访问该网站的位置数据,作为所述符合预设要求的痕迹数据。
在一个优选的实施方式,为了使得痕迹插件从不同类型的痕迹数据中获取符合预设要求的痕迹数据,可以通过痕迹插件向待获取痕迹数据的网页页面注入预设痕迹标记,根据痕迹标记,控制痕迹插件获取符合预设要求的痕迹数据。在本实施方式中,所述预设痕迹标记,可以是一个特定的字符串,也可以是仅起标识区别作用的几个符号。当然,这里所列举的两种预设痕迹标记只是为了更好地说明本申请实施例,可以使用其他形式的标记作为预设痕迹标记,对此,本申请不作限定。在具体实施时,痕迹插件可以根据该预设痕迹标识搜寻并获取对应的痕迹数据,这种与预设痕迹标记对应的痕迹数据就可以是上述的符合预设要求的痕迹数据。例如,某网站要对访问该网站用户的地域位置作统计分析,要获取用户访问该网站的位置数据时,可以以字符串“weizhi”作为预设痕迹标记。向该网站主页注入“weizhi”,痕迹插件可以根据“weizhi”搜寻并获取对应的用户访问该网站的位置数据。
在一个优选的实施方式中,为了获取待获取痕迹数据页面的痕迹数据,在所述根据痕迹数据的类型,通过痕迹插件获取符合预设要求的痕迹数据之前,还包括:将上述痕迹插件部署在待获取痕迹数据的页面中。以使得痕迹插件可以针对该页面进行痕迹数据的获取。例如,当某网站要获取用户访问该网站的位置数据时,可以将痕迹插件部署在该网站的主页,从而可以通过该痕迹插件获取相应的痕迹数据。
在一个优选的实施方式中,为了通过痕迹插件获取待获取痕迹数据页面的痕迹数据,需要先加载生成该页面,再从页面中获取痕迹数据。具体地,可以为:
S1:加载生成待获取痕迹数据的网页页面;
S2:控制痕迹插件从该页面中获取符合预设要求的痕迹数据,其中,符合预设要求的痕迹数据的数据类型符合预设要求。
步骤103:根据所述痕迹插件的内部封装的异步方法,将所述符合预设要求的痕迹数据异步发送至处理单元。
在本实施方式中,所述处理单元可以是对符合预设要求进行具体处理,具有一定逻辑处理功能的装置。在本实施方式中,所述处理单元可以是初级的处理结构,可以对预设要求的痕迹数据进行初步处理,再将初步处理结果返回给相应的结构进行进一步的分析处理。例如,处理单元可以是一个简单的读取装置,根据得到的用户访问该网站的位置数据,读取得到各个用户访问该网站时所在城市名称。再将各个用户访问该网站时所在城市名称发送到统计单元进行统计处理。
在本实施方式中,为将符合预设要求的痕迹数据发送到对应的处理单元,可以在根据痕迹数据的类型,通过痕迹插件获取符合预设要求的痕迹数据之后,根据痕迹插件的内部封装的异步方法,将符合预设要求的痕迹数据发送至对应的处理单元。
在本实施方式中,所述根据所述痕迹插件的内部封装的异步方法,将所述符合预设要求的痕迹数据异步发送至所述处理单元。具体可以为,通过异步传输方法将符合预设要求的痕迹数据发送至对应的处理单元进行处理。
步骤104:接收所述处理单元按照系统需求处理后的痕迹数据。
在一个优选实施方式中,在接收所述处理单元按照系统需求处理后的痕迹数据之后,还包括:根据所述处理后的痕迹数据,建立用户分类定位视图。
在本实施方式中,所述用户分类定位视图可以是上述处理单元根据符合预设要求的痕迹数据,按照系统需求进行处理得到的处理结果。当然,上述的用户分类定位视图可以是为了更好地说明本申请实施例的一种示意性说明。接收的处理结果还可以是其他根据符合预设要求的痕迹数据,按照系统需求处理得到的处理结果。
在本实施方式中,所述处理后的痕迹数据可以是处理单元对符合预设要求的痕迹数据进行相应处理后,返回的处理后的痕迹数据。上述处理后痕迹数据,也可以是一种处理单元根据符合预设要求的痕迹数据,初步处理得到的处理结果。根据所述处理后的痕迹数据,可以进一步得到深入分析的处理结果,如用户分类定位视图。例如,某网站要对访问该网站用户的地域位置作统计分析时,根据返回得到的访问该网站的用户所在城市,对各个用户所在城市进行统计,建立访问该网站用户的城市分布图。这里访问该网站用户的城市分布图可以认为是一种处理单元初步处理得到的处理结果,即可以为上述处理后的痕迹数据。
在本申请实施例中,先将痕迹数据进行分类,再通过痕迹插件根据预设数据标记获取符合预设要求的痕迹数据,解决了现有的痕迹数据获取方法中存在的页面代码注入量大、资源消耗大、部署复杂和痕迹数据获取效率低的技术问题,实现了简单部署且高效获取符合预设要求的痕迹数据的技术效果。
在一个具体实施例中,用户浏览X网站中商品A的展示信息时,如果觉得商品A不错,值得购买,会点击在商品A的展示信息右下方的大拇指图标,如果觉得商品A不值得购买,则会点击商品A的展示信息左下方的脚掌图标。为了获取用户对于商品A的评价,可以根据本申请提供的痕迹数据获取方法获取用户的操作数据,再统计用户的操作数据统计获得用户对商品A的评价情况。具体实施时,可以按照以下步骤执行。在X网站中商品A的展示信息页面部署痕迹插件。将X网站中商品A的展示信息页面中的痕迹数据进行分类,分为:用户浏览商品A的用户基本信息数据、用户浏览商品A时的操作数据和用户浏览商品A时的位置数据。其中,用户浏览商品A时的操作数据是实施的预设要求数据。具体地,该用户浏览商品A时的操作数据包括用户对商品A展示信息右下方大拇指图标的点击和用户对商品A展示信息左下方脚掌图标的点击。通过痕迹插件,向X网商品A页面注入预设痕迹标记“dianji”,从而可以控制痕迹插件从X网商品A页面中获取用户浏览商品A时的操作数据。其中,该操作数据可以包括用户对大拇指图标的点击和用户对脚掌的点击。再通过痕迹插件内部的异步方法将用户浏览X网站A商品时的操作数据发送到X网站服务器中的第一处理单元进行初步处理,得到用户的具体操作数据,即该用户是点击了大拇指图标还是点击了脚掌图标。将得到的用户具体数据发送到X网站服务器中的统计单元,控制统计单元对用户具体操作数据进行统计处理,得到用户对X网站商品A的评价情况统计表。根据用户对X网站商品A的评价情况统计表可以了解用户认为商品A是否值得购买,是否可以在市场上推广商品A。在本实施例中,先将痕迹数据划分为多个类型,再通过痕迹插件获取符合预设要求的痕迹数据,从而避免了直接使用页面代码,解决了现有的痕迹数据获取方法中存在的页面代码注入量大、资源消耗大、部署复杂和痕迹数据获取效率低的技术问题,实现了简单部署且高效获取符合预设要求的痕迹数据的技术效果。同时,根据本申请所提供的方法可以根据具体需要,设计定制对应的痕迹插件,即可以通过调整痕迹插件来获取不同种类的痕迹数据,从而可以减少技术人员的工作量,提高痕迹数据获取速度。
基于同一发明构思,本发明实施例中还提供了一种痕迹数据获取系统,如下面的实施例所述。由于痕迹数据获取系统解决问题的原理与痕迹数据获取方法相似,因此痕迹数据获取系统的实施可以参见痕迹数据获取方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能被构想的。参阅图2,是本申请实施例的痕迹数据获取系统的一种结构框图。参阅2所示,该系统可以包括:
分类模块201,用于将痕迹数据划分为多个类型。
获取模块202,用于根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据。
发送模块203,用于根据痕迹插件的内部封装的异步方法,将符合预设要求的痕迹数据异步发送至处理单元。
接收模块204,用于接收处理单元按照系统需求处理后的痕迹数据。
上述痕迹数据获取系统,可以通过控制分类模块201、获取模块202、发送模块203和接收模块204协调合作,按照具体要求,从待获取痕迹数据的网页页面中获取符合预设要求的痕迹数据,并将所述痕迹数据发送至相应的处理单元进行处理,再接收处理后的痕迹数据,以备进一步使用。
在一个优选实施方式中,为了控制插件从待获取痕迹数据的页面中获取符合预设要求的痕迹数据,上述获取模块202还可以包括:
页面加载单元,用于加载生成待获取痕迹数据的页面;
痕迹数据获取单元,用于控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据。
在一个优选实施方式中,为了通过上述痕迹数据获取单元获取符合预设要求的痕迹数据,所述痕迹数据获取单元具体可以包括以下结构:
注入子单元,用于向所述待获取痕迹数据的页面注入预设痕迹标记;
数据获取子单元,用于根据所述预设痕迹标记,从所述页面中获取符合预设要求的痕迹数据,并将所述符合预设要求的痕迹数据发送至所述发送模块。
需要说明的是,上述预设痕迹标记与符合预设要求的痕迹数据对应。由于痕迹数据种类很多,很大。具体实施时,往往只要对其中某种类型的痕迹数据进行获取、处理,对于其他类型的痕迹数据不会直接使用。因此,在获取痕迹数据的过程中,可以按照要求从大量痕迹数据中只针对性地获取符合预设要求的痕迹数据。其中,上述符合预设要求的痕迹数据可以是其类型符合预设要求。这样可以避免对不需要的痕迹数据进行获取、处理。进而可以提高痕迹数据获取效率。基于上述考虑,痕迹数据获取单元可以通过协调控制注入子单元和数据获取子单元获取符合预设要求的痕迹数据。
本申请还提供了一种痕迹插件。参阅图3,所述痕迹插件可以包括以下结构。
痕迹数据为划分单元301,用于将痕迹数据划分多个类型;
痕迹数据收集单元302,用于根据预设要求,向待获取痕迹数据的页面注入预设痕迹标识,并根据所述预设痕迹标记获取符合预设要求的痕迹数据。
需要说明的是,上述痕迹插件可以是内嵌于某浏览器中的一个部件,也可以是独立于浏览器的一个应用。对此,本申请不作限定。具体实施时,可以先将痕迹插件部署在待获取痕迹数据的网页页面或者启动内嵌于待获取痕迹数据的网页页面中的痕迹插件。上述痕迹插件具体可以通过痕迹数据划分单元301先将痕迹数据先分类,再通过痕迹数据收集单元302通过注入预设痕迹标记获取与预设痕迹标记相对应的符合预设要求的痕迹数据。这样,避免了通过注入页面代码获取痕迹数据时存在的页面代码注入量大、资源消耗大和部署复杂的技术问题。而且,可以通过调整痕迹插件,灵活方便地获取不同的符合预设要求的痕迹数据,减少了技术人员的工作量。
本申请还提供了一种数据获取方法。参阅图4,可以按照以下步骤执行数据获取方法,获取符合预设要求的数据。
步骤401:将数据划分为多个类型。
步骤402:根据数据的类型,通过预设数据标记,获取符合预设要求的数据。
步骤403:将所述符合预设要求的数据发送至处理单元。
步骤404:接收所述处理单元按照系统需求处理后的痕迹数据。
需要说明的是,上述预设数据标记与符合预设要求的数据相对应,根据预设数据标记可以从大量的数据中搜寻并获取符合预设要求的数据。其中,符合预设要求的数据的数据类型可以为预设要求中所要求的数据类型。此外,上述数据的类型可以根据具体情况按照具体要求灵活进行选取划分。对此,本申请不作限定。在接收所述处理单元按照系统需求处理后的痕迹数据之后,还可以对处理后的痕迹数据进行进一步处理。例如,可以根据处理后的用户访问的痕迹数据,建立用户访问情况统计图。
从以上的描述中,可以看出,本申请实施例实现了如下技术效果:通过使用痕迹插件获取痕迹数据,避免了对待获取痕迹数据页面注入大量的页面代码,解决了现有的痕迹数据获取方法存在的页面代码注入量大、资源消耗大和部署复杂的技术问题,实现了高效获取痕迹数据的技术效果;通过将痕迹数据先分类,再通过痕迹插件注入预设痕迹标记获取符合预设要求的痕迹数据,实现了对符合预设要求的痕迹数据的准确获取;此外,由于本申请是通过痕迹插件获取痕迹数据,可以通过调整痕迹插件获取符合不同预设要求的痕迹数据,实现了简单部署、高效获取的技术效果。
在一个具体实施例中,请参阅图5。可以根据本申请提供的痕迹数据获取方法/系统获取用户的规定数据,并根据上述规定数据建立获得用户定位分类视图。具体可以按照以下步骤执行。当用户访问某网站网页时,将该网站网页的用户痕迹数据进行分类,具体可以划分成以下3种:用户信息、应用信息和内容信息。将上述3类信息传输至部署有痕迹插件的页面。痕迹插件先进行过滤判断。可以过滤排除一些无效的访问信息。例如一些恶意的网络攻击或者误操作产生的错误访问等。再判断所访问用户是否是注册用户,根据是否是注册用户,获取相应的规定的痕迹记录,进而获取规定数据。其中,上述获取规定数据的过程,可以是痕迹插件向对应页面输入与规定痕迹记录相对应的痕迹数据标记,根据痕迹数据标记,从该页面中获取上述规定数据。再将所获取得到的规定数据通过通信传输发送至处理单元进行数据处理。处理单元进行数据处理后,返回相应的分析结果。根据返回的分析结果,进行进一步的分析、处理,建立获得用户定位分类视图。
通过先将痕迹数据分类,通过痕迹插件获取所需要的规定数据,再根据所述规定数据进行相应的处理。避免了现有的痕迹数据方法由于通过注入页面代码获取痕迹数据导致的页面代码注入量大、资源消耗大和部署复杂的技术问题。
以上实施例中,先将痕迹数据进行分类,再通过痕迹插件根据预设数据标记获取符合预设要求的痕迹数据,解决了现有的痕迹数据获取方法中存在的页面代码注入量大、资源消耗大、部署复杂和痕迹数据获取效率低的技术问题,实现了简单部署且高效获取符合预设要求的痕迹数据的技术效果。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种痕迹数据获取方法,其特征在于,包括:
将痕迹数据划分为多个类型;
根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据;
根据所述痕迹插件的内部封装的异步方法,将所述符合预设要求的痕迹数据异步发送至处理单元;
接收所述处理单元按照系统需求处理后的痕迹数据。
2.根据权利要求1所述的方法,其特征在于,所述类型包括以下至少之一:用户的基本信息数据、用户的设备数据、用户的位置数据和用户的行为操作数据。
3.根据权利要求1所述的方法,其特征在于,在所述根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据之前,将所述痕迹插件部署在待获取痕迹数据的页面中。
4.根据权利要求1所述的方法,其特征在于,所述根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据,包括:
加载生成待获取痕迹数据的页面;
控制所述痕迹插件从所述待获取痕迹数据的页面中获取符合预设要求的痕迹数据。
5.根据权利要求4所述的方法,其特征在于,控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据,包括:通过向所述待获取痕迹数据的页面注入预设痕迹标记,根据所述预设痕迹标记,控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据。
6.一种痕迹数据获取系统,其特征在于,包括:
分类模块,用于将痕迹数据划分为多个类型;
获取模块,用于根据痕迹数据的类型,通过痕迹插件获取符合预设要求的各类型痕迹数据;
发送模块,用于根据所述痕迹插件的内部封装的异步方法,将所述符合预设要求的痕迹数据异步发送至处理单元;
接收模块,用于接收所述处理单元按照系统需求处理后的痕迹数据。
7.根据权利要求6所述的系统,其特征在于,所述获取模块包括:
页面加载单元,用于加载生成待获取痕迹数据的页面;
痕迹数据获取单元,用于控制所述痕迹插件从所述页面中获取符合预设要求的痕迹数据。
8.根据权利要求6所述的系统,其特征在于,所述痕迹数据获取单元包括:
注入子单元,用于向所述待获取痕迹数据的页面注入预设痕迹标记;
数据获取子单元,用于根据所述预设痕迹标记,从所述页面中获取符合预设要求的痕迹数据,并将所述符合预设要求的痕迹数据发送至所述发送模块。
9.一种痕迹插件,其特征在于,包括:
痕迹数据划分单元,用于将痕迹数据划分多个类型;
痕迹数据收集单元,用于根据预设要求,向待获取痕迹数据的页面注入预设痕迹标记,并根据所述预设痕迹标记获取符合预设要求的痕迹数据。
10.一种数据获取方法,其特征在于,包括:
将数据划分为多个类型;
根据数据的类型,通过预设数据标记,获取符合预设要求的数据;
将所述符合预设要求的数据发送至处理单元;
接收所述处理单元按照系统需求处理后的痕迹数据。
CN201610865691.0A 2016-09-29 2016-09-29 痕迹数据获取方法和系统、痕迹插件和数据获取方法 Pending CN106649477A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610865691.0A CN106649477A (zh) 2016-09-29 2016-09-29 痕迹数据获取方法和系统、痕迹插件和数据获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610865691.0A CN106649477A (zh) 2016-09-29 2016-09-29 痕迹数据获取方法和系统、痕迹插件和数据获取方法

Publications (1)

Publication Number Publication Date
CN106649477A true CN106649477A (zh) 2017-05-10

Family

ID=58853985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610865691.0A Pending CN106649477A (zh) 2016-09-29 2016-09-29 痕迹数据获取方法和系统、痕迹插件和数据获取方法

Country Status (1)

Country Link
CN (1) CN106649477A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109445870A (zh) * 2018-09-28 2019-03-08 浙江乾冠信息安全研究院有限公司 一种数据处理方法、电子设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046855A1 (en) * 2011-08-16 2013-02-21 Changhao Jiang Aggregating Plug-In Requests for Improved Client Performance
CN103020194A (zh) * 2012-12-03 2013-04-03 北京奇虎科技有限公司 用于浏览文件的方法及装置
CN103577490A (zh) * 2012-08-08 2014-02-12 百度在线网络技术(北京)有限公司 一种网页浏览历史展现方法及装置
CN103714119A (zh) * 2013-11-29 2014-04-09 北京奇虎科技有限公司 一种浏览器数据的处理方法和装置
CN104036159A (zh) * 2013-03-05 2014-09-10 腾讯科技(深圳)有限公司 浏览终端的浏览器控制方法及装置
CN105117453A (zh) * 2015-08-18 2015-12-02 陈丹 一种历史记录处理方法及系统
CN105528394A (zh) * 2015-11-30 2016-04-27 北京金山安全软件有限公司 一种网页处理方法、装置及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046855A1 (en) * 2011-08-16 2013-02-21 Changhao Jiang Aggregating Plug-In Requests for Improved Client Performance
CN103577490A (zh) * 2012-08-08 2014-02-12 百度在线网络技术(北京)有限公司 一种网页浏览历史展现方法及装置
CN103020194A (zh) * 2012-12-03 2013-04-03 北京奇虎科技有限公司 用于浏览文件的方法及装置
CN104036159A (zh) * 2013-03-05 2014-09-10 腾讯科技(深圳)有限公司 浏览终端的浏览器控制方法及装置
CN103714119A (zh) * 2013-11-29 2014-04-09 北京奇虎科技有限公司 一种浏览器数据的处理方法和装置
CN105117453A (zh) * 2015-08-18 2015-12-02 陈丹 一种历史记录处理方法及系统
CN105528394A (zh) * 2015-11-30 2016-04-27 北京金山安全软件有限公司 一种网页处理方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
凌捷 等: "《信息化建设与信息安全》", 30 April 2013 *
汪振林主编: "《电子证据学》", 31 August 2016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109445870A (zh) * 2018-09-28 2019-03-08 浙江乾冠信息安全研究院有限公司 一种数据处理方法、电子设备以及存储介质

Similar Documents

Publication Publication Date Title
CN108363602B (zh) 智能ui界面布局方法、装置、终端设备及存储介质
US9524343B2 (en) Interactive web crawler
US9298680B2 (en) Display of hypertext documents grouped according to their affinity
US8874542B2 (en) Displaying browse sequence with search results
CN103970788A (zh) 一种基于网页爬取的爬虫技术
CN104516982A (zh) 一种基于Nutch的Web信息提取方法和系统
CN106339398A (zh) 一种网页页面的预读取方法、装置及智能终端设备
CN103473234B (zh) 一种从web查询系统导出报表的方法、装置及系统
CN114417197A (zh) 一种访问记录处理方法、装置及存储介质
CN104391978B (zh) 用于浏览器的网页收藏处理方法及装置
CN102857369A (zh) 一种网站日志保存系统及方法和装置
CN104182482B (zh) 一种新闻列表页判断方法及筛选新闻列表页的方法
CN101188521B (zh) 一种挖掘用户行为数据的方法和网站服务器
CN103559203A (zh) 网页排序方法、装置和系统
WO2021189766A1 (zh) 数据可视化方法及相关设备
CN106484412A (zh) 一种基于访问器劫持的前端数据双向绑定实现方法
CN104281629A (zh) 从网页中提取图片的方法、装置及客户端设备
CN107908371A (zh) 一种数据管理系统及其实现数据管理业务的方法
CN104008116B (zh) 一种文件同步方法及电子设备
CN110532455A (zh) 一种基于Chrome浏览器的网页图片获取方法和系统
CN109213824A (zh) 数据抓取系统、方法和装置
DE112016004967T5 (de) Automatisiertes Auffinden von Informationen
CN108733543A (zh) 一种日志分析的方法、装置、电子设备和可读存储介质
CN112506733B (zh) 一种用户行为数据的精细化分析方法、装置、设备和介质
CN104376066B (zh) 一种网络特定内容挖掘方法和装置、及一种电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination