CN112148957A - 网页访问数据分析方法、装置、设备及可读存储介质 - Google Patents

网页访问数据分析方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112148957A
CN112148957A CN201910559536.XA CN201910559536A CN112148957A CN 112148957 A CN112148957 A CN 112148957A CN 201910559536 A CN201910559536 A CN 201910559536A CN 112148957 A CN112148957 A CN 112148957A
Authority
CN
China
Prior art keywords
target
identification
information
identification information
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910559536.XA
Other languages
English (en)
Inventor
尹畅文
叶峻
高春旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910559536.XA priority Critical patent/CN112148957A/zh
Publication of CN112148957A publication Critical patent/CN112148957A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Abstract

本公开提供一种网页访问数据分析方法、装置、设备及可读存储介质,包括:获取多个网页的访问数据,其中,网页具有第一标识信息,以及与第一标识信息对应的第一标识值;接收目标标识,并根据目标标识、第一标识信息及其对应的第一标识值,确定与目标标识对应的网页的目标访问信息;根据目标访问信息确定分析结果。本公开提供的方法、装置、设备及计算机可读存储介质,能够根据需求获取希望分析的网页对应的目标访问信息,从而能够有选择的对网页访问数据进行分析,灵活度更高,从而满足用户的多样化需求。

Description

网页访问数据分析方法、装置、设备及可读存储介质
技术领域
本公开涉及网页分析技术,尤其涉及一种网页访问数据分析方法、装置、设备及可读存储介质。
背景技术
随着互联网技术的发展,用来越多的用户选择在网络中浏览信息。在这一过程中,为了根据用户的浏览情况为用户提供更优质的服务,网站侧需要对用户的浏览行为进行分析,进而对网页架构、内容等进行优化。
由于受访网页多样性大,在对网页分析时,可以通过简单的去除参数值可以减少多样性,从而达到过筛选网页的目的,或者通过下载全量受访页面的数据,通过用户自有的程序对网页进行筛选,然后再进行自有的二次分析。
但是,简单的去除参数值的方式只能去除query string中指定参数的值,那么无法根据需求灵活的筛选受访数据,因此,这种方式限制大,灵活性不足;而通过用户自有的程序筛选网页时,需要用户进行二次开发,成本大便利性不足。因此,现有技术中亟需一种能够满足用户的多样化需求的网页分析方案。
发明内容
本公开提供一种网页访问数据分析方法、装置、设备及可读存储介质,以实现在对网页进行分析时满足用户的多样化需求。
本公开的第一个方面是提供一种网页访问数据分析方法,包括:
获取多个网页的访问数据,其中,所述网页具有第一标识信息,以及与所述第一标识信息对应的第一标识值;
接收目标标识,并根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息;
根据所述目标访问信息确定分析结果。
本公开的另一个方面是提供一种网页访问数据分析装置,包括:
获取模块,用于获取多个网页的访问数据,其中,所述网页具有第一标识信息,以及与所述第一标识信息对应的第一标识值;
确定模块,用于接收目标标识,并根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息;
分析模块,用于根据所述目标访问信息确定分析结果。
本公开的又一个方面是提供一种网页访问数据分析设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如上述第一方面所述的网页访问数据分析方法。
本公开的又一个方面是提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述第一方面所述的网页访问数据分析方法。
本公开提供的网页访问数据分析方法、装置、设备及计算机可读存储介质的技术效果是:
本公开提供的网页访问数据分析方法、装置、设备及可读存储介质,包括:获取多个网页的访问数据,其中,网页具有第一标识信息,以及与第一标识信息对应的第一标识值;接收目标标识,并根据目标标识、第一标识信息及其对应的第一标识值,确定与目标标识对应的网页的目标访问信息;根据目标访问信息确定分析结果。本公开提供的方法、装置、设备及可读存储介质,能够根据需求获取希望分析的网页对应的目标访问信息,从而能够有选择的对网页访问数据进行分析,灵活度更高,从而满足用户的多样化需求。
附图说明
图1为本发明一示例性实施例示出的页面分析方法的流程图;
图2为本发明另一示例性实施例示出的网页访问数据分析方法的流程图;
图3为本发明再一示例性实施例示出的网页访问数据分析方法的流程图;
图4为本发明一示例性实施例示出的网页访问数据分析装置的结构图;
图5为本发明另一示例性实施例示出的网页访问数据分析装置的结构图;
图6为本发明一示例性实施例示出的网页访问数据分析设备的结构图。
具体实施方式
目前采用的网站分析方式中,用户无法灵活的对网页进行聚类筛选,导致无法直接获取希望分析的网页的分析结果。例如,通过简单的去除参数值从而筛选网页时,无法实现根据URL的非query string部分(例如Path)对网页进行聚合。
本发明实施例的方案中,可以预先设置网页标识,从而能够通过网页标识筛选出需要的目标访问信息,再对这些目标访问信息进行分析处理,得到分析结果。采用本发明实施例提供的方案,可以根据用户需求对多个网页进行分析,从而满足用户的多样化需求。
图1为本发明一示例性实施例示出的页面分析方法的流程图。
如图1所示,本实施例提供的页面分析方法包括:
步骤101,获取多个网页的访问数据,其中,网页具有第一标识信息,以及与第一标识信息对应的第一标识值。
其中,本实施例提供的方法可以由具备计算功能的电子设备执行,例如计算机。该电子设备例如可以是网页的后台服务器,或与网页后台服务器连接的电子设备。该电子设备能够获取站点的网页的访问数据,并根据用户需求对这些访问数据进行分析,得到分析结果。
具体的,用户操作用户终端浏览网页时,会产生访问数据,例如ID为张三的用户,在8:00钟访问了第一网页,停留时长为5分钟等。例如,可以由网页的后台服务器获取并存储访问数据,也可以由执行本实施例方法的电子设备获取并存储访问数据。
进一步的,若执行本实施例提供的方法的电子设备能够根据用户的访问行为获取访问数据,则该电子设备可以直接获取得到的访问数据,并根据需求对其进行分析。
实际应用时,若由其他电子设备根据用户的浏览行为确定访问数据,则该电子设备与执行本实施例提供的方法的电子设备连接,使得执行本实施例提供的方法的电子设备能够获取到多个网页的访问数据。
其中,预先设置有这些网页的第一标识信息及其对应的第一标识值。对于一个网页来说,其具有至少一个第一标识信息与第一标识值的组合。例如,第一网页具有一组标识ID1,ID1的第一标识值为keyA1
具体的,同一个网页还可以具有多个第一标识信息与第一标识值的组合,多个第一标识信息互不相同。例如第一网页还可以具有另一组标识,具体可以是ID2、keyB1
进一步的,网页标识可以是用户根据需求设置的,可以预留用于设置网页标识的接口。用户还可以先设置多个第一标识信息,再为各个网页设置这些第一标识信息对应的值。例如,可以先设置ID1-ID10,再针对每个网页设置其与ID1-ID10对应的key值。此时,每个网页可以具有十个标识组合信息。
步骤102,接收目标标识,并根据目标标识、第一标识信息及其对应的第一标识值,确定与目标标识对应的网页的目标访问信息。
实际应用时,用户还可以输入目标标识,从而使电子设备能够对具有目标标识的网页进行分析。
其中,可以设置交互界面,用户可以在交互界面中输入目标标识。例如,可以输入一组标识信息及其对应的标识值,例如ID1与keyA1,也可以输入多组标识信息及其对应的标识值。一标识信息的标识值可以是一个,也可以是多个。例如,可以输入标识信息ID1,及其对应的标示值keyA1-keyE1,还可以输入ID1,及其对应的标示值keyA1以及ID2,及其对应的标示值keyB1。用户可以根据希望统计的页面标识,输入该目标标识。
具体的,电子设备接收到用户输入的目标标识后,可以根据目标标识、第一标识信息及其对应的第一标识值,确定目标访问信息。
在一种实施方式中,可以根据目标标识在多个网页中筛选出目标网页,目标网页的标识属于该目标标识。再根据这些目标网页的访问数据确定目标访问信息。
在另一种实施方式中,还可以对获取的访问数据先进行汇总处理得到,具体可以将具有相同第一标识信息及其对应的第一标识值的访问数据进行汇总,得到聚类访问信息。该聚类访问信息也具有第一标识信息及第一标识值的标识组合。在需要确定目标访问信息时,可以直接在聚类访问信息中确定,从而无需遍历所有的访问数据。
若同一网页具有多个第一标识信息与第一标识值的组合,则在对访问信息聚类处理时,可以针对每个第一标识信息进行处理。例如,各个网页都具有第一标识信息ID1、ID2、ID3。则可以先根据这些网页的ID1对应的值进行聚类,得到聚类访问信息,假设ID1对应的第一标识值可以是A1以及A2,则可以得到第一标识ID1为A1的聚类访问信息,第一标识ID2为A2的聚类访问信息。对于ID2、ID3也可以采用相同的方式处理。这种方式得到的聚类访问信息具有第一标识信息以及第一标识值的标识组合,因此,在确定目标访问信息时,可以基于标识组合直接获取。
可以对同一类网页的访问数据进行去重、求和等处理,例如,ID1为A1的网页的UV值为500。
步骤103,根据目标访问信息确定分析结果。
可以根据确定的目标访问信息进行分析,得到与目标标识对应的所有网页的分析结果。具体的分析方式可以采用现有技术的方案。
采用本实施例提供的方法,可以根据用户需求对部分网页的访问数据进行分析,且用户可以根据需求调整分析的网页,能够满足用户的多样化需求。
具体的,分析结果中可以是一段时间内网页对应的流量情况,例如,一天内网页的访问量,一个小时网页的访问量等。
进一步的,分析结果中包括以下任意一种:
访问量(PV,Page View)、独立访客(UV,Unique Visitor)、独立IP数(IP,InternetProtocol)、会话次数(Session)。
访问量是指页面浏览量或点击量,用于衡量站点被用户访问的数量;在一定统计周期内用户每打开或刷新一个页面就记录1次,多次打开或刷新同一页面则浏览量累计。
独立访客是指一个周期内访问某站点的用户数(以cookie为依据);访问网站的一台电脑客户端为一个访客。
独立IP数,是指一个周期内多少个独立的IP浏览了页面,即统计不同的IP浏览用户数量。
会话次数是一段时间内用户向网站发起的会话(Session)总数量。一次会话会浏览一个或多个页面。
本实施例提供的方法用于分析网页访问数据,该方法由设置有本实施例提供的方法的设备执行,该设备通常以硬件和/或软件的方式来实现。
本实施例提供的网页访问数据分析方法,包括:获取多个网页的访问数据,其中,网页具有第一标识信息,以及与第一标识信息对应的第一标识值;接收目标标识,并根据目标标识、第一标识信息及其对应的第一标识值,确定目标访问信息;根据目标访问信息确定分析结果。本实施例提供的方法,能够根据需求获取希望分析的网页对应的目标访问信息,从而能够有选择的对网页访问数据进行分析,灵活度更高,从而满足用户的多样化需求。
图2为本发明另一示例性实施例示出的网页访问数据分析方法的流程图。
如图2所示,本实施例提供的网页访问数据分析方法,包括:
步骤201,接收设置指令,根据设置指令确定每个网页的第一标识信息及其对应的第一标识值。
其中,此处的设置指令可以是单个指令,也可以是连续的指令。
例如,用户可以预先设置好多个第一标识信息,以及每个第一标识信息对应的多个第一标识值。用户可以通过选择的方式,设置每个网页的第一标识信息及其对应的第一标识值。在这种情况下,该选择指令可以是设置指令。
再例如,用户还可以先设置多个第一标识信息,再针对每个网页设置每个第一标识信息对应的第一标识值,比如对于一网页来说,设置ID1的第一标识值,再设置其ID2的标识值,此时,设置指令可以是连续的设置子指令。
再例如,每个网页可以具有多组标识,此时,设置指令中携带的标识组合也可以是多个。
可选的,各个网页可以具有多个第一标识信息,且多个网页的第一标识信息相同。在这种情况下,用户可以先设置多个第一标识信息,并针对多个或一个网页,设置其每个第一标识信息对应的第一标识值。
具体的,电子设备接收到用户的设置指令后,可以根据设置指令确定每个网页的第一标识信息及对应的第一标识值。例如,用户可以选择多个网页,同时设置这些属性相同的网页的标识组合。
进一步的,电子设备还可以存储每个网页与标识组合的对应关系,进而使得每个网页具有第一标识信息及其对应的第一标识值。
步骤202,获取多个网页的访问数据。
步骤202与步骤101的具体原理和实现方式类似,此处不再赘述。
步骤203,根据网页的第一标识信息及其对应的第一标识值对网页进行聚类。
步骤204,对属于一类的网页的访问数据进行处理,得到聚类访问信息。
本实施例提供的方法,可以根据网页的第一标识信息及其对应的第一标识值对网页进行聚类;对属于一类的网页的访问数据进行处理,得到聚类访问信息。
其中,可以将第一标识信息及其对应的第一标识值相同的网页分为一类,当网页具有多个标识组合时,可以针对每个第一标识信息逐一处理。例如,当各个网页都具有第一标识信息ID1、ID2、ID3时,可以先根据这些网页的ID1对应的值对网页进行分类,假设ID1为A1的网页有100个,ID1为A2的网页有150个。
对网页分类完成后,可以针对每个类网页的访问数据进行处理,进而得到每类网页的聚类访问信息。
例如,可以根据上述100个网页的访问数据得到ID1为A1的聚类访问信息,还可以根据上述150个网页的访问数据得到ID1为A2的聚类访问信息。针对ID2、ID3也可以这样处理,从而得到不同标识组合对应的聚类访问信息。
具体的,对访问数据进行处理,得到聚类访问信息,可以具体包括:
对属于同一类网页的访问数据中的每个指标信息进行求和计算、去重计算,得到属于一类的网页的聚类访问信息。
例如,用户A访问了如下页面各一次:
https://my.com/news?p=1;
https://my.com/news?p=2;
https://my.com/profile?id=1;
用户B访问了如下页面各一次:
https://my.com/news?p=2;
https://my.com/news?p=3;
https://my.com/profile?id=2。
预先确定的标识组合包括:
第一标识信息 第一标识值的类别 标识实际存储列
100 功能 Column1
101 Path Column2
为各个网页设置的标识组合为:
Figure BDA0002107851350000081
基于第一标识信息是101对网页进行聚类,并确定每类网页的聚类访问信息:
Column1 Column2 PV UV
新闻列表 /news 4 2
我的信息 /profile 2 2
步骤205,接收目标标识。
步骤205与步骤102中接收目标标识的具体原理和实现方式类似,此处不再赘述。
步骤206,根据目标标识、聚类访问信息的第一标识信息及其对应的第一标识值,确定目标访问信息。
其中,聚类访问信息包括具有相同标识组合的网页的访问数据的信息,该标识组合是指上述第一标识信息及其对应的第一标识值。因此,可以认为聚类访问信息也具有相同的标识组合。
具体的,可以在聚类访问信息中,确定具有与目标标识一致的标识组合的目标访问信息。具体可以根据目标标识遍历聚类访问信息的标识组合,从而确定出目标访问信息。
步骤207,根据目标访问信息确定分析结果。
步骤207与步骤103的具体原理和实现方式类似,此处不再赘述。
图3为本发明再一示例性实施例示出的网页访问数据分析方法的流程图。
步骤301,获取多个网页的访问数据,其中,所述网页具有第一标识信息,以及与所述第一标识信息对应的第一标识值。
步骤301与步骤101或步骤202的具体原理和实现方式类似,此处不再赘述。在步骤301之前还可以设置步骤201。
步骤302,接收目标标识。
步骤302与步骤101或步骤202中接收目标标识的具体原理和实现方式类似,此处不再赘述。
步骤303,根据目标标识、网页的第一标识信息及其对应的第一标识值,在多个网页中确定目标网页,根据目标网页的访问数据确定目标访问信息。
其中,电子设备接收目标标识后,可以在网页中筛选出与目标标识一致的目标网页。具体可以获取目标标识中包括的第二标识信息及其对应的第二标识值;在多个网页中,确定第一标识信息与第二标识信息相同,且第一标识值与第二标识值相同的目标网页。
具体的,当网页具有多个标识组合时,任一标识组合与目标标识一致,就可以认为其是目标网页。
进一步的,当目标标识中包括多个标识组合时,网页的任一标识与任一个目标标识组合一致,就可以认为网页是目标网页。
实际应用时,可以根据目标网页的访问数据确定目标访问信息。例如,可以对目标网页的访问数据进行去重、求和等处理,得到目标访问信息。
本实施例提供的方法与图2所示实施例的发明构思一致,均是对与目标标识一致的目标网页的访问数据进行统一处理,再对处理后的信息进行分析。区别在于,图2实施例的方法先对网页进行聚类,从而得到聚类访问信息,在聚类访问信息中筛选出目标访问信息。本实施例则根据目标标识筛选出需要分析的访问数据,并根据这些访问数据直接确定目标访问信息。
步骤304,根据目标访问信息确定分析结果。
步骤304与步骤103的具体原理和实现方式类似,此处不再赘述。
图4为本发明一示例性实施例示出的网页访问数据分析装置的结构图。
如图4所示,本实施例提供的网页访问数据分析装置,包括:
获取模块41,用于获取多个网页的访问数据,其中,所述网页具有第一标识信息,以及与所述第一标识信息对应的第一标识值;
确定模块42,用于接收目标标识,并根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息;
分析模块43,用于根据所述目标访问信息确定分析结果。
本实施例提供的网页访问数据分析装置,包括:获取模块,用于获取多个网页的访问数据,其中,网页具有第一标识信息,以及与第一标识信息对应的第一标识值;确定模块,用于接收目标标识,并根据目标标识、第一标识信息及其对应的第一标识值,确定与目标标识对应的网页的目标访问信息;分析模块,用于根据目标访问信息确定分析结果。本实施例提供的装置,能够根据需求获取希望分析的网页对应的目标访问信息,从而能够有选择的对网页访问数据进行分析,灵活度更高,从而满足用户的多样化需求。
本实施例提供的网页访问数据分析装置的具体原理和实现方式均与图1所示的实施例类似,此处不再赘述。
图5为本发明另一示例性实施例示出的网页访问数据分析装置的结构图。
如图5所示,在上述实施例的基础上,本实施例提供的网页访问数据分析装置,可选的,还包括聚类模块44,用于在获取模块41获取多个网页的访问数据之后:
根据所述网页的所述第一标识信息及其对应的所述第一标识值对所述网页进行聚类;
对属于一类的所述网页的所述访问数据进行处理,得到聚类访问信息;
所述确定模块42包括第一确定单元421,用于:
根据所述目标标识、所述聚类访问信息的所述第一标识信息及其对应的所述第一标识值,确定所述目标访问信息。
可选的,所述聚类模块44具体用于:
对所述访问数据中的每个指标信息进行求和计算、去重计算,得到属于一类的所述网页的所述聚类访问信息。
可选的,所述确定模块42包括第二确定单元422,用于:
根据所述目标标识、所述网页的第一标识信息及其对应的第一标识值,在多个所述网页中确定目标网页,根据所述目标网页的所述访问数据确定所述目标访问信息。
可选的,所述第二确定单元422具体用于:
获取所述目标标识中包括的第二标识信息及其对应的第二标识值;
在多个所述网页中,确定所述第一标识信息与所述第二标识信息相同,且所述第一标识值与所述第二标识值相同的所述目标网页。
可选的,每个网页具有多个所述第一标识信息,且多个所述网页的第一标识信息相同。
可选的,还包括设置模块45,用于接收设置指令,根据所述设置指令确定每个所述网页的第一标识信息,以及与所述第一标识信息对应的所述第一标识值。
本实施例提供的网页访问数据分析装置的具体原理和实现方式均与图2所示的实施例类似,此处不再赘述。
图6为本发明一示例性实施例示出的网页访问数据分析设备的结构图。
如图6所示,本实施例提供的网页访问数据分析设备包括:
存储器61;
处理器62;以及
计算机程序;
其中,所述计算机程序存储在所述存储器61中,并配置为由所述处理器62执行以实现如上所述的任一种网页访问数据分析方法。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如上所述的任一种网页访问数据分析方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (16)

1.一种网页访问数据分析方法,其特征在于,包括:
获取多个网页的访问数据,其中,所述网页具有第一标识信息,以及与所述第一标识信息对应的第一标识值;
接收目标标识,并根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息;
根据所述目标访问信息确定分析结果。
2.根据权利要求1所述的方法,其特征在于,所述获取多个网页的访问数据之后,还包括:
根据所述网页的所述第一标识信息及其对应的所述第一标识值对所述网页进行聚类;
对属于一类的所述网页的所述访问数据进行处理,得到聚类访问信息;
所述根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息,包括:
根据所述目标标识、所述聚类访问信息的所述第一标识信息及其对应的所述第一标识值,确定所述目标访问信息。
3.根据权利要求2所述的方法,其特征在于,所述对属于一类的所述网页的所述访问数据进行处理,得到聚类访问信息,包括:
对所述访问数据中的每个指标信息进行求和计算、去重计算,得到属于一类的所述网页的所述聚类访问信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息,包括:
根据所述目标标识、所述网页的第一标识信息及其对应的第一标识值,在多个所述网页中确定目标网页,根据所述目标网页的所述访问数据确定所述目标访问信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标标识、所述网页的第一标识信息及其对应的第一标识值,在多个所述网页中确定目标网页,包括:
获取所述目标标识中包括的第二标识信息及其对应的第二标识值;
在多个所述网页中,确定所述第一标识信息与所述第二标识信息相同,且所述第一标识值与所述第二标识值相同的所述目标网页。
6.根据权利要求1-5任一项所述的方法,其特征在于,每个网页具有多个所述第一标识信息,且多个所述网页的第一标识信息相同。
7.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
接收设置指令,根据所述设置指令确定每个所述网页的第一标识信息,以及与所述第一标识信息对应的所述第一标识值。
8.一种网页访问数据分析装置,其特征在于,包括:
获取模块,用于获取多个网页的访问数据,其中,所述网页具有第一标识信息,以及与所述第一标识信息对应的第一标识值;
确定模块,用于接收目标标识,并根据所述目标标识、所述第一标识信息及其对应的所述第一标识值,确定与所述目标标识对应的所述网页的目标访问信息;
分析模块,用于根据所述目标访问信息确定分析结果。
9.根据权利要求8所述的装置,其特征在于,还包括聚类模块,用于在获取模块获取多个网页的访问数据之后:
根据所述网页的所述第一标识信息及其对应的所述第一标识值对所述网页进行聚类;
对属于一类的所述网页的所述访问数据进行处理,得到聚类访问信息;
所述确定模块包括第一确定单元,用于:
根据所述目标标识、所述聚类访问信息的所述第一标识信息及其对应的所述第一标识值,确定所述目标访问信息。
10.根据权利要求9所述的装置,其特征在于,所述聚类模块具体用于:
对所述访问数据中的每个指标信息进行求和计算、去重计算,得到属于一类的所述网页的所述聚类访问信息。
11.根据权利要求8所述的装置,其特征在于,所述确定模块包括第二确定单元,用于:
根据所述目标标识、所述网页的第一标识信息及其对应的第一标识值,在多个所述网页中确定目标网页,根据所述目标网页的所述访问数据确定所述目标访问信息。
12.根据权利要求11所述的装置,其特征在于,所述第二确定单元具体用于:
获取所述目标标识中包括的第二标识信息及其对应的第二标识值;
在多个所述网页中,确定所述第一标识信息与所述第二标识信息相同,且所述第一标识值与所述第二标识值相同的所述目标网页。
13.根据权利要求8-12任一项所述的装置,其特征在于,每个网页具有多个所述第一标识信息,且多个所述网页的第一标识信息相同。
14.根据权利要求8-12任一项所述的装置,其特征在于,还包括设置模块,用于接收设置指令,根据所述设置指令确定每个所述网页的第一标识信息,以及与所述第一标识信息对应的所述第一标识值。
15.一种网页访问数据分析设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如权利要求1-7任一种所述的方法。
16.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如权利要求1-7任一种所述的方法。
CN201910559536.XA 2019-06-26 2019-06-26 网页访问数据分析方法、装置、设备及可读存储介质 Pending CN112148957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910559536.XA CN112148957A (zh) 2019-06-26 2019-06-26 网页访问数据分析方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910559536.XA CN112148957A (zh) 2019-06-26 2019-06-26 网页访问数据分析方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112148957A true CN112148957A (zh) 2020-12-29

Family

ID=73869681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910559536.XA Pending CN112148957A (zh) 2019-06-26 2019-06-26 网页访问数据分析方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112148957A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630325A (zh) * 2009-08-18 2010-01-20 北京大学 一种基于脚本特征的网页聚类方法
CN103020126A (zh) * 2012-11-19 2013-04-03 北京奇虎科技有限公司 网络内容的访问控制方法和装置
CN103297469A (zh) * 2012-02-25 2013-09-11 阿里巴巴集团控股有限公司 一种网站数据的采集方法及装置
CN103595747A (zh) * 2012-08-16 2014-02-19 腾讯科技(深圳)有限公司 用户信息推荐方法和系统
CN103823904A (zh) * 2014-03-19 2014-05-28 广东绿瘦健康信息咨询有限公司 网页浏览路径优化方法及其系统
CN104239559A (zh) * 2014-09-26 2014-12-24 北京金山安全软件有限公司 一种网页打开方法及装置
CN106294559A (zh) * 2016-07-26 2017-01-04 北京三快在线科技有限公司 一种应用流量分析方法及装置
CN106991175A (zh) * 2017-04-06 2017-07-28 百度在线网络技术(北京)有限公司 一种客户信息挖掘方法、装置、设备以及存储介质
CN108023867A (zh) * 2016-10-28 2018-05-11 中国移动通信集团广东有限公司 移动端网页广告过滤的方法、网关服务器及过滤服务器
CN108196874A (zh) * 2017-12-29 2018-06-22 东软集团股份有限公司 一种网页分析方法、装置及存储介质、程序产品
CN108304498A (zh) * 2018-01-12 2018-07-20 深圳壹账通智能科技有限公司 网页数据采集方法、装置、计算机设备和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630325A (zh) * 2009-08-18 2010-01-20 北京大学 一种基于脚本特征的网页聚类方法
CN103297469A (zh) * 2012-02-25 2013-09-11 阿里巴巴集团控股有限公司 一种网站数据的采集方法及装置
CN103595747A (zh) * 2012-08-16 2014-02-19 腾讯科技(深圳)有限公司 用户信息推荐方法和系统
CN103020126A (zh) * 2012-11-19 2013-04-03 北京奇虎科技有限公司 网络内容的访问控制方法和装置
CN103823904A (zh) * 2014-03-19 2014-05-28 广东绿瘦健康信息咨询有限公司 网页浏览路径优化方法及其系统
CN104239559A (zh) * 2014-09-26 2014-12-24 北京金山安全软件有限公司 一种网页打开方法及装置
CN106294559A (zh) * 2016-07-26 2017-01-04 北京三快在线科技有限公司 一种应用流量分析方法及装置
CN108023867A (zh) * 2016-10-28 2018-05-11 中国移动通信集团广东有限公司 移动端网页广告过滤的方法、网关服务器及过滤服务器
CN106991175A (zh) * 2017-04-06 2017-07-28 百度在线网络技术(北京)有限公司 一种客户信息挖掘方法、装置、设备以及存储介质
CN108196874A (zh) * 2017-12-29 2018-06-22 东软集团股份有限公司 一种网页分析方法、装置及存储介质、程序产品
CN108304498A (zh) * 2018-01-12 2018-07-20 深圳壹账通智能科技有限公司 网页数据采集方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110020122B (zh) 一种视频推荐方法、系统及计算机可读存储介质
CN107862022B (zh) 文化资源推荐系统
US10404731B2 (en) Method and device for detecting website attack
CN107797894B (zh) App用户行为分析方法和装置
US20100088354A1 (en) Method and System for Log File Analysis Based on Distributed Computing Network
CN106790487B (zh) 帮助信息的显示方法、装置及系统
CN109359263B (zh) 一种用户行为特征提取方法及系统
CN107800591A (zh) 一种统一日志数据的分析方法
CN104902292B (zh) 一种基于电视报道的舆情分析方法和系统
CN103605714B (zh) 网站异常数据的识别方法及装置
CN108512720B (zh) 一种网站流量的统计方法及装置
CN103605736A (zh) 转化数据的处理方法及装置
CN103530390A (zh) 网页抓取的方法及设备
CN112825089B (zh) 文章推荐方法、装置、设备及存储介质
CN109033286A (zh) 数据统计方法和装置
CN106933905B (zh) 网页访问数据的监测方法和装置
CN110324352A (zh) 识别批量注册账号群的方法及装置
CN103399968A (zh) 一种微博信息采集方法及系统
CN108241611B (zh) 一种关键词提取方法以及提取设备
CN106897297B (zh) 网站栏目间访问路径的确定方法及装置
CN112148957A (zh) 网页访问数据分析方法、装置、设备及可读存储介质
CN109145307A (zh) 用户画像识别方法、推送方法、装置、设备和存储介质
CN103544278A (zh) 确定网站抓取流量配额的方法及设备
WO2019062013A1 (zh) 电子装置、用户分群的方法、系统及计算机可读存储介质
CN106815247B (zh) 统一资源定位符获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination