CN106933915A - 网页导航的生成方法及装置 - Google Patents
网页导航的生成方法及装置 Download PDFInfo
- Publication number
- CN106933915A CN106933915A CN201511032519.9A CN201511032519A CN106933915A CN 106933915 A CN106933915 A CN 106933915A CN 201511032519 A CN201511032519 A CN 201511032519A CN 106933915 A CN106933915 A CN 106933915A
- Authority
- CN
- China
- Prior art keywords
- data
- page
- sublist
- screened
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种网页导航的生成方法及装置。其中,该方法包括:获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量;根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息;按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量;根据第二数据子表生成网页导航。本发明解决了在生成网页导航时由于需要对各个会话节点进行查询导致的反复对数据库进行读写,查询性能差的技术问题。
Description
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页导航的生成方法及装置。
背景技术
在现有的对网站中各级页面进行导航的导航类型中,包括:页面导航、路径导航、事件导航、类别导航等。导航可以根据在同一场景中的各个页面之间的访问顺序,出具相应的页面导航图,即能够从某个页面出发,剖析与之关联的后续页面和前置页面。
现有的对于上述导航的实现方式,是通过数据表之间的连接关系对其进行生成。在每一次对后续页面的进行剖析时,都需要查询一次完整的表连接,处理性能很差。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种网页导航的生成方法及装置,以至少解决在生成网页导航时由于需要对各个会话节点进行查询导致的反复对数据库进行读写,查询性能差的技术问题。
根据本发明实施例的一个方面,提供了一种网页导航的生成方法,包括:获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量;根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息;按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量;根据第二数据子表生成网页导航。
进一步地,根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,包括:根据初始页面对待筛选数据表进行筛选,得到第一数据集合,其中,第一数据集合包括:包含初始页面的数据行;根据查询层级数量对第一数据集合进行筛选,得到以初始页面对应的层级为初始层级且层级深度小于或等于查询层级数量的第二数据集合;根据第二数据集合,生成第一数据子表。
进一步地,按照生成指令对第一数据子表进行整理,得到第二数据子表,包括:对第一数据子表中的数据进行筛选,得到第三数据集合,第三数据集合包括:与各网页页面对应的起点页面地址、终点地址和页面访问量;根据第三数据集合,生成第二数据子表。
进一步地,根据第二数据子表生成网页导航,包括:根据与各网页页面对应的起点页面地址和终点地址,对网页页面进行关联;根据关联后的网页页面和页面访问量,生成网页导航。
进一步地,在获取用于生成网页导航的生成指令之前,方法还包括:根据预先设置的筛选条件,筛选得到待筛选数据表,其中,筛选条件至少包括如下一种或多种:会话主页地址和会话生成日期。
根据本发明实施例的另一方面,还提供了一种网页导航的生成装置,包括:获取模块,用于获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量;第一筛选模块,用于根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息;整理模块,用于按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量;生成模块,用于根据第二数据子表生成网页导航。
进一步地,上述第一筛选模块,包括:第一子筛选模块,用于根据初始页面对待筛选数据表进行筛选,得到第一数据集合,其中,第一数据集合包括:包含初始页面的数据行;第二子筛选模块,用于根据查询层级数量对第一数据集合进行筛选,得到以初始页面对应的层级为初始层级且层级深度小于或等于查询层级数量的第二数据集合;第一子生成模块,用于根据第二数据集合,生成第一数据子表。
进一步地,上述整理模块,包括:第三子筛选模块,用于对第一数据子表中的数据进行筛选,得到第三数据集合,第三数据集合包括:与各网页页面对应的起点页面地址、终点地址和页面访问量;第二子生成模块,用于根据第三数据集合,生成第二数据子表。
进一步地,上述生成模块,包括:子关联模块,用于根据与各网页页面对应的起点页面地址和终点地址,对网页页面进行关联;第三子生成模块,用于根据关联后的网页页面和页面访问量,生成网页导航。
进一步地,上述装置还包括:第二筛选模块,用于根据预先设置的筛选条件,筛选得到待筛选数据表,其中,筛选条件至少包括如下一种或多种:会话主页地址和会话生成日期。
在本发明实施例中,采用获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量;根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息;按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量;根据第二数据子表生成网页导航的方式,实现了通过一次查询即可生成网页导航的技术效果,达到了提升网页导航生成性能的目的,进而解决了在生成网页导航时由于需要对各个会话节点进行查询导致的反复对数据库进行读写,查询性能差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种网页导航的生成方法的流程图;
图2是根据本发明实施例的网页导航的生成方法生成的网页导航页面的示意图;
图3是根据本发明实施例的一种网页导航的生成装置的示意图;以及
图4是根据本发明实施例的一种可选的网页导航的生成装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种网页导航的生成方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的网页导航的生成方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量。
具体的,通过步骤S102,获取用于生成网页导航的生成指令,在生成指令中,可以包括作为网页导航起始的初始页面,以及网页导航中包含层级数量的查询层级数量。
步骤S104,根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息。
具体的,在步骤S104中,可以对待筛选数据表中包含的各个会话信息进行筛选,筛选得到会话中包含有初始页面,且以初始页面为起始的层级深度不超过查询层级数量的会话信息。其中,每各数据行与一个会话信息对应,用于存储在该次会话中访问的所有网页的网页信息以及访问顺序等。
步骤S106,按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量。
具体的,通过步骤S106,对第一数据子表的各数据行中存储的数据进行筛选,得到只包含与网页页面对应的起点地址、终点地址以及页面访问量等信息,并生成第二数据子表。
步骤S108,根据第二数据子表生成网页导航。
具体的,通过步骤S108,利用通过上述步骤生成的第二数据子表,生成网页导航。
通过上述步骤,实现了通过一次查询即可生成网页导航的技术效果,达到了提升网页导航生成性能的目的,进而解决了在生成网页导航时由于需要对各个会话节点进行查询导致的反复对数据库进行读写,查询性能差的技术问题。
作为一种可选的实施方式,在步骤S106之后,还可以根据新的初始页面和新的查询层级数量,直接对第一数据子表进行筛选,生成新的导航数据表,从而使网页导航相关数据记录于同一张数据表当中,以提高网页导航生成的效率。
作为一种可选的实施方式,在绘制网页导航的过程中,关联强度可以通过改变反映关联关系的连接线的粗细来体现。关联强度越强,连接线越粗,关联强度越弱,连接线越细。
作为一种可选的实施方式,在步骤S104根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表中,可以包括:
步骤S41,根据初始页面对待筛选数据表进行筛选,得到第一数据集合,其中,第一数据集合包括:包含初始页面的数据行。
步骤S43,根据查询层级数量对第一数据集合进行筛选,得到以初始页面对应的层级为初始层级且层级深度小于或等于查询层级数量的第二数据集合。
步骤S45,根据第二数据集合,生成第一数据子表。
具体的,通过步骤S41至步骤S45,利用初始页面的地址信息,对带筛选数据表中的各数据行中的数据进行筛选,筛选出用于记录所有包含初始页面的会话的数据行,得到第一数据集合。再将在各个会话中初始页面的原始层级作为初始层级,筛选得到在初始层级至查询层级数量范围区间内的页面信息集合,即第二数据集合。最后,利用上述第二数据集合生成第一数据子表。
作为一种可选的实施方式,在步骤S43中,可以将初始页面的层级作为初始层级,根据初始层级和查询层级数量确定对第一数据集合中的页面进行筛选的层级区间。进一步的,可以根据层级区间对第一数据集合中各数据行内的页面信息进行筛选,得到包含有第一数据集合中处于层级区间内的所有页面信息的第二数据集合;也可以根据初始层级和查询层级数量,直接将小于初始层级和大于查询层级数量的页面信息删除,从而得到第二数据集合,当然还可以利用其他方式对第一数据集合中的页面信息进行筛选,得到第二数据表,此处不做具体限定。
作为一种可选的实施方式,在步骤S106按照生成指令对第一数据子表进行整理,得到第二数据子表中,步骤可以包括:
步骤S61,对第一数据子表中的数据进行筛选,得到第三数据集合,第三数据集合包括:与各网页页面对应的起点页面地址、终点地址和页面访问量。
步骤S63,根据第三数据集合,生成第二数据子表。
具体的,在步骤S61至步骤S63中,对第二数据集合中的页面信息进行筛选处理,根据会话中对各个网页页面的浏览顺序,确定各网页页面之间的前后关系。通过前后关系,确定与各网页页面对应的起点页面地址、终点地址和页面访问量。然后,根据上述起点页面地址、终点地址和页面访问量,生成第二数据子表。
作为一种可选的实施方式,在步骤S108根据第二数据子表生成网页导航中,还可以包括
步骤S81,根据与各网页页面对应的起点页面地址和终点地址,对网页页面进行关联。
步骤S83,根据关联后的网页页面和页面访问量,生成网页导航。
具体的,在步骤S81至步骤S83中,利用第二数据子表中记录的各个网页页面之间的访问顺序的前后关系,确定与每个网页页面(ConversionName)对应的前一个网页页面信息(即FromUrl)和后一个网页页面信息(ToUrl)。将上述信息与页面访问量结合,生成完整的网页导航。
作为一种可选的实施方式,在实际应用当中,树形结构的网页导航为例进行说明,当需要生成网页导航时,可以查询并返回如下字段信息:
FromUrl:用于记录当前页面节点的上一个节点的地址信息;
ToUrl:用于记录当前页面节点的下一个节点的地址信息;
AccessOrder:用于记录当前页面节点的节点层级信息;
Visits:用于记录访问量,其中,访问量中包括从FromUrl到ToUrl一共包含了的访问量。
例如,如图2所示,在某一会话中包含A、B、C、D四个页面,并按照A-B-C-D顺序进行访问并生成网页导航时,首先,生成指令中的初始页面为B、查询层级数量AccessOrder为3,会话中第1个B出现的那条记录中数值最小的节点层级信息为与第1个B对应的节点层级信息,即Min(AccessOrder)=2,再根据树的节点层级信息AccessOrder,4-2+1≥3,确定当前会话符合第一数据子表的筛选条件,之后对该会话的数据行记录进行按照生成质量进行整理,得到B-C-D,将B、C、D依次布置在3个层级上,即B层级与图2中的初始层级对应,C层级与图2中的第二层及对应,D层级与图2中的第三层级对应。再根据FromUrl,ToUrl以及Visits确定各个页面之间的关联关系以及关联强度,其中,关联强度可以通过访问量的多少体现。对于第二数据子表中的各个数据行记录均按上述布置层级的过程进行操作,即可得到网页导航。
在现有技术中,由于直接根据预先确定好的网页导航的路径信息,对原始表进行表连接,导致性能开销大,处理速度慢。而上述步骤,则将生成网页导航的模型统一化,利用AccessOrder来记录各个页面节点的层级信息树结点的深度信息。在生成网页导航时,仅需要一次表连接,便能计算得到无限层级的页面导航,处理性能得到大幅提升。
作为一种可选的实施方式,在图2中的页面导航中的用于显示各个页面信息的页面信息框体之后,可以设置“+”或“-”标识。其中,“+”标识用于提示当前页面信息框体后存在与其对应的其他层级的页面信息框体,“-”标识用于提示已对当前页面信息框体之后的其他页面信息框体进行展开显示。
作为一种可选的实施方式,在步骤S102获取用于生成网页导航的生成指令之前,方法还包括:
步骤S101,根据预先设置的筛选条件,筛选得到待筛选数据表,其中,筛选条件至少包括如下一种或多种:会话主页地址和会话生成日期。
具体的,在实际应用中,可以根据不同的实际需求设置具体的筛选条件,通过步骤S101,将不符合筛选条件的会话或者网页从会话数据表中删除,得到待筛选数据表。其中,筛选条件可以包括:会话初始页的地址信息、生成会话的时间信息以及需要筛选的网页的网页地址信息等。
在实际应用当中,以会话中包含A、B、C、D四个页面,并按照A-B-A-B-C的顺序进行访问为例,进行说明。
步骤1,从会话数据表中过滤得到网页的第一页面集合,并计算得到符合条件的SessionID,以及其最小的AccessOrder。
在步骤1中,通过计算筛选得到所有满足作为网页导航起始点的网页信息,从而确定其中数值最小的节点层级信息AccessOrder。例如:当会话的访问顺序为A-B-A-B-C,并选取B为起点时,数值最小的节点层级信息为与第1个B对应的节点层级信息,即Min(AccessOrder)=2。
步骤2,从会话数据表(页面浏览记录PV表)中,选取所有节点层级信息AccessOrder大于或等于上述步骤1中确定的最小的AccessOrder的页面浏览记录pageview。
在步骤2中,通过计算选取得到所有用于生成网页导航的页面地址Url的访问记录。以选取B为起点为例,选取得到B-A-B-C的记录。
步骤3,由于AccessOrder参差不齐,对选取得到的同会话下的页面浏览记录PV对应的AccessOrder做重新排序,生成新的节点层级信息newAccessOrder。其中,newAccessOrder根据会话数据表中的AccessOrder进行生成。
步骤4,对生成网页导航的层级进行限制,例如:当仅需要对前10个层级页面生成网页导航时,则可以通过设置newAccessOrder<=10的筛选条件对页面进行筛选,层级高于10的将不用参与计算。
步骤5,根据当前层级页面的页面地址Url,通过查询确定的下一层级页面对应的页面地址Url,从而确定上一个节点的地址信息FromUrl和下一个节点的地址信息ToUrl,以及访问量信息Visits。
步骤6,根据上述获取的到的当前页面地址、上一个节点的地址信息、下一个节点的地址信息以及访问量信息Visits,生成网页导航。
在具体实现当中,可以通过以下代码实现:
通过上述方法,只需要通过两次表连接,即可生成网页导航。两次表连接即为:过滤所有需要参与生成网页导航的数据信息,以及计算与各个页面对应的上一个节点的地址信息、下一个节点的地址信息和访问量信息Visits。与现有技术相比,极大的提升了生成网页导航的处理性能。
图3是根据本发明实施例的网页导航的生成装置的示意图。如图3所示,该装置包括:获取模块22、第一筛选模块24、整理模块26和生成模块28。
其中,获取模块22,用于获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量;第一筛选模块24,用于根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息;整理模块26,用于按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量;生成模块28,用于根据第二数据子表生成网页导航。
通过上述装置,实现了通过一次查询即可生成网页导航的技术效果,达到了提升网页导航生成性能的目的,进而解决了在生成网页导航时由于需要对各个会话节点进行查询导致的反复对数据库进行读写,查询性能差的技术问题。
作为一种可选的实施方式,上述第一筛选模块24,包括:第一子筛选模块241、第二子筛选模块243和第一子生成模块245。
其中,第一子筛选模块241,用于根据初始页面对待筛选数据表进行筛选,得到第一数据集合,其中,第一数据集合包括:包含初始页面的数据行;第二子筛选模块243,用于根据查询层级数量对第一数据集合进行筛选,得到以初始页面对应的层级为初始层级且层级深度小于或等于查询层级数量的第二数据集合;第一子生成模块245,用于根据第二数据集合,生成第一数据子表。
具体的,通过上述第一子筛选模块241、第二子筛选模块243和第一子生成模块245,利用初始页面的地址信息,对带筛选数据表中的各数据行中的数据进行筛选,筛选出用于记录所有包含初始页面的会话的数据行,得到第一数据集合。再将在各个会话中初始页面的原始层级作为初始层级,筛选得到在初始层级至查询层级数量范围区间内的页面信息集合,即第二数据集合。最后,利用上述第二数据集合生成第一数据子表。
作为一种可选的实施方式,上述整理模块26,包括:第三子筛选模块261和第二子生成模块263。
其中,第三子筛选模块261,用于对第一数据子表中的数据进行筛选,得到第三数据集合,第三数据集合包括:与各网页页面对应的起点页面地址、终点地址和页面访问量;第二子生成模块263,用于根据第三数据集合,生成第二数据子表。
具体的,在上述第三子筛选模块261和第二子生成模块263中,对第二数据集合中的页面信息进行筛选处理,根据会话中对各个网页页面的浏览顺序,确定各网页页面之间的前后关系。通过前后关系,确定与各网页页面对应的起点页面地址、终点地址和页面访问量。然后,根据上述起点页面地址、终点地址和页面访问量,生成第二数据子表。
作为一种可选的实施方式,上述生成模块28,包括:子关联模块281和第三子生成模块283。
其中,子关联模块281,用于根据与各网页页面对应的起点页面地址和终点地址,对网页页面进行关联;第三子生成模块283,用于根据关联后的网页页面和页面访问量,生成网页导航。
具体的,在上述子关联模块281和第三子生成模块283中,利用第二数据子表中记录的各个网页页面之间的访问顺序的前后关系,确定与每个网页页面(ConversionName)对应的前一个网页页面信息(即FromUrl)和后一个网页页面信息(ToUrl)。将上述信息与页面访问量结合,生成完整的网页导航。
作为一种可选的实施方式,如图4所示,上述装置还可以包括:第二筛选模块20。
其中,第二筛选模块20,用于根据预先设置的筛选条件,筛选得到待筛选数据表,其中,筛选条件至少包括如下一种或多种:会话主页地址和会话生成日期。
具体的,在实际应用中,可以根据不同的实际需求设置具体的筛选条件,通过上述,第二筛选模块20,将不符合筛选条件的会话或者网页从会话数据表中删除,得到待筛选数据表。其中,筛选条件可以包括:会话初始页的地址信息、生成会话的时间信息以及需要筛选的网页的网页地址信息等。
所述网页导航的生成装置包括处理器和存储器,上述获取模块、第一筛选模块、整理模块和生成模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。上述筛选条件、预设规则等都可以存储在存储器中。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解析文本内容。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取用于生成网页导航的生成指令,其中,生成指令中包括:初始页面和查询层级数量;根据生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,待筛选数据表的数据行用于记录各个会话信息;按照生成指令对第一数据子表进行整理,得到第二数据子表,其中,第二数据子表用于记录与各网页页面对应的起点页面地址、终点地址和页面访问量;根据第二数据子表生成网页导航。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种网页导航的生成方法,其特征在于,包括:
获取用于生成网页导航的生成指令,其中,所述生成指令中包括:初始页面和查询层级数量;
根据所述生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,所述待筛选数据表的所述数据行用于记录各个会话信息;
按照所述生成指令对所述第一数据子表进行整理,得到第二数据子表,其中,所述第二数据子表用于记录与所述各网页页面对应的起点页面地址、终点地址和页面访问量;
根据所述第二数据子表生成所述网页导航。
2.根据权利要求1所述的方法,其特征在于,所述根据所述生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,包括:
根据所述初始页面对所述待筛选数据表进行筛选,得到第一数据集合,其中,所述第一数据集合包括:包含所述初始页面的所述数据行;
根据所述查询层级数量对所述第一数据集合进行筛选,得到以所述初始页面对应的层级为初始层级且层级深度小于或等于所述查询层级数量的第二数据集合;
根据所述第二数据集合,生成所述第一数据子表。
3.根据权利要求1所述的方法,其特征在于,所述按照所述生成指令对所述第一数据子表进行整理,得到第二数据子表,包括:
对所述第一数据子表中的数据进行筛选,得到第三数据集合,所述第三数据集合包括:与所述各网页页面对应的所述起点页面地址、所述终点地址和所述页面访问量;
根据所述第三数据集合,生成所述第二数据子表。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二数据子表生成所述网页导航,包括:
根据与所述各网页页面对应的所述起点页面地址和所述终点地址,对所述网页页面进行关联;
根据关联后的所述网页页面和所述页面访问量,生成所述网页导航。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,在获取用于生成网页导航的生成指令之前,所述方法还包括:
根据预先设置的筛选条件,筛选得到所述待筛选数据表,其中,所述筛选条件至少包括如下一种或多种:会话主页地址和会话生成日期。
6.一种网页导航的生成装置,其特征在于,包括:
获取模块,用于获取用于生成网页导航的生成指令,其中,所述生成指令中包括:初始页面和查询层级数量;
第一筛选模块,用于根据所述生成指令对待筛选数据表的数据行进行筛选,得到第一数据子表,其中,所述待筛选数据表的所述数据行用于记录各个会话信息;
整理模块,用于按照所述生成指令对所述第一数据子表进行整理,得到第二数据子表,其中,所述第二数据子表用于记录与所述各网页页面对应的起点页面地址、终点地址和页面访问量;
生成模块,用于根据所述第二数据子表生成所述网页导航。
7.根据权利要求6所述的装置,其特征在于,所述第一筛选模块,包括:
第一子筛选模块,用于根据所述初始页面对所述待筛选数据表进行筛选,得到第一数据集合,其中,所述第一数据集合包括:包含所述初始页面的所述数据行;
第二子筛选模块,用于根据所述查询层级数量对所述第一数据集合进行筛选,得到以所述初始页面对应的层级为初始层级且层级深度小于或等于所述查询层级数量的第二数据集合;
第一子生成模块,用于根据所述第二数据集合,生成所述第一数据子表。
8.根据权利要求6所述的装置,其特征在于,所述整理模块,包括:
第三子筛选模块,用于对所述第一数据子表中的数据进行筛选,得到第三数据集合,所述第三数据集合包括:与所述各网页页面对应的所述起点页面地址、所述终点地址和所述页面访问量;
第二子生成模块,用于根据所述第三数据集合,生成所述第二数据子表。
9.根据权利要求6所述的装置,其特征在于,所述生成模块,包括:
子关联模块,用于根据与所述各网页页面对应的所述起点页面地址和所述终点地址,对所述网页页面进行关联;
第三子生成模块,用于根据关联后的所述网页页面和所述页面访问量,生成所述网页导航。
10.根据权利要求6至9中任意一项所述的装置,其特征在于,所述装置还包括:
第二筛选模块,用于根据预先设置的筛选条件,筛选得到所述待筛选数据表,其中,所述筛选条件至少包括如下一种或多种:会话主页地址和会话生成日期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511032519.9A CN106933915B (zh) | 2015-12-31 | 2015-12-31 | 网页导航的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511032519.9A CN106933915B (zh) | 2015-12-31 | 2015-12-31 | 网页导航的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106933915A true CN106933915A (zh) | 2017-07-07 |
CN106933915B CN106933915B (zh) | 2020-03-03 |
Family
ID=59444152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511032519.9A Active CN106933915B (zh) | 2015-12-31 | 2015-12-31 | 网页导航的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933915B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948034A (zh) * | 2017-09-27 | 2019-06-28 | 北京国双科技有限公司 | 基于过滤会话实现提取页面信息的方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050198567A1 (en) * | 2004-01-29 | 2005-09-08 | Vermeulen Bert M. | Web navigation method and system |
CN102088639A (zh) * | 2011-01-21 | 2011-06-08 | 烽火通信科技股份有限公司 | Iptv机顶盒浏览器页面的导航控制方法 |
CN102349069A (zh) * | 2009-01-16 | 2012-02-08 | 谷歌公司 | 为搜索结果或链接页面可视化站点结构及使能站点导航 |
CN103136316A (zh) * | 2012-02-29 | 2013-06-05 | 何劲 | 一种网址导航系统和方法 |
CN103514232A (zh) * | 2012-06-29 | 2014-01-15 | 百度在线网络技术(北京)有限公司 | 一种web站点资源管理方法及装置 |
CN103793453A (zh) * | 2012-10-31 | 2014-05-14 | 国际商业机器公司 | 用于web导航跟踪的方法和系统 |
CN103793532A (zh) * | 2014-02-27 | 2014-05-14 | 北京金山网络科技有限公司 | 一种页面导航方法、装置及浏览器 |
CN105205061A (zh) * | 2014-06-12 | 2015-12-30 | 中国银联股份有限公司 | 一种电商网站的页面信息获取方法 |
-
2015
- 2015-12-31 CN CN201511032519.9A patent/CN106933915B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050198567A1 (en) * | 2004-01-29 | 2005-09-08 | Vermeulen Bert M. | Web navigation method and system |
CN102349069A (zh) * | 2009-01-16 | 2012-02-08 | 谷歌公司 | 为搜索结果或链接页面可视化站点结构及使能站点导航 |
CN102088639A (zh) * | 2011-01-21 | 2011-06-08 | 烽火通信科技股份有限公司 | Iptv机顶盒浏览器页面的导航控制方法 |
CN103136316A (zh) * | 2012-02-29 | 2013-06-05 | 何劲 | 一种网址导航系统和方法 |
CN103514232A (zh) * | 2012-06-29 | 2014-01-15 | 百度在线网络技术(北京)有限公司 | 一种web站点资源管理方法及装置 |
CN103793453A (zh) * | 2012-10-31 | 2014-05-14 | 国际商业机器公司 | 用于web导航跟踪的方法和系统 |
CN103793532A (zh) * | 2014-02-27 | 2014-05-14 | 北京金山网络科技有限公司 | 一种页面导航方法、装置及浏览器 |
CN105205061A (zh) * | 2014-06-12 | 2015-12-30 | 中国银联股份有限公司 | 一种电商网站的页面信息获取方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948034A (zh) * | 2017-09-27 | 2019-06-28 | 北京国双科技有限公司 | 基于过滤会话实现提取页面信息的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106933915B (zh) | 2020-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019034299A1 (de) | Vorrichtungen zum bereitstellen einer menge von kryptographisch geschützten und gefilterten sowie sortierten transaktionsdatensätzen eines gliedes einer blockkette | |
DE60014341T2 (de) | Server, der die automatische einfügung von daten in elektronische formulare auf einem nutzer-computer ermöglicht | |
CN108595583A (zh) | 动态图表类页面数据爬取方法、装置、终端及存储介质 | |
CN104504086B (zh) | 网页页面的聚类方法和装置 | |
CN106951489A (zh) | 一种用于稀疏大数据的个性化推荐方法和装置 | |
CN106815254A (zh) | 一种数据处理方法和装置 | |
CN104484449B (zh) | 网页页面的正文提取方法和装置 | |
CN109254980A (zh) | 客户分数排序的方法、装置、计算机设备和存储介质 | |
Singh et al. | Comparison analysis of web usage mining using pattern recognition techniques | |
CN106708841A (zh) | 网站访问路径的聚合方法和装置 | |
CN108153719A (zh) | 合并电子表格的方法和装置 | |
CN103970753A (zh) | 关联知识的推送方法和装置 | |
CN107784035A (zh) | 漏斗模型的节点的评估系统、方法和装置 | |
US20120166412A1 (en) | Super-clustering for efficient information extraction | |
CN108320168A (zh) | 一种数据分析方法及装置 | |
DE112021004234T5 (de) | Einsetzen von metalernen zum optimieren der automatischen auswahl von pipelinesdes maschinellen lernens | |
CN103440199A (zh) | 测试引导方法和装置 | |
DE112012006412T5 (de) | System zur verteilten Datensuche, Verfahren zur verteilten Datensuche und Managementcomputer | |
CN104765823A (zh) | 一种网站数据采集的方法及装置 | |
CN103605736A (zh) | 转化数据的处理方法及装置 | |
CN108182595A (zh) | 一种制定运营策略方法及装置 | |
CN108241691A (zh) | 热点查询数据的搜集方法和装置 | |
CN106933903A (zh) | 应用于分布式存储的存储方法及装置 | |
CN106933915A (zh) | 网页导航的生成方法及装置 | |
CN106933894A (zh) | 多维度数据的查询方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |