CN106933896A - 最短访问路径识别方法及装置 - Google Patents

最短访问路径识别方法及装置 Download PDF

Info

Publication number
CN106933896A
CN106933896A CN201511031384.4A CN201511031384A CN106933896A CN 106933896 A CN106933896 A CN 106933896A CN 201511031384 A CN201511031384 A CN 201511031384A CN 106933896 A CN106933896 A CN 106933896A
Authority
CN
China
Prior art keywords
page
node
rearmounted
memory cell
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511031384.4A
Other languages
English (en)
Other versions
CN106933896B (zh
Inventor
马燕龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201511031384.4A priority Critical patent/CN106933896B/zh
Publication of CN106933896A publication Critical patent/CN106933896A/zh
Application granted granted Critical
Publication of CN106933896B publication Critical patent/CN106933896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Abstract

本发明公开了一种最短访问路径识别方法及装置。其中,该方法包括:获取起始访问页面对应的访问源点,其中,访问源点的横坐标表示起始访问页面的标号,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离;获取起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从起始访问页面到达对应后置页面的路径距离;当各后置页面为终止访问页面时,将起始访问页面到各后置页面的路径都作为最短访问路径。本发明解决了相关技术中由于用户手动确定最短访问路径造成的操作步骤繁琐、工作效率低、易出错的技术问题。

Description

最短访问路径识别方法及装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种最短访问路径识别方法及装置。
背景技术
目前,网站分析系统中的路径导航功能,可以帮助用户发现当前页面的前置页面和后置页面,以及每个前置页面到达当前页面的占比,当前页面到达每个后置页面的占比。
虽然通过路径导航能够直观地看到当前页面的前置页面和后置页面,以及各路径的访问占比,但是难以看出网站的最短访问路径。在这种情况下,往往需要用户手动对每条路径进行指标汇总,从而得出最短访问路径。
但是,手动操作方式操作步骤繁琐,工作效率低,易出错。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种最短访问路径识别方法及装置,以至少解决相关技术中由于用户手动确定最短访问路径造成的操作步骤繁琐、工作效率低、易出错的技术问题。
根据本发明实施例的一个方面,提供了一种最短访问路径识别方法,包括:获取起始访问页面对应的访问源点,其中,上述访问源点的横坐标表示上述起始访问页面的标号,上述访问源点的纵坐标表示从上述起始访问页面到达上述起始访问页面的路径距离;获取上述起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从上述起始访问页面到达对应后置页面的路径距离;当上述各后置页面为终止访问页面时,将上述起始访问页面到上述各后置页面的路径都作为最短访问路径。
进一步地,上述起始访问页面为第一起始访问页面,上述访问源点为第一访问源点,其中,将上述起始访问页面到上述各后置页面的路径都作为最短访问路径包括:将上述第一起始访问页面到上述各后置页面的路径都作为第一最短访问路径,在将上述第一起始访问页面到上述各后置页面的路径都作为最短访问路径之前,上述方法还包括:获取第二起始访问页面对应的第二访问源点;获取上述第二起始访问页面的各后置页面对应的节点;在上述各后置页面为终止访问页面时,将上述第二起始访问页面到上述各后置页面的路径都作为第二最短访问路径;确定上述第一最短访问路径和上述第二最短访问路径中的最短路径;将确定出的最短访问路径作为网站的最短路径。
进一步地,上述方法还包括:当上述各后置页面为中间访问页面时,将目标节点从第一存储单元转移到第二存储单元中,其中,上述目标节点为上述各后置页面对应的节点中纵坐标最小的节点;确定上述目标节点的后置节点,其中,上述后置节点对应的页面是上述目标节点对应的页面的后置页面;将上述后置节点添加至上述第一存储单元中,其中,上述第一存储单元中还存储有上述各后置页面对应的节点中除上述目标节点之外的节点;依次从上述第一存储单元中选择并转移纵坐标最小的节点至上述第二存储单元中,同时将通过该节点能够到达的终止访问页面对应的节点添加至上述第一存储单元中,直到上述第一存储单元为空时,根据上述第二存储单元中各节点的横纵坐标确定上述起始访问页面到上述各节点对应访问页面的最小路径。
进一步地,在当上述各后置页面为中间访问页面时,且在将目标节点从第一存储单元转移到第二存储单元中之前,上述方法还包括:判断上述第二存储单元中是否存在横坐标与上述纵坐标最小的节点的横坐标相同的节点;在判断结果为上述第二存储单元中存在横坐标与上述纵坐标最小的节点的横坐标相同的节点的情况下,从上述第一存储单元删除上述纵坐标最小的节点,并将执行删除操作后的上述各后置页面对应的节点中纵坐标最小的节点从上述第一存储单元转移到上述第二存储单元中。
进一步地,在上述各后置页面为中间访问页面时,且在将目标节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中之后,上述方法还包括:判断上述第二存储单元中是否存在横坐标与上述纵坐标最小的节点的横坐标相同的节点;在判断结果为上述第二存储单元中存在横坐标与上述纵坐标最小的节点的横坐标相同的节点的情况下,从上述第二存储单元删除上述纵坐标最小的节点,并将执行转移操作后的上述各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
根据本发明实施例的另一方面,还提供了一种最短访问路径识别装置,包括:第一获取单元,用于获取起始访问页面对应的访问源点,其中,上述访问源点的横坐标表示上述起始访问页面的标号,上述访问源点的纵坐标表示从上述起始访问页面到达上述起始访问页面的路径距离;第二获取单元,用于获取上述起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从上述起始访问页面到达对应后置页面的路径距离;第一识别单元,用于在上述各后置页面为终止访问页面时,将上述起始访问页面到上述各后置页面的路径都作为最短访问路径。
进一步地,上述起始访问页面为第一起始访问页面,上述访问源点为第一访问源点,其中,第一识别单元还用于将上述第一起始访问页面到上述各后置页面的路径都作为第一最短访问路径,上述装置还包括:第三获取单元,用于在将上述第一起始访问页面到上述各后置页面的路径都作为最短访问路径之前,获取第二起始访问页面对应的第二访问源点;第四获取单元,用于获取上述第二起始访问页面的各后置页面对应的节点;第二识别单元还用于在上述各后置页面为终止访问页面时,将上述第二起始访问页面到上述各后置页面的路径都作为第二最短访问路径;第一确定单元,用于确定上述第一最短访问路径和上述第二最短访问路径中的最短路径;第三识别单元,用于将确定出的最短访问路径作为网站的最短路径。
进一步地,上述装置还包括:转移单元,用于当上述各后置页面为中间访问页面时,将目标节点从第一存储单元转移到第二存储单元中,其中,上述目标节点为上述各后置页面对应的节点中纵坐标最小的节点;第二确定单元,用于确定上述目标节点的后置节点,其中,上述后置节点对应的页面是上述目标节点对应的页面的后置页面;添加单元,用于将上述后置节点添加至上述第一存储单元中,其中,上述第一存储单元中还存储有上述各后置页面对应的节点中除上述目标节点之外的节点;第四识别单元,用于依次从上述第一存储单元中选择并转移纵坐标最小的节点至上述第二存储单元中,同时将通过该节点能够到达的终止访问页面对应的节点添加至上述第一存储单元中,直到上述第一存储单元为空时,根据上述第二存储单元中各节点的横纵坐标确定上述起始访问页面到上述各节点对应访问页面的最小路径。
进一步地,上述装置还包括:第一判断单元,用于在当上述各后置页面为中间访问页面时,且在目标节点从第一存储单元转移到第二存储单元中之前,判断上述第二存储单元中是否存在横坐标与上述纵坐标最小的节点的横坐标相同的节点;第一删除单元,用于在判断结果为上述第二存储单元中存在横坐标与上述纵坐标最小的节点的横坐标相同的节点的情况下,从上述第一存储单元删除上述纵坐标最小的节点,其中,上述转移单元还用于将执行删除操作后的上述各后置页面对应的节点中纵坐标最小的节点从上述第一存储单元转移到上述第二存储单元中。
进一步地,上述装置还包括:第二判断单元,用于在上述各后置页面为中间访问页面时,且在将目标节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中之后,判断上述第二存储单元中是否存在横坐标与上述纵坐标最小的节点的横坐标相同的节点;第二删除单元,用于在判断结果为上述第二存储单元中存在横坐标与上述纵坐标最小的节点的横坐标相同的节点的情况下,从上述第二存储单元删除上述纵坐标最小的节点,其中,上述转移单元还用于将执行转移操作后的上述各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
在本发明实施例中,采用自动识别最短访问路径的方式,通过获取起始访问页面对应的访问源点,其中,访问源点的横坐标表示起始访问页面的标号,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离;获取起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从起始访问页面到达对应后置页面的路径距离;在各后置页面为终止访问页面时,将起始访问页面到各后置页面的路径都作为最短访问路径,达到了自动识别最短访问路径的目的,从而实现了操作步骤简单、工作效率高、出错率低的技术效果,进而解决了相关技术中由于用户手动确定最短访问路径造成的操作步骤繁琐、工作效率低、易出错的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的最短访问路径识别方法的流程图;
图2是根据本发明实施例的路径导航示意图;
图3是根据本发明实施例的一种可选的最短访问路径识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种最短访问路径识别方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的最短访问路径识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取起始访问页面对应的访问源点,其中,访问源点的横坐标表示起始访问页面的标号,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离;
步骤S104,获取起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从起始访问页面到达对应后置页面的路径距离;
步骤S106,当各后置页面为终止访问页面时,将起始访问页面到各后置页面的路径都作为最短访问路径。
需要说明的是,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离为0。每个网站一般都有多个网页,对于当前网页而言,它即可以有前置页面,也可以有后置页面。例如,用户访问页面A时,通过点击页面A中链接打开页面B,则页面A称为页面B的前置页面,页面B称为页面A的后置页面。
实施时,可以给网站上的每个页面标注标号,以示区别,同时预先设定每个前置页面到其后置页面的路径距离,这样,根据页面的标号和页面间的路径距离,将各页面映射为点。其中,起始访问页面映射为访问源点,终止访问页面映射为终点,中间访问页面映射为中间点。
例如,假设某网站的源点1映射为(1,0),其中,1表示源点1对应的起始访问页面1的标号,0表示从起始访问页面1到起始访问页面1的路径距离;此时,该网站的终止访问页面3、4、5分别映射为(3,76)、(4,83)、(5,31),其中,3、4、5分别表示对应页面的标号,76、83、31分别表示从起始访问页面1到页面3、4、5的路径距离;假设网页1的后置页面只有网页3、4、5,且网页3、4、5就是终止访问页面,那么使用本发明提供的技术方案,可以确定页面1到页面3的最短路径为1->3=76,页面1到页面4的最短路径为1->4=83,页面1到页面5的最短路径为1->5=31。
通过本发明实施例,可以实现自动识别最短访问路径的目的,从而达到操作步骤简单、工作效率高、出错率低的技术效果。
可选地,起始访问页面为第一起始访问页面,访问源点为第一访问源点,其中,将起始访问页面到各后置页面的路径都作为最短访问路径包括:将第一起始访问页面到各后置页面的路径都作为第一最短访问路径,在将第一起始访问页面到各后置页面的路径都作为最短访问路径之前,上述方法还包括:
S2,获取第二起始访问页面对应的第二访问源点;
S4,获取第二起始访问页面的各后置页面对应的节点;
S6,在各后置页面为终止访问页面时,将第二起始访问页面到各后置页面的路径都作为第二最短访问路径;
S8,确定第一最短访问路径和第二最短访问路径中的最短路径;
S10,将确定出的最短访问路径作为网站的最短路径。
也即,在某网站的起始访问页面包括多个的情况下,可以先确定每个起始访问页面到其各自的每个终止访问页面的最短访问路径,再比较不同的起始访问页面到同一个终止访问页面的最短访问路径的长短,并根据比较结果将不同的起始访问页面到同一个终止访问页面的路径中最短的作为网站的最短路径。
基于上述示例,假设某网站映射出来的源点除了上述源点1外,还包括源点2(2,0),其中,2表示源点2对应的起始访问页面2的标号,0表示从起始访问页面2到起始访问页面2的路径距离;此时,该网站的终止访问页面3、4、5分别映射为(3,50)、(4,19)、(5,12),其中,3、4、5分别表示对应页面的标号,50、19、12分别表示从起始访问页面2到页面3、4、5的路径距离;假设网页2的后置页面只有网页3、4、5,且网页3、4、5就是终止访问页面,那么使用本发明提供的技术方案,可以确定页面2到页面3的最短路径为2->3=50,页面2到页面4的最短路径为2->4=19,页面2到页面5的最短路径为2->5=12,由于页面1到页面3的最短路径为1->3=76,页面1到页面4的最短路径为1->4=83,页面1到页面5的最短路径为1->5=31,经比较发现,50<76、19<83,12<31,由此可见该网站的最短访问路径为2->5=12。
通过本发明实施例,在网站具有多个起始访问页面的情况下,可以通过比较各起始访问页面到终止访问页面的最短访问路径,最终实现识别网站的最短访问路径的目的。
可选地,上述方法还包括:
S12,当各后置页面为中间访问页面时,将目标节点从第一存储单元转移到第二存储单元中,其中,目标节点为各后置页面对应的节点中纵坐标最小的节点;
S14,确定目标节点的后置节点,其中,后置节点对应的页面是目标节点对应的页面的后置页面;
S16,将后置节点添加至第一存储单元中,其中,第一存储单元中还存储有各后置页面对应的节点中除目标节点之外的节点;
S18,依次从第一存储单元中选择并转移纵坐标最小的节点至第二存储单元中,同时将通过该节点能够到达的终止访问页面对应的节点添加至第一存储单元中,直到第一存储单元为空时,根据第二存储单元中各节点的横纵坐标确定起始访问页面到各节点对应访问页面的最小路径。
需要说明的是,第一存储单元可以是开启列表;第二存储单元可以是关闭列表。多数情况下,一个网站上的页面数目往往很多,此时从源点到终点,也即从起始访问页面到终止访问页面,往往需要经过起始访问页面的后置页面对应的中间点。
另外,为了便于存储和区分不同页面对应的节点,需要预先创建两个表,即开启列表和关闭列表。其中,开启列表用于存放所有等待检测的节点;关闭列表用于记录已经计算出最短路径的节点(这些节点为不再需要进行检测的节点)。
实施时,首先进行初始化处理,将源点放入开启列表,同时将关闭列表设置为空。程序执行过程中,依次从开启列表中选择路径距离最短的节点,并将该节点由开启列表转移到关闭列表中,同时将通过该节点能够到达的其他点添加至开启列表中,并计算这些节点的纵坐标,直到开启列表为空时,程序结束,此时,关闭列表中的节点即为源点到这些节点的最短路径。
通过本发明实施例,通过设置两个列表,可以便于区分不同页面节点,达到快速计算各节点到源点的最短路径的目的。
可选地,在当各后置页面为中间访问页面时,且在将目标节点从第一存储单元转移到第二存储单元中之前,上述方法还包括:
S20,判断第二存储单元中是否存在横坐标与纵坐标最小的节点的横坐标相同的节点;
S22,在判断结果为第二存储单元中存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,从第一存储单元删除纵坐标最小的节点,并将执行删除操作后的各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
也即,在将各后置页面对应的节点中纵坐标最小的节点从开启列表转移到关闭列表中之前,先确定关闭列表中是否存在横坐标与纵坐标最小的节点的横坐标相同的节点,再在存在的情况下直接将这个纵坐标最小的节点从开启列表删除,同时将纵坐标次小的节点(即执行删除操作后的各后置页面对应的节点中纵坐标最小的节点)从开启列表转移到关闭列表中,进而将与纵坐标次小的节点对应的中间访问页面的后置页面对应的节点添加至存放了各后置页面中除纵坐标次小的节点对应的页面之外其它后置页面对应的节点的开启列表中,并依次从开启列表中选择并转移纵坐标最小的节点至关闭列表中,同时将通过该节点能够到达的终止访问页面对应的节点添加至开启列表中,直到开启列表为空时,根据关闭列表中各节点的横纵坐标确定起始访问页面到各节点对应访问页面的最小路径。
另外,在判断结果为关闭列表中不存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,直接将该纵坐标最小的节点从开启列表转移至关闭列表中,并依此执行后续步骤。
可选地,在各后置页面为中间访问页面时,且在将目标节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中之后,上述方法还包括:
S24,判断第二存储单元中是否存在横坐标与纵坐标最小的节点的横坐标相同的节点;
S26,在判断结果为第二存储单元中存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,从第二存储单元删除纵坐标最小的节点,并将执行转移操作后的各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
也即,在关闭列表中存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,可以在将该纵坐标最小的节点转移至关闭列表之前或者之后执行删除操作,为删除操作提供了多种执行时机和执行途径。
以下结合图2所示的路径导航示意图,以具体实施例详细阐述本发明:
1.先计算以1为源点,到达其他各节点的距离:
表1-1
表1-2
开启列表 (5,31)(3,76)(4,83)
关闭列表 (1,0)
表1-3
开启列表 (8,57)(7,64)(3,76)(4,83)
关闭列表 (1,0)(5,31)
表1-4
开启列表 (7,64)(3,76)(4,83)(10,86)(9,134)
关闭列表 (1,0)(5,31)(8,57)
表1-5
开启列表 (3,76)(4,83)(10,84)(10,86)(9,134)(9,150)
关闭列表 (1,0)(5,31)(8,57)(7,64)
表1-6
开启列表 (4,83)(10,84)(10,86)(6,86)(7,99)(9,134)(9,150)
关闭列表 (1,0)(5,31)(8,57)(7,64)(3,76)
表1-7
表1-8
表1-9
表1-10
由上表可知,最终得到的网站最短路径为1->10=84。
2.先计算以2为源点,到达其他各节点的距离:
表2-1
开启列表 (2,0)
关闭列表
表2-2
开启列表 (5,12)(4,19)(3,50)
关闭列表 (2,0)
表2-3
开启列表 (4,19)(8,38)(7,45)(3,50)
关闭列表 (2,0)(5,12)
表2-4
开启列表 (8,38)(7,45)(3,50)(7,57)(8,72)(6,79)
关闭列表 (2,0)(5,12)(4,19)
表2-5
开启列表 (7,45)(3,50)(7,57)(10,67)(8,72)(6,79)(9,115)
关闭列表 (2,0)(5,12)(4,19)(8,38)
表2-6
表2-7
表2-8
表2-9
表2-10
由上表可知,最终得到的网站最短路径为2->10=65。
经比较1为源点和2为源点时网站的最短路径,可以得到2为源点的路径更短,因此最终确定的网站的最短路径为2->10=65。
实施例2
根据本发明实施例,提供了一种最短访问路径识别装置的装置实施例。
图3是根据本发明实施例的一种可选的最短访问路径识别装置的示意图,如图3所示,该装置包括:第一获取单元302,用于获取起始访问页面对应的访问源点,其中,访问源点的横坐标表示起始访问页面的标号,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离;第二获取单元304,用于获取起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从起始访问页面到达对应后置页面的路径距离;第一识别单元306,用于当各后置页面为终止访问页面时,将起始访问页面到各后置页面的路径都作为最短访问路径。
需要说明的是,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离为0。
每个网站一般都有多个网页,对于当前网页而言,它即可以有前置页面,也可以有后置页面。例如,用户访问页面A时,通过点击页面A中链接打开页面B,则页面A称为页面B的前置页面,页面B称为页面A的后置页面。
实施时,可以给网站上的每个页面标注标号,以示区别,同时预先设定每个前置页面到其后置页面的路径距离,这样,根据页面的标号和页面间的路径距离,将各页面映射为点。其中,起始访问页面映射为访问源点,终止访问页面映射为终点,中间访问页面映射为中间点。
例如,假设某网站的源点1映射为(1,0),其中,1表示源点1对应的起始访问页面1的标号,0表示从起始访问页面1到起始访问页面1的路径距离;此时,该网站的终止访问页面3、4、5分别映射为(3,76)、(4,83)、(5,31),其中,3、4、5分别表示对应页面的标号,76、83、31分别表示从起始访问页面1到页面3、4、5的路径距离;假设网页1的后置页面只有网页3、4、5,且网页3、4、5就是终止访问页面,那么使用本发明提供的技术方案,可以确定页面1到页面3的最短路径为1->3=76,页面1到页面4的最短路径为1->4=83,页面1到页面5的最短路径为1->5=31。
通过本发明实施例,可以实现自动识别最短访问路径的目的,从而达到操作步骤简单、工作效率高、出错率低的技术效果。
可选地,起始访问页面为第一起始访问页面,访问源点为第一访问源点,其中,第一识别单元还用于将第一起始访问页面到各后置页面的路径都作为第一最短访问路径,上述装置还包括:第三获取单元,用于在将第一起始访问页面到各后置页面的路径都作为最短访问路径之前,获取第二起始访问页面对应的第二访问源点;第四获取单元,用于获取第二起始访问页面的各后置页面对应的节点;第二识别单元还用于在各后置页面为终止访问页面时,将第二起始访问页面到各后置页面的路径都作为第二最短访问路径;第一确定单元,用于确定第一最短访问路径和第二最短访问路径中的最短路径;第三识别单元,用于将确定出的最短访问路径作为网站的最短路径。
也即,在某网站的起始访问页面包括多个的情况下,可以先确定每个起始访问页面到其各自的每个终止访问页面的最短访问路径,再比较不同的起始访问页面到同一个终止访问页面的最短访问路径的长短,并根据比较结果将不同的起始访问页面到同一个终止访问页面的路径中最短的作为网站的最短路径。
基于上述示例,假设某网站映射出来的源点除了上述源点1外,还包括源点2(2,0),其中,2表示源点2对应的起始访问页面2的标号,0表示从起始访问页面2到起始访问页面2的路径距离;此时,该网站的终止访问页面3、4、5分别映射为(3,50)、(4,19)、(5,12),其中,3、4、5分别表示对应页面的标号,50、19、12分别表示从起始访问页面2到页面3、4、5的路径距离;假设网页2的后置页面只有网页3、4、5,且网页3、4、5就是终止访问页面,那么使用本发明提供的技术方案,可以确定页面2到页面3的最短路径为2->3=50,页面2到页面4的最短路径为2->4=19,页面2到页面5的最短路径为2->5=12,由于页面1到页面3的最短路径为1->3=76,页面1到页面4的最短路径为1->4=83,页面1到页面5的最短路径为1->5=31,经比较发现,50<76、19<83,12<31,由此可见该网站的最短访问路径为2->5=12。
通过本发明实施例,在网站具有多个起始访问页面的情况下,可以通过比较各起始访问页面到终止访问页面的最短访问路径,最终实现识别网站的最短访问路径的目的。
可选地,上述装置还包括:转移单元,用于当各后置页面为中间访问页面时,将目标节点从第一存储单元转移到第二存储单元中,其中,目标节点为各后置页面对应的节点中纵坐标最小的节点;第二确定单元,用于确定目标节点的后置节点,其中,后置节点对应的页面是目标节点对应的页面的后置页面;添加单元,用于将后置节点添加至第一存储单元中,其中,第一存储单元中还存储有各后置页面对应的节点中除目标节点之外的节点;第四识别单元,,用于依次从第一存储单元中选择并转移纵坐标最小的节点至第二存储单元中,同时将通过该节点能够到达的终止访问页面对应的节点添加至第一存储单元中,直到第一存储单元为空时,根据第二存储单元中各节点的横纵坐标确定起始访问页面到各节点对应访问页面的最小路径。
需要说明的是,第一存储单元可以是开启列表;第二存储单元可以是关闭列表。
多数情况下,一个网站上的页面数目往往很多,此时从源点到终点,也即从起始访问页面到终止访问页面,往往需要经过起始访问页面的后置页面对应的中间点。
另外,为了便于存储和区分不同页面对应的节点,需要预先创建两个表,即开启列表和关闭列表。其中,开启列表用于存放所有等待检测的节点;关闭列表用于记录已经计算出最短路径的节点(这些节点为不再需要进行检测的节点)。
实施时,首先进行初始化处理,将源点放入开启列表,同时将关闭列表设置为空。程序执行过程中,依次从开启列表中选择路径距离最短的节点,并将该节点由开启列表转移到关闭列表中,同时将通过该节点能够到达的其他点添加至开启列表中,并计算这些节点的纵坐标,直到开启列表为空时,程序结束,此时,关闭列表中的节点即为源点到这些节点的最短路径。
通过本发明实施例,通过设置两个列表,可以便于区分不同页面节点,达到快速计算各节点到源点的最短路径的目的。
可选地,上述装置还包括:第一判断单元,用于在当各后置页面为中间访问页面时,且在目标节点从第一存储单元转移到第二存储单元中之前,判断第二存储单元中是否存在横坐标与纵坐标最小的节点的横坐标相同的节点;第一删除单元,用于在判断结果为第二存储单元中存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,从第一存储单元删除纵坐标最小的节点,其中,转移单元还用于将执行删除操作后的各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
也即,在将各后置页面对应的节点中纵坐标最小的节点从开启列表转移到关闭列表中之前,先确定关闭列表中是否存在横坐标与纵坐标最小的节点的横坐标相同的节点,再在存在的情况下直接将这个纵坐标最小的节点从开启列表删除,同时将纵坐标次小的节点(即执行删除操作后的各后置页面对应的节点中纵坐标最小的节点)从开启列表转移到关闭列表中,进而将与纵坐标次小的节点对应的中间访问页面的后置页面对应的节点添加至存放了各后置页面中除纵坐标次小的节点对应的页面之外其它后置页面对应的节点的开启列表中,并依次从开启列表中选择并转移纵坐标最小的节点至关闭列表中,同时将通过该节点能够到达的终止访问页面对应的节点添加至开启列表中,直到开启列表为空时,根据关闭列表中各节点的横纵坐标确定起始访问页面到各节点对应访问页面的最小路径。
另外,在判断结果为关闭列表中不存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,直接将该纵坐标最小的节点从开启列表转移至关闭列表中,并依此执行后续步骤。
可选地,上述装置还包括:第二判断单元,用于在各后置页面为中间访问页面时,且在将目标节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中之后,判断第二存储单元中是否存在横坐标与纵坐标最小的节点的横坐标相同的节点;第二删除单元,用于在判断结果为第二存储单元中存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,从第二存储单元删除纵坐标最小的节点,其中,转移单元还用于将执行转移操作后的各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
也即,在关闭列表中存在横坐标与纵坐标最小的节点的横坐标相同的节点的情况下,可以在将该纵坐标最小的节点转移至关闭列表之前或者之后执行删除操作,为删除操作提供了多种执行时机和执行途径。
上述最短访问路径识别装置包括处理器和存储器,上述第一获取单元、第二获取单元、第一识别单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解析文本内容。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取起始访问页面对应的访问源点,其中,访问源点的横坐标表示起始访问页面的标号,访问源点的纵坐标表示从起始访问页面到达起始访问页面的路径距离;获取起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从起始访问页面到达对应后置页面的路径距离;在各后置页面为终止访问页面时,将起始访问页面到各后置页面的路径都作为最短访问路径。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种最短访问路径识别方法,其特征在于,包括:
获取起始访问页面对应的访问源点,其中,所述访问源点的横坐标表示所述起始访问页面的标号,所述访问源点的纵坐标表示从所述起始访问页面到达所述起始访问页面的路径距离;
获取所述起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从所述起始访问页面到达对应后置页面的路径距离;
当所述各后置页面为终止访问页面时,将所述起始访问页面到所述各后置页面的路径都作为最短访问路径。
2.根据权利要求1所述的方法,其特征在于,所述起始访问页面为第一起始访问页面,所述访问源点为第一访问源点,其中,
将所述起始访问页面到所述各后置页面的路径都作为最短访问路径包括:将所述第一起始访问页面到所述各后置页面的路径都作为第一最短访问路径,
在将所述第一起始访问页面到所述各后置页面的路径都作为最短访问路径之前,所述方法还包括:
获取第二起始访问页面对应的第二访问源点;
获取所述第二起始访问页面的各后置页面对应的节点;
在所述各后置页面为终止访问页面时,将所述第二起始访问页面到所述各后置页面的路径都作为第二最短访问路径;
确定所述第一最短访问路径和所述第二最短访问路径中的最短路径;
将确定出的最短访问路径作为网站的最短路径。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述各后置页面为中间访问页面时,将目标节点从第一存储单元转移到第二存储单元中,其中,所述目标节点为所述各后置页面对应的节点中纵坐标最小的节点;
确定所述目标节点的后置节点,其中,所述后置节点对应的页面是所述目标节点对应的页面的后置页面;
将所述后置节点添加至所述第一存储单元中,其中,所述第一存储单元中还存储有所述各后置页面对应的节点中除所述目标节点之外的节点;
依次从所述第一存储单元中选择并转移纵坐标最小的节点至所述第二存储单元中,同时将通过该节点能够到达的终止访问页面对应的节点添加至所述第一存储单元中,直到所述第一存储单元为空时,根据所述第二存储单元中各节点的横纵坐标确定所述起始访问页面到所述各节点对应访问页面的最小路径。
4.根据权利要求3所述的方法,其特征在于,在当所述各后置页面为中间访问页面时,且在将目标节点从第一存储单元转移到第二存储单元中之前,所述方法还包括:
判断所述第二存储单元中是否存在横坐标与所述纵坐标最小的节点的横坐标相同的节点;
在判断结果为所述第二存储单元中存在横坐标与所述纵坐标最小的节点的横坐标相同的节点的情况下,从所述第一存储单元删除所述纵坐标最小的节点,并将执行删除操作后的所述各后置页面对应的节点中纵坐标最小的节点从所述第一存储单元转移到所述第二存储单元中。
5.根据权利要求3所述的方法,其特征在于,在所述各后置页面为中间访问页面时,且在将目标节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中之后,所述方法还包括:
判断所述第二存储单元中是否存在横坐标与所述纵坐标最小的节点的横坐标相同的节点;
在判断结果为所述第二存储单元中存在横坐标与所述纵坐标最小的节点的横坐标相同的节点的情况下,从所述第二存储单元删除所述纵坐标最小的节点,并将执行转移操作后的所述各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
6.一种最短访问路径识别装置,其特征在于,包括:
第一获取单元,用于获取起始访问页面对应的访问源点,其中,所述访问源点的横坐标表示所述起始访问页面的标号,所述访问源点的纵坐标表示从所述起始访问页面到达所述起始访问页面的路径距离;
第二获取单元,用于获取所述起始访问页面的各后置页面对应的节点,其中,每个节点的横坐标表示对应后置页面的标号,每个节点的纵坐标表示从所述起始访问页面到达对应后置页面的路径距离;
第一识别单元,用于当所述各后置页面为终止访问页面时,将所述起始访问页面到所述各后置页面的路径都作为最短访问路径。
7.根据权利要求6所述的装置,其特征在于,所述起始访问页面为第一起始访问页面,所述访问源点为第一访问源点,其中,
第一识别单元还用于将所述第一起始访问页面到所述各后置页面的路径都作为第一最短访问路径,
所述装置还包括:
第三获取单元,用于在将所述第一起始访问页面到所述各后置页面的路径都作为最短访问路径之前,获取第二起始访问页面对应的第二访问源点;
第四获取单元,用于获取所述第二起始访问页面的各后置页面对应的节点;
第二识别单元还用于在所述各后置页面为终止访问页面时,将所述第二起始访问页面到所述各后置页面的路径都作为第二最短访问路径;
第一确定单元,用于确定所述第一最短访问路径和所述第二最短访问路径中的最短路径;
第三识别单元,用于将确定出的最短访问路径作为网站的最短路径。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
转移单元,用于当所述各后置页面为中间访问页面时,将目标节点从第一存储单元转移到第二存储单元中,其中,所述目标节点为所述各后置页面对应的节点中纵坐标最小的节点;
第二确定单元,用于确定所述目标节点的后置节点,其中,所述后置节点对应的页面是所述目标节点对应的页面的后置页面;
添加单元,用于将所述后置节点添加至所述第一存储单元中,其中,所述第一存储单元中还存储有所述各后置页面对应的节点中除所述目标节点之外的节点;
第四识别单元,用于依次从所述第一存储单元中选择并转移纵坐标最小的节点至所述第二存储单元中,同时将通过该节点能够到达的终止访问页面对应的节点添加至所述第一存储单元中,直到所述第一存储单元为空时,根据所述第二存储单元中各节点的横纵坐标确定所述起始访问页面到所述各节点对应访问页面的最小路径。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一判断单元,用于在当所述各后置页面为中间访问页面时,且在目标节点从第一存储单元转移到第二存储单元中之前,判断所述第二存储单元中是否存在横坐标与所述纵坐标最小的节点的横坐标相同的节点;
第一删除单元,用于在判断结果为所述第二存储单元中存在横坐标与所述纵坐标最小的节点的横坐标相同的节点的情况下,从所述第一存储单元删除所述纵坐标最小的节点,
其中,所述转移单元还用于将执行删除操作后的所述各后置页面对应的节点中纵坐标最小的节点从所述第一存储单元转移到所述第二存储单元中。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二判断单元,用于在所述各后置页面为中间访问页面时,且在将目标节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中之后,判断所述第二存储单元中是否存在横坐标与所述纵坐标最小的节点的横坐标相同的节点;
第二删除单元,用于在判断结果为所述第二存储单元中存在横坐标与所述纵坐标最小的节点的横坐标相同的节点的情况下,从所述第二存储单元删除所述纵坐标最小的节点,
其中,所述转移单元还用于将执行转移操作后的所述各后置页面对应的节点中纵坐标最小的节点从第一存储单元转移到第二存储单元中。
CN201511031384.4A 2015-12-31 2015-12-31 最短访问路径识别方法及装置 Active CN106933896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511031384.4A CN106933896B (zh) 2015-12-31 2015-12-31 最短访问路径识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511031384.4A CN106933896B (zh) 2015-12-31 2015-12-31 最短访问路径识别方法及装置

Publications (2)

Publication Number Publication Date
CN106933896A true CN106933896A (zh) 2017-07-07
CN106933896B CN106933896B (zh) 2021-06-22

Family

ID=59444119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511031384.4A Active CN106933896B (zh) 2015-12-31 2015-12-31 最短访问路径识别方法及装置

Country Status (1)

Country Link
CN (1) CN106933896B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933895A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 最短访问路径识别方法及装置
CN108093072A (zh) * 2017-12-27 2018-05-29 广州品唯软件有限公司 站内访问路径的获取方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755682A (zh) * 2004-09-30 2006-04-05 微软公司 使用点击距离对搜索结果分级的系统和方法
CN102054004A (zh) * 2009-11-04 2011-05-11 清华大学 一种网页推荐方法和装置
CN103281303A (zh) * 2013-04-28 2013-09-04 乐视网信息技术(北京)股份有限公司 一种获取数据的方法和设备
CN103823883A (zh) * 2014-03-06 2014-05-28 焦点科技股份有限公司 一种网站用户访问路径的分析方法及系统
CN104123321A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种确定推荐图片的方法及装置
US20150169601A1 (en) * 2012-11-01 2015-06-18 Tencent Technology (Shenzhen) Company Limited Method and apparatus for storing webpage access records
US20150227587A1 (en) * 2014-02-10 2015-08-13 Tibero Co., Ltd. Method and apparatus for searching node by using tree index

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755682A (zh) * 2004-09-30 2006-04-05 微软公司 使用点击距离对搜索结果分级的系统和方法
CN102054004A (zh) * 2009-11-04 2011-05-11 清华大学 一种网页推荐方法和装置
US20150169601A1 (en) * 2012-11-01 2015-06-18 Tencent Technology (Shenzhen) Company Limited Method and apparatus for storing webpage access records
CN103281303A (zh) * 2013-04-28 2013-09-04 乐视网信息技术(北京)股份有限公司 一种获取数据的方法和设备
CN104123321A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种确定推荐图片的方法及装置
US20150227587A1 (en) * 2014-02-10 2015-08-13 Tibero Co., Ltd. Method and apparatus for searching node by using tree index
CN103823883A (zh) * 2014-03-06 2014-05-28 焦点科技股份有限公司 一种网站用户访问路径的分析方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933895A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 最短访问路径识别方法及装置
CN106933895B (zh) * 2015-12-31 2020-02-07 北京国双科技有限公司 最短访问路径识别方法及装置
CN108093072A (zh) * 2017-12-27 2018-05-29 广州品唯软件有限公司 站内访问路径的获取方法、装置及存储介质
CN108093072B (zh) * 2017-12-27 2021-10-01 广州品唯软件有限公司 站内访问路径的获取方法、装置及存储介质

Also Published As

Publication number Publication date
CN106933896B (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN103189836B (zh) 用于对图数据流中的对象分类的方法
CN110473083B (zh) 树状风险账户识别方法、装置、服务器及存储介质
CN106951925A (zh) 数据处理方法、装置、服务器及系统
CN104391951B (zh) 网页热力图的加载方法和装置
CN105893349A (zh) 类目标签匹配映射方法及装置
CN106708841B (zh) 网站访问路径的聚合方法和装置
CN106815226A (zh) 文本匹配方法和装置
CN105306495B (zh) 用户识别方法和装置
CN109951846A (zh) 无线网络识别方法、装置、存储介质及计算机设备
CN106936778A (zh) 网站流量异常的检测方法和装置
CN110019519A (zh) 数据处理方法、装置、存储介质和电子装置
CN107908432A (zh) 应用程序的配置方法及装置、终端设备及可读存储介质
CN108346098A (zh) 一种风控规则挖掘的方法及装置
CN109117475A (zh) 一种文本改写的方法以及相关设备
CN104462061B (zh) 词语提取方法及提取装置
CN106933896A (zh) 最短访问路径识别方法及装置
CN109697281A (zh) 在线合并文档的方法、装置及电子设备
CN108170805A (zh) 一种数据表比较方法、装置、电子设备及可读存储介质
CN103957012B (zh) 一种dfa矩阵的压缩方法及装置
CN109753552A (zh) 家族成员的称谓确定方法、系统、计算机设备及存储介质
CN106130880A (zh) 网络邮件数据的搜集方法及系统
CN106169974A (zh) 本地邮件数据的搜集方法及系统
CN110401626A (zh) 一种黑客攻击分级检测方法及装置
CN109992960A (zh) 一种伪造参数检测方法、装置、电子设备及存储介质
CN110110182A (zh) 一种适用于批量爬取的数据采集方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant