CN111104600B - 一种web站点网页推荐方法、装置、设备、介质 - Google Patents

一种web站点网页推荐方法、装置、设备、介质 Download PDF

Info

Publication number
CN111104600B
CN111104600B CN201911337779.5A CN201911337779A CN111104600B CN 111104600 B CN111104600 B CN 111104600B CN 201911337779 A CN201911337779 A CN 201911337779A CN 111104600 B CN111104600 B CN 111104600B
Authority
CN
China
Prior art keywords
webpage
web
pheromone
web site
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911337779.5A
Other languages
English (en)
Other versions
CN111104600A (zh
Inventor
张欢
范渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DBAPPSecurity Co Ltd
Original Assignee
DBAPPSecurity Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DBAPPSecurity Co Ltd filed Critical DBAPPSecurity Co Ltd
Priority to CN201911337779.5A priority Critical patent/CN111104600B/zh
Publication of CN111104600A publication Critical patent/CN111104600A/zh
Application granted granted Critical
Publication of CN111104600B publication Critical patent/CN111104600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Remote Sensing (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种WEB站点网页推荐方法、装置、设备、介质,该方法包括:当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。

Description

一种WEB站点网页推荐方法、装置、设备、介质
技术领域
本申请涉及WEB技术领域,特别涉及一种WEB站点网页推荐方法、装置、设备、介质。
背景技术
随着Web站点自身信息越来越丰富和拓扑结构越来越复杂,目前信息服务中普遍存在着“信息过载”和“资源迷向”的状况。从用户的角度,不同的用户有不同的访问目的,而同一个用户在不同时期的访问兴趣也可能会发生变化。对网站来说,只有迅速满足用户的访问需求,提高信息服务质量,才能创造更大的经济效益。为了解决来自用户和网站双方面的问题,自适应网站应运而生,它通过学习用户访问模式,呈现不同的界面给不同的用户并且完善网站自身拓扑结构。目前,WEB站点进行网页推荐的方法主要是,首先进行WEB站点日志挖掘,再利用一般的蚂蚁算法,确定出相应的最优路径,然后根据最优路径进行网页推荐,这样在确定最优路径的时候需要进行许多轮,每轮中又包括多条路径,会消耗较长时间,降低网页推荐效率,影响用户体验。
发明内容
有鉴于此,本申请的目的在于提供一种WEB站点网页推荐方法、装置、设备、介质,能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。其具体方案如下:
第一方面,本申请公开了一种WEB站点网页推荐方法,包括:
当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;
根据所述访问日志,确定所述访问日志对应的目标网页;
基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;
根据所述最优路径,进行所述WEB站点的网页推荐。
可选的,所述基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径,包括:
A01:每隔预设时长有一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径,其中,所述网页跳转概率为在网页i选择下一个网页j的概率;
A02:确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素;
A03:若当前已有路径数量等于预设每轮路径数量,则根据本轮路径中所有路径的长度,将最短长度对应的路径确定出本轮最优路径,并根据本轮最优路径长度,确定精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,其中,所述精英蚂蚁为找到所述本轮最优路径的蚂蚁;
A04:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率;
重新执行步骤A01,直至当前轮数等于预设最大轮数或在一轮路径中的每条路径均相同,则确定出从所述WEB站点首页到达所述目标网页的最优路径。
可选的,所述每隔预设时长有一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径之前,还包括:
获取所述WEB站点的历史日志;
对所述历史日志进行日志挖掘,确定网页跳转概率初始值;
配置所述预设时长、所述预设每轮路径数量、所述预设最大轮数以及所述WEB站点中各个网页的信息素初始值。
可选的,所述确定所述蚂蚁经过所述路径上各个网页释放的第一信息素,包括:
根据第一预设公式确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素,其中,所述第一预设公式为:
Figure BDA0002331426820000021
其中,Δτi(k)表示蚂蚁k经过网页i时释放的第一信息素,di表示网页i距离所述目标网页的距离,预设路径中相邻两个网页之间的距离为1。
可选的,所述根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率,包括:
根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素;
根据所述更新后信息素更新所述网页跳转概率。
可选的,所述根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素,包括:
根据所述第一信息素、所述第二信息素和第二预设公式,更新所述WEB站点中所有网页的信息素,得到更新后信息素,其中,所述第二预设公式为:
Figure BDA0002331426820000031
其中,τi′表示网页i的更新后信息素,ρ表示信息素的挥发度,n表示经过网页i的蚂蚁总数,τi表示本轮路径开始前网页i的信息素,Δτi *表示精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,σ表示精英蚂蚁数量,Lgb本轮最优路径长度。
可选的,所述根据所述更新后信息素更新所述网页跳转概率,包括:
根据所述更新后信息素和第三预设公式更新所述网页跳转概率,其中,所述第三预设公式为:
Figure BDA0002331426820000032
其中,pij′表示更新后的网页跳转概率,Ni表示与网页i直接相邻的所有网页,m表示与网页i直接相邻的网页总数,α表示信息素浓度权重,β表示启发性因素权重,ltj表示蚂蚁向网页j发起请求到获得网页j所耗时间,vtj表示蚂蚁在网页j停留的时间。
第二方面,本申请公开了一种WEB站点网页推荐装置,包括:
数据获取模块,用于当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;
目标网页确定模块,用于根据所述访问日志,确定所述访问日志对应的目标网页;
最优路径确定模块,用于基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;
网页推荐模块,用于根据所述最优路径,进行所述WEB站点的网页推荐。
第三方面,本申请公开了一种WEB站点网页推荐设备,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现前述公开的WEB站点网页推荐方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的WEB站点网页推荐方法。
可见,本申请当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。由此可见,本申请在获取到相应的访问日志和WEB站点的站点拓扑结构之后,根据所述访问日志确定出所述访问日志对应的目标网页,再基于带精英策略的蚂蚁算法,确定出从WEB站点首页到达所述目标网页的最优路径,并根据所述最优路径进行WEB站点的网页推荐,这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种WEB站点网页推荐方法流程图;
图2为本申请公开的一种WEB站点的站点拓扑结构图;
图3为本申请公开的一种WEB站点网页推荐方法的子流程图;
图4为本申请公开的一种WEB日志挖掘流程图;
图5为本申请公开的一种WEB站点网页推荐装置结构示意图;
图6为本申请公开的一种WEB站点网页推荐设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,WEB站点进行网页推荐的方法主要是,首先进行WEB站点日志挖掘,再利用一般的蚂蚁算法,确定出相应的最优路径,然后根据最优路径进行网页推荐,这样在确定最优路径的时候需要进行许多轮,每轮中又包括多条路径,会消耗较长时间,降低网页推荐效率,影响用户体验。有鉴于此,本申请提出了一种WEB站点网页推荐方法,能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
本申请实施例公开了一种WEB站点网页推荐方法,参见图1所示,该方法包括:
步骤S11:当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构。
本实施例中,需要在WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构,以便确定目标网页和相应的最优路径。参见图2所示,为WEB站点的站点拓扑结构。WEB站点的站点拓扑结构可以通过一个二元图(N,E)进行描述,其中N是节点集合,每一个节点代表一个网页,E是节点之间链接。
步骤S12:根据所述访问日志,确定所述访问日志对应的目标网页。
在具体的实施过程中,在获取到所述访问日志之后,需要根据所述访问日志确定对应的目标网页,以便确定从所述WEB站点首页到所述目标网页的最优路径。
步骤S13:基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径。
本实施例中,在确定出所述目标网页之后,需要基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径。所述蚁群算法是一种源于大自然中生物世界的新的仿生类进化算法,也是求解适应性计算问题的一种算法。该算法模仿蚂蚁觅食时的行为,按照启发式思想,通过信息素的诱导作用,逐步收敛到问题的全局最优解。所述精英策略指的是每次循环之后给予当前最优解以额外的信息素量,并最终确定出全局最优解,找出所述全局最优解的蚂蚁被称为精英蚂蚁。与传统蚁群算法相比,带精英策略的蚁群算法确定出所述最优路径所消耗的时间可以大大缩短。
参见图3所示,为一种WEB站点网页推荐方法的子流程图。所述基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径,包括:
A01:每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径,其中,所述网页跳转概率为在网页i选择下一个网页j的概率;
A02:确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素;
A03:若当前已有路径数量等于预设每轮路径数量,则根据本轮路径中所有路径的长度,将最短长度对应的路径确定出本轮最优路径,并根据本轮最优路径长度,确定精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,其中,所述精英蚂蚁为找到所述本轮最优路径的蚂蚁;
A04:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率;
重新执行步骤A01,直至当前轮数等于预设最大轮数或在一轮路径中的每条路径均相同,则确定出从所述WEB站点首页到达所述目标网页的最优路径。
具体的,所述每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径,其中,所述网页跳转概率为在网页i选择下一个网页j的概率,包括:每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和所述网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径。所述根据轮盘赌方式和所述网页跳转概率选择下一个跳转网页,包括:预设群体大小为N,将所述网页跳转概率作为相应个体xi的选择概率P(xi),其中,一个个体为一个网页;根据预设累计概率计算公式确定每个个体的累计概率qi;在[0,1]内产生一个均匀分布的随机数r;若r<q1,则选择个体1,否则,选择个体k,使得qk-1<r≤qk成立;其中,所述预设累计概率计算公式为:
Figure BDA0002331426820000071
例如,与当前网页1直接相连的网页包括网页2、网页3、网页4以及网页4,网页1跳转到网页2的网页跳转概率为0.2,网页1跳转到网页3的网页跳转概率为0.3,网页1跳转到网页4的网页跳转概率为0.4,网页1跳转到网页5的网页跳转概率为0.1,则网页1跳转到网页2的累计概率为0.2,网页1跳转到网页3的累计概率为0.5,网页1跳转到网页4的累计概率为0.9,网页1跳转到网页5的累计概率为1,生成一个随机数为0.8,则得到0.5<0.8<0.9,故选择网页4作为在网页1时候的下一个跳转网页。
在具体的实施过程中,所述确定所述蚂蚁经过所述路径上各个网页释放的第一信息素,包括:根据第一预设公式确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素,其中,所述第一预设公式为:
Figure BDA0002331426820000072
其中,Δτi(k)表示蚂蚁k经过网页i时释放的第一信息素,di表示网页i距离所述目标网页的距离,预设路径中相邻两个网页之间的距离为1。也即,所述蚂蚁经过所述路径上各个网页时释放的第一信息素等于当前网页到所述目标网页的距离的倒数,预设路径中相邻两个页面之间的距离为1。
具体的,所述根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率,包括:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素;根据所述更新后信息素更新所述网页跳转概率。其中,所述根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素,包括:根据所述第一信息素、所述第二信息素和第二预设公式,更新所述WEB站点中所有网页的信息素,得到更新后信息素,其中,所述第二预设公式为:
Figure BDA0002331426820000081
其中,τi′表示网页i的更新后信息素,ρ表示信息素的挥发度,n表示经过网页i的蚂蚁总数,τi表示本轮路径开始前网页i的信息素,Δτi *表示精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,σ表示精英蚂蚁数量,Lgb本轮最优路径长度,ρ需要满足0<ρ≤1。所述根据所述更新后信息素更新所述网页跳转概率,包括:根据所述更新后信息素和第三预设公式更新所述网页跳转概率,其中,所述第三预设公式为:
Figure BDA0002331426820000082
其中,pij′表示更新后的网页跳转概率,Ni表示与网页i直接相邻的所有网页,m表示与网页i直接相邻的网页总数,α表示信息素浓度权重,β表示启发性因素权重,ltj表示蚂蚁向网页j发起请求到获得网页j所耗时间,vtj表示蚂蚁在网页j停留的时间,α的取值区间为[1,2],β的取值区间为[2,5]。在更新所述网页跳转概率之后,将更新后的网页跳转概率作为网页新的选择概率。
在具体的实施过程中,所述每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径之前,还包括:获取所述WEB站点的历史日志;对所述历史日志进行日志挖掘,确定网页跳转概率初始值;配置所述预设时长、所述预设每轮路径数量、所述预设最大轮数以及所述WEB站点中各个网页的信息素初始值。也即,在由蚂蚁开始从所述WEB站点首页搜索所述目标网页之前,需要先获取所述WEB站点的历史日志,并对所述历史日志进行日志挖掘,确定网页跳转概率初始值,再配置所述预设时长、所述预设每轮路径数量、所述预设最大轮数以及所述WEB站点中各个网页的信息素初始值。参见图4所示,为WEB日志挖掘流程图。所述日志挖掘分为预处理阶段、挖掘算法实施阶段和模式分析阶段。对原始日志文件、站点文件进行预处理,得到用户会话文件,利用挖掘算法对所述用户会话文件进行处理,得到相应的规则、模式以及汇总,再加上所述站点文件通过模式分析得到感兴趣的规则、模式以及汇总。其中,预处理阶段的主要任务是对存储在各种数据源中纷繁复杂的Web数据进行选择、过滤并转换为挖掘算法实施阶段所需的数据形式。挖掘算法实施阶段主要是运用各种算法对已净化的数据进行挖掘,从中得到各种模式,如用户通常访问路径、页面聚类结果等,模式分析阶段则对已产生的模式进行分析、综合、过滤掉无意义的模式,并显示最终的结果。
步骤S14:根据所述最优路径,进行所述WEB站点的网页推荐。
可以理解的是,在确定出所述最优路径之后,需要根据所述最优路径进行所述WEB站点的网页推荐,以便用户可以通过最短路径快速到达所述目标网页。
可见,本申请当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。由此可见,本申请在获取到相应的访问日志和WEB站点的站点拓扑结构之后,根据所述访问日志确定出所述访问日志对应的目标网页,再基于带精英策略的蚂蚁算法,确定出从WEB站点首页到达所述目标网页的最优路径,并根据所述最优路径进行WEB站点的网页推荐,这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
参见图5所示,本申请实施例公开了一种WEB站点网页推荐装置,包括:
数据获取模块11,用于当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;
目标网页确定模块12,用于根据所述访问日志,确定所述访问日志对应的目标网页;
最优路径确定模块13,用于基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;
网页推荐模块14,用于根据所述最优路径,进行所述WEB站点的网页推荐。
可见,本申请当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。由此可见,本申请在获取到相应的访问日志和WEB站点的站点拓扑结构之后,根据所述访问日志确定出所述访问日志对应的目标网页,再基于带精英策略的蚂蚁算法,确定出从WEB站点首页到达所述目标网页的最优路径,并根据所述最优路径进行WEB站点的网页推荐,这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
进一步的,参见图6所示,本申请实施例还公开了一种WEB站点网页推荐设备,包括:处理器21和存储器22。
其中,所述存储器22,用于存储计算机程序;所述处理器21,用于执行所述计算机程序,以实现前述实施例中公开的WEB站点网页推荐方法。
其中,关于上述WEB站点网页推荐方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现以下步骤:
当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。
可见,本申请当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。由此可见,本申请在获取到相应的访问日志和WEB站点的站点拓扑结构之后,根据所述访问日志确定出所述访问日志对应的目标网页,再基于带精英策略的蚂蚁算法,确定出从WEB站点首页到达所述目标网页的最优路径,并根据所述最优路径进行WEB站点的网页推荐,这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:A01:每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径,其中,所述网页跳转概率为在网页i选择下一个网页j的概率;A02:确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素;A03:若当前已有路径数量等于预设每轮路径数量,则根据本轮路径中所有路径的长度,将最短长度对应的路径确定出本轮最优路径,并根据本轮最优路径长度,确定精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,其中,所述精英蚂蚁为找到所述本轮最优路径的蚂蚁;A04:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率;重新执行步骤A01,直至当前轮数等于预设最大轮数或在一轮路径中的每条路径均相同,则确定出从所述WEB站点首页到达所述目标网页的最优路径。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:获取所述WEB站点的历史日志;对所述历史日志进行日志挖掘,确定网页跳转概率初始值;配置所述预设时长、所述预设每轮路径数量、所述预设最大轮数以及所述WEB站点中各个网页的信息素初始值。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:根据第一预设公式确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素,其中,所述第一预设公式为:
Figure BDA0002331426820000121
其中,Δτi(k)表示蚂蚁k经过网页i时释放的第一信息素,di表示网页i距离所述目标网页的距离,预设路径中相邻两个网页之间的距离为1。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素;根据所述更新后信息素更新所述网页跳转概率。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:根据所述第一信息素、所述第二信息素和第二预设公式,更新所述WEB站点中所有网页的信息素,得到更新后信息素,其中,所述第二预设公式为:
Figure BDA0002331426820000122
其中,τi′表示网页i的更新后信息素,ρ表示信息素的挥发度,n表示经过网页i的蚂蚁总数,τi表示本轮路径开始前网页i的信息素,Δτi *表示精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,σ表示精英蚂蚁数量,Lgb本轮最优路径长度。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:根据所述更新后信息素和第三预设公式更新所述网页跳转概率,其中,所述第三预设公式为:
Figure BDA0002331426820000123
其中,pij′表示更新后的网页跳转概率,Ni表示与网页i直接相邻的所有网页,m表示与网页i直接相邻的网页总数,α表示信息素浓度权重,β表示启发性因素权重,ltj表示蚂蚁向网页j发起请求到获得网页j所耗时间,vtj表示蚂蚁在网页j停留的时间。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得一系列包含其他要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种WEB站点网页推荐方法、装置、设备、介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种WEB站点网页推荐方法,其特征在于,包括:
当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;
根据所述访问日志,确定所述访问日志对应的目标网页;
基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;
根据所述最优路径,进行所述WEB站点的网页推荐;
其中,所述基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径,包括:
A01:每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径,其中,所述网页跳转概率为在网页i选择下一个网页j的概率;
A02:确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素;
A03:若当前已有路径数量等于预设每轮路径数量,则根据本轮路径中所有路径的长度,将最短长度对应的路径确定出本轮最优路径,并根据本轮最优路径长度,确定精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,其中,所述精英蚂蚁为找到所述本轮最优路径的蚂蚁;
A04:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率;
重新执行步骤A01,直至当前轮数等于预设最大轮数或在一轮路径中的每条路径均相同,则确定出从所述WEB站点首页到达所述目标网页的最优路径。
2.根据权利要求1所述的WEB站点网页推荐方法,其特征在于,所述每隔预设时长有一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径之前,还包括:
获取所述WEB站点的历史日志;
对所述历史日志进行日志挖掘,确定网页跳转概率初始值;
配置所述预设时长、所述预设每轮路径数量、所述预设最大轮数以及所述WEB站点中各个网页的信息素初始值。
3.根据权利要求2所述的WEB站点网页推荐方法,其特征在于,所述确定所述蚂蚁经过所述路径上各个网页释放的第一信息素,包括:
根据第一预设公式确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素,其中,所述第一预设公式为:
Figure FDA0004078778900000021
其中,Δτi(k)表示蚂蚁k经过网页i时释放的第一信息素,di表示网页i距离所述目标网页的距离,预设路径中相邻两个网页之间的距离为1。
4.根据权利要求3所述的WEB站点网页推荐方法,其特征在于,所述根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率,包括:
根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素;
根据所述更新后信息素更新所述网页跳转概率。
5.根据权利要求4所述的WEB站点网页推荐方法,其特征在于,所述根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的信息素,得到更新后信息素,包括:
根据所述第一信息素、所述第二信息素和第二预设公式,更新所述WEB站点中所有网页的信息素,得到更新后信息素,其中,所述第二预设公式为:
Figure FDA0004078778900000022
其中,τi′表示网页i的更新后信息素,ρ表示信息素的挥发度,n表示经过网页i的蚂蚁总数,τi表示本轮路径开始前网页i的信息素,Δτi *表示精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,σ表示精英蚂蚁数量,Lgb本轮最优路径长度。
6.根据权利要求5所述的WEB站点网页推荐方法,其特征在于,所述根据所述更新后信息素更新所述网页跳转概率,包括:
根据所述更新后信息素和第三预设公式更新所述网页跳转概率,其中,所述第三预设公式为:
Figure FDA0004078778900000031
其中,pij′表示更新后的网页跳转概率,Ni表示与网页i直接相邻的所有网页,m表示与网页i直接相邻的网页总数,α表示信息素浓度权重,β表示启发性因素权重,ltj表示蚂蚁向网页j发起请求到获得网页j所耗时间,vtj表示蚂蚁在网页j停留的时间。
7.一种WEB站点网页推荐装置,其特征在于,包括:
数据获取模块,用于当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;
目标网页确定模块,用于根据所述访问日志,确定所述访问日志对应的目标网页;
最优路径确定模块,用于基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;
网页推荐模块,用于根据所述最优路径,进行所述WEB站点的网页推荐;
其中,所述最优路径确定模块,具体用于:
A01:每隔预设时长由一只蚂蚁从所述WEB站点首页开始,根据轮盘赌方式和网页跳转概率选择下一个跳转网页,直到到达所述目标网页,得到相应的一条路径,其中,所述网页跳转概率为在网页i选择下一个网页j的概率;
A02:确定所述蚂蚁经过所述路径上各个网页时释放的第一信息素;
A03:若当前已有路径数量等于预设每轮路径数量,则根据本轮路径中所有路径的长度,将最短长度对应的路径确定出本轮最优路径,并根据本轮最优路径长度,确定精英蚂蚁经过所述本轮最优路径上每个网页释放的第二信息素,其中,所述精英蚂蚁为找到所述本轮最优路径的蚂蚁;
A04:根据所述第一信息素和所述第二信息素,更新所述WEB站点中所有网页的所述网页跳转概率;
重新执行步骤A01,直至当前轮数等于预设最大轮数或在一轮路径中的每条路径均相同,则确定出从所述WEB站点首页到达所述目标网页的最优路径。
8.一种WEB站点网页推荐设备,其特征在于,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现权利要求1至6任一项所述的WEB站点网页推荐方法。
9.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的WEB站点网页推荐方法。
CN201911337779.5A 2019-12-23 2019-12-23 一种web站点网页推荐方法、装置、设备、介质 Active CN111104600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911337779.5A CN111104600B (zh) 2019-12-23 2019-12-23 一种web站点网页推荐方法、装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911337779.5A CN111104600B (zh) 2019-12-23 2019-12-23 一种web站点网页推荐方法、装置、设备、介质

Publications (2)

Publication Number Publication Date
CN111104600A CN111104600A (zh) 2020-05-05
CN111104600B true CN111104600B (zh) 2023-04-07

Family

ID=70423696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911337779.5A Active CN111104600B (zh) 2019-12-23 2019-12-23 一种web站点网页推荐方法、装置、设备、介质

Country Status (1)

Country Link
CN (1) CN111104600B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881400B (zh) * 2020-07-31 2024-02-23 中国农业银行股份有限公司 网页跳转路径确定方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222098A (zh) * 2011-06-20 2011-10-19 北京邮电大学 一种网页预取方法和系统
CN102254004A (zh) * 2011-07-14 2011-11-23 北京邮电大学 一种网络日志挖掘中的Web建模方法及系统
CN103002520A (zh) * 2012-06-06 2013-03-27 北京邮电大学 多模终端选择能够保证服务质量的目标网络的方法
CN103839105A (zh) * 2014-03-10 2014-06-04 北京航空航天大学 行程推荐方法和装置
CN103927347A (zh) * 2014-04-01 2014-07-16 复旦大学 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法
CN105787596A (zh) * 2016-02-29 2016-07-20 泰华智慧产业集团股份有限公司 一种基于改进蚁群算法的应急物流路径优化方法
CN106599027A (zh) * 2016-11-01 2017-04-26 四川用联信息技术有限公司 基于改进的蚁群算法实现关键词优化
CN108180914A (zh) * 2018-01-09 2018-06-19 昆明理工大学 一种基于蚁群改进和尖峰平滑的移动机器人路径规划方法
CN108551661A (zh) * 2018-04-19 2018-09-18 南京邮电大学 一种基于蚁群路由算法连通预测的能效最优化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9530111B2 (en) * 2013-10-31 2016-12-27 Ebay Inc. Methods, systems, and apparatus for personalizing a web experience using ant routing theory

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222098A (zh) * 2011-06-20 2011-10-19 北京邮电大学 一种网页预取方法和系统
CN102254004A (zh) * 2011-07-14 2011-11-23 北京邮电大学 一种网络日志挖掘中的Web建模方法及系统
CN103002520A (zh) * 2012-06-06 2013-03-27 北京邮电大学 多模终端选择能够保证服务质量的目标网络的方法
CN103839105A (zh) * 2014-03-10 2014-06-04 北京航空航天大学 行程推荐方法和装置
CN103927347A (zh) * 2014-04-01 2014-07-16 复旦大学 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法
CN105787596A (zh) * 2016-02-29 2016-07-20 泰华智慧产业集团股份有限公司 一种基于改进蚁群算法的应急物流路径优化方法
CN106599027A (zh) * 2016-11-01 2017-04-26 四川用联信息技术有限公司 基于改进的蚁群算法实现关键词优化
CN108180914A (zh) * 2018-01-09 2018-06-19 昆明理工大学 一种基于蚁群改进和尖峰平滑的移动机器人路径规划方法
CN108551661A (zh) * 2018-04-19 2018-09-18 南京邮电大学 一种基于蚁群路由算法连通预测的能效最优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑子伟 ; 郑建秋 ; .基于精英蚁群算法的SPARQL优化算法.控制工程.2017,(07),全文. *

Also Published As

Publication number Publication date
CN111104600A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US9978093B2 (en) Method and system for pushing mobile application
US8510322B2 (en) Enriched search features based in part on discovering people-centric search intent
US7945565B2 (en) Method and system for generating a hyperlink-click graph
US8745183B2 (en) System and method for adaptively refreshing a web page
US20080104502A1 (en) System and method for providing a change profile of a web page
US20150227524A1 (en) Synthesizing directories, domains, and subdomains
JP2006107432A (ja) クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
US20170039297A1 (en) Learning Graph
US10108736B2 (en) Method and apparatus for rendering statistics on web page visits by a browser
US20100100600A1 (en) Distributing data messages
WO2014118524A1 (en) Method and apparatus for accessing web sites
CN111104600B (zh) 一种web站点网页推荐方法、装置、设备、介质
CN108614843A (zh) 网站内容的评估方法及装置
Chmiel et al. Scaling of human behavior during portal browsing
CN103544257A (zh) 网页质量检测方法和装置
CN111291138A (zh) 更新关系网络的方法及装置
CN110598126A (zh) 基于行为习惯的跨社交网络用户身份识别方法
Basyuk Innerlinking website pages and weight of links
US9928313B2 (en) Seasonal query suggestion system and method
CN113742578A (zh) 一种数据推荐方法、装置、电子设备及存储介质
CN116069876A (zh) 基于知识图谱的问答方法、装置、设备及存储介质
CN107807993B (zh) 一种网页历史记录功能的实现方法及装置
WO2017050991A1 (en) Aggregating profile information
US8630992B1 (en) URL rank variability determination
CN113536087B (zh) 作弊站点的识别方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant