CN100385442C - 一种优化网站链接结构的方法 - Google Patents

一种优化网站链接结构的方法 Download PDF

Info

Publication number
CN100385442C
CN100385442C CNB2005100112120A CN200510011212A CN100385442C CN 100385442 C CN100385442 C CN 100385442C CN B2005100112120 A CNB2005100112120 A CN B2005100112120A CN 200510011212 A CN200510011212 A CN 200510011212A CN 100385442 C CN100385442 C CN 100385442C
Authority
CN
China
Prior art keywords
link
website
page
user
linking structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2005100112120A
Other languages
English (en)
Other versions
CN1645373A (zh
Inventor
郭岩
刘悦
王斌
张刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB2005100112120A priority Critical patent/CN100385442C/zh
Publication of CN1645373A publication Critical patent/CN1645373A/zh
Application granted granted Critical
Publication of CN100385442C publication Critical patent/CN100385442C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及网络信息处理技术领域,是一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法。该方法利用网站的服务器日志中蕴含的网络用户对网页之间相关性的潜在理解,从网站的服务器日志中抽取出用户主观上认为的网站链接结构,即虚拟链接结构;并将虚拟链接结构与网站的实际链接结构相比较,计算二者的匹配程度,匹配度越高,说明该网站的链接质量越好;最后将匹配结果量化,汇报给网站设计者。因为该方法是根据网络用户主观上对网站中各网页之间相关性的理解,去纠正网站设计者对网站链接结构的理解,所以能够真正地帮助网站设计者去优化网站链接结构,为用户提供更好的服务。

Description

一种优化网站链接结构的方法
技术领域
本发明涉及网络信息处理技术领域,特别是一种优化网站链接结构的方法。具体说是一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法。
背景技术
一个网站能否在内容和结构方面设计得足够吸引用户,对于很多网络商家是很关键的。但是由于网站的特点,网站设计者不可能直接面对每一个访问者,那么设计者如何能够得到访问者的反馈意见从而改进其服务呢?网络日志为这种沟通提供了可能,成为网站设计者和访问者进行沟通的主要桥梁。网站的服务器日志显式地记录了网络用户对该网站的访问行为,从各方面详尽反映了用户访问网站的细节,是取之不尽、用之不竭的宝贵资源。因为用户的访问行为是自动记录的,即网络日志的形成对于网络用户和网站设计者来说都是透明的,所以网站设计者和网络用户双方能够通过这种“零干扰”的方式互相了解、沟通。通过对网络日志进行有效地挖掘,能够帮助网站设计者改进自身的服务,这对于开发网站的最大经济潜力是非常关键的。因此通过分析网络日志来优化网站链接结构具有很重要的现实意义。
通过分析网络日志来帮助网站设计者优化网站链接结构,关键在于理解好以下五点:
(1)网站链接结构体现了网站中各网页之间的相关性,所以从本质上说,优化网站链接结构就是要让网站的链接能够更准确地表达网站中各网页之间的相关特性。
(2)要帮助网站设计者优化网站链接结构,首先就要了解网站设计者当前对网站中各网页之间相关性的理解;而网站当前的实际链接结构就体现了网站设计者对网站中各网页之间相关性的理解。因此,从当前的实际链接结构中可以抽象出网站设计者当前对网站中各网页之间相关性的理解。
(3)使用网站的是网络用户,因此优化网站链接结构的目的是为了更好的满足用户对该网站的浏览需求。如果一个网站中网页之间的链接结构非常符合网络用户主观上认为的链接组织结构,那么用户势必能够以最快的速度从这个网站中获取所需的信息,于是这个网站也就能够强有力地吸引用户,从而发挥网站的最大经济潜力。所以如果能够抽象出用户主观上对网站中各网页之间相关性的理解,并根据用户的理解去优化网站链接结构,必然能使网站更好地满足用户的浏览需求。
(4)要想抽象出用户主观上对网站中各网页之间相关性的理解,就需要分析网络日志。这是因为,网络用户主观意图的最直接体现就是用户的网络使用行为,落实到电子载体上就是网络日志。网站的服务器日志显式地、详细地记录了网络用户对该网站的访问行为,体现了用户对网站中各网页之间相关判定上的潜在意识。因此从网络日志中可以挖掘出用户主观上对网站中各网页之间相关性的理解。
(5)根据网络用户主观上对网站中各网页之间相关性的理解,去纠正网站设计者的理解,才能真正地帮助网站设计者去优化网站链接结构,为用户提供更好的服务。
目前已有不少通过分析网络日志来优化网站链接结构的方法。这些方法都具有以下这两大特点:
(1)分析对象仅局限于网络日志——既然需要抽象出网站设计者对网站中各网页之间相关性的理解,仅仅通过分析网络日志是无法得到抽象的,还需要对网站的实际链接进行分析,因为网站的实际链接结构体现了网站设计者对网站中各网页之间相关性的理解。
(2)没有考虑网络日志中蕴含的网络用户对网页之间相关性的潜在判定——既然需要抽象出访问该网站的网络用户主观上对网站中各网页之间相关性的理解,不从网络日志中蕴含着用户对网页之间相关性的潜在判定这一角度去挖掘,这个抽象也是无法完整得到的。
可见,目前已有的通过分析网络日志来优化网站链接结构的方法所具有的以上两个特点,决定了这些方法都不能从本质上去帮助网站设计者优化网站链接结构。本发明是一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法,克服了既有方法的缺陷。
发明内容
目前已有的通过分析网络日志来优化网站链接结构的方法都没有从网站设计者和网络用户分别对网站中各网页之间相关性的理解方面考虑,也就不能从本质上去帮助网站设计者优化网站链接结构。鉴于这些既有方法的缺陷,本发明设计了一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法,该方法包括:
步骤S1,根据用户提供的网站实际链接结构,填充矩阵LinksMatrix;矩阵LinksMatrix的行与列均为网站中的页面,矩阵中的元素(x,y)表示在实际链接结构中页面x到页面y的链接权重;
步骤S2,抽取矩阵LinksMatrix中权重大于0的链接,构成实际链接集合TRUELINKS;
步骤S3,根据网站的服务器日志抽取出用户潜意识中的虚拟链接结构,并填充矩阵LogsMatrix;矩阵LogsMatrix的行与列均为网站中的页面,矩阵中的元素(x,y)表示在虚拟链接结构中页面x到页面y的链接权重;
步骤S4,根据用户指定的阈值MINVALUE,抽取矩阵LogsMatrix中的权重高于阈值MINVALUE的链接,构成虚拟链接集合USERSLINKS;
步骤S5,根据集合TRUELINKS和USERSLINKS的匹配程度计算该网站的当前链接结构质量,并给出量化报告。
该方法利用网站的服务器日志中蕴含的网络用户对网页之间相关性的潜在理解,从网站的服务器日志中抽取出用户主观上认为的网站链接结构,即虚拟链接结构;并将虚拟链接结构与网站的实际链接结构相比较,计算二者的匹配程度,匹配度越高,说明该网站的链接质量越好;最后将匹配结果量化,汇报给网站设计者。因为该方法是根据网络用户主观上对网站中各网页之间相关性的理解,去纠正网站设计者对网站链接结构的理解,所以能够真正地帮助网站设计者去优化网站链接结构,为用户提供更好的服务。
与既有方法相比,本发明的效果体现在:
(1)从网站的实际链接结构中抽象出了网站设计者对网站中各网页之间相关性的理解。
(2)从网站的服务器日志中抽象出了用户主观上对网站中各网页之间相关性的理解,即用户主观上对网站链接结构的理解。
(3)根据用户主观上对网站链接结构的理解,去纠正网站设计者对网站链接结构的理解,从而能够真正帮助网站设计者去优化网站链接结构,为用户提供更好的服务。
(4)该方法为网站设计者定量地提供网站当前的链接结构质量,从而帮助网站设计者精确地制定优化链接结构的方案。
附图说明
图1是本发明的一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法的实现流程图。
具体实施方式
以下是本发明的一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法的实现过程,参照说明书附图1:
步骤S1,根据用户提供的网站实际链接结构,填充矩阵LinksMatrix;
矩阵LinksMatrix的行与列均为网站中的页面,矩阵中的元素(x,y)表示在实际链接结构中,页面x到页面y的链接权重;如果在实际链接结构中,页面x到页面y存在n个链接,则元素(x,y)大于0且为n,否则元素(x,y)等于0;
步骤S2,抽取矩阵LinksMatrix中权重大于0的链接,构成实际链接集合TRUELINKS;
步骤S3,根据网站的服务器日志抽取出用户潜意识中的虚拟链接结构,
并填充矩阵LogsMatrix;矩阵LogsMatrix的行与列均为网站中的页面,矩阵中的元素(x,y)表示在虚拟链接结构中,页面x到页面y的链接权重;如果在虚拟链接结构中,页面x到页面y存在n个链接,则元素(x,y)大于0且为n,否则元素(x,y)等于0;填充矩阵LogsMatrix的具体步骤是:按时间顺序扫描服务器日志中的访问记录,以2条记录为一个窗口,对于同一个窗口中的访问记录,如果由同一个用户发生,则认为该用户访问的这两个页面之间应有链接,由先访问的页面指向后访问的页面,根据识别出的链接填充矩阵LogsMatrix;例如,服务器日志中有这样的按时间顺序的访问记录序列:<用户a,网页1>(表示用户a访问了网页1,下同),<用户a,网页2>,<用户a,网页3>,<用户b,网页6>,<用户b,网页5>,<用户b,网页2>,<用户b,网页7>;则从这个访问记录序列中可以识别出以下链接:网页1——>网页2(表示有网页1指向网页2的链接,下同),网页2——>网页3,网页6——>网页5,网页2网页7;
步骤S4,根据用户指定的阈值MINVALUE,抽取矩阵LogsMatrix中的权重高于阈值MINVALUE的链接,构成虚拟链接集合USERSLINKS;
步骤S5,根据集合TRUELINKS和USERSLINKS的匹配程度计算该网站的当前链接结构质量,并给出量化报告;具体步骤是:(1)统计集合TRUELINKS和USERSLINKS中同时存在的链接,记为匹配链接;并计算匹配链接占集合TRUELINKS中所有实际链接的百分比;(2)统计在集合TRUELINKS中存在,但在USERSLINKS中不存在的链接,记为冗余链接;(3)统计在集合USERSLINKS中存在,但在TRUELINKS中不存在的链接,记为缺失链接。

Claims (4)

1.一种利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法,其特征在于,该方法包括:
步骤S1,根据用户提供的网站实际链接结构,填充矩阵LinksMatrix;矩阵LinksMatrix的行与列均为网站中的页面,矩阵中的元素(x,y)表示在实际链接结构中页面x到页面y的链接权重;
步骤S2,抽取矩阵LinksMatrix中权重大于0的链接,构成实际链接集合TRUELINKS;
步骤S3,根据网站的服务器日志抽取出用户潜意识中的虚拟链接结构,并填充矩阵LogsMatrix;矩阵LogsMatrix的行与列均为网站中的页面,矩阵中的元素(x,y)表示在虚拟链接结构中页面x到页面y的链接权重;
步骤S4,根据用户指定的阈值MINVALUE,抽取矩阵LogsMatrix中的权重高于阈值MINVALUE的链接,构成虚拟链接集合USERSLINKS;
步骤S5,根据集合TRUELINKS和USERSLINKS的匹配程度计算该网站的当前链接结构质量,并给出量化报告。
2.根据权利要求1所述的利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法,其特征在于:
对于步骤S1中所述的元素(x,y),如果在实际链接结构中,页面x到页面y存在n个链接,则元素(x,y)大于0且为n,否则元素(x,y)等于0;
对于步骤S3中所述的元素(x,y),如果在虚拟链接结构中,页面x到页面y存在n个链接,则元素(x,y)大于0且为n,否则元素(x,y)等于0。
3.根据权利要求1所述的利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法,其特征在于:步骤S3中所述填充矩阵LogsMatrix的具体步骤是:
按时间顺序扫描服务器日志中的访问记录,以2条记录为一个窗口,对于同一个窗口中的访问记录,如果由同一个用户发生,则认为该用户访问的这两个页面之间应有链接,由先访问的页面指向后访问的页面,根据识别出的链接填充矩阵LogsMatrix。
4.根据权利要求1所述的利用网络用户对网页之间相关性的潜在理解来优化网站链接结构的方法,其特征在于:所述步骤S5具体包括:
(1)统计集合TRUELINKS和USERSLINKS中同时存在的链接,记为匹配链接;并计算匹配链接占集合TRUELINKS中所有实际链接的百分比;
(2)统计在集合TRUELINKS中存在,但在USERSLINKS中不存在的链接,记为冗余链接;
(3)统计在集合USERSLINKS中存在,但在TRUELINKS中不存在的链接,记为缺失链接。
CNB2005100112120A 2005-01-20 2005-01-20 一种优化网站链接结构的方法 Active CN100385442C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100112120A CN100385442C (zh) 2005-01-20 2005-01-20 一种优化网站链接结构的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100112120A CN100385442C (zh) 2005-01-20 2005-01-20 一种优化网站链接结构的方法

Publications (2)

Publication Number Publication Date
CN1645373A CN1645373A (zh) 2005-07-27
CN100385442C true CN100385442C (zh) 2008-04-30

Family

ID=34875492

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100112120A Active CN100385442C (zh) 2005-01-20 2005-01-20 一种优化网站链接结构的方法

Country Status (1)

Country Link
CN (1) CN100385442C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823904A (zh) * 2014-03-19 2014-05-28 广东绿瘦健康信息咨询有限公司 网页浏览路径优化方法及其系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635826B (zh) * 2008-07-21 2011-02-09 中国科学院计算技术研究所 一种获取网络音视频节目地址的方法
CN102054004B (zh) * 2009-11-04 2015-05-06 清华大学 一种网页推荐方法和装置
CN102510536A (zh) * 2011-12-21 2012-06-20 中国传媒大学 一种互联网音视频下载方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055572A (en) * 1998-01-20 2000-04-25 Netscape Communications Corporation System and method for creating pathfiles for use to predict patterns of web surfaces
JP2000222276A (ja) * 1999-01-29 2000-08-11 Internatl Business Mach Corp <Ibm> 普及コンピュ―ティング装置により表示するためのウェブ・コンテンツを変更するためのシステム、方法、およびコンピュ―タ・プログラム製品
CN1356644A (zh) * 2000-11-30 2002-07-03 国际商业机器公司 从网络服务器向客户计算机提供资源的方法
US20040158523A1 (en) * 2003-02-06 2004-08-12 Dort David Bogart Method providing contingency access to valuable accounts or information

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055572A (en) * 1998-01-20 2000-04-25 Netscape Communications Corporation System and method for creating pathfiles for use to predict patterns of web surfaces
JP2000222276A (ja) * 1999-01-29 2000-08-11 Internatl Business Mach Corp <Ibm> 普及コンピュ―ティング装置により表示するためのウェブ・コンテンツを変更するためのシステム、方法、およびコンピュ―タ・プログラム製品
CN1356644A (zh) * 2000-11-30 2002-07-03 国际商业机器公司 从网络服务器向客户计算机提供资源的方法
US20040158523A1 (en) * 2003-02-06 2004-08-12 Dort David Bogart Method providing contingency access to valuable accounts or information

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823904A (zh) * 2014-03-19 2014-05-28 广东绿瘦健康信息咨询有限公司 网页浏览路径优化方法及其系统
CN103823904B (zh) * 2014-03-19 2014-11-26 广东绿瘦健康信息咨询有限公司 网页浏览路径优化方法及其系统

Also Published As

Publication number Publication date
CN1645373A (zh) 2005-07-27

Similar Documents

Publication Publication Date Title
CN102946319B (zh) 网络用户行为信息分析系统及其分析方法
CN105069087B (zh) 基于Web日志数据挖掘的网站优化方法
US6393479B1 (en) Internet website traffic flow analysis
JP5722783B2 (ja) 傾向の識別に基づくユーザへのカスタマイズ情報の提供
CN101079768B (zh) 一种统计网页链接点击数据的方法
US8103599B2 (en) Calculating web page importance based on web behavior model
CN106446228A (zh) 一种web页面数据的采集分析方法及装置
US20050021731A1 (en) Traffic flow analysis method
WO2008064593A1 (fr) Procédé et système d&#39;analyse de journal basés sur un réseau de calcul distribué
CN103631828A (zh) 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN102043783A (zh) 一种数据更新的方法、装置及系统
CN104426713A (zh) 网络站点访问效果数据的监测方法和装置
CN100385442C (zh) 一种优化网站链接结构的方法
CN104301161A (zh) 业务质量指标的计算方法、计算装置以及通信系统
CN105721578A (zh) 一种用户行为数据采集方法和系统
CN104615748A (zh) 基于Watir的物联网Web事件处理方法
CN103164438B (zh) 一种网络评论的采集方法及系统
CN109002550B (zh) 一种针对还原设备的测试方法及装置
CN102681996B (zh) 预读方法和装置
CN101227657A (zh) 一种彩信元素的跟踪分析系统及方法
CN102542478A (zh) 一种电子商务用户公共访问轨迹提取方法和装置
CN109840687A (zh) 一种品牌影响力指数构建方法、系统及存储介质
Shrivastava et al. Extracting knowledge from user access logs
CN109981738B (zh) 一种适用于窄带物联网应用的云服务器
CN103714075B (zh) 一种确定网站目录页的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Guo Yan

Inventor after: Liu Yue

Inventor after: Wang Bin

Inventor after: Zhang Gang

Inventor after: Cheng Xueqi

Inventor before: Guo Yan

Inventor before: Liu Yue

Inventor before: Wang Bin

Inventor before: Zhang Gang

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: GUO YAN LIU YUE WANG BIN ZHANG GANG TO: GUO YAN LIU YUE WANG BIN ZHANG GANG CHENG XUEQI

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20050727

Assignee: Branch DNT data Polytron Technologies Inc

Assignor: Institute of Computing Technology, Chinese Academy of Sciences

Contract record no.: 2018110000033

Denomination of invention: Method for optimizing linking structure of web station

Granted publication date: 20080430

License type: Common License

Record date: 20180807