CN112364271A - 一种网页间访问流转信息的获取方法 - Google Patents

一种网页间访问流转信息的获取方法 Download PDF

Info

Publication number
CN112364271A
CN112364271A CN202011472385.3A CN202011472385A CN112364271A CN 112364271 A CN112364271 A CN 112364271A CN 202011472385 A CN202011472385 A CN 202011472385A CN 112364271 A CN112364271 A CN 112364271A
Authority
CN
China
Prior art keywords
webpage
identifier
source
event
source webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011472385.3A
Other languages
English (en)
Inventor
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shangyue Network Technology Co ltd
Original Assignee
Beijing Shangyue Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shangyue Network Technology Co ltd filed Critical Beijing Shangyue Network Technology Co ltd
Priority to CN202011472385.3A priority Critical patent/CN112364271A/zh
Publication of CN112364271A publication Critical patent/CN112364271A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开的网页间访问流转数据的获取方法,涉及计算机技术领域,当目标网页被加载后,判断该目标网页是否是为源网页打开的,若是,则向源网页发送请求,获取源网页的标识及源网页中记录的最近一次触发打开新页面的事件对应元素的标识,源网页接收该请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页,目标网页根据该源网页的标识及源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据,能够准确获取网页间访问流转信息,提高了精确度。

Description

一种网页间访问流转信息的获取方法
技术领域
本发明涉及计算机技术领域,具体涉及一种网页间访问流转信息的获取方法。
背景技术
用户在访问网页时,会从一个网页跳转到另一个网页。记录用户在网页间的访问流转信息是分析用户行为的关键数据之一。
现有的网页间的访问流转信息方法是通过自动修改来源网页中的个个URL地址,在各个URL地址后面带上来源页面的标识和来源页面上的位置的标识,从而在打开目标网页时,知晓其是从哪里来的信息。
例如,假设如上网页X中的超链接b的URL地址是:“https://www.sunyur.com/product/mall/index.html”。现有技术方案会将该URL地址修改为:
“https://www.sunyur.com/product/mall/index.html pos=X.b”,这样在打开网页Y时,就知道它是从X网页的超链接b过来的。
在现有技术方案下,会对各个URL地址进行修改。当用户拷贝网页Y的URL地址通过聊天软件传给其他用户时,或用户收藏了该URL地址后再打开时,URL中已经带有了“pos=X.b”这样的数据,所以会错误地认为网页Y是从网页X过来的。
所以现有的技术方案,在统计网页间流转信息时,会错误地统计拷贝/收藏的网页的来源,导致统计结果不够精准。
发明内容
为解决现有技术的不足,本发明实施例提供了一种网页间访问流转信息的获取方法,该方法包括以下步骤:
当目标网页被加载后,判断所述目标网页是否是为所述源网页打开的,若是,则向源网页发送请求,获取源网页的标识及所述源网页中记录的最近一次触发打开新页面的事件对应元素的标识;
所述源网页接收所述请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页;
所述目标网页根据所述源网页的标识及所述源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据。
优选地,实时判断源网页中是否存在触发打开新页面的事件包括:
所述源网页监听各个超链接的点击事件,当产生点击事件时,记录所述超链接的标识。
优选地,判断所述目标网页是否是为所述源网页打开的包括:
通过Web API 接口window.opener判断其是否为所述源网页打开的。
优选地,所述源网页接收所述请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页包括:
所述源网页监听message事件,当message事件发生且message事件的类型为request时,获取其自身的标识及最近一次触发新开页面的超链接的标识,其中,request为针对网页流转信息的请求。
优选地,所述目标网页根据所述源网页的标识及所述源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据包括:
所述目标网页监听message事件,当message事件发生且message事件的类型为response时,保存所述源网页的标识及所述超链接的标识,其中,response为针对网页流转信息的响应。
优选地,实时判断源网页中是否存在触发打开新页面的事件,若是,则记录触发所述事件对应元素的标识。
本发明实施例提供的网页间访问流转数据的获取方法,具有以下有益效果:
当用户拷贝网页的URL地址通过聊天软件传给其他用户时,或用户收藏了该URL地址后再打开时,也能准确获取网页间访问流转信息,提高了精确度。
具体实施方式
以下结合具体实施例对本发明作具体的介绍。
本发明实施例提供的网页间访问流转数据的获取方法包括以下步骤:
S101,当目标网页被加载后,判断该目标网页是否是为源网页打开的,若是,则向源网页发送请求,获取源网页的标识及源网页中记录的最近一次触发打开新页面的事件对应元素的标识;
S102,源网页接收该请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页;
S103,目标网页根据该源网页的标识及源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据。
可选地,实时判断源网页中是否存在触发打开新页面的事件包括:
源网页监听各个超链接的点击事件,当产生点击事件时,记录所述超链接的标识。
作为一个具体的实施例,监听超链接<a href=“www.baidu.com”id=”b”></a>的点击事件,当该超链接被点击时,将标识“b”存储起来。
可选地,判断目标网页是否是为源网页打开的包括:
通过Web API 接口window.opener判断其是否为所述源网页打开的。
可选地,源网页接收所述请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页包括:
源网页监听message事件,当message事件发生且message事件的类型为“request”时,获取其自身的标识及最近一次触发新开页面的超链接的标识,其中,request为针对网页流转信息的请求。
其中,request可以是字符串,只要约定好就行。
可选地,目标网页根据所述源网页的标识及所述源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据包括:
目标网页监听message事件,当message事件发生且message事件的类型为response时,保存所述源网页的标识及所述超链接的标识,其中,response为针对网页流转信息的响应。
其中,request可以是字符串,只要约定好就行。
可选地,实时判断源网页中是否存在触发打开新页面的事件,若是,则记录触发该事件对应元素的标识;
本发明实施例提供的网页间访问流转数据的获取方法,当目标网页被加载后,判断该目标网页是否是为源网页打开的,若是,则向源网页发送请求,获取源网页的标识及源网页中记录的最近一次触发打开新页面的事件对应元素的标识,源网页接收该请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页,目标网页根据该源网页的标识及源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据,能够准确获取网页间访问流转信息,提高了精确度。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种网页间访问流转信息的获取方法,其特征在于,包括:
当目标网页被加载后,判断所述目标网页是否是为源网页打开的,若是,则向源网页发送请求,获取源网页的标识及所述源网页中记录的最近一次触发打开新页面的事件对应元素的标识;
所述源网页接收所述请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页;
所述目标网页根据所述源网页的标识及所述源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据。
2.根据权利要求1所述的网页间访问流转信息的获取方法,其特征在于,实时判断源网页中是否存在触发打开新页面的事件包括:
所述源网页监听各个超链接的点击事件,当产生点击事件时,记录对应超链接的标识。
3.根据权利要求1所述的网页间访问流转信息的获取方法,其特征在于,判断所述目标网页是否是为所述源网页打开的包括:
通过Web API 接口window.opener判断其是否为所述源网页打开的。
4.根据权利要求1所述的网页间访问流转信息的获取方法,其特征在于,所述源网页接收所述请求,将自身标识及最近一次触发打开新页面的事件对应元素的标识发送给目标网页包括:
所述源网页监听message事件,当message事件发生且message事件的类型为request时,获取其自身的标识及最近一次触发新开页面的超链接的标识,其中,request为针对网页流转信息的请求。
5.根据权利要求1所述的网页间访问流转信息的获取方法,其特征在于,所述目标网页根据所述源网页的标识及所述源网页中最近一次触发打开新页面的事件对应元素的标识,获取网页间访问流转数据包括:
所述目标网页监听message事件,当message事件发生且message事件的类型为response时,保存所述源网页的标识超链接的标识,其中,response为针对网页流转信息的响应。
6.根据权利要求1所述的网页间访问流转信息的获取方法,其特征在于,在当目标网页被加载后,判断所述目标网页是否是为所述源网页打开的之前,所述方法还包括:
实时判断源网页中是否存在触发打开新页面的事件,若是,则记录触发所述事件对应元素的标识。
7.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如权利要求1-6任一项所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1-6任一项所述的方法。
CN202011472385.3A 2020-12-15 2020-12-15 一种网页间访问流转信息的获取方法 Pending CN112364271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011472385.3A CN112364271A (zh) 2020-12-15 2020-12-15 一种网页间访问流转信息的获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011472385.3A CN112364271A (zh) 2020-12-15 2020-12-15 一种网页间访问流转信息的获取方法

Publications (1)

Publication Number Publication Date
CN112364271A true CN112364271A (zh) 2021-02-12

Family

ID=74534487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011472385.3A Pending CN112364271A (zh) 2020-12-15 2020-12-15 一种网页间访问流转信息的获取方法

Country Status (1)

Country Link
CN (1) CN112364271A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631829A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 一种网页访问请求的响应方法和装置
CN103810268A (zh) * 2014-01-27 2014-05-21 北京奇虎科技有限公司 加载搜索结果推荐信息、网址检测的方法、装置和系统
WO2016050124A1 (zh) * 2014-09-30 2016-04-07 优视科技有限公司 网页转码方法、装置以及服务器
CN106294648A (zh) * 2016-08-03 2017-01-04 腾讯科技(深圳)有限公司 一种针对页面访问路径的处理方法及装置
CN106528657A (zh) * 2016-10-19 2017-03-22 广东欧珀移动通信有限公司 浏览器跳转至应用程序的控制方法及装置
CN106649350A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 链接元素位置信息的获取方法及装置
CN106980614A (zh) * 2016-01-15 2017-07-25 中国科学院声学研究所 一种基于JavaScript扩展的Web页面语音操控实现方法
CN107688568A (zh) * 2016-08-03 2018-02-13 腾讯科技(深圳)有限公司 基于网页访问行为记录的采集方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631829A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 一种网页访问请求的响应方法和装置
CN103810268A (zh) * 2014-01-27 2014-05-21 北京奇虎科技有限公司 加载搜索结果推荐信息、网址检测的方法、装置和系统
WO2016050124A1 (zh) * 2014-09-30 2016-04-07 优视科技有限公司 网页转码方法、装置以及服务器
CN106649350A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 链接元素位置信息的获取方法及装置
CN106980614A (zh) * 2016-01-15 2017-07-25 中国科学院声学研究所 一种基于JavaScript扩展的Web页面语音操控实现方法
CN106294648A (zh) * 2016-08-03 2017-01-04 腾讯科技(深圳)有限公司 一种针对页面访问路径的处理方法及装置
CN107688568A (zh) * 2016-08-03 2018-02-13 腾讯科技(深圳)有限公司 基于网页访问行为记录的采集方法及装置
CN106528657A (zh) * 2016-10-19 2017-03-22 广东欧珀移动通信有限公司 浏览器跳转至应用程序的控制方法及装置

Similar Documents

Publication Publication Date Title
KR100723867B1 (ko) 피싱웹페이지 차단 장치 및 방법
CN110602029B (zh) 一种用于识别网络攻击的方法和系统
US20110035390A1 (en) Message Descriptions
US20070299880A1 (en) Document Management Server, Document Management Method, Computer Readable Medium, Computer Data Signal, and System For Managing Document Use
CN111753171B (zh) 一种恶意网站的识别方法和装置
US20070220145A1 (en) Computer product, access-restricting method, and proxy server
JP6160064B2 (ja) 適用判定プログラム、障害検出装置および適用判定方法
CN110008197B (zh) 一种数据处理方法、系统及电子设备和存储介质
CN112003857A (zh) 一种网络资产搜集方法、装置、设备及存储介质
US20150142813A1 (en) Language tag management on international data storage
JPH11195025A (ja) ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置
CN101331488A (zh) 基于盘的高速缓存
CN111666205B (zh) 一种数据审计的方法、系统、计算机设备和存储介质
CN111885086A (zh) 恶意软件心跳检测方法、装置、设备及可读存储介质
CN110990365A (zh) 一种数据同步方法、装置、服务器及存储介质
JP2015076892A (ja) 権威ネームサーバの変化に基づくドメイン名の特徴付け
JP7470235B2 (ja) 語彙抽出支援システムおよび語彙抽出支援方法
CN107886008B (zh) 文件管理方法、系统、装置和计算机可读存储介质
CN112364271A (zh) 一种网页间访问流转信息的获取方法
CN108416057A (zh) 一种网站行为分析系统
JP2012523626A (ja) ドメイン状態、目的、およびカテゴリ
CN110719337A (zh) 业务系统、业务请求处理方法、装置及服务器
CN116451071A (zh) 样本标注方法、设备及可读存储介质
CN112738221B (zh) 对象存储流量的审计方法及装置
CN115442109A (zh) 网络攻击结果的确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination