CN103268361B - 网页中隐藏url的提取方法、装置和系统 - Google Patents
网页中隐藏url的提取方法、装置和系统 Download PDFInfo
- Publication number
- CN103268361B CN103268361B CN201310226579.9A CN201310226579A CN103268361B CN 103268361 B CN103268361 B CN 103268361B CN 201310226579 A CN201310226579 A CN 201310226579A CN 103268361 B CN103268361 B CN 103268361B
- Authority
- CN
- China
- Prior art keywords
- url
- webpage
- browser
- event
- hidden
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310226579.9A CN103268361B (zh) | 2013-06-07 | 2013-06-07 | 网页中隐藏url的提取方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310226579.9A CN103268361B (zh) | 2013-06-07 | 2013-06-07 | 网页中隐藏url的提取方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103268361A CN103268361A (zh) | 2013-08-28 |
CN103268361B true CN103268361B (zh) | 2019-05-31 |
Family
ID=49011990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310226579.9A Active CN103268361B (zh) | 2013-06-07 | 2013-06-07 | 网页中隐藏url的提取方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103268361B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593396A (zh) * | 2013-10-08 | 2014-02-19 | 北京奇虎科技有限公司 | 基于浏览器的网络资源的提取方法及装置 |
CN104778070B (zh) * | 2014-01-15 | 2018-07-06 | 富士通株式会社 | 隐藏变量抽取方法和设备以及信息提取方法和设备 |
CN104156458B (zh) * | 2014-08-20 | 2017-09-22 | 北京小度互娱科技有限公司 | 一种信息的提取方法及装置 |
CN105871845A (zh) * | 2016-03-31 | 2016-08-17 | 深圳市深信服电子科技有限公司 | Web漏洞扫描行为的检测方法及装置 |
CN105824965A (zh) * | 2016-04-01 | 2016-08-03 | 无锡中科富农物联科技有限公司 | 基于动态爬虫技术的数据源发现方法 |
CN107844484B (zh) * | 2016-09-18 | 2021-07-16 | 北京国双科技有限公司 | 一种识别曝光代码的方法和装置 |
CN106528779A (zh) * | 2016-11-03 | 2017-03-22 | 北京知道未来信息技术有限公司 | 一种基于可变url的爬虫识别方法 |
CN106649567A (zh) * | 2016-11-15 | 2017-05-10 | 杭州安恒信息技术有限公司 | 一种基于浏览器内核的网络爬虫系统 |
CN106844475A (zh) * | 2016-12-23 | 2017-06-13 | 北京奇虎科技有限公司 | 确定隐藏的url的方法及装置 |
CN108632219B (zh) * | 2017-03-21 | 2021-04-27 | 腾讯科技(深圳)有限公司 | 一种网站漏洞检测方法、检测服务器、系统及存储介质 |
CN108667770B (zh) * | 2017-03-29 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种网站的漏洞测试方法、服务器及系统 |
CN107147645B (zh) * | 2017-05-11 | 2020-05-05 | 北京安赛创想科技有限公司 | 网络安全数据的获取方法及装置 |
CN109948025B (zh) * | 2019-03-20 | 2023-10-20 | 上海古鳌电子科技股份有限公司 | 一种数据引用记录方法 |
CN110083755A (zh) * | 2019-04-29 | 2019-08-02 | 北京脉冲星科技有限公司 | 一种高仿真解析网页方法、装置和电子设备 |
CN111177636B (zh) * | 2020-01-07 | 2023-11-03 | 北京同有飞骥科技股份有限公司 | 网页请求的递归调度方法及系统 |
CN113609411A (zh) * | 2021-06-25 | 2021-11-05 | 北京华云安信息技术有限公司 | 通过网络爬虫爬取页面信息的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515300A (zh) * | 2009-04-02 | 2009-08-26 | 阿里巴巴集团控股有限公司 | 一种Ajax网页内容的抓取方法及系统 |
CN101520796A (zh) * | 2009-02-16 | 2009-09-02 | 深圳市腾讯计算机系统有限公司 | 从网页内容中提取统一资源定位符的方法及系统 |
CN101587488A (zh) * | 2009-05-25 | 2009-11-25 | 深圳市腾讯计算机系统有限公司 | 一种搜索引擎中页面重定向的检测方法及装置 |
CN101984429A (zh) * | 2010-11-04 | 2011-03-09 | 百度在线网络技术(北京)有限公司 | 获取目标页面的方法、装置、搜索引擎和浏览器 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060190561A1 (en) * | 2002-06-19 | 2006-08-24 | Watchfire Corporation | Method and system for obtaining script related information for website crawling |
US7496636B2 (en) * | 2002-06-19 | 2009-02-24 | International Business Machines Corporation | Method and system for resolving Universal Resource Locators (URLs) from script code |
-
2013
- 2013-06-07 CN CN201310226579.9A patent/CN103268361B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520796A (zh) * | 2009-02-16 | 2009-09-02 | 深圳市腾讯计算机系统有限公司 | 从网页内容中提取统一资源定位符的方法及系统 |
CN101515300A (zh) * | 2009-04-02 | 2009-08-26 | 阿里巴巴集团控股有限公司 | 一种Ajax网页内容的抓取方法及系统 |
CN101587488A (zh) * | 2009-05-25 | 2009-11-25 | 深圳市腾讯计算机系统有限公司 | 一种搜索引擎中页面重定向的检测方法及装置 |
CN101984429A (zh) * | 2010-11-04 | 2011-03-09 | 百度在线网络技术(北京)有限公司 | 获取目标页面的方法、装置、搜索引擎和浏览器 |
Also Published As
Publication number | Publication date |
---|---|
CN103268361A (zh) | 2013-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103268361B (zh) | 网页中隐藏url的提取方法、装置和系统 | |
US8413044B2 (en) | Method and system of retrieving Ajax web page content | |
CN102272757B (zh) | 用于执行客户端浏览器状态的服务器端记录的方法和系统 | |
US9195572B2 (en) | Systems and methods for identifying user interface (UI) elements | |
CN103984686B (zh) | 页面切换方法及装置 | |
US8612420B2 (en) | Configuring web crawler to extract web page information | |
CN101697156B (zh) | 一种构造链式网页的方法及系统 | |
US20190042397A1 (en) | Accessibility testing software automation tool | |
US20080235671A1 (en) | Injecting content into third party documents for document processing | |
CN109144567B (zh) | 跨平台的网页渲染方法、装置、服务器及存储介质 | |
CN106598991A (zh) | 一种使用会话方式实现与网站交互表单自动提取的网络爬虫系统 | |
CN109684571A (zh) | 一种数据采集方法及装置、存储介质 | |
Hallé et al. | Testing web applications through layout constraints | |
CN113190512A (zh) | 一种基于埋点技术的电力客户行为数据分析方法 | |
CN110083755A (zh) | 一种高仿真解析网页方法、装置和电子设备 | |
CN103458065A (zh) | 一种HTML5标准下基于Webkit内核的视频地址提取方法 | |
CN105373533B (zh) | 一种页面链接地址的检测方法、客户端及装置 | |
CN102043786A (zh) | 配置快速键予页面转换元素的浏览系统及其方法 | |
CN109240700B (zh) | 关键代码定位方法与系统 | |
CN109240664A (zh) | 一种采集用户行为信息的方法及终端 | |
CN103970773B (zh) | 一种网页的页面更新方法及装置 | |
CN109062784B (zh) | 接口参数约束代码入口定位方法与系统 | |
CN104951536B (zh) | 搜索方法及装置 | |
CN104050165A (zh) | 一种基于iptv的网页初始焦点选定方法和装置 | |
CN109062785B (zh) | 接口参数约束代码定位方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
ASS | Succession or assignment of patent right |
Owner name: NANKAI UNIVERSITY Effective date: 20140106 |
|
C41 | Transfer of patent application or patent right or utility model | ||
C53 | Correction of patent for invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhou Zhengji Inventor after: Li Minglei Inventor after: Zhang Biao Inventor after: Wang Dan Inventor after: Lian Kunmei Inventor after: Liu Lei Inventor after: Xu Jing Inventor before: Zhou Zhengji Inventor before: Li Minglei Inventor before: Zhang Biao Inventor before: Wang Dan Inventor before: Lian Kunmei Inventor before: Liu Lei |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: ZHOU ZHENGJI LI MINGLEI ZHANG BIAO WANG DAN LIAN KUNMEI LIU LEI TO: ZHOU ZHENGJI LI MINGLEI ZHANG BIAO WANG DAN LIAN KUNMEI LIU LEI XU JING |
|
TA01 | Transfer of patent application right |
Effective date of registration: 20140106 Address after: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. Applicant after: Nankai University Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |