CN104092660A - 一种访问网络站点的方法 - Google Patents

一种访问网络站点的方法 Download PDF

Info

Publication number
CN104092660A
CN104092660A CN201410255583.2A CN201410255583A CN104092660A CN 104092660 A CN104092660 A CN 104092660A CN 201410255583 A CN201410255583 A CN 201410255583A CN 104092660 A CN104092660 A CN 104092660A
Authority
CN
China
Prior art keywords
agent
access
targeted sites
effective
broker library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410255583.2A
Other languages
English (en)
Other versions
CN104092660B (zh
Inventor
江潮
贺建华
蒋汉华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUHAN TRANSN INFORMATION TECHNOLOGY Co Ltd
Original Assignee
WUHAN TRANSN INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN TRANSN INFORMATION TECHNOLOGY Co Ltd filed Critical WUHAN TRANSN INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410255583.2A priority Critical patent/CN104092660B/zh
Publication of CN104092660A publication Critical patent/CN104092660A/zh
Application granted granted Critical
Publication of CN104092660B publication Critical patent/CN104092660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种访问网络站点的方法,包括:确定目标站点的访问限制;在当前IP触发所述访问限制之后,调取代理IP访问所述目标站点。本发明通过智能代理策略,可以有效地解决当IP受限无法访问目标站点的问题。

Description

一种访问网络站点的方法
技术领域
本发明涉及网络技术领域,尤其是涉及一种访问网络站点的方法。
背景技术
现在的网络站点,对于用户访问存在许多的限制,例如限制一个IP地址访问的次数,当访问次数达到限制后,网络站点就会拒绝该IP地址访问该网络站点;还例如限制一个IP的访问间隔,在该IP地址访问网络站点之后,网络网站在访问间隔内拒绝该IP地址的访问。受到网络站点的访问限制,许多的网络搜索引擎无法实时的获取到该网络站点的网络数据,无法获得更加完全的数据库支撑用户搜索。
发明内容
本发明的目的之一是提供一种访问网络站点的方法,以解决现有技术中由于访问限制无法访问网络站点的问题。
在一些说明性实施例中,所述访问网络站点的方法,包括:确定目标站点的访问限制;在当前IP触发所述访问限制之后,调取代理IP访问所述目标站点。
与现有技术相比,本发明的说明性实施例包括以下优点:
通过代理IP访问网络站点,可以有效的解决当前IP受到访问限制无法访问网络站点的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是按照本发明的说明性实施例的流程图;
图2是按照本发明的说明性实施例的流程图;
图3是按照本发明的说明性实施例的流程图。
具体实施方式
在以下详细描述中,提出大量特定细节,以便于提供对本发明的透彻理解。但是,本领域的技术人员会理解,即使没有这些特定细节也可实施本发明。在其它情况下,没有详细描述众所周知的方法、过程、组件和电路,以免影响对本发明的理解。
现在参照图1,图1示出了在一些说明性实施例中的流程图。
如图1所示,在一些说明性实施例中,公开了一种访问网络站点的方法,包括:
S11、确定目标站点的访问限制;
其中,在目标站点不存在访问限制的情况下,用户直接访问目标站点,或例如代理IP直接访问目标站点。
S12、在当前IP触发所述访问限制之后,调取代理IP访问所述目标站点。
其中,网络站点的网络限制例如限制当前IP访问次数,再例如限制当前IP访问间隔;限制当前IP访问次数是指网络站点设置在当前IP访问该网络站点的次数达到网络站点内设置有阈值时,该网络站点自动将用户所使用的当前IP列入其黑名单,禁止该IP再次访问本网络站点。限制当前IP访问间隔是指网络站点设置在当前IP访问该网络站点之后,将该IP列入其黑名单,在一定时长后,将该IP从黑名单中的移除,实现解禁。
用户访问网络站点受限后,采用代理IP访问该网络站点,由于IP不同不会受到网络站点的访问限制,用户可以通过代理IP访问网络站点,进行浏览或数据采集等操作。
代理IP可以理解用户对网络站点的IP地址,即用户使用其自身IP访问代理IP,通过代理IP访问网络站点。在一些情况下,用户自身的IP与网络站点所处的网络站点不同,例如用户为联通网络,网络站点为移动网络,用户访问网络站点的响应时间慢,通过代理IP可以有效的解决访问的响应时间慢的问题。
在一些说明性实施例中,步骤S12中调取代理IP是从有效代理库中进行调取。
其中,有效代理库中的代理IP的数量为一个或者多个,每个代理IP根据其访问目标站点的响应时间建立有优先级,例如表1;
优先级 代理IP 响应时间
1 192.168.1.0 100MS
2 192.168.4.10 157MS
3 192.168.101.101 1S
4 192.168.1.47 2S
表1
表1中代理IP:192.168.1.0的访问目标站点的响应时间为100MS,在有效代理库中的响应时间是最短的,因此它的优先级为1;在需要在有效代理库中调取代理IP时,优先调取优先级为1的代理IP,可以大大提高访问目标站点的效率。
在一些说明性实施例张工,所述当前IP为所述有效代理库中的代理IP时,还包括:在调取代理IP访问所述目标站点之前,将当前IP从所述有效代理库中移除。
在一些说明性实施例中,在所述目标站点的访问限制为限制当前IP访问间隔时,还包括:记录移除所述有效代理库中的代理IP的移除时长,当所述移除时长大于所述访问间隔时,将该代理IP重新加入所述有效代理库。
在一些说明性实施例中,所述有效代理库中的所有代理IP来自于代理白名单。
其中,白名单中包括若干满足用户的配置信息访问目标站点的代理IP。
如图2所示,在一些说明性实施例中,建立所述代理白名单的过程,包括:
S21、获取支持访问目标站点的至少一个代理IP;
S22、检验所述代理IP在满足配置信息的条件下,是否支持访问所述目标站点;
S23、将支持访问的代理IP加入到所述白名单。
在一些说明性实施例中,所述方法中还包括:当有效代理库中的代理IP的数量小于阈值时,将所述代理白名单中未加入所述有效代理库中的代理IP补充到所述有效代理库。
在一些说明性实施例中,所述方法中还包括:访问结束后,建立使用过的每个代理IP与所述目标站点的关联关系;当再次访问所述目标站点时,调取代理IP访问所述目标站点,包括:从与所述目标站点具有关联关系的代理IP访问所述目标站点。
如图3所示,在一些说明性实施例中,公开了一种访问网络站点的方法,包括:
S31、建立代理白名单;
1、确定目标站点,从目标站点的网页源代码中获取所有代理IP;
2、验证获取到的每个代理IP在用户设置的固定条件下访问目标站点,是否可以反馈预期结果;
例如判断访问目标站点反馈的状态码是否正常、无误。
3、以可以反馈预期结果的代理IP建立代理IP白名单。
例如以反馈的状态码正常、无误的代理IP建立代理IP白名单。
在一些说明性实施例中,代理IP白名单中的每个代理IP根据访问目标站点的响应时间建立有优先级,其中,响应时间最短的代理IP的优先级最高。
S32、建立有效代理库;
以优先级从高到低的顺序在代理IP白名单中提取一定数量的代理IP,建立有效代理库;
其中,有效库中的代理IP使用后,自动将该代理IP移除有效代理库;在有效代理库中的代理IP的数量低于设定的阈值时,自动从代理IP白名单中按照优先级顺序提取未加入有效代理库中的代理IP补充道有效代理库中。
S33、获取目标站点的访问限制规则;
1),使用同一IP同一频率重复访问目标站点,记录该IP访问次数和每次的访问结果;
2),在1)中的访问目标站点结束于第二次,则动态调整该IP的访问频率,分析各项数据。
通过上述1)和2)中的测试和分析方法,确定目标站点是否存在访问限制;在存在访问限制的情况下,判断该访问限制为限制当前IP访问次数,还是限制当前IP访问间隔。
在一些说明性实施例中,步骤S31、S32和S33为前期配置,在已知目标站点的访问限制时,以及建立有针对于目标站点的代理IP白名单和有效代理库的情况下,则无需再次进行步骤S31、S32和S33。
S34、制定目标站点的访问策略
根据目标站点的访问限制,制定访问策略;
1)、访问限制为限制当前IP访问次数;
在用户自身IP访问次数达到目标站点的访问次数时,设置用户IP再次访问目标站点时,通过有效代理库中的代理IP访问目标站点;
在当前IP为代理IP时,设置用户在有效代理库中更换代理IP访问目标站点。
其中,调取有效代理库中的代理IP按照优先级的先后顺序。使用过的代理IP直接从有效代理库中移除。
2)、访问限制为限制当前IP访问间隔
在用户自身IP访问目标站点之后,设置用户IP再次访问目标站点时,通过有效代理库中的代理IP访问目标站点。
在当前IP为代理IP时,设置用户在有效代理库中更换代理IP访问目标站点。
其中,调取有效代理库中的代理IP按照优先级的先后顺序;
使用过的代理IP从有效代理库中移除,并记录该代理IP,在该代理IP的移除时长超过访问间隔后,将该代理IP重新加入到有效代理库中。
在一些说明性实施例中,记录成功访问过目标站点的代理IP,建立使用过的每个代理IP与所述目标站点的关联关系;当再次访问所述目标站点时,从与所述目标站点具有关联关系的代理IP访问所述目标站点。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种访问网络站点的方法,其特征在于,包括:
确定目标站点的访问限制;
在当前IP触发所述访问限制之后,调取代理IP访问所述目标站点。
2.根据权利要求1所述的方法,其特征在于,从有效代理库中调取所述代理IP访问所述目标站点。
3.根据权利要求2所述的方法,其特征在于,所述目标站点的访问限制为限制当前IP访问次数或限制当前IP访问间隔。
4.根据权利要求3所述的方法,其特征在于,所述当前IP为所述有效代理库中的代理IP时,还包括:
在调取代理IP访问所述目标站点之前,将当前IP从所述有效代理库中移除。
5.根据权利要求4所述的方法,其特征在于,在所述目标站点的访问限制为限制当前IP访问间隔时,还包括:
记录移除所述有效代理库中的代理IP的移除时长,当所述移除时长大于所述访问间隔时,将该代理IP重新加入所述有效代理库。
6.根据要求2所述的方法,其特征在于,所述有效代理库中的每个代理IP根据其访问所述目标站点的响应时间建立有优先级;
从有效代理库中调取所述代理IP访问所述目标站点,包括:
从有效代理库中调取所述优先级最高的代理IP访问所述目标站点。
7.根据权利要求2所述的方法,其特征在于,所述有效代理库中的所有代理IP来自于代理白名单。
8.根据权利要求7所述的方法,其特征在于,建立所述代理白名单的过程,包括:
获取支持访问目标站点的至少一个代理IP;
检验所述代理IP在满足配置信息的条件下,是否支持访问所述目标站点;
是,则将该代理IP加入到所述白名单。
9.根据权利要求7所述的方法,其特征在于,还包括:
当有效代理库中的代理IP的数量小于阈值时,将所述代理白名单中未加入所述有效代理库中的代理IP补充到所述有效代理库。
10.根据权利要求2所述的方法,其特征在于,还包括:
访问结束后,建立使用过的每个代理IP与所述目标站点的关联关系;
当再次访问所述目标站点时,调取代理IP访问所述目标站点,包括:
从与所述目标站点具有关联关系的代理IP访问所述目标站点。
CN201410255583.2A 2014-06-09 2014-06-09 一种访问网络站点的方法 Active CN104092660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410255583.2A CN104092660B (zh) 2014-06-09 2014-06-09 一种访问网络站点的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410255583.2A CN104092660B (zh) 2014-06-09 2014-06-09 一种访问网络站点的方法

Publications (2)

Publication Number Publication Date
CN104092660A true CN104092660A (zh) 2014-10-08
CN104092660B CN104092660B (zh) 2018-09-21

Family

ID=51640342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410255583.2A Active CN104092660B (zh) 2014-06-09 2014-06-09 一种访问网络站点的方法

Country Status (1)

Country Link
CN (1) CN104092660B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162830A (zh) * 2015-07-23 2015-12-16 浪潮软件集团有限公司 一种提高代理ip利用率的采集方法
CN105992194A (zh) * 2015-01-30 2016-10-05 阿里巴巴集团控股有限公司 网络数据内容的获取方法及装置
CN109246180A (zh) * 2018-07-24 2019-01-18 孙满堂 信息查询方法、中转服务器及计算机可读介质
CN110062025A (zh) * 2019-03-14 2019-07-26 深圳绿米联创科技有限公司 数据采集的方法、装置、服务器及存储介质
CN112583780A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 使用代理ip访问网站数据的方法、装置、系统和设备
CN117714537A (zh) * 2024-02-06 2024-03-15 湖南四方天箭信息科技有限公司 一种访问方法、装置、终端和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060282408A1 (en) * 2003-09-30 2006-12-14 Wisely David R Search system and method via proxy server
CN102088477A (zh) * 2010-11-25 2011-06-08 互动在线(北京)科技有限公司 网站内容防采集系统和方法
CN102355458A (zh) * 2011-09-16 2012-02-15 四川长虹电器股份有限公司 一种提高网络接入成功率的方法
CN102739681A (zh) * 2012-06-29 2012-10-17 奇智软件(北京)有限公司 一种登录控件进行服务器登录的方法和装置
CN102882874A (zh) * 2012-09-29 2013-01-16 合一网络技术(北京)有限公司 一种用户服务权限保护装置及方法
CN102982141A (zh) * 2012-11-20 2013-03-20 北京搜狐新媒体信息技术有限公司 一种实现分布式数据库代理的方法及装置
CN103152354A (zh) * 2013-03-19 2013-06-12 北京奇虎科技有限公司 对危险网站进行提示的方法、系统及客户端设备
CN103179155A (zh) * 2011-12-22 2013-06-26 苏州威世博知识产权服务有限公司 一种自动获取代理的方法及系统
CN103475637A (zh) * 2013-04-24 2013-12-25 携程计算机技术(上海)有限公司 基于ip访问行为的网络访问控制方法及系统
CN103581328A (zh) * 2013-11-14 2014-02-12 广州品唯软件有限公司 产品属性数据的获取方法和系统
CN103607333A (zh) * 2013-11-22 2014-02-26 深圳维盟科技有限公司 端口代理服务器的局域网端口代理方法
CN103607410A (zh) * 2013-11-27 2014-02-26 中国联合网络通信集团有限公司 一种内容访问方法和设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060282408A1 (en) * 2003-09-30 2006-12-14 Wisely David R Search system and method via proxy server
CN102088477A (zh) * 2010-11-25 2011-06-08 互动在线(北京)科技有限公司 网站内容防采集系统和方法
CN102355458A (zh) * 2011-09-16 2012-02-15 四川长虹电器股份有限公司 一种提高网络接入成功率的方法
CN103179155A (zh) * 2011-12-22 2013-06-26 苏州威世博知识产权服务有限公司 一种自动获取代理的方法及系统
CN102739681A (zh) * 2012-06-29 2012-10-17 奇智软件(北京)有限公司 一种登录控件进行服务器登录的方法和装置
CN102882874A (zh) * 2012-09-29 2013-01-16 合一网络技术(北京)有限公司 一种用户服务权限保护装置及方法
CN102982141A (zh) * 2012-11-20 2013-03-20 北京搜狐新媒体信息技术有限公司 一种实现分布式数据库代理的方法及装置
CN103152354A (zh) * 2013-03-19 2013-06-12 北京奇虎科技有限公司 对危险网站进行提示的方法、系统及客户端设备
CN103475637A (zh) * 2013-04-24 2013-12-25 携程计算机技术(上海)有限公司 基于ip访问行为的网络访问控制方法及系统
CN103581328A (zh) * 2013-11-14 2014-02-12 广州品唯软件有限公司 产品属性数据的获取方法和系统
CN103607333A (zh) * 2013-11-22 2014-02-26 深圳维盟科技有限公司 端口代理服务器的局域网端口代理方法
CN103607410A (zh) * 2013-11-27 2014-02-26 中国联合网络通信集团有限公司 一种内容访问方法和设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105992194A (zh) * 2015-01-30 2016-10-05 阿里巴巴集团控股有限公司 网络数据内容的获取方法及装置
CN105992194B (zh) * 2015-01-30 2019-10-29 阿里巴巴集团控股有限公司 网络数据内容的获取方法及装置
CN105162830A (zh) * 2015-07-23 2015-12-16 浪潮软件集团有限公司 一种提高代理ip利用率的采集方法
CN109246180A (zh) * 2018-07-24 2019-01-18 孙满堂 信息查询方法、中转服务器及计算机可读介质
CN109246180B (zh) * 2018-07-24 2021-05-21 深圳市魔数智擎人工智能有限公司 信息查询方法、中转服务器及计算机可读介质
CN110062025A (zh) * 2019-03-14 2019-07-26 深圳绿米联创科技有限公司 数据采集的方法、装置、服务器及存储介质
CN110062025B (zh) * 2019-03-14 2022-09-09 深圳绿米联创科技有限公司 数据采集的方法、装置、服务器及存储介质
CN112583780A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 使用代理ip访问网站数据的方法、装置、系统和设备
CN112583780B (zh) * 2019-09-30 2023-04-07 北京国双科技有限公司 使用代理ip访问网站数据的方法、装置、系统和设备
CN117714537A (zh) * 2024-02-06 2024-03-15 湖南四方天箭信息科技有限公司 一种访问方法、装置、终端和存储介质
CN117714537B (zh) * 2024-02-06 2024-04-16 湖南四方天箭信息科技有限公司 一种访问方法、装置、终端和存储介质

Also Published As

Publication number Publication date
CN104092660B (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
CN104092660A (zh) 一种访问网络站点的方法
CN102957712B (zh) 网站资源加载方法和系统
CN104219230B (zh) 识别恶意网站的方法及装置
CN106933871A (zh) 短链接处理方法、装置及短链接服务器
DE602005020445D1 (de) Entdecken eines netzwerkelements in einem kommunikationssystem
CN104168316B (zh) 一种网页访问控制方法、网关
CN101833570A (zh) 一种移动终端页面推送优化的方法和装置
CN106341373B (zh) 用于检测和阻止恶意点击广告链接的方法和装置
US20140337536A1 (en) Method and apparatus for data communication
CN104933069A (zh) 一种桌面终端上网浏览统计的分析方法和系统
WO2016173349A1 (zh) 一种网络接入方法及移动通信终端
CN103200231B (zh) 策略控制方法及系统
CN104301161A (zh) 业务质量指标的计算方法、计算装置以及通信系统
CN103401861B (zh) 代理上网识别方法及装置
WO2014194704A1 (en) A grouping processing method and system
CN108366012A (zh) 一种社交关系建立方法、装置及电子设备
CN102880698B (zh) 一种抓取网站确定方法及装置
CN106484775A (zh) 一种基于selenium的爬虫抓取方法及系统
CN104967632B (zh) 网页异常数据处理方法、数据服务器及系统
CN107239542A (zh) 一种数据统计方法、装置、服务器及存储介质
CN104852997B (zh) 对网络地址的处理方法及服务器与计算机可读储存介质
CN104023093B (zh) 家庭基站接入网关的方法、系统以及接入导引服务器
CN106933885A (zh) 网站传播影响力的获取方法与装置
CN114040378B (zh) 应用的编排方法、装置、计算机设备和存储介质
CN105472029A (zh) 一种基于缓存的单点登录的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 430070 East Lake Hubei Development Zone, Optics Valley Software Park, a phase of the west, South Lake Road South, Optics Valley Software Park, No. 2, No. 5, layer 205, six

Applicant after: Language network (Wuhan) Information Technology Co., Ltd.

Address before: 430073 East Lake Hubei Development Zone, Optics Valley Software Park, a phase of the west, South Lake Road South, Optics Valley Software Park, No. 2, No. 5, layer 205, six

Applicant before: Wuhan Transn Information Technology Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant