CN103179155A - 一种自动获取代理的方法及系统 - Google Patents
一种自动获取代理的方法及系统 Download PDFInfo
- Publication number
- CN103179155A CN103179155A CN2011104349357A CN201110434935A CN103179155A CN 103179155 A CN103179155 A CN 103179155A CN 2011104349357 A CN2011104349357 A CN 2011104349357A CN 201110434935 A CN201110434935 A CN 201110434935A CN 103179155 A CN103179155 A CN 103179155A
- Authority
- CN
- China
- Prior art keywords
- address
- agent
- automatic acquisition
- agency
- threshold values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供一种自动获取代理的方法及系统,其中方法包括以下步骤:通过解析网页源代码获取待验证的代理IP地址;检验获取到的代理IP地址是否能够根据固定条件返回预期结果;保留能够返回预期结果的代理IP地址。本发明能够自动获取到可用的代理IP地址,无需手动操作,显著提高了工作效率。
Description
技术领域
本发明涉及专利数据库管理领域,尤其涉及一种自动获取代理的方法及系统。
背景技术
在专利检索分析过程中,常常需要链接到其它国家或地区的专利局网站进行相关专利的下载,但在有些时候这些网站被屏蔽掉或不允许访问。现有技术下,一般是通过在网络页面上寻找到代理地址,然后通过人工一个个键入IP地址进行测试,从而找到可用的代理地址。这种方法往往需要耗费大量时间,从而降低了工作效率。
因此,有必要提供一种自动获取代理的方法及系统以克服上述问题。
发明内容
本发明的目的在于提供一种自动获取代理的方法。
本发明的另一目的在于提供一种自动获取代理的系统,该系统应用于所述自动获取代理的方法。
相应地,本发明的一种自动获取代理的方法,包括以下步骤:
S10,通过解析网页源代码获取待验证的代理IP地址;
S20,检验获取到的代理IP地址是否能够根据固定条件返回预期结果;
S30,保留能够返回预期结果的代理IP地址。
作为本发明的进一步改进,S20中进一步设定速度阀值,代理IP地址的连接速度超过阀值则丢弃。
作为本发明的进一步改进,所述速度阀值设定为10秒。
作为本发明的进一步改进,S30中可保留多个IP地址,在一个IP地址无法使用时,自动切换到下一个IP地址。
相应地,本发明的一种自动获取代理的系统,包括:
搜索模块,用以通过解析网页源代码获取待验证的代理IP地址;
分析模块,用以检验获取到的代理IP地址是否能够根据固定条件返回预期结果;
储存模块,用以保留能够返回预期结果的代理IP地址。
作为本发明的进一步改进,分析模块中设定速度阀值,代理IP地址的连接速度超过阀值则丢弃。
作为本发明的进一步改进,所述速度阀值设定为10秒。
作为本发明的进一步改进,所述储存模块中可保留多个IP地址,在一个IP地址无法使用时,自动切换到下一个IP地址。
本发明的有益效果是:本发明能够自动获取到可用的代理IP地址,无需手动操作,显著提高了工作效率。
附图说明
图1所示为本发明一种实施方式的流程图;
图2所示为本发明一实施方式的系统模块图。
具体实施方式
以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
如图1所示,本发明一实施方式一种自动获取代理的方法,包括以下步骤:
S10,通过解析网页源代码获取待验证的代理IP地址;
S20,检验获取到的代理IP地址是否能够根据固定条件返回预期结果;
S30,保留能够返回预期结果的代理IP地址。
具体地,数据库系统中的搜索模块通过解析网站上特定网页的源代码将待验证的代理IP地址提取出来,在这个过程中,网页的源代码除了代理IP地址外,还有其它的源代码,那么解析模块通过限定特定特征,比如:必须全是数字,必须具有至少两个冒号等,将其它源代码剔除掉。然后分析模块对获取到的代理IP地址进行分析,首先需要分析代理IP地址是否可用,正常情况下待分析代理IP地址根据一固定条件返回的结果是可以预期的,如果待分析的代理IP地址返回的结果与预期结果不同,则表明该待分析的代理IP地址不可用。储存模块将能够返回预期结果的代理IP地址进行储存。但是,即使验证到一个代理IP地址可用,如果它的连接速度特别慢,同样也不能实现快速流畅的下载。优选地,分析模块中进一步设定了速度阀值,如果经测试,可用的代理IP地址传输速度超过设定的阀值,那么这样的代理IP地址同样会被丢弃掉,不会在储存模块进行存储。本发明实施方式中设定的速度阀值为10秒。
在得到合适的代理IP地址后,数据库系统就通过该代理IP地址下载相关专利。但是,在实际应用中,往往开始找到的传输速度较快的代理IP地址在下载一段时间后速度变慢或无法下载。因此,储存模块中一般储存有多个代理IP地址,在一个代理IP地址出现故障时,自动切换到下一个代理IP地址。优选地,储存模块中储存有5个代理IP地址。分析模块在检验多个获取到的待检验代理IP地址时,采取逐个自动写入,检验到合适的代理IP地址后就储存在储存模块里。如果检验到5个合适的代理IP地址,则分析模块停止对剩下的待检验代理IP地址进行测试。
如图2所示,本发明一实施方式一种自动获取代理的系统,包括:
搜索模块,用以通过解析网页源代码获取待验证的代理IP地址;
分析模块,用以检验获取到的代理IP地址是否能够根据固定条件返回预期结果;
储存模块,用以保留能够返回预期结果的代理IP地址。
本发明能够自动获取到可用的代理IP地址,无需手动操作,显著提高了工作效率。
为了描述的方便,描述以上系统时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的系统实施方式仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置,或通信设备中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (8)
1.一种自动获取代理的方法,其特征在于,包括以下步骤:
S10,通过解析网页源代码获取待验证的代理IP地址;
S20,检验获取到的代理IP地址是否能够根据固定条件返回预期结果;
S30,保留能够返回预期结果的代理IP地址。
2.根据权利要求1所述的自动获取代理的方法,其特征在于,S20中进一步设定速度阀值,代理IP地址的连接速度超过阀值则丢弃。
3.根据权利要求2所述的自动获取代理的方法,其特征在于,所述速度阀值设定为10秒。
4.根据权利要求1至3中任一项所述的自动获取代理的方法,其特征在于,S30中可保留多个IP地址,在一个IP地址无法使用时,自动切换到下一个IP地址。
5.一种自动获取代理的系统,其特征在于,包括:
搜索模块,用以通过解析网页源代码获取待验证的代理IP地址;
分析模块,用以检验获取到的代理IP地址是否能够根据固定条件返回预期结果;
储存模块,用以保留能够返回预期结果的代理IP地址。
6.根据权利要求5所述的自动获取代理的系统,其特征在于,分析模块中设定速度阀值,代理IP地址的连接速度超过阀值则丢弃。
7.根据权利要求6所述的自动获取代理的系统,其特征在于,所述速度阀值设定为10秒。
8.根据权利要求5至7中任一项所述的自动获取代理的系统,其特征在于,所述储存模块中可保留多个IP地址,在一个IP地址无法使用时,自动切换到下一个IP地址。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104349357A CN103179155A (zh) | 2011-12-22 | 2011-12-22 | 一种自动获取代理的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104349357A CN103179155A (zh) | 2011-12-22 | 2011-12-22 | 一种自动获取代理的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103179155A true CN103179155A (zh) | 2013-06-26 |
Family
ID=48638778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011104349357A Pending CN103179155A (zh) | 2011-12-22 | 2011-12-22 | 一种自动获取代理的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103179155A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104092660A (zh) * | 2014-06-09 | 2014-10-08 | 武汉传神信息技术有限公司 | 一种访问网络站点的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101102313A (zh) * | 2007-06-21 | 2008-01-09 | 潘晓梅 | 自动更换代理服务器的网络下载系统及方法 |
CN101217508A (zh) * | 2007-12-29 | 2008-07-09 | 腾讯科技(深圳)有限公司 | 一种基于即时通信平台的网络代理系统及其实现方法 |
CN101510874A (zh) * | 2009-03-20 | 2009-08-19 | 腾讯科技(深圳)有限公司 | 网络连接设置系统及方法、网络通讯工具及方法 |
-
2011
- 2011-12-22 CN CN2011104349357A patent/CN103179155A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101102313A (zh) * | 2007-06-21 | 2008-01-09 | 潘晓梅 | 自动更换代理服务器的网络下载系统及方法 |
CN101217508A (zh) * | 2007-12-29 | 2008-07-09 | 腾讯科技(深圳)有限公司 | 一种基于即时通信平台的网络代理系统及其实现方法 |
CN101510874A (zh) * | 2009-03-20 | 2009-08-19 | 腾讯科技(深圳)有限公司 | 网络连接设置系统及方法、网络通讯工具及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104092660A (zh) * | 2014-06-09 | 2014-10-08 | 武汉传神信息技术有限公司 | 一种访问网络站点的方法 |
CN104092660B (zh) * | 2014-06-09 | 2018-09-21 | 语联网(武汉)信息技术有限公司 | 一种访问网络站点的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102708050B (zh) | 移动应用测试方法和系统 | |
CN112261118B (zh) | 多媒体数据的异常检测方法、终端及服务器 | |
CN104067276B (zh) | 客户机侧最小下载和模拟的页面导航特征 | |
CN104539487A (zh) | 一种基于云平台的系统测试及可靠性评估方法 | |
CN105099755A (zh) | 一种监控网站系统性能的方法、设备和系统 | |
CN104978529A (zh) | 网页前端的异常处理方法、异常处理系统及异常处理服务器 | |
CN104978258A (zh) | 软件自动化测试方法及系统 | |
CN104536899A (zh) | 一种基于智能集群的软件部署及其维护方法 | |
CN103377127A (zh) | 网页产品的开发测试系统、测试方法及装置 | |
CN104838405A (zh) | 用于应用程序的测试框架 | |
CN104641353A (zh) | 在连续部署的情况下可用的监视器 | |
CN107370804B (zh) | 软件应用处理方法和装置 | |
CN101202649A (zh) | 计算机设备信息的收集和管理方法 | |
CN102970369A (zh) | 一种下载用浏览器及下载方法 | |
CN105204986A (zh) | 产品的自动化测试方法、服务器及移动设备 | |
CN111782317A (zh) | 页面的测试方法和装置、存储介质和电子装置 | |
CN103246606A (zh) | Esb平台的性能方法和系统 | |
CN104579830A (zh) | 服务监控方法及装置 | |
CN112433899A (zh) | 一种云服务器批量检测方法、装置、设备及存储介质 | |
CN104951382A (zh) | 基于app映射库的智能终端用户行为分析方法和系统 | |
CN111654495B (zh) | 用于确定流量产生来源的方法、装置、设备及存储介质 | |
US9866466B2 (en) | Simulating real user issues in support environments | |
CN112818201A (zh) | 一种网络数据采集方法、装置、计算机设备及存储介质 | |
CN102014163B (zh) | 一种基于事务驱动的云存储测试方法及系统 | |
US10761862B2 (en) | Method and device for adding indicative icon in interactive application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130626 |