CN110704566A - 基于地理位置的数据采集方法、装置、及计算机设备 - Google Patents
基于地理位置的数据采集方法、装置、及计算机设备 Download PDFInfo
- Publication number
- CN110704566A CN110704566A CN201910943382.4A CN201910943382A CN110704566A CN 110704566 A CN110704566 A CN 110704566A CN 201910943382 A CN201910943382 A CN 201910943382A CN 110704566 A CN110704566 A CN 110704566A
- Authority
- CN
- China
- Prior art keywords
- address
- client
- target
- data acquisition
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Remote Sensing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了基于地理位置的数据采集方法、装置、计算机设备及存储介质。该方法包括若检测到客户端发送的数据采集任务请求,接收与数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址;根据用户账号信息对应的地理位置分区和客户端IP地址,将本地的IP地址对应调整为地理位置分区对应的当前IP地址;根据用户账号信息登录目标地址对应的目标网站;以及根据数据采集任务请求在目标网站对应采集网页数据,得到并存储采集结果。本发明实施例实现了通过记录用户账号信息的地理位置分区,在使用用户账号进行目标网站登录前,先切换到对应地区的IP地址后再进行登录,实现了异地登录目标网站进行数据采集。
Description
技术领域
本发明涉及数据采集技术领域,尤其涉及一种基于地理位置的数据采集方法、装置、计算机设备及存储介质。
背景技术
目前,数据采集方法一般通过采集服务器的采集程序对目标服务器进行数据采集,通过用户授权账号进行网站登录时,由于采集服务器的IP归属地址和用户账号注册地址不在同一个地区,容易触发目标服务器中的目标网站基于异地登录的反爬机制,导致无法进行数据的采集。
发明内容
本发明实施例提供了一种基于地理位置的数据采集方法、装置、计算机设备及存储介质,旨在解决现有技术中目标服务器中的目标网站基于异地登录的反爬机制使得采集服务器无法正常通过用户授权账号进行网站登录以采集数据的问题。
第一方面,本发明实施例提供了一种基于地理位置的数据采集方法,其包括:
若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址;
根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址;
根据所述用户账号信息登录所述目标地址对应的目标网站;以及
根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。
第二方面,本发明实施例提供了一种基于地理位置的数据采集装置,其包括:
请求检测单元,用于若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址;
IP地址调整单元,用于根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址;
目标网址登录单元,用于根据所述用户账号信息登录所述目标地址对应的目标网站;以及
数据采集单元,用于根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于地理位置的数据采集方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于地理位置的数据采集方法。
本发明实施例提供了一种基于地理位置的数据采集方法、装置、计算机设备及存储介质,方法包括若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址;根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址;根据所述用户账号信息登录所述目标地址对应的目标网站;以及根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。本发明实施例实现了通过记录用户账号信息的地理位置分区,在使用用户账号进行目标网站登录前,先切换到对应地区的IP地址后再进行登录,实现了异地登录目标网站进行数据采集。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于地理位置的数据采集方法的应用场景示意图;
图2为本发明实施例提供的基于地理位置的数据采集方法的流程示意图;
图3为本发明实施例提供的基于地理位置的数据采集方法的子流程示意图;
图4为本发明实施例提供的基于地理位置的数据采集方法的另一子流程示意图;
图5为本发明实施例提供的基于地理位置的数据采集装置的示意性框图;
图6为本发明实施例提供的基于地理位置的数据采集装置的子单元示意性框图;
图7为本发明实施例提供的基于地理位置的数据采集装置的另一子单元示意性框图;
图8为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的基于地理位置的数据采集方法的应用场景示意图;图2为本发明实施例提供的基于地理位置的数据采集方法的流程示意图,该基于地理位置的数据采集方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S110~S140。
S110、若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址。
在本实施例中,为了更清楚的理解本申请的技术方案,下面对所涉及的终端进行介绍。本申请是在服务器的角度描述技术方案。
一是采集服务器,简记为服务器,用于根据用户端发送的数据采集任务请求,相应调整得到相同地区的当前IP地址后,登录目标服务器进行数据采集。
二是客户端,用于向服务器发送数据采集任务请求,以请求服务器辅助进行数据采集。
三是目标服务器,用于部署目标网站对应的数据,在接收到服务器的登录请求并验证用户账号和当前IP地址成功后,目标网站中的数据可被服务器所采集。
例如,当客户端和采集服务器均所属为同一企业,而客户端与采集服务器分别部署在不同的地理区域(如客户端部署在城市A,采集服务器部署在城市B)。当客户端有数据采集需求且客户端从目标服务器采集数据需要进行用户账号信息验证(主要是用户账号名称、密码及用户账号地理位置分区)时,若此时客户端因被其他需求占用不便于自身采集数据时,此时可以授权委托采集服务器帮其采集数据,也即与所述数据采集任务请求对应的用户账号信息被发送至采集服务器时,需要客户端的用户进行同意授权操作。
客户端的用户操作而触发数据采集任务请求后,由客户端将所述数据采集任务请求发送至服务器。服务器检测到该数据采集任务请求后,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址。
在一实施例中,步骤S110之后还包括:
判断所述客户端IP地址是否存在于预先存储的有效IP地址列表中;
若所述客户端IP地址存在于所述有效IP地址列表中,与所述客户端建立连接;
若所述客户端IP地址未存在于所述有效IP地址列表中,发送用于提示所述客户端IP地址为无效IP地址的提示信息至客户端。
在本实施例中,服务器接收了所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址后,为了进一步确认客户端的合法性(也就是判断该用户端是否有调用服务器进行数据采集的权限),此时先获取服务器中预先存储的有效IP地址列表,然后判断所述客户端IP地址是否存在于预先存储的有效IP地址列表中。
若所述客户端IP地址存在于所述有效IP地址列表中,表示客户端有权限与服务器进行连接,此时服务器与客户端成功建立连接。若所述客户端IP地址未存在于所述有效IP地址列表中,表示客户端可能因错误访问服务器而导致无权限调用该服务器,此时服务器发送用于提示所述客户端IP地址为无效IP地址的提示信息至客户端。通过这一验证方式,能有效隔绝服务器中的无效客户端连接请求。
S120、根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址。
在本实施例中,当服务器与客户端建立连接后,由于目标服务器对访问其的终端有账户验证及账户地理位置分区验证的双重验证,此时为了确保服务器成功的与目标服务器建立连接,可根据所述用户账号信息对应的地理位置分区将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址,当前IP地址与所述客户端IP地址属于同一地理位置分区。通过这一IP地址修改,能使得服务器具备通过目标服务器的地理位置分区验证的IP地址。
在一实施例中,如图3所示,步骤S120包括:
S121、根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,获取与所述客户端IP地址对应的IP代理;
S122、由所述IP代理将本地的IP地址调整为所述地理位置分区对应的当前IP地址。
在本实施例中,对服务器的IP地址进行调整时,先根据所述用户账号信息对应的地理位置分区匹配目标地理分区,之后服务器再对应调用该目标地理分区的IP代理,由该IP代理将服务器本地的IP地址调整为所述地理位置分区对应的当前IP地址。此时,通过这一IP地址修改,能使得服务器具备通过目标服务器的地理位置分区验证的IP地址。
S130、根据所述用户账号信息登录所述目标地址对应的目标网站。
在本实施例中,当服务器完成了IP地址的调整后,可根据所述用户账号信息中的用户账号名称和密码登录所述目标地址对应的目标网站。此时目标网站会对服务器的用户账号名称、密码登录及当前IP地址进行多重验证,只有当用户账号名称、密码登录及当前IP地址均通过验证时,才能成功与所述目标地址对应的目标网站建立连接。
在一实施例中,步骤S130之前,还包括:
由IP代理将所述数据采集任务请求进行初始化,得到数据采集任务。
在本实施例中,由客户端初始发送至服务器的所述数据采集任务请求,在服务器的IP地址根据地理位置分区和所述客户端IP地址对应进行调整后,需要由IP代理将所述数据采集任务请求进行初始化,生成与服务器相对应的数据采集任务。该数据采集任务至少目标地址、数据采集任务信息(所述采集任务信息包括数据采集目标字段、及目标字段划分信息)及数据采集任务有效时间段等信息。之后,服务器即可根据所述数据采集任务去目标服务器采集数据。
S140、根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。
在本实施例中,当服务器与目标网站成功建立连接后,即可根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到采集结果。具体是通过服务器中的数据采集工具具体根据配置参数(配置参数的来源即数据采集任务请求)进行目标数据的采集,从而得到采集结果。
在一实施例中,如图4所示,步骤S140包括:
S141、根据所述数据采集任务获取对应的采集目标字段、目标字段划分信息、及采集任务有效时间段;
S142、根据所述数据采集任务对应的采集目标字段、目标字段划分信息、及采集任务有效时间段在所述目标网站获取对应的目标数据集;
S143、将所得到的目标数据集进行存储。
在本实施例中,服务器发送至目标服务器的数据采集任务包括采集目标字段、目标字段划分信息、及采集任务有效时间段等信息,此时服务器即可根据上述信息在目标服务器中获取对应的目标数据集,并将所获取的目标数据集存储在服务器本地,从而实现数据采集。
在一实施例中,步骤S140之后,还包括:
根据所述目标字段划分信息将所述目标数据集划分为多个子数据表,以分别按各子数据表对应进行存储。
在本实施例中,所述采集结果是服务端根据数据采集任务而在目标服务器中对应采集得到,而所述数据采集任务中包括数据采集目标字段、目标字段划分信息及数据采集任务有效时间段,此时可以根据目标字段划分信息将各数据采集目标字段进行有效分组,例如将数据采集目标字段1-5分配至子数据表1进行存储,将数据采集目标字段6-10分配至子数据表2进行存储,从而实现对采集结果中的数据进行有效分组。
当在服务器中完成了采集结果的存储之后,还包括:将所述采集结果发送至客户端。通过上述过程,实现了及时将采集结果回传至用户端,以满足用户端的数据使用需求。
该方法实现了通过记录用户账号信息的地理位置分区,在使用用户账号进行目标网站登录前,先切换到对应地区的IP地址后再进行登录,实现了异地登录目标网站进行数据采集。
本发明实施例还提供一种基于地理位置的数据采集装置,该基于地理位置的数据采集装置用于执行前述基于地理位置的数据采集方法的任一实施例。具体地,请参阅图5,图5是本发明实施例提供的基于地理位置的数据采集装置的示意性框图。该基于地理位置的数据采集装置100可以配置于服务器中。
如图5所示,基于地理位置的数据采集装置100包括请求检测单元110、IP地址调整单元120、目标网址登录单元130、数据采集单元140。
请求检测单元110,用于若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址。
在本实施例中,例如,当客户端和采集服务器均所属为同一企业,而客户端与采集服务器分别部署在不同的地理区域(如客户端部署在城市A,采集服务器部署在城市B)。当客户端有数据采集需求且客户端从目标服务器采集数据需要进行用户账号信息验证(主要是用户账号名称、密码及用户账号地理位置分区)时,若此时客户端因被其他需求占用不便于自身采集数据时,此时可以授权委托采集服务器帮其采集数据,也即与所述数据采集任务请求对应的用户账号信息被发送至采集服务器时,需要客户端的用户进行同意授权操作。
客户端的用户操作而触发数据采集任务请求后,由客户端将所述数据采集任务请求发送至服务器。服务器检测到该数据采集任务请求后,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址。
在一实施例中,基于地理位置的数据采集装置100还包括:
IP地址有效性判断单元,用于判断所述客户端IP地址是否存在于预先存储的有效IP地址列表中;
连接建立单元,用于若所述客户端IP地址存在于所述有效IP地址列表中,与所述客户端建立连接;
无效IP提示单元,用于若所述客户端IP地址未存在于所述有效IP地址列表中,发送用于提示所述客户端IP地址为无效IP地址的提示信息至客户端。
在本实施例中,服务器接收了所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址后,为了进一步确认客户端的合法性(也就是判断该用户端是否有调用服务器进行数据采集的权限),此时先获取服务器中预先存储的有效IP地址列表,然后判断所述客户端IP地址是否存在于预先存储的有效IP地址列表中。
若所述客户端IP地址存在于所述有效IP地址列表中,表示客户端有权限与服务器进行连接,此时服务器与客户端成功建立连接。若所述客户端IP地址未存在于所述有效IP地址列表中,表示客户端可能因错误访问服务器而导致无权限调用该服务器,此时服务器发送用于提示所述客户端IP地址为无效IP地址的提示信息至客户端。通过这一验证方式,能有效隔绝服务器中的无效客户端连接请求。
IP地址调整单元120,用于根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址。
在本实施例中,当服务器与客户端建立连接后,由于目标服务器对访问其的终端有账户验证及账户地理位置分区验证的双重验证,此时为了确保服务器成功的与目标服务器建立连接,可根据所述用户账号信息对应的地理位置分区将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址,当前IP地址与所述客户端IP地址属于同一地理位置分区。通过这一IP地址修改,能使得服务器具备通过目标服务器的地理位置分区验证的IP地址。
在一实施例中,如图6所示,IP地址调整单元120包括:
IP代理获取单元121,用于根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,获取与所述客户端IP地址对应的IP代理;
当前IP地址获取单元122,用于由所述IP代理将本地的IP地址调整为所述地理位置分区对应的当前IP地址。
在本实施例中,对服务器的IP地址进行调整时,先根据所述用户账号信息对应的地理位置分区匹配目标地理分区,之后服务器再对应调用该目标地理分区的IP代理,由该IP代理将服务器本地的IP地址调整为所述地理位置分区对应的当前IP地址。此时,通过这一IP地址修改,能使得服务器具备通过目标服务器的地理位置分区验证的IP地址。
目标网址登录单元130,用于根据所述用户账号信息登录所述目标地址对应的目标网站。
在本实施例中,当服务器完成了IP地址的调整后,可根据所述用户账号信息中的用户账号名称和密码登录所述目标地址对应的目标网站。此时目标网站会对服务器的用户账号名称、密码登录及当前IP地址进行多重验证,只有当用户账号名称、密码登录及当前IP地址均通过验证时,才能成功与所述目标地址对应的目标网站建立连接。
在一实施例中,基于地理位置的数据采集装置100之前,还包括:
任务再次初始化单元,用于由IP代理将所述数据采集任务请求进行初始化,得到数据采集任务。
在本实施例中,由客户端初始发送至服务器的所述数据采集任务请求,在服务器的IP地址根据地理位置分区和所述客户端IP地址对应进行调整后,需要由IP代理将所述数据采集任务请求进行初始化,生成与服务器相对应的数据采集任务。该数据采集任务至少目标地址、数据采集任务信息(所述采集任务信息包括数据采集目标字段、及目标字段划分信息)及数据采集任务有效时间段等信息。之后,服务器即可根据所述数据采集任务去目标服务器采集数据。
数据采集单元140,用于根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。
在本实施例中,当服务器与目标网站成功建立连接后,即可根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到采集结果。具体是通过服务器中的数据采集工具具体根据配置参数(配置参数的来源即数据采集任务请求)进行目标数据的采集,从而得到采集结果。
在一实施例中,如图7所示,数据采集单元140包括:
采集任务解析单元141,用于根据所述数据采集任务获取对应的采集目标字段、目标字段划分信息、及采集任务有效时间段;
目标数据集获取单元142,用于根据所述数据采集任务对应的采集目标字段、目标字段划分信息、及采集任务有效时间段在所述目标网站获取对应的目标数据集;
目标数据集存储单元143,用于将所得到的目标数据集进行存储。
在本实施例中,服务器发送至目标服务器的数据采集任务包括采集目标字段、目标字段划分信息、及采集任务有效时间段等信息,此时服务器即可根据上述信息在目标服务器中获取对应的目标数据集,并将所获取的目标数据集存储在服务器本地,从而实现数据采集。
在一实施例中,基于地理位置的数据采集装置100还包括:
分表存储单元,用于根据所述目标字段划分信息将所述目标数据集划分为多个子数据表,以分别按各子数据表对应进行存储。
在本实施例中,所述采集结果是服务端根据数据采集任务而在目标服务器中对应采集得到,而所述数据采集任务中包括数据采集目标字段、目标字段划分信息及数据采集任务有效时间段,此时可以根据目标字段划分信息将各数据采集目标字段进行有效分组,例如将数据采集目标字段1-5分配至子数据表1进行存储,将数据采集目标字段6-10分配至子数据表2进行存储,从而实现对采集结果中的数据进行有效分组。
当在服务器中完成了采集结果的存储之后,还包括:将所述采集结果发送至客户端。通过上述过程,实现了及时将采集结果回传至用户端,以满足用户端的数据使用需求。
该装置实现了通过记录用户账号信息的地理位置分区,在使用用户账号进行目标网站登录前,先切换到对应地区的IP地址后再进行登录,实现了异地登录目标网站进行数据采集。
上述基于地理位置的数据采集装置可以实现为计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。
请参阅图8,图8是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图8,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于地理位置的数据采集方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于地理位置的数据采集方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图8中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的基于地理位置的数据采集方法。
本领域技术人员可以理解,图8中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图8所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的基于地理位置的数据采集方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于地理位置的数据采集方法,其特征在于,包括:
若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址;
根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址;
根据所述用户账号信息登录所述目标地址对应的目标网站;以及
根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。
2.根据权利要求1所述的基于地理位置的数据采集方法,其特征在于,所述接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址之后,还包括:
判断所述客户端IP地址是否存在于预先存储的有效IP地址列表中;
若所述客户端IP地址存在于所述有效IP地址列表中,与所述客户端建立连接;
若所述客户端IP地址未存在于所述有效IP地址列表中,发送用于提示所述客户端IP地址为无效IP地址的提示信息至客户端。
3.根据权利要求1所述的基于地理位置的数据采集方法,其特征在于,所述根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址,包括:
根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,获取与所述客户端IP地址对应的IP代理;
由所述IP代理将本地的IP地址调整为所述地理位置分区对应的当前IP地址。
4.根据权利要求1所述的基于地理位置的数据采集方法,其特征在于,所述根据所述用户账号信息登录所述目标地址对应的目标网站之前,还包括:
由IP代理将所述数据采集任务请求进行初始化,得到数据采集任务。
5.根据权利要求4所述的基于地理位置的数据采集方法,其特征在于,所述根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果,包括:
根据所述数据采集任务获取对应的采集目标字段、目标字段划分信息、及采集任务有效时间段;
根据所述数据采集任务对应的采集目标字段、目标字段划分信息、及采集任务有效时间段在所述目标网站获取对应的目标数据集;
将所得到的目标数据集进行存储。
6.根据权利要求5所述的基于地理位置的数据采集方法,所述将所得到的目标数据集进行存储,包括:
根据所述目标字段划分信息将所述目标数据集划分为多个子数据表,以分别按各子数据表对应进行存储。
7.一种基于地理位置的数据采集装置,其特征在于,包括:
请求检测单元,用于若检测到客户端发送的数据采集任务请求,接收与所述数据采集任务请求对应的用户账号信息、客户端IP地址、目标地址;
IP地址调整单元,用于根据所述用户账号信息对应的地理位置分区和所述客户端IP地址,将本地的IP地址对应调整为所述地理位置分区对应的当前IP地址;
目标网址登录单元,用于根据所述用户账号信息登录所述目标地址对应的目标网站;以及
数据采集单元,用于根据所述数据采集任务请求在所述目标网站对应采集网页数据,得到并存储采集结果。
8.根据权利要求7所述的基于地理位置的数据采集装置,其特征在于,还包括:
IP地址有效性判断单元,用于判断所述客户端IP地址是否存在于预先存储的有效IP地址列表中;
连接建立单元,用于若所述客户端IP地址存在于所述有效IP地址列表中,与所述客户端建立连接;
无效IP提示单元,用于若所述客户端IP地址未存在于所述有效IP地址列表中,发送用于提示所述客户端IP地址为无效IP地址的提示信息至客户端。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于地理位置的数据采集方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6任一项所述的基于地理位置的数据采集方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943382.4A CN110704566B (zh) | 2019-09-30 | 2019-09-30 | 基于地理位置的数据采集方法、装置、及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910943382.4A CN110704566B (zh) | 2019-09-30 | 2019-09-30 | 基于地理位置的数据采集方法、装置、及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110704566A true CN110704566A (zh) | 2020-01-17 |
CN110704566B CN110704566B (zh) | 2022-05-13 |
Family
ID=69198118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910943382.4A Active CN110704566B (zh) | 2019-09-30 | 2019-09-30 | 基于地理位置的数据采集方法、装置、及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110704566B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111447292A (zh) * | 2020-02-24 | 2020-07-24 | 北京邮电大学 | 一种IPv6地理位置定位方法、装置、设备及存储介质 |
CN111611573A (zh) * | 2020-05-20 | 2020-09-01 | 深圳市镜玩科技有限公司 | 实现终端设备切换的数据处理方法、相关设备及介质 |
US20210349951A1 (en) * | 2020-05-05 | 2021-11-11 | Asustek Computer Inc. | Internet data collection method |
CN116432190A (zh) * | 2023-06-15 | 2023-07-14 | 杭州美创科技股份有限公司 | 接口未授权访问检测方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1476585A (zh) * | 2001-08-24 | 2004-02-18 | ��ϰ�� | 便携式数据采集和管理系统、相关设备和方法 |
CN101315695A (zh) * | 2008-07-09 | 2008-12-03 | 北京九恒星科技股份有限公司 | 银行信息处理方法及数据提取组件 |
CN101441689A (zh) * | 2007-11-23 | 2009-05-27 | 杨筑平 | 登录保护方法 |
CN102377785A (zh) * | 2011-11-28 | 2012-03-14 | 上海量明科技发展有限公司 | 即时通信中向自身发送数据的方法和系统 |
CN207939653U (zh) * | 2018-03-05 | 2018-10-02 | 南昌航空大学 | 一种无线遥控的辐射区域实时监测装置 |
-
2019
- 2019-09-30 CN CN201910943382.4A patent/CN110704566B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1476585A (zh) * | 2001-08-24 | 2004-02-18 | ��ϰ�� | 便携式数据采集和管理系统、相关设备和方法 |
CN101441689A (zh) * | 2007-11-23 | 2009-05-27 | 杨筑平 | 登录保护方法 |
CN101315695A (zh) * | 2008-07-09 | 2008-12-03 | 北京九恒星科技股份有限公司 | 银行信息处理方法及数据提取组件 |
CN102377785A (zh) * | 2011-11-28 | 2012-03-14 | 上海量明科技发展有限公司 | 即时通信中向自身发送数据的方法和系统 |
CN207939653U (zh) * | 2018-03-05 | 2018-10-02 | 南昌航空大学 | 一种无线遥控的辐射区域实时监测装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111447292A (zh) * | 2020-02-24 | 2020-07-24 | 北京邮电大学 | 一种IPv6地理位置定位方法、装置、设备及存储介质 |
US20210349951A1 (en) * | 2020-05-05 | 2021-11-11 | Asustek Computer Inc. | Internet data collection method |
US11630872B2 (en) * | 2020-05-05 | 2023-04-18 | Asustek Computer Inc. | Internet data collection method |
CN111611573A (zh) * | 2020-05-20 | 2020-09-01 | 深圳市镜玩科技有限公司 | 实现终端设备切换的数据处理方法、相关设备及介质 |
CN111611573B (zh) * | 2020-05-20 | 2023-10-03 | 深圳市镜玩科技有限公司 | 实现终端设备切换的数据处理方法、相关设备及介质 |
CN116432190A (zh) * | 2023-06-15 | 2023-07-14 | 杭州美创科技股份有限公司 | 接口未授权访问检测方法、装置、计算机设备及存储介质 |
CN116432190B (zh) * | 2023-06-15 | 2023-09-08 | 杭州美创科技股份有限公司 | 接口未授权访问检测方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110704566B (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704566B (zh) | 基于地理位置的数据采集方法、装置、及计算机设备 | |
US20230379316A1 (en) | Tenant-aware distributed application authentication | |
CN104506510B (zh) | 用于设备认证的方法、装置及认证服务系统 | |
CN107580046B (zh) | 长连接服务系统及方法 | |
US10206099B1 (en) | Geolocation-based two-factor authentication | |
US20140157381A1 (en) | Frictionless multi-factor authentication system and method | |
CN105991614B (zh) | 一种开放授权、资源访问的方法及装置、服务器 | |
JP2012508410A (ja) | Id盗難又は複製を用いた不正使用に対する保護の方法とシステム | |
WO2015158129A1 (en) | An exception prompting method, apparatus, and system using the same | |
JP2016524248A (ja) | 身元情報の窃盗又は複製行為から保護する方法及びシステム | |
JP4753953B2 (ja) | ソフトウェア実行管理装置、その方法及びプログラム | |
TW201631510A (zh) | 身份認證方法、裝置、伺服器及終端 | |
JP2020177537A (ja) | 認証認可サーバー、クライアント、サービス提供システム、アクセス管理方法とプログラム | |
US20180034809A1 (en) | Technique for connecting to a service | |
CN108076077A (zh) | 一种会话控制方法及装置 | |
US20240275794A1 (en) | Limiting discovery of a protected resource in a zero trust access model | |
CN110677423A (zh) | 基于客户代理端的数据采集方法、装置、及计算机设备 | |
CN106254328B (zh) | 一种访问控制方法及装置 | |
US8290901B2 (en) | Techniques for remote resource mounting | |
CN110691091A (zh) | 基于身份认证的数据采集方法、装置、及计算机设备 | |
CN112367666A (zh) | 一种5G核心网中pNF通过NRF认证cNF的方法、装置及系统 | |
CN108494843A (zh) | 网盘空间共享方法、装置及设备 | |
CN113472735B (zh) | 一种大数据服务单点登录方法、装置及存储介质 | |
US9386042B1 (en) | Methods, systems, and computer readable mediums for utilizing geographical location information to manage applications in a computer network system | |
JP6059748B2 (ja) | 認証連携システム及び認証方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |