CN102710559A - 一种反向代理技术实现数字文献资源网关的方法 - Google Patents

一种反向代理技术实现数字文献资源网关的方法 Download PDF

Info

Publication number
CN102710559A
CN102710559A CN2012102065406A CN201210206540A CN102710559A CN 102710559 A CN102710559 A CN 102710559A CN 2012102065406 A CN2012102065406 A CN 2012102065406A CN 201210206540 A CN201210206540 A CN 201210206540A CN 102710559 A CN102710559 A CN 102710559A
Authority
CN
China
Prior art keywords
resource
download
user
gateway
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102065406A
Other languages
English (en)
Other versions
CN102710559B (zh
Inventor
曹方
施韶亭
杨生举
赵凡
张龙
肖琬蓉
赵昕晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GANSU PROVINCIAL SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Original Assignee
GANSU PROVINCIAL SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GANSU PROVINCIAL SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE filed Critical GANSU PROVINCIAL SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority to CN201210206540.6A priority Critical patent/CN102710559B/zh
Publication of CN102710559A publication Critical patent/CN102710559A/zh
Application granted granted Critical
Publication of CN102710559B publication Critical patent/CN102710559B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种反向代理技术实现数字文献资源网关的方法,在客户机和内部服务器之间部署具有反向代理服务的资源网关HTTP服务器;每一种文献资源服务器建立一个虚拟主机,并分配唯一的HTTP端口;资源网关HTTP服务器上建立每个文献资源访问的受控URL列表,对有下载内容的关键URL地址按照正则表达式给予统一地址重定向;按照时间和下载量判断用户下载资源是否超过过量下载阀值,超过阀值提醒用户不能下载;合法,执行资源下载,将下载内容发给用户。本方法降低了服务器不断重定向地址引发的性能损耗和系统部署难度,提升了资源网关的稳定性和效能,提高了资源过度下载控制的时效。

Description

一种反向代理技术实现数字文献资源网关的方法
技术领域
本发明属于数字文献资源管理技术领域,主要涉及反向代理(Reverse Proxy)技术,通过资源网关实现对用户的统一授权,对数字文献资源进行透明访问和原文下载控制的方法,具体涉及一种反向代理技术实现数字文献资源网关的方法。
背景技术
反向代理(Reverse Proxy)技术是指以代理服务器来接受Internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给Internet上请求连接的客户端。主要起到作用为:加密和SSL加速、负载平衡、缓存静态内容、压缩、减速上传、网络安全等。支持反向代理的WEB服务协议主要为HTTP、HTTPS、FTP、DNS、VPN和SSH等。
HTTP协议的反向代理技术中主要采用转发(ProxyPass)和重定向(Rewrite)两种方式对用户的URL请求进行处理。两种方式中,重定向方式不仅执行效率低,过多的请求会造成系统混乱、脆弱和难以维持。普通的资源网关主要采用目录形式区分资源,如地址后加“/source1”代表某以资源,使得反向代理技术需过多采用重定向方式不断改写地址。此种方法在一定程度上可以解决内部数字文献资源的透明访问,实现用户访问的验证和文献资源的控制管理。但此种方法主要采用一个标准HTTP端口访问,会造成反向代理服务器负载过大,服务容易出现问题,稳定性较差。其次,采用目录区分资源的方法,一方面会导致大量的地址重定向,另一方面为了保持网页内容的一致性,HTTP响应数据需二次清理网页内URL地址,造成了资源网关服务器的效能低下。第三,在资源控制方法上,由于采用日志分析方法确定资源是否被过多下载,具有明显的时间滞后性,也不能满足大用户量的访问控制。
发明内容
为了克服上述现有技术中存在的问题,本发明的目的是提供一种反向代理技术实现数字文献资源网关的方法,优化目前图书情报机构对数字文献资源和用户的统一控制及管理的过程,提高转发方法、大幅度减少重定向方法的使用,提升网关的稳定性。
为实现上述目的,本发明所采用的技术方案是:一种反向代理技术实现数字文献资源网关的方法,具体按以下步骤进行::
步骤1:在外部客户机和内部数字资源服务器之间部署具有反向代理服务的资源网关HTTP服务器;为每一种文献资源服务器建立一个外网可访问的虚拟主机,给每一个虚拟主机分配一个唯一的HTTP端口;
步骤2:在资源网关HTTP服务器上建立每个文献资源访问的受控URL列表,对有下载内容的关键URL地址按照正则表达式给予地址重定向,重定向的地址为统一的资源控制模块的接口程序;
步骤3:在资源控制模块接口程序中,首先调入用户管理模块,验证用户登录信息是否合法,若不合法则提示用户登录;按照时间和下载量判断用户下载资源是否超过过量下载阀值,超过阀值提醒用户不能下载;检验合法后,服务程序执行资源下载工作,并将下载内容发送给用户客户端。
所述步骤1中还在文献服务的网站页面给出含有不同端口资源的下载地址导航信息,供用户进行访问。
所述步骤3中将下载内容发送给用户客户端后调入业务管理模块,进行相应的账务处理。
本发明方法具有如下优点:
1)采用端口区分资源相比按目录区分资源,不但降低了服务器因不断重定向地址而引发的性能损耗,而且降低了系统的部署难度,使资源网关的稳定性和效能得以提升。
2)建立具体数字文献资源的关键URL受控列表的处理方法,实现了资源下载的实时保护,提高了资源过度下载控制的时效。
3)网关部署方法简单,采用了统一的资源控制模块接口处理后,相应软件开发周期短且易于维护。
附图说明
图1是现有技术实现资源网关的示意图。
图2是本发明方法用于一种数字文献资源访问的流程图。
图3是本发明方法用于多资源、多端口资源访问的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
现有采用反向代理技术的资源网关方案中系统结构,如图1所示;主要由WAN网络的客户端110、连通WAN、LAN网络的资源网关服务器120和LAN网络数字资源服务器130三部分组成。该系统中采用一个标准HTTP端口用于访问,造成反向代理服务器负载过大,稳定性较差,服务容易出现问题。再者,采用目录区分资源,一方面导致大量地址重定向,另一方面为了保持网页内容的一致性,HTTP响应数据需二次清理网页内URL地址,造成资源网关服务器效能低下。第三,在资源控制方法上,由于采用日志分析方法确定资源是否被过多下载,具有明显的时间滞后性,也不能满足大用户量的访问控制。
为了克服上述现有技术中存在的问题,本发明提供了一种反向代理技术实现数字文献资源网关的方法,即建立一种数字文献资源映射一个HTTP端口,避免HTTP响应数据需二次清理网页内URL地址,提升网关的处理效率;通过建立不同资源关键受控URL列表,对关键受控URL列表的请求进行重定向到控制模块接口方法,不仅能够优化目前图书情报机构对数字文献资源和用户的统一控制及管理的过程,而且能够提高转发方法、大幅度减少重定向方法的使用,提升网关的稳定性。本发明方法具体按以下步骤进行::
步骤1:在外部客户机和内部数字资源服务器之间部署具有反向代理服务的资源网关HTTP服务器;为每一种文献资源服务器建立一个外网可访问的虚拟主机,给每一个虚拟主机分配一个唯一的HTTP端口;并在文献服务的网站页面给出含有不同端口资源的下载地址导航信息,供用户进行访问;
步骤2:在资源网关HTTP服务器上建立每个文献资源访问的受控URL列表,对有下载内容的关键URL地址按照正则表达式给予地址重定向,重定向的地址为统一的资源控制模块的接口程序;
步骤3:在资源控制模块接口程序中,首先调入用户管理模块,验证用户登录信息是否合法,若不合法则提示用户登录;按照时间和下载量判断用户下载资源是否超过过量下载阀值,超过阀值提醒用户不能下载;检验合法后,服务程序执行资源下载工作,并将下载内容发送给用户客户端;最后调入业务管理模块,进行相应的账务处理。
例如:
客户通过客户端访问一种数字文献资源时,采用本发明方法对该客户的访问进行回馈的流程图,如图2所示。客户端210首先访问http://x.x.x的资源网关服务网站220,在资源网关服务网站220上以用户名或IP地址进行登录,获取认证会话信息;根据网站的导航信息,访问了http端口为81的某一个数字文献资源。客户通过客户端210发送给资源网关服务器220的请求中包含着“http://x.x.x:81/x.asp”地址,资源网关服务器220中的HTTP服务程序根据81端口找到相应的虚拟主机模块221,虚拟主机模块221首先根据地址及参数的正则表达式判断这个请求是不是受控的URL,如果不是,根据已定义的数字资源服务器230的地址”http://192.168.2”附加上文件地址”/x.asp”及GET或POST数据后,形成新的网址请求“http://192.168.1.2/x.asp”进行转发(ProxyPass),并将结果返回到客户端浏览器;如果是,则将给地址的请求数据附加上当前资源的标示后(如,资源名称为”source1”),形成新的数据请求后重定向(Rewrite)至用户管理模块222的统一处理接口程序中,如“http://x.x.x/gateway?lib= source1...”。用户管理模块222根据传入的参数验证用户的已经登录的用户信息与当前信息是否一致,如果不一致,给客户端210发出用户验证失败的提示信息,并终止用户请求。如果一致,按照时间和下载量判断用户下载资源是否超过过量下载阀值,超过阀值提醒用户不能下载。在阀值以内则将所有请求参数转入Curl下载访问模块223进行进一步的处理。Curl下载访问模块223根据传入的用户请求数据,启动Curl访问工具,发出“http://192.168.1.2/x.asp”请求,并获取下载的数据后传递给客户端浏览器,然后业务管理模块224对相应下载执行记账和统计。
又例如:
客户通过客户端访问多种数字文献资源时,采用本发明方法对该客户的访问进行回馈的流程图,如图3所示。客户端310首先访问http://x.x.x的资源服务网站,在该资源服务网站上以用户名或IP地址进行登录,获取认证会话信息;根据网站的导航信息,访问了http端口为81、82、83、……的多个数字文献资源。客户通过客户端310发送给资源网关服务器320的请求中包含着“http://x.x.x:81/x.asp”、“http://x.x.x:82/d/download.php?” 、“http://x.x.x:83/jsp/down.jsp”……等地址,资源网关服务器320中的HTTP服务程序根据81、81、83……端口找到相应的虚拟主机模块,虚拟主机模块首先根据地址及参数的正则表达式判断这个请求是不是受控的URL,如果不是,根据已定义的文献资源服务器320的地址”http://192.168.2”附加上文件地址”/x.asp”及GET或POST数据后,形成新的网址请求“http://192.168.1.2/x.asp”进行转发(ProxyPass),并将结果返回到客户端浏览器;如果是,则将给地址的请求数据附加上当前资源的标示后(如,资源名称为”source1”),形成新的数据请求后重定向(Rewrite)至用户管理模块的统一处理接口程序中,如“http://x.x.x/gateway?lib= source1...”。用户管理模块根据传入的参数验证用户的已经登录的用户信息与当前信息是否一致,如果不一致,给客户端310发出用户验证失败的提示信息,并终止用户请求。如果一致,按照时间和下载量判断用户下载资源是否超过过量下载阀值,超过阀值提醒用户不能下载。在阀值以内则将所有请求参数转入Curl下载访问模块进行进一步的处理。Curl下载访问模块根据传入的用户请求数据,启动Curl访问工具,发出“http://192.168.1.2/x.asp”请求,并获取下载的数据后传递给客户端浏览器,然后业务管理模块对相应下载执行记账和统计。
访问多种数字文献资源时,资源网关服务器320有了更多服务端口,每个端口对应了一种数字文献资源。
本发明方法中的客户端与网络资源服务器在各实现方案中基本差异性不大,重点在于资源网关服务器处理过程中进行了优化,实现了数字化文献资源开放式服务中的统一访问、授权和统计的功能,对用户进行有效控制,防止资源滥用,满足了数字资源开放式服务的网关需求。

Claims (3)

1.一种反向代理技术实现数字文献资源网关的方法,其特征在于,该方法具体按以下步骤进行:
步骤1:在外部客户机和内部数字资源服务器之间部署具有反向代理服务的资源网关HTTP服务器;为每一种文献资源服务器建立一个外网可访问的虚拟主机,给每一个虚拟主机分配一个唯一的HTTP端口;
步骤2:在资源网关HTTP服务器上建立每个文献资源访问的受控URL列表,对有下载内容的关键URL地址按照正则表达式给予地址重定向,重定向的地址为统一的资源控制模块的接口程序;
步骤3:在资源控制模块接口程序中,首先调入用户管理模块,验证用户登录信息是否合法,若不合法则提示用户登录;按照时间和下载量判断用户下载资源是否超过过量下载阀值,超过阀值提醒用户不能下载;检验合法后,服务程序执行资源下载工作,并将下载内容发送给用户客户端。
2.根据权利要求1所述的反向代理技术实现数字文献资源网关的方法,其特征在于,所述步骤1中还在文献服务的网站页面给出含有不同端口资源的下载地址导航信息,供用户进行访问。
3.根据权利要求1所述的反向代理技术实现数字文献资源网关的方法,其特征在于,所述步骤3中将下载内容发送给用户客户端后调入业务管理模块,进行相应的账务处理。
CN201210206540.6A 2012-06-21 2012-06-21 一种反向代理技术实现数字文献资源网关的方法 Expired - Fee Related CN102710559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210206540.6A CN102710559B (zh) 2012-06-21 2012-06-21 一种反向代理技术实现数字文献资源网关的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210206540.6A CN102710559B (zh) 2012-06-21 2012-06-21 一种反向代理技术实现数字文献资源网关的方法

Publications (2)

Publication Number Publication Date
CN102710559A true CN102710559A (zh) 2012-10-03
CN102710559B CN102710559B (zh) 2016-08-03

Family

ID=46903125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210206540.6A Expired - Fee Related CN102710559B (zh) 2012-06-21 2012-06-21 一种反向代理技术实现数字文献资源网关的方法

Country Status (1)

Country Link
CN (1) CN102710559B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125243A (zh) * 2013-04-23 2014-10-29 浙江大学 一种穿透内网远程连接大规模虚拟机的方法
CN104967628A (zh) * 2015-07-16 2015-10-07 浙江大学 一种保护web应用安全的诱骗方法
CN107071572A (zh) * 2017-04-06 2017-08-18 青岛海信宽带多媒体技术有限公司 开机海报的加载方法及网关设备
CN108768779A (zh) * 2018-06-04 2018-11-06 杭州迪普科技股份有限公司 网络资源的统计方法及装置
CN109299174A (zh) * 2018-09-11 2019-02-01 北京奇安信科技有限公司 一种多源情报数据聚合处理方法及装置
CN109962913A (zh) * 2019-03-11 2019-07-02 北京信安世纪科技股份有限公司 基于安全套接层协议的代理服务器及代理方法
CN115776518A (zh) * 2022-11-15 2023-03-10 西北农林科技大学 一种国外电子文献资源加速访问系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452483A (zh) * 2008-12-25 2009-06-10 阿里巴巴集团控股有限公司 网站访问方法及系统
CN101495990A (zh) * 2005-12-02 2009-07-29 思杰系统有限公司 用于提供从代理服务器到虚拟计算环境的身份验证证明以访问远程资源的方法和设备
CN101753606A (zh) * 2008-12-03 2010-06-23 北京天融信科技有限公司 一种实现web反向代理的方法
US20120023554A1 (en) * 2010-07-21 2012-01-26 Marco Murgia Systems and methods for providing a smart group

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101495990A (zh) * 2005-12-02 2009-07-29 思杰系统有限公司 用于提供从代理服务器到虚拟计算环境的身份验证证明以访问远程资源的方法和设备
CN101753606A (zh) * 2008-12-03 2010-06-23 北京天融信科技有限公司 一种实现web反向代理的方法
CN101452483A (zh) * 2008-12-25 2009-06-10 阿里巴巴集团控股有限公司 网站访问方法及系统
US20120023554A1 (en) * 2010-07-21 2012-01-26 Marco Murgia Systems and methods for providing a smart group

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘荣发: "服务器虚拟化技术在图书馆数字化服务中的应用", 《现代图书情报技术》, no. 4, 30 April 2007 (2007-04-30), pages 79 - 82 *
耿文涛: "远程通过EZproxy反向代理访问图书馆电子资源的实现", 《电脑知识与技术》, vol. 6, no. 23, 15 August 2010 (2010-08-15) *
钟旋: "图书馆数字资源校外访问策略", 《图书与档案管理》, no. 11, 10 April 2007 (2007-04-10), pages 452 - 454 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125243A (zh) * 2013-04-23 2014-10-29 浙江大学 一种穿透内网远程连接大规模虚拟机的方法
CN104125243B (zh) * 2013-04-23 2018-01-02 浙江大学 一种穿透内网远程连接大规模虚拟机的方法
CN104967628A (zh) * 2015-07-16 2015-10-07 浙江大学 一种保护web应用安全的诱骗方法
CN104967628B (zh) * 2015-07-16 2017-12-26 浙江大学 一种保护web应用安全的诱骗方法
CN107071572A (zh) * 2017-04-06 2017-08-18 青岛海信宽带多媒体技术有限公司 开机海报的加载方法及网关设备
CN108768779A (zh) * 2018-06-04 2018-11-06 杭州迪普科技股份有限公司 网络资源的统计方法及装置
CN109299174A (zh) * 2018-09-11 2019-02-01 北京奇安信科技有限公司 一种多源情报数据聚合处理方法及装置
CN109962913A (zh) * 2019-03-11 2019-07-02 北京信安世纪科技股份有限公司 基于安全套接层协议的代理服务器及代理方法
CN115776518A (zh) * 2022-11-15 2023-03-10 西北农林科技大学 一种国外电子文献资源加速访问系统
CN115776518B (zh) * 2022-11-15 2024-05-03 西北农林科技大学 一种国外电子文献资源加速访问系统

Also Published As

Publication number Publication date
CN102710559B (zh) 2016-08-03

Similar Documents

Publication Publication Date Title
CN102710559A (zh) 一种反向代理技术实现数字文献资源网关的方法
US10904204B2 (en) Incompatible network gateway provisioned through DNS
CN104506510B (zh) 用于设备认证的方法、装置及认证服务系统
CN104580192B (zh) 应用程序的网络访问请求的处理方法和装置
JP5739023B2 (ja) 割り当てられたネットワークアドレスを有するデバイスにアクセスするウェブプロキシサーバを使用したシステムおよび方法
JP6054484B2 (ja) 割り当てられたネットワークアドレスを有するデバイスにアクセスするクライアントローカルプロキシサーバを使用したシステムおよび方法
CN101582856B (zh) 一种门户服务器与宽带接入设备的会话建立方法及其系统
EP2633667B1 (en) System and method for on the fly protocol conversion in obtaining policy enforcement information
US8806040B2 (en) Accessing external network via proxy server
US9118718B2 (en) Techniques to monitor connection paths on networked devices
CN103024740B (zh) 移动终端访问互联网的方法及系统
CN101873329A (zh) 一种Portal强制认证方法以及接入设备
CN105516171B (zh) 基于认证服务集群的Portal保活系统及方法、认证系统及方法
CN109815684A (zh) 一种身份认证方法、系统及服务器和存储介质
CN101039309A (zh) 链路共享服务装置以及通信方法
WO2013170158A1 (en) Computer readable storage media for selective proxification of applications and method and systems utilizing same
CN103428310A (zh) 基于虚拟ip的非http域名引导系统和方法
WO2013144713A1 (en) Articles of manufacture, service provider computing methods, and computing service systems
WO2017097092A1 (zh) 缓存集群服务的处理方法及系统
CN102571817B (zh) 访问应用服务器的方法及装置
CN106230925A (zh) 一种访问控制方法及装置
JP2014222455A (ja) 通信システム、プロキシサーバ、通信方法およびプログラム
US11323426B2 (en) Method to identify users behind a shared VPN tunnel
WO2015188453A1 (zh) 一种客户端接入方法及装置
CN109600379A (zh) Https重定向的降噪方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160803

Termination date: 20200621

CF01 Termination of patent right due to non-payment of annual fee