CN102428685B - 用于url评级的方法 - Google Patents
用于url评级的方法 Download PDFInfo
- Publication number
- CN102428685B CN102428685B CN201080020130.1A CN201080020130A CN102428685B CN 102428685 B CN102428685 B CN 102428685B CN 201080020130 A CN201080020130 A CN 201080020130A CN 102428685 B CN102428685 B CN 102428685B
- Authority
- CN
- China
- Prior art keywords
- uniform resource
- resource identifier
- grading
- inquiry
- client terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1441—Countermeasures against malicious traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/53—Network services using third party service providers
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种用于向客户终端提供与统一资源标识符相关的评级信息的方法。所述方法包括:在客户终端处识别统一资源标识符;通过IP网络向评级服务器发送第一询问,第一询问包括所识别的统一资源标识符的第一组成部分或第一组成部分的派生物,作为询问字符串;以及在评级服务器处接收第一询问,并确定是否存在针对询问字符串的评级。评级服务器向客户终端发送响应,包括所确定的评级、或不存在评级的指示。在客户终端处接收响应,如果响应中包括的评级这样指示,或者如果响应这样指示,则向评级服务器发送另一询问,另一询问包括所识别的统一资源标识符的第一和第二组成部分,或者第一和第二组成部分的派生物,作为询问字符串。根据需要,重复在评级服务器处接收第一询问、发送响应和在客户终端处接收响应的步骤一次或多次,针对每次重复,向询问字符串添加其它组成部分。
Description
技术领域
本发明涉及对统一资源定位符(URL)进行评级的方法和设备。更具体地,本发明涉及一种在基于客户端-服务器的体系结构中对URL进行评级的方法和设备,由此多个客户端从公共服务器或服务器集合请求URL评级。
背景技术
尽管因特网向个人和组织提供了极大的便利,但是因特网同样是隐藏和已知危险的来源。一方面,很多在因特网上可用的内容具有不期望的特性,另一方面,网页可以是包括间谍软件、木马、病毒等的恶意软件的来源。防御这些问题的一个机制是:针对输入客户终端上的网络浏览器的统一资源定位符(URL)执行评级,并在下载相关网页之前将评级信息呈现给用户,和/或依据评级结果过滤访问请求。
US 2008/0163380描述了一种涉及URL评级的方案。该方案包括:提供URL评级服务器,该服务器维护已知URL及其评级的数据库。例如,客户终端在下载网页之前,从评级服务器请求评级。为了减少客户端的等待时间,基于先前访问和信任的URL以及预先填充的URL评级数据(例如,基于用户简档获得),在客户终端中构建URL高速缓存。
使用客户端-服务器方式提供URL评级的已知方案存在以下缺点:评级后的URL的数据库肯定非常大,并且在因特网日益变化的特性之下,极难保持可靠的数据库。在不确定和危险的内容会被引入因特网、继而在极短的时段内移除的情况下,web 2.0站点内的大量扩充对于传统的URL评级系统来说尤其会引发重大问题。事实上,由于目前对因特网不断变化的使用模式,已知方案在很大程度上是非常低效的。
发明内容
本发明的目的在于克服或至少减少已知URL评级方法的上述缺点。这至少部分地通过寻求识别与客户端想要评级的URL的组成部分相匹配的评级后的URL来实现。可以将这种评级后的URL提供给客户端,以至少将对URL进行评级所需的部分计算负载从后端服务器转移至客户端。
根据本发明的一方面,提供了一种用于向客户终端提供与统一资源标识符相关的评级信息的方法,所述方法包括:
1)在客户终端处,识别统一资源标识符;
2)通过IP网络向评级服务器发送第一询问,所述第一询问包括所识别的统一资源标识符的第一组成部分或所述第一组成部分的派生物(derivative),作为询问字符串;
3)在评级服务器处,接收第一询问,并确定是否存在针对所述询问字符串的评级;
4)向客户终端发送响应,所述响应包括所确定的评级、或不存在评级的指示;
5)在客户终端处,接收所述响应,如果所述响应中包括的评级指示需要进一步查询,或者如果所述响应指示需要进一步查询,则向评级服务器发送另一询问,所述另一询问包括所识别的统一资源标识符的所述第一组成部分和第二组成部分,或者第一和第二组成部分的派生物,作为询问字符串;
6)重复步骤3)~5)一次或多次,直至进一步响应中包括的评级指示不需要进一步查询、且所述进一步响应指示不需要进一步查询为止,针对每次重复,向所述询问字符串添加其它组成部分。
在许多情况下,本发明的实施例可以减少对URL进行评级所花费的时间。仅在有限的情况下,才需要对完整的URL进行评级。
发送至评级服务器的询问可以包含各个询问字符串的派生物,通过向相应的询问字符串应用散列函数来获得每个派生物。
所述第一组成部分可以包括登记的域名或登记的IP地址。所述第二和任何其它组成部分可以包括以所述第一组成部分为前缀的其它子组成部分。
所述方法可以包括:在评级服务器处,如果确定存在针对询问字符串的评级,但需要第二或其它组成部分来改进评级,则在所述响应中包括针对另一询问的格式定义。
所述方法可以包括:当在客户终端处接收到响应时,在本地高速缓存器中缓存任何确定的评级和相关联的询问字符串或派生物。在评级服务器处,如果确定存在针对询问字符串的评级,但需要第二或其它组成部分来改进评级,则可以在所述响应中包括针对另一询问的格式定义,并将所述格式定义另外缓存在本地高速缓存器中。
在步骤1)和2)之间,所述方法可以包括:查询所述本地高速缓存器,以确定所述本地高速缓存器是否包含针对统一资源标识符的组成部分或所述组成部分的派生物的条目,以及
如果不包含,则在所述第一询问中包括所述组成部分或所述组成部分的派生物,作为所述第一组成部分或所述第一组成部分的派生物,以及
如果包含,则向用户呈现所述评级,和/或根据特定格式定义来构造所述第一询问的所述询问字符串。
在本发明的实施例中,客户终端包括网络浏览器,以及所述方法还包括:在网络浏览器窗口中,显示所确定的评级。所述方法还可以包括以下步骤:
如果客户终端接收到的评级指示:所述统一资源标识符是受信任的,则从所述统一资源标识符下载数据到网络浏览器窗口,以及
如果客户终端接收到的评级指示:所述统一资源标识符是恶意的,则阻止从所述统一资源标识符下载数据到网络浏览器窗口。
可以在发送到评级服务器的所述第一询问中包括统一资源标识符或统一资源标识符的派生物。在这种情况下,所述方法可以包括:在所述评级服务器处,在确定是否存在针对询问字符串的评级之前,确定是否存在针对所述统一资源标识符或其派生物的评级;如果存在,则向客户终端返回包含所述评级的响应。
根据本发明的第二方面,提供了一种用于向客户终端提供与统一资源标识符相关的评级信息的方法。所述方法包括:在客户终端处,从评级服务器接收与统一资源标识符相关的评级,并在客户终端处,在客户端高速缓存器内缓存接收到的评级。所述方法还包括:针对在客户终端处识别的、需要进行评级的统一资源标识符,
查询客户端高速缓存器,以确定所述客户端高速缓存器是否包含针对与所识别的统一资源标识符的第一组成部分相匹配的统一资源标识符的评级,
依据上述结果,利用所识别的统一资源标识符的第二组成部分来扩展所述第一组成部分;以及利用扩展后的统一资源标识符进行对客户端高速缓存器的进一步查询,或向所述评级服务器发送询问。
扩展后的统一资源标识符可以与所识别的统一资源标识符相对应。
第二方面的方法可以包括:依据进一步查询的结果来扩展所述扩展后的统一资源标识符;以及重复对所述客户端高速缓存器的查询,或向所述评级服务器发送询问。
发送给评级服务器的询问可以包含完整的所识别的统一资源标识符。
根据本发明的第三方面,提供了一种用于使计算机执行以下步骤的计算机程序:
1)在客户终端处,识别统一资源标识符;
2)通过IP网络向评级服务器发送第一询问,所述第一询问包括所识别的统一资源标识符的第一组成部分或所述第一组成部分的派生物,作为询问字符串;
3)在客户终端处,接收响应,如果所述响应中包括的评级这样指示,或者如果所述响应这样指示,则向评级服务器发送另一询问,所述另一询问包括所识别的统一资源标识符的所述第一组成部分和第二组成部分,或者第一和第二组成部分的派生物,作为询问字符串;
4)根据需要,重复步骤2)和3)一次或多次,针对每次重复, 向所述询问字符串添加其它组成部分;
5)依据最终评级或不存在评级,允许客户终端访问由统一资源标识符标识的访问数据,或者防止访问所述数据或请求用户决定。
根据本发明的第四方面,提供了一种计算机可读介质,其上存储有用于使计算机执行以下步骤的指令:
1)在客户终端处,识别统一资源标识符;
2)通过IP网络向评级服务器发送第一询问,所述第一询问包括所识别的统一资源标识符的第一组成部分或所述第一组成部分的派生物,作为询问字符串;
3)在客户终端处,接收响应,如果所述响应中包括的评级这样指示,或者如果所述响应这样指示,则向评级服务器发送另一询问,所述另一询问包括所识别的统一资源标识符的所述第一组成部分和第二组成部分,或者第一和第二组成部分的派生物,作为询问字符串;
4)根据需要,重复步骤2)和3)一次或多次,针对每次重复,向所述询问字符串添加其它组成部分;
5)依据最终评级或不存在评级,允许客户终端访问由统一资源标识符标识的访问数据,或者防止访问所述数据或请求用户决定。
根据本发明的第五方面,提供了一种用于向客户终端提供与统一资源标识符相关的评级的方法,所述方法包括:
1)在服务器处或与服务器相关联地,维护包含针对统一资源标识符的高速缓存器;
2)在服务器处,从客户终端接收包含所询问的统一资源标识符的询问;
3)识别所询问的统一资源标识符的第一组成部分,并确定所述高速缓存器是否包含针对与所述第一组成部分相匹配的统一资源标识符的条目;
4)如果所述高速缓存器包含指示需要统一资源标识符的其它组 成部分来对所询问的统一资源标识符进行评级的条目,则识别高速缓存器条目所指示的格式的第二组成部分,并确定高速缓存器是否包含针对与所述第一和第二组成部分相匹配的统一资源标识符的条目;
5)根据需要,通过包括其它组成部分来重复步骤4),直至获得最终评级或确定无法对所询问的统一资源标识符进行评级;
6)将所确定的评级返回客户终端,所确定的评级包括针对中间统一资源标识符确定的任何评级。
附图说明
图1示意性地示出了提供URL评级服务的网络体系结构;
图2是示出了第一URL评级过程的流程图,该第一URL评级过程包括评级服务器针对先前评级的组成部分解析URL;
图3示出了执行改进的评级过程的顺序图,其中客户终端解析URL,并向评级服务器发送关于URL组成部分的子询问;
图4示意性地示出了被配置用于提供URL评级信息的客户终端;以及
图5更加详细地示出了图3的过程。
具体实施方式
图1中示出了用于提供URL评级服务的典型客户端-服务器体系结构。多个客户终端1(可以是移动电话、PDA、膝上型电脑、PC等)能够经由一个(或一些)适合的接入网络(图1中未示出)来访问因特网2。由第三方服务提供商(例如,防病毒程序和安全产品和服务的提供商)操作的ORSP FE(URL)评级服务器3也与因特网耦合。每个终端典型地具有网络浏览器,允许用户下载、查看网页和与网页交互。网络浏览器还具有优化评级过程并增强用户体验的特定新功能。现在,将对该功能进行详细描述。
每个URL由以下部分的组合构成:scheme名或资源类型、登记域名或因特网协议(IP)地址、端口号、要获取的文件或要运行的程序的路 径名、包括询问参数的询问字符串、以及具有html文件的、针对页面应当显示的位置的锚链接。组合后的句法可以如下:
resource_type://domain:port/filepathname?query_string#anchor。
如从以上可以注意到的,甚至在域名或(IP)地址受信任的情况下,如是“youtube.com”或“wikipedia.com”的情况下,域名或IP地址之后的内容仍可能是不受信任的。多个(或大量)不同的URL也可能会指示相同的网页。
可以通过识别在其后的所有URL都是受信任(或都是不受信任)的那些URL组成部分,并在客户端进行缓存,来减少客户端发送给URL评级服务器的评级询问的数目。当用户将URL输入浏览器时,将URL的适合的组成部分与缓存的组成部分进行比较。如果发现匹配,则向用户呈现缓存的评级,或者采取过滤操作,而无需客户端向评级服务器发送询问。只有在不匹配的情况下,才需要发送询问。
可以通过使客户端在发现不匹配的情况下向评级服务器发送完整的URL,在客户端构建高速缓存器。该过程在图2中示出,其中(在步骤1至3、9和10),客户终端确定本地URL评级高速缓存器是否包含针对URL的组成部分的条目。如果没有包含,则客户端向评级服务器发送URL(步骤4)。然后,评级服务器可以将URL分成各个组成部分,并将这些组成部分与评级服务器的数据库的内容进行比较(步骤5)。然后,评级服务器向客户端返回一个或多个组成部分以及它们的评级(步骤6)。客户端接收并缓存结果(步骤7),并相应地允许或阻止URL(步骤8)。因而,例如,如果用户输入URL:
http://www.marks-clerk.com/uk/attorneys/publications/articles.html
并且在本地高速缓存器中没有发现针对该URL或其组成部分的匹配项,则将该URL发送至URL评级服务器。在这种情况下,评级服务器解析该URL,并确定“marks-clerk.com”域层级之后的所有URL是受信任的,将结果返回客户端。URL评级服务器不必针对marks-clerk.com域层级之后的特定URL保持任何评级数据。对于恶意域名也是如此,也就是说,只需保持针对域层级的条目,而不必保持针对该域层级之后的任何URL的条目。对于本身受信任、但在其之后的URL不受信任的域层级,例如 “youtube.com”,评级服务器应保持针对那些URL的评级(至少到已经建立了受信/不受信的层级)。
通过存储URL组成部分的散列,并根据接收到的URL中生成相应的散列,可以获得改进的查找速度。客户端高速缓存器也包含散列。除了明文URL之外,客户端可以在询问中包括URL组成部分(直到客户端在本地高速缓存器中没有发现匹配的点)的散列。然后,评级服务器开始从该散列向前搜索。评级服务器仅将客户端先前不知道的匹配返回客户端。
为了提供非常迅速的初始检查,客户端可以向评级服务器发送完整的URL的散列和明文URL。评级服务器针对散列执行快速搜索,如果结果是URL受信任或不受信任,则立即向客户端返回。仅在评级服务器没有发现针对散列的匹配时,才使用URL组成部分执行搜索。
尽管该方式在原理上可行,但实际上,该方式开放了安全性威胁,因为为了使URL评级服务器解析URL,客户端需要以明文发送完整的URL。在一些实例中,URL可以包含敏感数据,如用户的银行用户名和密码。尽管URL评级的一些方式需要客户端加密所发送的URL(例如通过针对URL应用散列函数并仅发送结果),但是使用在前一段落中描述的方式是不可能的,因为URL评级服务器在先前不知道该URL的情况下将无法解析URL组成部分。如果使用了加密,则评级服务器必须存储每个(已评级的)URL的评级。
该问题的解决方案是将URL询问分解为多个子询问。该方式在图3中示出,其中用户首先将URL输入浏览器的地址栏(或点击网络链接)(步骤100)。在以上示例的情况下,再次假设客户端使用客户端高速缓冲器无法对URL进行评级,客户端确定它必须向评级服务器发送包含域层级“marks-clerk.com”的询问(步骤101)。客户端应用在该步骤中设置的规则,以考虑分层顶级域名结构,如“.co.uk”。客户端仅发送组成部分的散列(步骤102),而不以明文发送域名部分。在接收到询问时,评级服务器处的ORSP前端(FE)将接收到的散列与同评级后的URL相对应的散列的数据库进行比较(步骤103)。在本例中,在数据库中呈现“marks-clerk.com”的散列、以及“受信任的”评级。评级服务器以该 评级响应客户端(步骤104)。客户端向用户呈现评级,并下载所请求的网页(步骤105)。此外,在客户端高速缓存器中存储域名部分的散列、以及评级(步骤106)。用户现在可以浏览“marks-clerk.com”域之后的所有URL,而不必将任何其它询问发送到URL评级服务器。
现在考虑用户将社区(web 2.0)网站输入浏览器的情况。以下顺序操作示出了这种情况:
1.用户转向http://www.youtube.com/watch?v=1234。
2.客户端向客户端高速缓存器查询根“.”域。客户端高速缓存器维护处理这种查询的规则集。在这种情况下,客户端高速缓存器返回以格式“<顶级域>”再次查询的指令。
3.客户端使用“.com”顶级域再次查询客户端高速缓存器,客户端高速缓存器返回以格式“<xxx>.com”再次查询的指令。
4.客户端使用“.youtube.com”域再次查询客户端高速缓存器。
5.客户端高速缓存器返回域层级的散列不包含在高速缓存器内的结果。
6.然后,客户端将询问转发给ORSP FE服务器,该服务器返回域层级“*.youtube.com*”是默认信任的、但请求路径的第一部分的应答。
7.客户端将包含“*.youtube.com/watch*”的散列的询问转发给ORSP FE服务器,并接收“*.youtube.com/watch*”是默认信任的、但请求‘v’参数的响应。
8.客户端将包含“*.youtube.com/watch?v=1234*”的散列的询问转发给ORSP FE服务器,并接收“*.youtube.com/watch?v=1234*”是恶意的响应。
9.客户端在客户端高速缓存器中存储每个响应(包括散列和相关评级),并将最终响应返回浏览器插件。
10.接下来,每次用户浏览“youtube.com”或该域层级之下的视频时,仅需要将单个询问发送到与该视频相关的ORSP FE服务器。
图4示意性地示出了适于与上述方式一起使用的客户终端10。作为 示例,该终端可以是PC、膝上型计算机或移动电话。该终端包括显示器11、用户输入单元12(例如键盘)、以及因特网接口13。该终端还包括用于实现网络浏览器15、URL评级专用浏览器插件16、ORSP客户端17和ORSP客户端可用的存储高速缓存器18的硬件和软件组件14。浏览器插件16被配置为实现上述ORSP客户端功能,而存储器18被配置为存储客户端高速缓存。
更加详细地考虑客户端10的组件,浏览器插件16表示“瘦”组件,其作用是识别并从浏览器15提取URL,将询问传递给ORSP客户端17,从ORSP客户端接收评级响应,并根据接收到的评级更新浏览器显示(包括下载/阻止网页)。ORSP客户端17负责解析URL,对组成部分进行散列处理,查询本地高速缓存器18,以及询问评级服务器。ORSP客户端可以是在WindowsTM平台上提供的服务,并经由适合的应用编程接口(API)与浏览器插件通信。ORSP客户端17将本地(客户端)高速缓存存储在存储高速缓存器18中。
图5示出了与本例相关联的信令,其中,浏览器、浏览器插件、ORSP客户端(NRS-ORSP-适配器)和客户端高速缓存器均为客户端内的软件组件,以及FE-服务器和FE DB(数据库)是评级服务器的组件(可能为分布式的)。在本例中,重新定向的消息使ORSP客户端重新查询/询问本地高速缓存器或评级服务器。
应当理解,窃听客户终端与评级服务器之间的业务的任何人将仅看到散列后的URL组成部分,而并非组成部分本身。在评级服务器处理针对接收到的散列的评级的情况下,评级服务器将能够识别相应的URL组成部分。在这种情况下,用户不必担心URL组成部分的公开。评级服务器不太可能获知敏感URL组成部分。
本领域技术人员还应当理解,可以在不偏离本发明的范围的情况下,对上述实施例进行各种修改。例如,从客户端发送到评级服务器的初始子询问可以另外包括完整URL的散列。然后,评级服务器可以针对该散列执行初始“快速搜索”,如果存在针对该URL的评级,则立即向客户端返回结果。仅在无法发现评级时,服务器才继续基于域层级来执行查找。
ORSP客户端可以实现为客户终端上的单机应用。可选地,ORSP可以实现为浏览器插件、小应用程序(applet)等。
URL评级服务器可以保持指示与评级后的URL相关联的信任度的评级类别集。例如,可以使用以下六类:
与每类相关联的颜色定义了在由ORSP客户端添加到浏览器按钮的“信号灯”信任度指示符中所显示的颜色。
由URL评级服务器提供给客户端的评级可以包括“生存时间”(TTL)值。这向客户端指示了可以相信该评级的持续时间,该值存储在客户端高速缓存器中。当输入浏览器的URL或所包含的一组成部分与一散列相匹配,但该散列的TTL已到期时,客户端将重复与评级服务器的询问过程,根据结果来更新高速缓存条目。客户端还可以定期发起对已到期高速缓存条目的更新。
可以由评级服务器向客户端推送关键的高速缓存更新。例如,这可以应用于新发现的恶意域名。可选地,可以在下次客户端向评级服务器做出普通询问时,整体提供这种关键更新。
还应当理解的是,除了网络浏览器之外,这里所描述的评级过程还可以用于对与应用/服务相关联的URL进行评级。例如,该过程可以应用于对包含在电子邮件内的URL和网络数据进行评级。在这种情况下,可以在电子邮件客户端(如,Microsoft OutlookTM)中实现瘦“插件”类组件,该组件与ORSP客户端通信。ORSP客户端可以由多个应用和服务共享。
Claims (17)
1.一种用于向客户终端提供与统一资源标识符相关的评级信息的方法,所述方法包括:
1)在客户终端处,识别统一资源标识符;
2)通过IP网络向评级服务器发送第一询问,所述第一询问包括所识别的统一资源标识符的第一组成部分或所述第一组成部分的派生物,作为询问字符串;
3)在评级服务器处,接收第一询问,并确定是否存在针对所述询问字符串的评级;
4)向客户终端发送响应,所述响应包括所确定的评级、或不存在评级的指示;
5)在客户终端处,接收所述响应,如果所述响应中包括的评级指示需要进一步查询,或者如果所述响应指示需要进一步查询,则向评级服务器发送另一询问,所述另一询问包括所识别的统一资源标识符的所述第一组成部分和第二组成部分,或者所述第一和第二组成部分的派生物,作为询问字符串;
6)重复步骤3)~5)一次或多次,直至进一步响应中包括的评级指示不需要进一步查询、且所述进一步响应指示不需要进一步查询为止,针对每次重复,向所述询问字符串添加其它组成部分。
2.根据权利要求1所述的方法,其中所述询问包含各个询问字符串的派生物,每个派生物通过向相应的询问字符串应用散列函数来获得。
3.根据权利要求1所述的方法,其中所述第一组成部分包括登记的域名或登记的IP地址。
4.根据权利要求3所述的方法,其中所述第二和任何其它组成部分包括以所述第一组成部分为前缀的其它子组成部分。
5.根据权利要求1所述的方法,包括:在评级服务器处,如果确定存在针对询问字符串的评级,但需要第二或其它组成部分来改进评级,则在所述响应中包括针对另一询问的格式定义。
6.根据权利要求1所述的方法,包括:当在客户终端处接收到响应时,在本地高速缓存器中缓存任何确定的评级和相关联的询问字符串或派生物。
7.根据权利要求6所述的方法,包括:在评级服务器处,如果确定存在针对询问字符串的评级,但需要第二或其它组成部分来改进评级,则在所述响应中包括针对另一询问的格式定义,并将所述格式定义另外缓存在本地高速缓存器中。
8.根据权利要求6所述的方法,包括:在步骤1)和2)之间,查询所述本地高速缓存器,以确定所述本地高速缓存器是否包含针对统一资源标识符的组成部分或所述组成部分的派生物的条目,
如果不包含,则在所述第一询问中包括所述组成部分或所述组成部分的派生物,作为所述第一组成部分或所述第一组成部分的派生物,以及
如果包含,则向用户呈现所述评级,和/或根据特定格式定义来构造所述第一询问的所述询问字符串。
9.根据权利要求1所述的方法,其中所述客户终端包括网络浏览器,以及所述方法还包括:在网络浏览器窗口中,显示所确定的评级。
10.根据权利要求9所述的方法,包括:
如果客户终端接收到的评级指示:所述统一资源标识符是受信任的,则从所述统一资源标识符下载数据到网络浏览器窗口,以及
如果客户终端接收到的评级指示:所述统一资源标识符是恶意的,则阻止从所述统一资源标识符下载数据到网络浏览器窗口。
11.根据权利要求1所述的方法,包括:在发送到评级服务器的所述第一询问中包括统一资源标识符或统一资源标识符的派生物。
12.根据权利要求11所述的方法,包括:在所述评级服务器处,在确定是否存在针对询问字符串的评级之前,确定是否存在针对所述统一资源标识符或其派生物的评级;如果存在,则向客户终端返回包含所述评级的响应。
13.一种用于向客户终端提供与统一资源标识符相关的评级信息的方法,所述方法包括:
在客户终端处,从评级服务器接收与统一资源标识符相关的评级;
在客户终端处,在客户端高速缓存器内缓存接收到的评级;以及
针对在客户终端处识别的、需要进行评级的统一资源标识符,
查询客户端高速缓存器,以确定所述客户端高速缓存器是否包含针对与所识别的统一资源标识符的第一组成部分相匹配的统一资源标识符的评级,
依据上述结果,利用所识别的统一资源标识符的第二组成部分来扩展所述第一组成部分;以及利用扩展后的统一资源标识符进行对客户端高速缓存器的进一步查询,或向所述评级服务器发送询问。
14.根据权利要求13所述的方法,其中扩展后的统一资源标识符与所识别的统一资源标识符相对应。
15.根据权利要求13所述的方法,包括:依据进一步查询的结果来扩展所述扩展后的统一资源标识符;以及重复对所述客户端高速缓存器的查询,或向所述评级服务器发送询问。
16.根据权利要求13所述的方法,其中发送给评级服务器的询问包含完整的所识别的统一资源标识符。
17.一种用于向客户终端提供与统一资源标识符相关的评级的方法,所述方法包括:
1)在服务器处或与服务器相关联地,维护包含针对统一资源标识符的高速缓存器;
2)在服务器处,从客户终端接收包含所询问的统一资源标识符的询问;
3)识别所询问的统一资源标识符的第一组成部分,并确定所述高速缓存器是否包含针对与所述第一组成部分相匹配的统一资源标识符的条目;
4)如果所述高速缓存器包含指示需要统一资源标识符的其它组成部分来对所询问的统一资源标识符进行评级的条目,则识别高速缓存器条目所指示的格式的第二组成部分,并确定高速缓存器是否包含针对与所述第一和第二组成部分相匹配的统一资源标识符的条目;
5)根据需要,通过包括其它组成部分来重复步骤4),直至获得最终评级或确定无法对所询问的统一资源标识符进行评级;
6)将所确定的评级返回客户终端,所确定的评级包括针对中间统一资源标识符确定的任何评级。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/387,923 US9461966B2 (en) | 2009-05-08 | 2009-05-08 | Method and apparatus for rating URLs |
US12/387,923 | 2009-05-08 | ||
PCT/EP2010/056107 WO2010128082A1 (en) | 2009-05-08 | 2010-05-05 | Method and apparatus for rating urls |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102428685A CN102428685A (zh) | 2012-04-25 |
CN102428685B true CN102428685B (zh) | 2015-02-18 |
Family
ID=42371361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080020130.1A Active CN102428685B (zh) | 2009-05-08 | 2010-05-05 | 用于url评级的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9461966B2 (zh) |
EP (1) | EP2428017B1 (zh) |
CN (1) | CN102428685B (zh) |
BR (1) | BRPI1013205A2 (zh) |
WO (1) | WO2010128082A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9300755B2 (en) * | 2009-04-20 | 2016-03-29 | Matthew Gerke | System and method for determining information reliability |
US9215548B2 (en) | 2010-09-22 | 2015-12-15 | Ncc Group Security Services, Inc. | Methods and systems for rating privacy risk of applications for smart phones and other mobile platforms |
US9137202B2 (en) | 2011-06-09 | 2015-09-15 | At&T Intellectual Property I, L.P. | System and method for dynamically adapting network delivery modes of content |
CN103092832A (zh) * | 2011-10-27 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 网址风险检测的处理方法及装置 |
CN103685174B (zh) * | 2012-09-07 | 2016-12-21 | 中国科学院计算机网络信息中心 | 一种不依赖样本的钓鱼网站检测方法 |
GB2505533B (en) * | 2012-12-14 | 2014-07-09 | F Secure Corp | Security method and apparatus |
US20140196144A1 (en) * | 2013-01-04 | 2014-07-10 | Jason Aaron Trost | Method and Apparatus for Detecting Malicious Websites |
US9286488B2 (en) | 2013-03-13 | 2016-03-15 | Northrop Grumman Systems Corporation | System and method for secure database queries |
CN104580093B (zh) * | 2013-10-21 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
US9419986B2 (en) | 2014-03-26 | 2016-08-16 | Symantec Corporation | System to identify machines infected by malware applying linguistic analysis to network requests from endpoints |
JP6259175B1 (ja) | 2017-05-12 | 2018-01-10 | ネットスター株式会社 | ウェブフィルタリングシステム |
US10652260B1 (en) * | 2017-11-08 | 2020-05-12 | Cisco Technology, Inc. | Detecting botnet domains |
US10805421B2 (en) | 2018-04-03 | 2020-10-13 | Citrix Systems, Inc. | Data caching for cloud services |
US11522670B2 (en) * | 2019-12-04 | 2022-12-06 | MaataData, Inc. | Pyramid construct with trusted score validation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772214B1 (en) * | 2000-04-27 | 2004-08-03 | Novell, Inc. | System and method for filtering of web-based content stored on a proxy cache server |
CN101341717A (zh) * | 2005-12-23 | 2009-01-07 | 国际商业机器公司 | 评估和访问网络地址的方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7539664B2 (en) * | 2001-03-26 | 2009-05-26 | International Business Machines Corporation | Method and system for operating a rating server based on usage and download patterns within a peer-to-peer network |
WO2003096669A2 (en) * | 2002-05-10 | 2003-11-20 | Reisman Richard R | Method and apparatus for browsing using multiple coordinated device |
US8332464B2 (en) * | 2002-12-13 | 2012-12-11 | Anxebusiness Corp. | System and method for remote network access |
US20050144297A1 (en) | 2003-12-30 | 2005-06-30 | Kidsnet, Inc. | Method and apparatus for providing content access controls to access the internet |
US7424476B2 (en) | 2004-04-16 | 2008-09-09 | Aol Llc | Categorized web browsing history |
US7634479B2 (en) | 2006-12-29 | 2009-12-15 | Trend Micro Incorporated | Pre-populating local URL rating cache |
-
2009
- 2009-05-08 US US12/387,923 patent/US9461966B2/en active Active
-
2010
- 2010-05-05 BR BRPI1013205-8A patent/BRPI1013205A2/pt not_active Application Discontinuation
- 2010-05-05 CN CN201080020130.1A patent/CN102428685B/zh active Active
- 2010-05-05 WO PCT/EP2010/056107 patent/WO2010128082A1/en active Application Filing
- 2010-05-05 EP EP10721736A patent/EP2428017B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772214B1 (en) * | 2000-04-27 | 2004-08-03 | Novell, Inc. | System and method for filtering of web-based content stored on a proxy cache server |
CN101341717A (zh) * | 2005-12-23 | 2009-01-07 | 国际商业机器公司 | 评估和访问网络地址的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102428685A (zh) | 2012-04-25 |
US20100287151A1 (en) | 2010-11-11 |
EP2428017B1 (en) | 2013-03-06 |
US9461966B2 (en) | 2016-10-04 |
BRPI1013205A2 (pt) | 2020-06-02 |
EP2428017A1 (en) | 2012-03-14 |
WO2010128082A1 (en) | 2010-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102428685B (zh) | 用于url评级的方法 | |
US10979485B2 (en) | Mechanism for distinguishing between content to be served through first or second delivery channels | |
CN106874471B (zh) | 信息推送方法和装置 | |
US10057207B2 (en) | Smart navigation for shortened URLs | |
US20080215675A1 (en) | Method and system for secured syndication of applications and applications' data | |
US20080126355A1 (en) | Entry group tags | |
CN107016074B (zh) | 一种网页加载方法及装置 | |
EP3491808B1 (en) | Interchangeable retrieval of content | |
CN107844488B (zh) | 数据查询方法和装置 | |
CN103810268A (zh) | 加载搜索结果推荐信息、网址检测的方法、装置和系统 | |
US11258608B1 (en) | Systems for secure access to protected content in a content management system | |
CN103793508A (zh) | 一种加载推荐信息、网址检测的方法、装置和系统 | |
US10764399B2 (en) | Customized web services gateway | |
US20190387069A1 (en) | Unified Content Posting | |
CN115495621A (zh) | 一种敏感词数据的屏蔽方法、装置、设备及存储介质 | |
CA2877604C (en) | System and method of resolving a domain name | |
US8005849B2 (en) | Database access server with reformatting | |
US20090063505A1 (en) | Selective chaining of LDAP directory servers | |
US8606832B2 (en) | Dynamic management of groups | |
US8745169B2 (en) | Intelligent system of unified content posting | |
CN114726616A (zh) | 一种网站访问请求的处理方法及装置 | |
KR100814533B1 (ko) | 엘디에이피 기반의 커넥션 유지 서비스 시스템 및 방법 | |
CN117014282A (zh) | 一种节点接入方法、装置及计算机可读存储介质 | |
CN115941349A (zh) | 社交通信方法、装置、设备及计算机可读存储介质 | |
EP3051442A1 (en) | Smart navigation for shortened urls |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: Helsinki, Finland Patentee after: Weiss Security Address before: Helsinki, Finland Patentee before: F-SECURE Corp. |
|
CP01 | Change in the name or title of a patent holder |