CN103548022B - Utf‑8模式匹配系统和方法 - Google Patents

Utf‑8模式匹配系统和方法 Download PDF

Info

Publication number
CN103548022B
CN103548022B CN201280024694.1A CN201280024694A CN103548022B CN 103548022 B CN103548022 B CN 103548022B CN 201280024694 A CN201280024694 A CN 201280024694A CN 103548022 B CN103548022 B CN 103548022B
Authority
CN
China
Prior art keywords
equipment
network
core
pattern
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280024694.1A
Other languages
English (en)
Other versions
CN103548022A (zh
Inventor
S·K·杜丽帕拉
S·C·弗农
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Citrix Systems Inc
Original Assignee
Citrix Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Citrix Systems Inc filed Critical Citrix Systems Inc
Publication of CN103548022A publication Critical patent/CN103548022A/zh
Application granted granted Critical
Publication of CN103548022B publication Critical patent/CN103548022B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Abstract

描述了用于有效地处理、搜索和/或重写可变宽度编码数据的系统和方法,该可变宽度编码数据例如是UTF‑8编码数据。系统和方法的实施例修改和改写了诸如Horspool和Wu‑Manber算法的搜索算法,以便有效地处理和管理在大块文本中搜索可变宽度编码文本,该大块文本例如可经由通过网络装置的分组流传输的文本,该网络装置例如是中间装置。

Description

UTF-8模式匹配系统和方法
相关申请
本申请要求在2011年3月28日提交的、名称为“Systems and Methods ForRewriting A Data Stream Containing UTF-8Encoding Via An Intermediary”的美国临时申请No.61/468470的权益和优先权,该美国临时申请通过引用被全部包含于此。
技术领域
本申请总的涉及修改数据。本申请尤其涉及在UTF-8编码的分组穿过中间装置时识别和重写它们。
背景技术
存在提供重写特征的不同系统,该重写特征允许系统重写分组内容。在一些实例中,需要被重写的内容可以是流过多核系统的内容。当前系统可提供在超文本传输协议(HTTP)层面的重写支持。此外,当前系统可在执行重写之前保存整个响应。
在许多实例中,提供重写支持的当前系统可能需要在执行重写之前积累整个响应。在这些实例中,保存响应的需求可导致增加的存储器消耗以及增加的响应时间延迟。其他系统可能需要不必要的开销动作,例如将响应复制到缓冲器的需求。还有一些其他的系统仅能重写可累积的数据量。在其他系统中,可多次执行主体解析,使得主体被解析的次数可与用新模式重写特定模式的动作的数量相等。在这些系统的许多中,附加需求可耗尽资源和存储器,从而降低了特定时间段期间的吞吐量或者被重写的分组量。
发明内容
鉴于当前系统的缺点,需要一种系统,其能够重写分组流、保存最小数量的分组并且使用最小量的资源。特别地,本公开的系统和方法对(例如在分组流内的)多字节字符编码的数据或文本提供更有效的搜索。
UTF-8是关于统一码(Unicode)的多字节字符编码,其通常由符合互联网数字分配机构(IANA)列表的标准使用,该标准包括CSS、HTML、XML和HTTP头部。UTF-8使用的日益增加可归因于其反向兼容ASCII,以及归因于其不需要采用字节顺序标记(BOM)。由于行业主要使用UTF-8,所以需要能够在大块文本中搜索多个UTF-8编码模式的系统。
当前系统使用各种算法来识别字符串中的子串,也称为多模式匹配。该算法的例子包括((可在http://webglimpse.net/pubs/TR94-17.pdf获得的)Sun Wu和Udi Manber,“A Fast Algorithm for Multi-Pattern Searching”,技术报告TR-94-17,亚利桑那大学(1994)中所描述的,其中通过引用全部包含其内容的)Wu-Manber和Horspool算法。
Wu-Manber算法是对Boyer-Moore算法的改进算法。如本领域公知的,Wu-Manber算法是采用以下三个表的多阶段算法:移动表(SHIFT table)、哈希表(HASH table)和前缀表(PREFIX table)。与Boyer-Moore算法一样,对于检查在特定位置处是否存在匹配进行的验证或尝试是反向操作的。移动表用于在扫描文本时确定可移动或者略过文本中的多少个字符。哈希和前缀表用于为匹配确定哪个模式是候选模式,并且验证该匹配。
Wu-Manber用于同时搜索多个模式。P={p1,p2,…,pk}表示一组模式,是来自固定字母表的字符的串,每个pi是一个字符串。lmin表示P中模式的最小长度,且lmax表示P中模式的最大长度。T={t1,t2,…tN}是包括与P相同的固定字母表的字符的大文本。M是所有模式的总的大小,其中M=k*lmin,且c是固定字母表的大小。Wu-Manber的实质是使用长度为B的字符块,以通过生成表来对模式进行预处理。如果文本中B个字符的字符串没有出现在任何模式中,则搜索移动lmin-B+1。将每个大小为B的字符串映射到用作对移动表的索引的整数。移动表中的值确定在扫描T时移动多远。设X=x1...xΒ为正被扫描的文本中的B个字符,并且X被映射到移动表的第i个条目。有两种情况:
·如果X没有作为P中任何模式的子串出现,则搜索移动(lmin-B+1)个字符。系统在SHIFT[i]中存储(lmin-B+1)。
·如果X作为P的某些模式的子串出现,则标识在任何模式中最右边出现的X。如果X在Pj的位置q处结束,并且假设X不在任何其他模式中大于q的任何位置处结束。则在SHIFT[i]中存储lmin-q。
为计算移动表,分别考虑每个模式pi=a1a2...almin。将大小为B的pi的子串aj-b+1…aj映射到移动表,且将相应的值设置为其当前值(所有子串当前值的初始值为lmin-B+1)和lmin-j(得到该子串需要移动的量)中的最小值。在搜索阶段期间,只要移动(SHIFT)值为正,则沿文本移动搜索位置。当移动值为零时,到搜索位置左边的文本可能是一个模式字符串。
正是同一个整数索引到另一个表,称作哈希。哈希表的第i个条目HASH[i]包括指向模式列表的指针,该模式最后B个字符哈希到i。哈希表仅保存模式,而移动表保存大小为B的所有可能的字符串。
对使用UTF-8编码的模式实现Wu-Manber算法存在一些挑战。对于不区分大小写的字符串比较,在比较前将字符串都转换为同样格式其效率非常低。该附加步骤可能将算法的效率降低到几乎为线性效率,其不同于Wu-Manber算法的原始次线性效率。此外,Wu-Manber需要跳转到文本中标识的第N个字符。由于在ASCII中每个字符是单字节的,这是常量时间的操作。然而,由于UTF-8是多字节编码,因为跳转到字符位置需要在计算字符期间穿过整个文本,该操作变为线性操作。这还将算法从次线性效率降低到线性效率。
用于对字符串进行多模式匹配的另一个经常使用的公知算法是Horsp ool算法。与Wu-Manber算法一样,Horspool是Boyer-Moore算法的变形。Horspool算法是简化的Boyer-Moore算法,并且具有O(N)的平均复杂度和最差情况下O(MN)的复杂度,其中N表示搜索字符串的长度且M表示模式的长度。在由Nigel Horspool撰写的、标题为“PracticalFast Searchin g in Strings”的文章(Software-Practice and Experience,卷10,页501-506(1980))中更加详细地描述了该算法,其中通过引用全部包括了该内容。Horspool算法也执行模式预处理,作为在初始匹配尝试失败时确定在搜索文本中向前跳过多远的手段。预处理的结果存储在矢量中,其中在搜索处理期间使用该矢量。
示例:
文本:G C A T C G C A G A G A G T A T A C A G T A C G
模式:G C A G A G A G
模式字符的跳转值为:
G C A G A G A G
7 6 5 4 3 2 1
字符的跳转值(jump value)是其距离结尾(不考虑最后字符)的位置。如果模式中有字符重复,则采取最小的位置。对于上面列举的示例,该模式的跳转值为:
A=1
G=2
C=6
列举的值反映在忽略最后位置的情况下字符在字符串中距离结尾的最小位置。
初始值:
文本:G C A T C G C A G A G A G T A T A C A G T A C G
模式:G C A G A G A G
步骤1:
比较模式的最后字符与文本的相应字符。跳转总是基于该文本字符,其称作支点(pivot)字符。在所给的示例中,由于模式的最后字符(G)与文本的相应字符(A)不匹配,所以存在不匹配,并且在文本字符A(该步骤的支点字符)处不匹配,将模式向右跳转A的跳转值(在实际的实现中,保持指向该文本的指针且移动该指针)。
步骤1之后的位置:
文本:G C A T C G C A G A G A G T A T A C A G T A C G
模式:G C A G A G A G
步骤2:
尽管模式的最后字符与文本中相应的字符相匹配,但实际匹配失败。所以系统再次前进支点字符(G)的跳转值。
步骤2之后的位置:
文本:G C A T C G C A G A G A G T A T A C A G T A C G
模式:G C A G A G A G
步骤3:
由于模式最后的字符与文本中的相应字符相匹配,则系统从头开始进行比较以查看是否是完美匹配。在这种情况下,由于在其第一个字符存在不匹配(G与T不匹配),则系统再次跳转支点字符(该情况下为G)的跳转值。
步骤3之后的位置:
文本:G C A T C G C A G A G A G T A T A C A G T A C G
模式:G C A G A G A G
步骤4:模式的最后字符匹配,且从开头比较字符串。如示例中所示,找到匹配。
对使用UTF-8编码的模式实现Horspool算法存在一些挑战。在ASCI I情况下预处理和存储预处理的模式比较简单,这是因为ASCII字符的总数小于用UTF-8编码的那些字符,并且对于所有ASCII来说大写与相应的小写字符之间的差是相同的。但是对于UTF-8字符来说,可能需要有效的数据结构来存储预处理的字符串,并且不区分大小写的比较变得较为复杂,这是因为除了通过引用格式映射表,没有直接的方法来寻找字符的其他格式(case)。对于不区分大小写的字符串比较,在比较前将字符串都转换为相同格式其效率非常低。这将算法的效率降低到几乎线性的效率,而不是原始的次线性效率。规则的Horspool算法需要跳转到文本的第N个字符。由于ASCII中的每个字符是单字节的,这是常量时间的操作。但在UTF-8中,由于跳转到字符位置需要在计算字符期间穿过整个文本,这样是线性的操作。这样还使得算法从次线性变为线性。
在实现不分大小写的过程中,在计算前缀和后缀表的同时,将所有U TF-8模式转换为相应的小写模式,并且如同规则Wu-Manber算法,对它们计算哈希值和相应的跳转值。
将三个字节的块用于哈希计算。这与Wu-Manber不同,因为在计算移动和哈希表时,系统使用字节而非字符。在一些实施例中,可基于模式或统计分析使用另一长度的字节。例如,如果模式具有为10的字节长度,在将模式转换为其小写后,字节8、9、10用于计算哈希。该元组的跳转值为零。对于字节(8、9、10)的哈希值,存储跳转值0。不管何时记录为零的零跳转,在相同的表中(或者在替换表中)还存储该模式。因此,如果在哈希索引处的跳转值为零,可以很容易地访问所有相应的模式。当在文本中进行搜索时这样是有益的。不管何时找到具有零跳转的支点块,获取并且检查所有相应的模式,以验证它们中的任何一个是否与文本实际上相匹配。
修改的算法可能需要在文本中跳转。为保持次线性运行时间复杂度,使用字节跳转而非字符跳转。这可能导致跳转到字符的中间。在一些实施例中,这样有助于确定不存在匹配。在一些情况下,当跳转到字符的中间时,系统转到字符的开头并且继续进行算法。
首先,获取所有模式的最小字节长度,并且系统根据最小模式在文本中进行跳转。从该位置使用最后三个字节计算哈希值。由于这是不区分大小写的字符串搜索(并且因此对小写UTF-8字符串计算哈希表),所以在计算哈希前将字节转换为小写。由于只能将字符转换为小写,获取包括所选择的3个字节的最小有效UTF-8字符串。将该字符串转换为小写UTF-8字符串,并且将来自相同位置的三个字节用于哈希值计算。由于这一步,算法仅对该简单情况起作用:其中UTF-8字符长度并不随着格式转换而改变。基于该哈希值来标识跳转。
在本公开的一些实施例中,修改的Wu-Manber算法可包括以下步骤:
1.初始化:设置指向文本开头的指针。(通过获取所有模式之中最小的字节长度lmin以及通过将指针移动lmin-3个字节,其中3是块的大小)将指针移动到支点块。
2.对于支点块中的三个字节计算哈希值。为此,找到包括这三个字节的最小有效UTF-8字符串,并且将该字符串转换为小写。从小写字符串中,选择该三个字节的位置并且计算哈希值,以及根据哈希值找到跳转。
3.如果在该哈希处跳转为0,则在该位置处可匹配一个或多个模式。在预处理步骤中,当在哈希表中记录零跳转时,还维护在该哈希处具有零跳转的模式列表。获取并且检查那些模式中的每一个,以查看是否存在任何匹配。任何这样的搜索可能需要基于模式长度在文本中回顾适当的长度。如果文本中的这个点没有到达字符边界,甚至可以在比较任何字符之前跳过该模式。如果该点在字符边界处,执行不区分大小写的UTF-8字符串比较,以检查模式是否匹配文本的该部分。如果其匹配,则公布对该字符串的匹配。系统继续匹配模式列表中的其他字符串,直到用尽关于该哈希的列表。将跳转设置为1。注意:如Wu-Manber文章所描述的,系统还可以对模式进行前缀匹配。
4.根据跳转值在文本中跳转。如果该跳转超过文本边界,则公布没有更多的匹配。否则获取该指针处的最后三个字节作为支点块。
5.转到步骤2。
在规则Horspool中,字符的跳转值是其在模式中距离结尾的位置。如果字符重复多于一次,则其所有位置中的最小值将是其跳转值。由于用于找到某个字符的跳转值的线性搜索效率较低(如需要在算法的每次迭代中找到某个字符的跳转值的搜索),所以需要索引表来存储该跳转值。对于ASCII来说,由于ASCII字符数量较小,可使用普通索引表来存储跳转值。在UTF-8中,可能的字符数量巨大。对于模式中的每个UTF-8字符,计算其相应的统一码值。如果其是大写的,则计算相应的小写统一码值。在任何一种情况下,在统一码值上应用哈希。由于UTF-8字符可以最多有4个字节,所以维护四个哈希表,每个大小一个哈希表(基于统计分析、空间限制和哈希冲突,该数可以减少或增加)。如果存在哈希冲突,则跳转值应该是两者中的最小值。这是因为,在不存在任何哈希冲突时,字符的跳转值确保在跳转之后文本的支点字符与模式中的相同字符对齐。没有该对齐,系统不能识别任何匹配。在冲突的情况下,通过获取现有值和新值的最小值,跳转可能不会使文本中的支点与模式中的相同字符对齐,但是其确保不会漏掉匹配。可以通过从后处理而不是从前处理模式,来容易地实现获取两个哈希值中的最小值。
在跳转表中,字符的跳转值是其在模式中距离后面的位置。但是如果保持跳转表中的字符位置,则系统可能必须在UTF-8文本中跳转那些字符,并且系统将变为字符接字符的匹配,该匹配的效率非常低。因此,不保持字符在模式中的位置。相反,使用相应的字节长度。那样,当使用这些值在文本中进行跳转时,系统可以执行直接跳转而不用计算字符。
比较模式的最后字符与文本。并且如果存在匹配,则比较整个模式。要不区分大小写地比较两个字符,系统需要计算它们相应的小写(或大写)统一码值。由于事先已知模式,则在预处理步骤中,系统计算模式所有字符的小写统一码值,并且进行存储。还存储模式的字节长度和最后字符的长度。在流式文本中,搜索预处理模式。
在处理不对齐时,算法可能需要在文本中跳转。为保持次线性运行时间复杂度,使用字节跳转而不是字符跳转。这样会导致跳转到字符的中间。在一些实施例中,这样有助于确定不存在匹配。在一些情况下,当在字符的中间时,系统转到字符的开头并且用算法继续处理。
在处理选择支点元素时,获取模式的最后字符以及文本中的相应字符,以执行不区分大小写的比较。如果模式具有5个字符,则系统需要转到文本中的第5个字符,并且将其与模式的第5个字符进行比较。但是转到文本中第5个字符是线性时间,因此,而是使用模式的字节长度。如果模式中的最后字符长度为4,并且如果模式为20字节长度,则最后字符从第17个字节开始。在文本中,系统还直接转到第17个字节,并且查看其是否与字符边界对齐。系统朝文本的开头转到最近的对齐字符。在任何情况下,在文本中寻找模式的小写统一码值(该值是支点元素)。在不匹配的情况下,系统从跳转表中找到其跳转值且在文本中跳转,使得文本的比较点向右移动,并且比较该点与模式中的相应点。
在本公开的一些实施例中,修改的Horspool算法可包括以下步骤:
1.初始化:设置指向文本开头的指针。基于模式长度和最后字符长度,在文本中跳转到其支点元素。在初始化过程中,如果任何这样的跳转转到字符的中间,则转到下一字符。但在随后的步骤中,在任何这种不对齐的情况下,转到字符的开头。
2.比较支点元素的小写统一码值与模式最后字符的相应值。如果上面比较的字符相同则转到模式的开头,并且跳转到文本的相应字节位置,以比较模式与文本的该部分。但是在文本中的该跳转可能到达字符的中间,其明显表示没有匹配。但如果跳转到字符边界,则对两个字符串执行不区分大小写的比较。
3.如果存在匹配,通过公布匹配位置退出(如果搜索模式的多次出现,则可继续算法直到到达文本的结尾)。如果不存在匹配,则跳转当前支点元素的跳转值。
4.如果跳转遇到或者穿过文本的结尾,则退出算法。如果跳转到达字符的开头或中间,将该字符取作支点元素。
5.转到步骤2。
在一个方面,本公开涉及用于在文本块中不区分大小写地搜索可变宽度编码模式的系统和方法。装置可为模式中的每个字符确定相应的小写统一码值,其中对于该模式在文本块中搜索匹配。所述模式可由可变宽度编码字符组成。装置可为所述模式建立跳转值的索引表,所述索引表包括对每个相应的小写统一码值的哈希,该哈希标识关于相应字符的多个字节长度。响应于跳转值的索引表,所述装置可基于模式的字节长度以及模式的最后字符的字节长度,将指向文本块的指针跳转到文本块中的支点元素。所述装置比较支点元素的小写统一码值与所述模式的最后字符的字符的相应小写统一码值。
在一些实施例中,装置确定在所述模式中的字符是大写的,并且计算小写统一码值。所述模式可以是UTF-8编码的模式,或者包括UTF-8编码的可变宽度编码字符。在一些实施例中,所述装置为每个大小的可变宽度编码字符建立索引表。在一些实施例中,所述装置在文本块的开头处设置指针。在一些实施例中,所述装置确定所述指针已经跳转到文本块中的字符的中间。响应于确定指针已经跳转到文本块中的字符的中间,所述装置可将指针移动或设置到该字符的开头。在一些实施例中,所述装置确定到支点元素的跳转是到字符边界的跳转,并且所述装置响应于确定跳转到字符边界而执行比较。在一些实施例中,所述装置确定支点元素的小写统一码值与所述模式的最后字符的字符的相应小写统一码值相匹配。所述装置可将指针跳转到与模式的开头相对应的文本块中的字节位置,并且比较模式与由指针标识的文本块的相应部分。
在另一个方面,本公开涉及用于在文本块中对可变宽度编码模式同时执行不区分大小写搜索的系统和方法。装置可将要在文本块内搜索的每个模式转换为相应的小写模式,每个模式包括可变宽度编码字符。所述装置可为每个模式建立转移表,该转移表包括相应的小写模式的预定数量字节的哈希以及跳转值。响应于转移表,所述装置可将指针跳转或移动到文本块的支点块。所述装置可标识支点块内的编码字符串,其包括来自支点块的预定数量字节的字节,并且计算与预定数量字节相对应的小写编码字符串的字节的哈希。所述装置可使用字节的哈希,从转移表获得跳转值。
在一些实施例中,所述模式包括UTF-8编码的可变宽度编码字符。在一些实施例中,所述装置在每个哈希维护具有零跳转的模式列表。在一些实施例中,所述装置基于所有模式的最小字节长度,首先将指针跳转到初始支点块。在一些实施例中,所述装置识别最小有效编码字符串,其包括来自支点块的预定数量字节的字节。
在一些实施例中,所述装置识别出跳转值为零。所述装置可确定与为零的跳转值相关联的任何模式是否与文本块中的相应文本相匹配。所述装置可为每个模式将指向文本块的指针移回模式的多个字节长度。所述装置可响应于识别所述指针不是字符边界,确定所述模式与由所述指针标识的文本的相应部分不匹配。所述装置可响应于识别所述指针在字符边界处,比较模式与由所述指针标识的文本块的文本。
在附图和下面的描述中将详细阐述本发明的各种实施例的细节。
附图说明
通过参考下述结合附图的描述,本发明的前述和其它目的、方面、特征和优点将会更加明显并更易于理解,其中:
图1A是客户机经由设备访问服务器的网络环境的实施例的框图;
图1B是经由设备从服务器传送计算环境到客户机的环境的实施例的框图;
图1C是经由设备从服务器传送计算环境到客户机的环境的另一个实施例的框图;
图1D是经由设备从服务器传送计算环境到客户机的环境的另一个实施例的框图;
图1E-1H是计算装置的实施例的框图;
图2A是用于处理客户机和服务器之间的通信的设备的实施例的框图;
图2B是用于优化、加速、负载平衡和路由客户端和服务器之间的通信的设备的另一个实施例的框图;
图3是用于经由设备与服务器通信的客户机的实施例的框图;
图4A是虚拟化环境的实施例的框图;
图4B是虚拟化环境的另一个实施例的框图;
图4C是虚拟化设备的实施例的框图;
图5A是在多核网络设备中实现并行的方法的实施例的框图;
图5B是使用多核系统的系统的实施例的框图;
图5C是多核系统的一个方面的另一实施例的框图;
图6A-6C是用于执行流式重写的系统的实施例的框图;
图7是用于执行流式重写的方法的实施例的流程图;
图8A是用于执行流式重写的方法的实施例的流程图;以及
图8B是用于执行流式重写的方法的另一个实施例的流程图;
图9A是用于搜索可变宽度编码数据的系统的实施例的框图;
图9B是用于搜索可变宽度编码数据的方法的实施例的流程图;
图9C是用于搜索可变宽度编码数据的方法的另一个实施例的流程图。
从下面结合附图所阐述的详细描述,本发明的特征和优点将更明显,其中,同样的参考标记在全文中标识相应的元素。在附图中,同样的附图标记通常表示相同的、功能上相似的和/或结构上相似的元素。
具体实施方式
为了阅读下文各种实施例的描述,下述对于说明书的部分以及它们各自内容的描述是有用的:
-A部分描述有益于实施本文描述的实施例的网络环境和计算环境;
-B部分描述用于将计算环境传送到远程用户的系统和方法的实施例;
-C部分描述用于加速客户机和服务器间通信的系统和方法的实施例;
-D部分描述用于对应用传送控制器进行虚拟化的系统和方法的实施例。
-E部分描述用于提供多核架构和环境的系统和方法的实施例;以及
-F部分描述用于经由中间装置重写数据流的系统和方法的实施例;
-G部分描述用于经由中间装置重写包含UTF-8编码的数据流的系统和方法的实施例。
A.网络和计算环境
在讨论设备和/或客户机的系统和方法的实施例的细节之前,讨论可在其中部署这些实施例的网络和计算环境是有帮助的。现在参见图1A,描述了网络环境的实施例。概括来讲,网络环境包括经由一个或多个网络104、104’(总的称为网络104)与一个或多个服务器106a-106n(同样总的称为服务器106,或远程机器106)通信的一个或多个客户机102a-102n(同样总的称为本地机器102,或客户机102)。在一些实施例中,客户机102通过设备200与服务器106通信。
虽然图1A示出了在客户机102和服务器106之间的网络104和网络104’,客户机102和服务器106可以位于同一个的网络104上。网络104和104’可以是相同类型的网络或不同类型的网络。网络104和/或104’可为局域网(LAN)例如公司内网,城域网(MAN),或者广域网(WAN)例如因特网或万维网。在一个实施例中,网络104可为专用网络并且网络104’可为公网。在一些实施例中,网络104可为专用网并且网络104’可为公网。在又一个实施例中,网络104和104’可都为专用网。在一些实施例中,客户机102可位于公司企业的分支机构中,通过网络104上的WAN连接与位于公司数据中心的服务器106通信。
网络104和/或104’可以是任何类型和/或形式的网络,并且可包括任何下述网络:点对点网络,广播网络,广域网,局域网,电信网络,数据通信网络,计算机网络,ATM(异步传输模式)网络,SONET(同步光纤网络)网络,SDH(同步数字体系)网络,无线网络和有线网络。在一些实施例中,网络104可以包括无线链路,诸如红外信道或者卫星频带。网络104和/或104’的拓扑可为总线型、星型或环型网络拓扑。网络104和/或104’以及网络拓扑可以是对于本领域普通技术人员所熟知的、可以支持此处描述的操作的任何这样的网络或网络拓扑。
如图1A所示,设备200被显示在网络104和104’之间,设备200也可被称为接口单元200或者网关200。在一些实施例中,设备200可位于网络104上。例如,公司的分支机构可在分支机构中部署设备200。在其他实施例中,设备200可以位于网络104’上。例如,设备200可位于公司的数据中心。在又一个实施例中,多个设备200可在网络104上部署。在一些实施例中,多个设备200可部署在网络104’上。在一个实施例中,第一设备200与第二设备200’通信。在其他实施例中,设备200可为位于与客户机102同一或不同网络104、104’的任一客户机102或服务器106的一部分。一个或多个设备200可位于客户机102和服务器106之间的网络或网络通信路径中的任一点。
在一些实施例中,设备200包括由位于佛罗里达州Ft.Lauderdale的CitrixSystems公司制造的被称为Citrix NetScaler设备的任何网络设备。在其他实施例中,设备200包括由位于华盛顿州西雅图的F5Networks公司制造的被称为WebAccelerator和BigIP的任何一个产品实施例。在又一个实施例中,设备205包括由位于加利福尼亚州Sunnyvale的Juniper Networks公司制造的DX加速设备平台和/或诸如SA700、SA2000、SA4000和SA6000的SSL VPN系列设备中的任何一个。在又一个实施例中,设备200包括由位于加利福尼亚州San Jose的Cisco Systems公司制造的任何应用加速和/或安全相关的设备和/或软件,例如Cisco ACE应用控制引擎模块服务(Application Control Engine Moduleservice)软件和网络模块以及Cisco AVS系列应用速度系统(Application VelocitySystem)。
在一个实施例中,系统可包括多个逻辑分组的服务器106。在这些实施例中,服务器的逻辑分组可以被称为服务器群38。在其中一些实施例中,服务器106可为地理上分散的。在一些情况中,群38可以作为单个实体被管理。在其他实施例中,服务器群38包括多个服务器群38。在一个实施例中,服务器群代表一个或多个客户机102执行一个或多个应用程序。
在每个群38中的服务器106可为不同种类。一个或多个服务器106可根据一种类型的操作系统平台(例如,由华盛顿州Redmond的Microsoft公司制造的WINDOWS NT)操作,而一个或多个其它服务器106可根据另一类型的操作系统平台(例如,Unix或Linux)操作。每个群38的服务器106不需要与同一群38内的另一个服务器106物理上接近。因此,被逻辑分组为群38的服务器106组可使用广域网(WAN)连接或城域网(MAN)连接互联。例如,群38可包括物理上位于不同大陆或大陆的不同区域、国家、州、城市、校园或房间的服务器106。如果使用局域网(LAN)连接或一些直连形式来连接服务器106,则可增加群38中的服务器106间的数据传送速度。
服务器106可指文件服务器、应用服务器、web服务器、代理服务器或者网关服务器。在一些实施例中,服务器106可以有作为应用服务器或者作为主应用服务器工作的能力。在一个实施例中,服务器106可包括活动目录。客户机102也可称为客户端节点或端点。在一些实施例中,客户机102可以有作为客户机节点寻求访问服务器上的应用的能力,也可以有作为应用服务器为其它客户机102a-102n提供对寄载的应用的访问的能力。
在一些实施例中,客户机102与服务器106通信。在一个实施例中,客户机102与群38中的服务器106的其中一个直接通信。在又一个实施例中,客户机102执行程序邻近应用(program neighborhood application)以与群38内的服务器106通信。在又一个实施例中,服务器106提供主节点的功能。在一些实施例中,客户机102通过网络104与群38中的服务器106通信。通过网络104,客户机102例如可以请求执行群38中的服务器106a-106n寄载的各种应用,并接收应用执行结果的输出进行显示。在一些实施例中,只有主节点提供识别和提供与寄载所请求的应用的服务器106’相关的地址信息所需的功能。
在一个实施例中,服务器106提供web服务器的功能。在又一个实施例中,服务器106a接收来自客户机102的请求,将该请求转发到第二服务器106b,并使用来自服务器106b对该请求的响应来对客户机102的请求进行响应。在又一个实施例中,服务器106获得客户机102可用的应用的列举以及与由该应用的列举所识别的应用的服务器106相关的地址信息。在又一个实施例中,服务器106使用web接口将对请求的响应提供给客户机102。在一个实施例中,客户机102直接与服务器106通信以访问所识别的应用。在又一个实施例中,客户机102接收由执行服务器106上所识别的应用而产生的诸如显示数据的应用输出数据。
现参考图1B,描述了部署多个设备200的网络环境的实施例。第一设备200可以部署在第一网络104上,而第二设备200’部署在第二网络104’上。例如,公司可以在分支机构部署第一设备200,而在数据中心部署第二设备200’。在又一个实施例中,第一设备200和第二设备200’被部署在同一个网络104或网络104上。例如,第一设备200可以被部署用于第一服务器群38,而第二设备200可以被部署用于第二服务器群38’。在另一个实例中,第一设备200可以被部署在第一分支机构,而第二设备200’被部署在第二分支机构’。在一些实施例中,第一设备200和第二设备200’彼此协同或联合工作,以加速客户机和服务器之间的网络流量或应用和数据的传送。
现参考图1C,描述了网络环境的又一个实施例,在该网络环境中,将设备200和一个或多个其它类型的设备部署在一起,例如,部署在一个或多个WAN优化设备205,205’之间。例如,第一WAN优化设备205显示在网络104和104’之间,而第二WAN优化设备205’可以部署在设备200和一个或多个服务器106之间。例如,公司可以在分支机构部署第一WAN优化设备205,而在数据中心部署第二WAN优化设备205’。在一些实施例中,设备205可以位于网络104’上。在其他实施例中,设备205’可以位于网络104上。在一些实施例中,设备205’可以位于网络104’或网络104"上。在一个实施例中,设备205和205’在同一个网络上。在又一个实施例中,设备205和205’在不同的网络上。在另一个实例中,第一WAN优化设备205可以被部署用于第一服务器群38,而第二WAN优化设备205’可以被部署用于第二服务器群38’。
在一个实施例中,设备205是用于加速、优化或者以其他方式改善任何类型和形式的网络流量(例如去往和/或来自WAN连接的流量)的性能、操作或服务质量的装置。在一些实施例中,设备205是一个性能增强代理。在其他实施例中,设备205是任何类型和形式的WAN优化或加速装置,有时也被称为WAN优化控制器。在一个实施例中,设备205是由位于佛罗里达州Ft.Lauderdale的Citrix Systems公司出品的被称为WANScaler的产品实施例中的任何一种。在其他实施例中,设备205包括由位于华盛顿州Seattle的F5Networks公司出品的被称为BIG-IP链路控制器和WANjet的产品实施例中的任何一种。在又一个实施例中,设备205包括由位于加利福尼亚州Sunnyvale的Juniper NetWorks公司出品的WX和WXC WAN加速装置平台中的任何一种。在一些实施例中,设备205包括由加利福尼亚州SanFrancisco的Riverbed Technology公司出品的虹鳟(steelhead)系列WAN优化设备中的任何一种。在其他实施例中,设备205包括由位于新泽西州Roseland的Expand Networks公司出品的WAN相关装置中的任何一种。在一个实施例中,设备205包括由位于加利福尼亚州Cupertino的Packeteer公司出品的任何一种WAN相关设备,例如由Packeteer提供的PacketShaper、iShared和SkyX产品实施例。在又一个实施例中,设备205包括由位于加利福尼亚州San Jose的Cisco Systems公司出品的任何WAN相关设备和/或软件,例如Cisco广域网应用服务软件和网络模块以及广域网引擎设备。
在一个实施例中,设备205为分支机构或远程办公室提供应用和数据加速服务。在一个实施例中,设备205包括广域文件服务(WAFS)的优化。在又一个实施例中,设备205加速文件的传送,例如经由通用互联网文件系统(CIFS)协议。在其他实施例中,设备205在存储器和/或存储装置中提供高速缓存来加速应用和数据的传送。在一个实施例中,设备205在任何级别的网络堆栈或在任何的协议或网络层中提供网络流量的压缩。在又一个实施例中,设备205提供传输层协议优化、流量控制、性能增强或修改和/或管理,以加速WAN连接上的应用和数据的传送。例如,在一个实施例中,设备205提供传输控制协议(TCP)优化。在其他实施例中,设备205提供对于任何会话或应用层协议的优化、流量控制、性能增强或修改和/或管理。
在又一个实施例中,设备205将任何类型和形式的数据或信息编码成网络分组的定制的或标准的TCP和/或IP的报头字段或可选字段,以将其存在、功能或能力通告给另一个设备205’。在又一个实施例中,设备205’可以使用在TCP和/或IP报头字段或选项中编码的数据来与另一个设备205’进行通信。例如,设备可以使用TCP选项或IP报头字段或选项来传达在执行诸如WAN加速的功能时或者为了彼此联合工作而由设备205,205’所使用的一个或多个参数。
在一些实施例中,设备200保存在设备205和205’之间传达的TCP和/或IP报头和/或可选字段中编码的任何信息。例如,设备200可以终止经过设备200的传输层连接,例如经过设备205和205’的在客户机和服务器之间的一个传输层连接。在一个实施例中,设备200识别并保存由第一设备205通过第一传输层连接发送的传输层分组中的任何编码信息,并经由第二传输层连接来将具有编码信息的传输层分组传达到第二设备205’。
现参考图1D,描述了用于传送和/或操作客户机102上的计算环境的网络环境。在一些实施例中,服务器106包括用于向一个或多个客户机102传送计算环境或应用和/或数据文件的应用传送系统190。总的来说,客户机10通过网络104、104’和设备200与服务器106通信。例如,客户机102可驻留在公司的远程办公室里,例如分支机构,并且服务器106可驻留在公司数据中心。客户机102包括客户机代理120以及计算环境15。计算环境15可执行或操作用于访问、处理或使用数据文件的应用。可经由设备200和/或服务器106传送计算环境15、应用和/或数据文件。
在一些实施例中,设备200加速计算环境15或者其任何部分到客户机102的传送。在一个实施例中,设备200通过应用传送系统190加速计算环境15的传送。例如,可使用此处描述的实施例来加速从公司中央数据中心到远程用户位置(例如公司的分支机构)的流应用(streaming application)及该应用可处理的数据文件的传送。在又一个实施例中,设备200加速客户机102和服务器106之间的传输层流量。设备200可以提供用于加速从服务器106到客户机102的任何传输层有效载荷的加速技术,例如:1)传输层连接池,2)传输层连接多路复用,3)传输控制协议缓冲,4)压缩和5)高速缓存。在一些实施例中,设备200响应于来自客户机102的请求提供服务器106的负载平衡。在其他实施例中,设备200充当代理或者访问服务器来提供对一个或者多个服务器106的访问。在又一个实施例中,设备200提供从客户机102的第一网络104到服务器106的第二网络104’的安全虚拟专用网络连接,诸如SSLVPN连接。在又一些实施例中,设备200提供客户机102和服务器106之间的连接和通信的应用防火墙安全、控制和管理。
在一些实施例中,基于多个执行方法并且基于通过策略引擎195所应用的任一验证和授权策略,应用传送管理系统190提供将计算环境传送到远程的或者另外的用户的桌面的应用传送技术。使用这些技术,远程用户可以从任何网络连接装置100获取计算环境并且访问服务器所存储的应用和数据文件。在一个实施例中,应用传送系统190可驻留在服务器106上或在其上执行。在又一个实施例中,应用传送系统190可驻留在多个服务器106a-106n上或在其上执行。在一些实施例中,应用传送系统190可在服务器群38内执行。在一个实施例中,执行应用传送系统190的服务器106也可存储或提供应用和数据文件。在又一个实施例中,一个或多个服务器106的第一组可执行应用传送系统190,而不同的服务器106n可存储或提供应用和数据文件。在一些实施例中,应用传送系统190、应用和数据文件中的每一个可驻留或位于不同的服务器。在又一个实施例中,应用传送系统190的任何部分可驻留、执行、或被存储于或分发到设备200或多个设备。
客户机102可包括用于执行使用或处理数据文件的应用的计算环境15。客户机102可通过网络104、104’和设备200请求来自服务器106的应用和数据文件。在一个实施例中,设备200可以将来自客户机102的请求转发到服务器106。例如,客户机102可能不具有本地存储或者本地可访问的应用和数据文件。响应于请求,应用传送系统190和/或服务器106可以传送应用和数据文件到客户机102。例如,在一个实施例中,服务器106可以把应用作为应用流来传输,以在客户机102上的计算环境15中操作。
在一些实施例中,应用传送系统190包括Citrix Systems有限公司的CitrixAccess SuiteTM的任一部分(例如MetaFrame或Citrix Presentation ServerTM),和/或微软公司开发的Windows终端服务中的任何一个。在一个实施例中,应用传送系统190可以通过远程显示协议或者以其它方式通过基于远程计算或者基于服务器计算来传送一个或者多个应用到客户机102或者用户。在又一个实施例中,应用传送系统190可以通过应用流来传送一个或者多个应用到客户机或者用户。
在一个实施例中,应用传送系统190包括策略引擎195,其用于控制和管理对应用的访问、应用执行方法的选择以及应用的传送。在一些实施例中,策略引擎195确定用户或者客户机102可以访问的一个或者多个应用。在又一个实施例中,策略引擎195确定应用应该如何被传送到用户或者客户机102,例如执行方法。在一些实施例中,应用传送系统190提供多个传送技术,从中选择应用执行的方法,例如基于服务器的计算、本地流式传输或传送应用给客户机120以用于本地执行。
在一个实施例中,客户机102请求应用程序的执行并且包括服务器106的应用传送系统190选择执行应用程序的方法。在一些实施例中,服务器106从客户机102接收证书。在又一个实施例中,服务器106从客户机102接收对于可用应用的列举的请求。在一个实施例中,响应该请求或者证书的接收,应用传送系统190列举对于客户机102可用的多个应用程序。应用传送系统190接收执行所列举的应用的请求。应用传送系统190选择预定数量的方法之一来执行所列举的应用,例如响应策略引擎的策略。应用传送系统190可以选择执行应用的方法,使得客户机102接收通过执行服务器106上的应用程序所产生的应用输出数据。应用传送系统190可以选择执行应用的方法,使得本地机器10在检索包括应用的多个应用文件之后本地执行应用程序。在又一个实施例中,应用传送系统190可以选择执行应用的方法,以通过网络104流式传输应用到客户机102。
客户机102可以执行、操作或者以其它方式提供应用,所述应用可为任何类型和/或形式的软件、程序或者可执行指令,例如任何类型和/或形式的web浏览器、基于web的客户机、客户机-服务器应用、瘦客户端计算客户机、ActiveX控件、或者Java程序、或者可以在客户机102上执行的任何其它类型和/或形式的可执行指令。在一些实施例中,应用可以是代表客户机102在服务器106上执行的基于服务器或者基于远程的应用。在一个实施例中,服务器106可以使用任何瘦-客户端或远程显示协议来显示输出到客户机102,所述瘦-客户端或远程显示协议例如由位于佛罗里达州Ft.Lauderdale的Citrix Systems公司出品的独立计算架构(ICA)协议或由位于华盛顿州Redmond的微软公司出品的远程桌面协议(RDP)。应用可使用任何类型的协议,并且它可为,例如,HTTP客户机、FTP客户机、Oscar客户机或Telnet客户机。在其他实施例中,应用包括和VoIP通信相关的任何类型的软件,例如软IP电话。在进一步的实施例中,应用包括涉及到实时数据通信的任一应用,例如用于流式传输视频和/或音频的应用。
在一些实施例中,服务器106或服务器群38可运行一个或多个应用,例如提供瘦客户端计算或远程显示表示应用的应用。在一个实施例中,服务器106或服务器群38作为一个应用来执行Citrix Systems有限公司的Citrix Access SuiteTM的任一部分(例如MetaFrame或Citrix Presentation ServerTM),和/或微软公司开发的Windows终端服务中的任何一个。在一个实施例中,该应用是位于佛罗里达州Fort Lauderdale的Citrix Systems有限公司开发的ICA客户机。在其他实施例中,该应用包括由位于华盛顿州Redmond的Microsoft公司开发的远程桌面(RDP)客户机。另外,服务器106可以运行一个应用,例如,其可以是提供电子邮件服务的应用服务器,例如由位于华盛顿州Redmond的Microsoft公司制造的Microsoft Exchange,web或Internet服务器,或者桌面共享服务器,或者协作服务器。
在一些实施例中,任一应用可以包括任一类型的所寄载的服务或产品,例如位于加利福尼亚州Santa Barbara的Citrix Online Division公司提供的GoToMeetingTM,位于加利福尼亚州Santa Clara的WebEx有限公司提供的WebExTM,或者位于华盛顿州Redmond的Microsoft公司提供的Microsoft Office Live Meeting。
仍参考图1D,网络环境的一个实施例可以包括监控服务器106A。监控服务器106A可以包括任何类型和形式的性能监控服务198。性能监控服务198可以包括监控、测量和/或管理软件和/或硬件,包括数据收集、集合、分析、管理和报告。在一个实施例中,性能监控服务198包括一个或多个监控代理197。监控代理197包括用于在诸如客户机102、服务器106或设备200和205的装置上执行监控、测量和数据收集活动的任何软件、硬件或其组合。在一些实施例中,监控代理197包括诸如Visual Basic脚本或Javascript任何类型和形式的脚本。在一个实施例中,监控代理197相对于装置的任何应用和/或用户透明地执行。在一些实施例中,监控代理197相对于应用或客户机不显眼地被安装和操作。在又一个实施例中,监控代理197的安装和操作不需要用于该应用或装置的任何设备。
在一些实施例中,监控代理197以预定频率监控、测量和收集数据。在其他实施例中,监控代理197基于检测到任何类型和形式的事件来监控、测量和收集数据。例如,监控代理197可以在检测到对web页面的请求或收到HTTP响应时收集数据。在另一个实例中,监控代理197可以在检测到诸如鼠标点击的任一用户输入事件时收集数据。监控代理197可以报告或提供任何所监控、测量或收集的数据给监控服务198。在一个实施例中,监控代理197根据时间安排或预定频率来发送信息给监控服务198。在又一个实施例中,监控代理197在检测到事件时发送信息给监控服务198。
在一些实施例中,监控服务198和/或监控代理197对诸如客户机、服务器、服务器群、设备200、设备205或网络连接的任何网络资源或网络基础结构元件的进行监控和性能测量。在一个实施例中,监控服务198和/或监控代理197执行诸如TCP或UDP连接的任何传输层连接的监控和性能测量。在又一个实施例中,监控服务198和/或监控代理197监控和测量网络等待时间。在又一个实施例中,监控服务198和/或监控代理197监控和测量带宽利用。
在其他实施例中,监控服务198和/或监控代理197监控和测量终端用户响应时间。在一些实施例中,监控服务198执行应用的监控和性能测量。在又一个实施例中,监控服务198和/或监控代理197执行到应用的任何会话或连接的监控和性能测量。在一个实施例中,监控服务198和/或监控代理197监控和测量浏览器的性能。在又一个实施例中,监控服务198和/或监控代理197监控和测量基于HTTP的事务的性能。在一些实施例中,监控服务198和/或监控代理197监控和测量IP电话(VoIP)应用或会话的性能。在其他实施例中,监控服务198和/或监控代理197监控和测量诸如ICA客户机或RDP客户机的远程显示协议应用的性能。在又一个实施例中,监控服务198和/或监控代理197监控和测量任何类型和形式的流媒体的性能。在进一步的实施例中,监控服务198和/或监控代理197监控和测量所寄载的应用或软件即服务(Software-As-A-Service,SaaS)传送模型的性能。
在一些实施例中,监控服务198和/或监控代理197执行与应用相关的一个或多个事务、请求或响应的监控和性能测量。在其他实施例中,监控服务198和/或监控代理197监控和测量应用层堆栈的任何部分,例如任何.NET或J2EE调用。在一个实施例中,监控服务198和/或监控代理197监控和测量数据库或SQL事务。在又一个实施例中,监控服务198和/或监控代理197监控和测量任何方法、函数或应用编程接口(API)调用。
在一个实施例中,监控服务198和/或监控代理197对经由诸如设备200和/或设备205的一个或多个设备从服务器到客户机的应用和/或数据的传送进行监控和性能测量。在一些实施例中,监控服务198和/或监控代理197监控和测量虚拟化应用的传送的性能。在其他实施例中,监控服务198和/或监控代理197监控和测量流式应用的传送的性能。在又一个实施例中,监控服务198和/或监控代理197监控和测量传送桌面应用到客户机和/或在客户机上执行桌面应用的性能。在又一个实施例中,监控服务198和/或监控代理197监控和测量客户机/服务器应用的性能。
在一个实施例中,监控服务198和/或监控代理197被设计和构建成为应用传送系统190提供应用性能管理。例如,监控服务198和/或监控代理197可以监控、测量和管理经由Citrix表示服务器(Citrix Presentation Server)传送应用的性能。在该实例中,监控服务198和/或监控代理197监控单独的ICA会话。监控服务198和/或监控代理197可以测量总的以及每次的会话系统资源使用,以及应用和连网性能。监控服务198和/或监控代理197可以对于给定用户和/或用户会话来标识有效服务器(active server)。在一些实施例中,监控服务198和/或监控代理197监控在应用传送系统190和应用和/或数据库服务器之间的后端连接。监控服务198和/或监控代理197可以测量每个用户会话或ICA会话的网络等待时间、延迟和容量。
在一些实施例中,监控服务198和/或监控代理197测量和监控对于应用传送系统190的诸如总的存储器使用、每个用户会话和/或每个进程的存储器使用。在其他实施例中,监控服务198和/或监控代理197测量和监控诸如总的CPU使用、每个用户会话和/或每个进程的应用传送系统190的CPU使用。在又一个实施例中,监控服务198和/或监控代理197测量和监控登录到诸如Citrix表示服务器的应用、服务器或应用传送系统所需的时间。在一个实施例中,监控服务198和/或监控代理197测量和监控用户登录应用、服务器或应用传送系统190的持续时间。在一些实施例中,监控服务198和/或监控代理197测量和监控应用、服务器或应用传送系统会话的有效和无效的会话计数。在又一个实施例中,监控服务198和/或监控代理197测量和监控用户会话等待时间。
在另外的实施例中,监控服务198和/或监控代理197测量和监控任何类型和形式的服务器指标。在一个实施例中,监控服务198和/或监控代理197测量和监控与系统内存、CPU使用和盘存储器有关的指标。在又一个实施例中,监控服务198和/或监控代理197测量和监控和页错误有关的指标,诸如每秒页错误。在其他实施例中,监控服务198和/或监控代理197测量和监控往返时间的指标。在又一个实施例中,监控服务198和/或监控代理197测量和监控与应用崩溃、错误和/或中止相关的指标。
在一些实施例中,监控服务198和监控代理198包括由位于佛罗里达州Ft.Lauderdale的Citrix Systems公司出品的被称为EdgeSight的任何一种产品实施例。在又一个实施例中,性能监控服务198和/或监控代理198包括由位于加利福尼亚州Palo Alto的Symphoniq公司出品的被称为TrueView产品套件的产品实施例的任一部分。在一个实施例中,性能监控服务198和/或监控代理198包括由位于加利福尼亚州San Francisco的TeaLeaf技术公司出品的被称为TeaLeafCX产品套件的产品实施例的任何部分。在其他实施例中,性能监控服务198和/或监控代理198包括由位于德克萨斯州Houston的BMC软件公司出品的诸如BMC性能管理器和巡逻产品(BMC Performance Manager and Patrolproducts)的商业服务管理产品的任何部分。
客户机102、服务器106和设备200可以被部署为和/或执行在任何类型和形式的计算装置上,诸如能够在任何类型和形式的网络上通信并执行此处描述的操作的计算机、网络装置或者设备。图1E和1F描述了可用于实施客户机102、服务器106或设备200的实施例的计算装置100的框图。如图1E和1F所示,每个计算装置100包括中央处理单元101和主存储器单元122。如图1E所示,计算装置100可以包括可视显示装置124、键盘126和/或诸如鼠标的指示装置127。每个计算装置100也可包括其它可选元件,例如一个或多个输入/输出装置130a-130b(总的使用附图标记130表示),以及与中央处理单元101通信的高速缓存存储器140。
中央处理单元101是响应并处理从主存储器单元122取出的指令的任何逻辑电路。在许多实施例中,中央处理单元由微处理器单元提供,例如:由加利福尼亚州MountainView的Intel公司制造的微处理器单元;由伊利诺伊州Schaumburg的Motorola公司制造的微处理器单元;由加利福尼亚州Santa Clara的Transmeta公司制造的微处理器单元;由纽约州White Plains的International Business Machines公司制造的RS/6000处理器;或者由加利福尼亚州Sunnyvale的Advanced Micro Devices公司制造的微处理器单元。计算装置100可以基于这些处理器中的任何一种,或者能够如此处所述方式运行的任何其它处理器。
主存储器单元122可以是能够存储数据并允许微处理器101直接访问任何存储位置的一个或多个存储器芯片,例如静态随机存取存储器(SRAM)、突发SRAM或同步突发SRAM(BSRAM)、动态随机存取存储器DRAM、快速页模式DRAM(FPM DRAM)、增强型DRAM(EDRAM)、扩展数据输出RAM(EDO RAM)、扩展数据输出DRAM(EDO DRAM)、突发式扩展数据输出DRAM(BEDODRAM)、增强型DRAM(EDRAM)、同步DRAM(SDRAM)、JEDEC SRAM、PC100SDRAM、双数据速率SDRAM(DDRSDRAM)、增强型SRAM(ESDRAM)、同步链路DRAM(SLDRAM)、直接内存总线DRAM(DRDRAM)或铁电RAM(FRAM)。主存储器122可以基于上述存储芯片的任何一种,或者能够如此处所述方式运行的任何其它可用存储芯片。在图1E中所示的实施例中,处理器101通过系统总线150(在下面进行更详细的描述)与主存储器122进行通信。图1E描述了在其中处理器通过存储器端口103直接与主存储器122通信的计算装置100的实施例。例如,在图1F中,主存储器122可以是DRDRAM。
图1F描述了在其中主处理器101通过第二总线与高速缓存存储器140直接通信的实施例,第二总线有时也称为后端总线。其他实施例中,主处理器101使用系统总线150和高速缓存存储器140通信。高速缓存存储器140通常有比主存储器122更快的响应时间,并且通常由SRAM、BSRAM或EDRAM提供。在图1F中所示的实施例中,处理器101通过本地系统总线150与多个I/O装置130进行通信。可以使用各种不同的总线将中央处理单元101连接到任何I/O装置130,所述总线包括VESA VL总线、ISA总线、EISA总线、微通道体系结构(MCA)总线、PCI总线、PCI-X总线、PCI-Express总线或NuBus。对于I/O装置是视频显示器124的实施例,处理器101可以使用高级图形端口(AGP)与显示器124通信。图1F说明了主处理器101通过超传输(HyperTransport)、快速I/O或者InfiniBand直接与I/O装置130通信的计算机100的一个实施例。图1F还描述了在其中混合本地总线和直接通信的实施例:处理器101使用本地互连总线与I/O装置130b进行通信,同时直接与I/O装置130a进行通信。
计算装置100可以支持任何适当的安装装置116,例如用于接纳诸如3.5英寸、5.25英寸磁盘或ZIP磁盘这样的软盘的软盘驱动器、CD-ROM驱动器、CD-R/RW驱动器、DVD-ROM驱动器、各种格式的磁带驱动器、USB装置、硬盘驱动器或适于安装像任何客户机代理120或其部分的软件和程序的任何其它装置。计算装置100还可以包括存储装置128,诸如一个或者多个硬盘驱动器或者独立磁盘冗余阵列,用于存储操作系统和其它相关软件,以及用于存储诸如涉及客户机代理120的任何程序的应用软件程序。或者,可以使用安装装置116的任何一种作为存储装置128。此外,操作系统和软件可从例如可引导CD的可引导介质运行,诸如一种用于GNU/Linux的可引导CD,该可引导CD可自knoppix.net作为GNU/Linux一个分发版获得。
此外,计算装置100可以包括通过多种连接接口到局域网(LAN)、广域网(WAN)或因特网的网络接口118,所述多种连接包括但不限于标准电话线路、LAN或WAN链路(例如802.11,T1,T3、56kb、X.25)、宽带连接(如ISDN、帧中继、ATM)、无线连接、或上述任何或所有连接的一些组合。网络接口118可以包括内置网络适配器、网络接口卡、PCMCIA网络卡、卡总线网络适配器、无线网络适配器、USB网络适配器、调制解调器或适用于将计算装置100接口到能够通信并执行这里所说明的操作的任何类型的网络的任何其它设备。
计算装置100中可以包括各种I/O装置130a-130n。输入装置包括键盘、鼠标、触控板、轨迹球、麦克风和绘图板。输出装置包括视频显示器、扬声器、喷墨打印机、激光打印机和热升华打印机。如图1E所示,I/O装置130可以由I/O控制器123控制。I/O控制器可以控制一个或多个I/O装置,例如键盘126和指示装置127(如鼠标或光笔)。此外,I/O装置还可以为计算装置100提供存储装置128和/或安装介质116。在其他实施例中,计算装置100可以提供USB连接以接纳手持USB存储装置,例如由位于美国加利福尼亚州Los Alamitos的TwintechIndustry有限公司生产的USB闪存驱动驱动系列装置。
在一些实施例中,计算装置100可以包括多个显示装置124a-124n或与其相连,这些显示装置各自可以是相同或不同的类型和/或形式。因而,任何一种I/O装置130a-130n和/或I/O控制器123可以包括任一类型和/或形式的适当的硬件、软件或硬件和软件的组合,以支持、允许或提供通过计算装置100连接和使用多个显示装置124a-124n。例如,计算装置100可以包括任何类型和/或形式的视频适配器、视频卡、驱动器和/或库,以与显示装置124a-124n接口、通信、连接或以其他方式使用显示装置。在一个实施例中,视频适配器可以包括多个连接器以与多个显示装置124a-124n接口。在其他实施例中,计算装置100可以包括多个视频适配器,每个视频适配器与显示装置124a-124n中的一个或多个连接。在一些实施例中,计算装置100的操作系统的任一部分都可以被配置用于使用多个显示器124a-124n。在其他实施例中,显示装置124a-124n中的一个或多个可以由一个或多个其它计算装置提供,诸如例如通过网络与计算装置100连接的计算装置100a和100b。这些实施例可以包括被设计和构造为将另一个计算机的显示装置用作计算装置100的第二显示装置124a的任一类型的软件。本领域的普通技术人员应认识和理解可以将计算装置100配置成具有多个显示装置124a-124n的各种方法和实施例。
在另外的实施例中,I/O装置130可以是系统总线150和外部通信总线之间的桥170,所述外部通信总线例如USB总线、Apple桌面总线、RS-232串行连接、SCSI总线、FireWire总线、FireWire800总线、以太网总线、AppleTalk总线、千兆位以太网总线、异步传输模式总线、HIPPI总线、超级HIPPI总线、SerialPlus总线、SCI/LAMP总线、光纤信道总线或串行SCSI总线。
图1E和1F中描述的那类计算装置100通常在控制任务的调度和对系统资源的访问的操作系统的控制下操作。计算装置100可以运行任何操作系统,如Windows操作系统,不同发行版本的Unix和Linux操作系统,用于Macintosh计算机的任何版本的MAC任何嵌入式操作系统,任何实时操作系统,任何开源操作系统,任何专有操作系统,任何用于移动计算装置的操作系统,或者任何其它能够在计算装置上运行并完成这里所述操作的操作系统。典型的操作系统包括:WINDOWS3.x、WINDOWS95、WINDOWS98、WINDOWS2000、WINDOWS NT3.51、WINDOWS NT4.0、WINDOWS CE和WINDOWS XP,所有这些均由位于华盛顿州Redmond的微软公司出品;由位于加利福尼亚州Cupertino的苹果计算机出品的MacOS;由位于纽约州Armonk的国际商业机器公司出品的OS/2;以及由位于犹他州Salt Lake City的Caldera公司发布的可免费使用的Linux操作系统或者任何类型和/或形式的Unix操作系统,以及其它。
在其他的实施例中,计算装置100可以有符合该装置的不同的处理器、操作系统和输入设备。例如,在一个实施例中,计算机100是由Palm公司出品的Treo180、270、1060、600或650智能电话。在该实施例中,Treo智能电话在PalmOS操作系统的控制下操作,并包括指示笔输入装置以及五向导航装置。此外,计算装置100可以是任何工作站、桌面计算机、膝上型或笔记本计算机、服务器、手持计算机、移动电话、任何其它计算机、或能够通信并有足够的处理器能力和存储容量以执行此处所述的操作的其它形式的计算或者电信装置。
如图1G所示,计算装置100可以包括多个处理器,可以提供用于对不只一个数据片同时执行多个指令或者同时执行一个指令的功能。在一些实施例中,计算装置100可包括具有一个或多个核的并行处理器。在这些实施例的一个中,计算装置100是共享内存并行设备,具有多个处理器和/或多个处理器核,将所有可用内存作为一个全局地址空间进行访问。在这些实施例的又一个中,计算装置100是分布式存储器并行设备,具有多个处理器,每个处理器访问本地存储器。在这些实施例的又一个中,计算装置100既有共享的存储器又有仅由特定处理器或处理器子集访问的存储器。在这些实施例的又一个中,如多核微处理器的计算装置100将两个或多个独立处理器组合在一个封装中,通常在一个集成电路(IC)中。在这些实施例的又一个中,计算装置100包括具有单元宽带引擎(CELL BROADBAND ENGINE)架构的芯片,并包括高能处理器单元以及多个协同处理单元,高能处理器单元和多个协同处理单元通过内部高速总线连接在一起,可以将内部高速总线称为单元互连总线。
在一些实施例中,处理器提供用于对多个数据片同时执行单个指令(SIMD)的功能。其他实施例中,处理器提供用于对多个数据片同时执行多个指令(MIMD)的功能。又一个实施例中,处理器可以在单个装置中使用SIMD和MIMD核的任意组合。
在一些实施例中,计算装置100可包括图像处理单元。图1H所示的在这些实施例的一个中,计算装置100包括至少一个中央处理单元101和至少一个图像处理单元。在这些实施例的又一个中,计算装置100包括至少一个并行处理单元和至少一个图像处理单元。在这些实施例的又一个中,计算装置100包括任意类型的多个处理单元,多个处理单元中的一个包括图像处理单元。
一些实施例中,第一计算装置100a代表客户计算装置100b的用户执行应用。又一个实施例中,计算装置100执行虚拟机,其提供执行会话,在该会话中,代表客户计算装置100b的用户执行应用。在这些实施例的一个中,执行会话是寄载的桌面会话。在这些实施例的又一个中,计算装置100执行终端服务会话。终端服务会话可以提供寄载的桌面环境。在这些实施例的又一个中,执行会话提供对计算环境的访问,该计算环境可包括以下的一个或多个:应用、多个应用、桌面应用以及可执行一个或多个应用的桌面会话。
B.设备架构
图2A示出设备200的一个示例实施例。提供图2A的设备200架构仅用于示例,并不意于作为限制性的架构。如图2所示,设备200包括硬件层206和被分为用户空间202和内核空间204的软件层。
硬件层206提供硬件元件,在内核空间204和用户空间202中的程序和服务在该硬件元件上被执行。硬件层206也提供结构和元件,就设备200而言,这些结构和元件允许在内核空间204和用户空间202内的程序和服务既在内部进行数据通信又与外部进行数据通信。如图2所示,硬件层206包括用于执行软件程序和服务的处理单元262,用于存储软件和数据的存储器264,用于通过网络传输和接收数据的网络端口266,以及用于执行与安全套接字协议层相关的功能处理通过网络传输和接收的数据的加密处理器260。在一些实施例中,中央处理单元262可在单独的处理器中执行加密处理器260的功能。另外,硬件层206可包括用于每个处理单元262和加密处理器260的多处理器。处理器262可以包括以上结合图1E和1F所述的任一处理器101。例如,在一个实施例中,设备200包括第一处理器262和第二处理器262’。在其他实施例中,处理器262或者262’包括多核处理器。
虽然示出的设备200的硬件层206通常带有加密处理器260,但是处理器260可为执行涉及任何加密协议的功能的处理器,例如安全套接字协议层(SSL)或者传输层安全(TLS)协议。在一些实施例中,处理器260可为通用处理器(GPP),并且在进一步的实施例中,可为用于执行任何安全相关协议处理的可执行指令。
虽然图2中设备200的硬件层206包括了某些元件,但是设备200的硬件部分或组件可包括计算装置的任何类型和形式的元件、硬件或软件,例如此处结合图1E和1F示出和讨论的计算装置100。在一些实施例中,设备200可包括服务器、网关、路由器、开关、桥接器或其它类型的计算或网络设备,并且拥有与此相关的任何硬件和/或软件元件。
设备200的操作系统分配、管理或另外分离可用的系统存储器到内核空间204和用户空间204。在示例的软件架构200中,操作系统可以是任何类型和/或形式的Unix操作系统,尽管本发明并未这样限制。这样,设备200可以运行任何操作系统,如任何版本的Windows操作系统、不同版本的Unix和Linux操作系统、用于Macintosh计算机的任何版本的Mac任何的嵌入式操作系统、任何的网络操作系统、任何的实时操作系统、任何的开放源操作系统、任何的专用操作系统、用于移动计算装置或网络装置的任何操作系统、或者能够运行在设备200上并执行此处所描述的操作的任何其它操作系统。
保留内核空间204用于运行内核230,内核230包括任何设备驱动器,内核扩展或其他内核相关软件。就像本领域技术人员所知的,内核230是操作系统的核心,并提供对资源以及设备104的相关硬件元件的访问、控制和管理。根据设备200的实施例,内核空间204也包括与高速缓存管理器232协同工作的多个网络服务或进程,高速缓存管理器232有时也称为集成的高速缓存,其益处此处将进一步详细描述。另外,内核230的实施例将依赖于通过设备200安装、配置或其他使用的操作系统的实施例。
在一个实施例中,设备200包括一个网络堆栈267,例如基于TCP/IP的堆栈,用于与客户机102和/或服务器106通信。在一个实施例中,使用网络堆栈267与第一网络(例如网络108)以及第二网络110通信。在一些实施例中,设备200终止第一传输层连接,例如客户机102的TCP连接,并建立客户机102使用的到服务器106的第二传输层连接,例如,终止在设备200和服务器106的第二传输层连接。可通过单独的网络堆栈267建立第一和第二传输层连接。在其他实施例中,设备200可包括多个网络堆栈,例如267或267’,并且在一个网络堆栈267可建立或终止第一传输层连接,在第二网络堆栈267’上可建立或者终止第二传输层连接。例如,一个网络堆栈可用于在第一网络上接收和传输网络分组,并且另一个网络堆栈用于在第二网络上接收和传输网络分组。在一个实施例中,网络堆栈267包括用于为一个或多个网络分组进行排队的缓冲器243,其中网络分组由设备200传输。
如图2A所示,内核空间204包括高速缓存管理器232、高速层2-7集成分组引擎240、加密引擎234、策略引擎236以及多协议压缩逻辑238。在内核空间204或内核模式而不是用户空间202中运行这些组件或进程232、240、234、236和238提高这些组件中的每个单独的和结合的性能。内核操作意味着这些组件或进程232、240、234、236和238在设备200的操作系统的核地址空间中运行。例如,在内核模式中运行加密引擎234通过移动加密和解密操作到内核可改进加密性能,从而可减少在内核模式中的存储空间或内核线程与在用户模式中的存储空间或线程之间的传输的数量。例如,在内核模式获得的数据可能不需要传输或拷贝到运行在用户模式的进程或线程,例如从内核级数据结构到用户级数据结构。在另一个方面,也可减少内核模式和用户模式之间的上下文切换的数量。另外,在任何组件或进程232、240、235、236和238间的同步和通信在内核空间204中可被执行的更有效率。
在一些实施例中,组件232、240、234、236和238的任何部分可在内核空间204中运行或操作,而这些组件232、240、234、236和238的其它部分可在用户空间202中运行或操作。在一个实施例中,设备200使用内核级数据结构来提供对一个或多个网络分组的任何部分的访问,例如,包括来自客户机102的请求或者来自服务器106的响应的网络分组。在一些实施例中,可以由分组引擎240通过到网络堆栈267的传输层驱动器接口或过滤器获得内核级数据结构。内核级数据结构可包括通过与网络堆栈267相关的内核空间204可访问的任何接口和/或数据、由网络堆栈267接收或发送的网络流量或分组。在其他实施例中,任何组件或进程232、240、234、236和238可使用内核级数据结构来执行组件或进程的需要的操作。在一个实例中,当使用内核级数据结构时,组件232、240、234、236和238在内核模式204中运行,而在又一个实施例中,当使用内核级数据结构时,组件232、240、234、236和238在用户模式中运行。在一些实施例中,内核级数据结构可被拷贝或传递到第二内核级数据结构,或任何期望的用户级数据结构。
高速缓存管理器232可包括软件、硬件或软件和硬件的任何组合,以提供对任何类型和形式的内容的高速缓存访问、控制和管理,例如对象或由源服务器106提供服务的动态产生的对象。由高速缓存管理器232处理和存储的数据、对象或内容可包括任何格式(例如标记语言)的数据,或者通过任何协议的通信的任何类型的数据。在一些实施例中,高速缓存管理器232复制存储在其他地方的原始数据或先前计算、产生或传输的数据,其中相对于读高速缓存存储器元件,需要更长的访问时间以取得、计算或以其他方式得到原始数据。一旦数据被存储在高速缓存存储元件中,通过访问高速缓存的副本而不是重新获得或重新计算原始数据即可进行后续操作,因此而减少了访问时间。在一些实施例中,高速缓存元件可以包括设备200的存储器264中的数据对象。在其他实施例中,高速缓存存储元件可包括有比存储器264更快的存取时间的存储器。在又一个实施例中,高速缓存元件可以包括设备200的任一类型和形式的存储元件,诸如硬盘的一部分。在一些实施例中,处理单元262可提供被高速缓存管理器232使用的高速缓存存储器。在又一个实施例中,高速缓存管理器232可使用存储器、存储区或处理单元的任何部分和组合来高速缓存数据、对象或其它内容。
另外,高速缓存管理器232包括用于执行此处描述的设备200的技术的任一实施例的任何逻辑、功能、规则或操作。例如,高速缓存管理器232包括基于无效时间周期的终止,或者从客户机102或服务器106接收无效命令使对象无效的逻辑或功能。在一些实施例中,高速缓存管理器232可作为在内核空间204中执行的程序、服务、进程或任务而操作,并且在其他实施例中,在用户空间202中执行。在一个实施例中,高速缓存管理器232的第一部分在用户空间202中执行,而第二部分在内核空间204中执行。在一些实施例中,高速缓存管理器232可包括任何类型的通用处理器(GPP),或任何其他类型的集成电路,例如现场可编程门阵列(FPGA),可编程逻辑设备(PLD),或者专用集成电路(ASIC)。
策略引擎236可包括例如智能统计引擎或其它可编程应用。在一个实施例中,策略引擎236提供配置机制以允许用户识别、指定、定义或配置高速缓存策略。策略引擎236,在一些实施例中,也访问存储器以支持数据结构,例如备份表或hash表,以启用用户选择的高速缓存策略决定。在其他实施例中,除了对安全、网络流量、网络访问、压缩或其它任何由设备200执行的功能或操作的访问、控制和管理之外,策略引擎236可包括任何逻辑、规则、功能或操作以确定和提供对设备200所高速缓存的对象、数据、或内容的访问、控制和管理。特定高速缓存策略的其他实施例此处进一步描述。
加密引擎234包括用于操控诸如SSL或TLS的任何安全相关协议或其中涉及的任何功能的处理的任何逻辑、商业规则、功能或操作。例如,加密引擎234加密并解密通过设备200传输的网络分组,或其任何部分。加密引擎234也可代表客户机102a-102n、服务器106a-106n或设备200来设置或建立SSL或TLS连接。因此,加密引擎234提供SSL处理的卸载和加速。在一个实施例中,加密引擎234使用隧道协议来提供在客户机102a-102n和服务器106a-106n间的虚拟专用网络。在一些实施例中,加密引擎234与加密处理器260通信。在其他实施例中,加密引擎234包括运行在加密处理器260上的可执行指令。
多协议压缩引擎238包括用于压缩一个或多个网络分组协议(例如被设备200的网络堆栈267使用的任何协议)的任何逻辑、商业规则、功能或操作。在一个实施例中,多协议压缩引擎238双向压缩在客户机102a-102n和服务器106a-106n间任一基于TCP/IP的协议,包括消息应用编程接口(MAPI)(电子邮件)、文件传输协议(FTP)、超文本传输协议(HTTP)、通用互联网文件系统(CIFS)协议(文件传输)、独立计算架构(ICA)协议、远程桌面协议(RDP)、无线应用协议(WAP)、移动IP协议以及互联网协议电话(VoIP)协议。在其他实施例中,多协议压缩引擎238提供基于超文本标记语言(HTML)的协议的压缩,并且在一些实施例中,提供任何标记语言的压缩,例如可扩展标记语言(XML)。在一个实施例中,多协议压缩引擎238提供任何高性能协议的压缩,例如设计用于设备200到设备200通信的任何协议。在又一个实施例中,多协议压缩引擎238使用修改的传输控制协议来压缩任何通信的任何载荷或任何通信,例如事务TCP(T/TCP)、带有选择确认的TCP(TCP-SACK)、带有大窗口的TCP(TCP-LW)、例如TCP-Vegas协议的拥塞预报协议以及TCP欺骗协议(TCP spoofingprotocol)。
同样的,多协议压缩引擎238为用户加速经由桌面客户机乃至移动客户机访问应用的性能,所述桌面客户机例如Micosoft Outlook和非web瘦客户机,诸如由像Oracle、SAP和Siebel的通用企业应用所启动的任何客户机,所述移动客户机例如掌上电脑。在一些实施例中,通过在内核模式204内部执行并与访问网络堆栈267的分组处理引擎240集成,多协议压缩引擎238可以压缩TCP/IP协议携带的任何协议,例如任何应用层协议。
高速层2-7集成分组引擎240,通常也称为分组处理引擎,或分组引擎,负责设备200通过网络端口266接收和发送的分组的内核级处理的管理。高速层2-7集成分组引擎240可包括用于在例如接收网络分组和传输网络分组的处理期间排队一个或多个网络分组的缓冲器。另外,高速层2-7集成分组引擎240与一个或多个网络堆栈267通信以通过网络端口266发送和接收网络分组。高速层2-7集成分组引擎240与加密引擎234、高速缓存管理器232、策略引擎236和多协议压缩逻辑238协同工作。更具体地,配置加密引擎234以执行分组的SSL处理,配置策略引擎236以执行涉及流量管理的功能,例如请求级内容切换以及请求级高速缓存重定向,并配置多协议压缩逻辑238以执行涉及数据压缩和解压缩的功能。
高速层2-7集成分组引擎240包括分组处理定时器242。在一个实施例中,分组处理定时器242提供一个或多个时间间隔以触发输入处理,例如,接收或者输出(即传输)网络分组。在一些实施例中,高速层2-7集成分组引擎240响应于定时器242处理网络分组。分组处理定时器242向分组引擎240提供任何类型和形式的信号以通知、触发或传输时间相关的事件、间隔或发生。在许多实施例中,分组处理定时器242以毫秒级操作,例如100ms、50ms、或25ms。例如,在一些实例中,分组处理定时器242提供时间间隔或者以其它方式使得由高速层2-7集成分组引擎240以10ms时间间隔处理网络分组,而在其他实施例中,使高速层2-7集成分组引擎240以5ms时间间隔处理网络分组,并且在进一步的实施例中,短到3、2或1ms时间间隔。高速层2-7集成分组引擎240在操作期间可与加密引擎234、高速缓存管理器232、策略引擎236以及多协议压缩引擎238连接、集成或通信。因此,响应于分组处理定时器242和/或分组引擎240,可执行加密引擎234、高速缓存管理器232、策略引擎236以及多协议压缩引擎238的任何逻辑、功能或操作。因此,在由分组处理定时器242提供的时间间隔粒度,可执行加密引擎234、高速缓存管理器232、策略引擎236以及多协议压缩引擎238的任何逻辑、功能或操作,例如,时间间隔少于或等于10ms。例如,在一个实施例中,高速缓存管理器232可响应于高速层2-7集成分组引擎240和/或分组处理定时器242来执行任何高速缓存的对象的终止。在又一个实施例中,高速缓存的对象的终止或无效时间被设定为与分组处理定时器242的时间间隔相同的粒度级,例如每10ms。
与内核空间204不同,用户空间202是被用户模式应用或在用户模式运行的程序所使用的操作系统的存储区域或部分。用户模式应用不能直接访问内核空间204而使用服务调用以访问内核服务。如图2所示,设备200的用户空间202包括图形用户接口(GUI)210、命令行接口(CLI)212、壳服务(shell service)214、健康监控程序216以及守护(daemon)服务218。GUI210和CLI212提供系统管理员或其他用户可与之交互并控制设备200操作的装置,例如通过设备200的操作系统。GUI210和CLI212可包括运行在用户空间202或内核框架204中的代码。GUI210可以是任何类型或形式的图形用户接口,可以通过文本、图形或其他形式由任何类型的程序或应用(如浏览器)来呈现。CLI212可为任何类型和形式的命令行或基于文本的接口,例如通过操作系统提供的命令行。例如,CLI212可包括壳,该壳是使用户与操作系统相互作用的工具。在一些实施例中,可通过bash、csh、tcsh或者ksh类型的壳提供CLI212。壳服务214包括程序、服务、任务、进程或可执行指令以支持由用户通过GUI210和/或CLI212的与设备200或者操作系统的交互
健康监控程序216用于监控、检查、报告并确保网络系统正常运行,以及用户正通过网络接收请求的内容。健康监控程序216包括一个或多个程序、服务、任务、进程或可执行指令,为监控设备200的任何行为提供逻辑、规则、功能或操作。在一些实施例中,健康监控程序216拦截并检查通过设备200传递的任何网络流量。在其他实施例中,健康监控程序216通过任何合适的方法和/或机制与一个或多个下述设备连接:加密引擎234,高速缓存管理器232,策略引擎236,多协议压缩逻辑238,分组引擎240,守护服务218以及壳服务214。因此,健康监控程序216可调用任何应用编程接口(API)以确定设备200的任何部分的状态、情况或健康。例如,健康监控程序216可周期性地查验(ping)或发送状态查询以检查程序、进程、服务或任务是否活动并当前正在运行。在又一个实施例中,健康监控程序216可检查由任何程序、进程、服务或任务提供的任何状态、错误或历史日志以确定设备200任何部分的任何状况、状态或错误。
守护服务218是连续运行或在背景中运行的程序,并且处理设备200接收的周期性服务请求。在一些实施例中,守护服务可向其他程序或进程(例如合适的另一个守护服务218)转发请求。如本领域技术人员所公知的,守护服务218可无人监护的运行,以执行连续的或周期性的系统范围功能,例如网络控制,或者执行任何需要的任务。在一些实施例中,一个或多个守护服务218运行在用户空间202中,而在其他实施例中,一个或多个守护服务218运行在内核空间。
现参考图2B,描述了设备200的又一个实施例。总的来说,设备200提供下列服务、功能或操作中的一个或多个:用于一个或多个客户机102以及一个或多个服务器106之间的通信的SSL VPN连通280、交换/负载平衡284、域名服务解析286、加速288和应用防火墙290。服务器106的每一个可以提供一个或者多个网络相关服务270a-270n(称为服务270)。例如,服务器106可以提供http服务270。设备200包括一个或者多个虚拟服务器或者虚拟互联网协议服务器,称为vServer275、vS275、VIP服务器或者仅是VIP275a-275n(此处也称为vServer275)。vServer275根据设备200的配置和操作来接收、拦截或者以其它方式处理客户机102和服务器106之间的通信。
vServer275可以包括软件、硬件或者软件和硬件的任何组合。vServer275可包括在设备200中的用户模式202、内核模式204或者其任何组合中运行的任何类型和形式的程序、服务、任务、进程或者可执行指令。vServer275包括任何逻辑、功能、规则或者操作,以执行此处所述技术的任何实施例,诸如SSL VPN280、转换/负载平衡284、域名服务解析286、加速288和应用防火墙290。在一些实施例中,vServer275建立到服务器106的服务270的连接。服务275可以包括能够连接到设备200、客户机102或者vServer275并与之通信的任何程序、应用、进程、任务或者可执行指令集。例如,服务275可以包括web服务器、http服务器、ftp、电子邮件或者数据库服务器。在一些实施例中,服务270是守护进程或者网络驱动器,用于监听、接收和/或发送应用的通信,诸如电子邮件、数据库或者企业应用。在一些实施例中,服务270可以在特定的IP地址、或者IP地址和端口上通信。
在一些实施例中,vServer275应用策略引擎236的一个或者多个策略到客户机102和服务器106之间的网络通信。在一个实施例中,该策略与vServer275相关。在又一个实施例中,该策略基于用户或者用户组。在又一个实施例中,策略为通用的并且应用到一个或者多个vServer275a-275n,和通过设备200通信的任何用户或者用户组。在一些实施例中,策略引擎的策略具有基于通信的任何内容应用该策略的条件,通信的内容诸如互联网协议地址、端口、协议类型、分组中的头部或者字段、或者通信的上下文,诸如用户、用户组、vServer275、传输层连接、和/或客户机102或者服务器106的标识或者属性。
在其他实施例中,设备200与策略引擎236通信或接口,以便确定远程用户或远程客户机102的验证和/或授权,以访问来自服务器106的计算环境15、应用和/或数据文件。在又一个实施例中,设备200与策略引擎236通信或交互,以便确定远程用户或远程客户机102的验证和/或授权,使得应用传送系统190传送一个或多个计算环境15、应用和/或数据文件。在又一个实施例中,设备200基于策略引擎236对远程用户或远程客户机102的验证和/或授权建立VPN或SSL VPN连接。一个实施例中,设备200基于策略引擎236的策略控制网络流量以及通信会话。例如,基于策略引擎236,设备200可控制对计算环境15、应用或数据文件的访问。
在一些实施例中,vServer275与客户机102经客户机代理120建立传输层连接,诸如TCP或者UDP连接。在一个实施例中,vServer275监听和接收来自客户机102的通信。在其他实施例中,vServer275与客户机服务器106建立传输层连接,诸如TCP或者UDP连接。在一个实施例中,vServer275建立到运行在服务器106上的服务器270的互联网协议地址和端口的传输层连接。在又一个实施例中,vServer275将到客户机102的第一传输层连接与到服务器106的第二传输层连接相关联。在一些实施例中,vServer275建立到服务器106的传输层连接池并经由所述池化(pooled)的传输层连接多路复用客户机的请求。
在一些实施例中,设备200提供客户机102和服务器106之间的SSL VPN连接280。例如,第一网络102上的客户机102请求建立到第二网络104’上的服务器106的连接。在一些实施例中,第二网络104’是不能从第一网络104路由的。在其他实施例中,客户机102位于公用网络104上,并且服务器106位于专用网络104’上,例如企业网。在一个实施例中,客户机代理120拦截第一网络104上的客户机102的通信,加密该通信,并且经第一传输层连接发送该通信到设备200。设备200将第一网络104上的第一传输层连接与到第二网络104上的服务器106的第二传输层连接相关联。设备200接收来自客户机代理102的所拦截的通信,解密该通信,并且经第二传输层连接发送该通信到第二网络104上的服务器106。第二传输层连接可以是池化的传输层连接。同样的,设备200为两个网络104、104’之间的客户机102提供端到端安全传输层连接。
在一个实施例中,设备200寄载虚拟专用网络104上的客户机102的内部网互联网协议或者IntranetIP282地址。客户机102具有本地网络标识符,诸如第一网络104上的互联网协议(IP)地址和/或主机名称。当经设备200连接到第二网络104’时,设备200在第二网络104’上为客户机102建立、分配或者以其它方式提供IntranetIP,其是诸如IP地址和/或主机名称的网络标识符。使用为客户机的所建立的IntranetIP282,设备200在第二或专用网104’上监听并接收指向该客户机102的任何通信。在一个实施例中,设备200在第二专用网络104上用作或者代表客户机102。例如,在又一个实施例中,vServer275监听和响应到客户机102的IntranetIP282的通信。在一些实施例中,如果第二网络104’上的计算装置100发送请求,设备200如同客户机102一样来处理该请求。例如,设备200可以响应对客户机IntranetIP282的查验。在又一个实施例中,设备可以与请求和客户机IntranetIP282连接的第二网络104上的计算装置100建立连接,诸如TCP或者UDP连接。
在一些实施例中,设备200为客户机102和服务器106之间的通信提供下列一个或多个加速技术288:1)压缩;2)解压缩;3)传输控制协议池;4)传输控制协议多路复用;5)传输控制协议缓冲;以及6)高速缓存。
在一个实施例中,设备200通过开启与每一服务器106的一个或者多个传输层连接并且维持这些连接以允许由客户机经因特网的重复数据访问,来为服务器106缓解由重复开启和关闭到客户机102的传输层连接所造成的大量处理负载。该技术此处称为“连接池”。
在一些实施例中,为了经池化的传输层连接无缝拼接从客户机102到服务器106的通信,设备200通过在传输层协议级修改序列号和确认号来转换或多路复用通信。这被称为“连接多路复用”。在一些实施例中,不需要应用层协议相互作用。例如,在到来分组(即,自客户机102接收的分组)的情况中,所述分组的源网络地址被改变为设备200的输出端口的网络地址,而目的网络地址被改为目的服务器的网络地址。在发出分组(即,自服务器106接收的一个分组)的情况中,源网络地址被从服务器106的网络地址改变为设备200的输出端口的网络地址,而目的地址被从设备200的网络地址改变为请求的客户机102的网络地址。分组的序列号和确认号也被转换为到客户机102的设备200的传输层连接上的客户机102所期待的序列号和确认。在一些实施例中,传输层协议的分组校验和被重新计算以计及这些转换。
在又一个实施例中,设备200为客户机102和服务器106之间的通信提供交换或负载平衡功能284。在一些实施例中,设备200根据层4或应用层请求数据来分布流量并将客户机请求定向到服务器106。在一个实施例中,尽管网络分组的网络层或者层2识别目的服务器106,但设备200通过承载为传输层分组的有效载荷的数据和应用信息来确定服务器106以便分发网络分组。在一个实施例中,设备200的健康监控程序216监控服务器的健康来确定分发客户机请求到哪个服务器106。在一些实施例中,如果设备200探测到某个服务器106不可用或者具有超过预定阈值的负载,设备200可以将客户机请求指向或者分发到另一个服务器106。
在一些实施例中,设备200用作域名服务(DNS)解析器或者以其它方式为来自客户机102的DNS请求提供解析。在一些实施例中,设备拦截由客户机102发送的DNS请求。在一个实施例中,设备200以设备200的IP地址或其所寄载的IP地址来响应客户机的DNS请求。在此实施例中,客户机102把用于域名的网络通信发送到设备200。在又一个实施例中,设备200以第二设备200’的或其所寄载的IP地址来响应客户机的DNS请求。在一些实施例中,设备200使用由设备200确定的服务器106的IP地址来响应客户机的DNS请求。
在又一个实施例中,设备200为客户机102和服务器106之间的通信提供应用防火墙功能290。在一个实施例中,策略引擎236提供用于探测和阻断非法请求的规则。在一些实施例中,应用防火墙290防御拒绝服务(DoS)攻击。在其他实施例中,设备检查所拦截的请求的内容,以识别和阻断基于应用的攻击。在一些实施例中,规则/策略引擎236包括用于提供对多个种类和类型的基于web或因特网的脆弱点的保护的一个或多个应用防火墙或安全控制策略,例如下列的一个或多个脆弱点:1)缓冲区泄出,2)CGI-BIN参数操纵,3)表单/隐藏字段操纵,4)强制浏览,5)cookie或会话中毒,6)被破坏的访问控制列表(ACLs)或弱密码,7)跨站脚本处理(XSS),8)命令注入,9)SQL注入,10)错误触发敏感信息泄露,11)对加密的不安全使用,12)服务器错误配置,13)后门和调试选项,14)网站涂改,15)平台或操作系统弱点,和16)零天攻击。在一个实施例中,对下列情况的一种或多种,应用防火墙290以检查或分析网络通信的形式来提供HTML格式字段的保护:1)返回所需的字段,2)不允许附加字段,3)只读和隐藏字段强制(enforcement),4)下拉列表和单选按钮字段的一致,以及5)格式字段最大长度强制。在一些实施例中,应用防火墙290确保cookie不被修改。在其他实施例中,应用防火墙290通过执行合法的URL来防御强制浏览。
在其他实施例中,应用防火墙290保护在网络通信中包含的任何机密信息。应用防火墙290可以根据引擎236的规则或策略来检查或分析任一网络通信以识别在网络分组的任一字段中的任一机密信息。在一些实施例中,应用防火墙290在网络通信中识别信用卡号、口令、社会保险号、姓名、病人代码、联系信息和年龄的一次或多次出现。网络通信的编码部分可以包括这些出现或机密信息。基于这些出现,在一个实施例中,应用防火墙290可以对网络通信采取策略行动,诸如阻止发送网络通信。在又一个实施例中,应用防火墙290可以重写、移动或者以其它方式掩盖该所识别的出现或者机密信息。
仍参考图2B,设备200可以包括如上面结合图1D所讨论的性能监控代理197。在一个实施例中,设备200从如图1D中所描述的监控服务198或监控服务器106中接收监控代理197。在一些实施例中,设备200在诸如磁盘的存储装置中保存监控代理197,以用于传送给与设备200通信的任何客户机或服务器。例如,在一个实施例中,设备200在接收到建立传输层连接的请求时发送监控代理197给客户机。在其他实施例中,设备200在建立与客户机102的传输层连接时发送监控代理197。在又一个实施例中,设备200在拦截或检测对web页面的请求时发送监控代理197给客户机。在又一个实施例中,设备200响应于监控服务器198的请求来发送监控代理197到客户机或服务器。在一个实施例中,设备200发送监控代理197到第二设备200’或设备205。
在其他实施例中,设备200执行监控代理197。在一个实施例中,监控代理197测量和监控在设备200上执行的任何应用、程序、进程、服务、任务或线程的性能。例如,监控代理197可以监控和测量vServers275A-275N的性能与操作。在又一个实施例中,监控代理197测量和监控设备200的任何传输层连接的性能。在一些实施例中,监控代理197测量和监控通过设备200的任何用户会话的性能。在一个实施例中,监控代理197测量和监控通过设备200的诸如SSL VPN会话的任何虚拟专用网连接和/或会话的性能。在进一步的实施例中,监控代理197测量和监控设备200的内存、CPU和磁盘使用以及性能。在又一个实施例中,监控代理197测量和监控诸如SSL卸载、连接池和多路复用、高速缓存以及压缩的由设备200执行的任何加速技术288的性能。在一些实施例中,监控代理197测量和监控由设备200执行的任一负载平衡和/或内容交换284的性能。在其他实施例中,监控代理197测量和监控由设备200执行的应用防火墙290保护和处理的性能。
C.客户机代理
现参考图3,描述客户机代理120的实施例。客户机102包括客户机代理120,用于经由网络104与设备200和/或服务器106来建立和交换通信。总的来说,客户机102在计算装置100上操作,该计算装置100拥有带有内核模式302以及用户模式303的操作系统,以及带有一个或多个层310a-310b的网络堆栈310。客户机102可以已经安装和/或执行一个或多个应用。在一些实施例中,一个或多个应用可通过网络堆栈310与网络104通信。所述应用之一,诸如web浏览器,也可包括第一程序322。例如,可在一些实施例中使用第一程序322来安装和/或执行客户机代理120,或其中任何部分。客户机代理120包括拦截机制或者拦截器350,用于从网络堆栈310拦截来自一个或者多个应用的网络通信。
客户机102的网络堆栈310可包括任何类型和形式的软件、或硬件或其组合,用于提供与网络的连接和通信。在一个实施例中,网络堆栈310包括用于网络协议组的软件实现。网络堆栈310可包括一个或多个网络层,例如为本领域技术人员所公认和了解的开放式系统互联(OSI)通信模型的任何网络层。这样,网络堆栈310可包括用于任何以下OSI模型层的任何类型和形式的协议:1)物理链路层;2)数据链路层;3)网络层;4)传输层;5)会话层);6)表示层,以及7)应用层。在一个实施例中,网络堆栈310可包括在因特网协议(IP)的网络层协议上的传输控制协议(TCP),通常称为TCP/IP。在一些实施例中,可在以太网协议上承载TCP/IP协议,以太网协议可包括IEEE广域网(WAN)或局域网(LAN)协议的任何族,例如被IEEE802.3覆盖的这些协议。在一些实施例中,网络堆栈310包括任何类型和形式的无线协议,例如IEEE802.11和/或移动因特网协议。
考虑基于TCP/IP的网络,可使用任何基于TCP/IP的协议,包括消息应用编程接口(MAPI)(email)、文件传输协议(FTP)、超文本传输协议(HTTP)、通用因特网文件系统(CIFS)协议(文件传输)、独立计算架构(ICA)协议、远程桌面协议(RDP)、无线应用协议(WAP)、移动IP协议,以及互联网协议电话(VoIP)协议。在又一个实施例中,网络堆栈310包括任何类型和形式的传输控制协议,诸如修改的传输控制协议,例如事务TCP(T/TCP),带有选择确认的TCP(TCP-SACK),带有大窗口的TCP(TCP-LW),例如TCP-Vegas协议的拥塞预测协议,以及TCP欺骗协议。在其他实施例中,网络堆栈310可使用诸如基于IP的UDP的任何类型和形式的用户数据报协议(UDP),例如用于语音通信或实时数据通信。
另外,网络堆栈310可包括支持一个或多个层的一个或多个网络驱动器,例如TCP驱动器或网络层驱动器。网络层驱动器可作为计算装置100的操作系统的一部分或者作为计算装置100的任何网络接口卡或其它网络访问组件的一部分被包括。在一些实施例中,网络堆栈310的任何网络驱动器可被定制、修改或调整以提供网络堆栈310的定制或修改部分,用来支持此处描述的任何技术。在其他实施例中,设计并构建加速程序302以与网络堆栈310协同操作或工作,上述网络堆栈310由客户机102的操作系统安装或以其它方式提供。
网络堆栈310包括任何类型和形式的接口,用于接收、获得、提供或以其它方式访问涉及客户机102的网络通信的任何信息和数据。在一个实施例中,与网络堆栈310的接口包括应用编程接口(API)。接口也可包括任何函数调用、钩子或过滤机制,事件或回调机制、或任何类型的接口技术。网络堆栈310通过接口可接收或提供与网络堆栈310的功能或操作相关的任何类型和形式的数据结构,例如对象。例如,数据结构可以包括与网络分组相关的信息和数据或者一个或多个网络分组。在一些实施例中,数据结构包括在网络堆栈310的协议层处理的网络分组的一部分,例如传输层的网络分组。在一些实施例中,数据结构325包括内核级别数据结构,而在其他实施例中,数据结构325包括用户模式数据结构。内核级数据结构可以包括获得的或与在内核模式302中操作的网络堆栈310的一部分相关的数据结构、或者运行在内核模式302中的网络驱动程序或其它软件、或者由运行或操作在操作系统的内核模式的服务、进程、任务、线程或其它可执行指令获得或收到的任何数据结构。
此外,网络堆栈310的一些部分可在内核模式302执行或操作,例如,数据链路或网络层,而其他部分在用户模式303执行或操作,例如网络堆栈310的应用层。例如,网络堆栈的第一部分310a可以给应用提供对网络堆栈310的用户模式访问,而网络堆栈310的第二部分310a提供对网络的访问。在一些实施例中,网络堆栈的第一部分310a可包括网络堆栈310的一个或多个更上层,例如层5-7的任何层。在其他实施例中,网络堆栈310的第二部分310b包括一个或多个较低的层,例如层1-4的任何层。网络堆栈310的每个第一部分310a和第二部分310b可包括网络堆栈310的任何部分,位于任何一个或多个网络层,处于用户模式203、内核模式202,或其组合,或在网络层的任何部分或者到网络层的接口点,或用户模式203和内核模式202的任何部分或到用户模式203和内核模式202的接口点。
拦截器350可以包括软件、硬件、或者软件和硬件的任何组合。在一个实施例中,拦截器350在网络堆栈310的任一点拦截网络通信,并且重定向或者发送网络通信到由拦截器350或者客户机代理120所期望的、管理的或者控制的目的地。例如,拦截器350可以拦截第一网络的网络堆栈310的网络通信并且发送该网络通信到设备200,用于在第二网络104上发送。在一些实施例中,拦截器350包括含有诸如被构建和设计来与网络堆栈310对接并一同工作的网络驱动器的驱动器的任一类型的拦截器350。在一些实施例中,客户机代理120和/或拦截器350操作在网络堆栈310的一个或者多个层,诸如在传输层。在一个实施例中,拦截器350包括过滤器驱动器、钩子机制、或者连接到网络堆栈的传输层的任一形式和类型的合适网络驱动器接口,诸如通过传输驱动器接口(TDI)。在一些实施例中,拦截器350连接到诸如传输层的第一协议层和诸如传输协议层之上的任何层的另一个协议层,例如,应用协议层。在一个实施例中,拦截器350可以包括遵守网络驱动器接口规范(NDIS)的驱动器,或者NDIS驱动器。在又一个实施例中,拦截器350可以包括微型过滤器或者微端口驱动器。在一个实施例中,拦截器350或其部分在内核模式202中操作。在又一个实施例中,拦截器350或其部分在用户模式203中操作。在一些实施例中,拦截器350的一部分在内核模式202中操作,而拦截器350的另一部分在用户模式203中操作。在其他实施例中,客户机代理120在用户模式203操作,但通过拦截器350连接到内核模式驱动器、进程、服务、任务或者操作系统的部分,诸如以获取内核级数据结构225。在其他实施例中,拦截器350为用户模式应用或者程序,诸如应用。
在一个实施例中,拦截器350拦截任何的传输层连接请求。在这些实施例中,拦截器350执行传输层应用编程接口(API)调用以设置目的地信息,诸如到期望位置的目的地IP地址和/或端口用于定位。以此方式,拦截器350拦截并重定向传输层连接到由拦截器350或客户机代理120控制或管理的IP地址和端口。在一个实施例中,拦截器350把连接的目的地信息设置为客户机代理120监听的客户机102的本地IP地址和端口。例如,客户机代理120可以包括为重定向的传输层通信监听本地IP地址和端口的代理服务。在一些实施例中,客户机代理120随后将重定向的传输层通信传送到设备200。
在一些实施例中,拦截器350拦截域名服务(DNS)请求。在一个实施例中,客户机代理120和/或拦截器350解析DNS请求。在又一个实施例中,拦截器发送所拦截的DNS请求到设备200以进行DNS解析。在一个实施例中,设备200解析DNS请求并且将DNS响应传送到客户机代理120。在一些实施例中,设备200经另一个设备200’或者DNS服务器106来解析DNS请求。
在又一个实施例中,客户机代理120可以包括两个代理120和120’。在一个实施例中,第一代理120可以包括在网络堆栈310的网络层操作的拦截器350。在一些实施例中,第一代理120拦截网络层请求,诸如因特网控制消息协议(ICMP)请求(例如,查验和跟踪路由)。在其他实施例中,第二代理120’可以在传输层操作并且拦截传输层通信。在一些实施例中,第一代理120在网络堆栈210的一层拦截通信并且与第二代理120’连接或者将所拦截的通信传送到第二代理120’。
客户机代理120和/或拦截器350可以以对网络堆栈310的任何其它协议层透明的方式在协议层操作或与之对接。例如,在一个实施例中,拦截器350可以以对诸如网络层的传输层之下的任何协议层和诸如会话、表示或应用层协议的传输层之上的任何协议层透明的方式在网络堆栈310的传输层操作或与之对接。这允许网络堆栈310的其它协议层如所期望的进行操作并无需修改以使用拦截器350。这样,客户机代理120和/或拦截器350可以与传输层连接以安全、优化、加速、路由或者负载平衡经由传输层承载的任一协议提供的任一通信,诸如TCP/IP上的任一应用层协议。
此外,客户机代理120和/或拦截器可以以对任何应用、客户机102的用户和与客户机102通信的诸如服务器的任何其它计算装置透明的方式在网络堆栈310上操作或与之对接。客户机代理120和/或拦截器350可以以无需修改应用的方式被安装和/或执行在客户机102上。在一些实施例中,客户机102的用户或者与客户机102通信的计算装置未意识到客户机代理120和/或拦截器350的存在、执行或者操作。同样,在一些实施例中,相对于应用、客户机102的用户、诸如服务器的另一个计算装置、或者在由拦截器350连接的协议层之上和/或之下的任何协议层透明地来安装、执行和/或操作客户机代理120和/或拦截器350。
客户机代理120包括加速程序302、流客户机306、收集代理304和/或监控代理197。在一个实施例中,客户机代理120包括由佛罗里达州Fort Lauderdale的Citrix SystemsInc.开发的独立计算架构(ICA)客户机或其任一部分,并且也指ICA客户机。在一些实施例中,客户机代理120包括应用流客户机306,用于从服务器106流式传输应用到客户机102。在一些实施例中,客户机代理120包括加速程序302,用于加速客户机102和服务器106之间的通信。在又一个实施例中,客户机代理120包括收集代理304,用于执行端点检测/扫描并且用于为设备200和/或服务器106收集端点信息。
在一些实施例中,加速程序302包括用于执行一个或多个加速技术的客户机侧加速程序,以加速、增强或者以其他方式改善客户机与服务器106的通信和/或对服务器106的访问,诸如访问由服务器106提供的应用。加速程序302的可执行指令的逻辑、函数和/或操作可以执行一个或多个下列加速技术:1)多协议压缩,2)传输控制协议池,3)传输控制协议多路复用,4)传输控制协议缓冲,以及5)通过高速缓存管理器的高速缓存。另外,加速程序302可执行由客户机102接收和/或发送的任何通信的加密和/或解密。在一些实施例中,加速程序302以集成的方式或者格式执行一个或者多个加速技术。另外,加速程序302可以对作为传输层协议的网络分组的有效载荷所承载的任一协议或者多协议执行压缩。
流客户机306包括应用、程序、进程、服务、任务或者可执行指令,所述应用、程序、进程、服务、任务或者可执行指令用于接收和执行从服务器106所流式传输的应用。服务器106可以流式传输一个或者多个应用数据文件到流客户机306,用于播放、执行或者以其它方式引起客户机102上的应用被执行。在一些实施例中,服务器106发送一组压缩或者打包的应用数据文件到流客户机306。在一些实施例中,多个应用文件被压缩并存储在文件服务器上档案文件中,例如CAB、ZIP、SIT、TAR、JAR或其它档案文件。在一个实施例中,服务器106解压缩、解包或者解档应用文件并且将该文件发送到客户机102。在又一个实施例中,客户机102解压缩、解包或者解档应用文件。流客户机306动态安装应用或其部分,并且执行该应用。在一个实施例中,流客户机306可以为可执行程序。在一些实施例中,流客户机306可以能够启动另一个可执行程序。
收集代理304包括应用、程序、进程、服务、任务或者可执行指令,用于识别、获取和/或收集关于客户机102的信息。在一些实施例中,设备200发送收集代理304到客户机102或者客户机代理120。可以根据设备的策略引擎236的一个或多个策略来配置收集代理304。在其他实施例中,收集代理304发送在客户机102上收集的信息到设备200。在一个实施例中,设备200的策略引擎236使用所收集的信息来确定和提供到网络104的客户机连接的访问、验证和授权控制。
在一个实施例中,收集代理304包括端点检测和扫描机制,其识别并且确定客户机的一个或者多个属性或者特征。例如,收集代理304可以识别和确定任何一个或多个以下的客户机侧属性:1)操作系统和/或操作系统的版本,2)操作系统的服务包,3)运行的服务,4)运行的进程,和5)文件。收集代理304还可以识别并确定客户机上任何一个或多个以下软件的存在或版本:1)防病毒软件;2)个人防火墙软件;3)防垃圾邮件软件,和4)互联网安全软件。策略引擎236可以具有基于客户机或客户机侧属性的任何一个或多个属性或特性的一个或多个策略。
在一些实施例中,客户机代理120包括如结合图1D和2B所讨论的监控代理197。监控代理197可以是诸如Visual Basic或Java脚本的任何类型和形式的脚本。在一个实施例中,监控代理197监控和测量客户机代理120的任何部分的性能。例如,在一些实施例中,监控代理197监控和测量加速程序302的性能。在又一个实施例中,监控代理197监控和测量流客户机306的性能。在其他实施例中,监控代理197监控和测量收集代理304的性能。在又一个实施例中,监控代理197监控和测量拦截器350的性能。在一些实施例中,监控代理197监控和测量客户机102的诸如存储器、CPU和磁盘的任何资源。
监控代理197可以监控和测量客户机的任何应用的性能。在一个实施例中,监控代理197监控和测量客户机102上的浏览器的性能。在一些实施例中,监控代理197监控和测量经由客户机代理120传送的任何应用的性能。在其他实施例中,监控代理197测量和监控应用的最终用户响应时间,例如基于web的响应时间或HTTP响应时间。监控代理197可以监控和测量ICA或RDP客户机的性能。在又一个实施例中,监控代理197测量和监控用户会话或应用会话的指标。在一些实施例中,监控代理197测量和监控ICA或RDP会话。在一个实施例中,监控代理197测量和监控设备200在加速传送应用和/或数据到客户机102的过程中的性能。
在一些实施例中,仍参考图3,第一程序322可以用于自动地、静默地、透明地或者以其它方式安装和/或执行客户机代理120或其部分,诸如拦截器350。在一个实施例中,第一程序322包括插件组件,例如ActiveX控件或Java控件或脚本,其加载到应用并由应用执行。例如,第一程序包括由web浏览器应用载入和运行的ActiveX控件,例如在存储器空间或应用的上下文中。在又一个实施例中,第一程序322包括可执行指令组,该可执行指令组被例如浏览器的应用载入并执行。在一个实施例中,第一程序322包括被设计和构造的程序以安装客户机代理120。在一些实施例中,第一程序322通过网络从另一个计算装置获得、下载、或接收客户机代理120。在又一个实施例中,第一程序322是用于在客户机102的操作系统上安装如网络驱动的程序的安装程序或即插即用管理器。
D.用于提供虚拟化应用传送控制器的系统和方法
现参考图4A,该框图描述虚拟化环境400的一个实施例。总体而言,计算装置100包括管理程序层、虚拟化层和硬件层。管理程序层包括管理程序401(也称为虚拟化管理器),其通过在虚拟化层中执行的至少一个虚拟机来分配和管理对硬件层中的多个物理资源(例如处理器421和盘428)的访问。虚拟化层包括至少一个操作系统410和分配给至少一个操作系统410的多个虚拟资源。虚拟资源可包括而不限于多个虚拟处理器432a、432b、432c(总称为432)和虚拟盘442a、442b、442c(总称为442),以及如虚拟存储器和虚拟网络接口的虚拟资源。可将多个虚拟资源和操作系统称为虚拟机406。虚拟机406可包括控制操作系统405,该控制操作系统405与管理程序401通信,并用于执行应用以管理并配置计算装置100上的其他虚拟机。
具体而言,管理程序401可以以模拟可访问物理设备的操作系统的任何方式向操作系统提供虚拟资源。管理程序401可以向任何数量的客户操作系统410a、410b(总称为410)提供虚拟资源。一些实施例中,计算装置100执行一种或多种管理程序。这些实施例中,管理程序可用于模拟虚拟硬件、划分物理硬件、虚拟化物理硬件并执行提供对计算环境的访问的虚拟机。管理程序可包括由位于美国加州的Palo Alto的VMWare制造的这些程序;XEN管理程序(一种开源产品,其开发由开源Xen.org协会监管);由微软公司提供的HyperV、VirtualServer或虚拟PC管理程序,或其他。一些实施例中,计算装置100执行创建客户操作系统可在其上执行虚拟机平台的管理程序,该计算装置100被称为宿主服务器。在这些实施例的一个中,例如,计算装置100是由位于美国佛罗里达州Fort Lauderdale的CitrixSystems有限公司提供的XEN SERVER。
一些实施例中,管理程序401在计算装置上执行的操作系统之内执行。在这些实施例的一个中,执行操作系统和管理程序401的计算装置可被视为具有宿主操作系统(执行在计算装置上的操作系统),和客户操作系统(在由管理程序401提供的计算资源分区内执行的操作系统)。其他实施例中,管理程序401和计算装置上的硬件直接交互而不是在宿主操作系统上执行。在这些实施例的一个中,管理程序401可被视为在“裸金属(bare metal)”上执行,所述“裸金属”指包括计算装置的硬件。
一些实施例中,管理程序401可以产生操作系统410在其中执行的虚拟机406a-c(总称为406)。在这些实施例的一个中,管理程序401加载虚拟机映像以创建虚拟机406。在这些实施例的又一个中,管理程序401在虚拟机406内执行操作系统410。仍在这些实施例的又一个中,虚拟机406执行操作系统410。
一些实施例中,管理程序401控制在计算装置100上执行的虚拟机406的处理器调度和内存划分。在这些实施例的一个中,管理程序401控制至少一个虚拟机406的执行。在这些实施例的又一个中,管理程序401向至少一个虚拟机406呈现由计算装置100提供的至少一个硬件资源的抽象。其他实施例中,管理程序401控制是否以及如何将物理处理器能力呈现给虚拟机406。
控制操作系统405可以执行用于管理和配置客户操作系统的至少一个应用。一个实施例中,控制操作系统405可以执行管理应用,如包括如下用户接口的应用,该用户接口为管理员提供对用于管理虚拟机执行的功能的访问,这些功能包括用于执行虚拟机、中止虚拟机执行或者识别要分配给虚拟机的物理资源类型的功能。又一个实施例中,管理程序401在由管理程序401创建的虚拟机406内执行控制操作系统405。又一个实施例中,控制操作系统405在被授权直接访问计算装置100上的物理资源的虚拟机406上执行。一些实施例中,计算装置100a上的控制操作系统405a可以通过管理程序401a和管理程序401b之间的通信与计算装置100b上的控制操作系统405b交换数据。这样,一个或多个计算装置100可以和一个或多个其他计算装置100交换有关处理器或资源池中可用的其他物理资源的数据。在这些实施例的一个中,这种功能允许管理程序管理分布在多个物理计算装置上的资源池。在这些实施例的又一个中,多个管理程序管理在一个计算装置100上执行的一个或多个客户操作系统。
一个实施例中,控制操作系统405在被授权与至少一个客户操作系统410交互的虚拟机406上执行。又一个实施例中,客户操作系统410通过管理程序401和控制操作系统405通信,以请求访问盘或网络。仍在又一个实施例中,客户操作系统410和控制操作系统405可通过由管理程序401建立的通信信道通信,例如,通过由管理程序401提供的多个共享存储器页面。
一些实施例中,控制操作系统405包括用于直接与由计算装置100提供的网络硬件通信的网络后端驱动器。在这些实施例的一个中,网络后端驱动器处理来自至少一个客户操作系统110的至少一个虚拟机请求。其他实施例中,控制操作系统405包括用于与计算装置100上的存储元件通信的块后端驱动器。在这些实施例的一个中,块后端驱动器基于从客户操作系统410接收的至少一个请求从存储元件读写数据。
一个实施例中,控制操作系统405包括工具堆栈404。其他实施例中,工具堆栈404提供如下功能:和管理程序401交互、和其他控制操作系统405(例如位于第二计算装置100b上)通信,或者管理计算装置100上的虚拟机406b、406c。又一个实施例中,工具堆栈404包括自定义应用,其用于向虚拟机群的管理员提供改进的管理功能。一些实施例中,工具堆栈404和控制操作系统405中的至少一个包括管理API,其提供用于远程配置并控制计算装置100上运行的虚拟机406的接口。其他实施例中,控制操作系统405通过工具堆栈404和管理程序401通信。
一个实施例中,管理程序401在由管理程序401创建的虚拟机406内执行客户操作系统410。又一个实施例中,客户操作系统410为计算装置100的用户提供对计算环境中的资源的访问。又一个实施例中,资源包括程序、应用、文档、文件、多个应用、多个文件、可执行程序文件、桌面环境、计算环境或对计算装置100的用户可用的其他资源。又一个实施例中,可通过多个访问方法将资源传送给计算装置100,这些方法包括但不限于:常规的直接在计算装置100上安装、通过应用流的方法传送给计算装置100、将由在第二计算装置100’上执行资源产生的并通过表示层协议传送给计算装置100的输出数据传送给计算装置100、将通过在第二计算装置100’上执行的虚拟机执行资源所产生的输出数据传送给计算装置100、或者从连接到计算装置100的移动存储装置(例如USB设备)执行或者通过在计算装置100上执行的虚拟机执行并且产生输出数据。一些实施例中,计算装置100将执行资源所产生的输出数据传输给另一个计算装置100’。
一个实施例中,客户操作系统410和该客户操作系统410在其上执行的虚拟机结合形成完全虚拟化虚拟机,该完全虚拟化虚拟机并不知道自己是虚拟机,这样的机器可称为“Domain U HVM(硬件虚拟机)虚拟机”。又一个实施例中,完全虚拟化机包括模拟基本输入/输出系统(BIOS)的软件以便在完全虚拟化机中执行操作系统。在又一个实施例中,完全虚拟化机可包括驱动器,其通过和管理程序401通信提供功能。这样的实施例中,驱动器可意识到自己在虚拟化环境中执行。又一个实施例中,客户操作系统410和该客户操作系统410在其上执行的虚拟机结合形成超虚拟化(paravirtualized)虚拟机,该超虚拟化虚拟机意识到自己是虚拟机,这样的机器可称为“DomainU PV虚拟机”。又一个实施例中,超虚拟化机包括完全虚拟化机不包括的额外驱动器。又一个实施例中,超虚拟化机包括如上所述的被包含在控制操作系统405中的网络后端驱动器和块后端驱动器。
现参考图4B,框图描述了系统中的多个联网计算装置的一个实施例,其中,至少一个物理主机执行虚拟机。总体而言,系统包括管理组件404和管理程序401。系统包括多个计算装置100、多个虚拟机406、多个管理程序401、多个管理组件(又称为工具堆栈404或者管理组件404)以及物理资源421、428。多个物理机器100的每一个可被提供为如上结合图1E-1H和图4A描述的计算装置100。
具体而言,物理盘428由计算装置100提供,存储至少一部分虚拟盘442。一些实施例中,虚拟盘442和多个物理盘428相关联。在这些实施例的一个中,一个或多个计算装置100可以与一个或多个其他计算装置100交换有关处理器或资源池中可用的其他物理资源的数据,允许管理程序管理分布在多个物理计算装置上的资源池。一些实施例中,将虚拟机406在其上执行的计算装置100称为物理主机100或主机100。
管理程序在计算装置100上的处理器上执行。管理程序将对物理盘的访问量分配给虚拟盘。一个实施例中,管理程序401分配物理盘上的空间量。又一个实施例中,管理程序401分配物理盘上的多个页面。一些实施例中,管理程序提供虚拟盘442作为初始化和执行虚拟机450进程的一部分。
一个实施例中,将管理组件404a称为池管理组件404a。又一个实施例中,可以称为控制管理系统405a的管理操作系统405a包括管理组件。一些实施例中,将管理组件称为工具堆栈。在这些实施例的一个中,管理组件是上文结合图4A描述的工具堆栈404。其他实施例中,管理组件404提供用户接口,用于从如管理员的用户接收要供应和/或执行的虚拟机406的标识。仍在其他实施例中,管理组件404提供用户接口,用于从如管理员的用户接收将虚拟机406b从一个物理机器100迁移到另一物理机器的请求。在进一步的实施例中,管理组件404a识别在其上执行所请求的虚拟机406d的计算装置100b并指示所识别的计算装置100b上的管理程序401b执行所识别的虚拟机,这样,可将管理组件称为池管理组件。
现参考图4C,描述了虚拟应用传送控制器或虚拟设备450的实施例。总体而言,上文结合图2A和2B描述的设备200的任何功能和/或实施例(例如应用传送控制器)可以部署在上文结合图4A和4B描述的虚拟化环境的任何实施例中。应用传送控制器的功能不是以设备200的形式部署,而是将该功能部署在诸如客户机102、服务器106或设备200的任何计算装置100上的虚拟化环境400中。
现在参考图4C,描述了在服务器106的管理程序401上操作的虚拟设备450的实施例的框图。如图2A和2B的设备200一样,虚拟机450可以提供可用性、性能、卸载和安全的功能。对于可用性,虚拟设备可以执行网络第4层和第7层之间的负载平衡并执行智能服务健康监控。对于通过网络流量加速实现的性能增加,虚拟设备可以执行缓存和压缩。对于任何服务器的卸载处理,虚拟设备可以执行连接复用和连接池和/或SSL处理。对于安全,虚拟设备可以执行设备200的任何应用防火墙功能和SSL VPN功能。
结合附图2A描述的设备200的任何模块可以虚拟化设备传送控制器450的形式被打包、组合、设计或构造,虚拟化设备传送控制器450可部署成在诸如流行的服务器这样的任何服务器上的虚拟化环境300或非虚拟化环境中执行的软件模块或组件。例如,可以安装在计算装置上的安装包的形式提供虚拟设备。参考图2A,可以将高速缓存管理器232、策略引擎236、压缩238、加密引擎234、分组引擎240、GUI210、CLI212、壳服务214中的任一个设计和构成在计算装置和/或虚拟化环境300的任何操作系统上运行的组件或模块。虚拟化设备400不使用设备200的加密处理器260、处理器262、存储器264和网络堆栈267,而是可使用虚拟化环境400提供的任何这些资源或者服务器106上以其他方式可用的这些资源。
仍参考图4C,简言之,任何一个或多个vServer275A-275N可以操作或执行在任意类型的计算装置100(如服务器106)的虚拟化环境400中。结合附图2B描述的设备200的任何模块和功能可以设计和构造成在服务器的虚拟化或非虚拟化环境中操作。可以将vServer275、SSL VPN280、内网UP282、交换装置284、DNS286、加速装置288、APP FW280和监控代理中的任一个打包、组合、设计或构造成应用传送控制器450的形式,应用传送控制器450可部署成在装置和/或虚拟化环境400中执行的一个或多个软件模块或组件。
一些实施例中,服务器可以在虚拟化环境中执行多个虚拟机406a-406b,每个虚拟机运行虚拟应用传送控制器450的相同或不同实施例。一些实施例中,服务器可以在多核处理系统的一个核上执行一个或多个虚拟机上的一个或多个虚拟设备450。一些实施例中,服务器可以在多处理器装置的每个处理器上执行一个或多个虚拟机上的一个或多个虚拟设备450。
E.提供多核架构的系统和方法
根据摩尔定律,每两年集成电路上可安装的晶体管的数量会基本翻倍。然而,CPU速度增加会达到一个稳定的水平(plateaus),例如,2005年以来,CPU速度在约3.5-4GHz的范围内。一些情况下,CPU制造商可能不依靠CPU速度增加来获得额外的性能。一些CPU制造商会给处理器增加附加核以提供额外的性能。依靠CPU获得性能改善的如软件和网络供应商的产品可以通过利用这些多核CPU来改进他们的性能。可以重新设计和/或编写为单CPU设计和构造的软件以利用多线程、并行架构或多核架构。
一些实施例中,称为nCore或多核技术的设备200的多核架构允许设备打破单核性能障碍并利用多核CPU的能力。前文结合图2A描述的架构中,运行单个网络或分组引擎。nCore技术和架构的多核允许同时和/或并行地运行多个分组引擎。通过在每个核上运行分组引擎,设备架构利用附加核的处理能力。一些实施例中,这提供了高达七倍的性能改善和扩展性。
图5A示出根据一类并行机制或并行计算方案(如功能并行机制、数据并行机制或基于流的数据并行机制)在一个或多个处理器核上分布的工作、任务、负载或网络流量的一些实施例。总体而言,图5A示出如具有n个核的设备200'的多核系统的实施例,n个核编号为1到N。一个实施例中,工作、负载或网络流量可以分布在第一核505A、第二核505B、第三核505C、第四核505D、第五核505E、第六核505F、第七核505G等上,这样,分布位于所有n个核505N(此后统称为核505)或n个核中的两个或多个上。可以有多个VIP275,每个运行在多个核中的相应的核上。可以有多个分组引擎240,每个运行在多个核的相应的核。所使用任何方法可产生多个核中任一核上的不同的、变化的或类似的工作负载或性能级别515。对于功能并行方法,每个核运行由分组引擎、VIP275或设备200提供的多个功能的不同功能。在数据并行方法中,数据可基于接收数据的网络接口卡(NIC)或VIP275并行或分布在核上。又一个数据并行方法中,可通过将数据流分布在每个核上而将处理分布在核上。
图5A的进一步的细节中,一些实施例中,可以根据功能并行机制500将负载、工作或网络流量在多个核505间分布。功能并行机制可基于执行一个或多个相应功能的每个核。一些实施例中,第一核可执行第一功能,同时第二核执行第二功能。功能并行方法中,根据功能性将多核系统要执行的功能划分并分布到每个核。一些实施例中,可将功能并行机制称为任务并行机制,并且可在每个处理器或核对同一数据或不同数据执行不同进程或功能时实现。核或处理器可执行相同或不同的代码。一些情况下,不同的执行线程或代码可在工作时相互通信。可以进行通信以将数据作为工作流的一部分从一个线程传递给下一线程。
一些实施例中,根据功能并行机制500将工作分布在核505上,可以包括根据特定功能分布网络流量,所述特定功能例如为网络输入/输出管理(NW I/O)510A、安全套接层(SSL)加密和解密510B和传输控制协议(TCP)功能510C。这会产生基于所使用的功能量或功能级别的工作、性能或者计算负载515。一些实施例中,根据数据并行机制540将工作分布在核505上可包括基于与特定的硬件或软件组件相关联的分布数据来分布工作量515。一些实施例中,根据基于流的数据并行机制520将工作分布在核505上可包括基于上下文或流来分布数据,从而使得每个核上的工作量515A-N可以类似、基本相等或者相对平均分布。
在功能并行方法的情况下,可以配置每个核来运行由设备的分组引擎或VIP提供的多个功能中的一个或多个功能。例如,核1可执行设备200’的网络I/O处理,同时核2执行设备的TCP连接管理。类似地,核3可执行SSL卸载,同时核4可执行第7层或应用层处理和流量管理。每个核可执行相同或不同的功能。每个核可执行不只一个功能。任一核可运行结合附图2A和2B识别和/或描述的功能或其一部分。该方法中,核上的工作可以粗粒度或细粒度方式按功能划分。一些情况下,如图5A所示,按功能划分会使得不同核运行在不同的性能或负载级别515。
在功能并行方法的情况下,可以配置每个核来运行由设备的分组引擎提供的多个功能中的一个或多个功能。例如,核1可执行设备200’的网络I/O处理,同时核2执行设备的TCP连接管理。类似地,核3可执行SSL卸载,同时核4可执行第7层或应用层处理和流量管理。每个核可执行相同或不同的功能。每个核可执行不只一个功能。任何核可运行结合附图2A和2B识别和/或描述的功能或其一部分。该方法中,核上的工作可以粗粒度或细粒度方式按功能划分。一些情况下,如图5A所示,按功能划分会使得不同核运行在不同的性能或负载级别。
可以用任何结构或方案来分布功能或任务。例如,图5B示出用于处理与网络I/O功能510A相关联的应用和进程的第一核Core1505A。一些实施例中,与网络I/O相关联的网络流量可以和特定的端口号相关联。因而,将具有与NW I/O510A相关联的端口目的地的发出和到来的分组导引给Core1505A,该Core1505A专用于处理与NW I/O端口相关联的所有网络流量。类似的,Core2505B专用于处理与SSL处理相关联的功能,Core4505D可专用于处理所有TCP级处理和功能。
虽然图5A示出如网络I/O、SSL和TCP的功能,也可将其他功能分配给核。这些其他功能可包括此处描述的任一或多个功能或操作。例如,结合图2A和2B描述的任何功能可基于功能基础分布在核上。一些情况下,第一VIP275A可运行在第一核上,同时,具有不同配置的第二VIP275B可运行在第二核上。一些实施例中,每个核505可处理特定功能,这样每个核505可处理与该特定功能相关联的处理。例如,Core2505B可处理SSL卸载,同时Core4505D可处理应用层处理和流量管理。
其他实施例中,可根据任何类型或形式的数据并行机制540将工作、负载或网络流量分布在核505上。一些实施例中,可由每个核对分布式数据的不同片执行相同任务或功能来实现多核系统中的数据并行机制。一些实施例中,单个执行线程或代码控制对所有数据片的操作。其他实施例中,不同线程或指令控制操作,但是可执行相同代码。一些实施例中,从分组引擎、vServer(VIP)275A-C、网络接口卡(NIC)542D-E和/或设备200上包括的或者与设备200相关联的任何其他网络硬件或软件的角度实现数据并行机制。例如,每个核可运行同样的分组引擎或VIP代码或配置但是在不同的分布式数据集上进行操作。每个网络硬件或软件结构可接收不同的、变化的或者基本相同量的数据,因而可以具有变化的、不同的或相对相同量的负载515。
在数据并行方法的情况下,可以基于VIP、NIC和/或VIP或NIC的数据流来划分和分布工作。在这些的方法的一个中,可通过使每个VIP在分布的数据集上工作来将多核系统的工作划分或者分布在VIP中。例如,可配置每个核运行一个或多个VIP。网络流量可分布在处理流量的每个VIP的核上。在这些方法的又一个中,可基于哪个NIC接收网络流量来将设备的工作划分或分布在核上。例如,第一NIC的网络流量可被分布到第一核,同时第二NIC的网络流量可被分布给第二核。一些情况下,核可处理来自多个NIC的数据。
虽然图5A示出了与单个核505相关联的单个vServer,正如VIP1275A、VIP2275B和VIP3275C的情况。但是,一些实施例中,单个vServer可以与一个或者多个核505相关联。相反,一个或多个vServer可以与单个核505相关联。将vServer与核505关联可包括该核505处理与该特定vServer关联的所有功能。一些实施例中,每个核执行具有相同代码和配置的VIP。其他实施例中,每个核执行具有相同代码但配置不同的VIP。一些实施例中,每个核执行具有不同代码和相同或不同配置的VIP。
和vServer类似,NIC也可以和特定的核505关联。许多实施例中,NIC可以连接到一个或多个核505,这样,当NIC接收或传输数据分组时,特定的核505处理涉及接收和传输数据分组的处理。一个实施例中,单个NIC可以与单个核505相关联,正如NIC1542D和NIC2542E的情况。其他实施例中,一个或多个NIC可以与单个核505相关联。但其他实施例中,单个NIC可以与一个或者多个核505相关联。这些实施例中,负载可以分布在一个或多个核505上,使得每个核505基本上处理类似的负载量。与NIC关联的核505可以处理与该特定NIC关联的所有功能和/或数据。
虽然根据VIP或NIC的数据将工作分布在核上具有某种程度的独立性,但是,一些实施例中,这会造成如图5A的变化负载515所示的核的不平衡的使用。
一些实施例中,可根据任何类型或形式的数据流将负载、工作或网络流量分布在核505上。在这些方法的又一个中,可基于数据流将工作划分或分布在多个核上。例如,客户机或服务器之间的经过设备的网络流量可以被分布到多个核中的一个核并且由其处理。一些情况下,最初建立会话或连接的核可以是该会话或连接的网络流量所分布的核。一些实施例中,数据流基于网络流量的任何单元或部分,如事务、请求/响应通信或来自客户机上的应用的流量。这样,一些实施例中,客户机和服务器之间的经过设备200’的数据流可以比其他方式分布的更均衡。
在基于流的数据并行机制520中,数据分布和任何类型的数据流相关,例如请求/响应对、事务、会话、连接或应用通信。例如,客户机或服务器之间的经过设备的网络流量可以被分布到多个核中的一个核并且由其处理。一些情况下,最初建立会话或连接的核可以是该会话或连接的网络流量所分布的核。数据流的分布可以使得每个核505运行基本相等或相对均匀分布的负载量、数据量或网络流量。
一些实施例中,数据流基于网络流量的任何单元或部分,如事务、请求/响应通信或源自客户机上的应用的流量。这样,一些实施例中,客户机和服务器之间的经过设备200’的数据流可以比其他方式分布的更均衡。一个实施例中,可以基于事务或一系列事务分布数据量。一些实施例中,该事务可以是客户机和服务器之间的,其特征可以是IP地址或其他分组标识符。例如,核1505A可专用于特定客户机和特定服务器之间的事务,因此,核1505A上的负载515A可包括与特定客户机和服务器之间的事务相关联的网络流量。可通过将源自特定客户机或服务器的所有数据分组路由到核1505A来将网络流量分配给核1505A。
虽然可部分地基于事务将工作或负载分布到核,但是,其他实施例中,可基于每个分组的基础分配负载或工作。这些实施例中,设备200可拦截数据分组并将数据分组分配给负载量最小的核505。例如,由于核1上的负载515A小于其他核505B-N上的负载515B-N,所以设备200可将第一到来的数据分组分配给核1505A。将第一数据分组分配给核1505A后,核1505A上的负载量515A与处理第一数据分组所需的处理资源量成比例增加。设备200拦截到第二数据分组时,设备200会将负载分配给核4505D,这是由于核4505D具有第二少的负载量。一些实施例中,将数据分组分配给负载量最小的核可确保分布到每个核505的负载515A-N保持基本相等。
其他实施例中,将一部分网络流量分配给特定核505的情况下,可以每单元为基础分配负载。上述示例说明以每分组为基础进行负载平衡。其他实施例中,可以基于分组数目分配负载,例如,将每10个、100个或1000个分组分配给流量最少的核505。分配给核505的分组数量可以是由应用、用户或管理员确定的数目,而且可以为大于零的任何数。仍在其他实施例中,基于时间指标分配负载,使得在预定时间段将分组分布到特定核505。这些实施例中,可以在5毫秒内或者由用户、程序、系统、管理器或其他方式确定的任何时间段将分组分布到特定核505。预定时间段过去后,在预定时间段内将时间分组传输给不同的核505。
用于将工作、负载或网络流量分布在一个或多个核505上的基于流的数据并行方法可包括上述实施例的任意组合。这些方法可以由设备200的任何部分执行,由在核505上执行的应用或者一组可执行指令执行,例如分组引擎,或者由在与设备200通信的计算装置上执行的任何应用、程序或代理执行。
图5A所示的功能和数据并行机制计算方案可以任何方式组合,以产生混合并行机制或分布式处理方案,其包括功能并行机制500、数据并行机制540、基于流的数据并行机制520或者其任何部分。一些情况下,多核系统可使用任何类型或形式的负载平衡方案来将负载分布在一个或多个核505上。负载平衡方案可以和任何功能和数据平行方案或其组合结合使用。
图5B示出多核系统545的实施例,该系统可以是任何类型或形式的一个或多个系统、设备、装置或组件。一些实施例中,该系统545可被包括在具有一个或多个处理核505A-N的设备200内。系统545还可包括与存储器总线556通信的一个或多个分组引擎(PE)或分组处理引擎(PPE)548A-N。存储器总线可用于与一个或多个处理核505A-N通信。系统545还可包括一个或多个网络接口卡(NIC)552和流分布器550,流分布器还可与一个或多个处理核505A-N通信。流分布器550可包括接收侧调整器(Receiver Side Scaler-RSS)或接收侧调整(Receiver Side Scaling-RSS)模块560。
进一步参考图5B,具体而言,一个实施例中,分组引擎548A-N可包括此处所述的设备200的任何部分,例如图2A和2B所述设备的任何部分。一些实施例中,分组引擎548A-N可包括任何下列的元件:分组引擎240、网络堆栈267、高速缓存管理器232、策略引擎236、压缩引擎238、加密引擎234、GUI210、CLI212、壳服务214、监控程序216以及能够从数据总线556或一个或多个核505A-N中的任一个接收数据分组的其他任何软件和硬件元件。一些实施例中,分组引擎548A-N可包括一个或多个vServer275A-N或其任何部分。其他实施例中,分组引擎548A-N可提供以下功能的任意组合:SSL VPN280、内部网IP282、交换284、DNS286、分组加速288、APPFW280、如由监控代理197提供的监控、和作为TCP堆栈关联的功能、负载平衡、SSL卸载和处理、内容交换、策略评估、高速缓存、压缩、编码、解压缩、解码、应用防火墙功能、XML处理和加速以及SSL VPN连接。
一些实施例中,分组引擎548A-N可以与特定服务器、用户、客户或网络关联。分组引擎548与特定实体关联时,分组引擎548可处理与该实体关联的数据分组。例如,如果分组引擎548与第一用户关联,那么该分组引擎548将对由第一用户产生的分组或者目的地址与第一用户关联的分组进行处理和操作。类似地,分组引擎548可选择不与特定实体关联,使得分组引擎548可对不是由该实体产生的或目的是该实体的任何数据分组进行处理和以其他方式进行操作。
一些实例中,可将分组引擎548A-N配置为执行图5A所示的任何功能和/或数据并行方案。这些实例中,分组引擎548A-N可将功能或数据分布在多个核505A-N上,从而使得分布是根据并行机制或分布方案的。一些实施例中,单个分组引擎548A-N执行负载平衡方案,其他实施例中,一个或多个分组引擎548A-N执行负载平衡方案。一个实施例中,每个核505A-N可以与特定分组引擎548关联,使得可以由分组引擎执行负载平衡。在该实施例中,负载平衡可要求与核505关联的每个分组引擎548A-N和与核关联的其他分组引擎通信,使得分组引擎548A-N可共同决定将负载分布在何处。该过程的一个实施例可包括从每个分组引擎接收对于负载的投票的仲裁器。仲裁器可部分地基于引擎投票的持续时间将负载分配给每个分组引擎548A-N,一些情况下,还可基于与在引擎关联的核505上的当前负载量相关联的优先级值来将负载分配给每个分组引擎548A-N。
核上运行的任何分组引擎可以运行于用户模式、内核模式或其任意组合。一些实施例中,分组引擎作为在用户空间或应用空间中运行的应用或程序来操作。这些实施例中,分组引擎可使用任何类型或形式的接口来访问内核提供的任何功能。一些实施例中,分组引擎操作于内核模式中或作为内核的一部分来操作。一些实施例中,分组引擎的第一部分操作于用户模式中,分组引擎的第二部分操作于内核模式中。一些实施例中,第一核上的第一分组引擎执行于内核模式中,同时,第二核上的第二分组引擎执行于用户模式中。一些实施例中,分组引擎或其任何部分对NIC或其任何驱动器进行操作或者与其联合操作。
一些实施例中,存储器总线556可以是任何类型或形式的存储器或计算机总线。虽然在图5B中描述了单个存储器总线556,但是系统545可包括任意数量的存储器总线556。一个实施例中,每个分组引擎548可以和一个或者多个单独的存储器总线556相关联。
一些实施例中,NIC552可以是此处所述的任何网络接口卡或机制。NIC552可具有任意数量的端口。NIC可设计并构造成连接到任何类型和形式的网络104。虽然示出单个NIC552,但是,系统545可包括任意数量的NIC552。一些实施例中,每个核505A-N可以与一个或多个单个NIC552关联。因而,每个核505可以与专用于特定核505的单个NIC552关联。
核505A-N可包括此处所述的任何处理器。此外,可根据此处所述的任何核505配置来配置核505A-N。另外,核505A-N可具有此处所述的任何核505功能。虽然图5B示出七个核505A-G,但是系统545可包括任意数量的核505。具体而言,系统545可包括N个核,其中N是大于零的整数。
核可具有或使用被分配或指派用于该核的存储器。可将存储器视为该核的专有或本地存储器并且仅有该核可访问该存储器。核可具有或使用共享的或指派给多个核的存储器。该存储器可被视为由不只一个核可访问的公共或共享存储器。核可使用专有或公共存储器的任何组合。通过每个核的单独的地址空间,消除了使用同一地址空间的情况下的一些协调级别。利用单独的地址空间,核可以对核自己的地址空间中的信息和数据进行工作,而不用担心与其他核冲突。每个分组引擎可以具有用于TCP和/或SSL连接的单独存储器池。
仍参考图5B,上文结合图5A描述的核505的任何功能和/或实施例可以部署在上文结合图4A和4B描述的虚拟化环境的任何实施例中。不是以物理处理器505的形式部署核505的功能,而是将这些功能部署在诸如客户机102、服务器106或设备200的任何计算装置100的虚拟化环境400内。其他实施例中,不是以设备或一个装置的形式部署核505的功能,而是将该功能部署在任何布置的多个装置上。例如,一个装置可包括两个或多个核,另一个装置可包括两个或多个核。例如,多核系统可包括计算装置的集群、服务器群或计算装置的网络。一些实施例中,不是以核的形式部署核505的功能,而是将该功能部署在多个处理器上,例如部署多个单核处理器上。
一个实施例中,核505可以为任何形式或类型的处理器。一些实施例中,核的功能可以基本类似此处所述的任何处理器或中央处理单元。一些实施例中,核505可包括此处所述的任何处理器的任何部分。虽然图5A示出7个核,但是,设备200内可以有任意N个核,其中N是大于1的整数。一些实施例中,核505可以安装在公用设备200内,其他实施例中,核505可以安装在彼此通信连接的一个或多个设备200内。一些实施例中,核505包括图形处理软件,而其他实施例中,核505提供通用处理能力。核505可彼此物理靠近地安装和/或可彼此通信连接。可以用以物理方式和/或通信方式耦合到核的任何类型和形式的总线或子系统连接核,用于向核、从核和/或在核之间传输数据。
尽管每个核505可包括用于与其他核通信的软件,一些实施例中,核管理器(未示出)可有助于每个核505之间的通信。一些实施例中,内核可提供核管理。核可以使用各种接口机制彼此接口或通信。一些实施例中,可以使用核到核的消息传送来在核之间通信,比如,第一核通过连接到核的总线或子系统向第二核发送消息或数据。一些实施例中,核可通过任何种类或形式的共享存储器接口通信。一个实施例中,可以存在在所有核中共享的一个或多个存储器单元。一些实施例中,每个核可以具有和每个其他核共享的单独存储器单元。例如,第一核可具有与第二核的第一共享存储器,以及与第三核的第二共享存储器。一些实施例中,核可通过任何类型的编程或API(如通过内核的函数调用)来通信。一些实施例中,操作系统可识别并支持多核装置,并提供用于核间通信的接口和API。
流分布器550可以是任何应用、程序、库、脚本、任务、服务、进程或在任何类型或形式的硬件上执行的任何类型和形式的可执行指令。一些实施例中,流分布器550可以是用于执行此处所述任何操作和功能的任何电路设计或结构。一些实施例中,流分布器分布、转发、路由、控制和/或管理多个核505上的数据和/或在核上运行的分组引擎或VIP的分布。一些实施例中,可将流分布器550称为接口主装置(interface master)。一个实施例中,流分布器550包括在设备200的核或处理器上执行的一组可执行指令。又一个实施例中,流分布器550包括在与设备200通信的计算机器上执行的一组可执行指令。一些实施例中,流分布器550包括在如固件的NIC上执行的一组可执行指令。其他实施例,流分布器550包括用于将数据分组分布在核或处理器上的软件和硬件的任何组合。一个实施例中,流分布器550在至少一个核505A-N上执行,而在其他实施例中,分配给每个核505A-N的单独的流分布器550在相关联的核505A-N上执行。流分布器可使用任何类型和形式的统计或概率算法或决策来平衡多个核上的流。可以将如NIC的设备硬件或内核设计或构造成支持NIC和/或核上的顺序操作。
系统545包括一个或多个流分布器550的实施例中,每个流分布器550可以与处理器505或分组引擎548关联。流分布器550可包括允许每个流分布器550和在系统545内执行的其他流分布器550通信的接口机制。一个实例中,一个或多个流分布器550可通过彼此通信确定如何平衡负载。该过程的操作可以基本与上述过程类似,即将投票提交给仲裁器,然后仲裁器确定哪个流分布器550应该接收负载。其他实施例中,第一流分布器550’可识别所关联的核上的负载并基于任何下列标准确定是否将第一数据分组转发到所关联的核:所关联的核上的负载大于预定阈值;所关联的核上的负载小于预定阈值;所关联的核上的负载小于其他核上的负载;或者可以用于部分基于处理器上的负载量来确定将数据分组转发到何处的任何其他指标。
流分布器550可以根据如此处所述的分布、计算或负载平衡方法而将网络流量分布在核505上。一个实施例中,流分布器可基于功能并行机制分布方案550、数据并行机制负载分布方案540、基于流的数据并行机制分布方案520或这些分布方案的任意组合或用于将负载分布在多个处理器上的任何负载平衡方案来分布网络流量。因而,流分布器550可通过接收数据分组并根据操作的负载平衡或分布方案将数据分组分布在处理器上而充当负载分布器。一个实施例中,流分布器550可包括用于确定如何相应地分布分组、工作或负载的一个或多个操作、函数或逻辑。又一个实施例中,流分布器550可包括可识别与数据分组关联的源地址和目的地址并相应地分布分组的一个或多个子操作、函数或逻辑。
一些实施例中,流分布器550可包括接收侧调整(RSS)网络驱动器模块560或将数据分组分布在一个或多个核505上的任何类型和形式的可执行指令。RSS模块560可以包括硬件和软件的任意组合。一些实施例中,RSS模块560和流分布器550协同工作以将数据分组分布在核505A-N或多处理器网络中的多个处理器上。一些实施例中,RSS模块560可在NIC552中执行,其他实施例中,可在核505的任何一个上执行。
一些实施例中,RSS模块560使用微软接收侧调整(RSS)方法。一个实施例中,RSS是微软可扩展网络主动技术(Microsoft Scalable Networking initiative technology),其使得系统中的多个处理器上的接收处理是平衡的,同时保持数据的顺序传送。RSS可使用任何类型或形式的哈希方案来确定用于处理网络分组的核或处理器。
RSS模块560可应用任何类型或形式的哈希函数,如Toeplitz哈希函数。哈希函数可应用到哈希类型值或者任何值序列。哈希函数可以是任意安全级别的安全哈希或者是以其他方式加密。哈希函数可使用哈希关键字(hash key)。关键字的大小取决于哈希函数。对于Toeplitz哈希,用于IPv6的哈希关键字大小为40字节,用于IPv4的哈希关键字大小为16字节。
可以基于任何一个或多个标准或设计目标设计或构造哈希函数。一些实施例中,可使用为不同的哈希输入和不同哈希类型提供均匀分布的哈希结果的哈希函数,所述不同哈希输入和不同哈希类型包括TCP/IPv4、TCP/IPv6、IPv4和IPv6头部。一些实施例中,可使用存在少量桶时(例如2个或4个)提供均匀分布的哈希结果的哈希函数。一些实施例中,可使用存在大量桶时(例如64个桶)提供随机分布的哈希结果的哈希函数。在一些实施例中,基于计算或资源使用水平来确定哈希函数。在一些实施例中,基于在硬件中实现哈希的难易度来确定哈希函数。在一些实施例中,基于用恶意的远程主机发送将全部哈希到同一桶中的分组的难易度来确定哈希函数。
RSS可从任意类型和形式的输入来产生哈希,例如值序列。该值序列可包括网络分组的任何部分,如网络分组的任何头部、域或载荷或其一部分。一些实施例中,可将哈希输入称为哈希类型,哈希输入可包括与网络分组或数据流关联的任何信息元组,例如下面的类型:包括至少两个IP地址和两个端口的四元组、包括任意四组值的四元组、六元组、二元组和/或任何其他数字或值序列。以下是可由RSS使用的哈希类型示例:
-源TCP端口、源IP版本4(IPv4)地址、目的TCP端口和目的IPv4地址的四元组。
-源TCP端口、源IP版本6(IPv6)地址、目的TCP端口和目的IPv6地址的四元组。
-源IPv4地址和目的IPv4地址的二元组。
-源IPv6地址和目的IPv6地址的二元组。
-源IPv6地址和目的IPv6地址的二元组,包括对解析IPv6扩展头部的支持。
哈希结果或其任何部分可用于识别用于分布网络分组的核或实体,如分组引擎或VIP。一些实施例中,可向哈希结果应用一个或者多个哈希位或掩码。哈希位或掩码可以是任何位数或字节数。NIC可支持任意位,例如7位。网络堆栈可在初始化时设定要使用的实际位数。位数介于1和7之间,包括端值。
可通过任意类型和形式的表用哈希结果来识别核或实体,例如通过桶表(buckettable)或间接表(indirection table)。一些实施例中,用哈希结果的位数来索引表。哈希掩码的范围可有效地限定间接表的大小。哈希结果的任何部分或哈希结果自身可用于索引间接表。表中的值可标识任何核或处理器,例如通过核或处理器标识符来标识。一些实施例中,表中标识多核系统的所有核。其他实施例中,表中标识多核系统的一部分核。间接表可包括任意多个桶,例如2到128个桶,可以用哈希掩码索引这些桶。每个桶可包括标识核或处理器的索引值范围。一些实施例中,流控制器和/或RSS模块可通过改变间接表来重新平衡网络负载。
一些实施例中,多核系统575不包括RSS驱动器或RSS模块560。在这些实施例的一些中,软件操控模块(未示出)或系统内RSS模块的软件实施例可以和流分布器550共同操作或者作为流分布器550的一部分操作,以将分组引导到多核系统575中的核505。
一些实施例中,流分布器550在设备200上的任何模块或程序中执行,或者在多核系统575中包括的任何一个核505和任一装置或组件上执行。一些实施例中,流分布器550’可在第一核505A上执行,而在其他实施例中,流分布器550”可在NIC552上执行。其他实施例中,流分布器550’的实例可在多核系统575中包括的每个核505上执行。该实施例中,流分布器550’的每个实例可和流分布器550’的其他实例通信以在核505之间来回转发分组。存在这样的状况,其中,对请求分组的响应不是由同一核处理的,即第一核处理请求,而第二核处理响应。这些情况下,流分布器550’的实例可以拦截分组并将分组转发到期望的或正确的核505,即流分布器550’可将响应转发到第一核。流分布器550’的多个实例可以在任意数量的核505或核505的任何组合上执行。
流分布器可以响应于任一个或多个规则或策略而操作。规则可识别接收网络分组、数据或数据流的核或分组处理引擎。规则可识别和网络分组有关的任何类型和形式的元组信息,例如源和目的IP地址以及源和目的端口的四元组。基于所接收的匹配规则所指定的元组的分组,流分布器可将分组转发到核或分组引擎。一些实施例中,通过共享存储器和/或核到核的消息传输将分组转发到核。
虽然图5B示出了在多核系统575中执行的流分布器550,但是,一些实施例中,流分布器550可执行在位于远离多核系统575的计算装置或设备上。这样的实施例中,流分布器550可以和多核系统575通信以接收数据分组并将分组分布在一个或多个核505上。一个实施例中,流分布器550接收以设备200为目的地的数据分组,向所接收的数据分组应用分布方案并将数据分组分布到多核系统575的一个或多个核505。一个实施例中,流分布器550可以被包括在路由器或其他设备中,这样路由器可以通过改变与每个分组关联的元数据而以特定核505为目的地,从而每个分组以多核系统575的子节点为目的地。这样的实施例中,可用CISCO的vn-tag机制来改变或标记具有适当元数据的每个分组。
图5C示出包括一个或多个处理核505A-N的多核系统575的实施例。简言之,核505中的一个可被指定为控制核505A并可用作其他核505的控制平面570。其他核可以是次级核,其工作于数据平面,而控制核提供控制平面。核505A-N共享全局高速缓存580。控制核提供控制平面,多核系统中的其他核形成或提供数据平面。这些核对网络流量执行数据处理功能,而控制核提供对多核系统的初始化、配置和控制。
仍参考图5C,具体而言,核505A-N以及控制核505A可以是此处所述的任何处理器。此外,核505A-N和控制核505A可以是能在图5C所述系统中工作的任何处理器。另外,核505A-N可以是此处所述的任何核或核组。控制核可以是与其他核不同类型的核或处理器。一些实施例中,控制核可操作不同的分组引擎或者具有与其他核的分组引擎配置不同的分组引擎。
每个核的存储器的任何部分可以被分配给或者用作核共享的全局高速缓存。简而言之,每个核的每个存储器的预定百分比或预定量可用作全局高速缓存。例如,每个核的每个存储器的50%可用作或分配给共享全局高速缓存。也就是说,所示实施例中,除了控制平面核或核1以外的每个核的2GB可用于形成28GB的共享全局高速缓存。例如通过配置服务而配置控制平面可确定用于共享全局高速缓存的存储量(the amount of memory)。一些实施例中,每个核可提供不同的存储量供全局高速缓存使用。其他实施例中,任一核可以不提供任何存储器或不使用全局高速缓存。一些实施例中,任何核也可具有未分配给全局共享存储器的存储器中的本地高速缓存。每个核可将网络流量的任意部分存储在全局共享高速缓存中。每个核可检查高速缓存来查找要在请求或响应中使用的任何内容。任何核可从全局共享高速缓存获得内容以在数据流、请求或响应中使用。
全局高速缓存580可以是任意类型或形式的存储器或存储元件,例如此处所述的任何存储器或存储元件。一些实施例中,核505可访问预定的存储量(即32GB或者与系统575相当的任何其他存储量)。全局高速缓存580可以从预定的存储量分配而来,同时,其余的可用存储器可在核505之间分配。其他实施例中,每个核505可具有预定的存储量。全局高速缓存580可包括分配给每个核505的存储量。该存储量可以字节为单位来测量,或者可用分配给每个核505的存储器百分比来测量。因而,全局高速缓存580可包括来自与每个核505关联的存储器的1GB存储器,或者可包括和每个核505关联的存储器的20%或一半。一些实施例,只有一部分核505提供存储器给全局高速缓存580,而在其他实施例,全局高速缓存580可包括未分配给核505的存储器。
每个核505可使用全局高速缓存580来存储网络流量或缓存数据。一些实施例中,核的分组引擎使用全局高速缓存来缓存并使用由多个分组引擎所存储的数据。例如,图2A的高速缓存管理器和图2B的高速缓存功能可使用全局高速缓存来共享数据以用于加速。例如,每个分组引擎可在全局高速缓存中存储例如HTML数据的响应。操作于核上的任何高速缓存管理器可访问全局高速缓存来将高速缓存响应提供给客户请求。
一些实施例中,核505可使用全局高速缓存580来存储端口分配表,其可用于部分基于端口确定数据流。其他实施例中,核505可使用全局高速缓存580来存储地址查询表或任何其他表或列表,流分布器可使用这些表来确定将到来的数据分组和发出的数据分组导向何处。一些实施例中,核505可以读写高速缓存580,而其他实施例中,核505仅从高速缓存读或者仅向高速缓存写。核可使用全局高速缓存来执行核到核通信。
可以将全局高速缓存580划分成各个存储器部分,其中每个部分可专用于特定核505。一个实施例中,控制核505A可接收大量的可用高速缓存,而其他核505可接收对全局高速缓存580的变化的访问量。
一些实施例中,系统575可包括控制核505A。虽然图5C将核1505A示为控制核,但是,控制核可以是设备200或多核系统中的任何一个核。此外,虽然仅描述了单个控制核,但是,系统575可包括一个或多个控制核,每个控制核对系统有某种程度的控制。一些实施例中,一个或多个控制核可以各自控制系统575的特定方面。例如,一个核可控制决定使用哪种分布方案,而另一个核可确定全局高速缓存580的大小。
多核系统的控制平面可以是将一个核指定并配置成专用的管理核或者作为主核。控制平面核可对多核系统中的多个核的操作和功能提供控制、管理和协调。控制平面核可对多核系统中的多个核上存储器系统的分配和使用提供控制、管理和协调,这包括初始化和配置存储器系统。一些实施例中,控制平面包括流分布器,用于基于数据流控制数据流到核的分配以及网络分组到核的分配。一些实施例中,控制平面核运行分组引擎,其他实施例中,控制平面核专用于系统的其他核的控制和管理。
控制核505A可对其他核505进行某种级别的控制,例如,确定将多少存储器分配给每个核505,或者确定应该指派哪个核来处理特定功能或硬件/软件实体。一些实施例中,控制核505A可以对控制平面570中的这些核505进行控制。因而,控制平面570之外可存在不受控制核505A控制的处理器。确定控制平面570的边界可包括由控制核505A或系统575中执行的代理维护由控制核505A控制的核的列表。控制核505A可控制以下的任一个:核初始化、确定核何时不可用、一个核出故障时将负载重新分配给其他核505、决定实现哪个分布方案、决定哪个核应该接收网络流量、决定应该给每个核分配多少高速缓存、确定是否将特定功能或元件分布到特定核、确定是否允许核彼此通信、确定全局高速缓存580的大小以及对系统575内的核的功能、配置或操作的任何其他确定。
F.用于经由中间装置重写数据流的系统和方法
图6A和6B描述了使用流式重写的系统的实施例。该系统可包括经由一个或多个客户机装置访问设备的一个或多个用户。设备还可以与一个或多个后端服务器通信。
进一步参考图6A和6B且具体描述,在一个实施例中,系统可包括经由一个或多个客户机访问设备的一个或多个用户。客户机可以是任何计算机,并且在一些实施例中可以是本文描述的任何计算装置100。在一些实施例中,客户机可以是设备、服务器或者任何其他计算机器。经由一个或多个客户机访问设备的用户可使用在一个或多个客户机上显示的一个或多个用户接口发出请求。在一些实施例中,客户机响应于输入到在客户机上显示的用户接口中的客户机信息而生成请求。在一些实施例中,该请求可以是HTTP请求。
设备可以是任何设备,且在一些实施例中可以是本文描述的任何设备200。在一些实施例中,设备200可包括多核系统545。
在一个实施例中,设备可与一个或多个后端服务器通信。在一些实施例中,后端服务器可以是任何服务器。在另一个实施例中,后端服务器可以是本文描述的任何服务器。在一些实施例中,后端服务器可接收HTTP请求并且生成和发出HTTP响应。当接收到HTTP响应时,设备可将该HTTP响应转发到一个或多个客户机。
图6A描述其中可由设备执行重写的系统的实施例。在本实施例中,重写可包括用短语或模式“https”替换短语或模式“http”。在一些实施例中,当在设备上接收到数据分组时,设备可重写它们。在重写分组时,设备可将分组转发到后端服务器。在其他实施例中,当在设备上接收到由客户机发出的HTTP请求时,设备可重写它们。当重写HTTP请求时,设备可将请求转发到后端服务器。
在一些实施例中,由设备重写的内容可以是由一组动作所部分限定的内容。可由在设备上配置的一组策略来触发这些动作。例如,动作可指示需要用短语或模式“HTTPS://”来替换在响应主体中出现的所有短语或模式“HTTP://”。在一些实施例中,接着设备可将每个响应主体复制到缓冲区、解析主体得到所需的模式,并且重写包括所需模式的响应的部分。尽管图6A和6B描述了指定重写单个模式或短语的单个动作,但重写处理可包括多个动作,其中每个动作可指定将要由设备重写的一个或多个模式或短语。在多个实施例中,设备在重写所指示的模式之前解析分组、响应或请求的主体。
图6B中描述了其中使用界线字节(barrier byte)的系统的一个实施例。在一些实施例中,设备可连续重写分组、响应和/或请求,直到达到界线字节量。在一些实施例中,界线字节可以是可由设备保存的最大量分组的总和。尽管在一些实施例中该界线字节的值可以是固定值,但在其他实施例中,可基于系统的特征自动地配置界线字节的值。在一些实施例中,可通过在设备上启动一个或多个控制来配置界线字节的值。在其他实施例中,可经由设备显示屏上的管理接口来配置界线字节的值。
图6C中描述的是用于重写穿过客户机102和服务器106中间的装置的内容流的系统600的一个实施例。简要概括,该系统包括在客户机102和服务器106中间的装置200。客户机可以是本文描述的任何计算装置。系统600可包括一个或多个客户机。服务器可以是本文描述的任何计算装置。系统600可包括一个或多个服务器或者位于服务器群中。装置200可拦截通过网络104在客户机102和服务器106之间通信的请求610和响应615。设备可包括应用防火墙290,其可以包括解析器620、分组引擎548、重写缓冲器625、重写器(rewriter)630、动作635和数据库640。在一些实施例中,可在设备200上但是在防火墙290之外存储这些组件中的一个或多个。在一些实施例中,数据库管理器可驻留在设备200上。在一些实施例中,数据库管理器可驻留在设备200上,但是在应用防火墙290之外。在一些实施例中,系统600包括用于存储数据库640的一个或多个存储装置。
尽管可将本文描述的一些步骤视为由应用防火墙290或设备200,或者由防火墙290或装置200的某个组件或模块执行,但应理解,在各个实施例中,系统600的任何一个或多个组件或模块可执行相同或实质相同的步骤,而不会脱离本发明的精神和范围。此外,尽管就数据库进行概括描述,但应认识到本系统和方法可对允许存储所标识的模式的任何适当的数据结构进行操作。
设备或装置200可以是数据处理、管理或存储系统600的任何装置或组件。装置200可以是设备、网关或者在一个或多个客户机102和/或一个或多个服务器106之间的中间装置。在一些实施例中,装置200是接收或发送一个或多个消息677的客户机102或者服务器106的部分。在各个实施例中,装置200可包括上文中结合图1A-1H、2A-2B、3、4A-4C和5A-5C描述的计算装置100、102和/或服务器106的任一实施例的一个或多个特征。举例来说且并不意在进行限制,在下文中装置200有时被描述为在应用防火墙处理环境中的防火墙290。
应用防火墙290可包括任何类型或形式的硬件和/或硬件和软件的组合。应用防火墙290可包括任何应用、程序、库、脚本、进程、任务、线程或者在系统的任何处理器或核上执行的任何类型和形式的可执行指令。应用防火墙290可包括一个或多个模块,包括解析器620、重写缓冲器625、重写器630、动作635、数据库640和数据库管理器。这些模块中的任何一个或多个可具有或者继承应用防火墙290的一些属性。这些模块中的任何一个或多个可包括应用防火墙290的某些部分,例如硬件或者硬件和/或软件的组合。应用防火墙290可接收来自下列任何一个或多个的一个或多个请求610或者响应615、通信、分组和/或命令:用户、程序、处理模块和其他装置(例如,客户机102和/或服务器106)。
应用防火墙290可包括用于接收请求610或响应615,和/或向目的地(例如服务器106)重传请求610或响应615的收发器。应用防火墙290可接收来自多个装置的请求610或响应615,并且可处理在任何两个或更多装置之间的、在任何方向上的请求610或响应615(即提供双向支持)。可将应用防火墙290设计、构造和/或配置为接收、拦截、重定向、重新路由、过滤或者以其他方式处理请求610或响应615。应用防火墙290可经由解析器620从一个或多个请求610或者响应615中识别、提取或推断一个或多个模式。
请求610或响应615可以是使用任何标准、专有和/或定制协议的任何类型或形式的通信。请求610或响应615可以是装置之间的通信或者是装置模块之间的通信的部分。请求610或响应615可包括命令、头部信息、有效载荷、证书、认证信息、用户信息以及任何其他类型的事务信息或内容。
可将解析器620设计、构造和/或配置为提取、解析、推断、识别或者以其他方式处理来自请求610或响应615的分组或者任何内容。解析器620可包括硬件或者软件和硬件的任何组合。解析器620可包括应用、程序、库、脚本、进程、任务、线程或者在装置200的一个或多个处理器或核上执行的任何类型和形式的可执行指令。在一些实施例中,解析器620是通用或者多语法/语言解析器620。在其他实施例中,将解析器620设计和构造为处理或者分析任何一种或多种特定类型的信息。在一些实施例中,解析器620可解密、解压缩、执行协议转换或者以其他方式处理接收的请求610或响应615。
重写缓冲器625可包括硬件或者硬件和软件的任何组合。重写缓冲器625可存储在设备200上。在一些实施例中,重写缓冲器625可以是应用防火墙290的组件。在一些实施例中,重写缓冲器是用于存储识别的分组的存储缓冲器。在一些实施例中,重写缓冲器是存储包括分组的数据结构的存储缓冲器。在一些实施例中,重写缓冲器625可具有预定的大小阈值。在一些实施例中,在制造时确定重写缓冲器625的预定的大小阈值。在一些实施例中,由系统600的管理员设置该预定的大小阈值。在一些实施例中,可在与设备200关联的存储装置上存储重写缓冲器625。
可将重写器630设计、构造和/或配置为修改、更新、生成、识别或者以其他方式处理来自请求610或响应615的分组或者任何内容。重写器630可包括硬件或者软件和硬件的任何组合。重写器630可包括应用、程序、库、脚本、进程、任务、线程或者在装置200的一个或多个处理器或者核上执行的任何类型和形式的可执行指令。在其他实施例中,将重写器630设计和构造为处理或者分析任何一种或多种特定类型的信息。在一些实施例中,重写器630可使用由装置200提供的一个或多个标识的模式来为所识别的分组生成新分组。在一些实施例中,重写器使用第一模式来识别分组中要重写的内容。接着重写器630使用来自所识别的分组的数据创建新分组,并且替换第一模式。在一些实施例中,由第二模式替换第一模式。在一些实施例中,重写器用用户提供的内容来替换第一模式。在一些实施例中,重写器用由装置的动作、规则或策略提供的内容来替换第一模式。在一些实施例中,重写器完成新分组的生成并且删除现有的分组。
在一些实施例中,重写器630修改现有分组。重写器630接收将被修改的分组,并且使用由装置200提供的模式来识别将被修改的分组的内容。在一些实施例中,重写器630使用由装置200标识或提供的模式来识别将被修改的内容。在一些实施例中,重写器630删除所识别的内容。在一些实施例中,重写器替换所识别的内容。在一些实施例中,重写器630用由装置200提供的另一个模式来替换所识别的内容。在一些实施例中,重写器630用用户提供的信息来替换所识别的内容。在一些实施例中,重写器630使用在装置的动作、规则或策略中提供的内容替换所识别的内容。
可由任何应用、程序、库、脚本、任务、服务、进程或者在任何类型和形式的硬件上执行的任何类型和形式的可执行指令来表示或执行动作620。在一些实施例中,动作620可以是用于执行本文描述的任何操作和功能的电路的任何设计和构造。在一些实施例中,动作620可包括在设备200上的一组可执行指令。在另一个实施例中,动作620包括在与设备200通信的计算机器102、106上执行的一组可执行指令。在一些实施例中,动作620是在NIC(例如固件)上执行的一组可执行指令。在其他实施例中,动作620包括软件和硬件任何组合,以处理从客户机102或服务器106拦截的网络分组。动作620可指定将要执行的一组可执行指令。动作620的示例可包括但不限于:生成新分组、从重写缓冲器625移除分组,以及将来自多个分组的数据流存储到重写缓冲器625。
可将数据库640设计、构造和/或配置为存储来自请求610或响应615的分组或者任何内容的标识的模式。数据库640可包括硬件或者软件和硬件的任何组合。可在设备200上存储数据库640。在一些实施例中,数据库640可以是存储信息的任何手段,例如表、哈希表或矩阵。在一些实施例中,可在存储装置上存储数据库640。在一些实施例中,可在服务器106上存储数据库。
装置200的数据库管理器可接收来自解析器676的一个或多个字符串。数据库管理器可接收、存储、生成或者修改经由任何类型或形式的通信的数据库查询,例如,经由核到核消息传送(CCM),其中一个核执行解析器620而数据库管理器包括另一个核。可将数据库管理器设计、构造和/或配置为管理从响应615或请求610中提取的所标识的模式的数据库640。数据库管理器可将标识的模式评估、计算、翻译、转换或者以其他方式处理为查询。数据库管理器可使用、采用、调用或者执行任何算法、方法、公式、函数、转换装置、程序、脚本或命令,来将标识的模式处理为数据库查询。数据库管理器可处理每个标识的模式,以在数据库查询中使用。
图7中示出的是描述用于执行流式重写的方法的一个实施例的流程图。在一些实施例中,设备200对压缩的一组分组进行解块,使得设备200可访问每一个单独分组。设备200上的数据库640可存储一个或多个感兴趣的模式。在一些实施例中,可在规则或动作635中限定这些模式。可将规则和/或动作635称作panstr模式,并且规则和/或动作635可标识用来进行重写的一个或多个模式或短语。可将这些模式和/或短语称作感兴趣的模式。
在一些实施例中,存储模式、短语、动作635和/或规则的数据库640可以是媒介(panner)数据库640。在一些实施例中,可在设备200的协议控制块内包括该数据库640。在其他实施例中,媒介数据库640可以是存储用于执行本文描述的方法和系统的信息的任何数据库、表和/或列表。在其他实施例中,由协议控制块而不是媒介数据库640存储将对解块的分组采取的动作635。在一些实施例中,协议控制块可以是可管理设备与客户机102和/或服务器106的连接的连接管理结构。
在从媒介数据库640检索到感兴趣的模式时,设备200可针对一个或多个感兴趣的模式解析每个分组的主体。在一些实施例中,当设备200识别了一个模式,该设备200用由媒介数据库中的动作6350标识的新模式重写该模式。在一些实施例中,可缓冲重写后的分组、可应用额外编辑,并且可将分组重新组合到一起。在一些实例中,设备200可在重新组合分组前,将编辑后的分组重新映射到TCP套接字或端口。
图8A中描述的是用于执行流式重写的方法800的一个实施例。设备可对一组分组进行解块(步骤805)并且识别动作或规则,该动作或规则进一步识别一个或多个搜索模式(步骤810)。接着,在设备上执行的解析器可解析一个或多个分组的主体,以识别搜索模式(步骤815)。接着,设备可用标识的新模式来重写出现的搜索模式(步骤820),以及为重写保存部分写入响应的分组(步骤825)。接着,设备可重新组合分组,并且将重新组合的分组传输到目的地(步骤830)。
进一步参考图8A且具体描述,在一个实施例中设备可对一组分组进行解块(步骤805)。解块一组分组可包括分离一组压缩的和/或编码的分组。在一些实施例中,一组分组可与响应和/或请求相对应。在一些实施例中,解块一组分组可得到一个或多个单个分组的列表,这些分组一起构成整个响应和/或请求。在一些实施例中,解块可包括从块中的每个分组移除块头。
接着,设备可识别动作和/或规则,该动作和/或规则进一步识别搜索模式(步骤810)。在一些实施例中,可在设备200上存储动作和/或规则。在其他实施例中,可在设备200上的媒介数据库640内存储动作635和/或规则。在一个实施例中,动作和/或规则635可挂在设备200的协议控制块。由动作和/或规则635识别的搜索模式可包括要替换的模式,以及要覆写老的模式的新模式。例如,这些模式可以是:用“https://”替换“http://”的指示、用“xyz.com”替换“abc.com”的指示,以及用“修改的”替换“文本”的指示。因此,搜索模式可包括字母、数字和符号的任何组合。在一个实施例中,数据库640可包括多于一个的动作和/或规则。在其他实施例中,动作和/或规则可标识一个或多个搜索模式。
在识别了一个或多个搜索模式时,在设备上执行的解析器可针对所识别的搜索模式解析每个分组的主体(步骤815)。在一些实施例中,解析器可解析响应或请求的主体。在其他实施例中,解析器可在针对模式解析分组的同时,获得关于模式的信息。解析器可将获得的模式信息存储到媒介数据库中。
在一个实施例中,设备可重写响应和/或分组,以便用新识别的模式来替换搜索模式(步骤820)。例如,可用模式“123”来替换模式“abc”。在一些实施例中,可在查找媒介数据库之后执行重写动作。在为特定响应和/或分组在媒介数据库中识别了模式信息时,设备可重写该响应和/或分组,或者设备可更新媒介数据库并且对搜索模式的任何实例执行重写。
在一些实施例中,可为重写保存至少部分响应(步骤825)。保存的响应的大小可与配置的界线字节相对应。尽管图8描述了保存分组的方法800,但在在一些实施例中,对于将要发生的重写,不需要保存响应的任何部分。实质上,无论响应中有多少可用于重写,可执行所有重写动作。在一些实施例中,当由保存的分组占用的存储器的量超过界线字节限制时,可释放保存最久的分组从而空出存储器。
在一些实施例中,在重写了分组时,设备可重新组合分组并且将重新组合的分组传输到目的地(步骤830)。在一些实施例中,当采用传输编码时,可解块和/或重新组合分组。在一些实施例中,重新组合可包括向块中的每个分组添加修改的块头。在一些实施例中,设备可在重新组合分组之前,执行分组到TCP套接字或端口的TCP重新映射。在一些实施例中,目的地可以是任何计算机、客户机、服务器、设备和/或计算装置。
现参考图8B,示出了描述用于重写穿过客户机和服务器中间的装置的内容流的方法850的流程图。简要概括,在步骤852,在客户机和服务器中间的装置识别要匹配的多个模式,其用于重写由装置接收的内容流。在步骤854,装置通过对分组内容的单次解析,执行多个模式和分组内容的匹配。在步骤856,装置将匹配结果存储到与连接关联的数据库。在步骤858,装置将分组存储到具有预定的大小阈值的重写缓冲器,其中该重写缓冲器用于存储要在传输前重写的分组。在步骤860,装置响应于确定重写缓冲器的大小超过了该预定的大小阈值,来执行重写。装置基于对数据库中最老的分组执行匹配的结果,来对从重写缓冲器移除的最老分组执行重写。在步骤862,装置传输重写的最老的分组。
仍参考图6B且详细描述,在步骤852,在客户机和服务器中间的装置识别要匹配的多个模式,其用于重写由装置接收的内容流。在一些实施例中,装置利用有效多模式搜索算法来识别多个模式。装置可将这些模式存储到媒介数据库640中。在一些实施例中,装置响应于多个模式的识别来生成动作。在一些实施例中,装置将识别的模式合并到现有动作和/或规则中。在一些实施例中,在媒介数据库640中存储更新的动作或规则。如果所识别的模式先前还没有被识别过,则装置将所识别的模式存储到媒介数据库640中。如果在先前的模式识别中已经识别了所识别的模式,那么不更新媒介数据库。在一些实施例中,装置200解析接收的http请求610以识别模式。在一些实施例中,装置200解析接收的http响应615以识别模式。在一些实施例中,装置200解析接收的http请求610或响应615的主体,并且将任何识别的模式与现有规则或动作635比较。在一些实施例中,装置可以将识别的模式添加到规则或动作635中的现有模式。在一些实施例中,装置可以用识别的模式替换规则或动作635的现有模式。在一些实施例中,装置200可以用包括一个或多个识别的模式的新生成的规则或动作来替换现有规则或动作635。在一些实施例中,装置可通过多个分组来接收来自服务器106的、对客户机102的请求610的响应615。在一些实施例中,多个分组中的每个分组的有效载荷包括响应615的主体的部分。在一些实施例中,可在单个分组中识别响应615的主体。在一些实施例中,请求610的主体可包括多个分组的主体的部分。在一些实施例中,可在单个分组中识别请求610的主体。
在步骤854,装置200通过分组内容的单次解析来执行多个模式与分组内容的匹配。在一些实施例中,装置将识别的模式与单个分组的内容进行匹配或比较。在一些实施例中,可在单个分组中识别多个模式。在一些实施例中,可在单个分组中找到多个模式中的单个模式。在一些实施例中,在单个分组中可能找不到多个模式中的任何所识别的模式。在一些实施例中,装置200应用解析接收的分组的有效多模式搜索算法。通过应用多模式搜索算法,系统600可在搜索多个模式时在单次扫描(single pass)中处理分组。在一些实施例中,规则或动作635可包括多个模式。可将规则或模式635应用于分组,并且可在分组内搜索规则的多个模式。在一些实施例中,可将各自包括多个模式的多个规则或动作635组合到单个查询中,并且可在单次扫描中在分组中搜索来自该多个规则或动作635的所有模式。
在一些实施例中,系统可采用多模式搜索算法。在一些实施例中,系统600可并发或同时采用多个算法。在一些实施例中,系统600可采用Boyer-Moore字符串搜索算法或者Boyer-Moore算法的一些变形。在Boyer-Moore算法中,如本领域公知的,该算法可反向操作对于检查特定位置处是否存在匹配的验证或者尝试。在检查给定字符串的最后字符之后,如果验证失败,则算法可向前跳并且开始寻找在文本指定或确定位置终止的匹配。算法可预先计算两个表以处理其在每次失败的验证中获得的信息。第一个表包括关于基于导致匹配尝试失败的字符标识,向前多少位置来开始下一搜索的信息。第二个表包括基于在匹配尝试失败之前成功匹配了多少个字符的计算。当发生不匹配时,该算法可移动两个跳转值中较大的那个值。
在一些实施例中,系统600可采用Wu-Manber字符串搜索算法或Wu-Manber算法的一些变形,该Wu-Manber算法是对Boyer-Moore算法的改进。如本领域公知的,Wu-Manber算法是采用以下三个表的多阶段算法:移动(SHIFT)表、哈希(HASH)表和前缀(PREFIX)表。与Boyer-Mo ore算法一样,反向操作对于检查在特定位置是否存在匹配的验证或者尝试。在扫描文本时,转换表用于确定可移动或跳过文本中的多少字符。哈希和前缀表用于为匹配确定哪个模式是候选模式,并且验证该匹配。
在一些实施例中,装置200可将分组存储到数据结构。在一些实施例中,装置200仅在分组包括识别的模式的匹配模式时,将该分组存储到数据结构。在一些实施例中,解析器620解析所有接收的分组,并且无论是否存在识别的模式,将解析结果存储到数据结构中。在一些实施例中,装置200立即将接收的分组存储到数据结构,而不解析该分组。在一些实施例中,装置200执行数据结构的内容的单次解析,以在单次扫描中匹配多个模式和内容。
在步骤856,装置将匹配的结果存储到与连接关联的数据库。在一些实施例中,装置200将匹配的结果存储到与用户的用户会话关联的数据库。在一些实施例中,装置200将匹配的结果存储到在装置200上存储的数据库640。在一些实施例中,装置200将匹配的结果存储到在通过网络104访问的另一装置上存储的数据库640。在一些实施例中,装置200将结果存储到表、哈希表、矩阵或者其他数据存储结构。在一些实施例中,数据库640可以是SQL数据库。在一些实施例中,数据库640可使用多个识别的模式生成单个查询。在一些实施例中,装置200可响应于识别的动作635来生成新查询。在一些实施例中,装置200可以为每个标识的模式生成新查询。在一些实施例中,装置200可使用多个识别的模式来更新现有查询。在一些实施例中,查询与动作635相关联。在一些实施例中,可将查询存储到装置200上。在一些实施例中,可由数据库管理器生成查询。数据库管理器可存储在设备200上。在一些实施例中,数据库管理器可在应用防火墙290内执行。在一些实施例中,数据库管理器可在应用防火墙290的环境之外执行。在一些实施例中,数据库管理器可以为任何识别的模式生成、更新和存储所有查询。在一些实施例中,在装置200上存储查询。在一些实施例中,在不同的装置上存储查询。
在步骤858,装置将分组存储到具有预定的大小阈值的重写缓冲器,该重写缓冲器用于在传输前存储要重写的分组。在一些实施例中,装置200仅将具有识别的模式的分组存储到重写缓冲器625。在一些实施例中,装置200响应于设备200的动作635或者策略将分组存储到重写缓冲器。在一些实施例中,重写缓冲器625具有预定的大小阈值来存储数据。在一些实施例中,在制造时确定重写缓冲器625的预定的大小阈值。在一些实施例中,可由系统管理员修改重写缓冲器625的预定的大小阈值。在一些实施例中,可由系统的用户修改重写缓冲器625的预定的大小阈值。
在步骤860,装置响应于确定重写缓冲器的大小超过了预定的大小阈值,来执行重写。装置基于对数据库640中最老的分组执行的匹配结果,来执行对从重写缓冲器625移除的最老分组的重写。在一些实施例中,由与分组关联的时间戳来确定最老的分组。在一些实施例中,将时间戳存储到保存分组的数据结构。在一些实施例中,根据分组存储到重写缓冲器625中的顺序来确定最老的分组。在一些实施例中,根据装置200在将分组存储到重写缓冲器625之前完成对该分组的处理的时间来存储分组,而不是根据时间戳来存储分组。在一些实施例中,装置200从重写缓冲器625移除一个或多个最老的分组,直到在重写缓冲器625中存储的数据低于预定的大小阈值。在一些实施例中,响应于装置的触发动作635从重写缓冲器中移除最老的分组。在一些实施例中,响应于装置200的策略从重写缓冲器中移除最老的分组。在一些实施例中,一旦达到预定阈值,则重写缓冲器不允许装置200将数据存储到重写缓冲器。在一些实施例中,装置200响应于不能将数据存储到重写缓冲器635,而从重写缓冲器移除最老的一个或多个分组,直到具有将拒绝的分组存储到重写缓冲器625的足够空间。
在一些实施例中,装置200在数据库640中查找与将要重写的匹配模式相对应的分组中的偏移。在一些实施例中,装置200根据指定要匹配的第一模式、用于替换第一模式的第二模式以及用以搜索模式的响应主体的多个字节的动作635来执行写入。在一些实施例中,装置200修改现有动作以识别主体中的模式,以及用第二模式替换所识别的模式。第二模式可以是来自先前识别的另一个识别的模式。在一些实施例中,第二模式可以是用户指定的模式。在一些实施例中,第二模式可以是来自数据库640的现有模式。在一些实施例中,第二模式可以是由装置200的第二动作635、规则或策略提供的模式。在一些实施例中,第二模式可包括多个识别的模式。
在步骤862,装置传输重写的最老分组。在一些实施例中,装置200将重写的最老分组传输到客户机102。在一些实施例中,装置200将重写的最老分组传输到服务器106。在一些实施例中,装置200根据装置200的策略延迟传输重写的最老分组。在一些实施例中,装置200立即将重写的最老分组传输到其目的地。在一些实施例中,装置200将重写的最老分组传输到在数据结构中存储的目的地。在一些实施例中,装置响应于装置200的策略、动作635或规则,重新路由重写的最老分组。在一些实施例中,装置200将重写的最老分组传输到之前在分组的头部中存储的目的地。在一些实施例中,装置200在将最老的分组从重写缓冲器625移除时,重写每一个最老的分组。在一些实施例中,重写器630从重写缓冲器625移除最老的分组,并且使用识别的模式修改或者重写该分组。在一些实施例中,重写器630响应于设备200的动作635、策略或规则重写最老的分组。在一些实施例中,重写器通过重写主体的部分来更新现有分组。在一些实施例中,重写器630使用来自从重写缓冲器625移除的最老分组的信息来生成新分组、删除从重写缓冲器625移除的最老的分组,并且将新生成的分组传输到其目的地。在一些实施例中,如果装置200确定分组不包括任何识别的模式,则重写器630不会修改或更新现有的最老分组或者生成新分组。
G.用于经由中间装置重写包含UTF-8编码的数据流的系统和方法
现参考图9A-9C,将描述有效地处理、搜索和/或重写可变宽度编码数据的系统和方法,其中可变宽度编码数据例如是UTF-8编码数据。系统和方法的实施例修改和改写搜索算法(例如Horspool和Wu-Manber算法),以便有效地处理和管理在大块文本中对可变宽度编码数据的搜索,该文本例如是可经由通过网络装置(如中间装置)的分组流传输的文本。
图9B和9C描述的是用于UTF-8编码数据的搜索技术的方法的实施例。图9A中描述的是用于对UTF-8编码数据执行任何搜索技术的系统的实施例。
现参考图9A,示出了用于执行本文描述的多变量编码搜索技术的任何实施例的系统的实施例。简要概括,装置102可包括搜索引擎970。装置可接收或获得包括多变量编码数据(例如UTF-8)的文本块980。装置可接收或获得多变量编码数据的搜索模式/字符串982,以由搜索引擎在文本块980内搜索。搜索引擎可实现或包括修改的HorSpool972组件或引擎,用于对本文描述的多变量编码数据执行任何修改的HorSpool搜索技术。搜索引擎可实现或包括修改的Wu Manber974组件或引擎,用于对本文描述的多变量编码数据执行任何修改的Wu Manber搜索技术。搜索引擎可使用组件972和974中的任一个在文本块980内搜索所述搜索字符串982。搜索引擎可利用指向在(例如在存储器中存储的)文本块980内的定位或位置的指针990,并且响应于跳转/索引表986或表988(如移动、哈希或前缀表)将指针移动到支点984。
装置102可以是客户机或者服务器装置。装置可以是本文描述的设备的任何实施例。系统可包括经由客户机装置访问设备的一个或多个用户。设备还可以与一个或多个后端服务器通信。用于执行图9B和9C的任何方法的系统可以是本文描述的任何系统,例如上文的H部分中描写的流式重写设备的任何实施例。
装置可接收、识别或处理文本块980。文本块可以是一大块文本。文本块可包括大于预定阈值的大小(以字节、单词等为单位)。文本块可包括任何类型和形式的多变量编码数据,例如UTF-8数据。文本块可以是来自任何一个或多个网络分组的有效载荷的数据。文本块可包括应用层数据,例如经由传输层分组传输的HTTP或HTML数据。文本块可以是由H部分中描述的重写系统和方法的任何实施例重写的数据。
装置可接收、识别或处理搜索模式或字符串983,以在文本块内进行搜索。搜索模式或字符串可包括任何数量的字符或符号。搜索模式或字符串可包括任何长度。搜索模式或字符串可包括任何类型和形式的多变量编码数据,例如UTF-8数据。搜索模式或字符串可以是在任何一个或多个网络分组的有效载荷中寻找或识别的字符串或模式。搜索模式或字符串可以是确定是否在文本块内的字符串或模式,例如在任何一个或多个网络分组的有效载荷内。搜索模式或字符串可包括由设备在穿过该设备的网络分组流中识别的任何字符串或模式。搜索模式或字符串可包括先前由设备从穿过该设备的网络分组流中识别的和/或存储的任何字符串或模式。搜索模式或字符串可以是要由H部分中描述的重写系统和方法的任何实施例在文本块中重写的模式或字符串。
装置可经由请求接收文本块和搜索字符串。装置可例如通过搜索引擎接收经由API调用的请求。装置可例如通过搜索引擎接收经由应用层命令(例如经由HTML)的请求。在一些实施例中,搜索引擎在设备的实施例中运行。在这些实施例中,设备例如通过分组引擎经由API调用、程序指令等使用或集成搜索引擎,以在文本块中搜索所述搜索字符串/模式。在一些实施例中,在AppFw290的实施例中运行搜索引擎。在这些实施例中,AppFw可例如经由API调用、程序指令等使用或者集成搜索引擎,以在文本块内搜索所述搜索字符串/模式。
搜索引擎970可包括应用、程序、库、进程、服务、任务或者在装置上执行的任何类型和形式的可执行指令。可将搜索引擎设计和构造为执行任何搜索和/或重写技术以及本文描述的实施例。搜索引擎可使用指向在文本块内的定位或位置的指针990,例如指向存储器地址的指针。搜索引擎可将指针在文本块内向前或向后移动。例如,搜索引擎可响应于跳转表,将指针从一个位置/地址跳转到文本块中的另一个地址/位置。搜索引擎可将指针跳转或移动到支点块、指针或元素984,其是文本块中的一个点。可根据本文描述的搜索技术的实施例来限定和使用支点块584。搜索引擎可在支点元素984处应用搜索技术或者其部分。可根据搜索技术响应于索引或表,使用跳转表或其他表来标识支点或支点块。
搜索引擎可包括Horspool搜索引擎972组件或模块。可将Horspool搜索引擎修改为对多变量编码数据(例如UTF-8编码数据)执行任何修改的Horspool搜索技术。Horspool引擎可使用索引或跳转表986,用于根据修改的Horspool搜索技术来存储信息。跳转表可包括到统一码(Unicode)值的哈希,其标识字符的多个字节长度。在一些实施例中,跳转表可包括到每个相应的小写统一码值的哈希,其标识相应字符的多个字节长度。
搜索引擎可包括Wu Manber搜索引擎974组件或模块。可将Wu Ma nber搜索引擎修改为对多变量编码数据(例如UTF-8编码数据)执行任何修改的Wu Manber搜索技术。WuManber引擎可使用表988,用于根据修改的Wu Manber搜索技术存储信息。Wu Manber算法、组件或引擎可使用三个表988:移动表、哈希表和前缀表。与Boyer-Moore算法一样,反向操作对检查特定位置处是否存在匹配的验证或者尝试。在扫描文本时,移动表用于确定可移动或跳过文本中多少个字符。哈希和前缀表用于为匹配确定哪个模式是候选模式,并且验证该匹配。
UTF-8编码是关于统一码的多字节字符编码。由于行业主要使用UTF-8,所以需要能够在大块文本中搜索多个UTF-8编码模式的系统。能够执行多模式匹配的当前系统不能对编码文本执行这样的搜索。说明书以下部分提供了能够对UTF-8编码文本执行多模式搜索的机制。
Wu Manber搜索引擎组件可包括对多变量编码数据(例如UTF-8编码数据)执行改写的、配置的或者修改的Wu Manber基础搜索技术的可执行指令。在一些实施例中,WuManber搜索引擎组件使用以下算法来同时搜索由UTF-8编码的区分大小写的多个模式。P={p1,p2,…,pk}表示一组模式,是来自固定字母表的字符的串,每个pi是一个字符串。lmin表示以字节计的P中模式的最小长度,且lmax表示以字节计的P中模式的最大长度。T={t1,t2,…tN}是包括与P相同的固定字母表的字符的大文本。M是所有模式的总的大小,其中M=k*lmin,且c是固定字母表的大小。系统使用三个字节B的块,以通过生成表来预处理模式。在一些实施例中,B可包括少于三个字节的块。在一些实施例中,B可包括四个字节的块。
如果文本中B个字节的字符串没有出现在任何模式中,则搜索移动lmin-B+1。将每个大小为B的字符串映射到用作对移动表的索引的整数。移动表中的值确定在扫描T时移动多远。设X=x1...xΒ为正被扫描的文本中的B个字符,并且X被映射到移动表的第i个条目。有两种情况:
·如果X没有作为P中任何模式中的子串出现,则搜索移动(lmin-B+1)个字节。系统在SHIFT[i]中存储(lmin-B+1)。
·如果X作为P的某些模式的子串出现,则标识在任何模式中最右边出现的X。如果X在Pj的位置q处结束,并且假设X不在任何其他模式中大于q的任何位置处结束。则在SHIFT[i]中存储lmin-q。
为计算移动表,分别考虑每个模式pi=a1a2...almin。将大小为B的pi的子串aj-b+1…aj映射到移动表,且将相应的值设置为其当前值(所有子串当前值的初始值为lmin-B+1)和lmin-j(得到该子串需要移动的量)中的最小值。在搜索阶段期间,只要移动(SHIFT)值为正,则沿文本移动搜索位置。当移动值为零时,到搜索位置左边的文本可能是一个模式字符串。
正是同一个整数索引到另一个表,称作哈希。哈希表的第i个条目HASH[i]包括指向模式列表的指针,该模式最后B个字符哈希到i。哈希表仅保存模式,而移动表保存大小为B的所有可能的字符串。
在一些实施例中,系统或搜索引擎可能需要在文本中跳转。为保持次线性运行时间复杂度,使用字节跳转而不是字符跳转。这可导致跳转到字符的中间。在一些情况下,这样有助于确定不存在匹配。在一些实施例中,当跳转到字符的中间时,系统转到字符的开头,并且继续进行该系统。
最初,获取所有模式的最小字节长度,且系统在文件中跳转最小模式。从该位置使用最后三个字节来计算哈希值。
现参考图9B,描述改写的或修改的Wu Manber搜索技术的实施例。简要概括,方法900包括设置指向标识文本的开头的指针990(在步骤902)。在步骤904,通过获取最小字节长度以及将指针移动到(lmin-B),来将指针移动到支点块984。在步骤906,使用支点块中预定数量的字节来计算哈希值,并且根据该哈希确定跳转值986。在步骤908,确定跳转值是否等于零。如果不等于零,则在步骤912将跳转值设置为1。如果等于零,则在步骤910检查标识的模式,以查看是否找到任何模式匹配。接着,在步骤912将跳转值设置为1。在步骤914,确定是否已经到达文本的结尾。如果没有到达结尾,则方法返回步骤906并且继续,直到到达文本的结尾。如果已经到达文本的结尾,那么在步骤916终止搜索。
在步骤902,将指针990设置到文本的开头。指针可以是指向文本块内的地址或位置的指针,例如指向存储器地址的指针。在一些实施例中,将指针设置为指向整个文本的开头。在其他实施例中,将指针设置为指向由用户标识的文本部分的开头。在一些实施例中,将指针设置为指向文本的开头,其中该文本已经被分为多个部分。
在步骤904,通过在所有模式之中取最小字节长度(lmin)以及将指针移动到由(lmin-B)找到的位置,来将指针990移动到支点块984。在一些实施例中,将B预定为3字节。在其他实施例中,B可以是任何预定的大小。在其他实施例中,B大小可变。
在步骤906,为支点块计算哈希值。找到包含支点块的字节的最小有效UTF-8字符串,并且将该字符串转换为小写。根据该小写字符串,找到支点块的准确字节位置,并且为每个字节计算哈希值。接着根据哈希确定跳转值。
在步骤908,确定跳转值是否等于零。如果跳转值等于零,则在步骤910咨询哈希表。哈希表在零处包含具有零跳转的模式列表。接着检查每个模式,以查看是否存在到支点块的任何匹配。该搜索可能需要基于模式长度以适当的长度扫描文本。如果文本中的位置没有到字符边界,则甚至可以在比较任何字符之前可跳过该模式。如果文本中的位置在字符边界处,则执行不区分大小写的UTF-8字符串比较,以检查模式是否匹配文本的部分。如果其匹配,则公布对该字符串的匹配。系统继续匹配模式列表中的其他字符串,直到用尽关于该哈希的列表。
在步骤912,将跳转值设置为1。搜索继续且系统根据跳转值在文本中进行跳转。如果跳转超过文本边界,则在步骤914公布没有更多的匹配。否则,通过获取B的大小且将支点块更新为在指针处的大小为B(例如三个字节)的最后字节来更新支点块,并且返回步骤906来继续搜索直到到达文本的结尾。
现参考图9C,描述了用于对多变量宽度编码数据(例如UTF-8)使用改写的、配置的或修改的Horspool多模式搜索的方法。简要概括,该方法950在步骤952设置指向文本开头的指针。在步骤954,基于模式长度和最后字符长度在文本中将指针移动到其支点元素。在步骤956,比较支点元素的转换的小写统一码值与模式的最后字符的相应值。在步骤958,确定是否存在匹配。如果存在,则在步骤960公布匹配位置。如果不存在,则在步骤962,系统例如经由搜索引擎,根据当前支点元素的跳转值在文本内跳转。在步骤964,确定是否到达文本结尾。如果到达结尾,则在步骤968终止搜索。如果没有到达结尾,则返回步骤956并且继续搜索,直到到达文本结尾且搜索终止。
多模式搜索950执行模式预处理,作为确定如果初始匹配尝试失败则在搜索文本中向前跳多远的手段。在搜索处理期间使用的矢量中保存预处理的结果。字符的跳转值是其距离结尾的位置(不考虑最后字节)。如果模式中字节重复,则取最小位置。比较模式的最后字节与文本中的相应位置。基于该文本字符跳转,其中该文本字符被认为是支点字符。
对于模式中每个UTF-8字符,计算相应的统一码值。如果字符是大写的,则计算相应的小写统一码值。不论哪种情况,在统一码值上应用哈希。由于UTF-8字符可以最多有4个字节,所以维护四个哈希表988,每个大小一个哈希表(基于统计分析、空间限制和哈希冲突,该数可以减少或增加)。如果存在哈希冲突,则跳转值应该是两者中的最小值。这是因为,在不存在任何哈希冲突时,字符的跳转值确保在跳转之后文本的支点字符与模式中的相同字符对齐。没有该对齐,系统不能识别任何匹配。在冲突的情况下,通过获取现有值和新值中的最小值,跳转可能不会使文本中的支点与模式中的相同字符对齐,但是其确保不会漏掉匹配。可以通过从后处理而不是从前处理模式,来容易地实现获取两个哈希值中的最小值。
在跳转表中,字符的跳转值是其在模式中距离后面的位置。但是如果保持跳转表986中的字符位置,则系统可能必须在UTF-8文本中跳转那些字符,并且系统将变为字符接字符的匹配,该匹配的效率非常低。因此,不保持字符在模式中的位置。相反,在一些实施例中使用相应的字节长度。那样,当使用这些值在文本中进行跳转时,系统可以执行直接跳转而不用计算字符。
比较模式的最后字符与文本。并且如果存在匹配,则比较整个模式。要不区分大小写地比较两个字符,系统需要计算它们相应的小写(或大写)统一码值。由于事先已知模式,则在预处理步骤中,系统计算模式所有字符的小写统一码值,并且进行存储。还存储模式的字节长度和最后字符的长度。
方法需要在文本中跳转。为由UTF-8编码的数据保持次线性运行时间复杂度,使用字节跳转而不是字符跳转。这可能导致跳转到字符的中间。在一些实施例中,这样有助于确定不存在匹配。在一些情况下,当跳转到字符的中间时,系统转到字符的开头并且继续进行算法。
要确定支点元素,对模式的最后字符与文本中相应的字符执行不区分大小写的比较。如果模式具有5个字符,则系统需要转到文本中的第5个字符,并且将其与模式的第5个字符进行比较。但是转到文本中的第五个字符是线性时间。因此,而是使用模式的字节长度。如果模式中最后字符长度为4,并且如果模式为20个字节长,那么最后字符从第17个字节开始。另外在文本中,系统直接转到第17个字节,并且查看其是否与字符边界对齐。系统朝文本开头转到最近的对齐字符。在任何一种情况下,在文本中找到字符的小写统一码值(该值是支点元素)。在不匹配的情况下,系统从跳转表986找到其跳转值并且在文本中跳转,使得向右移动文本的比较点,并且比较该点与模式中的相应点。
在步骤952,将指针设置为指向文本的开头。在一些实施例中,将指针设置为指向整个文本的开头。在其他实施例中,将指针设置为指向由用户标识的文本的部分的开头。在一些实施例中,将指针设置为指向文本的开头,其中该文本已经被分为多个部分。
在步骤954,基于模式长度和最后字符长度,在文本中将指针移动或者跳转到其支点元素,在初始化过程中,如果任何这样的跳转转到字符的中间,则转到下一个字符。但在随后的步骤中,在任何这种没对齐的情况下,转到字符的开头。
在步骤956,比较支点元素的小写统一值与模式的最后字符的相应值。如果比较的字符相同,则比较模式的开头,并且跳转到文本中的相应字节位置,以比较模式与文本的该部分。如果在文本中可能跳转到字符的中间,其明显表示不匹配。但如果跳转到字符边界,则对两个字符串进行不区分大小写的比较。
在步骤958,确定是否存在匹配。如果存在匹配,那么在步骤960通知匹配位置。在一些实施例中,将匹配位置添加到哈希表。在一些实施例中,将匹配位置传输到另一模块。在一些实施例中,在中间装置上存储匹配位置。如果不存在匹配,则在步骤962根据当前支点元素的跳转值来移动或跳转指针。
在步骤964,确定是否已到达文本的结尾。如果已经到达,则在步骤968终止搜索。如果没有到达,则返回步骤965并且继续搜索,直到到达文本的结尾并且终止搜索。
应该理解,此处描述的系统可提供多个组件或每个组件并且这些组件可以在单独机器上提供,或者在一些实施例中,可在分布式系统的多个机器上提供。此外,上述系统和方法可作为一件或多件产品上所体现的或在其中的一个或多个计算机可读程序或可执行指令而被提供。所述产品可以是软盘、硬盘、CD-ROM,闪存卡、PROM、RAM、ROM或磁带。通常,计算机可读程序可以任何编程语言来实现,如LISP、PERL、C、C++、C#、PROLOG,或者诸如JAVA的任何字节码语言。软件程序或可执行指令可以作为目标代码被存储在一件或多件产品上或其中。
尽管已经参考具体实施例对本发明进行了详细的显示和描述,但对本领域技术人员应该理解可以在其中进行形式和细节上的各种变化而不脱离由本文公开的本发明的精神和范围。

Claims (20)

1.一种用于在文本块中对可变宽度编码模式进行不区分大小写的搜索的方法,所述方法包括:
(a)由装置为模式中的每个字符确定相应的小写统一码值,其中在文本块内为该模式搜索匹配,该模式包括可变宽度编码字符;
(b)由所述装置为所述模式建立跳转值的索引表,所述索引表包括到每个相应的小写统一码值的哈希,该哈希标识关于相应字符的多个字节长度;
(c)由所述装置响应于跳转值的索引表,基于所述模式的字节长度和所述模式的最后字符的字节长度,将指向所述文本块的指针跳转到所述文本块中的支点元素;以及
(d)由所述装置比较所述支点元素的小写统一码值与所述模式的最后字符的字符的相应小写统一码值。
2.根据权利要求1所述的方法,其中步骤(a)还包括由所述装置确定在所述模式中的字符是大写的,并且计算小写统一码值。
3.根据权利要求1所述的方法,其中所述模式包括UTF-8编码的可变宽度编码字符。
4.根据权利要求1所述的方法,其中步骤(b)还包括由所述装置为每种大小的可变宽度编码字符建立索引表。
5.根据权利要求1所述的方法,其中步骤(c)还包括由所述装置在所述文本块的开头处设置指针。
6.根据权利要求1所述的方法,其中步骤(c)还包括由所述装置确定所述指针已经跳转到所述文本块中字符的中间。
7.根据权利要求6所述的方法,还包括由所述装置响应于确定所述指针已经跳转到所述文本块中字符的中间,将所述指针移动到该字符的开头。
8.根据权利要求1所述的方法,其中步骤(d)还包括由所述装置确定到支点元素的跳转是到字符边界的跳转,并且所述装置响应于确定跳转是到字符边界而执行比较。
9.根据权利要求1所述的方法,还包括由所述装置确定支点元素的小写统一码值与所述模式的最后字符的字符的相应小写统一码值相匹配。
10.根据权利要求9所述的方法,还包括由所述装置将所述指针跳转到在所述文本块中与所述模式的开头相对应的字节位置,并且比较所述模式与由所述指针标识的所述文本块的相应部分。
11.一种用于在文本块中对可变宽度编码模式同时执行不区分大小写的搜索的方法,所述方法包括:
(a)由装置将将要在文本块内搜索的每个模式转换为相应的小写模式,每个模式包括可变宽度编码字符;
(b)由所述装置为每个模式建立转移表,该转移表包括相应的小写模式的预定数量字节的哈希以及跳转值;
(c)由所述装置响应于所述转移表,将指针跳转到所述文本块中的支点块;
(d)由所述装置标识在所述支点块内的编码字符串,其包括来自所述支点块的预定数量字节的字节;
(e)由所述装置计算与所述预定数量字节相对应的小写编码字符串的字节的哈希;
(f)由所述装置使用所述字节的哈希,从所述转移表获得跳转值。
12.根据权利要求11所述的方法,其中所述模式包括UTF-8编码的可变宽度编码字符。
13.根据权利要求11所述的方法,其中步骤(b)还包括由所述装置在每个哈希维护具有零跳转的模式的列表。
14.根据权利要求11所述的方法,其中步骤(c)还包括由所述装置基于所有模式的最小字节长度,首先将指针跳转到初始支点块。
15.根据权利要求11所述的方法,其中步骤(d)还包括由所述装置标识最小有效编码字符串,其包括来自所述支点块的预定数量字节的字节。
16.根据权利要求11所述的方法,其中步骤(f)还包括由所述装置识别所述跳转值为零。
17.根据权利要求16所述的方法,还包括由所述装置确定与为零的跳转值关联的任何模式是否与所述文本块中的相应文本相匹配。
18.根据权利要求16所述的方法,还包括由所述装置为每个模式将指向所述文本块的指针移回所述模式的多个字节长度。
19.根据权利要求18所述的方法,还包括由所述装置响应于识别所述指针不是字符边界,确定所述模式与由所述指针标识的文本的相应部分不匹配。
20.根据权利要求18所述的方法,还包括由所述装置响应于识别所述指针在字符边界处,比较所述模式与由所述指针标识的文本块的文本。
CN201280024694.1A 2011-03-28 2012-03-27 Utf‑8模式匹配系统和方法 Expired - Fee Related CN103548022B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161468470P 2011-03-28 2011-03-28
US61/468470 2011-03-28
PCT/US2012/030746 WO2012135222A1 (en) 2011-03-28 2012-03-27 Systems and methods of utf-8 pattern matching

Publications (2)

Publication Number Publication Date
CN103548022A CN103548022A (zh) 2014-01-29
CN103548022B true CN103548022B (zh) 2017-05-31

Family

ID=46045103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280024694.1A Expired - Fee Related CN103548022B (zh) 2011-03-28 2012-03-27 Utf‑8模式匹配系统和方法

Country Status (4)

Country Link
US (1) US8819045B2 (zh)
EP (1) EP2691883A1 (zh)
CN (1) CN103548022B (zh)
WO (1) WO2012135222A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9397932B2 (en) * 2012-01-17 2016-07-19 Reno Acquisitions, Llc Systems and methods for routing network information
US8751522B2 (en) * 2012-04-12 2014-06-10 International Business Machines Corporation Search improvement using historic code points associated with characters
WO2014077615A1 (en) * 2012-11-19 2014-05-22 Samsung Sds Co., Ltd. Anti-malware system, method of processing packet in the same, and computing device
IL224482B (en) 2013-01-29 2018-08-30 Verint Systems Ltd System and method for keyword spotting using representative dictionary
US20150032830A1 (en) * 2013-07-24 2015-01-29 Tencent Technology (Shenzhen) Company Limited Systems and Methods for Spam Interception
IL230741B (en) * 2014-01-30 2019-11-28 Verint Systems Ltd Systems and methods for finding keywords by alternating search algorithms
US10534753B2 (en) 2014-02-11 2020-01-14 Red Hat, Inc. Caseless file lookup in a distributed file system
JP2015219839A (ja) * 2014-05-20 2015-12-07 株式会社東芝 半導体メモリ装置、メモリコントローラの制御方法、及びメモリコントローラ
KR20150144447A (ko) * 2014-06-16 2015-12-28 한국전자통신연구원 메시지 수정 방법 및 장치
US10733199B2 (en) 2014-11-05 2020-08-04 International Business Machines Corporation Optimizing data conversion using pattern frequency
CN104361097A (zh) * 2014-11-21 2015-02-18 国家电网公司 一种基于多模匹配的电力敏感邮件实时检测方法
CN104391993A (zh) * 2014-12-15 2015-03-04 浪潮(北京)电子信息产业有限公司 一种识别网页编码方法及系统
US10484405B2 (en) * 2015-01-23 2019-11-19 Cisco Technology, Inc. Packet capture for anomalous traffic flows
IL242218B (en) 2015-10-22 2020-11-30 Verint Systems Ltd A system and method for maintaining a dynamic dictionary
IL242219B (en) 2015-10-22 2020-11-30 Verint Systems Ltd System and method for keyword searching using both static and dynamic dictionaries
US10146542B2 (en) * 2015-12-29 2018-12-04 Intel Corporation Hardware apparatus and methods for converting encoding formats
CN106027634B (zh) * 2016-05-16 2019-06-04 白杨 消息端口交换服务系统
CN109002423A (zh) * 2017-06-06 2018-12-14 北大方正集团有限公司 文本搜索方法及装置
CN107770844B (zh) * 2017-10-23 2020-12-29 Oppo广东移动通信有限公司 解码算法确定方法、装置、终端及存储介质
CN108021618B (zh) * 2017-11-13 2020-10-16 北京天元创新科技有限公司 一种数据查询方法及系统
CN110888675B (zh) * 2018-09-11 2021-04-06 深圳云天励飞技术有限公司 硬件系统和电子设备
US20190207853A1 (en) * 2019-03-07 2019-07-04 Intel Corporation Selection of inputs for lookup operations
CN111694693A (zh) * 2019-03-12 2020-09-22 上海晶赞融宣科技有限公司 数据流存储方法、装置以及计算机存储介质
CN111698174B (zh) * 2020-04-28 2024-02-20 山东八浚通信科技有限公司 流量动态分配方法、装置、设备及存储介质
US11847434B2 (en) * 2021-06-24 2023-12-19 International Business Machines Corporation Fast search for search string instructions
CN113935329B (zh) * 2021-10-13 2022-12-13 昆明理工大学 基于自适应特征识别与去噪的非对称文本匹配方法
US11853239B2 (en) 2022-04-11 2023-12-26 Western Digital Technologies, Inc. Hardware accelerator circuits for near storage compute systems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1694003A1 (en) * 2005-02-18 2006-08-23 Broadcom Corporation Expandable pipeline architecture for a network device
US7711719B1 (en) * 2005-03-24 2010-05-04 Palamida, Inc. Massive multi-pattern searching

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5966709A (en) * 1997-09-26 1999-10-12 Triada, Ltd. Method of optimizing an N-gram memory structure
US6311183B1 (en) * 1998-08-07 2001-10-30 The United States Of America As Represented By The Director Of National Security Agency Method for finding large numbers of keywords in continuous text streams
US6768991B2 (en) * 2001-05-15 2004-07-27 Networks Associates Technology, Inc. Searching for sequences of character data
GB2440560A (en) * 2006-07-28 2008-02-06 Roke Manor Research A method of searching for patterns in a text using Boyer-Moore methodology
US7539031B2 (en) * 2006-09-19 2009-05-26 Netlogic Microsystems, Inc. Inexact pattern searching using bitmap contained in a bitcheck command

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1694003A1 (en) * 2005-02-18 2006-08-23 Broadcom Corporation Expandable pipeline architecture for a network device
US7711719B1 (en) * 2005-03-24 2010-05-04 Palamida, Inc. Massive multi-pattern searching

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Boyer-More Horspool in Delphi 2010;Duminica;《The Spirit of Delphi:Programming tips,tricks and tools》;20100412;第2,3点以及相应的程序代码 *

Also Published As

Publication number Publication date
US20120254210A1 (en) 2012-10-04
EP2691883A1 (en) 2014-02-05
CN103548022A (zh) 2014-01-29
WO2012135222A1 (en) 2012-10-04
US8819045B2 (en) 2014-08-26

Similar Documents

Publication Publication Date Title
CN103548022B (zh) Utf‑8模式匹配系统和方法
CN103765851B (zh) 用于到任何服务的透明的层2重定向的系统和方法
CN103403707B (zh) 用于数据库代理请求交换的系统和方法
CN104012041B (zh) 用于分析网络指标的系统和方法
CN102217273B (zh) 用于应用流畅性策略的系统和方法
CN102460394B (zh) 用于多核系统中的分布式哈希表的系统和方法
CN103155524B (zh) 用于在多核系统中的多个核之间共享iip地址的系统和方法
CN103392320B (zh) 对加密项目进行多层标记以提供额外的安全和有效的加密项目确定的系统和方法
CN104365067B (zh) 用于重组跨集群分发的分组的系统和方法
CN103154895B (zh) 用于在多核系统中的核上管理cookie代理的系统和方法
CN103392314B (zh) 用于可扩展的n核统计信息聚合的系统和方法
CN102483707B (zh) 在负载平衡的多核环境中保持源ip的系统和方法
CN104054316B (zh) 用于对sms中心进行负载平衡和建立虚拟专用网络的系统和方法
CN102771085B (zh) 用于保持透明的端到端高速缓存重定向的系统和方法
CN104365058B (zh) 用于在多核和集群系统中高速缓存snmp数据的系统和方法
CN103119907B (zh) 提供用于访问控制的智能组的系统和方法
CN102783090B (zh) 用于多核系统中的对象速率限制的系统和方法
CN102771089B (zh) 用于通过虚拟服务器混合模式处理IPv6和IPv4流量的系统和方法
CN103155520B (zh) 用于多核虚拟分组引擎装置中的半虚拟化驱动程序的系统和方法
CN104380660B (zh) 用于在多核和集群系统中进行陷阱监控的系统和方法
CN103609071B (zh) 用于通过多连接中间装置跟踪应用层流的系统和方法
CN105284052B (zh) 用于基于字典的压缩的系统和方法
CN102549984B (zh) 在多核架构中分组引导的系统和方法
CN103299594B (zh) 用于可扩展的认证框架的系统和方法
CN102763375B (zh) 用于全局服务器负载平衡溢出的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170531