CN111813540B - 一种基于图划分的tcam的分配方法 - Google Patents
一种基于图划分的tcam的分配方法 Download PDFInfo
- Publication number
- CN111813540B CN111813540B CN202010474453.3A CN202010474453A CN111813540B CN 111813540 B CN111813540 B CN 111813540B CN 202010474453 A CN202010474453 A CN 202010474453A CN 111813540 B CN111813540 B CN 111813540B
- Authority
- CN
- China
- Prior art keywords
- node
- graph
- tcam
- subgraph
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000009826 distribution Methods 0.000 title claims abstract description 6
- 238000010586 diagram Methods 0.000 description 19
- 238000000638 solvent extraction Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004645 scanning capacitance microscopy Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于图划分的TCAM的分配方法,包括:将程序执行流程的控制流程图转换为条件变量图;依据效用值贪心地从当前条件变量图的备选节点中选取下一级子图根节点,直至获得最终子图根节点的集合;基于所述最终子图根节点的集合将所述条件变量图划分为若干最终子图;以及依据所述最终子图为所述程序执行流程分配TCAM。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种基于图划分的TCAM的分配方法。
背景技术
近年来随着许多新技术的涌现,新生代存储器市场不断升温,芯片架构正在与新市场一起发展。不同于传统的静态随机存取存储器(Static Ra ndom-Access Memory,SRAM),三态内容寻址存储器(Ternary Content-Addressable Memory,TCAM)提供了一种使用指示范围的掩码搜索大型数据集的方法。它允许通过其内容搜索存储的信息,而不是通过其物理地址检索存储器单元。TCAM中每个字节除“0”和“1”两个状态之外,还有一种被称为“其他”(即“don’t care”)的第三种状态。正是TCAM的这个第三种状态特征使其既能进行精确匹配查找,又能进行模糊匹配查找,因此其性能远远优于只能进行精确匹配查找的SCAM。实际上,在使用基于硬件的TCAM查找法中,整个表项空间的所有数据在同一时刻被查询,查找速度不受表项空间数据大小影响,每个时钟周期完成一次查找,其平均查找速度是基于SRAM算法查找的6-128倍。
现有技术中通常采用基于乘法加法原则的图划分方法进行TCAM的分配。图1示出了现有技术中基于乘法加法原则的图划分方法的示意图。如图1所示,该方法自上而下地划分由程序执行过程抽象而成的控制流程图,其中乘法原则对应横切方法,是指由原图划分而成的两张子图之间可达,可视为上下两张子图,且上子图没有路径可以越过下子图(如图1(A)中所示)。横切方法需要图中存在汇聚节点,该节点控制所有后继节点。加法原则对应纵切方法,是指由原图划分而成的两张子图之间不可达,可视为左右两张子图(如图1(B)中所示)。纵切方法一方面是为了减小图的规模,一方面是为了给横切提供条件。基于乘法加法原则的图划分方法就是通过递归的方式执行横切、纵切、横切,直至所有子图的规模满足硬件资源的限制,并依据子图部署硬件资源。
然而,基于乘法加法原则的图划分方法分配TCAM存在以下问题:首先,该方法采用了递归的划分策略,只考虑如何缩小图的规模,切分的目的仅是为了缩小图的规模,而没有全局视图,因而缺少全局的调度策略。这可能会造成局部子图的规模缩小,但整体效果可能很差的划分结果。其次,由于硬件资源的规格是多种的,不同子图可能需要不同的终止条件来限制,而使用该方法难以通过指标指导划分优化,这会进一步影响了划分结果。此外,横切的前提条件比较严格,需要大量的纵切来为横切创造条件,这可能会使划分结果交叉冗余。低质量的图划分结果会影响TCAM的分配结果以及编译器的效率。
因此,亟需一种更加有效的TCAM的分配方法以提高编译器的效率。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种基于图划分的TCAM的分配方法,包括:将程序执行流程的控制流程图转换为条件变量图;依据效用值贪心地从当前条件变量图的备选节点中选取下一级子图根节点,直至获得最终子图根节点的集合;基于所述最终子图根节点的集合将所述条件变量图划分为若干最终子图;以及依据所述最终子图为所述程序执行流程分配TCAM。
可选的,其中,通过以下方式确定所述效用值:当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配TCAM的规格时,至少基于所有下一级子图的键值之和确定所述效用值;或者当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配TCAM的规格时,至少基于下一级子图所需占用的TCAM数量以及TCAM的平均资源占有率确定所述效用值。
可选的,其中,当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配的TCAM的规格时,所述效用值表示为:U=E,其中,E为所述下一级子图中所有子图的键值的总和;或者当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配的TCAM的规格时,所述效用值表示为:U=v*N+ω*P,其中,N为由所述下一级子图的根节点的集合所确定的下一级子图所占用的TCAM容器数量,P为单个TCAM的平均占用率,P∈(0,1),ν,ω分别为权重系数。
可选的,其中,当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配的TCAM的规格时,所述下一级子图的键值之和最小时所述效用值最优;或者当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配的TCAM的规格时,所述效用值最大时所述效用值最优。
可选的,其中,当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配的TCAM的规格时,所述效用值基于所述下一级子图的最小键值确定,所述下一级子图的最小键值由所述下一级子图中节点的最小键值从下往上迭代计算获得,所述节点的最小键值为:其中,eT′为满足所述节点中条件的键值,/>为满足所述节点中条件的子节点的最小键值,eF′为不满足所述节点中条件的键值,/>为不满足所述节点中条件的子节点的最小键值。
可选的,其中,当所述节点为叶子节点时,所述节点的最小键值为:el=min(eT,eF)+1,其中,eT为满足所述叶子节点中条件的键值,eF为不满足所述叶子节点中条件的键值。
可选的,其中,所述满足所述节点中条件的键值通过以下方式计算获得:当条件为x>a时,a的二进制编码中0的个数为所述节点的键值;当条件为x==a时,所述节点的键值为1;当条件为x<a时,a的二进制编码中1的个数为所述节点的键值;当条件为x>a且y>b时,所述节点的键值为条件为x>a时节点的键值与条件为y>b时节点的键值之乘积;当条件为x>a或y>b时,所述节点的键值为条件为x>a时节点的键值与条件为y>b时节点的键值之和,其中x、y为变量,a、b为条件值。
可选的,其中,所述依据效用值贪心地从当前条件变量图的备选节点中选取下一级子图根节点,直至获得最终子图根节点的集合包括:(3-1)从所述当前条件变量图选取备选节点;(3-2)贪心地从所述备选节点中选取效用值最优的节点作为下一级子图根节点;(3-3)将由所述下一级子图根节点所确定的下一级子图作为当前条件变量图,重复上述步骤(3-1)-(3-2),直至所述下一级子图的键值均小于或者等于待分配的TCAM的规格且达到效用值最优;(3-4)将所获得的全部子图根节点作为最终子图根节点的集合。
可选的,上述方法还包括:当所述备选节点中既包含使所确定的下一级子图的键值中至少有一个大于待分配TCAM的规格的下一级子图根节点,又包含使所确定的下一级子图的键值均小于或等于待分配TCAM的规格的下一级子图根节点时,贪心地从后者中选取效用值最优的节点作为下一级子图根节点。
可选的,所述方法还包括:基于所述最终子图之间的约束关系分配TCAM。
可选的,其中,所述基于所述最终子图之间的约束关系分配TCAM包括:至少基于所述子图之间的依赖性为所述子图分配TCAM;和/或至少基于所述子图的优先顺序为所述子图分配TCAM,包括:当所述子图之间存在依赖性,则上子图优先分配;或者当所述子图之间不存在依赖性,则所述子图中记录条件较小的子图优先分配。
与现有技术相比,本发明的优点在于:
本发明通过将图划分的过程抽象为在条件变量图中选择子图根节点的过程,由于每次选取子图根节点会比较当前所有备选节点,因而具有全局视图,能够从根本上改变传统图划分中切点选择固定以及自上而下的划分方案,消除的冗余划分结果,有效统一算法搜索空间。另一方面,本发明以效用值为基础,根据下一级子图的键值与待分配的TCAM的规格的关系将效用值分为两个阶段,并采用贪心策略从备选节点中选择效用值最优的节点作为子图根节点,可以在保证将子图规模减少至硬件允许范围内以满足硬件需求的基础上,大幅提高硬件资源的利用率。
附图说明
以下参照附图对本发明实施例作进一步说明,其中:
图1是示出了现有技术中基于乘法加法原则的图划分方法的示意图;
图2示出了本发明一个实施例中描述单个节点的键值的示意图;
图3示出了一个实施例中基于图划分的TCAM的分配方法的流程图;
图4示出了一个实施例中将控制流程图转换为条件变量图的示意图;
图5示出了一个实施例中依据效用值获得最终子图根节点的集合方法;
图6示出了一个实施例中计算子图最小键值的示意图;
图7示出了一个实施例中依据效用值从备选节点中选取子图根节点的示意图;
图8示出了BranchTCAM中与TCAM相关的硬件结构;
图9示出了一个实施例中依据子图分配TCAM的示意图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在TCAM的芯片架构中,通常可以基于TCAM的特性快速匹配程序执行流程,将程序执行过程抽象成一张控制流程图(CFG),并通过把CFG上的资源映射到TCAM上来解决硬件资源的分配。然而,由于TCAM资源有限,往往无法一次性将整张CFG上的资源部署在同一个TCAM上,因此需要将CFG划分成多张子图,为每张子图分别单独分配硬件资源,最后由硬件将结果合并。因此,有关TCAM的分配问题实际上可以看作图划分问题。
图划分本质上是将一张图从某个(或某几个)节点处断开,分成两个(或两个以上)子图,该节点可以看作是子图的根节点。因此图划分问题可以抽象为在备选节点中选择子图根节点的集合的过程,其中,子图可以定义为子图根节点以及该根节点所控制的所有后继节点的集合,并且子图的根节点不属于其他任何同一级子图的后继节点,备选节点是指在当前子图集合中,满足上述子图定义的下一级子图根节点的集合。
根据所得子图的键值与待分配TCAM的规格之间的关系,可以将图划分的过程分为两个阶段,并在不同阶段采用不同的效用值的计算方式。在第一阶段,由图划分所得到的下一级子图中至少存在一个子图的键值大于待分配的TCAM规格,此时可以基于下一级子图的键值之和确定效用值。这是为了促使将子图规模减少至TCAM规格容许的范围内,以保证分配的准确性。这种情况下,可以设定下一级子图的键值之和越小,则效用值越优。在第二阶段,由图划分所得到的下一级子图的键值均小于或者等于待分配的TCAM规格,此时可以基于下一级子图所需占用的TCAM的数量以及TCAM的利用率确定效用值。这是为了提高TCAM利用率。在这种情况下,可以设定下一级子图所需占用的TCAM的数量越少且每个TCAM的利用率越高,则效用值越优。通过以效用值为基础选取子图根节点,能够在确保将划分所得的子图规模减少至硬件允许范围内以满足TCAM规格的基础上,提高硬件资源的占有率,可以
如上所述,当图划分所得到的下一级子图中至少存在一个子图的键值大于待分配的TCAM规格,效用值由下一级子图的键值之和所确定。子图的键值是指表示该子图的编码的数量,是基于图中节点的键值计算获得。而节点的键值由节点所表示的条件转换而来。条件变量图中的节点包括左右两个分支,各分支的键值分别表示满足该节点中条件的编码数量和不满足该节点中条件的编码数量。节点中的条件值可以通过一个无符号二进制编码来表示。
例如,可以用不同的二进制编码来表示x>a,x<a,x==a三种类型的条件,其他条件最终都分解为这三种类型:如,x>=a可转化为x>a-1;x<=a可转化为x<a+1;x!=a可转化为x==!a,其中x、y表示程序中的变量,a、b表示条件值。满足或不满足条件的二进制编码的数量即为代表该条件的节点的左右分支的键值。
当条件为x>a时,a的二进制编码中“0”的个数为满足该条件的编码数量。这是由于TCAM中有“其他”这种第三种状态,因此可以将任何小于或者等于a的数用“*”表示。具体来说,可以从右到左扫描a的二进制编码,找到第一个“0”的位置,将其变为“1”,并将从该位置向右的所有编码全部置为“*”,即可得到一种编码;然后从右到左扫描a的二进制编码,找到第二个“0”的位置,将其变为“1”,并将从该位置向右的所有编码全部置为“*”,即可得到第二种编码;如此重复以上操作,直至找到a的二进制编码中最后一个“0”,将其变为“1”,并将从该位置向右的所有编码全部置为“*”,即可得到第n种编码。因此,满足该条件的编码数量也可以视为a的二进制编码中“0”的个数。例如,假设条件为x>5,5的二进制编码为00101,将该编码从右到左的第一个“0”(从右到左第二位)变成“1”可得到编码00111,将从该位置(从右到左第二位)向右的所有编码全部置为“*”可得到编码0011*,即得到第一种编码;然后将该编码从右到左的第二个“0”(从右到左第四位)变成“1”可得到编码01101,将从该位置(从右到左第四位)向右的所有编码全部置为“*”可得到编码01***,即得到第二种编码;最后将该编码从右到左的第三个“0”(从右到左第五位)变成“1”可得到编码10101,将从该位置(从右到左第五位)向右的所有编码全部置为“*”可得到编码1****,即得到第三种编码。由此可知,满足条件x>5的编码数量为3,即满足条件x>5的编码数量相当于5的二进制编码(即00101)中“0”的个数。
当条件为x==a时,满足该条件的编码数量为1,该编码即为a的二进制表示。
同理,当条件为x<a时,a的二进制编码中1的个数为满足该条件的键值。基于TCAM的特性,可以将任何大于或者等于a的数用“*”表示。具体来说,可以从右到左扫描a的二进制编码,找到第一个“1”的位置,将其变为“0”,并将该位置向右的所有编码全部置为“*”,即可得到一种编码。重复以上操作,直至编码中没有“0”。因此,满足该条件的编码数量相当于a的二进制编码中“1”的个数。
对于复合条件,当条件为x>a且y>b时,满足该复合条件的编码数量为:满足条件x>a时的编码数量与满足条件为y>b时的编码数量的乘积;当条件为x>a或y>b时,满足该复合条件的编码数量为:满足条件x>a时的编码与满足条件y>b时的编码数量之和。
图2示出了一个实施例中描述单个节点的键值的示意图。节点中的条件值a可以通过一个5bits的无符号二进制编码表示。节点的左右两个分支分别表示满足节点中的条件和不满足节点中的条件的编码数量。如图2(A)所示,节点A中的条件为x<=6,满足该条件可以表示为x<7,其中7的二进制编码为00111,其中,“1”的个数为3,因此,满足条件x<=6可以由3种编码表示,分别是00110,0010*和000**;不满足该条件可以表示为x>6,其中,6的二进制编码为00110,因此,不满足条件x<=6也可以由3种编码表示,即00111,01***和1****。因此,节点A左右两个分支的键值分别为3和3。又如图2(B)所示,节点B中的条件为x==6时,满足该条件的编码只有一个,即6的二进制编码;而不满足该条件,即x>6或者x<6可以由5种编码表示,即00111、01***、1****、0010*和000**。因此,节点B左右两个分支的键值分别为1和5。
基于上述研究,本发明提供了一种基于图划分的TCAM的分配方法,该方法把图划分的过程抽象为在条件变量图中选择子图根节点的过程,通过迭代的方式以效用值为基础选取下一级子图根节点,并依据所获得的最终子图根节点的集合分配TCAM资源。
图3示出了本发明一个实施例中基于图划分的TCAM的分配方法的流程图。如图3所示,该方法包括以下步骤:
S310,将程序的控制流程图转换为条件变量图。
控制流程图(CFG)中包括两种节点,一种是带条件的双出节点,其左右两支分别连接不同的子节点;另一种是不带条件的单出节点,即只有一个子节点。由于本发明中的图划分以效用为基础,子图规模取决于子图的键值(即图中条件的编码数量),因此只有带条件的节点才会影响编码,而不带条件的节点没有影响。因此,可以将CFG图进行处理,抽象成一张条件变量图。通过将CFG转换为条件变量图,可以在不影响划分结果的情况下,简化图结构,便于进行图划分。
图4示出了一个实施例中将控制流程图转换为条件变量图的示意图。如图4所示,保留CFG中带条件的节点(即双出节点,例如BB2、BB5、BB6、BB10),同时删除不带条件的节点(即单出节点,例如BB1、BB3、BB4、BB7、BB8、BB9、BB11、BB12),即可形成与该控制流程图对应的条件变量图。条件变量图中的节点用C1、C2、C3、C4以及C5来表示。由于条件变量图和原图的路径一一对应,容易将条件变量图划分结果还原为CFG图划分结果。
S320,依据效用值贪心地从当前条件变量图的备选节点中选取下一级子图根节点,直至获得最终子图的根节点的集合。
在一个实施例中,可以采用迭代的方式贪心地从当前条件变量图的备选节点中选取效用值最优的节点作为下一级子图的根节点,直至获得最终子图的根节点的集合。
图5示出了一个实施例中依据效用值获得最终子图根节点的集合方法。
如图5所示,该方法包括:
S510,从当前条件变量图中选取备选节点。
如上所述,子图可以定义为子图根节点以及该根节点所控制的所有后继节点的集合,并且子图的根节点不属于其他任何同一级子图的后继节点。备选节点是指在当前子图集合中,满足上述子图定义的下一级子图根节点的集合。
S520,从备选节点中选取一个节点作为下一级子图的根节点。
可以依次从备选节点中分别选取不同节点作为下一级子图的根节点。选取一个子图根节点就相当于划分出一个子图。
S530,计算由该节点确定的下一级子图的效用值。
如上所述,效用值的计算方式可以根据图划分过程中的不同阶段分为两种。
在一个实施例中,当由下一级子图根节点所确定的下一级子图的键值至少有一个大于待分配的TCAM的规格时,效用值可以是所有下一级子图的键值之和,效用值公式如下:
U=E (1)
其中,E为所述下一级子图中所有子图的键值的总和。
在这种情况下,下一级子图的键值之和越小,则效用值越优。在一个实施例中,可以使用贪心算法从当前子图根节点集合中选出子图键值最小的节点作为下一级子图根节点,使得下一级子图的键值之和越小,从而实现效用值最优。
在一个实施例中,当两种图划分的子图键值之和相同时,还可以为下一级子图的键值设置权重,并设置划分平衡参数f(α),f(α)的取值范围为(0,1),效用值公式如下:
U=μ*E+f(α) (2)
其中,E为所述下一级子图中所有子图的键值的总和,μ为权重系数,f(α)为划分平衡参数,f(α)∈(0,1),当f(α)为0.5时,表示平均划分。
在一个实施例中,可以将子图的最小键值作为子图的键值来计算效用值。子图的最小键值,即子图根节点的最小键值,是由子图中的节点的最小键值从下往上迭代计算得出的。子图中的节点包括叶子节点和父节点。对于叶子节点,在实际编码中,不需要记录一个节点左右两支的全部编码,而只需要记录其中一支的编码,再附加一个编码表示不满足节点中的条件,以此进行条件判断。叶子节点的最小键值可以通过该节点左右两个分支中的最小的编码数量加1表示。例如在图2(A)中,条件x<=6有3种编码,x>6也有3种编码,但是判断该条件不需要记录全部的6个编码,而只需要记录任意一支的全部编码再加上一个表示另外一支的三个编码即可。因此节点A的最小键值为4(即3+1=4)。叶子节点最小键值可以用下列公式表示:
el=min(eT,eF)+1 (3)
其中,eT为满足该叶子节点中条件的键值,eF为不满足该叶子节点中条件的键值。
对于父节点(包括根节点),在实际编码中,不需要记录满足该父节点中条件及其子节点(即其中一支)的全部编码以及不满足该条件及其子节点(即另外一支)的全部编码,而只需记录其中一支及其子节点的编码数量以及另一支子节点的最小键值。当另一支没有子节点时,其子节点的最小键值为1。父节点的最小键值可以用下列公式表示:
其中,eT′为满足该节点中条件的键值,为满足该节点中条件的子节点的最小键值,eF′为不满足该节点中条件的键值,/>为不满足该节点中条件的子节点的最小键值,当没有满足或不满足该节点中条件的子节点时,/>或/>为1。
图6示出了一个实施例中计算子图最小键值的示意图。如图6所示,以图4中的条件变量图为例,除去子图的出口节点C5,共有C1、C2、C3、和C4四个节点,其中C1为子图的入口节点(即子图根节点),,C2、C4为叶子节点,C3为父节点。该图的最小键值为由图中的节点的最小键值从下往上迭代计算得出的,具体包括:
(1)计算叶子节点的最小键值
对于叶子节点C4,其左右分支的键值分别为5和1,代入公式(3)
可得C4的最小键值为2;
对于叶子节点C2,其左右分支的键值分别为3和7,代入公式(3)
可得C2的最小键值为4。
(2)从下往上迭代,依次计算各级父节点的最小键值
对于父节点C3,其左分支的键值为1,该左分支下没有子节点,其右分支的键值为3,该右分支下子节点C4的最小键值为2,代入公式(4)可得C3的最小键值为3。
(3)计算子图根节点的最小键值
对于子图根节点C1,其左分支的键值为6,该左分支下子节点C2的最小键值为4,其右分支的键值为5,该右分支下子节点C3的最小键值为3,代入公式(4)可得C1的最小键值为19。
因此,图6中子图的最小键值为19。
在一个实施例中,当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配的TCAM的规格时,效用值可以表示为:
U=v*N+ω*P (5)
其中,N为由所述下一级子图的根节点确定的下一级子图所占用的TCAM容器数量,P为单个TCAM的平均占用率,P∈(0,1),ν,ω分别为权重系数。
此时,下一级子图所需占用的TCAM数量越少且单个TCAM的资源占有率越高,则效用值越优。在一个实施例中,还可以根据实际情况设定公式(5)中的权重系数,使得所得效用值越大则效用值越优。
S540,当该节点确定的下一级子图的效用值优于同级迭代中记录的最优效用值时,更新最优效用值记录,并记录该节点。
S550,撤销该节点作为根节点,并重复步骤S520-S540,直至遍历备选节点所有节点。
S560,将效用值最优的节点设置为下一级子图的根节点,并将该根节点确定的下一级子图作为当前条件变量图。
由于每次选取子图根节点会比较当前所有备选节点的效用值,选择当前效用值最优的节点作为子图根节点,因而具有全局视图,能够从根本上改变传统图划分中切点选择固定以及自上而下的划分方案,不需要记录任何冗余,有效统一算法搜索空间。
图7示出了一个实施例中依据效用值从备选节点中选取子图根节点的示意图。如图7所示,当前条件变量图中根节点为C1,当前条件变量图中备选节点为{C1,C2,C3,C4,C5,C6,C7,C8}。通过贪心算法,从备选节点中选取效用值最优的节点C6作为下一级子图的根节点,将其划分为两张子图,其中,上子图以C1为根节点,包含{C1,C2,C3,C4,C5};下子图以C6为根节点,包含{C6,C7,C8}。可以以上子图或下子图作为当前条件变量图采用上述步骤进行再次图划分。
在一个实施例中,当同级迭代的备选节点中既包含使所确定的下一级子图的键值中至少有一个大于待分配TCAM的规格的下一级子图根节点,又包含使所确定的下一级子图的键值均小于或等于待分配TCAM的规格的下一级子图根节点时,从后者中选取效用值最优的节点作为下一级子图根节点。
S570,重复步骤S510-S560,直至满足终止条件。
终止条件是当指由下一级子图根节点所确定的下一级子图的键值均小于或等于待分配的TCAM的规格时,如果继续进行图划分已无法实现在不大幅增加TCAM数量的前提下进一步提高TCAM资源占有率,即不再优化效用值时,则停止划分下一级子图。在一个实施例中,当所得的下一级子图的效用值不再增加时,当前获得的所有子图根节点的集合为所述最终子图根节点的集合。
若获得的子图集合没有满足终止条件,即继续进行图划分仍可以优化效用值,则从当前子图中重新选取备选节点,重复上述步骤S510-S560,直至满足终止条件。
S330,基于最终子图根节点的集合将条件变量图划分为若干最终子图。
如上所述,子图可以由其根节点唯一确定,因此可以基于最终子图根节点以及该根节点的所有后继子节点,将条件变量图划分为若干最终子图。
S340,依据所述最终子图为所述程序执行流程分配TCAM。
由于获得的最终子图的键值均小于TCAM的规格,因此可以依据最终子图为相应的程序执行流程分配TCAM。
在一个实施例中,在依据最终子图分配TCAM时,还需要考虑最终子图之间约束关系。
图8示出了BranchTCAM中与TCAM相关的硬件结构。如图8所示,整个硬件由M个TCAM容器组成,每个TCAM容器中能存放若干个TCAM,这些TCAM可以具有不同的规格,能够存放不同数量的编码(例如64、32、16)。在同一个容器中,所有TCAM共享同一个关键字,作为该容器中TCAM的索引。在硬件中,存在两级的优先匹配。在TCAM中,排在前面的表项具有更高的优先级,在同一个TCAM中如果存在多个表项命中冲突,TCAM给出的命中结果是优先级最高的表项的结果。在TCAM容器中,排在前面的TCAM具有更高的优先级,在同一个TCAM容器中如果多个TCAM的表项命中冲突,TCAM容器会选择优先级最高的TCAM的命中结果。
由以上描述可知,处于同一路径的子图不能放在一个TCAM中,因为一个TCAM只会出一个结果,同一路径的子图放在一个TCAM中会导致该路径无法命中。此外,子图之间可以通过规定优先序来减少额外信息的记录。在我们的方法中,需要记录的约束有两个,分别是子图依赖和子图优先序,子图依赖用于保证匹配不会丢失部分路径;子图优先序用于保证不会有误命中。
在一个实施例中,可以基于子图之间的依赖性为其分配TCAM。子图之间的依赖性是指两张子图之间可达。这意味着两个子图处于同一条路径上,因此不能分配在同一个TCAM中。在一个实施例中,还可以基于子图之间的优先顺序为其分配TCAM。子图之间的优先顺序是指两张子图在分配TCAM资源时存在先后关系。这是由于为了减小子图规模,即子图的键值,在划分的子图并没有保留原图的全部条件,而是选择了部分子图记录条件用于区分不同子图。因此,可以将子图之间的优先顺序设为:当两张子图可达时(即存在依赖性),则上子图优先与下子图;当两张子图不可达(即不存在依赖性),则通过比较两张子图约束关系,选择记录条件较小的子图优先分配硬件资源。这样做的目的是为了能够根据图结构选择存在约束关系的子图,进而给出一种优化的划分方案。
图9示出了一个实施例中依据子图分配TCAM的示意图。如图9所示,在为子图分配TCAM时,首先初始化每个TCAM的规格,然后按子图优先级顺序依次分配TCAM,每次分配前需要检查TCAM中已有的子图与待分配的子图之间是否存在依赖性,若有则不能分配在该TCAM中。例如一张条件变量图被划分为一级子图I、一级子图II和一级子图III,其中一级子图II又被划分为二级子图II.i,二级子图II.ii和二级子图II.iii;一级子图III又被划分为二级子图III.i和二级子图III.ii。由于二级子图II.i、二级子图II.ii和二级子图II.iii之间具有依赖性,此三张子图不能分配在同一个TCAM中,此外,由于上图优于下图,故其优先顺序为图II.i>图II.ii>图II.iii。图III.i和图III.ii之间不具有依赖性,但图III.i的记录条件小于图III.ii,因此其优先顺序为图III.i>图III.ii。最后输出的TCAM列表中记录了每个TCAM所存储的子图,其中,TCAM A存储有图I、图II.i和图III.i;TCAM B中存储有图II.ii和图III.ii;TCAM C中存储有图II.iii和图III.i。
基于上述实施例可以看出,本发明以效用基础,直接向划分结果看齐,把问题抽象为在条件变量图中选择子图根节点的过程。该方法面向全局资源,以迭代的方式进行划分,每次迭代只选择一个节点,每次迭代都在选择节点时考察备选节点的效用值,并选取效用值最优的节点成为新的根节点。不断迭代,最终完成图划分。该方法可以在保证划分正确的前提下大幅提升划分效果和消除划分结果的冗余。
最后所应说明的是,以上仅用以说明本发明的技术方案而非限制。尽管对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种基于图划分的三态内容寻址存储器TCAM的分配方法,包括:
将程序执行流程的控制流程图转换为条件变量图;
依据效用值贪心地从当前条件变量图的备选节点中选取下一级子图根节点,直至获得最终子图根节点的集合;
基于所述最终子图根节点的集合将所述条件变量图划分为若干最终子图;以及
依据所述最终子图为所述程序执行流程分配三态内容寻址存储器TCAM;
其中,通过以下方式确定所述效用值:
当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配三态内容寻址存储器TCAM的规格时,至少基于所有下一级子图的键值之和确定所述效用值;或者
当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配三态内容寻址存储器TCAM的规格时,至少基于下一级子图所需占用的三态内容寻址存储器TCAM数量以及三态内容寻址存储器TCAM的平均资源占有率确定所述效用值;
以及其中所述依据效用值贪心地从当前条件变量图的备选节点中选取下一级子图根节点,直至获得最终子图根节点的集合包括:
(8-1)从所述当前条件变量图选取备选节点;
(8-2)贪心地从所述备选节点中选取效用值最优的节点作为下一级子图根节点;
(8-3)将由所述下一级子图根节点所确定的下一级子图作为当前条件变量图,重复上述步骤(8-1)-(8-2),直至所述下一级子图的键值均小于或者等于待分配的三态内容寻址存储器TCAM的规格且达到效用值最优;
(8-4)将所获得的全部子图根节点作为最终子图根节点的集合。
2.根据权利要求1所述的分配方法,其中,
当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配的三态内容寻址存储器TCAM的规格时,所述效用值表示为:
U=E
其中,E为所述下一级子图中所有子图的键值的总和;或者
当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配的三态内容寻址存储器TCAM的规格时,所述效用值表示为:
U=ν*N+ω*P
其中,N为由所述下一级子图的根节点的集合所确定的下一级子图所占用的三态内容寻址存储器TCAM容器数量,P为单个三态内容寻址存储器TCAM的平均占用率,P∈(0,1),ν,ω分别为权重系数。
3.根据权利要求1所述的分配方法,其中,
当由所述下一级子图根节点所确定的下一级子图的键值中至少有一个大于待分配的三态内容寻址存储器TCAM的规格时,所述下一级子图的键值之和最小时所述效用值最优;或者
当由所述下一级子图根节点所确定的下一级子图的键值均小于或者等于待分配的三态内容寻址存储器TCAM的规格时,所述效用值最大时所述效用值最优。
5.根据权利要求4所述的分配方法,其中,当所述节点为叶子节点时,所述节点的最小键值为:
el=min(eT,eF)+1
其中,eT为满足所述叶子节点中条件的键值,eF为不满足所述叶子节点中条件的键值。
6.根据权利要求4所述的分配方法,其中,所述满足所述节点中条件的键值通过以下方式计算获得:
当条件为x>a时,a的二进制编码中0的个数为所述节点的键值;
当条件为x==a时,所述节点的键值为1;
当条件为x<a时,a的二进制编码中1的个数为所述节点的键值;
当条件为x>a且y>b时,所述节点的键值为条件为x>a时节点的键值与条件为y>b时节点的键值之乘积;
当条件为x>a或y>b时,所述节点的键值为条件为x>a时节点的键值与条件为y>b时节点的键值之和,其中x、y为变量,a、b为条件值。
7.根据权利要求1所述的分配方法,还包括:
当所述备选节点中既包含使所确定的所述下一级子图的键值中至少有一个大于所述待分配三态内容寻址存储器TCAM的规格的下一级子图根节点,又包含使所确定的下一级子图的键值均小于或等于待分配三态内容寻址存储器TCAM的规格的下一级子图根节点时,贪心地从后者中选取效用值最优的节点作为下一级子图根节点。
8.根据权利要求1-7任一所述的分配方法,还包括:
基于所述最终子图之间的约束关系分配三态内容寻址存储器TCAM。
9.根据权利要求8所述的分配方法,其中,所述基于所述最终子图之间的约束关系分配三态内容寻址存储器TCAM包括:
至少基于所述子图之间的依赖性为所述子图分配三态内容寻址存储器TCAM;和/或
至少基于所述子图的优先顺序为所述子图分配三态内容寻址存储器TCAM,包括:
当所述子图之间存在依赖性,则上子图优先分配;或者
当所述子图之间不存在依赖性,则所述子图中记录条件较小的子图优先分配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010474453.3A CN111813540B (zh) | 2020-05-29 | 2020-05-29 | 一种基于图划分的tcam的分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010474453.3A CN111813540B (zh) | 2020-05-29 | 2020-05-29 | 一种基于图划分的tcam的分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111813540A CN111813540A (zh) | 2020-10-23 |
CN111813540B true CN111813540B (zh) | 2023-06-06 |
Family
ID=72847826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010474453.3A Active CN111813540B (zh) | 2020-05-29 | 2020-05-29 | 一种基于图划分的tcam的分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111813540B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8316151B1 (en) * | 2009-02-25 | 2012-11-20 | Juniper Networks, Inc. | Maintaining spatial ordering in firewall filters |
US8719917B1 (en) * | 2009-02-17 | 2014-05-06 | Juniper Networks, Inc. | Merging firewall filters using merge graphs |
CN106875281A (zh) * | 2017-03-13 | 2017-06-20 | 哈尔滨工程大学 | 基于贪心子图的社会网络节点挖掘方法 |
CN107967219A (zh) * | 2017-11-27 | 2018-04-27 | 北京理工大学 | 一种基于tcam的大规模字符串高速查找方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8191142B2 (en) * | 2006-10-26 | 2012-05-29 | Polytechnic Institute Of New York University | Detecting whether an arbitrary-length bit string input matches one of a plurality of known arbitrary-length bit strings using a hierarchical data structure |
-
2020
- 2020-05-29 CN CN202010474453.3A patent/CN111813540B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8719917B1 (en) * | 2009-02-17 | 2014-05-06 | Juniper Networks, Inc. | Merging firewall filters using merge graphs |
US8316151B1 (en) * | 2009-02-25 | 2012-11-20 | Juniper Networks, Inc. | Maintaining spatial ordering in firewall filters |
CN106875281A (zh) * | 2017-03-13 | 2017-06-20 | 哈尔滨工程大学 | 基于贪心子图的社会网络节点挖掘方法 |
CN107967219A (zh) * | 2017-11-27 | 2018-04-27 | 北京理工大学 | 一种基于tcam的大规模字符串高速查找方法 |
Non-Patent Citations (1)
Title |
---|
丁麟轩等."基于 TCAM 的低能耗正则表达式匹配算法".《通信学报》.2014,第35卷(第8期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111813540A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6505283B1 (en) | Efficient memory allocator utilizing a dual free-list structure | |
JP3913762B2 (ja) | ディスクスペースを管理する変型バデイシステム | |
US7990979B2 (en) | Recursively partitioned static IP router tables | |
US20130132405A1 (en) | Dynamically Associating Different Query Execution Strategies with Selective Portions of a Database Table | |
JP2001274837A (ja) | データ・パケットを分類する方法および手段 | |
EP1551141A1 (en) | Apparatus and method using hashing for efficiently implementing an IP lookup solution in hardware | |
JPWO2004032435A1 (ja) | ビットストリングの照合方法および装置 | |
CN108134739B (zh) | 一种基于索引特里树的路由查找方法及装置 | |
CN102945283A (zh) | 一种语义Web服务组合方法 | |
CN109710774B (zh) | 结合平衡策略的图数据划分与分布式存储方法 | |
CN107360031B (zh) | 一种基于优化开销收益比的虚拟网络映射方法 | |
CN115718819A (zh) | 一种索引构建方法、数据读取方法及索引构建装置 | |
CN108833295B (zh) | 面向sdn的基于禁忌搜索的虚拟网络重配置方法 | |
CN111813540B (zh) | 一种基于图划分的tcam的分配方法 | |
CN116501594B (zh) | 系统建模评估方法、装置、电子设备及存储介质 | |
US5579514A (en) | Methodology for increasing the average run length produced by replacement selection strategy in a system consisting of multiple, independent memory buffers | |
CN115146020A (zh) | 一种基于最小聚合距离的多源skyline查询方法及系统 | |
CN111459464A (zh) | 节点融合方法、代码生成方法、装置 | |
CN112100446B (zh) | 搜索方法、可读存储介质和电子设备 | |
CN113961568A (zh) | 基于区块链的链式数据结构的区块快速查找方法 | |
CN106709045A (zh) | 分布式文件系统中节点选择方法及装置 | |
CN114830088A (zh) | 用于对计算集群或云计算平台的资源节点执行资源调度的方法和装置 | |
CN114490799A (zh) | 单个图的频繁子图挖掘方法及装置 | |
CN113407354B (zh) | 分布式作业调整方法、主节点、系统、物理机及存储介质 | |
CN118396140B (zh) | 一种分布式模型训练系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231215 Address after: Room 1305, 13th Floor, No.1 Zhongguancun Street, Haidian District, Beijing, 100086 Patentee after: Zhongke Jiahe (Beijing) Technology Co.,Ltd. Address before: 100190 No. 6 South Road, Zhongguancun Academy of Sciences, Beijing, Haidian District Patentee before: Institute of Computing Technology, Chinese Academy of Sciences |