CN113553274A - 用自适应粒度目录表实现片间一致性的方法 - Google Patents

用自适应粒度目录表实现片间一致性的方法 Download PDF

Info

Publication number
CN113553274A
CN113553274A CN202010331793.0A CN202010331793A CN113553274A CN 113553274 A CN113553274 A CN 113553274A CN 202010331793 A CN202010331793 A CN 202010331793A CN 113553274 A CN113553274 A CN 113553274A
Authority
CN
China
Prior art keywords
directory table
grained
cache
remote
fine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010331793.0A
Other languages
English (en)
Other versions
CN113553274B (zh
Inventor
杨思博
于敦山
王波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Huachuang Micro System Co ltd
CETC 14 Research Institute
Original Assignee
Jiangsu Huachuang Micro System Co ltd
CETC 14 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Huachuang Micro System Co ltd, CETC 14 Research Institute filed Critical Jiangsu Huachuang Micro System Co ltd
Priority to CN202010331793.0A priority Critical patent/CN113553274B/zh
Publication of CN113553274A publication Critical patent/CN113553274A/zh
Application granted granted Critical
Publication of CN113553274B publication Critical patent/CN113553274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/0292User address space allocation, e.g. contiguous or non contiguous base addressing using tables or multilevel address translation means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本发明公开了用自适应粒度目录表实现片间一致性的方法,包括下述步骤:自适应粒度目录表包括粗粒度目录表和细粒度目录表;对用于本地处理器核和远程处理器核中任一项的内存块,使用粗粒度目录表来记录,粗粒度目录表对应的地址空间范围为内存块;对于既用于本地处理器核也用于远程处理器核的内存块,使用细粒度目录表来记录;使用粗粒度目录表覆盖整个本地内存空间,再使用细粒度目录表提高对少数本地和远程共用地址的过滤精度,可以用较少的容量达到较高的性能;正向细粒度目录表和反向细粒度目录表它们可以是同一个目录表,只是在表项中增加一项表示目录表的方向,这样可以根据实际情况灵活地应用硬件资源。

Description

用自适应粒度目录表实现片间一致性的方法
技术领域
本发明涉及实现片间一致性的方法技术领域,具体为用自适应粒度目录表实现片间一致性的方法。
背景技术
在NUMA系统中,所有处理器芯片上的cache之间都要保持cache一致性,即当一个处理器核读取数据时,要能够看到NUMA系统上所有处理器核对这个数据的修改,包括保存在远程cache中的修改,这就需要实现对远程cache的监听。
NUMA系统中每个处理器芯片都有很大的内存地址空间,如果每个cache行在目录表中都占据一位表示是否可能在远程cache中拥有副本,以cache行宽度512位为例,如果本地内存容量为32GB,则共包含512M个cache行,每个cache行在目录表中占据1比特,我们称之为细粒度目录表,则目录表的总容量高达64MB,很难放入片上RAM中,而如果放在片外,会增加访问延迟。如果使用目录表中的一位表示更大的地址访问,比如1位表示一个4KB页的数据是否有可能保存在远程cache中,我们称之为粗粒度目录表,目录表的容量可以缩小到1MB,但是目录表对不必要的监听的过滤效果会下降,因为在一页中任何一个cache行被保存在远程cache中,对该页中的其他cache行的访问也必须进行远程监听,尽管这个监听注定不会命中;另外粗粒度目录表的维护也有麻烦,因为同一页中可能有多个cache行被远程cache获取,但是粗粒度目录表中没有详细记录哪些行被分配,因此当有cache行从远程cache中被释放时,不能确定本页中是否还有在远程cache中未释放的cache行,也就不能直接判断对应的目录表项是否可以释放,需要主动发出监听命令到远程芯片确认是否还有未被释放的cache行,传统的目录表使用固定的粒度:要不是细粒度获得高精度但是导致目录表容量增大;要不是粗粒度缩小目录表容量但是损失了对无效监听的过滤效果。
发明内容
本发明的目的在于提供用自适应粒度目录表实现片间一致性的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:用自适应粒度目录表实现片间一致性的方法,包括下述步骤:
s1:自适应粒度目录表包括粗粒度目录表和细粒度目录表,细粒度目录表包括正向细粒度目录表和反向细粒度目录表;
s2:对用于本地处理器核和远程处理器核中任一项的内存块,使用粗粒度目录表来记录,粗粒度目录表对应的地址空间范围为内存块;
s3:对于既用于本地处理器核也用于远程处理器核的内存块,可以在粗粒度目录表之外同时使用细粒度目录表来进行精细记录。
优选的,所述粗粒度目录表覆盖整个本地地址空间,每一项代表地址连续的多个cache行,粗粒度目录表每项有两位,其中一位代表对应的地址空间是否被本地cache获取,称为本地获取位;另一项表示对应的地址空间是否被远程cache获取,称为远程获取位,粗粒度目录表对应的地址空间范围为内存块;
正向细粒度目录表中每一项由三部分组成,包括项有效位、基地址和cache行的获取位,正向细粒度目录表的每一项代表粗粒度目录表的一项,cache行获取位的数目和粗粒度目录表的内存块内cache行的数目相等,每一项代表内存块内的一个cache行,当cache行获取位有效时代表对应的cache行在远程cache中保存有副本,需要远程监听,当cache行获取位有效时代表对应的cache行在远程cache中没有保存副本,不需要远程监听,基地址是对应的粗粒度目录表项的内存块基地址;
反向细粒度目录表的结构和正向细粒度目录表结构的差异是:cache行获取位的意义相反:反向细粒度目录表中,当cache行获取位有效时代表在远程cache中没有副本,不需要远程监听,否则需要远程监听。
优选的,包括下述情况:
(1)当系统启动时,粗粒度目录表有效,细粒度目录表无效;粗粒度目录表的所有项的本地获取位和远程获取位都无效,数据既不在本地cache中,也不在远程cache中;
(2)当内存地址被本地cache获取时,粗粒度目录表对应项的本地获取位被设置为有效,代表数据在本地cache中有副本;当某个内存地址被远程cache获取时,粗粒度目录表对应项的远程获取位被设置为有效,代表数据在远程cache中有副本;
(3)当内存地址被远程cache获取时,在粗粒度目录表中的本地获取位已经有效,此内存块既会被本地cache获取也会被远程cache获取,在正向细粒度目录表中分配一项,记录被远程cache获取的cache行;
(4)当内存地址被本地cache获取时,在粗粒度目录表中的远程获取位已经有效,此内存块既会被远程cache获取也会被本地cache获取,如果被本地cache获取的cache行在远程cache中不存在副本,在反向细粒度目录表中分配一项,记录在远程cache中不存在副本的cache行;
(5)当新的访问到来时,命中了正向细粒度目录表和反向细粒度目录表中的任一项,根据细粒度目录表的内容决定是否需要远程监听:当正向细粒度目录表中的cache行获取位有效,需要进行远程监听;当反向细粒度目录表中对应的cache行获取位有效,不需要远程监听;
当新的访问到来时,没有命中任何细粒度目录表,根据粗粒度目录表中对应的远程获取位判断是否进行远程监听。
优选的,所述细粒度目录表的项数小于粗粒度目录表的项数,所有的细粒度目录表都被分配后,当有新的分配请求,将之前分配的细粒度目录表替换。
优选的,对本地监听的过滤通过和本地cache对应的监听过滤器进行,粗粒度目录表每隔一段时间会根据本地获取位有效的项向本地cache或本地cache的监听过滤器发出查询命令,判断在本地cache中是否保存着属于该内存块的cache行副本;当查询的结果是本地cache中已经不存在该内存块的副本,将粗粒度目录表中的该项的本地获取位设置为无效。
优选的,所述粗粒度目录表每隔一段时间根据远程获取位有效的项向远程cache或远程cache的监听过滤器发出查询指令,判断在远程cache中是否保存着属于该内存块的cache行副本;当查询的结果是远程cache中已经不存在该内存块的副本,将粗粒度目录表中的该项的远程获取位设置为无效,并将对应的细粒度目录表释放。
优选的,正向细粒度目录表和反向细粒度目录表采用同一个目录表和不同目录表中的任一项,当采用同一个目录表时,在表项中增加一项用于表示目录表的方向。
与现有技术相比,本方案设计了用自适应粒度目录表实现片间一致性的方法,其有益效果为:
(1)对本地内存的整个地址空间使用粗粒度目录表,对于被远程芯片获取的cache行,使用额外的细粒度目录表,从而避免单独的粗粒度目录表和细粒度目录表各自的问题。
(2)使用粗粒度目录表覆盖整个本地内存空间,再使用细粒度目录表提高对少数本地和远程共用地址的过滤精度,可以用较少的容量达到较高的性能。
(3)正向细粒度目录表和反向细粒度目录表由于只是对cache行获取位的解释不一样,且粗粒度目录表的同一项不会同时分配正向和方向细粒度目录表,所以它们可以是同一个目录表,只是在表项中增加一项表示目录表的方向是正向的还是反向的,这样可以根据实际情况灵活地应用硬件资源。
附图说明
图1为本发明的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:用自适应粒度目录表实现片间一致性的方法,括下述步骤:
s1:自适应粒度目录表包括粗粒度目录表和细粒度目录表,细粒度目录表包括正向细粒度目录表和反向细粒度目录表;
s2:对用于本地处理器核和远程处理器核中任一项的内存块,使用粗粒度目录表来记录,粗粒度目录表对应的地址空间范围为内存块;
s3:对于既用于本地处理器核也用于远程处理器核的内存块,可以额外使用细粒度目录表来进行精确记录。
粗粒度目录表覆盖整个本地地址空间,每一项代表地址连续的多个cache行,粗粒度目录表每项有两位,其中一位代表对应的地址空间是否被本地cache获取,称为本地获取位;另一项表示对应的地址空间是否被远程cache获取,称为远程获取位,粗粒度目录表对应的地址空间范围为内存块;
正向细粒度目录表中每一项由三部分组成,包括项有效位、基地址和cache行的获取位,正向细粒度目录表的每一项代表粗粒度目录表的一项,cache行获取位的数目和粗粒度目录表的内存块内cache行的数目相等,每一项代表内存块内的一个cache行,当cache行获取位有效时代表对应的cache行在远程cache中有副本,需要远程监听,否则不需要远程监听,基地址是对应的粗粒度目录表项的内存块基地址;
反向细粒度目录表的结构和正向细粒度目录表结构的差异是:cache行获取位的意义相反:反向细粒度目录表中,当cache行获取位有效时代表在远程cache中没有副本,不需要远程监听,否则需要远程监听。
用自适应粒度目录表实现片间一致性的方法,包括下述情况:
(1)当系统启动时,粗粒度目录表有效,细粒度目录表无效;粗粒度目录表的所有项的本地获取位和远程获取位都无效,数据既不在本地cache中,也不在远程cache中;
(2)当内存地址被本地cache获取时,粗粒度目录表对应项的本地获取位被设置为有效,代表数据在本地cache中有副本;当某个内存地址被远程cache获取时,粗粒度目录表对应项的远程获取位被设置为有效,代表数据在远程cache中有副本;
(3)当内存地址被远程cache获取时,在粗粒度目录表中的本地获取位已经有效,此内存块既会被本地cache获取也会被远程cache获取,在正向细粒度目录表中分配一项,记录被远程cache获取的cache行;
(4)当内存地址被本地cache获取时,在粗粒度目录表中的远程获取位已经有效,此内存块既会被远程cache获取也会被本地cache获取,如果被本地cache获取的cache行在远程cache中不存在副本,在反向细粒度目录表中分配一项,记录在远程cache中不存在副本的cache行;
(5)当新的访问到来时,命中了正向细粒度目录表和反向细粒度目录表中的任一项,根据细粒度目录表的内容决定是否需要远程监听:当正向细粒度目录表中的cache行获取位有效,需要进行远程监听;当反向细粒度目录表中对应的cache行获取位有效,不需要远程监听;
当新的访问到来时,没有命中任何细粒度目录表,根据粗粒度目录表中对应的远程获取位判断是否进行远程监听。
正向细粒度目录表和反向细粒度目录表由于只是对cache行获取位的解释不一样,且粗粒度目录表的同一项不会同时分配正向和方向细粒度目录表,所以它们可以是同一个目录表,只是在表项中增加一项表示目录表的方向是正向的还是反向的,这样可以根据实际情况灵活地应用硬件资源,根据实际情况决定哪些项属于正向细粒度目录表。
使用粗粒度目录表覆盖整个本地内存空间,再使用细粒度目录表提高对少数本地和远程共用地址的过滤精度,可以用较少的容量达到较高的性能;以本地32GB内存,512位cache行宽度为例,假设粗粒度目录表的内存块大小是4MB,则粗粒度目录表的容量是(32GB/4MB)*2bit=2KB,正反向细粒度目录表共用同一套硬件资源,每项的容量是:有效位1位+方向位1位+cache行地址29位+cache行获取位65536位=65567位,如果细粒度目录表有512项则细粒度目录表的容量是65567位*512≈4098KB,加上粗粒度目录表只需要4100KB的容量,完全可以在片上RAM上实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (7)

1.用自适应粒度目录表实现片间一致性的方法,其特征在于,包括下述步骤:
s1:自适应粒度目录表包括粗粒度目录表和细粒度目录表,细粒度目录表包括正向细粒度目录表和反向细粒度目录表;
s2:对用于本地处理器核和远程处理器核中任一项的内存块,使用粗粒度目录表来记录,粗粒度目录表对应的地址空间范围为内存块;
s3:对于既用于本地处理器核也用于远程处理器核的内存块,可以在粗粒度目录表之外同时使用细粒度目录表进行更精确的记录。
2.根据权利要求1所述的用自适应粒度目录表实现片间一致性的方法,其特征在于:
所述粗粒度目录表覆盖整个本地地址空间,每一项代表地址连续的多个cache行,粗粒度目录表每项有两位,其中一位代表对应的地址空间是否被本地cache获取,称为本地获取位;另一项表示对应的地址空间是否被远程cache获取,称为远程获取位,粗粒度目录表对应的地址空间范围为内存块;
正向细粒度目录表中每一项由三部分组成,包括项有效位、基地址和cache行的获取位,正向细粒度目录表的每一项代表粗粒度目录表的一项,cache行获取位的数目和粗粒度目录表的内存块内cache行的数目相等,每一位代表内存块内的一个cache行,当cache行获取位有效时代表对应的cache行在远程cache中保存有副本,需要远程监听,当cache行获取位有效时代表对应的cache行在远程cache中没有保存副本,不需要远程监听,基地址是对应的粗粒度目录表项的内存块基地址;
反向细粒度目录表的结构和正向细粒度目录表结构的差异是:cache行获取位的意义相反:反向细粒度目录表中,当cache行获取位有效时代表在远程cache中没有副本,不需要远程监听,否则需要远程监听。
3.根据权利要求1所述的用自适应粒度目录表实现片间一致性的方法,其特征在于,包括下述情况:
(1)当系统启动时,粗粒度目录表有效,细粒度目录表无效;粗粒度目录表的所有项的本地获取位和远程获取位都无效,数据既不在本地cache中,也不在远程cache中;
(2)当内存地址被本地cache获取时,粗粒度目录表对应项的本地获取位被设置为有效,代表数据在本地cache中有副本;当某个内存地址被远程cache获取时,粗粒度目录表对应项的远程获取位被设置为有效,代表数据在远程cache中有副本;
(3)当内存地址被远程cache获取时,在粗粒度目录表中的本地获取位已经有效,此内存块既会被本地cache获取也会被远程cache获取,在正向细粒度目录表中分配一项,记录被远程cache获取的cache行;
(4)当内存地址被本地cache获取时,在粗粒度目录表中的远程获取位已经有效,此内存块既会被远程cache获取也会被本地cache获取,如果被本地cache获取的cache行在远程cache中不存在副本,在反向细粒度目录表中分配一项,记录在远程cache中不存在副本的cache行;
(5)当新的访问到来时,命中了正向细粒度目录表和反向细粒度目录表中的任一项,根据细粒度目录表的内容决定是否需要远程监听:当正向细粒度目录表中的cache行获取位有效,需要进行远程监听;当反向细粒度目录表中对应的cache行获取位有效,不需要远程监听;
当新的访问到来时,没有命中任何细粒度目录表,根据粗粒度目录表中对应的远程获取位判断是否进行远程监听。
4.根据权利要求2所述的用自适应粒度目录表实现片间一致性的方法,其特征在于:所述细粒度目录表的项数小于粗粒度目录表的项数,所有的细粒度目录表都被分配后,当有新的分配请求,将之前分配的细粒度目录表替换。
5.根据权利要求2所述的用自适应粒度目录表实现片间一致性的方法,其特征在于:对本地监听的过滤通过和本地cache对应的监听过滤器进行,粗粒度目录表每隔一段时间会根据本地获取位有效的项向本地cache或本地cache的监听过滤器发出查询命令,判断在本地cache中是否保存着属于该内存块的cache行副本;当查询的结果是本地cache中已经不存在该内存块的副本,将粗粒度目录表中的该项的本地获取位设置为无效。
6.根据权利要求2所述的用自适应粒度目录表实现片间一致性的方法,其特征在于:所述粗粒度目录表每隔一段时间根据远程获取位有效的项向远程cache或远程cache的监听过滤器发出查询指令,判断在远程cache中是否保存着属于该内存块的cache行副本;当查询的结果是远程cache中已经不存在该内存块的副本,将粗粒度目录表中的该项的远程获取位设置为无效,并将对应的细粒度目录表释放。
7.根据权利要求2所述的用自适应粒度目录表实现片间一致性的方法,其特征在于:正向细粒度目录表和反向细粒度目录表采用同一个目录表和不同目录表中的任一项,当采用同一个目录表时,在表项中增加一项用于表示目录表的方向。
CN202010331793.0A 2020-04-24 2020-04-24 用自适应粒度目录表实现片间一致性的方法 Active CN113553274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010331793.0A CN113553274B (zh) 2020-04-24 2020-04-24 用自适应粒度目录表实现片间一致性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010331793.0A CN113553274B (zh) 2020-04-24 2020-04-24 用自适应粒度目录表实现片间一致性的方法

Publications (2)

Publication Number Publication Date
CN113553274A true CN113553274A (zh) 2021-10-26
CN113553274B CN113553274B (zh) 2023-09-12

Family

ID=78101240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010331793.0A Active CN113553274B (zh) 2020-04-24 2020-04-24 用自适应粒度目录表实现片间一致性的方法

Country Status (1)

Country Link
CN (1) CN113553274B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310414A (ja) * 2007-06-12 2008-12-25 Hitachi Ltd コンピュータシステム
US20090216954A1 (en) * 2008-02-27 2009-08-27 Michael Thomas Benhase Apparatus, system, and method for selecting a space efficient repository
CN102362464A (zh) * 2011-04-19 2012-02-22 华为技术有限公司 内存访问监测方法和装置
US20140244606A1 (en) * 2013-01-18 2014-08-28 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for storing, reading the directory index
US20150058570A1 (en) * 2013-03-22 2015-02-26 Inspur Electronic Information Industry Co., Ltd. Method of constructing share-f state in local domain of multi-level cache coherency domain system
CN107341114A (zh) * 2016-04-29 2017-11-10 华为技术有限公司 一种目录管理的方法、节点控制器和系统
US20170351600A1 (en) * 2016-06-02 2017-12-07 AO Kaspersky Lab System and method of transfer of control between memory locations
US20190050333A1 (en) * 2018-06-29 2019-02-14 Gino CHACON Adaptive granularity for reducing cache coherence overhead
CN110727464A (zh) * 2019-09-11 2020-01-24 无锡江南计算技术研究所 一种针对访存空间独立的多核处理器的信息处理方法
CN110990299A (zh) * 2020-03-03 2020-04-10 江苏华创微系统有限公司 非规整组相联cache组地址映射方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310414A (ja) * 2007-06-12 2008-12-25 Hitachi Ltd コンピュータシステム
US20090216954A1 (en) * 2008-02-27 2009-08-27 Michael Thomas Benhase Apparatus, system, and method for selecting a space efficient repository
CN102362464A (zh) * 2011-04-19 2012-02-22 华为技术有限公司 内存访问监测方法和装置
US20140244606A1 (en) * 2013-01-18 2014-08-28 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for storing, reading the directory index
US20150058570A1 (en) * 2013-03-22 2015-02-26 Inspur Electronic Information Industry Co., Ltd. Method of constructing share-f state in local domain of multi-level cache coherency domain system
CN107341114A (zh) * 2016-04-29 2017-11-10 华为技术有限公司 一种目录管理的方法、节点控制器和系统
US20170351600A1 (en) * 2016-06-02 2017-12-07 AO Kaspersky Lab System and method of transfer of control between memory locations
US20190050333A1 (en) * 2018-06-29 2019-02-14 Gino CHACON Adaptive granularity for reducing cache coherence overhead
CN110727464A (zh) * 2019-09-11 2020-01-24 无锡江南计算技术研究所 一种针对访存空间独立的多核处理器的信息处理方法
CN110990299A (zh) * 2020-03-03 2020-04-10 江苏华创微系统有限公司 非规整组相联cache组地址映射方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐卫志;宋风龙;刘志勇;范东睿;余磊;张帅;: "众核处理器片上同步机制和评估方法研究", 计算机学报, no. 10, pages 1777 - 1787 *

Also Published As

Publication number Publication date
CN113553274B (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
US6338123B2 (en) Complete and concise remote (CCR) directory
JP2540517B2 (ja) 階層キヤツシユメモリ装置および方法
US7774551B2 (en) Hierarchical cache coherence directory structure
US9792210B2 (en) Region probe filter for distributed memory system
US7669018B2 (en) Method and apparatus for filtering memory write snoop activity in a distributed shared memory computer
US6901483B2 (en) Prioritizing and locking removed and subsequently reloaded cache lines
US6446188B1 (en) Caching dynamically allocated objects
US8234451B1 (en) Caching in multicore and multiprocessor architectures
EP2437433B1 (en) Memory access monitoring method and device
US6826651B2 (en) State-based allocation and replacement for improved hit ratio in directory caches
KR100978156B1 (ko) 스누프 필터에서의 실효를 감소시키기 위한 라인 스와핑 스킴을 위한 방법, 장치, 시스템 및 컴퓨터 판독 가능 기록 매체
US9575893B2 (en) Snoop filter for multi-processor system and related snoop filtering method
KR20110059764A (ko) 액티브 로우를 이용하는 캐시 필터링
US7117312B1 (en) Mechanism and method employing a plurality of hash functions for cache snoop filtering
US20020078304A1 (en) System and method for allocating a directory entry for use in multiprocessor-node data processing systems
US20090193199A1 (en) Method for Increasing Cache Directory Associativity Classes Via Efficient Tag Bit Reclaimation
US8261022B2 (en) Method and apparatus for adaptive cache frame locking and unlocking
CN106164874B (zh) 多核系统中数据访问者目录的访问方法及设备
US20140297961A1 (en) Selective cache fills in response to write misses
CN111273860B (zh) 一种基于网络和页粒度管理的分布式内存管理方法
CN111666230B (zh) 在组相联tlb中支持巨页的方法
CN113553274A (zh) 用自适应粒度目录表实现片间一致性的方法
KR100300792B1 (ko) 공유 메모리 멀티프로세서용 계층적 버스 단순 코마 구조
US6901450B1 (en) Multiprocessor machine and cache control method for providing higher priority to shared cache that is accessed by multiprocessors
US6792512B2 (en) Method and system for organizing coherence directories in shared memory systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant