CN111158600B - 一种提升高带宽存储器(hbm)访问效率的装置和方法 - Google Patents
一种提升高带宽存储器(hbm)访问效率的装置和方法 Download PDFInfo
- Publication number
- CN111158600B CN111158600B CN201911393975.4A CN201911393975A CN111158600B CN 111158600 B CN111158600 B CN 111158600B CN 201911393975 A CN201911393975 A CN 201911393975A CN 111158600 B CN111158600 B CN 111158600B
- Authority
- CN
- China
- Prior art keywords
- memory
- storage
- access
- channel
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
本发明公开了一种提升高带宽存储器(HBM)访问效率的装置和方法,方法实施步骤包括统计高带宽存储器不同存储通道的访问量,按照访问量大小对存储通道排序,通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器较低的存储层上;装置包括存储通道访问统计模块、访问量排序模块、重映射模块;存储控制器包括存储器本体以及前述装置;存储器包括带有存储控制器的存储器本体及前述存储控制器;计算机装置包括带有存储器的计算机装置本体以及前述存储器。本发明能够有效利用高带宽存储器中不同存储层延迟不均衡性、充分开发利用低存储层的低延迟特性提升高带宽存储器整体的访问效率,具有实现简单、操作方便、运行高效的优点。
Description
技术领域
本发明涉及处理器领域,具体涉及一种提升高带宽存储器(HBM)访问效率的装置和方法,用于提升处理器中降低高带宽存储器(HBM)的访问延迟。
背景技术
随着处理器的不断发展,存储器的带宽成为处理器整体性能的关键限制因素。高带宽存储器(High Bandwidth Memory HBM)采用3D堆叠存储层的方式极大的提升了存储系统的带宽,逐渐成为高性能处理器的主流存储技术。3D堆叠存储层的结构在带来存储带宽提升的同时,也引入了不同存储层的访问延迟不均衡的特性。在HBM中不同的存储通道映射到不同的存储层中,从最底层到最高层存储,随着与运算逻辑距离的逐渐增大,访存延迟也逐渐增加。一直以来,业界都缺乏对上述不同存储层间访问延迟不均衡性的有效开发,无法充分发挥高带宽存储器的潜在效率。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种提升高带宽存储器(HBM)访问效率的装置和方法,本发明能够有效利用高带宽存储器中不同存储层延迟不均衡性、充分开发利用低存储层的低延迟特性提升高带宽存储器整体的访问效率,具有实现简单、操作方便、运行高效的优点。
为了解决上述技术问题,本发明采用的技术方案为:
一种提升高带宽存储器访问效率的装置,包括:
存储通道访问统计模块,用于统计高带宽存储器不同存储通道的访问量;
访问量排序模块,用于按照访问量大小对存储通道进行排序;
重映射模块,用于通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上。
可选地,所述存储通道访问统计模块包括:
位翻转监控阵列,挂载在高带宽存储器的存储总线上,用于根据存储通道的每一个有效访问触发对应存储通道的访问量计数;
按位累加器阵列,用于记录各个存储通道的访问量计数;
控制部件,用于使能和重置存储通道访问统计模块并提供对外的访问量计数读取操作。
可选地,所述位翻转监控阵列包括N个监控单元,所述监控单元与累加器以及存储通道一一对应,每一个监控单元用于根据对应存储通道的每一个有效访问触发该存储通道的计数操作,其中N为访存地址位宽。
可选地,所述按位累加器阵列包括N个累加器,每一个累加器与存储通道一一对应,累加器仅需支持加1操作,当累加值达到最大值时取消后续累加、且保持最大值直至累加器被重置。
本发明还提供一种存储控制器,包括存储器本体,所述存储器本体中集成或者挂载有前述提升高带宽存储器访问效率的装置
本发明还提供一种存储器,包括带有存储控制器的存储器本体,所述存储控制器为前述的存储控制器。
此外,本发明还提供一种提升高带宽存储器访问效率的方法,实施步骤包括:
1)统计高带宽存储器不同存储通道的访问量;
2)按照访问量大小对存储通道进行排序;
3)通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上。
可选地,步骤1)的详细步骤包括:通过N个累加器来记录高带宽存储器的N位存储通道的访问量,且每一个累加器与存储通道一一对应,每一个累加器仅需支持加1操作,当累加值达到最大值时取消后续累加、保持最大值直至累加器被重置,其中N为访存地址位宽。
可选地,步骤2)中的排序具体是指从大到小的排序。
可选地,步骤3)中通过存储地址的重映射把访问量较大的存储通道地址映射到较低的存储层上具体是指:针对按照访问量大小排序后的存储通道,从高带宽存储器最底层存储层开始从低到高顺序映射存储通道与存储层,使得一个或者多个存储通道映射到同一个存储层上,且任意映射到较低存储层上的存储通道的访问量高于映射到较高存储层上的存储通道的访问量。
和现有技术相比,本发明具有下述优点:本发明能够有效利用高带宽存储器中不同存储层延迟不均衡性、充分开发利用低存储层的低延迟特性提升高带宽存储器整体的访问效率,具有实现简单、操作方便、运行高效的优点。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例方法的重映射原理示意图。
图3为本发明实施例装置的结构示意图。
图4为本发明实施例装置的存储通道访问统计模块结构示意图。
具体实施方式
如图1所示,本实施例提升高带宽存储器访问效率的方法的实施步骤包括:
1)统计高带宽存储器不同存储通道的访问量;
2)按照访问量大小对存储通道进行排序;
3)通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上。
本实施例中,步骤1)的详细步骤包括:通过N个累加器来记录高带宽存储器的N位存储通道的访问量,且每一个累加器与存储通道一一对应,每一个累加器仅需支持加1操作,当累加值达到最大值时取消后续累加、保持最大值直至累加器被重置,其中N为访存地址位宽。本实施例中,访存地址位宽为40bit,因此通过40个累加器来记录高带宽存储器的40位存储通道的访问量,访存地址位宽可根据实际系统进行累加器的位宽扩展或缩减,对应地N也需要进行适应性调整。
本实施例中,步骤2)中的排序具体是指从大到小的排序。此外,也可以根据需要采用从小到大的顺序,一样也可以实现通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上。
如图2所示,步骤3)中通过存储地址的重映射把访问量较大的存储通道地址映射到较低的存储层上具体是指:针对按照访问量大小排序后的存储通道,从高带宽存储器最底层存储层开始从低到高顺序映射存储通道与存储层,使得一个或者多个存储通道映射到同一个存储层上(图2为采用一个示例),且任意映射到较低存储层上的存储通道的访问量高于映射到较高存储层上的存储通道的访问量。参见图2,本实施例基于通道访问量的存储通道与存储层映射方法分为两个步骤,第一:根据不同存储通道的访问量进行从大到小的排序;第二:基于访问量从大到小的排序,从最底层存储层开始,从低到高顺序映射存储通道与存储层次,使得访问量大的存储通道映射到存储层次较低的的存储层上。从而实现对具有较低延迟的存储层次更为充分的利用和开发。作为一般情况,可将多个存储通道映射到同一个存储层次上,但需要保证在较低存储层上的存储通道的访问量高于较高存储层上的存储通道。
如图3所示,本实施例提升高带宽存储器访问效率的装置包括:
存储通道访问统计模块,用于统计高带宽存储器不同存储通道的访问量;
访问量排序模块,用于按照访问量大小对存储通道进行排序;
重映射模块,用于通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上。
如图4所示,存储通道访问统计模块包括:
位翻转监控阵列,挂载在高带宽存储器的存储总线上,用于根据存储通道的每一个有效访问触发对应存储通道的访问量计数;
按位累加器阵列,用于记录各个存储通道的访问量计数;
控制部件,用于使能和重置存储通道访问统计模块并提供对外的访问量计数读取操作。
如图4所示,本实施例中位翻转监控阵列包括N个监控单元,所述监控单元与累加器以及存储通道一一对应,每一个监控单元用于根据对应存储通道的每一个有效访问触发该存储通道的计数操作,其中N为访存地址位宽。
如图4所示,本实施例中按位累加器阵列包括N个累加器,每一个累加器与存储通道一一对应,累加器仅需支持加1操作,当累加值达到最大值时取消后续累加、且保持最大值直至累加器被重置。
在处理器设计过程中,存储通道访问统计模块可以集成在存储器控制器中,或者作为单独的部件挂接在存储控制器的控制总线上。作为一般情况,可将累加器按照只读的配置寄存器进行处理。
此外,本实施例还提供一种存储控制器,包括存储器本体,该存储器本体中集成或者挂载有前述的提升高带宽存储器访问效率的装置
此外,本实施例还提供一种存储器,包括带有存储控制器的存储器本体,该存储控制器为前述的存储控制器。
此外,本实施例还提供一种计算机装置,包括带有存储器的计算机装置本体,该存储器为前述的存储器。
上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围的情况下,都可利用上述揭示的技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。
Claims (9)
1.一种提升高带宽存储器访问效率的装置,其特征在于包括:
存储通道访问统计模块,用于统计高带宽存储器不同存储通道的访问量;
访问量排序模块,用于按照访问量大小对存储通道进行排序;
重映射模块,用于通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上,所述通过存储地址的重映射把访问量较大的存储通道地址映射到较低的存储层上具体是指:针对按照访问量大小排序后的存储通道,从高带宽存储器最底层存储层开始从低到高顺序映射存储通道与存储层,使得一个或者多个存储通道映射到同一个存储层上,且任意映射到较低存储层上的存储通道的访问量高于映射到较高存储层上的存储通道的访问量。
2.根据权利要求1所述的提升高带宽存储器访问效率的装置,其特征在于,所述存储通道访问统计模块包括:
位翻转监控阵列,挂载在高带宽存储器的存储总线上,用于根据存储通道的每一个有效访问触发对应存储通道的访问量计数;
按位累加器阵列,用于记录各个存储通道的访问量计数;
控制部件,用于使能和重置存储通道访问统计模块并提供对外的访问量计数读取操作。
3.根据权利要求2所述的提升高带宽存储器访问效率的装置,其特征在于,所述位翻转监控阵列包括N个监控单元,所述监控单元与累加器以及存储通道一一对应,每一个监控单元用于根据对应存储通道的每一个有效访问触发该存储通道的计数操作,其中N为访存地址位宽。
4.根据权利要求2所述的提升高带宽存储器访问效率的装置,其特征在于,所述按位累加器阵列包括N个累加器,每一个累加器与存储通道一一对应,累加器仅需支持加1操作,当累加值达到最大值时取消后续累加、且保持最大值直至累加器被重置。
5.一种存储控制器,包括存储器本体,其特征在于,所述存储器本体中集成或者挂载有权利要求1~4中任意一项所述的提升高带宽存储器访问效率的装置。
6.一种存储器,包括带有存储控制器的存储器本体,其特征在于,所述存储控制器为权利要求5所述的存储控制器。
7.一种提升高带宽存储器访问效率的方法,其特征在于实施步骤包括:
1)统计高带宽存储器不同存储通道的访问量;
2)按照访问量大小对存储通道进行排序;
3)通过存储地址的重映射把访问量较大的存储通道地址映射到高带宽存储器中较低的存储层上,所述通过存储地址的重映射把访问量较大的存储通道地址映射到较低的存储层上具体是指:针对按照访问量大小排序后的存储通道,从高带宽存储器最底层存储层开始从低到高顺序映射存储通道与存储层,使得一个或者多个存储通道映射到同一个存储层上,且任意映射到较低存储层上的存储通道的访问量高于映射到较高存储层上的存储通道的访问量。
8.根据权利要求7所述的提升高带宽存储器访问效率的方法,其特征在于,步骤1)的详细步骤包括:通过N个累加器来记录高带宽存储器的N位存储通道的访问量,且每一个累加器与存储通道一一对应,每一个累加器仅需支持加1操作,当累加值达到最大值时取消后续累加、保持最大值直至累加器被重置,其中N为访存地址位宽。
9.根据权利要求7所述的提升高带宽存储器访问效率的方法,其特征在于,步骤2)中的排序具体是指从大到小的排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911393975.4A CN111158600B (zh) | 2019-12-30 | 2019-12-30 | 一种提升高带宽存储器(hbm)访问效率的装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911393975.4A CN111158600B (zh) | 2019-12-30 | 2019-12-30 | 一种提升高带宽存储器(hbm)访问效率的装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111158600A CN111158600A (zh) | 2020-05-15 |
CN111158600B true CN111158600B (zh) | 2023-10-27 |
Family
ID=70559141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911393975.4A Active CN111158600B (zh) | 2019-12-30 | 2019-12-30 | 一种提升高带宽存储器(hbm)访问效率的装置和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111158600B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116097233A (zh) * | 2020-11-27 | 2023-05-09 | 华为技术有限公司 | 存储芯片、存储设备及其访问方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146340A (ja) * | 2004-11-16 | 2006-06-08 | Canon Inc | メモリ制御装置及びメモリ制御方法 |
CN101141296A (zh) * | 2007-08-16 | 2008-03-12 | 华为技术有限公司 | 通道化逻辑单通道统计的方法和装置 |
CN104850501A (zh) * | 2015-04-29 | 2015-08-19 | 中国人民解放军国防科学技术大学 | 一种ddr存储器访存地址映射方法及访存地址映射单元 |
CN107729261A (zh) * | 2017-09-28 | 2018-02-23 | 中国人民解放军国防科技大学 | 一种多核/众核处理器中Cache地址映射方法 |
CN110531935A (zh) * | 2019-08-29 | 2019-12-03 | 北京计算机技术及应用研究所 | 一种基于物理页相对温度的slc闪存磨损均衡方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006236105A (ja) * | 2005-02-25 | 2006-09-07 | Canon Inc | アクセス制御装置及びその制御方法 |
US9218285B2 (en) * | 2012-11-26 | 2015-12-22 | Arm Limited | Variable mapping of memory accesses to regions within a memory |
US10503655B2 (en) * | 2016-07-21 | 2019-12-10 | Advanced Micro Devices, Inc. | Data block sizing for channels in a multi-channel high-bandwidth memory |
-
2019
- 2019-12-30 CN CN201911393975.4A patent/CN111158600B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146340A (ja) * | 2004-11-16 | 2006-06-08 | Canon Inc | メモリ制御装置及びメモリ制御方法 |
CN101141296A (zh) * | 2007-08-16 | 2008-03-12 | 华为技术有限公司 | 通道化逻辑单通道统计的方法和装置 |
CN104850501A (zh) * | 2015-04-29 | 2015-08-19 | 中国人民解放军国防科学技术大学 | 一种ddr存储器访存地址映射方法及访存地址映射单元 |
CN107729261A (zh) * | 2017-09-28 | 2018-02-23 | 中国人民解放军国防科技大学 | 一种多核/众核处理器中Cache地址映射方法 |
CN110531935A (zh) * | 2019-08-29 | 2019-12-03 | 北京计算机技术及应用研究所 | 一种基于物理页相对温度的slc闪存磨损均衡方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111158600A (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936418B2 (en) | Reduced uncorrectable memory errors | |
US8924631B2 (en) | Method and system for random write unalignment handling | |
US9836277B2 (en) | In-memory popcount support for real time analytics | |
KR102196747B1 (ko) | 메모리 시스템에서 데이터 구조들을 세그먼트하기 위한 시스템들 및 방법들 | |
US20170286311A1 (en) | Repetitive address indirection in a memory | |
US20190018805A1 (en) | System and method for fast execution of in-capsule commands | |
TWI457758B (zh) | 包含記憶體系統控制器之裝置及相關方法 | |
US10339079B2 (en) | System and method of interleaving data retrieved from first and second buffers | |
TWI463314B (zh) | 包含記憶體系統控制器之裝置及相關方法 | |
WO2017209887A9 (en) | Dynamic host memory buffer allocation | |
TW201303718A (zh) | 包含記憶體系統控制器之裝置及相關方法 | |
US20130060992A1 (en) | Data compression method | |
US9413358B2 (en) | Forward counter block | |
KR20160143744A (ko) | 로컬 메모리를 갖는 제어기를 가진 메모리 디바이스 | |
US20180067661A1 (en) | Memory wear leveling | |
JP7430282B2 (ja) | マルチバンクメモリコマンドの動的統合 | |
US11237903B2 (en) | Technologies for providing ECC pre-provisioning and handling for cross-point memory and compute operations | |
US20130061009A1 (en) | High Performance Free Buffer Allocation and Deallocation | |
CN111158600B (zh) | 一种提升高带宽存储器(hbm)访问效率的装置和方法 | |
US10452312B2 (en) | Apparatus, system, and method to determine a demarcation voltage to use to read a non-volatile memory | |
US10152352B2 (en) | Writing to contiguous memory addresses in a network on a chip architecture | |
US11720280B2 (en) | Storage system and method for improving utilization of a communication channel between a host and the storage system | |
US11086804B2 (en) | Storage system and method for reducing read-retry duration | |
CN107844265A (zh) | 操作计算系统的方法以及操作计算系统中的存储器控制器的方法 | |
US20180350428A1 (en) | Semiconductor device and method of driving the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |