CN109582226A - 一种高速存储访问逻辑结构及其控制方法 - Google Patents

一种高速存储访问逻辑结构及其控制方法 Download PDF

Info

Publication number
CN109582226A
CN109582226A CN201811351007.2A CN201811351007A CN109582226A CN 109582226 A CN109582226 A CN 109582226A CN 201811351007 A CN201811351007 A CN 201811351007A CN 109582226 A CN109582226 A CN 109582226A
Authority
CN
China
Prior art keywords
access
high speed
memory
memory array
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811351007.2A
Other languages
English (en)
Inventor
何宁宁
刘戬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing CEC Huada Electronic Design Co Ltd
Original Assignee
Beijing CEC Huada Electronic Design Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing CEC Huada Electronic Design Co Ltd filed Critical Beijing CEC Huada Electronic Design Co Ltd
Priority to CN201811351007.2A priority Critical patent/CN109582226A/zh
Publication of CN109582226A publication Critical patent/CN109582226A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0658Controller construction arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Abstract

本发明涉及一种高速存储访问逻辑结构及其控制方法,其包括:数据处理单元、CPU、存储控制器和存储器阵列;数据处理单元进行算法运算,CPU进行算法运算的源数据配置和结果数据读取,存储控制器进行数据处理单元和CPU对存储器阵列的访问控制,存储器阵列中存储数据处理单元的源数据和结果数据。在物联网、云计算等云端服务器应用中,此存储访问逻辑结构用于支持高速和高安全性的算法运算,从而实现云端服务器的算法运算服务在底层硬件运算级的加速。

Description

一种高速存储访问逻辑结构及其控制方法
技术领域
本发明涉及一种高速存储访问逻辑结构及其控制方法。
背景技术
在物联网、云计算等应用中,云端服务器提供着各种算法服务,比如深度学习算法的加速服务、签名和验签中的密码算法运算服务等,为了满足瞬时多则数以万计的算法服务请求,需要云端服务器具有高速的数据处理单元。
设计高速存储访问逻辑结构是实现高速数据处理单元的一种可行方案。在常规数据处理单元的设计中,受限于不同工艺下存储器的规格,存储器的访问位宽一般为32bit或64bit,而算法运算的位宽根据需求不同可能高达几百甚至上千bit,比如国密SM2算法的点乘运算操作数位宽为256bit。支持大位宽数据读取和写入的存储结构不仅可以缩短算法运算的数据加载、保存时间,更为大位宽的算法运算操作提供了实现基础。
本发明以云端服务器为例进行介绍,但不局限于云端服务器应用,其他高速数据处理应用均属于专利保护范畴。
发明内容
本发明提供一种高速存储访问逻辑结构,数据存储采用大位宽操作模式,支持大位宽算法运算,能满足高速性能要求与存储安全性要求。
本发明提供一种高速存储访问逻辑结构的控制方法,实现电路功耗与存储安全性调控。
根据本发明,一种高速存储访问逻辑结构包括数据处理单元(101)、CPU(102)、存储控制器(103)和存储器阵列(104);数据处理单元(101)进行算法运算,CPU(102)进行算法运算的源数据配置和结果数据读取,存储控制器(103)进行数据处理单元(101)和CPU(102)对存储器阵列(104)的访问控制,存储器阵列(104)中存储算法运算的源数据和结果数据。
在一种高速存储访问逻辑结构中,对于存储器阵列(104)的访问有两种外部接口,分别为CPU(102)的N0位宽接口访问和数据处理单元(101)的N1位宽接口访问,这两种接口的访问在存储控制器(103)中进行仲裁后产生真正的存储器访问逻辑;存储控制器(103)由地址仲裁器(110)、数据仲裁器(111)、时钟仲裁器(112)和安全存储控制器(113)组成。
在一种高速存储访问逻辑结构中,N0的取值为32,N1的取值为32*k,其中k取大于零的自然数。
在一种高速存储访问逻辑结构中,存储器阵列(104)可以采用单体多字存储或多体交叉存储方式,阵列内的每一个存储器均为N2位宽接口访问,N2的取值为32或64,阵列内存储器的数量为m=N1/N2。
在一种高速存储访问逻辑结构中,地址仲裁器(110)实现CPU(102)和数据处理单元(101)的逻辑地址到存储器阵列(104)中每一个存储器物理地址的映射,为抵抗模板攻击,映射关系在每次公钥运算结束后进行更新。
在一种高速存储访问逻辑结构中,数据仲裁器(111)实现CPU(102)和数据处理单元(101)对存储器阵列(104)的访问数据的选择,选择方式采用逻辑或操作。
在一种高速存储访问逻辑结构中,时钟仲裁器(112)实现CPU(102)和数据处理单元(101)两种访问模式下存储器阵列(104)的工作时钟切换,切换方式为无毛刺时钟切换电路或门控时钟电路。
在一种高速存储访问逻辑结构中,安全存储控制器(113)实现CPU(102)访问模式下对存储器阵列(104)中每一个存储器工作时钟的单独控制,通过控制时钟的开启和关闭可以实现低功耗模式或功耗均衡模式。
根据本发明的另一方面,一种高速存储访问逻辑结构的控制方法如下。
(1)根据访问的片选使能信号确定访问主体。
(2)解析逻辑地址与物理地址之间采用逆序映射关系。
(3)解析实际读取/写入数据与存储器阵列中每个存储器的读取/写入数据映射关系。
(4)当在CPU(102)访问模式下时,可根据安全性和功耗要求之间的权衡,单独控制开启一个或多个存储器的工作时钟。
(5)在算法运算结束时根据外部输入的随机数选择映射关系切换点,更新逻辑地址与物理地址的映射关系,映射方式为以切换点为分界点,高低存储区分别逆序映射。
附图说明
图1是一种高速存储访问逻辑结构示意图。
图2是说明在图1中地址仲裁器与数据仲裁器连接关系的示意图。
图3是说明在图1中时钟仲裁器与安全存储控制器连接关系的示意图。
图4是一种高速存储访问逻辑结构的控制方法示意图
具体实施方式
为了更清楚地描述本发明的技术方案,以下结合附图和具体实施例对本发明进行详细的说明。
如图1所示,一种高速存储访问逻辑结构包括数据处理单元(101)、CPU(102)、存储控制器(103)和存储器阵列(104),存储控制器(103)由地址仲裁器(110)、数据仲裁器(111)、时钟仲裁器(112)、安全存储控制器(113)组成。
CPU(102)对存储器阵列(104)的访问接口位宽为N0,数据处理单元(101)对存储器阵列(104)的访问接口位宽为N1,存储器阵列(104)中每一个存储器的访问接口位宽为N2,存储器阵列中存储器的个数m=N1/N2,其中N0的取值为32,N2的取值为32或64,N1的取值为32*k,其中k为大于零的自然数。
数据处理单元(101)可以为深度学习算法运算单元、密码算法运算单元等各种算法运算单元。
存储器阵列(104)可以采用单体多字存储或多体交叉存储方式。
地址仲裁器(110)实现CPU(102)和数据处理单元(101)的逻辑地址到存储器阵列(104)中每一个存储器物理地址的映射,为抵抗模板攻击,映射关系在每次算法运算结束后进行更新。
数据仲裁器(111)实现CPU(102)和数据处理单元(101)对存储器阵列(104)的访问数据的选择,选择方式采用逻辑或操作。
时钟仲裁器(112)实现CPU(102)和数据处理单元(101)两种访问模式下存储器阵列(104)的工作时钟切换,切换方式为无毛刺时钟切换电路或门控时钟电路。
安全存储控制器(113)实现CPU(102)访问模式下对存储器阵列(104)中每一个存储器工作时钟的单独控制,通过控制时钟的开启和关闭可以实现低功耗模式或功耗均衡模式。
如图2所示,地址仲裁器(110)根据访问模式解析CPU(102)访问地址或数据处理单元(101)访问地址,仲裁得到实际访问地址,实际访问地址即为存储器阵列(104)中每一个存储器的物理地址。数据仲裁器(111)根据访问模式解析实际读取或存储的数据与存储器阵列(104)中每一个存储器的映射关系。
如图3所示,时钟仲裁器(112)根据访问模式解析CPU(102)访问时钟或数据处理单元(101)访问时钟,仲裁得到实际的存储器时钟。根据访问模式不同,存储器时钟将在安全存储控制器的作用下分别单独控制存储器阵列(104)中每一个存储器工作时钟的启停。
如图4所示,一种高速存储访问逻辑结构的控制方法分为如下五个步骤:
(1)根据访问的片选使能信号确定访问主体。
(2)解析逻辑地址与物理地址之间的映射关系。
(3)解析实际读取/写入数据与存储器阵列中每个存储器的读取/写入数据映射关系。
(4)当在CPU(102)访问模式下时,可根据安全性和功耗要求之间的权衡,单独控制开启一个或多个存储器的工作时钟。
(5)在算法运算结束时根据外部输入的随机数选择映射关系切换点,更新逻辑地址与物理地址的映射关系,映射方式为以切换点为分界点,高低存储区分别逆序映射。

Claims (13)

1.一种高速存储访问逻辑结构,其特征在于,主要包括:对于存储器阵列(104)的访问有两种外部接口,分别为CPU(102)的N0位宽接口访问和数据处理单元(101)的N1位宽接口访问,这两种接口的访问在存储控制器(103)中进行仲裁后产生真正的存储器访问逻辑;存储控制器(103)由地址仲裁器(110)、数据仲裁器(111)、时钟仲裁器(112)和安全存储控制器(113)组成,地址仲裁器(110)和数据仲裁器(111)配合实现地址映射解析和数据通路选通,时钟仲裁器(112)和安全存储控制器(113)协同进行功耗与安全性能的调控;存储器阵列(104)由m个存储器组成。
2.根据权利要求1所述的一种高速存储访问逻辑结构,其特征在于所述N0位宽接口访问的取值为32,所述N1位宽接口访问的取值为32*k,其中k取大于零的自然数。
3.根据权利要求1所述的一种高速存储访问逻辑结构,其特征在于所述存储器阵列(104)采用单体多字存储或多体交叉存储方式,阵列内的每一个存储器均为N2位宽接口访问,N2的取值为32或64,阵列内存储器的数量为m=N1/N2,m应为大于零的自然数。
4.根据权利要求1所述的一种高速存储访问逻辑结构,其特征在于所述地址仲裁器(110)实现CPU(102)和数据处理单元(101)的逻辑地址到存储器阵列(104)中每一个存储器物理地址的映射,为抵抗侧信道攻击,映射关系在每次算法运算结束后进行更新。
5.根据权利要求1所述的一种高速存储访问逻辑结构,其特征在于所述数据仲裁器(111)实现CPU(102)和数据处理单元(101)对存储器阵列(104)的访问数据的选择,选择方式采用逻辑或操作。
6.根据权利要求1所述的一种高速存储访问逻辑结构,其特征在于所述时钟仲裁器(112)实现CPU(102)和数据处理单元(101)两种访问模式下存储器阵列的工作时钟切换,切换方式为无毛刺时钟切换电路或门控时钟电路。
7.根据权利要求1所述的一种高速存储访问逻辑结构,其特征在于所述安全存储控制器(113)实现CPU(102)访问模式下对存储器阵列(104)中每一个存储器工作时钟的单独控制,通过控制时钟的开启和关闭可以实现低功耗模式或功耗均衡模式。
8.一种高速存储访问逻辑结构的控制方法,基于权利要求1所述的一种高速存储访问逻辑结构,其特征在于,主要步骤包括:1)判定存储访问的主体为CPU(102)或数据处理单元(101);2)解析逻辑地址与物理地址的映射关系;3)解析实际读取/写入数据与存储器阵列(104)中每个存储器读取/写入数据的映射关系;4)在CPU(102)访问模式下单独控制每一个存储器的工作时钟启停;5)在算法运算结束时更新逻辑地址与物理地址的映射关系。
9.根据权利要求8所述的控制方法,其特征在于,所述步骤1),CPU(102)和数据处理单元(101)不会同时访问存储器阵列(104),根据访问的片选使能信号确定访问主体。
10.根据权利要求8所述的控制方法,其特征在于,所述步骤2),逻辑地址与物理地址之间采用逆序映射关系。
11.根据权利要求8所述的控制方法,其特征在于,所述步骤3),实际读取/写入数据与存储器阵列(104)中每个存储器的读取/写入数据映射关系参照随机数进行。
12.根据权利要求8所述的控制方法,其特征在于,所述步骤4),在CPU(102)访问模式下时,根据安全性和功耗要求之间的权衡,单独控制开启一个或多个存储器的工作时钟。
13.根据权利要求8所述的控制方法,其特征在于,所述步骤5),逻辑地址与物理地址的映射关系在算法运算结束时根据外部输入的随机数选择映射切换点,分两个半区进行映射。
CN201811351007.2A 2018-11-14 2018-11-14 一种高速存储访问逻辑结构及其控制方法 Pending CN109582226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811351007.2A CN109582226A (zh) 2018-11-14 2018-11-14 一种高速存储访问逻辑结构及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811351007.2A CN109582226A (zh) 2018-11-14 2018-11-14 一种高速存储访问逻辑结构及其控制方法

Publications (1)

Publication Number Publication Date
CN109582226A true CN109582226A (zh) 2019-04-05

Family

ID=65922367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811351007.2A Pending CN109582226A (zh) 2018-11-14 2018-11-14 一种高速存储访问逻辑结构及其控制方法

Country Status (1)

Country Link
CN (1) CN109582226A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112835842A (zh) * 2021-03-05 2021-05-25 深圳市汇顶科技股份有限公司 端序处理方法、电路、芯片以及电子终端
CN113112481A (zh) * 2021-04-16 2021-07-13 北京理工雷科电子信息技术有限公司 一种基于矩阵网络的混合异构片上架构
CN112835842B (zh) * 2021-03-05 2024-04-30 深圳市汇顶科技股份有限公司 端序处理方法、电路、芯片以及电子终端

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1209213A (zh) * 1995-12-29 1999-02-24 穆凯什·查特 高性能通用多端口内部高速缓存的动态随机存取存储器系统、体系结构和方法
CN101013407A (zh) * 2007-02-05 2007-08-08 北京中星微电子有限公司 支持多总线多类型存储器的内存仲裁实现系统和方法
CN101065739A (zh) * 2004-09-28 2007-10-31 皇家飞利浦电子股份有限公司 数据处理系统以及用于存储仲裁的方法
CN101606135A (zh) * 2007-12-13 2009-12-16 松下电器产业株式会社 时钟控制装置、时钟控制方法、时钟控制程序及集成电路
CN102567259A (zh) * 2010-12-27 2012-07-11 北京国睿中数科技股份有限公司 面向高速通信接口的低功耗缓冲装置
CN103201725A (zh) * 2010-11-25 2013-07-10 国际商业机器公司 用于在多个处理器之间共享的存储器的存储器访问设备及其访问方法
CN204650513U (zh) * 2015-04-21 2015-09-16 深圳市恒扬科技股份有限公司 分布式架构设备及其串口复用电路
CN105242768A (zh) * 2015-10-09 2016-01-13 天津国芯科技有限公司 可分时钟控制的低功耗高速ahb总线访问多块sram的桥装置
CN105373486A (zh) * 2014-08-13 2016-03-02 波音公司 计算系统中动态存储器地址的重新映射

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1209213A (zh) * 1995-12-29 1999-02-24 穆凯什·查特 高性能通用多端口内部高速缓存的动态随机存取存储器系统、体系结构和方法
CN101065739A (zh) * 2004-09-28 2007-10-31 皇家飞利浦电子股份有限公司 数据处理系统以及用于存储仲裁的方法
CN101013407A (zh) * 2007-02-05 2007-08-08 北京中星微电子有限公司 支持多总线多类型存储器的内存仲裁实现系统和方法
CN101606135A (zh) * 2007-12-13 2009-12-16 松下电器产业株式会社 时钟控制装置、时钟控制方法、时钟控制程序及集成电路
CN103201725A (zh) * 2010-11-25 2013-07-10 国际商业机器公司 用于在多个处理器之间共享的存储器的存储器访问设备及其访问方法
CN102567259A (zh) * 2010-12-27 2012-07-11 北京国睿中数科技股份有限公司 面向高速通信接口的低功耗缓冲装置
CN105373486A (zh) * 2014-08-13 2016-03-02 波音公司 计算系统中动态存储器地址的重新映射
CN204650513U (zh) * 2015-04-21 2015-09-16 深圳市恒扬科技股份有限公司 分布式架构设备及其串口复用电路
CN105242768A (zh) * 2015-10-09 2016-01-13 天津国芯科技有限公司 可分时钟控制的低功耗高速ahb总线访问多块sram的桥装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112835842A (zh) * 2021-03-05 2021-05-25 深圳市汇顶科技股份有限公司 端序处理方法、电路、芯片以及电子终端
CN112835842B (zh) * 2021-03-05 2024-04-30 深圳市汇顶科技股份有限公司 端序处理方法、电路、芯片以及电子终端
CN113112481A (zh) * 2021-04-16 2021-07-13 北京理工雷科电子信息技术有限公司 一种基于矩阵网络的混合异构片上架构
CN113112481B (zh) * 2021-04-16 2023-11-17 北京理工雷科电子信息技术有限公司 一种基于矩阵网络的混合异构片上架构

Similar Documents

Publication Publication Date Title
Kim et al. GRIM-Filter: Fast seed location filtering in DNA read mapping using processing-in-memory technologies
CN106683158B (zh) 一种GPU纹理映射非阻塞存储Cache的建模系统
US11003596B2 (en) Multiple memory type memory module systems and methods
CN110582745B (zh) 存储器装置及可促进张量存储器存取的方法
CN103778075B (zh) 安全管理单元、包括它的主机控制器接口及其操作方法
US20210096748A1 (en) Translation lookaside buffer in memory
US20160132237A1 (en) Data storage device, data processing system and method of operation
US9048834B2 (en) Grouping of physically unclonable functions
CN110781105A (zh) 存储设备、操作存储设备的方法以及系统
US8359438B2 (en) Memory banking system and method to increase memory bandwidth via parallel read and write operations
CN106155577A (zh) 扩展内存的访问方法、设备以及系统
Lee et al. Smartsage: training large-scale graph neural networks using in-storage processing architectures
CN104598161B (zh) 数据读取、写入方法和装置及数据存储结构
Lee et al. Buffered compares: Excavating the hidden parallelism inside DRAM architectures with lightweight logic
EP4004791A1 (en) Identification of susceptibility to induced charge leakage
Mai et al. Dynamic Data Migration in Hybrid Main Memories for In‐Memory Big Data Storage
US20240087624A1 (en) Buffer control of multiple memory banks
CN109582226A (zh) 一种高速存储访问逻辑结构及其控制方法
US20190303032A1 (en) Memory system, operating method thereof and computing system inclduing the memory system
WO2003083661A1 (en) Memory-access management method and system for synchronous dynamic random-access memory or the like
Chen et al. GCIM: Towards Efficient Processing of Graph Convolutional Networks in 3D-Stacked Memory
CN107632779A (zh) 数据处理方法和装置、服务器
Kwon et al. Gen‐Z memory pool system implementation and performance measurement
US20210311799A1 (en) Workload allocation among hardware devices
CN109901880B (zh) 一种spinlock硬件电路及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190405

WD01 Invention patent application deemed withdrawn after publication