CN112073225A - 一种基于校园网速设计的加速器系统以及流程 - Google Patents
一种基于校园网速设计的加速器系统以及流程 Download PDFInfo
- Publication number
- CN112073225A CN112073225A CN202010861524.5A CN202010861524A CN112073225A CN 112073225 A CN112073225 A CN 112073225A CN 202010861524 A CN202010861524 A CN 202010861524A CN 112073225 A CN112073225 A CN 112073225A
- Authority
- CN
- China
- Prior art keywords
- module
- convolution operation
- operation hardware
- hardware accelerator
- campus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 7
- 230000008569 process Effects 0.000 title claims abstract description 7
- 238000013461 design Methods 0.000 title claims abstract description 6
- 238000004891 communication Methods 0.000 claims abstract description 12
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/083—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for increasing network speed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/40—Bus networks
- H04L12/40006—Architecture of a communication node
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Advance Control (AREA)
Abstract
本发明公开了一种基于校园网速设计的加速器系统以及流程,包括微处理器模块、通用卷积运算硬件加速器模块、总线连接模块、网内主机、校园服务器,其特征在于:所述的微处理器模块采用的是arm Cortex‑A15,所述的通用卷积运算硬件加速器模块基于FPGA设计,所述的总线连接模块采用的是AXI总线,所述的网内主机在加速器系统中设有唯一的身份标识K,所述的校园服务器与通用卷积运算硬件加速器模块之间通过总线连接模块的AXI总线通讯连接。本发明的加速器系统通过通用卷积运算硬件加速器模块可以动态调剂校园网络的资源使用,提升加速系统的并行度,在不直接扩大服务器的规模,同时保证网络的高峰使用时段流畅。
Description
技术领域
本发明涉及计算机以及通讯网络技术,具体是指一种基于校园网速设计的加速器系统以及流程。
背景技术
随着高校的不断扩招以及校园信息化推进,师生对基于网络教学和生活的场景要求越来越高,且高校的网络是存在固定高峰使用时段,如果直接扩大服务器的规模,直接的经济效益提升不大,且仅仅扩大服务器的规模,校园存在的高低峰值分配的问题,不能及时动态调整,例如选课、提交作业等极端高峰数据交流的时候,这些网络低速甚至卡顿的问题相继呈现。
发明内容
本发明要解决的技术问题是,针对以上问题提供一种基于校园网速设计的加速器系统以及流程。
为解决上述技术问题,本发明提供的技术方案为:一种基于校园网速设计的加速器系统以及流程,包括微处理器模块、通用卷积运算硬件加速器模块、总线连接模块、网内主机、校园服务器,其特征在于:所述的微处理器模块采用的是armCortex-A15,所述的通用卷积运算硬件加速器模块基于FPGA设计,且微处理器模块、通用卷积运算硬件加速器模块之间设有读写寄存器的通讯连接,所述的总线连接模块采用的是AXI总线,所述的网内主机在加速器系统中设有唯一的身份标识K,所述的校园服务器与通用卷积运算硬件加速器模块之间通过总线连接模块的AXI总线通讯连接,其具体流程如下:
1)、通用卷积运算硬件加速器模块在开始加速工作前,微处理器模块先进行数据的内存排布和身份标识验证;
2)、通过总线连接模块的AXI总线配置加速器的调用计算规模;
3)、通用卷积运算硬件加速器模块通过AXI总线连续地从网内主机中读取K的feature_in,输出feature_out,且通过通讯连接结果输出到校园服务器。
本发明与现有技术相比的优点在于:本发明的加速器系统通过通用卷积运算硬件加速器模块可以动态调剂校园网络的资源使用,通过微处理器模块的硬件资源增加对通用卷积运算硬件加速器模块协处理,提升加速系统的并行度,在不直接扩大服务器的规模,同时保证网络的高峰使用时段流畅。
作为改进,所述的armCortex-A15采用的是主频率为1.5GHz。
作为改进,所述的通用卷积运算硬件加速器模块工作频率为100Mhz。
作为改进,所述的若干个网内主机通过AXI总线形成二叉树列型的网络连接关系。
附图说明
图1是一种基于校园网速设计的加速器系统以及流程的结构系统框图。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
本发明在具体实施时,一种基于校园网速设计的加速器系统以及流程,包括微处理器模块、通用卷积运算硬件加速器模块、总线连接模块、网内主机、校园服务器,其特征在于:所述的微处理器模块采用的是arm Cortex-A15,所述的通用卷积运算硬件加速器模块基于FPGA设计,且微处理器模块、通用卷积运算硬件加速器模块之间设有读写寄存器的通讯连接,所述的总线连接模块采用的是AXI总线,所述的网内主机在加速器系统中设有唯一的身份标识K,所述的校园服务器与通用卷积运算硬件加速器模块之间通过总线连接模块的AXI总线通讯连接,其具体流程如下:
1)、通用卷积运算硬件加速器模块在开始加速工作前,微处理器模块先进行数据的内存排布和身份标识验证;
2)、通过总线连接模块的AXI总线配置加速器的调用计算规模;
3)、通用卷积运算硬件加速器模块通过AXI总线连续地从网内主机中读取K的feature_in,输出feature_out,且通过通讯连接结果输出到校园服务器。
所述的arm Cortex-A15采用的是主频率为1.5GHz。
所述的通用卷积运算硬件加速器模块工作频率为100Mhz。
所述的若干个网内主机通过AXI总线形成二叉树列型的网络连接关系。
本发明的工作原理:本发明的加速器系统基于校园网速设计,通过通用卷积运算硬件加速器模块可以动态调剂校园网络的资源使用,通过微处理器模块的硬件资源增加对通用卷积运算硬件加速器模块协处理,提升加速系统的并行度,同时网内主机的身份标识K存储于校园服务器,如果有设备丢失的情况,可以轻松的找回。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具本的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”,“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (4)
1.一种基于校园网速设计的加速器系统以及流程,包括微处理器模块、通用卷积运算硬件加速器模块、总线连接模块、网内主机、校园服务器,其特征在于:所述的微处理器模块采用的是arm Cortex-A15,所述的通用卷积运算硬件加速器模块基于FPGA设计,且微处理器模块、通用卷积运算硬件加速器模块之间设有读写寄存器的通讯连接,所述的总线连接模块采用的是AXI总线,所述的网内主机在加速器系统中设有唯一的身份标识K,所述的校园服务器与通用卷积运算硬件加速器模块之间通过总线连接模块的AXI总线通讯连接,其具体流程如下:
1)、通用卷积运算硬件加速器模块在开始加速工作前,微处理器模块先进行数据的内存排布和身份标识验证;
2)、通过总线连接模块的AXI总线配置加速器的调用计算规模;
3)、通用卷积运算硬件加速器模块通过AXI总线连续地从网内主机中读取K的feature_in,输出feature_out,且通过通讯连接结果输出到校园服务器。
2.根据权利要求1所述的一种基于校园网速设计的加速器系统以及流程,其特征在于:所述的arm Cortex-A15采用的是主频率为1.5GHz。
3.根据权利要求1所述的一种基于校园网速设计的加速器系统以及流程,其特征在于:所述的通用卷积运算硬件加速器模块工作频率为100Mhz。
4.根据权利要求1所述的一种基于校园网速设计的加速器系统以及流程,其特征在于:所述的若干个网内主机通过AXI总线形成二叉树列型的网络连接关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010861524.5A CN112073225A (zh) | 2020-08-25 | 2020-08-25 | 一种基于校园网速设计的加速器系统以及流程 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010861524.5A CN112073225A (zh) | 2020-08-25 | 2020-08-25 | 一种基于校园网速设计的加速器系统以及流程 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112073225A true CN112073225A (zh) | 2020-12-11 |
Family
ID=73660057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010861524.5A Pending CN112073225A (zh) | 2020-08-25 | 2020-08-25 | 一种基于校园网速设计的加速器系统以及流程 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112073225A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334801A (zh) * | 2019-05-09 | 2019-10-15 | 苏州浪潮智能科技有限公司 | 一种卷积神经网络的硬件加速方法、装置、设备及系统 |
CN110390383A (zh) * | 2019-06-25 | 2019-10-29 | 东南大学 | 一种基于幂指数量化的深度神经网络硬件加速器 |
CN111242289A (zh) * | 2020-01-19 | 2020-06-05 | 清华大学 | 一种规模可扩展的卷积神经网络加速系统与方法 |
US20200264935A1 (en) * | 2019-04-30 | 2020-08-20 | Naidu Prakash Crj | Hardware accelerator for efficient convolution processing |
-
2020
- 2020-08-25 CN CN202010861524.5A patent/CN112073225A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200264935A1 (en) * | 2019-04-30 | 2020-08-20 | Naidu Prakash Crj | Hardware accelerator for efficient convolution processing |
CN110334801A (zh) * | 2019-05-09 | 2019-10-15 | 苏州浪潮智能科技有限公司 | 一种卷积神经网络的硬件加速方法、装置、设备及系统 |
CN110390383A (zh) * | 2019-06-25 | 2019-10-29 | 东南大学 | 一种基于幂指数量化的深度神经网络硬件加速器 |
CN111242289A (zh) * | 2020-01-19 | 2020-06-05 | 清华大学 | 一种规模可扩展的卷积神经网络加速系统与方法 |
Non-Patent Citations (1)
Title |
---|
余成宇等: "一种高效的稀疏卷积神经网络加速器的设计与实现", 《智能系统学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110225453A (zh) | 移动终端定位方法、装置、电子设备及存储介质 | |
CN103176913B (zh) | 硬盘动态映射方法与应用其的服务器 | |
CN114461382A (zh) | 可灵活配置的算力调度实现方法、装置及存储介质 | |
CN108762686A (zh) | 数据一致性校验流控方法、装置、电子设备及存储介质 | |
CN104615765A (zh) | 一种移动用户上网记录的数据处理方法及装置 | |
CN106126374A (zh) | 数据写入方法、数据读取方法及装置 | |
CN113018846A (zh) | 结合数据分析和动态渲染的游戏画面处理方法及存储介质 | |
CN103559194A (zh) | 一种搜索方法、服务器、系统 | |
CN113051102A (zh) | 文件备份方法、装置、系统、存储介质和计算机设备 | |
CN107766003A (zh) | 一种存储双活方法、装置、系统及计算机可读存储介质 | |
CN112073225A (zh) | 一种基于校园网速设计的加速器系统以及流程 | |
CN109948803A (zh) | 算法模型优化方法、装置和设备 | |
CN105656794A (zh) | 数据分发方法及装置 | |
CN108762684A (zh) | 热点数据迁移流控方法、装置、电子设备及存储介质 | |
CN110505276B (zh) | 对象匹配方法、装置及系统、电子设备及存储介质 | |
CN105912751B (zh) | 一种模型联合仿真的方法及系统 | |
CN104268174A (zh) | 一种信息显示方法及客户端 | |
CN105916303A (zh) | 一种生成pcb板的方法及一种pcb板 | |
CN107329798A (zh) | 数据复制的方法、装置和虚拟化系统 | |
WO2023051319A1 (zh) | 基于多数据对齐的数据发送和接收方法、装置和设备 | |
CN110737771A (zh) | 一种基于大数据的题目分配方法及其装置 | |
CN116186096A (zh) | 基于fpga的关系型数据库聚合查询方法、装置、设备及介质 | |
CN109597577A (zh) | 一种处理nvme协议读写命令的方法、系统及相关装置 | |
CN105957559A (zh) | 测试系统、试验装置 | |
CN114363988A (zh) | 分簇方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201211 |