CN104850529A - 基于Zynq开发平台构建LS-SVM模型的加速计算片上系统 - Google Patents

基于Zynq开发平台构建LS-SVM模型的加速计算片上系统 Download PDF

Info

Publication number
CN104850529A
CN104850529A CN201510245952.4A CN201510245952A CN104850529A CN 104850529 A CN104850529 A CN 104850529A CN 201510245952 A CN201510245952 A CN 201510245952A CN 104850529 A CN104850529 A CN 104850529A
Authority
CN
China
Prior art keywords
module
svm model
submodule
data
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510245952.4A
Other languages
English (en)
Inventor
王少军
王晓璐
马宁
刘大同
彭宇
彭喜元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201510245952.4A priority Critical patent/CN104850529A/zh
Publication of CN104850529A publication Critical patent/CN104850529A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,涉及一种构建LS-SVM模型的加速计算片上系统。本发明为了解决目前还没有一种有效的基于Zynq开发平台构建的LS-SVM模型加速计算的片上系统的问题。本发明包括DDR外部存储模块、处理器系统Processing System模块、可编程逻辑Programmable Logic模块和AXI总线模块;处理器系统Processing System模块实现任务调度、核函数的计算和模型预测,可编程逻辑Programmable Logic模块实现数据预处理和线性方程组的求解操作;最终,基于高层次综合HLS开发方式实现LS-SVM模型的加速计算。本发明适用于基于异构SoC平台构建LS-SVM模型的加速计算。

Description

基于Zynq开发平台构建LS-SVM模型的加速计算片上系统
技术领域
本发明涉及一种构建LS-SVM模型的加速计算片上系统。
背景技术
复杂系统的故障预测和健康管理获得越来越多地重视,并广泛应用于电子、汽车、航空航天、通信系统及图像处理等领域。大量系统健康管理的研究工作证明,系统的状态数据绝大多数是典型的时间序列,而机器学习算法是时间序列研究过程中应用的主要方法,LS-SVM作为机器学习的一种,广泛应用于航空航天器系统的健康管理。
针对无人飞行器这种特殊的航天器系统,因受飞行条件、飞行空间的约束,不得不选取低功耗、体积小、重量轻的健康管理平台,嵌入式平台凭借自身的优势可以满足应用的需求。随着片上系统SoC(System-on-a-chip)的发展,逐渐发展为异构多核处理器系统HMPSoC(Heterogeneous Multi-core Processor SoC),应用这种系统结构完成嵌入式SoC上的高性能计算,不仅可以解决单片FPGA面对高计算复杂度算法存在的计算任务调度问题,同时,可以充分发挥通用处理器编程简单、设计灵活的优势。Zynq开发平台是Xilinx公司推出的异构SoC平台,它为嵌入式高性能计算研究提供了软硬件协同设计的平台。
目前,系统健康管理方面的研究较多的局限于算法的软件实现和仿真,算法较慢的训练速度限制了其在实际中的应用,因此必须开展算法的硬件加速计算研究。
目前在异构SoC Zynq开发平台上实现硬件加速的设计较少,并且没有一种有效的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统。
发明内容
本发明为了解决目前还没有一种有效的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统的问题。
基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,主要包括下述模块:
DDR外部存储模块,用于存储LS-SVM模型处理的原始数据、中间数据及最后结果;
处理器系统Processing System模块,简称PS模块,用于对原始数据的预处理及实现LS-SVM模型中的核函数计算过程,形成核函数矩阵,并将正定对称的核函数矩阵进行存储;
可编程逻辑Programmable Logic模块,简称PL模块,用于LS-SVM模型中线性方程组的求解,负责从DDR外部存储模块读取正定对称矩阵的值,进行矩阵分解并实现求逆过程,最终将乔里斯基分解得到的下三角阵存储在DDR外部存储模块中,并根据分解得到的下三角阵求出LS-SVM模型系数;
AXI总线模块,用于PS模块与PL模块之间的信息传输。
本发明充分发挥Zynq开发平台异构的优势,展开对LS-SVM加速计算方法,采用软硬件协同设计技术,主要解决了异构SoC平台上的计算任务划分问题,同时,设计了基于Zynq SoC的片上系统结构以及线性方程组求解的数据通路,将任务调度、核函数计算和模型预测由处理器系统Processing System模块实现;将数据预处理和线性方程组的求解由可编程逻辑Programmable Logic模块实现,主要在于可编程逻辑Programmable Logic模块可以进行大量的并行操作;最终,基于高层次综合HLS开发方式实现LS-SVM模型的加速计算。
本发明的设计同时使用ARM处理器和可编程逻辑,充分发挥软硬件各自的优势,从而提高计算效率;同时,计算过程中的线性方程组的求解采用Submatrix-Cholesky分解方式,实现数据的规律访存,并且数据传输过程采用DMA的传输方式,大大提高了数据的传输速度,从而使计算效率进一步提高,达到加速计算的目的。
本发明除完成异构SoC平台上的加速计算设计外,通过合理的软硬件划分,并根据Submatrix-Cholesky分解方法设计了合理的数据通路,探索了一种在异构SoC架构下的软硬件协同设计方法,为其他异构平台下的开发设计提供参考和借鉴。
附图说明
图1为本发明原理示意图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,主要包括下述模块:
DDR外部存储模块,用于存储LS-SVM模型处理的原始数据、中间数据及最后结果;
处理器系统Processing System模块,简称PS模块,用于对原始数据的预处理及实现LS-SVM模型中的核函数计算过程,形成核函数矩阵,并将正定对称的核函数矩阵进行存储;
可编程逻辑Programmable Logic模块,简称PL模块,用于LS-SVM模型中线性方程组的求解,负责从DDR外部存储模块读取正定对称矩阵的值,进行矩阵分解并实现求逆过程,最终将乔里斯基分解得到的下三角阵存储在DDR外部存储模块中,并根据分解得到的下三角阵求出LS-SVM模型系数;
AXI总线模块,用于PS模块与PL模块之间的信息传输。
具体实施方式二:本实施方式所述的PS模块包括:
ARM处理器子模块,用于对LS-SVM模型的原始数据进行处理,同时,负责整个计算过程的任务调度;
Cache缓存子模块,用于缓存ARM处理器子模块处理的数据和提取的DDR外部存储模块中的数据;
DDR控制器子模块,用于控制对DDR外部存储模块中数据的读写;
Memory Interconnect子模块,用于PS模块内部存储之间的互联;
Central Interconnect子模块,用于PS模块内部结构的互联;
I/O子模块;用于连接外部的串口及SD卡及调试。
其它步骤与具体实施方式一相同。
具体实施方式三:本实施方式所述的PL模块包括:
加速计算子模块,用于实现线性方程组在可编程逻辑部分的加速求解;
AXI_DMA子模块,用于实现PS与PL之间的快速数据传输,采用DMA传输方式,可以加快传输速度;
RAM/FIFO子模块,用于可编程逻辑PL内部的数据存储或缓存。
其它步骤与具体实施方式一或二相同。
具体实施方式四:本实施方式所述的AXI总线模块包括:
AXI GP子模块,用于PS向PL传输控制信息,通过AXI-Lite总线实现;
AXI HP子模块,用于PS与PL之间进行高速数据传输,通过AXI-Stream总线实现。
整个计算过程,通过AXI GP子模块获得处理器系统子模块的控制命令,完成对整个计算任务调度;同时,通过AXI HP子模块获取DDR外部存储模块中的下三角矩阵,通过AXI_DMA子模块实现PS模块与PL模块之间的快速数据传输。
其它步骤与具体实施方式一至三之一相同。
具体实施方式五:本实施方式所述的ARM处理器子模块通过核函数对LS-SVM模型的原始数据进行计算;其中,σ为超参数,x和y是样本数据,均为l维的列向量;||·||为二范数计算。
其它步骤与具体实施方式二相同。
具体实施方式六:本实施方式所述的PL模块求出LS-SVM模型系数是通过以下方法实现的:
采用基于块的乔里斯基分解方法,实现矩阵A的分解;并通过计算出η和v;其中,A为核函数矩阵,Y为训练样本的输出值,η和v为中间变量;
然后,将转换为:利用η和v求解得到α和b,从而完成LS-SVM模型的建模过程;其中xi为训练样本,i为样本中每个样本值的下标;x为预测输入,y为训练样本的输出。
其它步骤与具体实施方式三相同。

Claims (6)

1.基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,其特征在于主要包括下述模块:
DDR外部存储模块,用于存储LS-SVM模型处理的原始数据、中间数据及最后结果;
处理器系统Processing System模块,简称PS模块,用于对原始数据的预处理及实现LS-SVM模型中的核函数计算过程,形成核函数矩阵,并将正定对称的核函数矩阵进行存储;
可编程逻辑Programmable Logic模块,简称PL模块,用于LS-SVM模型中线性方程组的求解,负责从DDR外部存储模块读取正定对称矩阵的值,进行矩阵分解并实现求逆过程,最终将乔里斯基分解得到的下三角阵存储在DDR外部存储模块中,并根据分解得到的下三角阵求出LS-SVM模型系数;
AXI总线模块,用于PS模块与PL模块之间的信息传输。
2.根据权利要求1所述的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,其特征在于:
所述的PS模块包括:
ARM处理器子模块,用于对LS-SVM模型的原始数据进行处理,同时,负责整个计算过程的任务调度;
Cache缓存子模块,用于缓存ARM处理器子模块处理的数据和提取的DDR外部存储模块中的数据;
DDR控制器子模块,用于控制对DDR外部存储模块中数据的读写;
Memory Interconnect子模块,用于PS模块内部存储之间的互联;
Central Interconnect子模块,用于PS模块内部结构的互联;
I/O子模块;用于连接外部的串口及SD卡及调试。
3.根据权利要求1或2所述的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,其特征在于:
所述的PL模块包括:
加速计算子模块,用于实现线性方程组在可编程逻辑部分的加速求解;
AXI_DMA子模块,用于实现PS与PL之间的快速数据传输,采用DMA传输方式,可以加快传输速度;
RAM/FIFO子模块,用于可编程逻辑PL内部的数据存储或缓存。
4.根据权利要求3所述的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,其特征在于:
所述的AXI总线模块包括:
AXI GP子模块,用于PS向PL传输控制信息,通过AXI-Lite总线实现;
AXI HP子模块,用于PS与PL之间进行高速数据传输,通过AXI-Stream总线实现。
5.根据权利要求2所述的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,其特征在于:
ARM处理器子模块通过核函数对LS-SVM模型的原始数据进行计算;其中,σ为超参数,x和y是样本数据,均为l维的列向量;||·||为二范数计算。
6.根据权利要求3所述的基于Zynq开发平台构建LS-SVM模型的加速计算片上系统,其特征在于PL模块求出LS-SVM模型系数是通过以下方法实现的:
采用基于块的乔里斯基分解方法,实现矩阵A的分解;并通过计算出η和v;其中,A为核函数矩阵,Y为训练样本的输出值,η和v为中间变量;
然后,将转换为:利用η和v求解得到α和b,从而完成LS-SVM模型的建模过程;其中xi为训练样本,i为样本中每个样本值的下标;x为预测输入,y为训练样本的输出。
CN201510245952.4A 2015-05-14 2015-05-14 基于Zynq开发平台构建LS-SVM模型的加速计算片上系统 Pending CN104850529A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510245952.4A CN104850529A (zh) 2015-05-14 2015-05-14 基于Zynq开发平台构建LS-SVM模型的加速计算片上系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510245952.4A CN104850529A (zh) 2015-05-14 2015-05-14 基于Zynq开发平台构建LS-SVM模型的加速计算片上系统

Publications (1)

Publication Number Publication Date
CN104850529A true CN104850529A (zh) 2015-08-19

Family

ID=53850179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510245952.4A Pending CN104850529A (zh) 2015-05-14 2015-05-14 基于Zynq开发平台构建LS-SVM模型的加速计算片上系统

Country Status (1)

Country Link
CN (1) CN104850529A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512084A (zh) * 2015-11-27 2016-04-20 中国电子科技集团公司第二十八研究所 一种Zynq平台数据交互装置
CN105550133A (zh) * 2015-12-08 2016-05-04 天津津航计算技术研究所 基于zynq的axis-fifo桥电路及利用该电路进行数据传输的方法
CN105785348A (zh) * 2016-04-08 2016-07-20 浙江大学 一种基于zynq-7000平台的声纳信号处理方法
CN110958189A (zh) * 2019-12-05 2020-04-03 中国电子科技集团公司第五十四研究所 一种多核fpga网络处理器
CN112461123A (zh) * 2020-10-09 2021-03-09 天津大学 空间定位系统的多发射站实现方法及装置
CN114520750A (zh) * 2022-02-24 2022-05-20 哈尔滨工业大学 非侵入式的无人装备状态监测及智能处理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103472721A (zh) * 2013-09-22 2013-12-25 浙江大学 自适应机器学习的农药废液焚烧炉炉温最佳化系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103472721A (zh) * 2013-09-22 2013-12-25 浙江大学 自适应机器学习的农药废液焚烧炉炉温最佳化系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MA NING 等: "Implementation of LS-SVM with HLS on Zynq", 《FIELD-PROGRAMMABLE TECHNOLOGY,2014 INTERNATIONAL CONFERENCE ON》 *
王少军: "时间序列预测的可重构计算研究", 《中国博士学位论文全文数据库 信息科技辑 》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512084A (zh) * 2015-11-27 2016-04-20 中国电子科技集团公司第二十八研究所 一种Zynq平台数据交互装置
CN105512084B (zh) * 2015-11-27 2018-12-21 中国电子科技集团公司第二十八研究所 一种Zynq平台数据交互装置
CN105550133A (zh) * 2015-12-08 2016-05-04 天津津航计算技术研究所 基于zynq的axis-fifo桥电路及利用该电路进行数据传输的方法
CN105785348A (zh) * 2016-04-08 2016-07-20 浙江大学 一种基于zynq-7000平台的声纳信号处理方法
CN110958189A (zh) * 2019-12-05 2020-04-03 中国电子科技集团公司第五十四研究所 一种多核fpga网络处理器
CN110958189B (zh) * 2019-12-05 2022-06-10 中国电子科技集团公司第五十四研究所 一种多核fpga网络处理器
CN112461123A (zh) * 2020-10-09 2021-03-09 天津大学 空间定位系统的多发射站实现方法及装置
CN114520750A (zh) * 2022-02-24 2022-05-20 哈尔滨工业大学 非侵入式的无人装备状态监测及智能处理装置

Similar Documents

Publication Publication Date Title
CN104850529A (zh) 基于Zynq开发平台构建LS-SVM模型的加速计算片上系统
CN109284817B (zh) 深度可分离卷积神经网络处理架构/方法/系统及介质
CN210006057U (zh) 用于深度学习引擎的设备和系统
CN110050256B (zh) 用于神经网络实现的块浮点
CN110516801B (zh) 一种高吞吐率的动态可重构卷积神经网络加速器
CN108268941B (zh) 深度卷积网络异构架构
CN108269224B (zh) 可重新配置的互连
US20210065005A1 (en) Systems and methods for providing vector-wise sparsity in a neural network
US11763156B2 (en) Neural network compression based on bank-balanced sparsity
CN111178518A (zh) 一种基于fpga的软硬件协同的加速方法
CN108537331A (zh) 一种基于异步逻辑的可重构卷积神经网络加速电路
US20210406437A1 (en) Programmable chip, design method and device
CN110383300A (zh) 一种计算装置及方法
CN110163362A (zh) 一种计算装置及方法
WO2021089009A1 (zh) 数据流重构方法及可重构数据流处理器
Pradeep et al. Edgenet: Squeezenet like convolution neural network on embedded fpga
US11775808B2 (en) Neural network computation device and method
CN114356836A (zh) 基于risc-v的三维互联众核处理器架构及其工作方法
Liu et al. CASSANN-v2: A high-performance CNN accelerator architecture with on-chip memory self-adaptive tuning
Zhao et al. A 307-fps 351.7-GOPs/W deep learning FPGA accelerator for real-time scene text recognition
CN104794102A (zh) 一种加速实现Cholesky分解的嵌入式片上系统
Dai et al. An energy-efficient bit-split-and-combination systolic accelerator for nas-based multi-precision convolution neural networks
CN111178492B (zh) 计算装置及相关产品、执行人工神经网络模型的计算方法
Kechiche Hardware acceleration for deep learning of image classification
CN112905954A (zh) 一种利用fpga bram的cnn模型卷积运算加速计算方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150819

RJ01 Rejection of invention patent application after publication