CN111090524A - 一种适用于边缘ai计算的指令数据结构及其设计方法 - Google Patents
一种适用于边缘ai计算的指令数据结构及其设计方法 Download PDFInfo
- Publication number
- CN111090524A CN111090524A CN201911306590.XA CN201911306590A CN111090524A CN 111090524 A CN111090524 A CN 111090524A CN 201911306590 A CN201911306590 A CN 201911306590A CN 111090524 A CN111090524 A CN 111090524A
- Authority
- CN
- China
- Prior art keywords
- instruction
- data
- edge
- data structure
- mark field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000013473 artificial intelligence Methods 0.000 title abstract description 24
- 238000012795 verification Methods 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims 1
- 230000004927 fusion Effects 0.000 abstract description 5
- 238000005265 energy consumption Methods 0.000 abstract description 3
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Neurology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本发明公开了一种适用于边缘AI计算的指令数据结构及其设计方法,属于智能计算技术领域。本发明的适用于边缘AI计算的指令数据结构,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。该发明的适用于边缘AI计算的指令数据结构设计合理,并且能够降低数据宽度需求,从而达到提升系统能耗的目的,具有很好的推广应用价值。
Description
技术领域
本发明涉及智能计算技术领域,具体提供一种适用于边缘AI计算的指令数据结构及其设计方法。
背景技术
卷积神经网络算法是在人工智能领域中应用最为广泛的算法,广泛应用于安防、自动驾驶、计算机视觉等领域。CNN本质上是一个多层感知机,其成功的原因关键在于它所采用的局部连接和共享权值的方式,一方面减少了的权值的数量使得网络易于优化,另一方面降低了过拟合的风险。CNN是神经网络中的一种,它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。
各类应用所需智能算法对计算平台的运算能力要求越来越高。以图像类算法为例,性能较好的模型权重参数规模在65M以上,模型的单次前向推理操作数超过了10G Ops,诸如VGG-19模型,操作数已经达到40G Ops。经过计算,单处理器的理想性能应该满足4-8TOPS。因此,如何提高神经网络的数据传输效率和计算效率,成为AI领域的关键问题。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种设计合理,并且能够降低数据宽度需求,从而达到提升系统能耗的目的的适用于边缘AI计算的指令数据结构。
本发明进一步的技术任务是提供一种适用于边缘AI计算的指令数据结构的设计方法。
为实现上述目的,本发明提供了如下技术方案:
一种适用于边缘AI计算的指令数据结构,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
作为优选,所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节。
作为优选,所述指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
作为优选,所述数据荷载包括数据类标识、待计算数据和数据载荷校验。
作为优选,所述指令完成标识包括起始位、指令或数据校验和完成标志。
一种适用于边缘AI计算的指令数据结构的设计方法,该方法将指令与数据融合一体,使得指令的载入与数据的载入通过相同的通路,其中,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
作为优选,所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
作为优选,所述数据荷载包括数据类标识、待计算数据和数据载荷校验;指令完成标识包括起始位、指令或数据校验和完成标志。
与现有技术相比,本发明的适用于边缘AI计算的指令数据结构具有以下突出的有益效果:所述适用于边缘AI计算的指令数据结构将指令与数据采用合理的格式融合一体,使得指令的载入与数据的载入通过相同的通路,降低数据带宽需求,从而达到提升系统能耗的目的,具有良好的推广应用价值。
附图说明
图1是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构示意图;
图2是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构的指令编码部分结构示意图;
图3是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构的数据载荷部分结构示意图;
图4是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构的指令完成标识结构示意图。
具体实施方式
下面将结合附图和实施例,对本发明的适用于边缘AI计算的指令数据结构及其设计方法作进一步详细说明。
实施例
如图1所示,本发明的适用于边缘AI计算的指令数据结构,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
指令标志字段和数据标志字段为固定长度的字段,长度均为2字节。
如图2所示,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,指令参数1、指令参数2、指令参数3和指令参数4。保留或对齐位将指令编码进行128bit对齐。
如图3所示,数据荷载包括数据类标识、待计算数据和数据载荷校验。
如图4所示,指令完成标识包括起始位、指令或数据校验和完成标志。
本发明的适用于边缘AI计算的指令数据结构的设计方法,该方法将指令与数据融合一体,使得指令的载入与数据的载入通过相同的通路,其中,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
指令标志字段和数据标志字段为固定长度的字段,长度均为2字节,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
数据荷载包括数据类标识、待计算数据和数据载荷校验;指令完成标识包括起始位、指令或数据校验和完成标志。
以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
Claims (8)
1.一种适用于边缘AI计算的指令数据结构,其特征在于:指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
2.根据权利要求1所述的适用于边缘AI计算的指令数据结构,其特征在于:所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节。
3.根据权利要求2所述的适用于边缘AI计算的指令数据结构,其特征在于:所述指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
4.根据权利要求3所述的适用于边缘AI计算的指令数据结构,其特征在于:所述数据荷载包括数据类标识、待计算数据和数据载荷校验。
5.根据权利要求4所述的适用于边缘AI计算的指令数据结构,其特征在于:所述指令完成标识包括起始位、指令或数据校验和完成标志。
6.一种适用于边缘AI计算的指令数据结构的设计方法,其特征在于:该方法将指令与数据融合一体,使得指令的载入与数据的载入通过相同的通路,其中,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
7.根据权利要求6所述的适用于边缘AI计算的指令数据结构的设计方法,其特征在于:所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
8.根据权利要求7所述的适用于边缘AI计算的指令数据结构的设计方法,其特征在于:所述数据荷载包括数据类标识、待计算数据和数据载荷校验;指令完成标识包括起始位、指令或数据校验和完成标志。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911306590.XA CN111090524A (zh) | 2019-12-18 | 2019-12-18 | 一种适用于边缘ai计算的指令数据结构及其设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911306590.XA CN111090524A (zh) | 2019-12-18 | 2019-12-18 | 一种适用于边缘ai计算的指令数据结构及其设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111090524A true CN111090524A (zh) | 2020-05-01 |
Family
ID=70395645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911306590.XA Pending CN111090524A (zh) | 2019-12-18 | 2019-12-18 | 一种适用于边缘ai计算的指令数据结构及其设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111090524A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113055187A (zh) * | 2021-04-23 | 2021-06-29 | 山东新一代信息产业技术研究院有限公司 | 一种针对区块链共识的窄带线路传输方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6021275A (en) * | 1996-08-05 | 2000-02-01 | General Magic, Inc. | Object code structure and method for translation of architecture independent program implementations |
US6385757B1 (en) * | 1999-08-20 | 2002-05-07 | Hewlett-Packard Company | Auto design of VLIW processors |
CN109067704A (zh) * | 2018-06-28 | 2018-12-21 | 中国空间技术研究院 | 一种卫星遥控指令格式设计与编码管理系统及方法 |
CN109460244A (zh) * | 2018-10-26 | 2019-03-12 | 苏州浪潮智能软件有限公司 | 一种屏蔽硬件差异的软件方法 |
CN109754062A (zh) * | 2017-11-07 | 2019-05-14 | 上海寒武纪信息科技有限公司 | 卷积扩展指令的执行方法以及相关产品 |
-
2019
- 2019-12-18 CN CN201911306590.XA patent/CN111090524A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6021275A (en) * | 1996-08-05 | 2000-02-01 | General Magic, Inc. | Object code structure and method for translation of architecture independent program implementations |
US6385757B1 (en) * | 1999-08-20 | 2002-05-07 | Hewlett-Packard Company | Auto design of VLIW processors |
CN109754062A (zh) * | 2017-11-07 | 2019-05-14 | 上海寒武纪信息科技有限公司 | 卷积扩展指令的执行方法以及相关产品 |
CN109067704A (zh) * | 2018-06-28 | 2018-12-21 | 中国空间技术研究院 | 一种卫星遥控指令格式设计与编码管理系统及方法 |
CN109460244A (zh) * | 2018-10-26 | 2019-03-12 | 苏州浪潮智能软件有限公司 | 一种屏蔽硬件差异的软件方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113055187A (zh) * | 2021-04-23 | 2021-06-29 | 山东新一代信息产业技术研究院有限公司 | 一种针对区块链共识的窄带线路传输方法 |
CN113055187B (zh) * | 2021-04-23 | 2023-02-03 | 山东新一代信息产业技术研究院有限公司 | 一种针对区块链共识的窄带线路传输方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103427844B (zh) | 一种基于gpu和cpu混合平台的高速无损数据压缩方法 | |
CN108985448A (zh) | 神经网络表示标准框架结构 | |
CN108345934A (zh) | 一种用于神经网络处理器的激活装置及方法 | |
CN111090524A (zh) | 一种适用于边缘ai计算的指令数据结构及其设计方法 | |
CN110213739A (zh) | 面向矿车无人驾驶运输系统的多模式通信方法和装置 | |
CN110365678B (zh) | 一种基于反样本的工控网络协议漏洞挖掘方法 | |
CN112035841A (zh) | 一种基于专家规则与序列化建模的智能合约漏洞检测方法 | |
CN108983733A (zh) | 一种串级控制方法、装置、设备及存储介质 | |
CN110503135A (zh) | 用于电力设备边缘侧识别的深度学习模型压缩方法及系统 | |
CN106130635A (zh) | 一种基于色移键控的可见光通信系统中星座图的处理方法 | |
CN110505655A (zh) | 数据指令处理方法、存储介质及蓝牙盾 | |
CN101719667A (zh) | 分布式管理与转移负荷的方法 | |
CN116052024A (zh) | 基于轻量化目标识别神经网络模型的电力线路巡检方法 | |
CN109818089A (zh) | 一种电池限流方法及装置 | |
Wang et al. | AlarmGPT: an intelligent operation assistant for optical network alarm analysis using ChatGPT | |
CN111641974B (zh) | 一种基于5g小型蜂窝混合再生能源网络的方法和存储设备 | |
Zhou et al. | Portable convolution neural networks for traffic sign recognition in intelligent transportation systems | |
CN112288028A (zh) | 一种基于流卷积的图像识别方法 | |
Jirásková | Note on Minimal Automata and Uniform Communication Protocols¹ | |
CN116094760B (zh) | 一种基于报文字典的跨正向隔离装置数据传输方法 | |
CN110113193A (zh) | 基于分级代理的数据传输方法、系统及介质 | |
CN117473124B (zh) | 一种具备抵制过度平滑能力的自监督异质图表示学习方法 | |
CN103078706B (zh) | 一种利用冗余位的字典查询压缩方法及装置 | |
CN109587087A (zh) | 一种报文处理方法及系统 | |
CN109190753A (zh) | 神经网络的处理方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200501 |
|
RJ01 | Rejection of invention patent application after publication |