CN111090524A - 一种适用于边缘ai计算的指令数据结构及其设计方法 - Google Patents

一种适用于边缘ai计算的指令数据结构及其设计方法 Download PDF

Info

Publication number
CN111090524A
CN111090524A CN201911306590.XA CN201911306590A CN111090524A CN 111090524 A CN111090524 A CN 111090524A CN 201911306590 A CN201911306590 A CN 201911306590A CN 111090524 A CN111090524 A CN 111090524A
Authority
CN
China
Prior art keywords
instruction
data
edge
data structure
mark field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911306590.XA
Other languages
English (en)
Inventor
姜凯
李朋
赵鑫鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Original Assignee
Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Artificial Intelligence Research Institute Co Ltd filed Critical Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority to CN201911306590.XA priority Critical patent/CN111090524A/zh
Publication of CN111090524A publication Critical patent/CN111090524A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Neurology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本发明公开了一种适用于边缘AI计算的指令数据结构及其设计方法,属于智能计算技术领域。本发明的适用于边缘AI计算的指令数据结构,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。该发明的适用于边缘AI计算的指令数据结构设计合理,并且能够降低数据宽度需求,从而达到提升系统能耗的目的,具有很好的推广应用价值。

Description

一种适用于边缘AI计算的指令数据结构及其设计方法
技术领域
本发明涉及智能计算技术领域,具体提供一种适用于边缘AI计算的指令数据结构及其设计方法。
背景技术
卷积神经网络算法是在人工智能领域中应用最为广泛的算法,广泛应用于安防、自动驾驶、计算机视觉等领域。CNN本质上是一个多层感知机,其成功的原因关键在于它所采用的局部连接和共享权值的方式,一方面减少了的权值的数量使得网络易于优化,另一方面降低了过拟合的风险。CNN是神经网络中的一种,它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。
各类应用所需智能算法对计算平台的运算能力要求越来越高。以图像类算法为例,性能较好的模型权重参数规模在65M以上,模型的单次前向推理操作数超过了10G Ops,诸如VGG-19模型,操作数已经达到40G Ops。经过计算,单处理器的理想性能应该满足4-8TOPS。因此,如何提高神经网络的数据传输效率和计算效率,成为AI领域的关键问题。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种设计合理,并且能够降低数据宽度需求,从而达到提升系统能耗的目的的适用于边缘AI计算的指令数据结构。
本发明进一步的技术任务是提供一种适用于边缘AI计算的指令数据结构的设计方法。
为实现上述目的,本发明提供了如下技术方案:
一种适用于边缘AI计算的指令数据结构,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
作为优选,所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节。
作为优选,所述指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
作为优选,所述数据荷载包括数据类标识、待计算数据和数据载荷校验。
作为优选,所述指令完成标识包括起始位、指令或数据校验和完成标志。
一种适用于边缘AI计算的指令数据结构的设计方法,该方法将指令与数据融合一体,使得指令的载入与数据的载入通过相同的通路,其中,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
作为优选,所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
作为优选,所述数据荷载包括数据类标识、待计算数据和数据载荷校验;指令完成标识包括起始位、指令或数据校验和完成标志。
与现有技术相比,本发明的适用于边缘AI计算的指令数据结构具有以下突出的有益效果:所述适用于边缘AI计算的指令数据结构将指令与数据采用合理的格式融合一体,使得指令的载入与数据的载入通过相同的通路,降低数据带宽需求,从而达到提升系统能耗的目的,具有良好的推广应用价值。
附图说明
图1是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构示意图;
图2是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构的指令编码部分结构示意图;
图3是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构的数据载荷部分结构示意图;
图4是本发明所述适用于边缘AI计算的指令数据结构的指令数据结构的指令完成标识结构示意图。
具体实施方式
下面将结合附图和实施例,对本发明的适用于边缘AI计算的指令数据结构及其设计方法作进一步详细说明。
实施例
如图1所示,本发明的适用于边缘AI计算的指令数据结构,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
指令标志字段和数据标志字段为固定长度的字段,长度均为2字节。
如图2所示,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,指令参数1、指令参数2、指令参数3和指令参数4。保留或对齐位将指令编码进行128bit对齐。
如图3所示,数据荷载包括数据类标识、待计算数据和数据载荷校验。
如图4所示,指令完成标识包括起始位、指令或数据校验和完成标志。
本发明的适用于边缘AI计算的指令数据结构的设计方法,该方法将指令与数据融合一体,使得指令的载入与数据的载入通过相同的通路,其中,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
指令标志字段和数据标志字段为固定长度的字段,长度均为2字节,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
数据荷载包括数据类标识、待计算数据和数据载荷校验;指令完成标识包括起始位、指令或数据校验和完成标志。
以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims (8)

1.一种适用于边缘AI计算的指令数据结构,其特征在于:指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
2.根据权利要求1所述的适用于边缘AI计算的指令数据结构,其特征在于:所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节。
3.根据权利要求2所述的适用于边缘AI计算的指令数据结构,其特征在于:所述指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
4.根据权利要求3所述的适用于边缘AI计算的指令数据结构,其特征在于:所述数据荷载包括数据类标识、待计算数据和数据载荷校验。
5.根据权利要求4所述的适用于边缘AI计算的指令数据结构,其特征在于:所述指令完成标识包括起始位、指令或数据校验和完成标志。
6.一种适用于边缘AI计算的指令数据结构的设计方法,其特征在于:该方法将指令与数据融合一体,使得指令的载入与数据的载入通过相同的通路,其中,指令与数据进行融合,指令与数据的融合格式包括指令标志字段、指令编码、数据标志字段、数据载荷和指令完成标识。
7.根据权利要求6所述的适用于边缘AI计算的指令数据结构的设计方法,其特征在于:所述指令标志字段和数据标志字段为固定长度的字段,长度均为2字节,指令编码包括指令类标识、指令参数、保留或对齐位,其中指令参数最多包含4个参数,保留或对齐位将指令编码进行128bit对齐。
8.根据权利要求7所述的适用于边缘AI计算的指令数据结构的设计方法,其特征在于:所述数据荷载包括数据类标识、待计算数据和数据载荷校验;指令完成标识包括起始位、指令或数据校验和完成标志。
CN201911306590.XA 2019-12-18 2019-12-18 一种适用于边缘ai计算的指令数据结构及其设计方法 Pending CN111090524A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911306590.XA CN111090524A (zh) 2019-12-18 2019-12-18 一种适用于边缘ai计算的指令数据结构及其设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911306590.XA CN111090524A (zh) 2019-12-18 2019-12-18 一种适用于边缘ai计算的指令数据结构及其设计方法

Publications (1)

Publication Number Publication Date
CN111090524A true CN111090524A (zh) 2020-05-01

Family

ID=70395645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911306590.XA Pending CN111090524A (zh) 2019-12-18 2019-12-18 一种适用于边缘ai计算的指令数据结构及其设计方法

Country Status (1)

Country Link
CN (1) CN111090524A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113055187A (zh) * 2021-04-23 2021-06-29 山东新一代信息产业技术研究院有限公司 一种针对区块链共识的窄带线路传输方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6021275A (en) * 1996-08-05 2000-02-01 General Magic, Inc. Object code structure and method for translation of architecture independent program implementations
US6385757B1 (en) * 1999-08-20 2002-05-07 Hewlett-Packard Company Auto design of VLIW processors
CN109067704A (zh) * 2018-06-28 2018-12-21 中国空间技术研究院 一种卫星遥控指令格式设计与编码管理系统及方法
CN109460244A (zh) * 2018-10-26 2019-03-12 苏州浪潮智能软件有限公司 一种屏蔽硬件差异的软件方法
CN109754062A (zh) * 2017-11-07 2019-05-14 上海寒武纪信息科技有限公司 卷积扩展指令的执行方法以及相关产品

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6021275A (en) * 1996-08-05 2000-02-01 General Magic, Inc. Object code structure and method for translation of architecture independent program implementations
US6385757B1 (en) * 1999-08-20 2002-05-07 Hewlett-Packard Company Auto design of VLIW processors
CN109754062A (zh) * 2017-11-07 2019-05-14 上海寒武纪信息科技有限公司 卷积扩展指令的执行方法以及相关产品
CN109067704A (zh) * 2018-06-28 2018-12-21 中国空间技术研究院 一种卫星遥控指令格式设计与编码管理系统及方法
CN109460244A (zh) * 2018-10-26 2019-03-12 苏州浪潮智能软件有限公司 一种屏蔽硬件差异的软件方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113055187A (zh) * 2021-04-23 2021-06-29 山东新一代信息产业技术研究院有限公司 一种针对区块链共识的窄带线路传输方法
CN113055187B (zh) * 2021-04-23 2023-02-03 山东新一代信息产业技术研究院有限公司 一种针对区块链共识的窄带线路传输方法

Similar Documents

Publication Publication Date Title
CN103427844B (zh) 一种基于gpu和cpu混合平台的高速无损数据压缩方法
CN108985448A (zh) 神经网络表示标准框架结构
CN108345934A (zh) 一种用于神经网络处理器的激活装置及方法
CN111090524A (zh) 一种适用于边缘ai计算的指令数据结构及其设计方法
CN110213739A (zh) 面向矿车无人驾驶运输系统的多模式通信方法和装置
CN110365678B (zh) 一种基于反样本的工控网络协议漏洞挖掘方法
CN112035841A (zh) 一种基于专家规则与序列化建模的智能合约漏洞检测方法
CN108983733A (zh) 一种串级控制方法、装置、设备及存储介质
CN110503135A (zh) 用于电力设备边缘侧识别的深度学习模型压缩方法及系统
CN106130635A (zh) 一种基于色移键控的可见光通信系统中星座图的处理方法
CN110505655A (zh) 数据指令处理方法、存储介质及蓝牙盾
CN101719667A (zh) 分布式管理与转移负荷的方法
CN116052024A (zh) 基于轻量化目标识别神经网络模型的电力线路巡检方法
CN109818089A (zh) 一种电池限流方法及装置
Wang et al. AlarmGPT: an intelligent operation assistant for optical network alarm analysis using ChatGPT
CN111641974B (zh) 一种基于5g小型蜂窝混合再生能源网络的方法和存储设备
Zhou et al. Portable convolution neural networks for traffic sign recognition in intelligent transportation systems
CN112288028A (zh) 一种基于流卷积的图像识别方法
Jirásková Note on Minimal Automata and Uniform Communication Protocols¹
CN116094760B (zh) 一种基于报文字典的跨正向隔离装置数据传输方法
CN110113193A (zh) 基于分级代理的数据传输方法、系统及介质
CN117473124B (zh) 一种具备抵制过度平滑能力的自监督异质图表示学习方法
CN103078706B (zh) 一种利用冗余位的字典查询压缩方法及装置
CN109587087A (zh) 一种报文处理方法及系统
CN109190753A (zh) 神经网络的处理方法及装置、存储介质、电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200501

RJ01 Rejection of invention patent application after publication