CN110084361A - 一种运算装置和方法 - Google Patents

一种运算装置和方法 Download PDF

Info

Publication number
CN110084361A
CN110084361A CN201910070501.XA CN201910070501A CN110084361A CN 110084361 A CN110084361 A CN 110084361A CN 201910070501 A CN201910070501 A CN 201910070501A CN 110084361 A CN110084361 A CN 110084361A
Authority
CN
China
Prior art keywords
data
value
computing module
unit
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910070501.XA
Other languages
English (en)
Other versions
CN110084361B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cambricon Information Technology Co Ltd
Original Assignee
Shanghai Cambricon Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cambricon Information Technology Co Ltd filed Critical Shanghai Cambricon Information Technology Co Ltd
Publication of CN110084361A publication Critical patent/CN110084361A/zh
Application granted granted Critical
Publication of CN110084361B publication Critical patent/CN110084361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/544Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
    • G06F7/5443Sum of products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/3001Arithmetic instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3818Decoding for concurrent execution
    • G06F9/382Pipelined decoding, e.g. using predecoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3824Operand accessing
    • G06F9/3826Bypassing or forwarding of data results, e.g. locally between pipeline stages or within a pipeline stage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/38Indexing scheme relating to groups G06F7/38 - G06F7/575
    • G06F2207/48Indexing scheme relating to groups G06F7/48 - G06F7/575
    • G06F2207/4802Special implementations
    • G06F2207/4818Threshold devices
    • G06F2207/4824Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Business, Economics & Management (AREA)
  • Neurology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)

Abstract

本申请提供了一种运算装置和方法,所述装置包括:存储器、控制器单元、互联模块和运算单元,其中,存储器用于存储数据块,互联模块,用于连接运算单元中的计算器以使得运算单元构成第一计算拓扑结构,以及接收数据块,将数据块发送至运算单元;控制器单元,用于从寄存器单元内提取运算指令,将运算指令译码成执行指令,执行指令用于控制运算单元执行运算操作,将运算指令对应的操作域传输至数据访问单元;运算单元,用于根据执行指令调用运算单元中的计算器对运算指令对应的操作域对应的数据块执行运算操作得到运算结果。本申请提供的技术方案具有计算速度快,功耗低的优点。

Description

一种运算装置和方法
技术领域
本申请涉及人工智能领域,具体地涉及一种运算装置和方法。
背景技术
卷积神经网络是近年来广泛应用于模式识别、图像处理等领域的一种高效识别算法,它具有结构简单、训练参数少和适应性强、平移、旋转、缩放等特点。由于CNN/DNN的特征检测层通过训练数据进行学习,所以在使用CNN/DNN时,避免了显示的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。
在已有的计算机领域应用中,与卷积运算相关的应用十分普遍。本申请专注于卷积神经网络,目前可以执行此种运算的主流装置如下:
在现有技术中,一种进行卷积神经网络运算的已知方案是使用通用处理器,该方法通过通用寄存器堆和通用功能部件来执行通用指令,从而执行卷积神经网络运算。然而,该方法的缺点之一是单个通用处理器多用于标量计算,在进行卷积神经网络运算时运算性能较低。而使用多个通用处理器并行执行时,通用处理器之间的相互通讯又有可能成为性能瓶颈,影响计算的速度,计算的功耗较高。
发明内容
本申请提供一种运算装置和方法,解决现有技术中存在的性能瓶颈,提高计算的速度,降低计算的功耗的问题。
本申请的一个方面提供了一种运算装置,存储器、控制器单元、互联模块和运算单元,其中,
所述存储器,用于存储数据块,所述数据块包括n维数据,n为大于等于1的整数;
所述互联模块,用于连接运算单元中的计算器以使得所述运算单元构成第一计算拓扑结构,以及接收数据块,将数据块发送至运算单元;
所述控制器单元,用于从寄存器单元内提取运算指令,将运算指令译码成执行指令,执行指令用于控制运算单元执行运算操作,将运算指令对应的操作域传输至所述数据访问单元;
所述运算单元,用于根据所行指令调用所述运算单元中的计算器对运算指令对应的操作域对应的数据块执行运算操作得到运算结果,将运算结果传输至所述数据访问单元以及存储在所述存储器内;
所述运算单元包括主运算模块和多个从运算模块,所述多个从运算模块用于将接收输入数据和运算指令对应的操作域对应的数据块执行卷积运算得到的中间向量,将所述中间向量通过所述互联模块转发至所述主运算模块;所述主运算模块用于将所有中间向量拼接成中间结果,并对所述中间结果执行非线性函数运算得到指令结果;
所述主运算模块包括:
查表部,用于存储有多个线性函数的斜率值和截距值,其中,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b;
线性拟合部,用于根据查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y;
子主运算模块,用于将中间结果的所有元素值对应的函数值y组合起来得到指令结果。
本申请的另一方面提供了一种运算方法,所述方法由运算装置执行,所述运算装置包括寄存器单元、存储器、数据访问单元、控制器单元和运算单元,其中,
所述控制器单元从所述寄存器单元的首地址读取第一IO指令,根据所述第一IO指令译出第一控制信号,所述数据访问单元根据所述第一控制信号从存储器读取相应的所有运算指令,并将其缓存在所述寄存器单元中;
所述控制器单元从所述寄存器单元读入第二IO指令,根据所述第二IO指令译出第二控制信号,所述数据访问单元根据所述第二IO指令译出的控制信号从所述存储器读取运算单元需要的所有数据块;
所述控制器单元从寄存器单元读入第一CONFIG指令,根据所述第一CONFIG指令译出第三控制信号,所述运算装置根据所述第三控制信号配置该层神经网络计算需要的各种常数;
所述控制器单元从寄存器单元读入第二COMPUTE指令,根据第二COMPUTE指令译出第四控制信号,所述互连模块根据所述第四控制信号将卷积窗口内的输入数据发给计所述算单元内的各计算器;
所述乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果,将所述第一结果输入到所述加法运算器执行加法运算得到第二结果,将所述第二结果和偏置b执行加法运算得到第三结果,将所述第三结果输入到激活运算器执行激活运算得到输出结果s,将所述输出结果s传输至所述数据访问单元存储到存储介质内,所述激活运算包括非线性函数运算;
或者,所述运算单元中的多个从运算模块将卷积核w与输入数据Xi执行卷积运算得到中间向量,并将所述中间向量发送到所述运算单元中的主运算模块;
所述主运算模块将所有的中间向量拼接成中间结果;
所述主运算模块中的线性拟合部根据主运算模块中的查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y,其中,所述查表部存储有多个线性函数的斜率值和截距值,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b;
所述主运算模块中的子主运算模块将中间结果的所有元素值对应的函数值y组合起来得到输出结果s,将所述输出结果s传输至所述数据访问单元存储到存储介质内。
第三方面,提供一种芯片,所述芯片集成第一方面提供的运算装置。
第四方面,提供一种电子设备,所述电子设备包括第三方面提供的芯片。
第五方面,提供一种计算机可读存储介质,其特征在于,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第二方面提供的方法。
第六方面,提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行第二方面所述的方法。
本申请提供的运算装置及配套指令,将参与计算的输入数据和卷积核暂存在高速暂存存储器上(Scratchpad Memory)。在仅发送同一条指令的情况下,卷积神经网络运算单元中可以更加灵活有效地支持不同宽度的数据,并可以解决数据存储中的相关性问题,从而提升了包含大量卷积神经网络计算任务的执行性能,本申请采用的指令具有精简的格式,使得指令集使用方便、支持的向量长度灵活,所以其具有计算速度快,功耗低的优点。
本申请可以应用于以下(包括但不限于)场景中:数据处理、机器人、电脑、打印机、扫描仪、电话、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备等各类电子产品;飞机、轮船、车辆等各类交通工具;电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机等各类家用电器;以及包括核磁共振仪、B超、心电图仪等各类医疗设备。
附图说明
图1为本申请实施例提供了一种运算装置的结构示意图;
图2a是本申请实施例提供的主运算模块的结构图;
图2b是本申请实施例提供的非线性函数运算装置的内部结构图;
图2c是本申请实施例中线性拟合部的内部结构图;
图2d是本申请实施例的非线性函数运算的原理图;
图3示出了根据本申请实施例的运算装置中主运算模块结构的示例框图;
图4a示出了根据本申请实施例的运算装置中从运算模块结构的示例框图;
图4b示出了根据本申请实施例的用于运算装置中从运算模块结构的示例框图;
图5示出了根据本申请实施例的运算方法的示例框图。
具体实施方式
本申请提供一种运算装置及配套指令集,包括存储单元、寄存器单元和卷积神经网络运算单元,存储单元中存储有输入输出数据和卷积核,寄存器单元中存储有输入输出数据和卷积核存储的地址,卷积神经网络运算单元根据运算指令在寄存器单元中获取数据地址,然后,根据该数据地址在存储单元中获取相应的输入数据和卷积核,接着,根据获取的输入数据和卷积核进行卷积神经网络运算,得到卷积神经网络运算结果。本申请将参与计算的输入数据和卷积核暂存在外部存储空间(例如,高速暂存存储器)上,使得卷积神经网络运算过程中可以更加灵活有效地支持不同宽度的数据,提升包含大量卷积神经网络计算任务的执行性能。
参阅图1,图1提供了一种运算装置,该运算装置包括:存储器111(可选的)、寄存器单元112、互联模块113、运算单元114、控制器单元115和数据访问单元116;
其中,运算单元114包括:加法计算器、乘法计算器、比较器、激活运算器中至少二种。
互联模块113,用于连接运算单元113中的计算器以使得所述运算单元构成第一计算拓扑结构,以及接收数据块,将数据块发送至运算单元。
寄存器单元112,寄存器单元还可以有其它的替代单元,例如指令缓存,高速暂存存储器等,用于存储该运算指令、数据块的在存储介质的地址、运算指令对应的计算拓扑结构。
该运算指令可以包括:操作域以及操作码,以卷积计算指令为例,如表1所示,其中,寄存器0、寄存器1、寄存器堆2、寄存器3、寄存器4可以为操作域。其中,每个寄存器0、寄存器1、寄存器2、寄存器3、寄存器4可以是一个或者多个寄存器。
表1
存储器111可以为片外存储器,当然在实际应用中,当为片内存储器时,该片内存储器可以为缓存,具体的,可以为高速暂存缓存,用于存储数据块,该数据块具体可以为n维数据,n为大于等于1的整数,例如,n=1时,为1维数据,即向量,如n=2时,为2维数据,即矩阵,如n=3或3以上时,为多维数据。
控制器单元115,用于从寄存器单元112内提取运算指令、该运算指令对应的操作域以及该运算指令对应的第一计算拓扑结构,将该运算指令译码成执行指令,该执行指令用于控制运算单元执行运算操作,将该操作域传输至数据访问单元116。
数据访问单元116,用于从存储器111中提取该操作域对应的数据块,并将该数据块传输至互联模块113。
互联模块113、用于接收数据块,将该数据块发送至运算单元114。
运算单元114,用于该执行指令调用运算单元114的计算器对该数据块执行运算操作得到运算结果,将该运算结果传输至数据访问单元存储在存储器内。一个实施例里,运算单元114,用于按第一计算拓扑结构以及该执行指令调用计算器对数据块执行运算操作得到运算结果,将该运算结果传输至数据访问单元存储在存储器内。
运算单元114还可以包括主运算模块和多个从运算模块,所述多个从运算模块用于将接收输入数据和运算指令对应的操作域对应的数据块执行卷积运算得到的中间向量,将所述中间向量通过所述互联模块转发至所述主运算模块;所述主运算模块用于将所有中间向量拼接成中间结果,并对所述中间结果执行非线性函数运算得到指令结果。
所述主运算模块包括:
查表部,用于存储有多个线性函数的斜率值和截距值,其中,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b;
线性拟合部,用于根据查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y;
所述子主运算模块,用于将中间结果的所有元素值对应的函数值y组合起来得到指令结果。
可选的,所述主运算模块,用于将中间结果与偏置数据相加,然后执行非线性函数运算。
可选的,所述非线性函数包括:sigmoid,tanh,relu或softmax。
可选的,所述互连模块为以下任一种结构:树状结构、环状结构、网格状结构、分级互连、总线结构。
可选的,存储器111(可选的)、寄存器单元112、互联模块113、运算单元114、控制器单元115和数据访问单元116以通过硬件电路(例如包括但不限于FPGA、CGRA、专用集成电路ASIC、模拟电路和电阻器等)实现。
在一种可选的实施例中,上述第一计算拓扑结构可以为:乘法运算器-加法运算器-加法运算器-激活运算器。
下面通过不同的运算指令来说明如图1所示的运算装置的具体计算方法,这里的运算指令以卷积计算指令为例,该卷积计算指令可以应用在神经网络中,所以该卷积计算指令也可以称为卷积神经网络。对于卷积计算指令来说,其实际需要执行的公式可以为:s=s(∑wxi+b),其中,即将卷积核w乘以输入数据xi,进行求和,然后加上偏置b后做激活运算s(h),得到最终的输出结果s。依据该公式即可以得到该计算拓扑结构为,乘法运算器-加法运算器-(可选的)激活运算器。
上述卷积计算指令可以包括指令集,该指令集包括:卷积神经网络指令,有不同功能的卷积神经网络COMPUTE指令以及CONFIG指令、IO指令、NOP指令、JUMP指令和MOVE指令。在一种实施例中,COMPUTE指令包括:
卷积神经网络指令,根据该指令,装置分别从存储器(优选的高速暂存存储器或者标量寄存器堆)的指定地址取出指定大小的输入数据和卷积核,在卷积运算部件中做卷积运算直接得到输出结果。即该指令不执行后续的操作,直接做卷积运算得到输出结果。
卷积神经网络sigmoid指令,根据该指令,装置分别从存储器(优选的高速暂存存储器或者标量寄存器堆)的指定地址取出指定大小的输入数据和卷积核,在卷积运算部件中做卷积操作,优选的,然后将输出结果做sigmoid激活;
卷积神经网络TanH指令,根据该指令,装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核,在卷积运算部件中做卷积操作,优选的,然后将输出结果做TanH激活;
卷积神经网络ReLU指令,根据该指令,装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核,在卷积运算部件中做卷积操作,优选的,然后将输出结果做ReLU激活;以及
卷积神经网络group指令,根据该指令,装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核,划分group之后,在卷积运算部件中做卷积操作,优选的,然后将输出结果做激活。
CONFIG指令在每层人工神经网络计算开始前配置当前层计算需要的各种常数。
IO指令实现从外部存储空间读入计算需要的输入数据以及在计算完成后将数据存回至外部空间。
NOP指令负责清空当前装置内部所有控制信号缓存队列中的控制信号,保证NOP指令之前的所有指令全部指令完毕。NOP指令本身不包含任何操作;
JUMP指令负责控制将要从寄存器单元读取的下一条指令地址的跳转,用来实现控制流的跳转;
MOVE指令负责将装置内部地址空间某一地址的数据搬运至装置内部地址空间的另一地址,该过程独立于运算单元,在执行过程中不占用运算单元的资源。
如图1所示的运算装置执行卷积计算指令的方法具体可以为:
控制器单元115从寄存器单元112内提取卷积计算指令、卷积计算指令对应的操作域,控制器单元将该操作域传输至数据访问单元。
数据访问单元从存储器内提取该操作域对应的卷积核w和偏置b(当b为0时,不需要提取偏置b),将卷积核w和偏置b传输至运算单元。
计算单元的乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果,将第一结果输入到加法运算器执行加法运算得到第二结果,将第二结果和偏置b执行加法运算得到第三结果,将第三结果输到激活运算器执行激活运算得到输出结果s,将输出结果s传输至数据访问单元存储至存储器内。其中,每个步骤后都可以直接输出结果传输到数据访问存储至存储器内。另外,将第二结果和偏置b执行加法运算得到第三结果这一步骤为可选步骤,即当b为0时,不需要这个步骤。
本申请提供的技术方案通过一个指令即卷积计算指令即实现了卷积的计算,在卷积计算的中间数据(例如第一结果、第二结果、第三结果)均无需存储或提取,减少了中间数据的存储以及提取操作,所以其具有减少对应的操作步骤,提高卷积的计算效果的优点。
如图2a所示,上述主运算模块的结构具体可以包括:
查表部,用于存储有多个线性函数的斜率值和截距值,其中,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b;
线性拟合部,用于根据查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y;
所述主运算单元,用于将中间结果的所有元素值对应的函数值y组合起来得到指令结果。
控制器单元用于控制查表部和线性拟合部的操作,数据传输等行为。查表部为存储器,用于存储多个线性函数的斜率值和截距值,并根据浮点数获取相应的斜率值k和截距值b;线性拟合部根据查表得到的斜率值k和截距值b,得到相应的线性函数y=kx+b,并将浮点数代入线性函数,得到线性函数的函数值,以作为浮点数在非线性函数中的函数值。本申请将非线性函数拟合为多个线性函数,只需针对不同的自变量选择相应的线性函数,故在运算时只需要进行简单的加法和乘法运算,因此简化硬件设计,并提高运算速度,同时降低芯片功耗和面积。
本申请提供一种运算装置,用于根据一输入的浮点数计算非线性函数的函数值,装置包括:
控制器单元,用于对查表部,线性拟合部进行控制。控制单元可以是本装置专有的模块;当本装置作为其他装置的一部分(即作为子模块)的时候,控制单元也可以是其他装置的控制单元的一部分,即通过父模块的控制单元对查表部,线性拟合部进行控制。
查表部,其中包含斜率截距存储部,以及选择部。斜率截距存储部中,存储有多个线性函数的斜率值和截距值,其中,多个线性函数由非线性函数分段线性拟合而得到。选择部根据浮点数获取相应的斜率值k和截距值b的存储位置,以此获得相应的斜率和截距;由于通过一组斜率值和截距值可以确定一个线性函数,因此,斜率值和截距值在存储时要有对应关系;
线性拟合部,用于根据从查表部输出的斜率,截距位置,从斜率截距存储部中取得的斜率值k和截距值b,用于计算线性函数y=k×x+b,其中x为装置的输入浮点数,即自变量,y为装置的输出。线性拟合部中包含乘法器和加法器,用于计算上述线性函数。本申请的原理是,将复杂的非线性函数拟合为多段线性函数,应该可知,分段的区间越小,线性函数与非线性函数的函数值越接近,亦即精度越高。确定输入的浮点数落入分段中的哪一段,由此确定出此段对应的线性函数,并将浮点数代入线性函数中,得到相应的函数值。
根据本申请的一种实施方式,查表部包括斜率截距存储部和选择部,其中,斜率截距存储部用于存储多个线性函数所对应的斜率值和截距值,选择部用于根据浮点数,计算出应该选择的斜率k和截距b在斜率截距存储部中所在的位置。选择部中包含配置部,用于配置选择过程中所需要的参数,包括斜率,截距,以及其他参数。配置部中还包括一个参数存储部,用于存放除斜率,截距之外的其他参数。
配置部所配置的其他参数包括:
N:区间数,用于将非线性函数的自变量分段为N个区间,在每个区间内,将非线性函数拟合为一个线性函数,分别得到N个线性函数,并获取N个线性函数的斜率值和截距值,其中,将N个线性函数的斜率值和截距值存储于斜率截距存储部,每组斜率值和截距值一一对应于N个区间中一个区间的序号index,并将序号index存储于选择部,其中,序号index的取值范围为[0,N-1]。因此,选择部根据浮点数落入哪个区间,获取相应的区间的序号index,并根据序号index在斜率截距存储部得到相应的斜率值k和截距值b。
r:自变量的取值范围。,当参数配置为r时,非线性函数自变量取值范围为(-r,r),并将边界值r的指数部分作为一偏移值bias输入至选择部,所述选择部根据浮点数及偏移值bias,确定序号index,并根据所述序号index得到对应的斜率值和截距值。需要说明的是,线性函数不可能覆盖所有非线性函数的取值,故可设定非线性函数自变量取值范围为(-r,r),以是的在(-r,r)中进行线性拟合。在设定好后,输入的浮点数落入(-r,r)中,这样只需根据浮点数所在区间就可得到相应的序号index,
bias:偏移值。用于处理当输入不落入自变量取值范围的情况。,具体包括:
在选择部进行选择之前,配置部将从外部传入数据存储到配置部中的参数存储部,以及斜率截距存储部。此数据的来源可以是寄存器,片上存储器,片外存储器等,此数据传输由控制单元进行控制。
选择部的具体执行过程如下,其中,所有数据,如bias,exp存放选择部内部的存储单元中(如:寄存器),计算操作通过选择部中的运算单元进行。
当bias-exp<0时,在所述浮点数为正数情况下,index取N-1,在所述浮点数为负数情况下序号index取0,其中,exp为所述浮点数的指数部分;
当0≤bias-exp<W-1时,
index=2W-1+2W-1-m-1+frac[F-1:F-(W-1-m-1)+1]
其中,frac为浮点数的尾数部分,W为序号index的位宽,并且,W=log2N,m=bias–exp,F为所述浮点数的尾数的位宽,然后将index的每一位和所述浮点数的符号位进行异或运算;
当bias-exp≥W-1,index最高位为浮点数的符号位取反,低W-1位均为浮点数的符号位。
根据本申请的一种实施方式,线性拟合部包括乘法器和加法器,其中,乘法器用于将查表部输出的的斜率值k与浮点数相乘,得到相乘结果,加法器用于将乘法器得到相乘结果与查表部输出的截距值b相加,得到最后的函数值y。
本申请提供还一种非线性函数运算方法,用于根据一输入的浮点数计算非线性函数的函数值,方法包括:
S0,控制器控制配置部对装置进行配置,包括前述的各种参数,不同线性函数的斜率和截距。
S1,控制器控制选择部根据输入的浮点数,计算出对应的序号index,用于选择出相应的斜率值k和截距值b,其中,这些斜率和截距为预先准备好的,根据需要拟合的非线性函数进行分段插值计算出来的,并预先存储在与本装置相连接的外部存储器上;
S2,根据S1得到的斜率值k和截距值b,控制器控制线性拟合部,进行线性函数y=k×x+b的计算。
上述步骤具体而言:
S0中配置部的配置方法,具体还包括:
配置部通过配置参数N,将所述非线性函数的自变量分段为N个区间,在每个区间内,选择部根据所述配置的参数bias,N,计算出输入浮点数对应的区间序号,根据此序号,找到斜率截距存储部中相应的斜率和截距,线性拟合部将斜率和输入浮点数相乘,其结果和截距相加,即得到最后的输出结果(非线性函数的拟合结果)。本装置将非线性函数拟合为一个线性函数,分别得到N个线性函数,并获取所述N个线性函数的斜率值和截距值,其中,每组斜率值和截距值一一对应于N个区间中一个区间的序号index,序号index的取值范围为[0,N-1]。
步骤S0还包括,配置部配置参数r,设定非线性函数自变量取值范围为(-r,r),并将边界值r的指数部分作为一偏移值bias;此步骤还包括,根据浮点数及所述偏移值bias,确定序号index,并根据序号index得到对应的斜率值和截距值。
上述步骤S1中,选择部根据浮点数及所述配置部中的参数偏移值bias,确定序号index,包括:
当bias-exp<0时,在输入浮点数为正数情况下,index取N-1,在所述浮点数为负数情况下序号index取0,其中,exp为所述浮点数的指数部分;
当0≤bias-exp<W-1时,
index=2W-1+2W-1-m-1+frac[F-1:F-(W-1-m-1)+1]
其中,frac为所述浮点数的尾数部分,W为序号index的位宽,并且,W=log2N,m=bias–exp,F为浮点数的尾数的位宽,然后将index的每一位和所述浮点数的符号位进行异或运算;
当bias-exp≥W-1,index最高位为浮点数的符号位取反,低W-1位均为浮点数的符号位。
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
图2a是本申请实施例提供的主运算模块的结构图,如图2a所示,装置包括查表部5和线性拟合部6,其中,查表部5用于根据由输入的自变量的值x,以及外部配置进来的偏移量bias,查找到对应的分段线性拟合的斜率和截距。
查表部5包括序号选择部1和斜率截距存储部2,序号选择部1用于根据输入的自变量值x和配置的偏移量bias计算出index,斜率截距存储部2用于根据序号选择部1计算出的index,选出斜率及截距。
线性拟合部6用于根据查表部5得到的斜率和截距通过线性拟合的方法得到最后结果。线性拟合部6包括乘法器3和加法器4,其中,乘法器3用于计算k*x,加法器4用于计算k*x+b。
图2b是本申请实施例提供的非线性函数运算装置的内部结构图,查表部5的输入值是非线性函数的自变量,以及偏移值。序号选择部1根据所述自变量x和偏移量计算出index。
斜率截距存储部2中,Table_k和Table_b里存储了非线性函数分段线性拟合的直线斜率和截距,Table_k和Table_b里的值是可以配置的,在开始计算之前,它们的值应该已完成配置。根据以上所述算出的index,可以选出要使用的斜率Table_k[index],和截距Table_b[index]。
图2c是本申请实施例中线性拟合部的内部结构图,线性拟合部6有三个输入,x表示自变量,即外部输入需要进行非线性变换的值,k和b是查表得到的截距和斜率,输出是最终的结果f(x),线性拟合部6实现的运算是:f(x)=k*x+b。
图2d是本申请实施例的非线性函数运算的原理图,查表部3的输入是自变量x,查找部件3根据x的值找到对应的斜率k和截距b,并将k和b输出,在乘法器4中计算k*x,并将结果和b输出,在加法器5中计算k*x+b,计算得到最终的结果。
以下通过计算非线性函数以进一步解释本申请,将非线性函数的自变量分段为N=64个区间,取值范围r设为7.75,即取值区间为(-7.75,7.75),通过线性拟合以上函数所得到的插值表为:
table_k=[0,0.00048656316525353121,0.00061973162484223741,0.00078928936655365655,0.0010051440297105911,0.0012798783909594086,0.0016294587358847128,0.0020741221116775564,0.0026394821537513336,0.0033578984220486922,0.0042701575375603202,0.0054275134806431417,0.0068941251757849761,0.0087499054356052815,0.011093746329263701,0.014046996903534316,0.017756918346970331,0.022399600632704755,0.028181459980468879,0.035337917880121604,0.044127182785956003,0.054816271160400852,0.067655703617413618,0.082839110694275894,0.10044501610076587,0.12036137423557895,0.14220006304664759,0.16521866898611015,0.18827848066541336,0.20987496057486665,0.22827132183028082,0.24173985504038351,0.24887167444405783,0.24887167444405978,0.24173985504038323,0.22827132183028037,0.20987496057486754,0.18827848066541422,0.16521866898610904,0.14220006304664773,0.1203613742355779,0.10044501610076662,0.082839110694276047,0.067655703617414242,0.054816271160399312,0.044127182785955642,0.035337917880122131,0.028181459980469011,0.022399600632704762,0.017756918346970005,0.014046996903534123,0.011093746329263798,0.0087499054356035919,0.0068941251757841807,0.0054275134806434523,0.0042701575375596592,0.0033578984220488948,0.0026394821537508726,0.002074122111678265,0.0016294587358859139,0.0012798783909593549,0.001005144029710878,0.00078928936655333173,0.00061973162484123137,0.00048656316525207165,0]
table_b=[0,0.0041993251816466815,0.0051986385576176901,0.0064299574345850303,0.0079452052890187242,0.009807238238936004,0.012091883136726765,0.01489024369806616,0.018311254971669941,0.022484429652995856,0.027562682295467392,0.033725030746198308,0.041178847029904868,0.050161149061534412,0.060938175678893231,0.073802158887859029,0.089063797665378613,0.10703847125951904,0.12802378192384653,0.15226575415464311,0.17991125218316206,0.21094542275377304,0.24511595347355658,0.28185147996324666,0.32019008490568668,0.35874483153772002,0.39574347031640295,0.42918193126900617,0.45711585573612518,0.47807264767380625,0.4915012059787659,0.49811232472098371,0.49994440545964863,0.50005559454035076,0.50188767527901634,0.50849879402123443,0.52192735232619281,0.54288414426387344,0.57081806873099528,0.60425652968359678,0.6412551684622817,0.67980991509431143,0.71814852003675334,0.75488404652644192,0.78905457724623107,0.82008874781683905,0.84773424584535517,0.87197621807615311,0.8929615287404804,0.9109362023346228,0.92619784111214154,0.93906182432110619,0.94983885093847398,0.95882115297009929,0.96627496925379974,0.97243731770453612,0.97751557034700309,0.98168874502833281,0.98510975630192921,0.98790811686326541,0.99019276176106386,0.9920547947109799,0.99357004256541748,0.99480136144239018,0.99580067481836443,1]
令输入自变量x为16位浮点小数0.25,其指数exp为13,尾数frac为b’0000000000,bias为17,m为bias–exp=4,落入0≤bias-exp<W-1区间,可得index为26-1+26-1-4-1+frac[16-1:16-(6-1-4-1)+1],即25+20+0=33。
根据index从上述插值表中选出斜率k为k[33]=0.248871674444,截距b为b[33]=0.50005559454,k×x+b的值为0.562273513151,而根据函数采用线性拟合方式算出的结果为0.562176500886,误差为-9.7012265e-05。
综上所述,本申请通过采用线性拟合方式,避免了复杂运算,如对数计算,通过采用乘法,加法这类速度更快的运算操作,提高计算速度,同时,避免了复杂的硬件设计,例如log2x的运算部件,降低了芯片面积和功耗。
图3示出了根据本申请实施例的用于执行卷积神经网络正向运算的装置中主运算模块5的结构的示例框图。如图5所示,主运算模块5包括第一子运算模块51、第一数据依赖关系判定单元52和第一存储单元53。
其中,第一子运算模块51接收来自控制器单元的控制信号,完成主运算模块5的各种运算功能。第一数据依赖关系判定单元52是第一子运算模块51读写第一存储单元53的端口,保证第一存储单元53中数据的读写一致性。同时,第一数据依赖关系判定单元52也负责将从第一存储单元53读取的数据通过互连模块4发送给从运算模块,而从运算模块6的输出数据通过互连模块4直接发送给第一子运算模块51。控制器单元2输出的指令发送给计算单元51和第一数据依赖关系判定单元52,来控制其行为,第一子运算单元还用于根据查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y。
第一存储单元53用于缓存主运算模块5在计算过程中用到的输入数据和输出数据,第一存储单元53还用于存储有多个线性函数的斜率值和截距值,其中,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b。
第一数据依赖关系判定单元52是第一子运算模块51读写第一存储单元53的端口,保证第一存储单元53中数据的读写一致性。同时,第一数据依赖关系判定单元52也负责将从第一存储单元53读取的数据通过互连模块4发送给从运算模块,而从运算模块6的输出数据通过互连模块4直接发送给第一子运算模块51。控制器单元2输出的指令发送给计算单元51和第一数据依赖关系判定单元52,来控制其行为。
图4a以及图4b示出了根据本申请实施例的用于执行卷积神经网络正向运算的装置中从运算模块6的结构的示例框图。如图4a以及图4b所示,每个从运算模块6包括每个从运算模块6包括第二子运算模块61、数据依赖关系判定单元62、第二存储单元63和第三存储单元64。
第二子运算模块61接收控制器单元2发出的控制信号并进行神经网络运算。
第二数据依赖关系判定单元62负责计算过程中对第二存储单元63的读写操作。第二数据依赖关系判定单元62执行读写操作之前会首先保证指令之间所用的数据不存在读写一致性冲突。例如,所有发往数据依赖关系单元62的控制信号都会被存入数据依赖关系单元62内部的指令队列里,在该队列中,读指令的读取数据的范围如果与队列位置靠前的写指令写数据的范围发生冲突,则该指令必须等到所依赖的写指令被执行后才能够执行。
第二存储单元63缓存该从运算模块6的输入数据和输出标量数据。
第三存储单元64缓存该从运算模块6在计算过程中需要的权值数据。
第一数据依赖关系判定单元和第二数据依赖关系判定单元通过以下方式保证读写不存在一致性冲突:判断尚未执行的控制信号与正在执行过程中的控制信号的数据之间是否存在依赖关系,如果不存在依赖关系,确定数据的读写不存在一致性冲突,如果存在依赖关系,确定数据的读写存在一致性冲突。
图5是本申请实施例提供的运算方法的流程图,应用于运算装置,运算装置包括寄存器单元、存储器、数据访问单元、控制器单元和运算单元,如图5所示,执行运算方法的过程包括:
在步骤S5B1,在寄存器单元的首地址处预先存入第一IO指令。
在步骤S5B2,控制器单元从所述寄存器单元的首地址读取第一IO指令,根据第一IO指令译出第一控制信号,数据访问单元根据所述第一控制信号从存储器读取相应的所有运算指令,并将其缓存在寄存器单元中。
在步骤S5B3,控制器单元从寄存器单元读入第二IO指令,根据第二IO指令译出第二控制信号,数据访问单元根据第二IO指令译出的控制信号从存储器读取运算单元需要的所有数据块(例如,包括输入数据、用于作快速的激活函数运算的插值表、用于配置运算器件参数的常数表、偏置数据等)。
在步骤S5B4,控制器单元从寄存器单元读入第一CONFIG指令,根据第一CONFIG指令译出第三控制信号,运算装置根据第三控制信号配置该层神经网络计算需要的各种常数。例如,运算单元根据控制信号里的参数配置单元内部寄存器的值,所述参数包括例如激活函数需要的数据。
在步骤S5B5,控制器单元从寄存器单元读入第二COMPUTE指令,根据第二COMPUTE指令译出第四控制信号,互连模块根据第四控制信号将卷积窗口内的输入数据发给计算单元内的各计算器。
在步骤S5B6,乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果,将第一结果输入到加法运算器执行加法运算得到第二结果,将第二结果和偏置b执行加法运算得到第三结果,将第三结果输入到激活运算器执行激活运算得到输出结果s,将输出结果s传输至所述数据访问单元存储到存储介质内;
或者,在步骤S5B7,运算单元中的多个从运算模块将卷积核w与输入数据Xi执行卷积运算得到中间向量,并将中间向量发送到运算单元中的主运算模块;
在步骤S5B8,主运算模块将所有的中间向量拼接成中间结果;
在步骤S5B9,主运算模块中的线性拟合部根据主运算模块中的查表部得到的斜率值k和截距值b,得到元素值对应的线性函数y=kx+b,并将中间结果的元素值代入元素值对应的线性函数计算得到函数值y,其中,查表部存储有多个线性函数的斜率值和截距值,多个线性函数由非线性函数分段线性拟合而得到,查表部根据中间结果的元素值获取相应的斜率值k和截距值b;
在步骤S5B10,主运算模块中的子主运算模块将中间结果的所有元素值对应的函数值y组合起来得到输出结果s,将输出结果s传输至数据访问单元存储到存储介质内。
可选的,所述运算装置还包括互联模块,所述方法还包括:
所述主运算模块将中间结果与偏置数据相加,然后执行非线性函数运算;
所述互联模块根据第四控制信号,将所述运算单元中的乘法计算器、加法计算器和激活计算器进行连接,使得所述运算单元构成第一计算拓扑结构。
可选的,所述方法还包括:
所述主运算模块中的第一存储单元缓存所述主运算模块在计算过程中用到的输入数据和输出数据;
所述主运算模块中的第一子运算模块完成所述主运算模块的各种运算功能;
所述主运算模块中的第一数据依赖关系判定单元保证对所述第一存储单元的数据的读写不存在一致性冲突,并负责从所述第一存储单元读取输入的数据,并通过所述互联模块将输入的数据发送给所述多个从运算模块;以及接收所述互连模块的发送的中间向量并发送到所述第一子运算模块。
可选的,所述方法还包括:
所述从运算模块中的第二子运算模块执行从所述运算模块的卷积运算中的各种算术逻辑运算;
所述从运算模块中的第二数据依赖关系判定单元负责计算过程中对所述第二存储单元和所述第三存储单元的读写操作,并保证对所述第二存储单元和所述第三存储单元的读写不存在一致性冲突;
所述从运算模块中的第二存储单元缓存数据块和所述从运算模块计算得到的输出标量;
所述从运算模块中的第三存储单元缓存所述从运算模块在计算过程中需要的卷积核数据。
可选的,所述第一数据依赖关系判定单元和所述第二数据依赖关系判定单元通过以下方式保证读写不存在一致性冲突:判断尚未执行的控制信号的数据与正在执行过程中的控制信号的数据之间是否存在依赖关系,如果不存在依赖关系,则确定出数据的读写不存在一致性冲突,如果存在依赖关系,则确定出数据的读写存在一致性冲突。
可选的,在所述将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y方面,所述方法包括:
所述线性拟合部中的乘法器将斜率值k与中间元素结果值相乘,得到中间结果;
所述线性拟合部中的加法器将所述中间结果与所述截距值b相加,得到函数值y。
可选的,在所述多个线性函数由所述非线性函数分段线性拟合而得到方面,所述方法包括:
所述查表部中的配置部将所述非线性函数的自变量分段为N个区间,在每个区间内,将非线性函数拟合为一个线性函数,分别得到N个线性函数,并获取所述N个线性函数的斜率值和截距值,其中,将N个线性函数的斜率值和截距值存储于所述斜率截距存储部,每组斜率值和截距值一一对应于N个区间中一个区间的序号index,并将所述序号index存储于选择部,其中,序号index的取值范围为[0,N-1]。
可选的,所述方法还包括:
所述查表部中的配置部设定所述非线性函数自变量取值范围为(-r,r),并将边界值r的指数部分作为一偏移值bias输入至所述选择部,所述选择部根据所述浮点数及所述偏移值bias,确定序号index,并根据所述序号index得到对应的斜率值和截距值。
可选的,所述方法还包括:
所述查表部中的配置部在bias-exp<0时,在所述浮点数为正数情况下,index取N-1,在所述浮点数为负数情况下序号index取0,其中,exp为所述浮点数的指数部分;
当0≤bias-exp<W-1时,
index=2W-1+2W-1-m-1+frac[F-1:F-(W-1-m-1)+1]
其中,frac为所述中间结果元素值的尾数部分,W为序号index的位宽,并且,W=log2N,m=bias–exp,F为所述中间结果元素值的尾数的位宽,然后将index的每一位和所述中间结果元素值的符号位进行异或运算;
当bias-exp≥W-1,index最高位为所述中间结果元素值的符号位取反,低W-1位均为所述浮点数的符号位。
本申请实施例提供了一种芯片,该芯片集成上述运算装置。
本申请实施例提供了一种电子设备,所述电子设备包括上述芯片。
本申请实施例提供了一种计算机可读存储介质,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行上述运算方法中的全部或部分步骤。
对于多层神经网络卷积层,其实现过程与单层神经网络卷积层类似,当上一层卷积神经网络执行完毕后,下一层的运算指令会将主运算单元中存储的上一层的输出数据地址作为本层的输入数据地址。同样地,指令中的卷积核和偏置数据地址也会变更至本层对应的地址。
通过采用用于执行卷积神经网络正向运算的装置和指令集,解决了CPU和GPU运算性能不足,前端译码开销大的问题。有效提高了对多层卷积神经网络正向运算的支持。
通过采用针对多层卷积神经网络正向运算的专用片上缓存,充分挖掘了输入神经元和卷积核数据的重用性,避免了反复向内存读取这些数据,降低了内存访问带宽,避免了内存带宽成为多层卷积神经网络正向运算性能瓶颈的问题。
前面的附图中所描绘的进程或方法可通过包括硬件(例如,电路、专用逻辑等)、固件、软件(例如,被具体化在非瞬态计算机可读介质上的软件),或两者的组合的处理逻辑来执行。虽然上文按照某些顺序操作描述了进程或方法,但是,应该理解,所描述的某些操作能以不同顺序来执行。此外,可并行地而非顺序地执行一些操作。
在前述的说明书中,参考其特定示例性实施例描述了本申请的各实施例。显然,可对各实施例做出各种修改,而不背离所附权利要求所述的本申请的更广泛的精神和范围。相应地,说明书和附图应当被认为是说明性的,而不是限制性的。

Claims (23)

1.一种运算装置,其特征在于,所述运算装置包括存储器、控制器单元、互联模块和运算单元,其中,
所述存储器,用于存储数据块,所述数据块包括n维数据,n为大于等于1的整数;
所述互联模块,用于连接运算单元中的计算器以使得所述运算单元构成第一计算拓扑结构,以及接收数据块,将数据块发送至运算单元;
所述控制器单元,用于从寄存器单元内提取运算指令,将运算指令译码成执行指令,执行指令用于控制运算单元执行运算操作,将运算指令对应的操作域传输至所述数据访问单元;
所述运算单元,用于根据所行指令调用所述运算单元中的计算器对运算指令对应的操作域对应的数据块执行运算操作得到运算结果,将运算结果传输至所述数据访问单元以及存储在所述存储器内;
所述运算单元包括主运算模块和多个从运算模块,所述多个从运算模块用于将接收输入数据和运算指令对应的操作域对应的数据块执行卷积运算得到的中间向量,将所述中间向量通过所述互联模块转发至所述主运算模块;所述主运算模块用于将所有中间向量拼接成中间结果,并对所述中间结果执行非线性函数运算得到指令结果;
所述主运算模块包括:
查表部,用于存储有多个线性函数的斜率值和截距值,其中,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b;
线性拟合部,用于根据查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y;
子主运算模块,用于将中间结果的所有元素值对应的函数值y组合起来得到指令结果。
2.根据权利要求1所述的运算装置,其特征在于,所述装置还包括:
寄存器单元,用于存储运算指令、数据块在存储介质的地址、运算指令对应的计算拓扑结构;
数据访问单元,用于从所述存储器中提取运算指令对应的操作域对应的数据块,并将运算指令对应的操作域对应的数据块输至所述互联模块。
3.根据权利要求1所述的运算装置,其特征在于,所述主运算模块,用于将中间结果与偏置数据相加,然后执行非线性函数运算。
4.根据权利要求1所述的运算装置,其特征在于,所述主运算模块还包括:第一存储单元、第一子运算模块和第一数据依赖关系判定单元;
所述第一存储单元,用于缓存所述主运算模块在计算过程中用到的输入数据和输出数据;
所述第一子运算模块,用于完成所述主运算模块的各种运算功能;
所述第一数据依赖关系判定单元,用于保证对所述第一存储单元的数据的读写不存在一致性冲突,并负责从所述第一存储单元读取输入的数据,并通过所述互联模块将输入的数据发送给所述多个从运算模块;以及接收所述互连模块的发送的中间向量并发送到所述第一子运算模块。
5.根据权利要求1所述的运算装置,其特征在于,所述从运算模块包括:第二子运算模块、第二数据依赖关系判定单元、第二存储单元和第三存储单元;
所述第二子运算模块,用于完成从所述运算模块的卷积运算中的各种算术逻辑运算;
所述第二数据依赖关系判定单元,用于负责计算过程中对所述第二存储单元和所述第三存储单元的读写操作,并保证对所述第二存储单元和所述第三存储单元的读写不存在一致性冲突;
所述第二存储单元,用于缓存数据块和所述从运算模块计算得到的输出标量;
所述第三存储单元,用于缓存所述从运算模块在计算过程中需要的卷积核数据。
6.根据权利要求4或5所述的运算装置,其特征在于,所述第一数据依赖关系判定单元和所述第二数据依赖关系判定单元通过以下方式保证读写不存在一致性冲突:判断尚未执行的控制信号的数据与正在执行过程中的控制信号的数据之间是否存在依赖关系,如果不存在依赖关系,则确定出数据的读写不存在一致性冲突,如果存在依赖关系,则确定出数据的读写存在一致性冲突。
7.根据权利要求1所述的运算装置,其特征在于,所述查表部包括:
斜率截距存储部,用于存储多个线性函数所对应的斜率值和截距值;
选择部,用于根据浮点数在所述斜率截距存储部中选择并获取相应的斜率值k和截距值b。
8.根据权利要求7所述的运算装置,其特征在于,所述查表部还包括:
配置部,用于将所述非线性函数的自变量分段为N个区间,在每个区间内,将非线性函数拟合为一个线性函数,分别得到N个线性函数,并获取所述N个线性函数的斜率值和截距值,其中,将N个线性函数的斜率值和截距值存储于所述斜率截距存储部,每组斜率值和截距值一一对应于N个区间中一个区间的序号index,并将所述序号index存储于选择部,其中,序号index的取值范围为[0,N-1]。
9.根据权利要求8所述的运算装置,其特征在于,所述配置部,还用于设定所述非线性函数自变量取值范围为(-r,r),并将边界值r的指数部分作为一偏移值bias输入至所述选择部,所述选择部根据所述浮点数及所述偏移值bias,确定序号index,并根据所述序号index得到对应的斜率值和截距值。
10.根据权利要求9所述的运算装置,其特征在于,所述配置部,还用于当bias-exp<0时,在所述浮点数为正数情况下,index取N-1,在所述浮点数为负数情况下序号index取0,其中,exp为所述浮点数的指数部分;
当0≤bias-exp<W-1时,
index=2W-1+2W-1-m-1+frac[F-1:F-(W-1-m-1)+1]
其中,frac为所述中间结果元素值的尾数部分,W为序号index的位宽,并且,W=log2N,m=bias–exp,F为所述中间结果元素值的尾数的位宽,然后将index的每一位和所述中间结果元素值的符号位进行异或运算;
当bias-exp≥W-1,index最高位为所述中间结果元素值的符号位取反,低W-1位均为所述浮点数的符号位。
11.根据权利要求1所述的运算装置,其特征在于,所述线性拟合部包括:
乘法器,用于将查表得到的斜率值k与所述中间结果元素值相乘,得到相乘结果;
加法器,用于将乘法器得到相乘结果与查表得到的截距值b相加,得到所述线性函数的函数值y。
12.一种运算方法,其特征在于,所述方法由运算装置执行,所述运算装置包括寄存器单元、存储器、数据访问单元、控制器单元和运算单元,其中,
所述控制器单元从所述寄存器单元的首地址读取第一IO指令,根据所述第一IO指令译出第一控制信号,所述数据访问单元根据所述第一控制信号从存储器读取相应的所有运算指令,并将其缓存在所述寄存器单元中;
所述控制器单元从所述寄存器单元读入第二IO指令,根据所述第二IO指令译出第二控制信号,所述数据访问单元根据所述第二IO指令译出的控制信号从所述存储器读取运算单元需要的所有数据块;
所述控制器单元从寄存器单元读入第一CONFIG指令,根据所述第一CONFIG指令译出第三控制信号,所述运算装置根据所述第三控制信号配置该层神经网络计算需要的各种常数;
所述控制器单元从寄存器单元读入第二COMPUTE指令,根据第二COMPUTE指令译出第四控制信号,所述互连模块根据所述第四控制信号将卷积窗口内的输入数据发给计所述算单元内的各计算器;
所述乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果,将所述第一结果输入到所述加法运算器执行加法运算得到第二结果,将所述第二结果和偏置b执行加法运算得到第三结果,将所述第三结果输入到激活运算器执行激活运算得到输出结果s,将所述输出结果s传输至所述数据访问单元存储到存储介质内,所述激活运算包括非线性函数运算;
或者,所述运算单元中的多个从运算模块将卷积核w与输入数据Xi执行卷积运算得到中间向量,并将所述中间向量发送到所述运算单元中的主运算模块;
所述主运算模块将所有的中间向量拼接成中间结果;
所述主运算模块中的线性拟合部根据主运算模块中的查表部得到的斜率值k和截距值b,得到所述元素值对应的线性函数y=kx+b,并将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y,其中,所述查表部存储有多个线性函数的斜率值和截距值,所述多个线性函数由所述非线性函数分段线性拟合而得到,所述查表部根据所述中间结果的元素值获取相应的斜率值k和截距值b;
所述主运算模块中的子主运算模块将中间结果的所有元素值对应的函数值y组合起来得到输出结果s,将所述输出结果s传输至所述数据访问单元存储到存储介质内。
13.根据权利要求12所述的方法,其特征在于,所述运算装置还包括互联模块,所述方法还包括:
所述主运算模块将中间结果与偏置数据相加,然后执行非线性函数运算;
所述互联模块根据第四控制信号,将所述运算单元中的乘法计算器、加法计算器和激活计算器进行连接,使得所述运算单元构成第一计算拓扑结构。
14.根据权利要求12所述的方法,其特征在于,所述方法还包括:
所述主运算模块中的第一存储单元缓存所述主运算模块在计算过程中用到的输入数据和输出数据;
所述主运算模块中的第一子运算模块完成所述主运算模块的各种运算功能;
所述主运算模块中的第一数据依赖关系判定单元保证对所述第一存储单元的数据的读写不存在一致性冲突,并负责从所述第一存储单元读取输入的数据,并通过所述互联模块将输入的数据发送给所述多个从运算模块;以及接收所述互连模块的发送的中间向量并发送到所述第一子运算模块。
15.根据权利要求12所述的方法,其特征在于,所述方法还包括:
所述从运算模块中的第二子运算模块执行从所述运算模块的卷积运算中的各种算术逻辑运算;
所述从运算模块中的第二数据依赖关系判定单元负责计算过程中对所述第二存储单元和所述第三存储单元的读写操作,并保证对所述第二存储单元和所述第三存储单元的读写不存在一致性冲突;
所述从运算模块中的第二存储单元缓存数据块和所述从运算模块计算得到的输出标量;
所述从运算模块中的第三存储单元缓存所述从运算模块在计算过程中需要的卷积核数据。
16.根据权利要求14或15所述的方法,其特征在于,所述第一数据依赖关系判定单元和所述第二数据依赖关系判定单元通过以下方式保证读写不存在一致性冲突:判断尚未执行的控制信号的数据与正在执行过程中的控制信号的数据之间是否存在依赖关系,如果不存在依赖关系,则确定出数据的读写不存在一致性冲突,如果存在依赖关系,则确定出数据的读写存在一致性冲突。
17.根据权利要求12所述的方法,其特征在于,所述将所述中间结果的元素值代入所述元素值对应的线性函数计算得到函数值y,包括:
所述线性拟合部中的乘法器将斜率值k与中间元素结果值相乘,得到中间结果;
所述线性拟合部中的加法器将所述中间结果与所述截距值b相加,得到函数值y。
18.根据权利要求12所述的方法,其特征在于,所述多个线性函数由所述非线性函数分段线性拟合而得到,包括:
所述查表部中的配置部将所述非线性函数的自变量分段为N个区间,在每个区间内,将非线性函数拟合为一个线性函数,分别得到N个线性函数,并获取所述N个线性函数的斜率值和截距值,其中,将N个线性函数的斜率值和截距值存储于所述斜率截距存储部,每组斜率值和截距值一一对应于N个区间中一个区间的序号index,并将所述序号index存储于选择部,其中,序号index的取值范围为[0,N-1]。
19.根据权利要求18所述的方法,其特征在于,所述方法还包括:
所述查表部中的配置部设定所述非线性函数自变量取值范围为(-r,r),并将边界值r的指数部分作为一偏移值bias输入至所述选择部,所述选择部根据所述浮点数及所述偏移值bias,确定序号index,并根据所述序号index得到对应的斜率值和截距值。
20.根据权利要求19所述的方法,其特征在于,所述方法还包括:
所述查表部中的配置部在bias-exp<0时,在所述浮点数为正数情况下,index取N-1,在所述浮点数为负数情况下序号index取0,其中,exp为所述浮点数的指数部分;
当0≤bias-exp<W-1时,
index=2W-1+2W-1-m-1+frac[F-1:F-(W-1-m-1)+1]
其中,frac为所述中间结果元素值的尾数部分,W为序号index的位宽,并且,W=log2N,m=bias–exp,F为所述中间结果元素值的尾数的位宽,然后将index的每一位和所述中间结果元素值的符号位进行异或运算;
当bias-exp≥W-1,index最高位为所述中间结果元素值的符号位取反,低W-1位均为所述浮点数的符号位。
21.一种芯片,其特征在于,所述芯片集成如权利要求1-11任意一项所述的运算装置。
22.一种电子设备,其特征在于,所述电子设备包括如权利要求21所述的芯片。
23.一种计算机可读存储介质,其特征在于,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求12-20任一项所述的方法。
CN201910070501.XA 2017-10-30 2018-09-13 一种运算装置和方法 Active CN110084361B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2017110363749 2017-10-30
CN201711036374.9A CN109726806A (zh) 2017-10-30 2017-10-30 信息处理方法及终端设备
CN201880002336.8A CN109997154A (zh) 2017-10-30 2018-09-13 信息处理方法及终端设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880002336.8A Division CN109997154A (zh) 2017-10-30 2018-09-13 信息处理方法及终端设备

Publications (2)

Publication Number Publication Date
CN110084361A true CN110084361A (zh) 2019-08-02
CN110084361B CN110084361B (zh) 2021-03-23

Family

ID=61645528

Family Applications (48)

Application Number Title Priority Date Filing Date
CN201711212991.XA Pending CN107992486A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201711212122.7A Pending CN107833176A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849498.7A Active CN108958801B (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行向量最大值指令的方法
CN201711212123.1A Pending CN107993206A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849496.8A Active CN109062607B (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量最小值指令的方法
CN201810849497.2A Active CN109086074B (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量复制指令的方法
CN201810849480.7A Active CN108984211B (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行吉文斯旋转指令的方法
CN201811440571.1A Active CN109542515B (zh) 2017-10-30 2017-10-30 运算装置及方法
CN201810799987.6A Pending CN109117947A (zh) 2017-10-30 2017-10-30 轮廓检测方法及相关产品
CN201810849492.XA Pending CN108874445A (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行向量点积指令的方法
CN201711036374.9A Pending CN109726806A (zh) 2017-10-30 2017-10-30 信息处理方法及终端设备
CN201711212660.6A Active CN107895191B (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849488.3A Active CN109034383B (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行矩阵相乘指令的方法
CN201711212994.3A Pending CN107832844A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810800665.9A Pending CN108898554A (zh) 2017-10-30 2017-10-30 提高图像分辨率的方法及相关产品
CN201811440484.6A Active CN109522254B (zh) 2017-10-30 2017-10-30 运算装置及方法
CN201810849509.1A Pending CN109117184A (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行平面旋转指令的方法
CN201711244020.3A Active CN109725936B (zh) 2017-10-30 2017-10-30 扩展计算指令的实现方法以及相关产品
CN201810799954.1A Pending CN108986022A (zh) 2017-10-30 2017-10-30 图像美化方法及相关产品
CN201810801239.7A Pending CN109034382A (zh) 2017-10-30 2017-10-30 场景或物体的识别方法及相关产品
CN201711211933.5A Pending CN107844832A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849479.4A Pending CN109063830A (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量范数指令的方法
CN201810800664.4A Pending CN109064384A (zh) 2017-10-30 2017-10-30 物体检测方法及相关产品
CN201810801238.2A Pending CN109003603A (zh) 2017-10-30 2017-10-30 语音识别方法及相关产品
CN201810849491.5A Pending CN109063831A (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行向量加和指令的方法
CN201810849499.1A Active CN109086075B (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行矩阵乘向量指令的方法
CN201810849485.XA Pending CN108874444A (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量外积指令的方法
CN201711212125.0A Pending CN107832804A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201811436410.5A Active CN109542514B (zh) 2017-10-30 2017-10-30 运算指令的实现方法以及相关产品
CN201810849483.0A Active CN109062606B (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量缩放指令的方法
CN201711212995.8A Pending CN107832845A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849484.5A Active CN109117183B (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行向量交换指令的方法
CN201810799988.0A Active CN109003132B (zh) 2017-10-30 2017-10-30 广告推荐方法及相关产品
CN201711212656.XA Active CN107832843B (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810801236.3A Active CN109117948B (zh) 2017-10-30 2017-10-30 画风转换方法及相关产品
CN201810849486.4A Pending CN109062539A (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行向量乘加指令的方法
CN201810800001.2A Pending CN108875926A (zh) 2017-10-30 2017-10-30 语言翻译方法及相关产品
CN201910067288.7A Pending CN109523020A (zh) 2017-10-30 2018-09-13 一种运算装置和方法
CN202010336354.9A Active CN111310910B (zh) 2017-10-30 2018-09-13 一种计算装置及方法
CN202010190143.9A Pending CN111160549A (zh) 2017-10-30 2018-09-13 互连电路的数据处理装置以及方法
CN201880002336.8A Pending CN109997154A (zh) 2017-10-30 2018-09-13 信息处理方法及终端设备
CN201911058910.4A Active CN110689126B (zh) 2017-10-30 2018-09-13 一种用于执行神经网络运算的装置
CN202010190142.4A Active CN111160548B (zh) 2017-10-30 2018-09-13 计算装置以及计算方法
CN201911062123.7A Active CN110610236B (zh) 2017-10-30 2018-09-13 一种用于执行神经网络运算的装置及方法
CN202010309559.8A Active CN111291880B (zh) 2017-10-30 2018-09-13 计算装置以及计算方法
CN201911058839.XA Pending CN110689125A (zh) 2017-10-30 2018-09-13 计算装置
CN202010189354.0A Pending CN111178521A (zh) 2017-10-30 2018-09-13 计算装置以及方法
CN201910070501.XA Active CN110084361B (zh) 2017-10-30 2018-09-13 一种运算装置和方法

Family Applications Before (47)

Application Number Title Priority Date Filing Date
CN201711212991.XA Pending CN107992486A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201711212122.7A Pending CN107833176A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849498.7A Active CN108958801B (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行向量最大值指令的方法
CN201711212123.1A Pending CN107993206A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849496.8A Active CN109062607B (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量最小值指令的方法
CN201810849497.2A Active CN109086074B (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量复制指令的方法
CN201810849480.7A Active CN108984211B (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行吉文斯旋转指令的方法
CN201811440571.1A Active CN109542515B (zh) 2017-10-30 2017-10-30 运算装置及方法
CN201810799987.6A Pending CN109117947A (zh) 2017-10-30 2017-10-30 轮廓检测方法及相关产品
CN201810849492.XA Pending CN108874445A (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行向量点积指令的方法
CN201711036374.9A Pending CN109726806A (zh) 2017-10-30 2017-10-30 信息处理方法及终端设备
CN201711212660.6A Active CN107895191B (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849488.3A Active CN109034383B (zh) 2017-10-30 2017-10-30 神经网络处理器及使用处理器执行矩阵相乘指令的方法
CN201711212994.3A Pending CN107832844A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810800665.9A Pending CN108898554A (zh) 2017-10-30 2017-10-30 提高图像分辨率的方法及相关产品
CN201811440484.6A Active CN109522254B (zh) 2017-10-30 2017-10-30 运算装置及方法
CN201810849509.1A Pending CN109117184A (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行平面旋转指令的方法
CN201711244020.3A Active CN109725936B (zh) 2017-10-30 2017-10-30 扩展计算指令的实现方法以及相关产品
CN201810799954.1A Pending CN108986022A (zh) 2017-10-30 2017-10-30 图像美化方法及相关产品
CN201810801239.7A Pending CN109034382A (zh) 2017-10-30 2017-10-30 场景或物体的识别方法及相关产品
CN201711211933.5A Pending CN107844832A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849479.4A Pending CN109063830A (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量范数指令的方法
CN201810800664.4A Pending CN109064384A (zh) 2017-10-30 2017-10-30 物体检测方法及相关产品
CN201810801238.2A Pending CN109003603A (zh) 2017-10-30 2017-10-30 语音识别方法及相关产品
CN201810849491.5A Pending CN109063831A (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行向量加和指令的方法
CN201810849499.1A Active CN109086075B (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行矩阵乘向量指令的方法
CN201810849485.XA Pending CN108874444A (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量外积指令的方法
CN201711212125.0A Pending CN107832804A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201811436410.5A Active CN109542514B (zh) 2017-10-30 2017-10-30 运算指令的实现方法以及相关产品
CN201810849483.0A Active CN109062606B (zh) 2017-10-30 2017-10-30 机器学习处理器及使用处理器执行向量缩放指令的方法
CN201711212995.8A Pending CN107832845A (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810849484.5A Active CN109117183B (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行向量交换指令的方法
CN201810799988.0A Active CN109003132B (zh) 2017-10-30 2017-10-30 广告推荐方法及相关产品
CN201711212656.XA Active CN107832843B (zh) 2017-10-30 2017-10-30 一种信息处理方法及相关产品
CN201810801236.3A Active CN109117948B (zh) 2017-10-30 2017-10-30 画风转换方法及相关产品
CN201810849486.4A Pending CN109062539A (zh) 2017-10-30 2017-10-30 人工智能处理器及使用处理器执行向量乘加指令的方法
CN201810800001.2A Pending CN108875926A (zh) 2017-10-30 2017-10-30 语言翻译方法及相关产品
CN201910067288.7A Pending CN109523020A (zh) 2017-10-30 2018-09-13 一种运算装置和方法
CN202010336354.9A Active CN111310910B (zh) 2017-10-30 2018-09-13 一种计算装置及方法
CN202010190143.9A Pending CN111160549A (zh) 2017-10-30 2018-09-13 互连电路的数据处理装置以及方法
CN201880002336.8A Pending CN109997154A (zh) 2017-10-30 2018-09-13 信息处理方法及终端设备
CN201911058910.4A Active CN110689126B (zh) 2017-10-30 2018-09-13 一种用于执行神经网络运算的装置
CN202010190142.4A Active CN111160548B (zh) 2017-10-30 2018-09-13 计算装置以及计算方法
CN201911062123.7A Active CN110610236B (zh) 2017-10-30 2018-09-13 一种用于执行神经网络运算的装置及方法
CN202010309559.8A Active CN111291880B (zh) 2017-10-30 2018-09-13 计算装置以及计算方法
CN201911058839.XA Pending CN110689125A (zh) 2017-10-30 2018-09-13 计算装置
CN202010189354.0A Pending CN111178521A (zh) 2017-10-30 2018-09-13 计算装置以及方法

Country Status (4)

Country Link
US (5) US20210182077A1 (zh)
EP (1) EP3709224A4 (zh)
CN (48) CN107992486A (zh)
WO (1) WO2019085655A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647718A (zh) * 2019-09-26 2020-01-03 深圳芯英科技有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN111027690A (zh) * 2019-11-26 2020-04-17 陈子祺 执行确定性推理的组合处理装置、芯片和方法
CN111767508A (zh) * 2020-07-09 2020-10-13 地平线(上海)人工智能技术有限公司 计算机实现张量数据计算的方法、装置、介质和设备
CN112200299A (zh) * 2020-09-09 2021-01-08 厦门星宸科技有限公司 神经网络计算装置、数据处理方法及装置
CN112328511A (zh) * 2021-01-04 2021-02-05 统信软件技术有限公司 一种数据处理方法、计算设备及可读存储介质
CN112346781A (zh) * 2019-08-07 2021-02-09 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
WO2021078210A1 (zh) * 2019-10-25 2021-04-29 安徽寒武纪信息科技有限公司 用于神经网络运算的计算装置、方法、集成电路和设备
CN113128673A (zh) * 2019-12-31 2021-07-16 Oppo广东移动通信有限公司 数据处理方法、存储介质、神经网络处理器及电子设备
CN115640493A (zh) * 2022-10-28 2023-01-24 成都医学院 基于fpga的分段线性分数阶运算ip核
US11562235B2 (en) 2020-02-21 2023-01-24 International Business Machines Corporation Activation function computation for neural networks

Families Citing this family (255)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3563304B1 (en) * 2016-12-30 2022-03-09 Intel Corporation Deep learning hardware
US11037330B2 (en) * 2017-04-08 2021-06-15 Intel Corporation Low rank matrix compression
WO2018192500A1 (zh) * 2017-04-19 2018-10-25 上海寒武纪信息科技有限公司 处理装置和处理方法
EP3637325A4 (en) * 2017-05-23 2020-05-27 Shanghai Cambricon Information Technology Co., Ltd TREATMENT METHOD AND ACCELERATION DEVICE
WO2019114842A1 (zh) * 2017-12-14 2019-06-20 北京中科寒武纪科技有限公司 一种集成电路芯片装置
JP6454397B1 (ja) * 2017-12-20 2019-01-16 Nttエレクトロニクス株式会社 誤り訂正装置、誤り訂正方法及び光通信システム
US11636327B2 (en) * 2017-12-29 2023-04-25 Intel Corporation Machine learning sparse computation mechanism for arbitrary neural networks, arithmetic compute microarchitecture, and sparsity for training mechanism
US20190244080A1 (en) * 2018-02-02 2019-08-08 Wisconsin Alumni Research Foundation Neural Network Processor with On-Chip Convolution Kernel Storage
CN108388446A (zh) * 2018-02-05 2018-08-10 上海寒武纪信息科技有限公司 运算模块以及方法
CN110222833B (zh) * 2018-03-01 2023-12-19 华为技术有限公司 一种用于神经网络的数据处理电路
CN108470211B (zh) * 2018-04-09 2022-07-12 郑州云海信息技术有限公司 一种卷积计算的实现方法、设备和计算机存储介质
CN110399976B (zh) * 2018-04-25 2022-04-05 华为技术有限公司 计算装置和计算方法
CN108629409B (zh) * 2018-04-28 2020-04-10 中国科学院计算技术研究所 一种基于主成分分析减少io开销的神经网络处理系统
CN110472734B (zh) * 2018-05-11 2024-03-29 上海寒武纪信息科技有限公司 一种计算装置及相关产品
CN108804223A (zh) * 2018-05-16 2018-11-13 努比亚技术有限公司 内存优化方法、移动终端及计算机可读存储介质
CN108831475B (zh) * 2018-05-24 2020-09-29 广州市千钧网络科技有限公司 一种文本消息提取方法及系统
CN110383330A (zh) * 2018-05-30 2019-10-25 深圳市大疆创新科技有限公司 池化装置和池化方法
US11880762B2 (en) * 2018-06-26 2024-01-23 International Business Machines Corporation Choosing execution mode of a neural network based on total memory usage
CN110647356A (zh) * 2018-06-27 2020-01-03 北京中科寒武纪科技有限公司 运算装置及相关产品
CN110728364A (zh) * 2018-07-17 2020-01-24 上海寒武纪信息科技有限公司 一种运算装置和运算方法
CN110647973A (zh) * 2018-06-27 2020-01-03 北京中科寒武纪科技有限公司 运算方法及相关方法和产品
WO2020014590A1 (en) * 2018-07-12 2020-01-16 Futurewei Technologies, Inc. Generating a compressed representation of a neural network with proficient inference speed and power consumption
CN109165728B (zh) * 2018-08-06 2020-12-18 浪潮集团有限公司 一种卷积神经网络的基本计算单元及计算方法
CN110874343B (zh) * 2018-08-10 2023-04-21 北京百度网讯科技有限公司 基于深度学习芯片进行语音处理的方法和深度学习芯片
KR20200023238A (ko) * 2018-08-23 2020-03-04 삼성전자주식회사 딥러닝 모델을 생성하는 방법 및 시스템
CN110865792B (zh) * 2018-08-28 2021-03-19 中科寒武纪科技股份有限公司 数据预处理方法、装置、计算机设备和存储介质
CN110874605B (zh) * 2018-08-31 2024-05-03 嘉楠明芯(北京)科技有限公司 图像识别处理方法和装置
CN110874632B (zh) * 2018-08-31 2024-05-03 嘉楠明芯(北京)科技有限公司 图像识别处理方法和装置
CN109242091B (zh) * 2018-09-03 2022-03-22 郑州云海信息技术有限公司 图像识别方法、装置、设备及可读存储介质
CN109065076B (zh) * 2018-09-05 2020-11-27 深圳追一科技有限公司 音频标签的设置方法、装置、设备和存储介质
US20210098001A1 (en) * 2018-09-13 2021-04-01 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
CN110897626A (zh) * 2018-09-14 2020-03-24 杭州脉流科技有限公司 基于深度神经网络的心电图分析方法、装置、计算机设备和系统
CN110968285A (zh) * 2018-09-28 2020-04-07 上海寒武纪信息科技有限公司 信号处理装置及相关产品
WO2020062392A1 (zh) 2018-09-28 2020-04-02 上海寒武纪信息科技有限公司 信号处理装置、信号处理方法及相关产品
CN110969246A (zh) * 2018-09-28 2020-04-07 上海寒武纪信息科技有限公司 信号处理装置及相关产品
US11928208B2 (en) * 2018-10-02 2024-03-12 Nippon Telegraph And Telephone Corporation Calculation device, calculation method, and calculation program
CN111353124A (zh) * 2018-12-20 2020-06-30 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN110096309B (zh) * 2018-11-14 2020-04-14 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111338694B (zh) * 2018-12-19 2022-05-31 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111047005A (zh) * 2018-10-11 2020-04-21 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111047027A (zh) * 2018-10-12 2020-04-21 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111353125B (zh) * 2018-12-20 2022-04-22 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111275197B (zh) * 2018-12-05 2023-11-10 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111339060B (zh) * 2018-12-19 2024-03-12 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111290788B (zh) * 2018-12-07 2022-05-31 上海寒武纪信息科技有限公司 运算方法、装置、计算机设备和存储介质
CN111353595A (zh) * 2018-12-20 2020-06-30 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111222633A (zh) * 2018-11-23 2020-06-02 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111047021B (zh) * 2018-10-12 2023-11-24 中科寒武纪科技股份有限公司 一种计算装置及相关产品
CN111047024B (zh) * 2018-10-12 2023-05-23 上海寒武纪信息科技有限公司 一种计算装置及相关产品
CN111047022B (zh) * 2018-10-12 2023-11-24 中科寒武纪科技股份有限公司 一种计算装置及相关产品
CN111045728B (zh) * 2018-10-12 2022-04-12 上海寒武纪信息科技有限公司 一种计算装置及相关产品
CN111079907B (zh) * 2018-10-19 2021-01-26 安徽寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111079911B (zh) * 2018-10-19 2021-02-09 中科寒武纪科技股份有限公司 运算方法、系统及相关产品
US11294985B2 (en) * 2018-10-30 2022-04-05 Intel Corporation Efficient analog in-memory matrix multiplication processor
US11526759B2 (en) * 2018-11-05 2022-12-13 International Business Machines Corporation Large model support in deep learning
KR102462910B1 (ko) * 2018-11-12 2022-11-04 한국전자통신연구원 배치 정규화 레이어의 웨이트들에 대한 양자화 방법 및 그 장치
CN109491938A (zh) * 2018-11-27 2019-03-19 济南浪潮高新科技投资发展有限公司 一种面向卷积神经网络加速的多通道dma控制器和卷积神经网络加速方法
US11056098B1 (en) * 2018-11-28 2021-07-06 Amazon Technologies, Inc. Silent phonemes for tracking end of speech
CN109583579B (zh) * 2018-11-30 2021-04-09 上海寒武纪信息科技有限公司 计算装置及相关产品
CN111399905B (zh) * 2019-01-02 2022-08-16 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111258641B (zh) * 2018-11-30 2022-12-09 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111382390B (zh) * 2018-12-28 2022-08-12 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN109543825B (zh) * 2018-11-30 2020-12-01 安徽寒武纪信息科技有限公司 神经网络模型算法编译方法、装置及相关产品
CN109543833B (zh) * 2018-11-30 2021-08-03 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111381871B (zh) * 2018-12-28 2022-12-09 上海寒武纪信息科技有限公司 运算方法、装置及相关产品
CN109685201B (zh) * 2018-12-14 2020-10-30 安徽寒武纪信息科技有限公司 运算方法、装置及相关产品
CN111385462A (zh) * 2018-12-28 2020-07-07 上海寒武纪信息科技有限公司 信号处理装置、信号处理方法及相关产品
CN111193917B (zh) * 2018-12-29 2021-08-10 中科寒武纪科技股份有限公司 运算方法、装置及相关产品
CN109635937B (zh) * 2018-12-30 2023-07-11 南京大学 一种面向低位宽卷积神经网络的低功耗系统
WO2020142973A1 (en) * 2019-01-10 2020-07-16 Alibaba Group Holding Limited Matrix-based instruction set architecture for neural network
US11475285B2 (en) * 2019-01-28 2022-10-18 Samsung Electronics Co., Ltd. Neural network accelerator and operating method thereof
CN110049200A (zh) * 2019-03-07 2019-07-23 永德利硅橡胶科技(深圳)有限公司 基于会议的语言翻译方法及相关产品
JP7353772B2 (ja) * 2019-03-07 2023-10-02 キヤノン株式会社 データ処理装置及びその方法、プログラム
CN109902201A (zh) * 2019-03-08 2019-06-18 天津理工大学 一种基于cnn和bp神经网络的推荐方法
CN111723921B (zh) * 2019-03-22 2024-05-14 中科寒武纪科技股份有限公司 人工智能计算装置及相关产品
CN111723920B (zh) * 2019-03-22 2024-05-17 中科寒武纪科技股份有限公司 人工智能计算装置及相关产品
US11704573B2 (en) * 2019-03-25 2023-07-18 Here Global B.V. Method, apparatus, and computer program product for identifying and compensating content contributors
CN111738021B (zh) * 2019-03-25 2023-10-31 株式会社理光 神经机器翻译模型的词向量处理方法、装置及存储介质
CN110009021B (zh) * 2019-03-26 2021-06-15 深兰科技(上海)有限公司 一种目标识别方法及设备
CN109919312B (zh) * 2019-03-29 2021-04-23 北京智芯微电子科技有限公司 卷积神经网络的运算方法、装置及dpu
CN111831337B (zh) * 2019-04-19 2022-11-29 安徽寒武纪信息科技有限公司 数据同步方法及装置以及相关产品
CN111782577B (zh) 2019-04-04 2023-03-24 安徽寒武纪信息科技有限公司 数据处理装置及方法以及相关产品
CN110135462B (zh) * 2019-04-18 2022-12-20 南开大学 一种基于上下文信息的艺术画风格分类方法
US11429787B2 (en) * 2019-05-01 2022-08-30 Microsoft Technology Licensing, Llc Method and system of utilizing unsupervised learning to improve text to content suggestions
EP3963474A4 (en) * 2019-05-01 2022-12-14 Microsoft Technology Licensing, LLC METHOD AND SYSTEM FOR USING UNSUPERVISED LEARNING TO IMPROVE TEXT ON SUGGESTED CONTENT
CN111930681B (zh) * 2019-05-13 2023-10-10 中科寒武纪科技股份有限公司 一种计算装置及相关产品
CN110210612B (zh) * 2019-05-14 2021-04-16 北京中科汇成科技有限公司 基于自适应分段线性逼近曲线的集成电路加速方法及系统
US20200364442A1 (en) * 2019-05-15 2020-11-19 Getac Technology Corporation System for detecting surface pattern of object and artificial neural network-based method for detecting surface pattern of object
CN110198164B (zh) * 2019-05-17 2023-04-04 山东科技大学 一种绝对值流控忆阻器模拟电路
CN111966403A (zh) * 2019-05-20 2020-11-20 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
CN111966400A (zh) * 2019-05-20 2020-11-20 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
CN111966398B (zh) * 2019-05-20 2024-06-07 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
CN110298441B (zh) * 2019-05-24 2022-01-11 深圳云天励飞技术有限公司 一种数据处理方法、电子装置及计算机可读存储介质
CN110277100A (zh) * 2019-06-19 2019-09-24 南京邮电大学 基于Alexnet改进的声纹识别方法、存储介质和终端
CN110390626A (zh) * 2019-07-02 2019-10-29 深兰科技(上海)有限公司 一种卷积神经网络的图像处理方法及装置
KR20210004702A (ko) 2019-07-05 2021-01-13 삼성전자주식회사 Ai 프로세서 및 이의 신경망 연산 수행 방법
CN110427578B (zh) * 2019-07-16 2020-06-02 盐城师范学院 一种基于深度机器学习的数字内容投放方法
CN110532205B (zh) * 2019-07-17 2021-04-06 浙江大华技术股份有限公司 数据传输方法、装置、计算机设备和计算机可读存储介质
CN112308198A (zh) * 2019-07-26 2021-02-02 中科寒武纪科技股份有限公司 循环神经网络的计算方法及相关产品
US11870804B2 (en) * 2019-08-01 2024-01-09 Akamai Technologies, Inc. Automated learning and detection of web bot transactions using deep learning
CN110598858A (zh) * 2019-08-02 2019-12-20 北京航空航天大学 基于非易失性存内计算实现二值神经网络的芯片和方法
CN112333222A (zh) * 2019-08-05 2021-02-05 中润普达(深圳)大数据技术有限公司 一种基于大数据的云计算服务系统
CN110489356B (zh) * 2019-08-06 2022-02-22 上海商汤智能科技有限公司 信息处理方法、装置、电子设备及存储介质
CN110569275A (zh) * 2019-08-14 2019-12-13 清华大学山西清洁能源研究院 支持相似性检索的高纬缺失时间序列的压缩方法及装置
CN112394887A (zh) * 2019-08-17 2021-02-23 森大(深圳)技术有限公司 Onepass打印数据高效率处理方法、装置、设备及存储介质
CN112434781A (zh) * 2019-08-26 2021-03-02 上海寒武纪信息科技有限公司 用于处理数据的方法、装置以及相关产品
CN110780921B (zh) * 2019-08-30 2023-09-26 腾讯科技(深圳)有限公司 数据处理方法和装置、存储介质及电子装置
CN112445523A (zh) * 2019-09-02 2021-03-05 中科寒武纪科技股份有限公司 数据处理方法、相关设备及计算机可读介质
CN110426965A (zh) * 2019-09-17 2019-11-08 苏州百宝箱科技有限公司 一种基于云平台的智能家居远程控制方法
CN110766155A (zh) * 2019-09-27 2020-02-07 东南大学 一种基于混合精度存储的深度神经网络加速器
CN112579042B (zh) * 2019-09-29 2024-04-19 广州希姆半导体科技有限公司 计算装置及方法、芯片、电子设备及计算机可读存储介质
CN110837483B (zh) * 2019-09-30 2021-07-23 厦门星宸科技有限公司 张量维度变换的方法以及装置
CN110673823B (zh) * 2019-09-30 2021-11-30 上海寒武纪信息科技有限公司 乘法器、数据处理方法及芯片
CN114365147A (zh) * 2019-10-22 2022-04-15 深圳鲲云信息科技有限公司 神经网络计算压缩方法、系统及存储介质
CN110796246A (zh) * 2019-10-29 2020-02-14 南京宁麒智能计算芯片研究院有限公司 一种基于线性分段的激活函数的硬件实现电路和方法
WO2021081739A1 (en) * 2019-10-29 2021-05-06 Intel Corporation Device capability aware technology to execute deep learning computation graphs in web applications
US11475311B2 (en) 2019-10-30 2022-10-18 Raytheon Company Neural network instruction streaming
CN110807522B (zh) * 2019-10-31 2022-05-06 合肥工业大学 一种神经网络加速器的通用计算电路
CN112784207B (zh) * 2019-11-01 2024-02-02 中科寒武纪科技股份有限公司 运算方法及相关产品
CN112817638A (zh) * 2019-11-18 2021-05-18 北京希姆计算科技有限公司 一种数据处理装置及方法
US11610102B1 (en) * 2019-11-27 2023-03-21 Amazon Technologies, Inc. Time-based memory allocation for neural network inference
US20210224658A1 (en) * 2019-12-12 2021-07-22 Texas Instruments Incorporated Parametric Power-Of-2 Clipping Activations for Quantization for Convolutional Neural Networks
CN110996171B (zh) * 2019-12-12 2021-11-26 北京金山云网络技术有限公司 视频类任务的训练数据生成方法、装置及服务器
CN111026445A (zh) * 2019-12-17 2020-04-17 湖南长城银河科技有限公司 一种智能识别方法及芯片
CN111178087B (zh) * 2019-12-20 2023-05-09 沈阳雅译网络技术有限公司 一种基于离散型注意力机制的神经机器翻译解码加速方法
CN111125617A (zh) * 2019-12-23 2020-05-08 中科寒武纪科技股份有限公司 数据处理方法、装置、计算机设备和存储介质
US11755683B2 (en) 2019-12-23 2023-09-12 Western Digital Technologies, Inc. Flexible accelerator for sparse tensors (FAST) in machine learning
CN111176725B (zh) * 2019-12-27 2022-05-06 北京市商汤科技开发有限公司 数据处理方法、装置、设备和存储介质
CN111144556B (zh) * 2019-12-31 2023-07-07 中国人民解放军国防科技大学 面向深度神经网络训练和推理的范围批处理归一化算法的硬件电路
CN111242293B (zh) * 2020-01-13 2023-07-18 腾讯科技(深圳)有限公司 一种处理部件、数据处理的方法以及电子设备
CN111240747B (zh) * 2020-01-13 2022-05-06 Oppo广东移动通信有限公司 指令生成方法、装置、测试架构和电子设备
US20210223987A1 (en) * 2020-01-20 2021-07-22 SK Hynix Inc. Controller with smart scheduling and method of operating the controller
CN113222126B (zh) * 2020-01-21 2022-01-28 上海商汤智能科技有限公司 数据处理装置、人工智能芯片
TWI727641B (zh) * 2020-02-03 2021-05-11 華邦電子股份有限公司 記憶體裝置及其操作方法
US20210256384A1 (en) * 2020-02-14 2021-08-19 Northeastern University Computer-implemented methods and systems for achieving real-time dnn execution on mobile devices with pattern-based weight pruning
CN111241204B (zh) * 2020-02-14 2023-01-10 苏州浪潮智能科技有限公司 一种梯度数据的同步方法、装置、设备及存储介质
KR20210105053A (ko) * 2020-02-18 2021-08-26 에스케이하이닉스 주식회사 연산 회로 및 그것을 포함하는 딥 러닝 시스템
US20210256092A1 (en) * 2020-02-19 2021-08-19 Nvidia Corporation Application programming interface to accelerate matrix operations
US11727270B2 (en) 2020-02-24 2023-08-15 Microsoft Technology Licensing, Llc Cross data set knowledge distillation for training machine learning models
EP3872710A1 (en) * 2020-02-27 2021-09-01 Aptiv Technologies Limited Method and system for determining information on an expected trajectory of an object
CN111311707B (zh) * 2020-03-05 2023-05-05 云知声智能科技股份有限公司 一种作画方法及装置
US20210287074A1 (en) * 2020-03-12 2021-09-16 Semiconductor Components Industries, Llc Neural network weight encoding
US11526743B2 (en) * 2020-03-13 2022-12-13 Arm Limited Artificial neural network optical hardware accelerator
US20210295134A1 (en) * 2020-03-18 2021-09-23 Infineon Technologies Ag Artificial neural network activation function
US11797830B2 (en) * 2020-03-25 2023-10-24 Western Digital Technologies, Inc. Flexible accelerator for sparse tensors in convolutional neural networks
WO2021189294A1 (zh) * 2020-03-25 2021-09-30 华为技术有限公司 卷积运算系统和卷积运算方法
CN111488969B (zh) * 2020-04-03 2024-01-19 北京集朗半导体科技有限公司 基于神经网络加速器的执行优化方法及装置
CN111522657B (zh) * 2020-04-14 2022-07-22 北京航空航天大学 一种分散设备协同深度学习推理方法
US11748623B2 (en) * 2020-04-15 2023-09-05 Mipsology SAS Modifying structure of artificial neural networks by collocating parameters
CN111539462B (zh) * 2020-04-15 2023-09-19 苏州万高电脑科技有限公司 模仿生物视觉神经元的图像分类方法、系统、装置及介质
CN111581593B (zh) * 2020-04-21 2023-09-05 天津大学 可配置重用的分段式查找表激活函数实现装置
CN111522776B (zh) * 2020-04-27 2022-04-05 西安交通大学 一种计算架构
CN111565180B (zh) * 2020-04-28 2021-01-29 广州锦行网络科技有限公司 一种虚拟端口的保护系统及方法
CN111563898B (zh) * 2020-04-29 2023-05-16 万翼科技有限公司 图像分割方法、电子设备及相关产品
US11604976B2 (en) * 2020-04-29 2023-03-14 International Business Machines Corporation Crossbar arrays for computations in memory-augmented neural networks
US11527089B2 (en) * 2020-04-29 2022-12-13 Conduent Business Services, Llc Building light-weight single shot refinement neural network for vehicle passenger detection system
CN111553466B (zh) * 2020-04-30 2024-03-22 上海商汤智能科技有限公司 信息处理方法、装置及设备
US11455143B2 (en) * 2020-05-07 2022-09-27 Meta Platforms, Inc. Using a low-bit-width dot product engine to sum high-bit-width numbers
CN113626080B (zh) * 2020-05-08 2023-10-03 安徽寒武纪信息科技有限公司 数据处理装置以及相关产品
CN111525921B (zh) * 2020-05-15 2023-09-08 矽力杰半导体技术(杭州)有限公司 用于神经网络中信号转换的系统和方法
CN111598227B (zh) * 2020-05-20 2023-11-03 字节跳动有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN111914612B (zh) * 2020-05-21 2024-03-01 淮阴工学院 一种基于改进的卷积神经网络的施工图图元自适应识别方法
JP7488696B2 (ja) * 2020-06-04 2024-05-22 株式会社東海理化電機製作所 処理装置、プログラム、およびシステム
US11782685B2 (en) * 2020-06-17 2023-10-10 Bank Of America Corporation Software code vectorization converter
CN111832718B (zh) * 2020-06-24 2021-08-03 上海西井信息科技有限公司 芯片架构
US11435941B1 (en) * 2020-06-24 2022-09-06 Amazon Technologies, Inc. Matrix transpose hardware acceleration
CN113867792A (zh) * 2020-06-30 2021-12-31 上海寒武纪信息科技有限公司 计算装置、集成电路芯片、板卡、电子设备和计算方法
CN111913744A (zh) * 2020-07-15 2020-11-10 博流智能科技(南京)有限公司 Ai深度学习数据处理方法及系统
KR20220009126A (ko) * 2020-07-15 2022-01-24 삼성전자주식회사 뉴럴 네트워크 연산 처리 장치 및 방법
CN111831582B (zh) * 2020-07-16 2024-03-29 中国科学院计算技术研究所 用于智能处理器的内存管理装置、方法及电子设备
CN111857833A (zh) * 2020-07-16 2020-10-30 中国科学院计算技术研究所 并行计算智能处理器及并行计算智能处理方法
CN111857834A (zh) * 2020-07-16 2020-10-30 中国科学院计算技术研究所 分形计算智能处理器、分形计算智能处理方法
CN111984189B (zh) * 2020-07-22 2022-05-17 深圳云天励飞技术股份有限公司 神经网络计算装置和数据读取、数据存储方法及相关设备
CN111860818B (zh) * 2020-07-23 2022-11-08 哈尔滨工业大学(威海) 基于智能芯片的som神经网络算法处理方法
US11163571B1 (en) * 2020-07-29 2021-11-02 International Business Machines Corporation Fusion to enhance early address generation of load instructions in a microprocessor
CN114070563B (zh) * 2020-07-31 2023-09-05 中移(苏州)软件技术有限公司 一种数据处理方法、装置、终端及存储介质
CN112102816A (zh) * 2020-08-17 2020-12-18 北京百度网讯科技有限公司 语音识别方法、装置、系统、电子设备和存储介质
JP2022034897A (ja) * 2020-08-19 2022-03-04 富士通株式会社 情報処理装置、機械学習方法及び機械学習プログラム
TWI746126B (zh) * 2020-08-25 2021-11-11 創鑫智慧股份有限公司 矩陣乘法裝置及其操作方法
CN112052149B (zh) * 2020-09-06 2022-02-22 厦门理工学院 一种大数据信息采集系统及使用方法
KR102466257B1 (ko) * 2020-09-10 2022-11-14 주식회사 더웨이브톡 다중 광원을 활용한 분광 장치
CN112181492A (zh) * 2020-09-23 2021-01-05 北京奕斯伟计算技术有限公司 一种指令处理方法、指令处理装置和芯片
US20220092408A1 (en) * 2020-09-23 2022-03-24 Facebook, Inc. Neural network weight distribution using a tree direct-memory access (dma) bus
CN111931937B (zh) * 2020-09-30 2021-01-01 深圳云天励飞技术股份有限公司 图像处理模型的梯度更新方法、装置及系统
CN112991358A (zh) * 2020-09-30 2021-06-18 北京字节跳动网络技术有限公司 风格图像生成方法、模型训练方法、装置、设备和介质
US11620818B2 (en) * 2020-10-01 2023-04-04 Intel Corporation Spatially sparse neural network accelerator for multi-dimension visual analytics
TWI748679B (zh) * 2020-10-08 2021-12-01 大陸商星宸科技股份有限公司 神經網路計算裝置、資料處理方法及裝置
CN112256801B (zh) * 2020-10-10 2024-04-09 深圳力维智联技术有限公司 抽取实体关系图中关键实体的方法、系统和存储介质
CN112232486A (zh) * 2020-10-19 2021-01-15 南京宁麒智能计算芯片研究院有限公司 一种yolo脉冲神经网络的优化方法
CN112287222B (zh) * 2020-10-29 2023-12-15 深圳大学 一种基于异质特征深度残差网络的内容推荐方法
CN112540996B (zh) * 2020-11-12 2023-11-24 Oppo(重庆)智能科技有限公司 一种业务数据的校验方法、装置、电子设备及存储介质
US20220147680A1 (en) * 2020-11-12 2022-05-12 Samsung Electronics Co., Ltd. Method for co-design of hardware and neural network architectures using coarse-to-fine search, two-phased block distillation and neural hardware predictor
CN114519167A (zh) * 2020-11-19 2022-05-20 华为技术有限公司 一种算子计算方法、装置、设备及系统
KR20220073306A (ko) * 2020-11-26 2022-06-03 에스케이하이닉스 주식회사 스토리지 장치 및 그 동작 방법
CN112306500B (zh) * 2020-11-30 2022-06-07 上海交通大学 一种针对粗粒度可重构结构的降低多类访存冲突编译方法
CN112580485A (zh) * 2020-12-14 2021-03-30 珠海零边界集成电路有限公司 图像的读写方法和装置、电子设备和存储介质
CN112666860A (zh) * 2020-12-15 2021-04-16 合肥中感微电子有限公司 数字信号的扩展处理系统、其处理方法和处理器
CN112631955B (zh) * 2020-12-18 2024-01-19 北京地平线机器人技术研发有限公司 数据处理方法、装置、电子设备以及介质
CN112488908B (zh) * 2020-12-18 2021-08-27 时擎智能科技(上海)有限公司 一种计算装置、计算方法、存储介质及终端
US12001385B2 (en) * 2020-12-24 2024-06-04 Intel Corporation Apparatuses, methods, and systems for instructions for loading a tile of a matrix operations accelerator
CN112633505B (zh) * 2020-12-24 2022-05-27 苏州浪潮智能科技有限公司 一种基于risc-v的人工智能推理方法和系统
CN112528224B (zh) * 2020-12-28 2022-09-13 上海微波技术研究所(中国电子科技集团公司第五十研究所) 一种矩阵特征值分解分组循环迭代流水实现方法及系统
CN116710930A (zh) * 2020-12-31 2023-09-05 北京希姆计算科技有限公司 执行程序的编译方法、芯片、电子设备及计算机可读存储介质
CN112766477B (zh) * 2021-01-13 2023-05-30 天津智模科技有限公司 神经网络运算电路
CN112905591B (zh) * 2021-02-04 2022-08-26 成都信息工程大学 一种基于机器学习的数据表连接顺序选择方法
CN114944155B (zh) * 2021-02-14 2024-06-04 成都启英泰伦科技有限公司 一种终端硬件和算法软件处理相结合的离线语音识别方法
CN112967188B (zh) * 2021-03-04 2024-04-02 中国科学技术大学 结合结构化语义码流的空间自适应图像超分辨重建方法
CN112835842B (zh) * 2021-03-05 2024-04-30 深圳市汇顶科技股份有限公司 端序处理方法、电路、芯片以及电子终端
US20220300816A1 (en) * 2021-03-19 2022-09-22 Rebellions Inc. Neural processing device and method for pruning thereof
CN113138804B (zh) * 2021-04-20 2022-10-04 清华大学 在传输过程中提取流数据特征的流处理器及其实现方法
CN113284512B (zh) * 2021-05-25 2022-05-27 重庆大学 一种基于深度稀疏迁移学习的帕金森语音分类方法
CN113256497B (zh) * 2021-06-21 2021-09-24 中南大学 图像重建方法及系统
CN113254648B (zh) * 2021-06-22 2021-10-22 暨南大学 一种基于多层次图池化的文本情感分析方法
CN115600659A (zh) * 2021-07-08 2023-01-13 北京嘉楠捷思信息技术有限公司(Cn) 一种神经网络运算的硬件加速装置和加速方法
CN113407351A (zh) * 2021-07-20 2021-09-17 北京百度网讯科技有限公司 执行运算的方法、装置、芯片、设备、介质和程序产品
CN113485951B (zh) * 2021-07-31 2022-02-11 郑州信大捷安信息技术股份有限公司 一种基于fpga的dma读操作实现方法、fpga设备以及通信系统
CN113344768B (zh) * 2021-08-02 2021-10-15 成都统信软件技术有限公司 一种图像矩阵卷积的实现方法、计算设备及储存介质
CN113688352B (zh) * 2021-08-20 2023-08-04 上海思朗科技有限公司 一种数据处理系统、方法及装置
CN113709495B (zh) * 2021-08-24 2023-11-24 天津津航计算技术研究所 一种基于pcie缓冲机制的同步解码方法
CN113704689B (zh) * 2021-08-25 2022-11-11 北京大学 一种基于昇腾ai处理器的矩阵乘算子的处理方法及装置
CN113489619B (zh) * 2021-09-06 2021-11-19 中国人民解放军国防科技大学 一种基于时间序列分析的网络拓扑推断方法及装置
US20230091581A1 (en) * 2021-09-21 2023-03-23 Bank Of America Corporation Personal Data Discovery
CN113869495B (zh) * 2021-09-30 2024-02-06 苏州浪潮智能科技有限公司 神经网络卷积权重layout优化的方法、装置、设备及可读介质
CN113988280B (zh) * 2021-10-26 2023-05-05 电子科技大学 一种基于二值化神经网络的阵列计算加速器架构
CN113918883B (zh) * 2021-11-03 2022-05-27 海光信息技术股份有限公司 数据处理方法、装置以及设备和计算机可读存储介质
CN114116547B (zh) * 2021-11-12 2024-03-26 成都立思方信息技术有限公司 一种可重构的电子对抗设备模拟器架构
CN113791889B (zh) * 2021-11-18 2022-03-11 中国科学院成都文献情报中心 一种基于多级轮询队列控制器部署学习模型的方法
CN114217710B (zh) * 2021-12-20 2023-07-21 平安付科技服务有限公司 弹框控制方法、装置、存储介质及系统
CN114372012B (zh) * 2021-12-21 2024-02-20 中国科学院深圳先进技术研究院 一种通用、可配置的高能效池化计算单行输出系统和方法
CN114340097A (zh) * 2021-12-30 2022-04-12 合肥市芯海电子科技有限公司 一种控制灯带的方法、装置、芯片和电子设备
CN114359683B (zh) * 2021-12-31 2023-10-20 电子科技大学 一种面向文本定位的单内核hog高效异构加速方法
CN114356235A (zh) * 2021-12-31 2022-04-15 Oppo广东移动通信有限公司 一种数据标准化处理方法、装置、电子设备及存储介质
CN114491396A (zh) * 2022-01-20 2022-05-13 重庆邮电大学 一种idma系统发送信号均值计算方法及系统
CN114567596B (zh) * 2022-01-24 2024-04-05 浙江数秦科技有限公司 一种用于区块链的数据快速交换方法
CN114567670B (zh) * 2022-01-25 2024-04-05 浙江数秦科技有限公司 一种区块链网络数据传输方法
CN114168522B (zh) * 2022-02-14 2022-04-29 北京微核芯科技有限公司 一种数据传输方法、装置及传输部件
CN114546914B (zh) * 2022-02-23 2024-04-26 北京奕斯伟计算技术股份有限公司 用于对多个通道信息执行数据处理的处理装置及系统
CN114692060A (zh) * 2022-03-04 2022-07-01 支付宝(杭州)信息技术有限公司 数据处理方法和装置
CN114615207B (zh) * 2022-03-10 2022-11-25 四川三思德科技有限公司 推流前的数据定向化处理方法及装置
CN114595173A (zh) * 2022-03-18 2022-06-07 山东云海国创云计算装备产业创新中心有限公司 一种数据传输方法、系统及计算机可读存储介质
TWI795254B (zh) * 2022-03-30 2023-03-01 天擎積體電路股份有限公司 支持廣播的模組系統、模組單元與廣播方法
CN114969029A (zh) * 2022-04-22 2022-08-30 南京航空航天大学 一种基于泰勒展开的多维插值方案及其维间点取值方法
WO2024004221A1 (ja) * 2022-07-01 2024-01-04 日本電信電話株式会社 演算処理装置、演算処理方法、及び演算処理プログラム
WO2024049568A1 (en) * 2022-08-31 2024-03-07 Microsoft Technology Licensing, Llc Increased computation efficiency with multi-stage 8-bit floating point matrix multiplication with format conversion
CN115412758B (zh) * 2022-09-01 2023-11-14 北京奇艺世纪科技有限公司 一种视频处理方法及相关装置
CN115248701B (zh) * 2022-09-21 2022-12-20 进迭时空(杭州)科技有限公司 一种处理器寄存器堆之间的零拷贝数据传输装置及方法
CN115269205B (zh) * 2022-09-27 2022-12-27 之江实验室 一种面向神经网络计算的内存优化方法和装置
CN115629579B (zh) * 2022-10-13 2023-11-07 南京天洑软件有限公司 一种cstr系统的控制方法及装置
CN115638833B (zh) * 2022-12-23 2023-03-31 保定网城软件股份有限公司 一种监控数据处理方法及系统
CN116188247B (zh) * 2023-02-06 2024-04-12 格兰菲智能科技有限公司 寄存器信息处理方法、装置、计算机设备、存储介质
CN116679988B (zh) * 2023-08-02 2023-10-27 武汉芯必达微电子有限公司 硬件加速单元、硬件加速方法、芯片及存储介质
CN116720554B (zh) * 2023-08-11 2023-11-14 南京师范大学 一种基于fpga技术的多段线性拟合的神经元电路实现方法
CN117202242B (zh) * 2023-11-08 2024-02-06 南京邮电大学 一种基于粒子滤波模型的车联网中节点失效检测方法
CN117313803B (zh) * 2023-11-28 2024-02-02 进迭时空(杭州)科技有限公司 基于risc-v向量处理器架构的滑动窗口2d卷积计算方法
CN117725468B (zh) * 2024-02-06 2024-04-26 四川鸿霖科技有限公司 一种智能医用电保障方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010064728A1 (en) * 2008-12-04 2010-06-10 Canon Kabushiki Kaisha Convolution operation circuit and object recognition apparatus
CN105354006A (zh) * 2015-11-27 2016-02-24 中国科学院计算技术研究所 一种非线性函数的快速运算装置及其方法
CN105468335A (zh) * 2015-11-24 2016-04-06 中国科学院计算技术研究所 流水级运算装置、数据处理方法及片上网络芯片
CN105488565A (zh) * 2015-11-17 2016-04-13 中国科学院计算技术研究所 加速深度神经网络算法的加速芯片的运算装置及方法
CN105869117A (zh) * 2016-03-28 2016-08-17 上海交通大学 一种针对深度学习超分辨率技术的gpu加速方法
CN105892989A (zh) * 2016-03-28 2016-08-24 中国科学院计算技术研究所 一种神经网络加速器及其运算方法
CN105930902A (zh) * 2016-04-18 2016-09-07 中国科学院计算技术研究所 一种神经网络的处理方法、系统
CN107301453A (zh) * 2016-04-15 2017-10-27 北京中科寒武纪科技有限公司 支持离散数据表示的人工神经网络正向运算装置和方法
CN107301454A (zh) * 2016-04-15 2017-10-27 北京中科寒武纪科技有限公司 支持离散数据表示的人工神经网络反向训练装置和方法
CN107305484A (zh) * 2016-04-19 2017-10-31 北京中科寒武纪科技有限公司 一种非线性函数运算装置及方法

Family Cites Families (259)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3382796T2 (de) * 1982-06-11 1996-03-28 Mitsubishi Electric Corp Vorrichtung zur Zwischenbildkodierung.
EP0184791A1 (en) * 1984-12-07 1986-06-18 Nec Corporation Information processing device capable of rapidly processing instructions of different groups
US5047954A (en) * 1986-01-17 1991-09-10 International Business Machines Corporation Graphics vector generator setup technique
JP2785155B2 (ja) * 1990-09-10 1998-08-13 富士通株式会社 ニューロコンピュータの非同期制御方式
JPH04195251A (ja) * 1990-10-03 1992-07-15 Fujitsu Ltd ニューラルネットの学習計算方法
US5283839A (en) * 1990-12-31 1994-02-01 Neurosciences Research Foundation, Inc. Apparatus capable of figure-ground segregation
JP3398673B2 (ja) * 1994-08-31 2003-04-21 エヌイーシーコンピュータテクノ株式会社 ベクトルデータ処理装置
US7085710B1 (en) * 1998-01-07 2006-08-01 Microsoft Corporation Vehicle computer system audio entertainment system
US6477555B1 (en) * 1999-07-07 2002-11-05 Lucent Technologies Inc. Method and apparatus for performing rapid convolution
DE19948373A1 (de) * 1999-10-06 2001-05-17 Infineon Technologies Ag Verfahren zur Kanalentzerrung
EP1160794B1 (en) * 2000-05-31 2008-07-23 STMicroelectronics S.r.l. Circuit structure for programming data in reference cells of a multibit non-volatile memory device
GB2382887B (en) * 2001-10-31 2005-09-28 Alphamosaic Ltd Instruction execution in a processor
CN1142484C (zh) * 2001-11-28 2004-03-17 中国人民解放军国防科学技术大学 微处理器向量处理方法
US6889216B2 (en) * 2002-03-12 2005-05-03 Knowm Tech, Llc Physical neural network design incorporating nanotechnology
US6670895B2 (en) * 2002-05-01 2003-12-30 Analog Devices, Inc. Method and apparatus for swapping the contents of address registers
US7065545B2 (en) * 2002-05-07 2006-06-20 Quintero-De-La-Garza Raul Gera Computer methods of vector operation for reducing computation time
US7475101B2 (en) * 2003-09-29 2009-01-06 International Business Machines Corporation Method and structure for producing high performance linear algebra routines using streaming
US7680208B2 (en) * 2004-02-25 2010-03-16 Nokia Corporation Multiscale wireless communication
US20050268195A1 (en) * 2004-04-29 2005-12-01 Lund Morten W Apparatus and method for improving emulation speed of high-level languages in on-chip emulation systems
JP4586443B2 (ja) * 2004-07-16 2010-11-24 トヨタ自動車株式会社 情報提供装置
HUE049974T2 (hu) * 2005-01-07 2020-11-30 Qualcomm Inc Képeken lévõ objektumok észlelése és követése
US7490230B2 (en) * 2005-02-04 2009-02-10 Mips Technologies, Inc. Fetch director employing barrel-incrementer-based round-robin apparatus for use in multithreading microprocessor
US20070005248A1 (en) * 2005-06-29 2007-01-04 Intel Corporation Data reconstruction in link-based interconnects
US20070156685A1 (en) * 2005-12-28 2007-07-05 Hiroshi Inoue Method for sorting data using SIMD instructions
WO2007143278A2 (en) * 2006-04-12 2007-12-13 Soft Machines, Inc. Apparatus and method for processing an instruction matrix specifying parallel and dependent operations
US7574534B2 (en) * 2006-05-23 2009-08-11 International Business Machines Corporation Method for using device enumeration information to identify an operating system running on a computer system
US20080071851A1 (en) * 2006-09-20 2008-03-20 Ronen Zohar Instruction and logic for performing a dot-product operation
US8340795B2 (en) * 2007-03-26 2012-12-25 Google Inc. Small removable audio player that attaches to a host media player
US20080201234A1 (en) * 2007-02-16 2008-08-21 Microsoft Corporation Live entities internet store service
CN100588172C (zh) * 2007-04-28 2010-02-03 腾讯科技(深圳)有限公司 一种实现网络预订存储的系统和方法
US8644151B2 (en) * 2007-05-22 2014-02-04 Cisco Technology, Inc. Processing packet flows
JP4325708B2 (ja) * 2007-07-05 2009-09-02 ソニー株式会社 データ処理装置、データ処理方法およびデータ処理プログラム、符号化装置、符号化方法および符号化プログラム、ならびに、復号装置、復号方法および復号プログラム
CN101369233A (zh) * 2007-08-14 2009-02-18 国际商业机器公司 程序编译方法和编译器
JP2009200713A (ja) * 2008-02-20 2009-09-03 Sony Corp 画像処理装置、画像処理方法、プログラム
CN101315770B (zh) * 2008-05-27 2012-01-25 北京承芯卓越科技有限公司 语音识别片上系统及采用其的语音识别方法
CN101295405A (zh) * 2008-06-13 2008-10-29 西北工业大学 人像与车辆识别报警跟踪方法
KR101680044B1 (ko) * 2008-08-19 2016-11-28 디지맥 코포레이션 콘텐트 처리를 위한 방법들 및 시스템들
CN101685388B (zh) * 2008-09-28 2013-08-07 北京大学深圳研究生院 执行比较运算的方法和装置
CN101782893B (zh) * 2009-01-21 2014-12-24 上海芯豪微电子有限公司 可重构数据处理平台
CN101556565B (zh) * 2009-01-22 2010-09-29 杭州中天微系统有限公司 嵌入式处理器的片上高性能dma
CN101819570B (zh) * 2009-02-27 2012-08-15 国际商业机器公司 网络环境中的用户信息处理和资源推荐的方法和系统
US8331168B2 (en) * 2009-04-30 2012-12-11 International Business Machines Corporation Increased capacity heterogeneous storage elements
CN101620524B (zh) * 2009-07-03 2011-08-10 中国人民解放军国防科学技术大学 支持矩阵整体读写操作的矩阵寄存器文件
CN101615113A (zh) * 2009-07-31 2009-12-30 清华大学 一条指令完成一次蝶形运算的微处理器实现方法
US8577950B2 (en) 2009-08-17 2013-11-05 International Business Machines Corporation Matrix multiplication operations with data pre-conditioning in a high performance computing architecture
CN101710272B (zh) * 2009-10-28 2012-09-05 龙芯中科技术有限公司 指令调度装置和方法
US8996845B2 (en) * 2009-12-22 2015-03-31 Intel Corporation Vector compare-and-exchange operation
US8984043B2 (en) 2009-12-23 2015-03-17 Intel Corporation Multiplying and adding matrices
CN102014475B (zh) * 2010-01-08 2012-01-04 华为技术有限公司 资源映射、码分复用方法及装置
JP5110098B2 (ja) * 2010-02-08 2012-12-26 カシオ計算機株式会社 表示処理装置、及び、プログラム
CN101794239B (zh) * 2010-03-16 2012-11-14 浙江大学 一种基于数据流模型的多处理器任务调度管理方法
CN101833441B (zh) * 2010-04-28 2013-02-13 中国科学院自动化研究所 并行向量处理引擎结构
CN101833468B (zh) * 2010-04-28 2013-05-08 中国科学院自动化研究所 在高性能计算系统中生成向量处理指令集结构的方法
CN101876892B (zh) * 2010-05-20 2013-07-31 复旦大学 面向通信和多媒体应用的单指令多数据处理器电路结构
JP5408037B2 (ja) * 2010-05-28 2014-02-05 カシオ計算機株式会社 画像処理装置及び方法、並びにプログラム
CN102346894B (zh) * 2010-08-03 2017-03-01 阿里巴巴集团控股有限公司 推荐信息的输出方法、系统及服务器
JP2012073998A (ja) * 2010-08-31 2012-04-12 Casio Comput Co Ltd 画像配信システム、画像表示装置、画像配信サーバー、及びプログラム
GB2483903A (en) * 2010-09-24 2012-03-28 Advanced Risc Mach Ltd Instruction which specifies the type of the next instruction to be executed
CN102005743A (zh) * 2010-11-25 2011-04-06 沈阳工业大学 基于径向基神经网络的自适应继电保护装置
CN102012893B (zh) * 2010-11-25 2012-07-18 中国人民解放军国防科学技术大学 一种可扩展向量运算装置
US8635431B2 (en) * 2010-12-08 2014-01-21 International Business Machines Corporation Vector gather buffer for multiple address vector loads
CN102541814B (zh) * 2010-12-27 2015-10-14 北京国睿中数科技股份有限公司 用于数据通信处理器的矩阵计算装置和方法
CN102098623B (zh) * 2011-01-27 2013-06-12 大唐移动通信设备有限公司 一种mbsfn操作域动态生成方法和mce
US8892788B2 (en) * 2011-02-22 2014-11-18 Red Hat Israel, Ltd. Exposing a DMA engine to guests in a virtual machine system
CN102103479B (zh) * 2011-03-02 2015-06-10 中兴通讯股份有限公司 浮点运算器及浮点运算的处理方法
US20130305020A1 (en) * 2011-04-01 2013-11-14 Robert C. Valentine Vector friendly instruction format and execution thereof
CN102156637A (zh) * 2011-05-04 2011-08-17 中国人民解放军国防科学技术大学 向量交叉多线程处理方法及向量交叉多线程微处理器
US8620853B2 (en) * 2011-07-19 2013-12-31 Smartsignal Corporation Monitoring method using kernel regression modeling with pattern sequences
CN102262525B (zh) * 2011-08-29 2014-11-19 孙瑞玮 基于矢量运算的矢量浮点运算装置及方法
CN102360344B (zh) * 2011-10-10 2014-03-12 西安交通大学 矩阵处理器及其指令集和嵌入式系统
CN102375805B (zh) * 2011-10-31 2014-04-02 中国人民解放军国防科学技术大学 面向向量处理器的基于simd的fft并行计算方法
CN102508643A (zh) * 2011-11-16 2012-06-20 刘大可 一种多核并行数字信号处理器及并行指令集的运行方法
CN102520906A (zh) * 2011-12-13 2012-06-27 中国科学院自动化研究所 支持定浮点可重构的向量长度可配置的向量点积累加网络
WO2013095493A1 (en) * 2011-12-22 2013-06-27 Intel Corporation Instructions to perform groestl hashing
CN103975302B (zh) * 2011-12-22 2017-10-27 英特尔公司 矩阵乘法累加指令
CN104011651B (zh) * 2011-12-22 2017-10-20 英特尔公司 用于执行向量计算指令的方法、装置和系统
CN104081337B (zh) * 2011-12-23 2017-11-07 英特尔公司 用于响应于单个指令来执行横向部分求和的系统、装置和方法
US9619226B2 (en) * 2011-12-23 2017-04-11 Intel Corporation Systems, apparatuses, and methods for performing a horizontal add or subtract in response to a single instruction
US9632980B2 (en) * 2011-12-23 2017-04-25 Intel Corporation Apparatus and method of mask permute instructions
CN104011649B (zh) * 2011-12-23 2018-10-09 英特尔公司 用于在simd/向量执行中传播有条件估算值的装置和方法
US9557998B2 (en) * 2011-12-28 2017-01-31 Intel Corporation Systems, apparatuses, and methods for performing delta decoding on packed data elements
KR20130090147A (ko) * 2012-02-03 2013-08-13 안병익 신경망 컴퓨팅 장치 및 시스템과 그 방법
US8706971B1 (en) * 2012-03-14 2014-04-22 Netapp, Inc. Caching and deduplication of data blocks in cache memory
US9575753B2 (en) * 2012-03-15 2017-02-21 International Business Machines Corporation SIMD compare instruction using permute logic for distributed register files
US9715383B2 (en) * 2012-03-15 2017-07-25 International Business Machines Corporation Vector find element equal instruction
CN102629913B (zh) * 2012-04-11 2014-12-24 浙江大学 适用于全局异步局部同步片上互连网络的路由器装置
AU2012381111B2 (en) * 2012-05-31 2015-08-13 Landmark Graphics Corporation Systems and methods for optimal positioning of drilling pads
CN102750127B (zh) * 2012-06-12 2015-06-24 清华大学 一种协处理器
CN102724482B (zh) * 2012-06-18 2015-08-26 西安电子科技大学 基于gps和gis的智能视觉传感网络运动目标接力跟踪系统
US10095516B2 (en) * 2012-06-29 2018-10-09 Intel Corporation Vector multiplication with accumulation in large register space
US9342479B2 (en) * 2012-08-23 2016-05-17 Qualcomm Incorporated Systems and methods of data extraction in a vector processor
CN102880341B (zh) * 2012-08-29 2015-08-05 北京集创北方科技有限公司 触摸屏数据处理系统、方法及专用alu
CN103699360B (zh) * 2012-09-27 2016-09-21 北京中科晶上科技有限公司 一种向量处理器及其进行向量数据存取、交互的方法
CN103064086B (zh) * 2012-11-04 2014-09-17 北京工业大学 一种基于深度信息的车辆跟踪方法
CN103002147A (zh) * 2012-11-29 2013-03-27 广东欧珀移动通信有限公司 一种移动终端自动应答方法和装置
US9405538B2 (en) * 2012-12-28 2016-08-02 Intel Corporation Functional unit having tree structure to support vector sorting algorithm and other algorithms
US9419792B2 (en) * 2012-12-28 2016-08-16 Intel Corporation Instruction for accelerating SNOW 3G wireless security algorithm
US9513906B2 (en) * 2013-01-23 2016-12-06 International Business Machines Corporation Vector checksum instruction
US9804840B2 (en) * 2013-01-23 2017-10-31 International Business Machines Corporation Vector Galois Field Multiply Sum and Accumulate instruction
US9823924B2 (en) 2013-01-23 2017-11-21 International Business Machines Corporation Vector element rotate and insert under mask instruction
US9430164B1 (en) * 2013-02-08 2016-08-30 Emc Corporation Memory efficient sanitization of a deduplicated storage system
US9231898B2 (en) * 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
JP5852601B2 (ja) * 2013-02-26 2016-02-03 日本電信電話株式会社 ネットワーク設計装置およびネットワーク設計プログラム
US9349386B2 (en) * 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US9542933B2 (en) 2013-03-08 2017-01-10 Analog Devices Global Microphone circuit assembly and system with speech recognition
US9250916B2 (en) * 2013-03-12 2016-02-02 International Business Machines Corporation Chaining between exposed vector pipelines
US9094576B1 (en) * 2013-03-12 2015-07-28 Amazon Technologies, Inc. Rendered audiovisual communication
US9417880B2 (en) * 2013-03-15 2016-08-16 Intel Corporation Instruction for performing an overload check
US20140317333A1 (en) * 2013-04-17 2014-10-23 Microchip Technology Incorporated Direct Memory Access Controller with Hybrid Scatter-Gather Functionality
CN104123250B (zh) * 2013-04-25 2019-02-01 上海联影医疗科技有限公司 基于dma的数据传输方法
CN103294648B (zh) * 2013-05-08 2016-06-01 中国人民解放军国防科学技术大学 支持多mac运算部件向量处理器的分块矩阵乘法向量化方法
CN104157285B (zh) * 2013-05-14 2016-01-20 腾讯科技(深圳)有限公司 语音识别方法、装置及电子设备
CN103368701B (zh) * 2013-07-12 2016-06-08 中国科学技术大学 一种基于吉文斯旋转的物理层多播多流数据传输方法
CN104376842A (zh) * 2013-08-12 2015-02-25 清华大学 神经网络语言模型的训练方法、装置以及语音识别方法
US9405728B2 (en) * 2013-09-05 2016-08-02 Altera Corporation Floating-point adder circuitry
US9542626B2 (en) * 2013-09-06 2017-01-10 Toyota Jidosha Kabushiki Kaisha Augmenting layer-based object detection with deep convolutional neural networks
CN104461970B (zh) * 2013-09-18 2019-06-11 中兴通讯股份有限公司 Dma控制器、移动终端以及数据搬运方法
EP2851786A1 (en) * 2013-09-23 2015-03-25 Telefonaktiebolaget L M Ericsson (publ) Instruction class for digital signal processors
CN103530276B (zh) * 2013-09-25 2016-06-22 中国科学技术大学 一种基于龙芯3b的自适应矩阵乘法优化方法
US20160293167A1 (en) * 2013-10-10 2016-10-06 Google Inc. Speaker recognition using neural networks
CN103646007A (zh) 2013-12-18 2014-03-19 北京经纬恒润科技有限公司 数据处理方法、装置及系统
US9934194B2 (en) * 2013-12-20 2018-04-03 Rambus Inc. Memory packet, data structure and hierarchy within a memory appliance for accessing memory
US9507595B2 (en) * 2014-02-28 2016-11-29 International Business Machines Corporation Execution of multi-byte memory access instruction specifying endian mode that overrides current global endian mode
US9740659B2 (en) * 2014-03-19 2017-08-22 International Business Machines Corporation Merging and sorting arrays on an SIMD processor
CN103856727B (zh) * 2014-03-24 2017-01-25 北京工业大学 一种多路实时视频拼接处理系统
CN105446970A (zh) * 2014-06-10 2016-03-30 华为技术有限公司 推荐项目的方法和装置
CN104158753B (zh) * 2014-06-12 2017-10-24 南京工程学院 基于软件定义网络的动态流调度方法及系统
CN104077138B (zh) * 2014-06-27 2017-08-29 中国科学院计算技术研究所 一种集成网络路由器的众核处理器系统及其集成方法和实现方法
US9798519B2 (en) * 2014-07-02 2017-10-24 Via Alliance Semiconductor Co., Ltd. Standard format intermediate result
KR101844932B1 (ko) * 2014-09-16 2018-04-03 한국전자통신연구원 신호처리 알고리즘이 통합된 심층 신경망 기반의 음성인식 장치 및 이의 학습방법
US10061746B2 (en) * 2014-09-26 2018-08-28 Intel Corporation Instruction and logic for a vector format for processing computations
CN104219505A (zh) * 2014-09-29 2014-12-17 济南中维世纪科技有限公司 一种基于PCIe的多路高清模拟音视频采集系统
CN104376326B (zh) * 2014-11-02 2017-06-16 吉林大学 一种用于图像场景识别的特征提取方法
US20160139921A1 (en) * 2014-11-14 2016-05-19 Intel Corporation Vector instruction to compute coordiante of next point in a z-order curve
CN105703978A (zh) * 2014-11-24 2016-06-22 武汉物联远科技有限公司 智能家居控制系统和方法
EP3035204B1 (en) * 2014-12-19 2018-08-15 Intel Corporation Storage device and method for performing convolution operations
US9851970B2 (en) * 2014-12-23 2017-12-26 Intel Corporation Method and apparatus for performing reduction operations on a set of vector elements
CN105787888A (zh) * 2014-12-23 2016-07-20 联芯科技有限公司 人脸图像美化方法
CN104537630A (zh) * 2015-01-22 2015-04-22 厦门美图之家科技有限公司 一种基于年龄估计的图像美颜方法和装置
CN106034145B (zh) * 2015-03-12 2019-08-09 阿里巴巴集团控股有限公司 数据处理的方法和系统
CN106302837B (zh) * 2015-05-12 2019-08-06 青岛海信宽带多媒体技术有限公司 一种光网络单元的mac地址表管理方法及装置
CN104834747B (zh) * 2015-05-25 2018-04-27 中国科学院自动化研究所 基于卷积神经网络的短文本分类方法
CN104850845B (zh) * 2015-05-30 2017-12-26 大连理工大学 一种基于非对称卷积神经网络的交通标志识别方法
CN104915322B (zh) * 2015-06-09 2018-05-01 中国人民解放军国防科学技术大学 一种卷积神经网络硬件加速方法
US11755484B2 (en) * 2015-06-26 2023-09-12 Microsoft Technology Licensing, Llc Instruction block allocation
KR102371188B1 (ko) * 2015-06-30 2022-03-04 삼성전자주식회사 음성 인식 장치 및 방법과 전자 장치
CN105068998B (zh) * 2015-07-29 2017-12-15 百度在线网络技术(北京)有限公司 基于神经网络模型的翻译方法及装置
DE102015009981A1 (de) * 2015-07-31 2017-02-02 Eberhard Karls Universität Tübingen Verfahren und Vorrichtung zur Bildsynthese
US10198872B2 (en) * 2015-08-10 2019-02-05 The Board Of Trustees Of The Leland Stanford Junior University 3D reconstruction and registration of endoscopic data
CN105069304B (zh) * 2015-08-18 2019-04-05 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于机器学习的评估预测asd的装置
CN106484682B (zh) * 2015-08-25 2019-06-25 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN105160340A (zh) * 2015-08-31 2015-12-16 桂林电子科技大学 一种车辆品牌识别系统及方法
EP3350690B1 (en) * 2015-09-19 2022-11-09 Microsoft Technology Licensing, LLC Implicit program order
US10789525B2 (en) * 2015-10-02 2020-09-29 Adobe Inc. Modifying at least one attribute of an image with at least one attribute extracted from another image
US10474627B2 (en) 2015-10-08 2019-11-12 Via Alliance Semiconductor Co., Ltd. Neural network unit with neural memory and array of neural processing units that collectively shift row of data received from neural memory
CN105405443A (zh) * 2015-10-23 2016-03-16 福州瑞芯微电子股份有限公司 基于ape格式的音频信号压缩处理系统及方法
WO2017077121A1 (en) * 2015-11-06 2017-05-11 Thomson Licensing Method for transfer of a style of a reference visual object to another visual object, and corresponding electronic device, computer readable program products and computer readable storage medium
US10691456B2 (en) * 2015-11-13 2020-06-23 International Business Machines Corporation Vector store instruction having instruction-specified byte count to be stored supporting big and little endian processing
CN105468546B (zh) * 2015-11-17 2017-04-12 中国科学院计算技术研究所 互连电路的数据处理装置和方法
CN105512676A (zh) * 2015-11-30 2016-04-20 华南理工大学 一种智能终端上的食物识别方法
CN106844368B (zh) * 2015-12-03 2020-06-16 华为技术有限公司 用于人机对话的方法、神经网络系统和用户设备
CN108511028B (zh) * 2015-12-18 2022-02-08 中国科学院计算技术研究所 利用纠错码自动校正访问存储装置数据的装置及方法
US20170177348A1 (en) * 2015-12-21 2017-06-22 Intel Corporation Instruction and Logic for Compression and Rotation
US10467201B1 (en) * 2015-12-23 2019-11-05 Massachusetts Mutual Life Insurance Company Systems and methods for integration and analysis of data records
US20170193397A1 (en) * 2015-12-30 2017-07-06 Accenture Global Solutions Limited Real time organization pulse gathering and analysis using machine learning and artificial intelligence
US10482380B2 (en) * 2015-12-30 2019-11-19 Amazon Technologies, Inc. Conditional parallel processing in fully-connected neural networks
US20170193361A1 (en) * 2015-12-31 2017-07-06 Microsoft Technology Licensing, Llc Neural network training performance optimization framework
US9760807B2 (en) * 2016-01-08 2017-09-12 Siemens Healthcare Gmbh Deep image-to-image network learning for medical image analysis
CN105721354B (zh) * 2016-01-18 2019-06-14 云南磊奥明科技有限公司 片上网络互联方法及装置
CN111580865B (zh) * 2016-01-20 2024-02-27 中科寒武纪科技股份有限公司 一种向量运算装置及运算方法
CN108595371B (zh) * 2016-01-20 2019-11-19 北京中科寒武纪科技有限公司 用于向量运算的数据读取、写入及读写调度器及保留站
CN106991077A (zh) * 2016-01-20 2017-07-28 南京艾溪信息科技有限公司 一种矩阵计算装置
CN106991477B (zh) * 2016-01-20 2020-08-14 中科寒武纪科技股份有限公司 一种人工神经网络压缩编码装置和方法
CN106991478B (zh) * 2016-01-20 2020-05-08 中科寒武纪科技股份有限公司 用于执行人工神经网络反向训练的装置和方法
CN109993285B (zh) * 2016-01-20 2020-02-07 中科寒武纪科技股份有限公司 用于执行人工神经网络正向运算的装置和方法
CN107506828B (zh) * 2016-01-20 2020-11-03 中科寒武纪科技股份有限公司 用于稀疏连接的人工神经网络计算装置和方法
CN105787557B (zh) * 2016-02-23 2019-04-19 北京工业大学 一种计算机智能识别的深层神经网络结构设计方法
KR101784944B1 (ko) * 2016-02-26 2017-10-12 삼성중공업 주식회사 과전압 억제필터의 구성방법
CN105719327B (zh) * 2016-02-29 2018-09-07 北京中邮云天科技有限公司 一种艺术风格化图像处理方法
CN205582481U (zh) * 2016-03-16 2016-09-14 中航华东光电(上海)有限公司 可加载个性化特征模型的语音识别系统
CN107203775B (zh) * 2016-03-18 2021-07-27 斑马智行网络(香港)有限公司 一种图像分类的方法、装置和设备
CN105844330B (zh) * 2016-03-22 2019-06-28 华为技术有限公司 神经网络处理器的数据处理方法及神经网络处理器
CN105912476A (zh) * 2016-04-06 2016-08-31 中国科学院计算技术研究所 片上重复寻址的方法及装置
CN105912667A (zh) * 2016-04-12 2016-08-31 玉环看知信息科技有限公司 一种信息推荐方法、装置及移动终端
EP3444757B1 (en) * 2016-04-15 2021-07-07 Cambricon Technologies Corporation Limited Discrete data representation supported device and method for forward operation of artificial neural network
CN105869024A (zh) * 2016-04-20 2016-08-17 北京小米移动软件有限公司 商品的推荐方法及装置
CN105956608A (zh) * 2016-04-21 2016-09-21 恩泊泰(天津)科技有限公司 一种基于深度学习的目标定位、分类算法
CN105913039B (zh) * 2016-04-26 2020-08-18 北京光年无限科技有限公司 基于视觉和语音的对话数据交互处理方法及装置
CN106022468B (zh) * 2016-05-17 2018-06-01 成都启英泰伦科技有限公司 人工神经网络处理器集成电路及该集成电路的设计方法
CN106067031B (zh) * 2016-05-26 2019-05-24 北京新长征天高智机科技有限公司 基于人工纠错机制与深度学习网络协作机器视觉识别系统
CN105895082A (zh) * 2016-05-30 2016-08-24 乐视控股(北京)有限公司 声学模型训练方法、语音识别方法及装置
CN106095834A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 基于话题的智能对话方法及系统
CN106066783A (zh) * 2016-06-02 2016-11-02 华为技术有限公司 基于幂次权重量化的神经网络前向运算硬件结构
CN106096542B (zh) * 2016-06-08 2020-02-11 中国科学院上海高等研究院 基于距离预测信息的图像视频场景识别方法
CN106127672B (zh) * 2016-06-21 2019-03-12 南京信息工程大学 基于fpga的图像纹理特征提取算法
CN106126507B (zh) * 2016-06-22 2019-08-09 哈尔滨工业大学深圳研究生院 一种基于字符编码的深度神经翻译方法及系统
CN106227507B (zh) * 2016-07-11 2019-10-18 北京深鉴智能科技有限公司 计算系统及其控制器
CN106228512A (zh) * 2016-07-19 2016-12-14 北京工业大学 基于学习率自适应的卷积神经网络图像超分辨率重建方法
CN106228162B (zh) 2016-07-22 2019-05-17 王威 一种基于深度学习的移动机器人快速物体识别方法
CN106296667A (zh) * 2016-08-01 2017-01-04 乐视控股(北京)有限公司 手形检测方法和系统
CN106250103A (zh) * 2016-08-04 2016-12-21 东南大学 一种卷积神经网络循环卷积计算数据重用的系统
US9864933B1 (en) * 2016-08-23 2018-01-09 Jasmin Cosic Artificially intelligent systems, devices, and methods for learning and/or using visual surrounding for autonomous object operation
CN106408595A (zh) * 2016-08-31 2017-02-15 上海交通大学 一种基于神经网络画风学习的图像渲染方法
EP3507773A1 (en) * 2016-09-02 2019-07-10 Artomatix Ltd. Systems and methods for providing convolutional neural network based image synthesis using stable and controllable parametric models, a multiscale synthesis framework and novel network architectures
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及系统
CN106503055B (zh) * 2016-09-27 2019-06-04 天津大学 一种从结构化文本到图像描述的生成方法
CN106650922B (zh) * 2016-09-29 2019-05-03 清华大学 硬件神经网络转换方法、计算装置、软硬件协作系统
WO2018058509A1 (en) * 2016-09-30 2018-04-05 Intel Corporation Dynamic neural network surgery
CN116823593A (zh) * 2016-10-21 2023-09-29 谷歌有限责任公司 风格化输入图像
CN106447034B (zh) * 2016-10-27 2019-07-30 中国科学院计算技术研究所 一种基于数据压缩的神经网络处理器、设计方法、芯片
CN106548208B (zh) * 2016-10-28 2019-05-28 杭州米绘科技有限公司 一种照片图像快速智能风格化方法
CN106778472A (zh) * 2016-11-17 2017-05-31 成都通甲优博科技有限责任公司 基于深度学习的输电走廊常见侵入物目标检测与识别方法
CN106780367B (zh) * 2016-11-28 2019-11-15 上海大学 基于字典学习的hdr照片风格转移方法
US10916001B2 (en) * 2016-11-28 2021-02-09 Adobe Inc. Facilitating sketch to painting transformations
CN107239824A (zh) * 2016-12-05 2017-10-10 北京深鉴智能科技有限公司 用于实现稀疏卷积神经网络加速器的装置和方法
CN106778928B (zh) * 2016-12-21 2020-08-04 广州华多网络科技有限公司 图像处理方法及装置
CN106815321A (zh) * 2016-12-27 2017-06-09 深圳前海勇艺达机器人有限公司 基于智能聊天机器人的聊天方法及装置
CN106782501B (zh) * 2016-12-28 2020-07-24 百度在线网络技术(北京)有限公司 基于人工智能的语音特征提取方法和装置
CN106604216A (zh) * 2016-12-31 2017-04-26 广州博冠光电技术有限公司 一种双向语音与操作控制数据的传输控制方法及系统
CN106775599B (zh) * 2017-01-09 2019-03-01 南京工业大学 递归神经网络的多计算单元粗粒度可重构系统及方法
CN106898350A (zh) * 2017-01-16 2017-06-27 华南理工大学 一种基于深度学习的智能工业机器人语音交互与控制方法
CN106844627B (zh) * 2017-01-20 2020-06-19 竹间智能科技(上海)有限公司 基于对话系统的在线学习方法及装置
CN106845549B (zh) * 2017-01-22 2020-08-21 珠海习悦信息技术有限公司 一种基于多任务学习的场景与目标识别的方法及装置
CN106709532B (zh) * 2017-01-25 2020-03-10 京东方科技集团股份有限公司 图像处理方法和装置
CN106952235B (zh) * 2017-02-10 2019-07-26 维沃移动通信有限公司 一种图像处理方法和移动终端
US10482639B2 (en) * 2017-02-21 2019-11-19 Adobe Inc. Deep high-resolution style synthesis
CN106951961B (zh) * 2017-02-24 2019-11-26 清华大学 一种粗粒度可重构的卷积神经网络加速器及系统
CN107066239A (zh) * 2017-03-01 2017-08-18 智擎信息系统(上海)有限公司 一种实现卷积神经网络前向计算的硬件结构
CN106850673A (zh) * 2017-03-09 2017-06-13 福建省汽车工业集团云度新能源汽车股份有限公司 基于声纹识别的汽车用户登入方法及装置
CN107038159B (zh) * 2017-03-09 2019-07-12 清华大学 一种基于无监督领域自适应的神经网络机器翻译方法
CN106887225B (zh) * 2017-03-21 2020-04-07 百度在线网络技术(北京)有限公司 基于卷积神经网络的声学特征提取方法、装置和终端设备
CN106920545B (zh) * 2017-03-21 2020-07-28 百度在线网络技术(北京)有限公司 基于人工智能的语音特征提取方法和装置
CN106898353A (zh) * 2017-03-23 2017-06-27 东华理工大学 一种智能家居语音控制系统及其语音识别方法
CN107169503B (zh) * 2017-03-27 2020-05-22 中国科学院深圳先进技术研究院 一种室内场景的分类方法及装置
CN106970896B (zh) * 2017-03-30 2020-05-12 中国人民解放军国防科学技术大学 面向向量处理器的二维矩阵卷积的向量化实现方法
CN106952224B (zh) * 2017-03-30 2019-08-13 电子科技大学 一种基于卷积神经网络的图像风格转移方法
US10152768B2 (en) * 2017-04-14 2018-12-11 Facebook, Inc. Artifact reduction for image style transfer
CN107194938A (zh) * 2017-04-17 2017-09-22 上海大学 基于深度卷积神经网络的图像轮廓检测方法
CN107133222A (zh) * 2017-04-17 2017-09-05 中译语通科技(北京)有限公司 一种基于异质架构的实时语言转换装置及转换方法
CN107092883A (zh) 2017-04-20 2017-08-25 上海极链网络科技有限公司 物体识别追踪方法
CN107193773A (zh) * 2017-04-20 2017-09-22 北京安云世纪科技有限公司 一种数据处理方法、装置及移动终端
CN107124609A (zh) * 2017-04-27 2017-09-01 京东方科技集团股份有限公司 一种视频图像的处理系统、其处理方法及显示装置
CN107067825A (zh) * 2017-04-27 2017-08-18 四川九洲空管科技有限责任公司 一种机载防撞系统的语音告警系统及其语音告警方法
CN107171932B (zh) * 2017-04-27 2021-06-08 腾讯科技(深圳)有限公司 一种图片风格转换方法、装置及系统
JP6889279B2 (ja) * 2017-04-28 2021-06-18 トヨタ モーター ヨーロッパ デジタル画像内の物体を検出するためのシステムおよび方法、ならびに物体検出を再スコアリングするためのシステムおよび方法
CN107247930A (zh) * 2017-05-26 2017-10-13 西安电子科技大学 基于cnn和选择性注意机制的sar图像目标检测方法
CN107291704B (zh) * 2017-05-26 2020-12-11 北京搜狗科技发展有限公司 处理方法和装置、用于处理的装置
US10504267B2 (en) * 2017-06-06 2019-12-10 Adobe Inc. Generating a stylized image or stylized animation by matching semantic features via an appearance guide, a segmentation guide, and/or a temporal guide
CN107301383B (zh) * 2017-06-07 2020-11-24 华南理工大学 一种基于Fast R-CNN的路面交通标志识别方法
CN107221337B (zh) * 2017-06-08 2018-08-31 腾讯科技(深圳)有限公司 数据滤波方法、多人语音通话方法以及相关设备
CN107240185B (zh) * 2017-06-23 2019-09-20 深圳怡化电脑股份有限公司 一种冠字号识别方法、装置、设备及存储介质
US9959272B1 (en) * 2017-07-21 2018-05-01 Memsource a.s. Automatic classification and translation of written segments
US10635858B2 (en) * 2017-09-11 2020-04-28 Nec Corporation Electronic message classification and delivery using a neural network architecture
WO2019071618A1 (zh) * 2017-10-09 2019-04-18 华为技术有限公司 一种图像处理方法及设备
KR102434728B1 (ko) * 2017-10-20 2022-08-19 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 처리방법 및 장치
CN107730474B (zh) * 2017-11-09 2022-02-22 京东方科技集团股份有限公司 图像处理方法、处理装置和处理设备
CN107977704B (zh) * 2017-11-10 2020-07-31 中国科学院计算技术研究所 权重数据存储方法和基于该方法的神经网络处理器
US11501153B2 (en) * 2017-12-28 2022-11-15 Intel Corporation Methods and apparatus for training a neural network
US11113578B1 (en) * 2020-04-13 2021-09-07 Adobe, Inc. Learned model-based image rendering

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010064728A1 (en) * 2008-12-04 2010-06-10 Canon Kabushiki Kaisha Convolution operation circuit and object recognition apparatus
CN105488565A (zh) * 2015-11-17 2016-04-13 中国科学院计算技术研究所 加速深度神经网络算法的加速芯片的运算装置及方法
CN106529668A (zh) * 2015-11-17 2017-03-22 中国科学院计算技术研究所 加速深度神经网络算法的加速芯片的运算装置及方法
CN105468335A (zh) * 2015-11-24 2016-04-06 中国科学院计算技术研究所 流水级运算装置、数据处理方法及片上网络芯片
CN105354006A (zh) * 2015-11-27 2016-02-24 中国科学院计算技术研究所 一种非线性函数的快速运算装置及其方法
CN105869117A (zh) * 2016-03-28 2016-08-17 上海交通大学 一种针对深度学习超分辨率技术的gpu加速方法
CN105892989A (zh) * 2016-03-28 2016-08-24 中国科学院计算技术研究所 一种神经网络加速器及其运算方法
CN107301453A (zh) * 2016-04-15 2017-10-27 北京中科寒武纪科技有限公司 支持离散数据表示的人工神经网络正向运算装置和方法
CN107301454A (zh) * 2016-04-15 2017-10-27 北京中科寒武纪科技有限公司 支持离散数据表示的人工神经网络反向训练装置和方法
CN105930902A (zh) * 2016-04-18 2016-09-07 中国科学院计算技术研究所 一种神经网络的处理方法、系统
CN107305484A (zh) * 2016-04-19 2017-10-31 北京中科寒武纪科技有限公司 一种非线性函数运算装置及方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112346781A (zh) * 2019-08-07 2021-02-09 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
CN110647718B (zh) * 2019-09-26 2023-07-25 中昊芯英(杭州)科技有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN110647718A (zh) * 2019-09-26 2020-01-03 深圳芯英科技有限公司 数据处理方法、装置、设备及计算机可读存储介质
WO2021078210A1 (zh) * 2019-10-25 2021-04-29 安徽寒武纪信息科技有限公司 用于神经网络运算的计算装置、方法、集成电路和设备
CN111027690A (zh) * 2019-11-26 2020-04-17 陈子祺 执行确定性推理的组合处理装置、芯片和方法
CN111027690B (zh) * 2019-11-26 2023-08-04 陈子祺 执行确定性推理的组合处理装置、芯片和方法
CN113128673A (zh) * 2019-12-31 2021-07-16 Oppo广东移动通信有限公司 数据处理方法、存储介质、神经网络处理器及电子设备
CN113128673B (zh) * 2019-12-31 2023-08-11 Oppo广东移动通信有限公司 数据处理方法、存储介质、神经网络处理器及电子设备
US11562235B2 (en) 2020-02-21 2023-01-24 International Business Machines Corporation Activation function computation for neural networks
CN111767508A (zh) * 2020-07-09 2020-10-13 地平线(上海)人工智能技术有限公司 计算机实现张量数据计算的方法、装置、介质和设备
CN111767508B (zh) * 2020-07-09 2024-02-23 地平线(上海)人工智能技术有限公司 计算机实现张量数据计算的方法、装置、介质和设备
CN112200299A (zh) * 2020-09-09 2021-01-08 厦门星宸科技有限公司 神经网络计算装置、数据处理方法及装置
CN112200299B (zh) * 2020-09-09 2024-04-12 星宸科技股份有限公司 神经网络计算装置、数据处理方法及装置
CN112328511B (zh) * 2021-01-04 2021-05-04 统信软件技术有限公司 一种数据处理方法、计算设备及可读存储介质
CN112328511A (zh) * 2021-01-04 2021-02-05 统信软件技术有限公司 一种数据处理方法、计算设备及可读存储介质
CN115640493A (zh) * 2022-10-28 2023-01-24 成都医学院 基于fpga的分段线性分数阶运算ip核

Also Published As

Publication number Publication date
CN109117184A (zh) 2019-01-01
CN110610236A (zh) 2019-12-24
CN109725936B (zh) 2022-08-26
CN108898554A (zh) 2018-11-27
CN107844832A (zh) 2018-03-27
CN110689125A (zh) 2020-01-14
CN109117183A (zh) 2019-01-01
CN109034382A (zh) 2018-12-18
CN109003132B (zh) 2021-12-14
EP3709224A4 (en) 2021-10-06
CN107895191B (zh) 2022-02-22
CN108984211A (zh) 2018-12-11
CN109522254A (zh) 2019-03-26
CN109063830A (zh) 2018-12-21
US20210158484A1 (en) 2021-05-27
CN109997154A (zh) 2019-07-09
CN109086075B (zh) 2021-06-08
CN109542515B (zh) 2021-06-25
US11922132B2 (en) 2024-03-05
CN107832844A (zh) 2018-03-23
CN109523020A (zh) 2019-03-26
CN110689126B (zh) 2023-04-07
CN109062607B (zh) 2021-09-21
CN109003132A (zh) 2018-12-14
CN109086075A (zh) 2018-12-25
CN109725936A (zh) 2019-05-07
CN109117183B (zh) 2021-10-19
CN110689126A (zh) 2020-01-14
CN109117947A (zh) 2019-01-01
CN109063831A (zh) 2018-12-21
CN109726806A (zh) 2019-05-07
US11762631B2 (en) 2023-09-19
CN107832845A (zh) 2018-03-23
US20210157992A1 (en) 2021-05-27
CN109034383A (zh) 2018-12-18
CN109064384A (zh) 2018-12-21
CN108984211B (zh) 2021-01-05
CN109062539A (zh) 2018-12-21
CN108874444A (zh) 2018-11-23
CN111160549A (zh) 2020-05-15
CN109542515A (zh) 2019-03-29
CN111291880A (zh) 2020-06-16
CN108986022A (zh) 2018-12-11
CN109117948A (zh) 2019-01-01
CN109086074B (zh) 2021-01-05
US20210182077A1 (en) 2021-06-17
CN107992486A (zh) 2018-05-04
CN109542514B (zh) 2021-01-05
CN109062606A (zh) 2018-12-21
CN111310910A (zh) 2020-06-19
CN107832843B (zh) 2021-09-21
CN107895191A (zh) 2018-04-10
CN110084361B (zh) 2021-03-23
CN109062607A (zh) 2018-12-21
CN111310910B (zh) 2023-06-30
CN109034383B (zh) 2021-09-21
CN107832843A (zh) 2018-03-23
CN107833176A (zh) 2018-03-23
CN110610236B (zh) 2022-05-31
EP3709224A1 (en) 2020-09-16
CN109522254B (zh) 2022-04-12
CN111291880B (zh) 2024-05-14
US20210192245A1 (en) 2021-06-24
CN109117948B (zh) 2021-10-19
CN107993206A (zh) 2018-05-04
CN109062606B (zh) 2021-09-21
CN108958801A (zh) 2018-12-07
CN108958801B (zh) 2021-06-25
CN111160548B (zh) 2024-01-12
CN108875926A (zh) 2018-11-23
CN109003603A (zh) 2018-12-14
CN108874445A (zh) 2018-11-23
CN111160548A (zh) 2020-05-15
US20210150685A1 (en) 2021-05-20
CN109542514A (zh) 2019-03-29
CN107832804A (zh) 2018-03-23
CN109086074A (zh) 2018-12-25
WO2019085655A1 (zh) 2019-05-09
CN111178521A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN110084361A (zh) 一种运算装置和方法
EP3451157B1 (en) Device and method for performing forward operation of convolutional neural network
US11710041B2 (en) Feature map and weight selection method and accelerating device
CN108229654B (zh) 神经网络卷积运算装置及方法
CN109032669B (zh) 神经网络处理装置及其执行向量最小值指令的方法
CN109284823B (zh) 一种运算装置及相关产品
CN107341547A (zh) 一种用于执行卷积神经网络训练的装置和方法
CN107301453A (zh) 支持离散数据表示的人工神经网络正向运算装置和方法
CN109767000A (zh) 基于Winograd算法的神经网络卷积方法及装置
KR20190107091A (ko) 계산 장치 및 방법
CN111126590B (zh) 一种人工神经网络运算的装置及方法
CN107957976A (zh) 一种计算方法及相关产品
CN109754062A (zh) 卷积扩展指令的执行方法以及相关产品
CN107315718A (zh) 一种用于执行向量内积运算的装置和方法
CN107315717A (zh) 一种用于执行向量四则运算的装置和方法
CN108960415B (zh) 处理装置和处理系统
CN109711540A (zh) 一种计算装置及板卡
CN115480731A (zh) 运算方法、装置、芯片、设备和介质
CN111930674B (zh) 乘累加运算装置及方法、异构智能处理器及电子设备
CN111930670B (zh) 异构智能处理量化装置、量化方法、电子设备及存储介质
WO2022001496A1 (zh) 计算装置、集成电路芯片、板卡、电子设备和计算方法
CN109754061A (zh) 卷积扩展指令的执行方法以及相关产品
CN113746471A (zh) 运算电路、芯片和板卡

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant