CN101236601A - 图像识别加速装置及具有图像识别加速装置的微处理器芯片 - Google Patents

图像识别加速装置及具有图像识别加速装置的微处理器芯片 Download PDF

Info

Publication number
CN101236601A
CN101236601A CNA200810007464XA CN200810007464A CN101236601A CN 101236601 A CN101236601 A CN 101236601A CN A200810007464X A CNA200810007464X A CN A200810007464XA CN 200810007464 A CN200810007464 A CN 200810007464A CN 101236601 A CN101236601 A CN 101236601A
Authority
CN
China
Prior art keywords
data
image recognition
controller
input
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200810007464XA
Other languages
English (en)
Other versions
CN101236601B (zh
Inventor
冯一名
孟路
董亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ma Lei
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN200810007464XA priority Critical patent/CN101236601B/zh
Publication of CN101236601A publication Critical patent/CN101236601A/zh
Application granted granted Critical
Publication of CN101236601B publication Critical patent/CN101236601B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

一种图像识别加速装置,主要由系统总线仲裁器、内部总线、接入控制单元、指令分配器、直接内存访问控制器、系统任务队列、资源统计器、运行任务保留站、配置存储器、多个指令译码器单元、数据存储器、多个处理单元阵列、数据保留站以及格雷编码器构成,具有相对于现有专用图像识别加速芯片性能高,成本低,应用灵活等优点。

Description

图像识别加速装置及具有图像识别加速装置的微处理器芯片
技术领域
本发明涉及图像处理大规模集成电路技术,更具体的说,涉及对图像处理加速装置的技术。
背景技术
随着信息和网络技术的发展,数字内容的内涵日益丰富,从原来单一的文字和图片为主扩展到音频,视频和3D环境等多种承载媒体,涉及教育、科学、金融、文化、娱乐、商业、通信等各个领域。从技术方面来讲,数字内容开发、数字内容传递和数字内容安全是数字内容产业的三大支撑。数字内容开发一方面与文化创意和艺术创造紧密结合,同时也与图像、音频、视频、Web2.0等技术不可分割;随着宽带技术的发展,数字内容传递正在由传统的离线配送向互联网在线传递和移动传递的方向急剧转变,网络门户、搜索引擎、无线宽带、移动交互等技术成为数字内容传递的核心技术;数字内容安全则包括数字版权管理(DRM)、非法及有害内容过滤、网络支付安全等重要内容。
基于内容的过滤即基于内容的过滤,是数字内容安全的重要内容。CBF的主要对象包括非法内容和有害内容,如非法广告、黄色信息、惑众谣言、网络病毒、黑客攻击等。在图像和视频文件过滤方面,文字识别、人脸识别、人体识别、物体识别等图像识别技术是核心。通过这些技术,可对文件中包含的字牌、标语、广告等反映不同场景的文字,以及人脸、人体、物体等反映不同人物和事件的对象进行识别。获得这些关键信息后,便可以对图像和视频进行分类和过滤。例如对黄色图片进行过滤,对毒品广告进行过滤等。在上述图像识别技术中,人脸识别和物体识别是当前的研究热点。文字识别是开展较早的研究,但图像中的文字识别有其特殊性,如倾斜和光线的影响等。关于人脸识别和物体识别,近年来人们给予了极大的关注,并取得了显著的进展。
在网络环境中,过滤器的效率是一个突出问题。基于智能技术的过滤器通常具有较高的计算复杂度,时间开销较大。目前的芯片技术中,已经有了针对图像处理的加速模块,但是基本上都是为了满足于媒体压缩或者是3D效果而特别设置的,如MPEG/H.264的搜索加速,DCT/IDCT等。也有一些针对哈夫变换等常用图像识别算法的硬件实现,如A.K.Majumdar Design of an ASIC for straight line detection in an image[C].In:Proceedings of the Thirteenth International Conference on VLSIDesign,2000:128~133以及S.Tagzout,K.Achour,O.Djkoune Houghtransform algorithm for FPGA implementation[M].Signal ProcessingSystem,2000-10:384~393。这些实现中,主要做的是采用专用硬件去实现某些特定的算法单元,如采用CORDIC电路去实现快速的曲线变换计算和专用累加电路等。由于图像识别算法针对不同的应用,参数的区别和步骤往往相差很大,因此,针对特定算法的加速电路的有效作用领域往往很窄;此外,图像识别算法是不断更新和改进的,针对某一特定算法实现的加速电路,很快随着时间的推移就暴露出了局限性。
发明内容
考虑到以上问题而提出了本发明。本发明的目的是提供一种应用于微处理器电路的图像识别加速装置。本发明的一个有利方面在于,基于可配置的多个并行PE阵列,所述图像识别加速装置能够提供高达153.6Gops的峰值计算能力。本发明的另一个有利方面在于,采用基于交换的数据路由方式,使得各个PE之间的数据通路可以灵活配置,适应不同的匹配算法的需求。
根据本发明的一个方面,提供了一种图像识别加速装置,包括:系统总线仲裁器,将外部数据请求发送至所述图像识别加速装置内部的直接内存访问控制器,同时将外部任务控制请求发送至系统任务队列,该系统总线仲裁器连接至外部系统总线;内部总线,其为按内存映射的地址和数据总线;接入控制单元,将系统任务队列、资源统计器、运行任务保留站的内部数据按照地址映射规则组织,使所述内部数据能够被所述内部总线上的读写请求所访问;指令分配器,将计算任务动态分配给多个处理单元阵列;所述直接内存访问控制器,连接于所述内部总线与所述系统总线仲裁器之间,将数据按预先设定好的地址读入或读出;所述系统任务队列,由一先入先出队列构成,该队列的输入数据为经由所述系统总线仲裁器输入的外部控制请求,该队列的输出端连接至所述指令分配器和所述接入控制单元;所述资源统计器,连接到所述接入控制单元与所述指令分配器,提供所述图像识别加速装置内部资源消耗情况的实时信息给微处理器以及所述指令分配器;所述运行任务保留站,连接于所述接入控制单元与所述指令分配器之间,用于保存当前正在执行的任务的情况和各个任务占用的资源数据;配置存储器,连接到所述内部总线,存储所述多个处理单元阵列内部配置和控制指令字;多个指令译码器单元,连接于所述指令分配器与所述配置存储器之间,将所述指令分配器分配给所述多个处理单元阵列或者格雷编码器的控制指令译码成与它们相应的控制字;数据存储器,连接于所述内部总线与多个处理单元阵列之间,为多个双端口随机存储器,所述随机存储器的个数与所述多个处理单元阵列个数相等;所述多个处理单元阵列,均连接于所述配置存储器与所述数据存储器之间,完成图像识别计算任务,各个阵列之间为串行连接;数据保留站,连接于所述内部总线,将所述直接内存访问控制器输入的多个周期的第一位宽的数据拼接成第二位宽的数据输出,其中所述第一位宽小于第二位宽;以及,格雷编码器,连接于数据保留站与所述处理单元阵列之间,将原始图像数据转换成格雷码编码的图像数据。
根据本发明的另一个方面,提供一种具有上述图像识别加速装置的微处理器芯片,该微处理器芯片还具有:微处理器内核、系统总线、内存控制器、直接内存访问控制器、中断控制器、网络控制器、视频控制器、低速外设桥接器,以及连接于低速外设桥接器的通用IO、I2C总线控制器、UART控制器以及SPI控制器;其中所述的微处理器内核、图像识别加速装置、内存控制器、直接内存访问控制器、中断控制器、网络控制器、视频控制器以及低速外设桥接器均连接至系统总线,其连接方式为地址映射。
附图说明
相信通过以下结合附图对本发明具体实施方式的说明,能够使人们更好地了解本发明的上述和其它特点、优点和目的。
图1是根据本发明的第一实施例的所在系统框图;
图2是根据本发明的第一实施例的逻辑结构示意图;
图3是根据本发明的第一实施例的数据保留站的内部逻辑结构示意图;
图4是根据本发明的第一实施例的PE阵列的内部逻辑结构示意图;
图5是根据本发明的第一实施例的PE单元的内部逻辑结构示意图。
具体实施方式
下面就结合附图对本发明的各个实施例进行详细的说明:
图1是根据本发明的一个实施例的微处理器系统方框图。图中详细描述了采用本发明的一个嵌入式处理器的芯片内部系统框图。该处理器由微处理器内核(101)、图像识别加速装置(102)、系统总线(103)、内存控制器(104)、直接内存访问控制器(105)、中断控制器(106)、网络控制器(107)、视频控制器(108)、用于连接低速外设的低速外设桥接器(109),以及挂载在低速外设桥接器上的通用IO(113)、I2C总线控制器(112)、UART控制器(111)和SPI控制器(110)等构成。其中所述的微处理器内核可以为商用的IP核如ARM9或者ARM11。为了满足性能需求,所述微处理器内核一般带有一级数据缓存和指令缓存(或者是统一的一级缓存)。通常情况下,所述微处理器内核为一精简指令集(RISC)处理器内核,数据位宽为32位。所述系统总线用于连接各个高速模块和微处理器模块。系统总线上可以有多个主设备,例如微处理器和直接内存访问控制器。所有的高速设备都是按地址映射在系统总线上。内存控制器是处理器和外部存储设备数据交换的接口。所述外部存储设备通常为DDR或者DDR2内存。内存控制器根据接收到的地址和读写指令,从外部存储设备中读出或者向外部存储设备中写入数据。数据通常以突发方式进行读写。所述的直接内存访问控制器用来在微处理器不干预的情况下进行数据搬移操作。所述的中断控制器负责记录外部中断的触发信息,并对不同的优先级中断进行排序。所述的网络控制器为千兆以太网的媒体接入控制器(MAC);所述的视频控制器为LCD显示屏驱动器。所述低速外设桥接器是挂在系统总线上,连接高速总线和低速总线的桥接设备。通用IO是通过寄存器编程,控制相应的IO管脚成为输入/输出接口的IO管脚。I2C总线控制器是用来连接外部I2C设备的总线控制器;UART控制器通过外接的RS232转换芯片,可以直接和PC机的串口设备进行通讯,用于低速数据传输和程序调试;SPI接口用于连接外部SPI的FLASH设备或者其他SPI设备。图像识别加速装置挂在系统总线上,作为从设备,可以被微处理器寻址访问;作为主设备,可以启动直接内存访问主动和外界进行数据交换。
图2是本发明第一实施例中图像识别加速装置的内部结构图。所述的图像识别加速装置,主要由系统总线仲裁器(212)、直接内存访问控制器(209)、内部总线(211)、数据保留站(201)、格雷编码器(202)、数据存储器(208)、配置存储器(207)、多个指令译码器(214,215,216,217)、接入控制单元(203)、系统任务队列(210)、资源统计器(213)、运行任务保留站(219)以及多个处理单元阵列(即PE阵列)(204,205,206)构成。系统总线仲裁器是整个加速单元与外部系统总线的接口模块,负责将外部的读写请求发送至内部对应的端口,其中数据请求发送至直接内存访问控制器,任务控制请求发送至系统任务队列(210)。直接内存访问控制器(209)作为整个图像识别加速装置同外部系统总线的数据接口,负责所有的数据搬移操作。直接内存访问在收获微处理器控制指令后,将外部数据按预先设定好的地址读入或者将内部数据按预先设定好的地址读出。这里所有的数据必须按照4字节的边界(32位)对齐,也就是说,作为图像处理单元,每次读写操作并行执行4个像素的数据,其中每个像素的数据位数为8位。内部总线是按内存映射的地址和数据总线,这里只有直接内存访问控制器作为主设备,负责地址和读写信号的产生,其余模块作为从设备响应直接内存访问控制器的读写操作。接入控制单元(203)将系统任务队列、资源统计器、运行任务保留站的内部数据按照地址映射规则组织,使其能够被内部总线上的读写请求所访问。数据保留站用来将输入的图像数据拼接成一个周期的256位数据,由于直接内存访问操作只能在微处理器不占用系统总线的时候进行,因此不能保证每8个周期都能取到256位的图像数据,数据保留站用来将所述的直接内存访问控制器输入的多个周期的32位数据拼接成256位的数据输出。所述的格雷编码器用来将并行输入的256位原始图像数据(RGB或者YUV格式)转换成格雷码编码的数据。所述配置存储器存储的是PE阵列的内部详细配置和控制指令字。所述的配置和控制指令字,是根据所需要执行的算法和步骤,预先设定好的存储在外部存储器的作为程序数据段数据的一些二进制代码。所述系统任务队列由一个16入口的先入先出队列(FIFO)构成,该FIFO的输入数据为经由系统总线仲裁器输入的外部控制请求,输出端连接至指令分配器(218)和接入控制单元。资源统计器(213)连接在接入控制单元和指令分配器上,一方面,提供图像识别加速装置内部资源消耗情况的实时信息给微处理器,另一方面,提供图像识别加速装置内部资源消耗情况的实时信息给指令分配器,作为调度控制的依据信息。运行任务保留站(219)保存当前正在执行的任务的情况和各个任务占用的资源数据,这里的资源统计器和运行任务保留站都可以由ASIC标准单元库中的寄存器文件来实现,其中资源统计器可以是3入口、256位的寄存器文件,运行任务保留站可以是3入口、64位的寄存器文件。指令分配器(218)负责把计算任务分配给多个PE阵列。分配过程中会依据系统任务队列中任务的多少,资源统计器中内部资源消耗的情况和当前运行任务保留站中当前运行任务的情况动态的调度并分配计算任务给多个PE阵列。多个指令译码器单元负责将指令分配器分配给多个PE阵列或者格雷编码器的控制指令译码成PE阵列或者格雷编码器所需要的详细控制字,例如,将二进制编码译码成独热码(one-hot)。所述PE阵列(204,205,206)为16×16的计算单元(PE)构成的并行处理阵列,是图像识别计算的核心引擎,完成图像识别计算任务,如滤波,FFT等。一个所述图像识别加速装置中,可以有多个PE阵列,如在本实施例中,就实现了3个PE阵列的配置,各个PE阵列之间有专用的链接来进行数据传递。同时,所有的PE阵列均外挂在所述图像识别加速装置的内部总线上,按地址映射。数据存储器(208)是3个256B大小的双端口随机存储器。用来存储PE阵列的计算结果和临时数据存取。数据存储器可以工作在缓冲模式,第一个PE阵列计算完成的结果存储在第一个双端口存储器中,同时,这些数据作为第二个PE阵列的输入数据,依次类推。数据存储器也可以工作在终端模式,这时PE阵列的最终计算结果保存在数据存储器中,等待CPU通过直接内存访问控制器发起的读取。
图3是数据保留站模块的内部逻辑结构图。输入数据data为32位位宽。触发器301,302,303,304,305,306,307,308的位宽均为32位,其数据输入端D均连接在data输入线上。所述的触发器301,302,303,304,305,306,307,308,314,309的时钟输入均为clk,复位输入均为rst。加法器313的输入端一端为常数1,另一端连接至触发器314的输出。触发器314位宽为3位,其数据输入端D连接在加法器313的输出端。触发器314的使能端连接在输入信号we上。解码器312的输入端为触发器314的输出端,解码器312的输出端为8位的选择信号,分别连接至触发器301,302,303,304,305,306,307,308的使能端。比较器311的一端输入为常数0,另一端连接在触发器314的数据输出端Q。二输入与门310的输入端一端连接在输入信号we上,另一端连接至比较器311的输出端。触发器309的数据输入端D连接至与门310的输出端。其使能段始终为高电平。触发器309的数据输出端Q连接至输出信号we_out。触发器301,302,303,304,305,306,307,308的数据输出端Q合并为256位的数据输出信号dout。
图4是所述处理单元(PE)阵列的逻辑结构图。每个PE阵列由256个PE构成,排列成16×16的矩阵结构。每个PE具有6个连接端口,分别是上,下,左,右,前,后。其中上下左右四个连接端口为双向,前后端口为单向,具体的说,前向连接是输入端口,用于接收前一个PE阵列输出的数据。后向连接是输出端口,用于向后方的PE输出数据。同时,每个PE还具有一个和配置存储器连接的控制端口,用于接收配置存储器提供的配置指令。以下详细描述PE阵列的数据流向和操作过程:在第一个数据周期中,第一个PE阵列的第一列或者第一行在配置存储器的控制下,接受格雷编码器的数据输入,并进行相应的计算,在第二个数据周期到来时,第一个PE阵列的第一列或者第一行继续接收格雷编码器的数据输入,同时第一个PE阵列的第一列或者第一行在配置存储器的控制下,将上一周期的计算结果或者是原始数据传输至第二列或者第二行或者是第二个PE阵列的第一列或者第一行。第三个数据周期中,第一个PE阵列的第一列或者第一行继续接收格雷编码器的数据输入,同时第一个PE阵列的第一列或者第一行在配置存储器的控制下,将上一周期的计算结果或者是原始数据传输至第二列或者第二行或者是第二个PE阵列的第一列或者第一行。与此同时,第一个PE阵列的第二列或者第二行继续接收第一列或者第一行的输入,同时第一个PE阵列的第二列或者第二行在配置存储器的控制下,将上一周期的计算结果或者是原始数据传输至第三列或者第三行或者是第二个PE阵列的第二列或者第二行。依次类推,当16个数据周期结束后,第一个PE阵列的第16列或者16行将数据写入数据缓冲存储器。
图5是所述PE单元的内部逻辑结构图。每个PE由多端口交换网络(501)、计算单元(502)以及寄存器文件(503)构成。其中所述的多端口交换网络(501)具有多个双向输入输出端口,在本实施例中,多端口交换网络负责路由上,下,左,右以及前后PE阵列相同位置的数据。出于成本和复杂度的考虑,交换网络只采取最简单的交换策略,即作用相当于双刀多掷的开关,将外部某个数据通路和内部节点相关联,或者是旁路内部节点。所述的计算单元(502)的第一输入端连接在交换网络的一个输出端,第二输入端为寄存器文件的输出端。而计算单元的输出端连接至寄存器文件的输入端。所述的计算单元的作用和构成均相似普通8位MCU的计算单元,只是功能更简单化,可以实现加、减、比较和位操作,这里不再繁述。计算单元的输出送至寄存器文件进行缓存,而寄存器文件的输出送至计算单元,可以完成累加等操作。
通过以上的说明可知,本实施例的图像识别加速装置具有以下优点:
基于全静态逻辑电路设计,容易采用标准化ASIC流程生产制造;
PE结构简单但是功能强大,多个PE单元可以并发的执行不同的计算任务。在200MHz的时钟主频下,3个PE阵列可以提供153.6Gops的峰值计算能力,在采用0.13um的标准单元库实现时,芯片面积不到1平方毫米,成本低;
采用基于交换的数据路由方式,使得各个PE之间的数据通路可以灵活配置,适应不同的匹配算法的需求;
基于直接内存访问的数据搬移,无需微处理器干预。最大程度发挥加速功能。
以上虽然通过一些示例性的实施例详细地描述了本发明的图像识别加速装置、应用所述的图像识别加速装置的系统以及图像识别应用在所述的加速装置上的运行方法。但是以上这些实施例并不是穷举的,本领域技术人员可以在本发明的精神和范围内实现各种变化和修改。因此,本发明并不限于这些实施例,本发明的范围仅由所附权利要求为准。

Claims (7)

1.一种图像识别加速装置,其特征在于,包括:
系统总线仲裁器,将外部数据请求发送至所述图像识别加速装置内部的直接内存访问控制器,同时将外部任务控制请求发送至系统任务队列,该系统总线仲裁器连接至外部系统总线;
内部总线,其为按内存映射的地址和数据总线;
接入控制单元,将系统任务队列、资源统计器、运行任务保留站的内部数据按照地址映射规则组织,使所述内部数据能够被所述内部总线上的读写请求所访问;
指令分配器,将计算任务动态分配给多个处理单元阵列;
所述直接内存访问控制器,连接于所述内部总线与所述系统总线仲裁器之间,将数据按预先设定好的地址读入或读出;
所述系统任务队列,由一先入先出队列构成,该队列的输入数据为经由所述系统总线仲裁器输入的外部控制请求,该队列的输出端连接至所述指令分配器和所述接入控制单元;
所述资源统计器,连接到所述接入控制单元与所述指令分配器,提供所述图像识别加速装置内部资源消耗情况的实时信息给微处理器以及所述指令分配器;
所述运行任务保留站,连接于所述接入控制单元与所述指令分配器之间,用于保存当前正在执行的任务的情况和各个任务占用的资源数据;
配置存储器,连接到所述内部总线,存储所述多个处理单元阵列内部配置和控制指令字;
多个指令译码器单元,连接于所述指令分配器与所述配置存储器之间,将所述指令分配器分配给所述多个处理单元阵列或者格雷码编码器的控制指令译码成与它们相应的控制字;
数据存储器,连接于所述内部总线与多个处理单元阵列之间,为多个双端口随机存储器,所述随机存储器的个数与所述多个处理单元阵列个数相等;
所述多个处理单元阵列,均连接于所述配置存储器与所述数据存储器之间,完成图像识别计算任务,各个阵列之间为串行连接;
数据保留站,连接于所述内部总线,将所述直接内存访问控制器输入的多个周期的第一位宽的数据拼接成第二位宽的数据输出,其中所述第一位宽小于第二位宽;
以及,
格雷编码器,连接于数据保留站与所述处理单元阵列之间,将原始图像数据转换成格雷码编码的图像数据。
2.根据权利要求1所述的图像识别加速装置,其特征在于,所述处理单元阵列由256个处理单元构成16×16的矩阵,所述处理单元与其相邻的处理单元之间构成双向数据链接,不同的处理单元阵列中相同行列位置的处理单元之间构成单向数据连接,其中所述处理单元的数据位宽为8。
3.根据权利要求1所述的图像识别加速装置,其特征在于,所述第一位宽为32位宽,第二位宽为256位宽。
4.根据权利要求1所述的图像识别加速装置,其特征在于,所述原始图像数据的格式为RGB或者YUV格式。
5.根据权利要求2所述的图像识别加速装置,其特征在于,所述处理单元包括多端口交换网络、计算单元以及寄存器文件;
其中,
所述计算单元的第一输入端连接至多端口交换网络的第一交换出口,第二输入端连接至寄存器文件的输出端,所述计算单元的输出端连接至寄存器文件的输入端;
所述计算单元,具有8位加法、减法、比较与位操作功能。
6.根据权利要求1所述的图像识别加速装置,其特征在于,所述数据保留站由多个32位D触发器、第一D触发器、第二D触发器、加法器、译码器、比较器以及两输入与门构成;
其中,
所述第一D触发器的数据输入端连接至所述加法器的输出端;
所述第二D触发器的数据输入端连接至所述与门的输出端;
所述比较器的第一输入端连接至第一常数,其第二输入端连接至所述第一D触发器的输出端;
所述两输入与门的第一输入端为外部输入信号,其第二输入端连接至所述比较器的输出端;
所述加法器的第一输入端的输入数据为第二常数,其第二输入端连接至所述第一D触发器的输出端;
所述译码器的输入端连接至所述第一D触发器的输出端,所述译码器的输出端个数与所述多个32位D触发器的个数相等;
所述多个32位D触发器的输入端为外部数据输入,其使能端连接至所述解码器的多个输出端,所述多个32位D触发器的数据输出端合并构成更高位宽的数据输出。
7.一种具有如权利要求1至5任一权利要求所述的图像识别加速装置的微处理器芯片,其特征在于,还具有:微处理器内核、系统总线、内存控制器、直接内存访问控制器、中断控制器、网络控制器、视频控制器、低速外设桥接器,以及连接于低速外设桥接器的通用IO、I2C总线控制器、UART控制器以及SPI控制器;
其中所述的微处理器内核、图像识别加速装置、内存控制器、直接内存访问控制器、中断控制器、网络控制器、视频控制器以及低速外设桥接器均连接至系统总线,其连接方式为地址映射。
CN200810007464XA 2008-03-11 2008-03-11 图像识别加速装置及具有图像识别加速装置的微处理器芯片 Expired - Fee Related CN101236601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810007464XA CN101236601B (zh) 2008-03-11 2008-03-11 图像识别加速装置及具有图像识别加速装置的微处理器芯片

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810007464XA CN101236601B (zh) 2008-03-11 2008-03-11 图像识别加速装置及具有图像识别加速装置的微处理器芯片

Publications (2)

Publication Number Publication Date
CN101236601A true CN101236601A (zh) 2008-08-06
CN101236601B CN101236601B (zh) 2010-10-06

Family

ID=39920207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810007464XA Expired - Fee Related CN101236601B (zh) 2008-03-11 2008-03-11 图像识别加速装置及具有图像识别加速装置的微处理器芯片

Country Status (1)

Country Link
CN (1) CN101236601B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944011A (zh) * 2010-06-29 2011-01-12 北京中星微电子有限公司 运行程序的装置、芯片和方法
CN102427543A (zh) * 2011-10-12 2012-04-25 大连科迪视频技术有限公司 一种帧同步3d实时视频信息处理平台和处理方法
CN102497544A (zh) * 2011-12-15 2012-06-13 中国科学院自动化研究所 一种对视频信号的存取进行控制的装置
CN102541657A (zh) * 2010-12-20 2012-07-04 国际商业机器公司 用于对硬件加速器进行运行时功能分配的方法和设备
CN105931176A (zh) * 2016-03-30 2016-09-07 杨桦 一种可扩展智能图形图像处理的加速装置和方法
CN105989352A (zh) * 2015-03-06 2016-10-05 华为技术有限公司 图像识别加速器、终端设备及图像识别方法
CN108256492A (zh) * 2018-01-26 2018-07-06 郑州云海信息技术有限公司 一种图像识别方法、装置及系统
CN110189244A (zh) * 2019-06-06 2019-08-30 卡瓦科尔牙科医疗器械(苏州)有限公司 用于ct影像设备的加速图像处理系统
WO2019205445A1 (zh) * 2018-04-27 2019-10-31 江苏华存电子科技有限公司 一种闪存存储系统的效能加速方法
CN111866069A (zh) * 2020-06-04 2020-10-30 西安万像电子科技有限公司 数据处理方法及装置
CN114707110A (zh) * 2022-06-07 2022-07-05 中科亿海微电子科技(苏州)有限公司 一种三角函数和双曲函数扩展指令计算装置及处理器核

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112419140B (zh) * 2020-12-02 2024-01-23 海光信息技术股份有限公司 数据处理装置、数据处理方法及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674430B1 (en) * 1998-07-16 2004-01-06 The Research Foundation Of State University Of New York Apparatus and method for real-time volume processing and universal 3D rendering
KR100451554B1 (ko) * 2002-08-30 2004-10-08 삼성전자주식회사 멀티미디어용 시스템온칩 프로세서
CN100416600C (zh) * 2005-07-27 2008-09-03 上海明波通信技术有限公司 一种高速图像匹配检测系统及方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944011A (zh) * 2010-06-29 2011-01-12 北京中星微电子有限公司 运行程序的装置、芯片和方法
CN101944011B (zh) * 2010-06-29 2015-11-25 北京中星微电子有限公司 运行程序的装置、芯片和方法
CN102541657A (zh) * 2010-12-20 2012-07-04 国际商业机器公司 用于对硬件加速器进行运行时功能分配的方法和设备
US8957903B2 (en) 2010-12-20 2015-02-17 International Business Machines Corporation Run-time allocation of functions to a hardware accelerator
US8970607B2 (en) 2010-12-20 2015-03-03 International Business Machines Corporation Run-time allocation of functions to a hardware accelerator
CN102541657B (zh) * 2010-12-20 2015-08-19 国际商业机器公司 用于对硬件加速器进行运行时功能分配的方法和设备
CN102427543A (zh) * 2011-10-12 2012-04-25 大连科迪视频技术有限公司 一种帧同步3d实时视频信息处理平台和处理方法
CN102427543B (zh) * 2011-10-12 2013-10-16 大连科迪视频技术有限公司 一种帧同步3d实时视频信息处理平台和处理方法
CN102497544A (zh) * 2011-12-15 2012-06-13 中国科学院自动化研究所 一种对视频信号的存取进行控制的装置
CN102497544B (zh) * 2011-12-15 2014-06-25 中国科学院自动化研究所 一种对视频信号的存取进行控制的装置
CN105989352B (zh) * 2015-03-06 2019-08-20 华为技术有限公司 图像识别加速器、终端设备及图像识别方法
CN105989352A (zh) * 2015-03-06 2016-10-05 华为技术有限公司 图像识别加速器、终端设备及图像识别方法
KR20170140162A (ko) * 2015-03-06 2017-12-20 후아웨이 테크놀러지 컴퍼니 리미티드 이미지 인식 가속기, 단말 기기 및 이미지 인식 방법
US10346701B2 (en) 2015-03-06 2019-07-09 Huawei Technologies Co., Ltd. Image recognition accelerator, terminal device, and image recognition method
CN105931176A (zh) * 2016-03-30 2016-09-07 杨桦 一种可扩展智能图形图像处理的加速装置和方法
CN108256492A (zh) * 2018-01-26 2018-07-06 郑州云海信息技术有限公司 一种图像识别方法、装置及系统
WO2019205445A1 (zh) * 2018-04-27 2019-10-31 江苏华存电子科技有限公司 一种闪存存储系统的效能加速方法
CN110189244A (zh) * 2019-06-06 2019-08-30 卡瓦科尔牙科医疗器械(苏州)有限公司 用于ct影像设备的加速图像处理系统
CN111866069A (zh) * 2020-06-04 2020-10-30 西安万像电子科技有限公司 数据处理方法及装置
CN114707110A (zh) * 2022-06-07 2022-07-05 中科亿海微电子科技(苏州)有限公司 一种三角函数和双曲函数扩展指令计算装置及处理器核
CN114707110B (zh) * 2022-06-07 2022-08-30 中科亿海微电子科技(苏州)有限公司 一种三角函数和双曲函数扩展指令计算装置及处理器核

Also Published As

Publication number Publication date
CN101236601B (zh) 2010-10-06

Similar Documents

Publication Publication Date Title
CN101236601B (zh) 图像识别加速装置及具有图像识别加速装置的微处理器芯片
JP4426099B2 (ja) 共有メモリを有するマルチプロセッサ装置
US10055807B2 (en) Hardware architecture for acceleration of computer vision and imaging processing
CN108206937B (zh) 一种提升智能分析性能的方法和装置
US7797467B2 (en) Systems for implementing SDRAM controllers, and buses adapted to include advanced high performance bus features
US20040257370A1 (en) Apparatus and method for selectable hardware accelerators in a data driven architecture
CN111258935B (zh) 数据传输装置和方法
EP1854016A2 (en) Methods and apparatus for synchronizing data access to a local memory in a multi-processor system
EP1839165A1 (en) Methods and apparatus for hybrid dma queue and dma table
CN112905530B (zh) 片上架构、池化计算加速器阵列、单元以及控制方法
CN105138489B (zh) 网络数据包缓存空间id管理单元
CN111813736B (zh) 片上系统及信号处理方法
CN117806833A (zh) 一种数据处理系统、方法及介质
CN117435251A (zh) 一种后量子密码算法处理器及其片上系统
CN111258769B (zh) 数据传输装置和方法
CN204515761U (zh) 片上系统
CN104598407A (zh) 片上系统及控制方法
US20140146067A1 (en) Accessing Configuration and Status Registers for a Configuration Space
CN114168503A (zh) 一种接口ip核控制方法、接口ip核、装置及介质
US6609188B1 (en) Data flow processor
CN218996035U (zh) 一种配合xmda使用的rdma高速数据传输系统
Kim et al. Memory-centric network-on-chip for power efficient execution of task-level pipeline on a multi-core processor
Shi et al. Optimization of shared memory controller for multi-core system
Ouni13 Generic SOPC platform for video interactive system with MPMC controller
Kechiche et al. SOPC for real time multi-video treatments with QoS requirements

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MA LEI

Free format text: FORMER OWNER: DONG LIANG

Effective date: 20090911

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090911

Address after: Post encoding 25 District No. 1, Beijing city Chaoyang District cuigezhuang Ma Quan Ying Village: 100102

Applicant after: Ma Lei

Address before: Room 302, unit 16, building 100088, rose garden, North Taiping Village, Beijing, Haidian District

Applicant before: Dong Liang

C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101006

Termination date: 20120311