CN111860540B - 基于fpga的神经网络图像特征提取系统 - Google Patents

基于fpga的神经网络图像特征提取系统 Download PDF

Info

Publication number
CN111860540B
CN111860540B CN202010700725.7A CN202010700725A CN111860540B CN 111860540 B CN111860540 B CN 111860540B CN 202010700725 A CN202010700725 A CN 202010700725A CN 111860540 B CN111860540 B CN 111860540B
Authority
CN
China
Prior art keywords
unit
feature map
storage unit
feature extraction
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010700725.7A
Other languages
English (en)
Other versions
CN111860540A (zh
Inventor
肖浩
李昆华
朱明程
李旭东
张哲�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN202010700725.7A priority Critical patent/CN111860540B/zh
Publication of CN111860540A publication Critical patent/CN111860540A/zh
Application granted granted Critical
Publication of CN111860540B publication Critical patent/CN111860540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于FPGA的神经网络图像特征提取系统,包括:第一计算单元,用于对图像帧进行特征提取,得到第一特征图;第二计算单元,用于对第一特征图进行特征提取,得到第二特征图,并将第二特征图存储在第一存储单元中;第二存储单元,用于存述第一计算单元和第二计算单元进行特征提取时的对应的参数;第二计算单元还用于从第一存储单元中读取第二特征图,以及从第二存储单元中读取对应的参数,并对第二特征图进行特征提取,得到第三特征图,并将第三特征图存储在第一存储单元中,依次类推,进行n次特征提取,得到最终特征图,并将最终特征图存储在第一存储单元中。上述图像特征提取系统对FPGA的资源需求较低。

Description

基于FPGA的神经网络图像特征提取系统
技术领域
本发明涉及FPGA领域,尤其涉及一种基于FPGA的神经网络图像特征提取系统。
背景技术
目前对飞行器(如无人机)的识别多依赖于PC端,以纯软件的方式追踪无人机目标,但是此种方式会有许多限制,比如PC端设备体型庞大,功耗较大,且不易随便安装在其他物体上,可携带型差。近年来也衍生了一些基于FPGA采用神经网络来识别的飞行器的方案,然而,由于FPGA(FieldProgrammable Gate Array,现场可编程门阵列)的资源有限,主要体现在FPGA中的DSP数量有限,无法直接承载神经网络的巨大运算量。
发明内容
本发明实施例提供一种基于FPGA的神经网络图像特征提取系统,应用在FPGA上,以降低对FPGA的资源需求。
一种基于FPGA的神经网络图像特征提取系统,包括:
第一计算单元,用于对图像帧进行特征提取,得到第一特征图;
第二计算单元,用于对所述第一特征图进行特征提取,得到第二特征图,并将所述第二特征图存储在第一存储单元中;
第二存储单元,用于存储所述第一计算单元和所述第二计算单元进行特征提取时的对应的参数;
所述第二计算单元还用于从所述第一存储单元中读取所述第二特征图,以及从所述第二存储单元中读取对应的参数,并对所述第二特征图进行特征提取,得到第三特征图,并将所述第三特征图存储在所述第一存储单元中,依次类推,进行n次特征提取,得到最终特征图,并将所述最终特征图存储在所述第一存储单元中。
优选地,所述系统还包括:
定位单元,用于根据所述最终特征图计算所述图像帧中被识别的目标的坐标位置。
优选地,所述第一计算单元被配置实现为全卷积孪生神经网络的第一层,所述第二计算单元计算单元被配置为实现全卷积孪生神经网络的第n+1层。
优选地,所述系统还包括:状态机单元和第一选择单元;
所述状态机单元用于输出第一选择参数给所述第一选择单元,所述第一选择参数用于指示所述第一选择单元选择输出第一特征图给所述第二计算单元,或者用于指示所述第一选择单元选择从所述第一存储单元获取特征图,并输出给所述第二计算单元;
所述状态机单元还用于输出第二选择参数给所述第一选择单元,所述第二选择参数用于指示所述第二存储单元输出特征提取时的对应的参数给所述第二计算单元。
优选地,所述第二计算单元包括第一卷积子单元和n+1个第一优化子单元,所述系统还包括第二选择单元;
所述第一卷积子单元用于对第一计算单元输出的第一特征图,或者所述第一存储单元输出的特征图进行卷积特征提取,并将第一卷积子单元输出的特征图输出给对应的第一优化子单元进行优化,得到对应的特征图;
所述第二选择单元用于从n+1个所述第一优化子单元中选取对应的特征图存储至所述第一存储单元中。
优选地,所述第二计算单元包括第二卷积子单元、第二优化子单元和选择子单元,所述第二存储单元存储有对应的优化参数;
所述第二卷积子单元用于对用于对第一计算单元输出的第一特征图,或者所述第一存储单元输出的特征图进行卷积特征提取;
所述选择子单元用于根据所述第二卷积子单元的卷积特征提取次数,从所述第二存储单元中选择对应的优化参数;
所述第二优化子单元用于根据所述优化参数对所述第二卷积子单元输出的特征图进行优化,并输出给所述第一存储单元进行存储。
优选地,预处理单元,用于对所述图像帧进行预处理。
优选地,所述第一计算单元和所述第二计算单元进行特征提取时,卷积核尺寸为3×3,所述第二计算单元进行5次特征提取。
优选地,所述第一存储单元为先进先出存储器。
上述基于FPGA的神经网络图像特征提取系统通过将FPGA中的寄存器、逻辑门电路等描述为具有不同功能的电路——第一计算单元、第二计算单元、第一存储单元和第二存储单元,并通过第一计算单元实现对神经网络的卷积层的功能,通过对第二计算单元的多次复用来实现神经网络的其余卷积层的功能,有效地利用FPGA的内的资源,降低了对FPGA中的DSP的需求,无需减少神经网络的卷积层的数量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于FPGA的神经网络图像特征提取系统的原理框图;
图2是本发明另一实施例中基于FPGA的神经网络图像特征提取系统的原理框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明实施例提出一种基于FPGA的神经网络图像特征提取系统,该基于FPGA的神经网络图像特征提取系统可应用FPGA中,以实现对图像帧进行特征提取。需要说明的是由于FPGA是通过特定的硬件描述语言将内部的寄存器、逻辑门电路等描述为一个个电路模块的,所以,本实施例提出的基于FPGA的神经网络图像特征提取系统包括以下电路单元,具体可如图1所示:
第一计算单元10,用于对视频数据的图像帧进行特征提取,得到第一特征图;
第二计算单元20,用于对第一特征图进行特征提取,得到第二特征图,并将第二特征图存储在第一存储单元30中。
第二存储单元40,用于存储第一计算单元和第二计算单元进行特征提取时的对应的参数。
第二计算单元20还用于从第一存储单元30中读取第二特征图,以及从第二存储单元40中读取对应的参数,并对第二特征图进行特征提取,得到第三特征图,并将第三特征图存储在第一存储单元30中,依次类推,进行n次特征提取,得到最终特征图,并将最终特征图存储在第一存储单元30中。
具体地,第一计算单元10和第二计算单元20均可被描述为实现神经网络的卷积层的功能。其中,第一计算单元10被描述为实现神经网络的第一层卷积层的功能。第二计算单元20被描述为实现神经网络的其余卷积层的功能,且上述第一计算单元10、第二计算单元20可以运行在同一个时钟下。上述第一存储单元30可以是先进先出存储器。
视频数据的图像帧可以通过上位机来传输给FPGA板,并将视频数据的图像帧存储在随机存储器中。第一计算单元10从随机存储器读取视频数据的图像帧,并进行特征提取。第二计算单元20多次用于进行特征提取,实际上是对第二计算单元20进行复用的过程。需要说明的是,由于需要利用第二计算单元20进行多次特征提取,而每次特征提取的需求不同,对应于神经网络,每次特征提取均采用不同的卷积层实现,因此本实施例通过在第二存储单元40中第二计算单元20进行每一次特征提取所需要的电路配置参数(对应神经网络则为神经网络的网络参数),例如卷积核尺寸、步长和权重等。示例性地,可以在第二计算单元20进行第一次特征提取之前,从第二存储单元40中读取第二计算单元20进行第一次特征提取的参数,然后对第一特征图进行特征提取,得到第二特征图,以此类推,采用第二计算单元20进行后续的n次特征提取。
本实施例通过将FPGA中的寄存器、逻辑门电路等描述为具有不同功能的电路——第一计算单元、第二计算单元、第一存储单元和第二存储单元,并通过第一计算单元实现对神经网络的卷积层的功能,通过对第二计算单元的多次复用来实现神经网络的其余卷积层的功能,有效地利用FPGA的内的资源,降低了对FPGA中的DSP的需求,无需减少神经网络的卷积层的数量。
上述实施例可用于对图像上的特定目标进行识别,例如,对视频图像上的目标进行跟踪,要实现该功能,可在上述实施例所提出的系统的基础上添加定位单元,如图2所述。具体地,在上述系统用于对视频图像中的目标进行跟踪时,上述第一计算单元和第二计算单元对视频的第一帧图像中的预设坐标位置进行特征提取,定位单元用于找出视频的其他帧图像的特征峰值最大处,然后计算与前一帧图像的移位,用前一帧图像的坐标加上移位,得到后面帧无人机坐标。
上述图像特征提取系统可以被描述为实现全卷积孪生神经网络的功能,且该全卷积孪生神经网络的卷积层数量可以是n+2层。具体地,上述第一计算单元被配置实现为全卷积孪生神经网络的第一层,上述第二计算单元计算单元被配置为实现全卷积孪生神经网络的第n+1层。其中,n为大于或等于2的正整数。
为了对上述第二计算单元20进行时序控制,如图2所示,上述图像特征提取系统还包括第一选择单元60和状态机单元70。具体地,第一选择单元60用于接收状态机单元70输出的第一选择参数,且第一选择参数用于指示第一选择单元60选择输出第一特征图给第二计算单元20,或者用于指示第一选择单元60选择从第一存储单元30获取特征图,并输出给第二计算单元20。示例性地,当状态机单元70输出00时,第一选择单元60选择输出第一特征图给第二计算单元20;当状态机单元70输出01时,第一选择单元60选择输出从第一存储单元30读取的特征图给第二计算单元20。另外,上述状态机单元70还用于输出第二选择参数给第一选择单元60,第二选择参数用于指示第二存储单元40输出特征提取时的对应的参数给第二计算单元20。
本实施例提出一种实施方式,在第二计算单元20对第一特征图或第一存储单元30输出的特征图进行特征提取时,还需要对特征图进行激活、归一化和池化等操作,因此,第二计算单元20可以包括第一卷积子单元21和n+1个第一优化子单元,系统还包括第二选择单元80。需要说明的是,第一卷积子单元21用于特征提取,第一优化子单元用于进行批量归一化、激活和最大池化等操作,而对不同的卷积特征图(可以理解为第一卷积子单元21对不同的特征图进行卷积后得到的)进行归一化、激活和池化需要采用不同的优化参数,因此,可以设置不同的第一优化子单元对卷积特征图进行优化,其中,第一优化子单元的数量与采用第一卷积子单元21进行卷积特征提取的次数(也即第第一卷积子单元21的复用次数)一致。
具体地,第一卷积子单元21用于对第一计算单元10输出的第一特征图,或者第一存储单元30输出的特征图进行卷积特征提取,并将第一卷积子单元21输出的特征图输出给对应的第一优化子单元进行优化,得到对应的特征图;第二选择单元80用于从n+1个第一优化子单元中选取对应的特征图存储至第一存储单元30中。
上述实施方式中,由于包括多个第一优化子单元,因此,对FPGA的资源占用还是比较大,因此,本发明实施例对上述实施方式进行了改进。具体地,第二计算单元20包括第二卷积子单元、第二优化子单元和选择子单元,第二存储单元40存储有对应的优化参数;
第二卷积子单元用于对用于对第一计算单元10输出的第一特征图,或者第一存储单元30输出的特征图进行卷积特征提取;
选择子单元用于根据第二卷积子单元的卷积特征提取次数,从第二存储单元40中选择对应的优化参数;
第二优化子单元用于根据优化参数对第二卷积子单元输出的特征图进行优化,并输出给第一存储单元30进行存储。
上述实施方式通过选择子单元从第二存储单元40中选择不同的优化参数来改变第二优化子单元的结构,实现了对第二优化子单元的复用,进一步减少了对FPGA的资源需求。
可以理解地,上述第一计算单元也可以包括卷积子单元和优化子单元,卷积子单元也是用于卷积特征提取,优化子单元用于批量归一化、激活和最大池化等操作。
在本实施例中,在第一计算单元10对图像帧进行特征提取之前,还需要设置一预处理单元,以对图像帧进行预处理,例如,对图像帧进行颜色空间转换,或者对将图像帧转换为预设尺寸等。
在本实施例中,为了进一步减小对FPGA中的DSP的数量需求,同时提高图像特征提取系统计算时的并行度,也可以将全卷积孪生神经网络的卷积核尺寸设置为3×3。上述全卷积孪生神经网络的包括6层卷积层,以提高神经网络的深度,从而提高上述系统对图像特征提取的能力,对应于本实施例中的图像特征提取系统,第一计算单元10和第二计算单元20进行特征提取时,卷积核尺寸为3×3,第二计算单元20进行5次特征提取。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于FPGA的神经网络图像特征提取系统,其特征在于,包括:
第一计算单元,用于对图像帧进行特征提取,得到第一特征图;
第二计算单元,用于对所述第一特征图进行特征提取,得到第二特征图,并将所述第二特征图存储在第一存储单元中;
第二存储单元,用于存储所述第一计算单元和所述第二计算单元进行特征提取时的对应的参数;
所述第二计算单元还用于从所述第一存储单元中读取所述第二特征图,以及从所述第二存储单元中读取对应的参数,并对所述第二特征图进行特征提取,得到第三特征图,并将所述第三特征图存储在所述第一存储单元中,依次类推,进行n次特征提取,得到最终特征图,并将所述最终特征图存储在所述第一存储单元中;
所述第一计算单元被配置实现为全卷积孪生神经网络的第一层,所述第二计算单元计算单元被配置为实现全卷积孪生神经网络的第n+1层;
所述第二计算单元包括第二卷积子单元、第二优化子单元和选择子单元,所述第二存储单元存储有对应的优化参数;
所述第二卷积子单元用于对第一计算单元输出的第一特征图,或者所述第一存储单元输出的特征图进行卷积特征提取;
所述选择子单元用于根据所述第二卷积子单元的卷积特征提取次数,从所述第二存储单元中选择对应的优化参数;
所述第二优化子单元用于根据所述优化参数对所述第二卷积子单元输出的特征图进行优化,并输出给所述第一存储单元进行存储;
所述系统还包括:状态机单元和第一选择单元;
所述状态机单元用于输出第一选择参数给所述第一选择单元,所述第一选择参数用于指示所述第一选择单元选择输出第一特征图给所述第二计算单元,或者用于指示所述第一选择单元选择从所述第一存储单元获取特征图,并输出给所述第二计算单元;
所述状态机单元还用于输出第二选择参数给所述第一选择单元,所述第二选择参数用于指示所述第二存储单元输出特征提取时的对应的参数给所述第二计算单元;
所述第二计算单元包括第一卷积子单元和n+1个第一优化子单元,所述系统还包括第二选择单元;
所述第一卷积子单元用于对第一计算单元输出的第一特征图,或者所述第一存储单元输出的特征图进行卷积特征提取,并将第一卷积子单元输出的特征图输出给对应的第一优化子单元进行优化,得到对应的特征图;
所述第二选择单元用于从n+1个所述第一优化子单元中选取对应的特征图存储至所述第一存储单元中。
2.如权利要求1所述的基于FPGA的神经网络图像特征提取系统,其特征在于,所述系统还包括:
定位单元,用于根据所述最终特征图计算所述图像帧中被识别的目标的坐标位置。
3.如权利要求2所述的基于FPGA的神经网络图像特征提取系统,其特征在于,所述系统还包括:
预处理单元,用于对所述图像帧进行预处理。
4.如权利要求1所述的基于FPGA的神经网络图像特征提取系统,其特征在于,所述第一计算单元和所述第二计算单元进行特征提取时,卷积核尺寸为3×3,所述第二计算单元进行5次特征提取。
5.如权利要求1所述的基于FPGA的神经网络图像特征提取系统,其特征在于,所述第一存储单元为先进先出存储器。
CN202010700725.7A 2020-07-20 2020-07-20 基于fpga的神经网络图像特征提取系统 Active CN111860540B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010700725.7A CN111860540B (zh) 2020-07-20 2020-07-20 基于fpga的神经网络图像特征提取系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010700725.7A CN111860540B (zh) 2020-07-20 2020-07-20 基于fpga的神经网络图像特征提取系统

Publications (2)

Publication Number Publication Date
CN111860540A CN111860540A (zh) 2020-10-30
CN111860540B true CN111860540B (zh) 2024-01-12

Family

ID=73000728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010700725.7A Active CN111860540B (zh) 2020-07-20 2020-07-20 基于fpga的神经网络图像特征提取系统

Country Status (1)

Country Link
CN (1) CN111860540B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529517A (zh) * 2016-12-30 2017-03-22 北京旷视科技有限公司 图像处理方法和图像处理设备
JP2018005520A (ja) * 2016-06-30 2018-01-11 クラリオン株式会社 物体検出装置及び物体検出方法
CN108805272A (zh) * 2018-05-03 2018-11-13 东南大学 一种基于fpga的通用卷积神经网络加速器
CN108846440A (zh) * 2018-06-20 2018-11-20 腾讯科技(深圳)有限公司 图像处理方法及装置、计算机可读介质和电子设备
CN108921182A (zh) * 2018-09-26 2018-11-30 苏州米特希赛尔人工智能有限公司 Fpga实现的特征提取图像传感器
CN109102065A (zh) * 2018-06-28 2018-12-28 广东工业大学 一种基于PSoC的卷积神经网络加速器
CN111340850A (zh) * 2020-03-20 2020-06-26 军事科学院系统工程研究院系统总体研究所 基于孪生网络和中心逻辑损失的无人机对地目标跟踪方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6963627B2 (ja) * 2017-07-21 2021-11-10 グーグル エルエルシーGoogle LLC 畳み込みニューラルネットワークのためのニューラルアーキテクチャ検索

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005520A (ja) * 2016-06-30 2018-01-11 クラリオン株式会社 物体検出装置及び物体検出方法
CN106529517A (zh) * 2016-12-30 2017-03-22 北京旷视科技有限公司 图像处理方法和图像处理设备
CN108805272A (zh) * 2018-05-03 2018-11-13 东南大学 一种基于fpga的通用卷积神经网络加速器
CN108846440A (zh) * 2018-06-20 2018-11-20 腾讯科技(深圳)有限公司 图像处理方法及装置、计算机可读介质和电子设备
CN109102065A (zh) * 2018-06-28 2018-12-28 广东工业大学 一种基于PSoC的卷积神经网络加速器
CN108921182A (zh) * 2018-09-26 2018-11-30 苏州米特希赛尔人工智能有限公司 Fpga实现的特征提取图像传感器
CN111340850A (zh) * 2020-03-20 2020-06-26 军事科学院系统工程研究院系统总体研究所 基于孪生网络和中心逻辑损失的无人机对地目标跟踪方法

Also Published As

Publication number Publication date
CN111860540A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
US11307864B2 (en) Data processing apparatus and method
JP2019036298A (ja) 知能型高帯域幅メモリシステム及びそのための論理ダイ
CN109408450B (zh) 一种数据处理的方法、系统、协处理装置和主处理装置
CN110751676A (zh) 一种基于目标检测的异构计算系统、方法和可读存储介质
CN110991630A (zh) 一种面向边缘计算的卷积神经网络处理器
CN110209472B (zh) 任务数据处理方法和板卡
CN111161705A (zh) 语音转换方法及装置
CN111860540B (zh) 基于fpga的神经网络图像特征提取系统
US20200242467A1 (en) Calculation method and calculation device for sparse neural network, electronic device, computer readable storage medium, and computer program product
CN108154522B (zh) 目标追踪系统
CN107247944B (zh) 基于深度学习的人脸检测速度优化方法及装置
EP4148627A1 (en) Neural network scheduling method and apparatus
CN111260046B (zh) 运算方法、装置及相关产品
CN111445019B (zh) 一种分组卷积中通道混洗操作的实现装置及方法
CN111382852B (zh) 数据处理装置、方法、芯片及电子设备
CN115731111A (zh) 图像数据处理装置及方法、电子设备
CN111382856B (zh) 数据处理装置、方法、芯片及电子设备
Le et al. An opencl-based sift accelerator for image features extraction on fpga in mobile edge computing environment
CN111258641B (zh) 运算方法、装置及相关产品
US20200380345A1 (en) Neural network chip, method of using neural network chip to implement de-convolution opeation, electronic device, and computer readable storage medium
CN111260070A (zh) 运算方法、装置及相关产品
US20220327391A1 (en) Global pooling method for neural network, and many-core system
Hasanaj et al. Cooperative edge deepfake detection
CN114359683B (zh) 一种面向文本定位的单内核hog高效异构加速方法
CN117519996B (zh) 一种数据处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant