CN105956666A - 一种机器学习方法及系统 - Google Patents

一种机器学习方法及系统 Download PDF

Info

Publication number
CN105956666A
CN105956666A CN201610283789.5A CN201610283789A CN105956666A CN 105956666 A CN105956666 A CN 105956666A CN 201610283789 A CN201610283789 A CN 201610283789A CN 105956666 A CN105956666 A CN 105956666A
Authority
CN
China
Prior art keywords
data processing
fpga
processing algorithm
data
spark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610283789.5A
Other languages
English (en)
Other versions
CN105956666B (zh
Inventor
王洪伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610283789.5A priority Critical patent/CN105956666B/zh
Publication of CN105956666A publication Critical patent/CN105956666A/zh
Application granted granted Critical
Publication of CN105956666B publication Critical patent/CN105956666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Advance Control (AREA)

Abstract

本发明公开了一种机器学习方法及装置,其中,该方法包括:数据处理服务器将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,Spark数据处理算法为由Spark提供的数据处理算法;FPGA异构加速计算装置获取由FPGA算法库提供的与Spark数据处理算法对应的FPGA数据处理算法,并利用FPGA数据处理算法对待处理数据进行处理。由此,利用FPGA数据处理算法实现对于待处理数据的处理;而FPGA数据处理算法均为计算速度较Spark数据处理算法更快的数据处理算法,因此,缩短了大数据处理周期,提升了Spark机器学习性能。

Description

一种机器学习方法及系统
技术领域
本发明涉及机器学习技术领域,更具体地说,涉及一种机器学习方法及系统。
背景技术
Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用并行框架,Spark拥有Hadoop MapReduce所具有的优点;但不同于HadoopMapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
相对于hadoop系统,Spark框架充分利用了内存计算技术,改进了IO的使用频度,有效的提升了大数据处理的性能。但是,随着更大规模海量数据的出现,对高性能数据分析处理的需求一直在增长。更多、更复杂及更多样化的数据正在不断出现,对计算性能的苛刻要求依然在增长。因此,有效提升Spark机器学习的性能,可以缩短大数据处理周期,缩短工作人员对于分析结果的等待时间。
综上所述,如何提供一种能够有效提升Spark机器学习性能的技术方案,是目前本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种机器学习方法及系统,以有效提升机器学习性能,缩短大数据处理周期。
为了实现上述目的,本发明提供如下技术方案:
一种机器学习方法,包括:
数据处理服务器将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,其中,所述Spark数据处理算法为由Spark提供的数据处理算法;
所述FPGA异构加速计算装置获取由FPGA算法库提供的与所述Spark数据处理算法对应的FPGA数据处理算法,并利用所述FPGA数据处理算法对所述待处理数据进行处理。
优选的,所述数据处理服务器将所述待处理数据发送至所述FPGA异构加速计算装置,包括:
判断所述FPGA异构加速计算装置的内存是否大于或等于所述待处理数据,如果是,则将所述待处理数据发送至所述FPGA异构加速计算装置,如果否,则将所述待处理数据分割成小于或等于所述FPGA异构加速计算装置的内存的待处理数据块,再依次发送至所述FPGA异构加速计算装置。
优选的,所述FPGA异构加速计算装置获取所述FPGA数据处理算法之后,还包括:
将所述FPGA数据处理算法进行存储;
对应的,所述FPGA异构加速计算装置获取所述FPGA数据处理算法,包括:
判断所述FPGA异构加速计算装置是否存储有所述FPGA数据处理算法,如果是,则直接采用所述FPGA数据处理算法,如果否,则由所述FPGA算法库获取所述FPGA数据处理算法。
优选的,还包括:
所述数据处理服务器将所述FPGA异构加速装置对所述待处理数据进行计算得到的计算结果返回给服务器主机,所述服务器主机为发送所述Spark数据处理算法至所述数据处理服务器的装置。
优选的,所述数据处理服务器将所述Spark数据处理算法发送至所述FPGA异构加速计算装置,包括:
所述数据处理服务器将所述Spark数据处理算法中计算性能要求大于预设值的部分算法发送至所述FPGA异构加速计算装置。
一种机器学习系统,包括:
数据处理服务器,用于将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,其中,所述Spark数据处理算法为由Spark提供的数据处理算法;
所述FPGA异构加速计算装置,用于获取由FPGA算法库提供的与所述Spark数据处理算法对应的FPGA数据处理算法,并利用所述FPGA数据处理算法对所述待处理数据进行处理;
所述FPGA算法库,用于提供FPGA数据处理算法。
优选的,所述数据处理服务器包括:
第一发送模块,用于判断所述FPGA异构加速计算装置的内存是否大于或等于所述待处理数据,如果是,则将所述待处理数据发送至所述FPGA异构加速计算装置,如果否,则将所述待处理数据分割成小于或等于所述FPGA异构加速计算装置的内存的待处理数据块,再依次发送至所述FPGA异构加速计算装置。
优选的,所述FPGA异构加速计算装置包括:
存储模块,用于将所述FPGA数据处理算法进行存储;
对应的,所述FPGA异构加速计算装置包括:
获取模块,用于判断所述FPGA异构加速计算装置是否存储有所述FPGA数据处理算法,如果是,则直接采用所述FPGA数据处理算法,如果否,则由所述FPGA算法库获取所述FPGA数据处理算法。
优选的,所述数据处理服务器包括:
反馈模块,用于将所述FPGA异构加速装置对所述待处理数据进行计算得到的计算结果返回给服务器主机,所述服务器主机为发送所述Spark数据处理算法至所述数据处理服务器的装置。
优选的,所述数据处理服务器包括:
第二发送模块,用于将所述Spark数据处理算法中计算性能要求大于预设值的部分算法发送至所述FPGA异构加速计算装置。
本发明提供的一种机器学习方法及装置,其中,该方法包括:数据处理服务器将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,其中,所述Spark数据处理算法为由Spark提供的数据处理算法;所述FPGA异构加速计算装置获取由FPGA算法库提供的与所述Spark数据处理算法对应的FPGA数据处理算法,并利用所述FPGA数据处理算法对所述待处理数据进行处理。本发明实施例提供的上述技术方案中,基于FPGA异构加速计算装置及FPGA算法库,利用FPGA数据处理算法实现对于待处理数据的处理。而FPGA数据处理算法均为计算性能较Spark数据处理算法更快的数据处理算法,因此,利用FPGA数据处理算法对待处理数据进行处理,能够缩短大数据处理周期,提升Spark机器学习性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种机器学习方法的流程图;
图2为本发明实施例提供的一种机器学习系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种机器学习方法的流程图,可以包括以下步骤:
S11:数据处理服务器将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,其中,Spark数据处理算法为由Spark提供的数据处理算法。
其中,需要说明的是,Spark数据处理算法为由Spark提供的经典Spark数据处理算法,该算法可以由服务器主机确定每个数据处理服务器需使用的Spark数据处理算法后通过任务分发机制向每个数据处理服务器发送该Spark数据处理算法。以K-mean聚类机器学习算法为例,将算法在Spark集群中启动,由服务器主机通过任务分发机制,将其发送至每个数据处理服务器。而待处理数据为数据处理服务器预先获取与服务器主机发送的Spark数据处理算法对应的数据。
另外,将待处理数据及Spark数据处理算法发送至FPGA异构加速计算装置中,具体可以是发送至FPGA异构加速计算装置的板载DDR内存中,该DDR内存可以是DDR3/DDR4。
S12:FPGA异构加速计算装置获取由FPGA算法库提供的与Spark数据处理算法对应的FPGA数据处理算法,并利用FPGA数据处理算法对待处理数据进行处理。
其中,FPGA异构加速计算装置具体可以为扩展卡式设计,采用PCIe3.0接口与其他装置进行连接,核心计算部件为FPGA(现场可编程门阵列)芯片。而FPGA算法库为机器学习专用算法库在FPGA芯片上的逻辑实现,经过对大数据算法的优化,较高的匹配FPGA算法库的硬件属性。具体来说,FPGA算法库具体可以包括协同过滤,隐性反馈vs显性反馈,梯度下降基础算法,二元分类,线性回归,聚类等。另外,为了使得数据处理服务器能够对上述装置进行应用,还可以包括FPGA加速装置接口,为对应服务器提供软件接口,对上层透明,与Spark的机器学习底层算法相配合,使得采用Spark平台的处理任务设计人员无需了解底层的FPGA算法库设计。
本发明实施例提供的上述技术方案中,基于FPGA异构加速计算装置及FPGA算法库,利用FPGA数据处理算法实现对于待处理数据的处理。而FPGA数据处理算法均为计算速度较Spark数据处理算法更快的数据处理算法,因此,利用FPGA数据处理算法对待处理数据进行处理,能够缩短大数据处理周期,提升Spark机器学习性能。
其中,FPGA异构加速计算装置为机器学习算法提供硬件加速平台,FPGA算法库在FPGA上进行加速优化实现,为Spark机器学习提供算法支持;且,上述两个装置实现的异构加速的机器学习算法与Spark上层应用松耦合,对上层透明,使用户无需关心底层实现。
本发明实施例提供的一种机器学习方法,数据处理服务器将待处理数据发送至FPGA异构加速计算装置,可以包括:
判断FPGA异构加速计算装置的内存是否大于或等于待处理数据,如果是,则将待处理数据发送至FPGA异构加速计算装置,如果否,则将待处理数据分割成小于或等于FPGA异构加速计算装置的内存的待处理数据块,再依次发送至FPGA异构加速计算装置。
其中,数据处理服务器将一个待处理数据块发送至FPGA异构加速计算装置后,FPGA异构加速计算装置对该数据块进行处理,然后返回处理完成信息至数据处理服务器,数据处理服务器再将下一个待处理数据块发送至FPGA异构加速计算装置,直至全部待处理数据块处理完成为止。并且,FPGA异构加速计算装置可以将每次计算完成的结果存储,以在对待处理数据全部计算完成后,将计算结果反馈给数据处理服务器。
本发明实施例提供的一种机器学习方法,FPGA异构加速计算装置获取FPGA数据处理算法之后,还可以包括:
将FPGA数据处理算法进行存储;
对应的,FPGA异构加速计算装置获取FPGA数据处理算法,可以包括:
判断FPGA异构加速计算装置是否存储有FPGA数据处理算法,如果是,则直接采用FPGA数据处理算法,如果否,则由FPGA算法库获取FPGA数据处理算法。
由此,能够在一定程序上避免FPGA异构加速计算装置由FPGA算法库中获取FPGA数据处理算法的次数,进一步提高了数据处理速度,提升了机器学习性能。
本发明实施例提供的一种机器学习方法,还可以包括:
数据处理服务器将FPGA异构加速装置对待处理数据进行计算得到的计算结果返回给服务器主机,服务器主机为发送Spark数据处理算法至数据处理服务器的装置。
将全部计算结果返回给服务器主机,以供服务器主机利用。
本发明实施例提供的一种机器学习方法,数据处理服务器将Spark数据处理算法发送至FPGA异构加速计算装置,可以包括:
数据处理服务器将Spark数据处理算法中计算性能要求大于预设值的部分算法发送至FPGA异构加速计算装置。
其中,预设值可以根据实际需要进行确定,由此,仅将Spark数据处理算法中计算性能要求大于预设值的部分算法,即计算性能要求较高的部分算法发送至FPGA异构加速计算装置,由该装置进行处理,而Spark数据处理算法中的其他算法,则直接利用Spark数据处理算法进行处理,实现了对于FPGA异构加速计算装置的合理利用。
与上述方法实施例相对应,本发明实施例还提供了一种机器学习系统,如图2所示,可以包括:
数据处理服务器11,用于将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置12,其中,Spark数据处理算法为由Spark提供的数据处理算法;
FPGA异构加速计算装置12,用于获取由FPGA算法库13提供的与Spark数据处理算法对应的FPGA数据处理算法,并利用FPGA数据处理算法对待处理数据进行处理;
FPGA算法库13,用于提供FPGA数据处理算法。
本发明实施例提供的一种机器学习系统,数据处理服务器可以包括:
第一发送模块,用于判断FPGA异构加速计算装置的内存是否大于或等于待处理数据,如果是,则将待处理数据发送至FPGA异构加速计算装置,如果否,则将待处理数据分割成小于或等于FPGA异构加速计算装置的内存的待处理数据块,再依次发送至FPGA异构加速计算装置。
本发明实施例提供的一种机器学习系统,FPGA异构加速计算装置可以包括:
存储模块,用于将FPGA数据处理算法进行存储;
对应的,FPGA异构加速计算装置可以包括:
获取模块,用于判断FPGA异构加速计算装置是否存储有FPGA数据处理算法,如果是,则直接采用FPGA数据处理算法,如果否,则由FPGA算法库获取FPGA数据处理算法。
本发明实施例提供的一种机器学习系统,数据处理服务器可以包括:
反馈模块,用于将FPGA异构加速装置对待处理数据进行计算得到的计算结果返回给服务器主机,服务器主机为发送Spark数据处理算法至数据处理服务器的装置。
本发明实施例提供的一种机器学习系统,数据处理服务器可以包括:
第二发送模块,用于将Spark数据处理算法中计算性能要求大于预设值的部分算法发送至FPGA异构加速计算装置。
本发明实施例提供的一种机器学习系统中相关部分的说明请参见本发明实施例提供的一种机器学习方法中对应部分的详细说明,在此不再赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种机器学习方法,其特征在于,包括:
数据处理服务器将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,其中,所述Spark数据处理算法为由Spark提供的数据处理算法;
所述FPGA异构加速计算装置获取由FPGA算法库提供的与所述Spark数据处理算法对应的FPGA数据处理算法,并利用所述FPGA数据处理算法对所述待处理数据进行处理。
2.根据权利要求1所述的方法,其特征在于,所述数据处理服务器将所述待处理数据发送至所述FPGA异构加速计算装置,包括:
判断所述FPGA异构加速计算装置的内存是否大于或等于所述待处理数据,如果是,则将所述待处理数据发送至所述FPGA异构加速计算装置,如果否,则将所述待处理数据分割成小于或等于所述FPGA异构加速计算装置的内存的待处理数据块,再依次发送至所述FPGA异构加速计算装置。
3.根据权利要求1所述的方法,其特征在于,所述FPGA异构加速计算装置获取所述FPGA数据处理算法之后,还包括:
将所述FPGA数据处理算法进行存储;
对应的,所述FPGA异构加速计算装置获取所述FPGA数据处理算法,包括:
判断所述FPGA异构加速计算装置是否存储有所述FPGA数据处理算法,如果是,则直接采用所述FPGA数据处理算法,如果否,则由所述FPGA算法库获取所述FPGA数据处理算法。
4.根据权利要求3所述的方法,其特征在于,还包括:
所述数据处理服务器将所述FPGA异构加速装置对所述待处理数据进行计算得到的计算结果返回给服务器主机,所述服务器主机为发送所述Spark数据处理算法至所述数据处理服务器的装置。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述数据处理服务器将所述Spark数据处理算法发送至所述FPGA异构加速计算装置,包括:
所述数据处理服务器将所述Spark数据处理算法中计算性能要求大于预设值的部分算法发送至所述FPGA异构加速计算装置。
6.一种机器学习系统,其特征在于,包括:
数据处理服务器,用于将Spark数据处理算法及对应的待处理数据发送至FPGA异构加速计算装置,其中,所述Spark数据处理算法为由Spark提供的数据处理算法;
所述FPGA异构加速计算装置,用于获取由FPGA算法库提供的与所述Spark数据处理算法对应的FPGA数据处理算法,并利用所述FPGA数据处理算法对所述待处理数据进行处理;
所述FPGA算法库,用于提供FPGA数据处理算法。
7.根据权利要求6所述的系统,其特征在于,所述数据处理服务器包括:
第一发送模块,用于判断所述FPGA异构加速计算装置的内存是否大于或等于所述待处理数据,如果是,则将所述待处理数据发送至所述FPGA异构加速计算装置,如果否,则将所述待处理数据分割成小于或等于所述FPGA异构加速计算装置的内存的待处理数据块,再依次发送至所述FPGA异构加速计算装置。
8.根据权利要求6所述的系统,其特征在于,所述FPGA异构加速计算装置包括:
存储模块,用于将所述FPGA数据处理算法进行存储;
对应的,所述FPGA异构加速计算装置包括:
获取模块,用于判断所述FPGA异构加速计算装置是否存储有所述FPGA数据处理算法,如果是,则直接采用所述FPGA数据处理算法,如果否,则由所述FPGA算法库获取所述FPGA数据处理算法。
9.根据权利要求8所述的系统,其特征在于,所述数据处理服务器包括:
反馈模块,用于将所述FPGA异构加速装置对所述待处理数据进行计算得到的计算结果返回给服务器主机,所述服务器主机为发送所述Spark数据处理算法至所述数据处理服务器的装置。
10.根据权利要求6至9任一项所述的系统,其特征在于,所述数据处理服务器包括:
第二发送模块,用于将所述Spark数据处理算法中计算性能要求大于预设值的部分算法发送至所述FPGA异构加速计算装置。
CN201610283789.5A 2016-04-29 2016-04-29 一种机器学习方法及系统 Active CN105956666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610283789.5A CN105956666B (zh) 2016-04-29 2016-04-29 一种机器学习方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610283789.5A CN105956666B (zh) 2016-04-29 2016-04-29 一种机器学习方法及系统

Publications (2)

Publication Number Publication Date
CN105956666A true CN105956666A (zh) 2016-09-21
CN105956666B CN105956666B (zh) 2018-09-07

Family

ID=56913218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610283789.5A Active CN105956666B (zh) 2016-04-29 2016-04-29 一种机器学习方法及系统

Country Status (1)

Country Link
CN (1) CN105956666B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528490A (zh) * 2016-11-30 2017-03-22 郑州云海信息技术有限公司 一种fpga异构加速计算装置及系统
CN106528171A (zh) * 2016-11-24 2017-03-22 郑州云海信息技术有限公司 一种异构计算平台子系统间的接口设计方法、装置及系统
CN106547627A (zh) * 2016-11-24 2017-03-29 郑州云海信息技术有限公司 一种Spark MLlib数据处理加速的方法及系统
CN106776466A (zh) * 2016-11-30 2017-05-31 郑州云海信息技术有限公司 一种fpga异构加速计算装置及系统
CN109284250A (zh) * 2017-09-11 2019-01-29 南京弹跳力信息技术有限公司 一种基于大规模fpga芯片的计算加速系统及其加速方法
CN109408148A (zh) * 2018-10-25 2019-03-01 北京计算机技术及应用研究所 一种国产化计算平台及其应用加速方法
CN111209248A (zh) * 2020-01-07 2020-05-29 广东珠江智联信息科技股份有限公司 边缘计算服务器及边缘计算方法
WO2024114320A1 (zh) * 2022-11-28 2024-06-06 杭州阿里云飞天信息技术有限公司 一种异构加速方法、设备、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135951A (zh) * 2011-03-07 2011-07-27 哈尔滨工业大学 基于运行时重构的ls-svm算法fpga实现方法
CN103902498A (zh) * 2013-12-18 2014-07-02 曲阜师范大学 一种面向异构计算的软件定义服务器系统及方法
CN103942235A (zh) * 2013-05-15 2014-07-23 张一凡 针对大规模数据集交叉比较的分布式计算系统和方法
CN104657308A (zh) * 2015-03-04 2015-05-27 浪潮电子信息产业股份有限公司 一种用fpga实现的服务器硬件加速的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135951A (zh) * 2011-03-07 2011-07-27 哈尔滨工业大学 基于运行时重构的ls-svm算法fpga实现方法
CN103942235A (zh) * 2013-05-15 2014-07-23 张一凡 针对大规模数据集交叉比较的分布式计算系统和方法
CN103902498A (zh) * 2013-12-18 2014-07-02 曲阜师范大学 一种面向异构计算的软件定义服务器系统及方法
CN104657308A (zh) * 2015-03-04 2015-05-27 浪潮电子信息产业股份有限公司 一种用fpga实现的服务器硬件加速的方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528171A (zh) * 2016-11-24 2017-03-22 郑州云海信息技术有限公司 一种异构计算平台子系统间的接口设计方法、装置及系统
CN106547627A (zh) * 2016-11-24 2017-03-29 郑州云海信息技术有限公司 一种Spark MLlib数据处理加速的方法及系统
CN106528171B (zh) * 2016-11-24 2019-09-24 郑州云海信息技术有限公司 一种异构计算平台子系统间的接口设计方法、装置及系统
CN106528490A (zh) * 2016-11-30 2017-03-22 郑州云海信息技术有限公司 一种fpga异构加速计算装置及系统
CN106776466A (zh) * 2016-11-30 2017-05-31 郑州云海信息技术有限公司 一种fpga异构加速计算装置及系统
CN106528490B (zh) * 2016-11-30 2020-02-07 郑州云海信息技术有限公司 一种fpga异构加速计算装置及系统
CN109284250A (zh) * 2017-09-11 2019-01-29 南京弹跳力信息技术有限公司 一种基于大规模fpga芯片的计算加速系统及其加速方法
CN109408148A (zh) * 2018-10-25 2019-03-01 北京计算机技术及应用研究所 一种国产化计算平台及其应用加速方法
CN111209248A (zh) * 2020-01-07 2020-05-29 广东珠江智联信息科技股份有限公司 边缘计算服务器及边缘计算方法
WO2024114320A1 (zh) * 2022-11-28 2024-06-06 杭州阿里云飞天信息技术有限公司 一种异构加速方法、设备、系统及存储介质

Also Published As

Publication number Publication date
CN105956666B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN105956666A (zh) 一种机器学习方法及系统
CN106875013B (zh) 用于多核优化循环神经网络的系统和方法
US10558664B2 (en) Structured cluster execution for data streams
CN103345514B (zh) 大数据环境下的流式数据处理方法
US9846589B2 (en) Virtual machine placement optimization with generalized organizational scenarios
CN108319599A (zh) 一种人机对话的方法和装置
US11429855B2 (en) Acceleration of neural networks using depth-first processing
CN108563808A (zh) 基于fpga的异构可重构图计算加速器系统的设计方法
CN106201722A (zh) 服务器的负载调整方法及系统
US20200117988A1 (en) Networks for distributing parameters and data to neural network compute cores
CN103678603B (zh) 多源异构数据高效汇聚存取架构系统
CN108139931A (zh) 通过重映射同步来加速任务子图
WO2007082814A3 (en) Method for modeling a free pool of resources
CN109754359A (zh) 一种应用于卷积神经网络的池化处理的方法及系统
Valero‐Lara et al. cuThomasBatch and cuThomasVBatch, CUDA routines to compute batch of tridiagonal systems on NVIDIA GPUs
US10790828B1 (en) Application specific integrated circuit accelerators
CN103942108B (zh) Hadoop同构集群下的资源参数优化方法
CN106776466A (zh) 一种fpga异构加速计算装置及系统
CN103455518A (zh) 一种数据处理方法及装置
Lerat et al. Single node deep learning frameworks: Comparative study and CPU/GPU performance analysis
Mandal et al. Architecture of efficient word processing using Hadoop MapReduce for big data applications
CN109359542A (zh) 基于神经网络的车辆损伤级别的确定方法及终端设备
CN107038244A (zh) 一种数据挖掘方法和装置、一种可读介质和存储控制器
CN110276064A (zh) 一种词性标注方法及装置
CN109947861A (zh) 用于数据仓库生成目标表的方法、装置和计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant