CN116383248A - 一种数据查询任务加速方法、装置、设备及存储介质 - Google Patents

一种数据查询任务加速方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116383248A
CN116383248A CN202310494709.0A CN202310494709A CN116383248A CN 116383248 A CN116383248 A CN 116383248A CN 202310494709 A CN202310494709 A CN 202310494709A CN 116383248 A CN116383248 A CN 116383248A
Authority
CN
China
Prior art keywords
acceleration
fpga
card
target
query task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310494709.0A
Other languages
English (en)
Inventor
王帅
张晖
姜凯
赵鑫鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Database Technology Co Ltd
Original Assignee
Shandong Inspur Science Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Science Research Institute Co Ltd filed Critical Shandong Inspur Science Research Institute Co Ltd
Priority to CN202310494709.0A priority Critical patent/CN116383248A/zh
Publication of CN116383248A publication Critical patent/CN116383248A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据查询任务加速方法、装置、设备及存储介质,涉及数据库异构加速领域,应用于分布式数据库中的任一主机,包括:获取当前查询任务,并查询本地FPGA加速卡以及其他主机的FPGA加速卡的当前等待时间开销;基于本地的预设查询任务时间开销表确定出当前查询任务的加速时间开销;根据当前等待时间开销以及加速时间开销计算出总时间开销最小的目标FPGA加速卡;判断目标FPGA加速卡是否为本地FPGA加速卡,若是则通过本地FPGA加速卡执行当前查询任务对应的目标加速指令,若否则将目标加速指令发送至目标FPGA加速卡对应的目标主机,以执行目标加速指令。这样一来,本申请可以提高查询任务整体的加速效率。

Description

一种数据查询任务加速方法、装置、设备及存储介质
技术领域
本发明涉及数据库异构加速领域,特别涉及一种数据查询任务加速方法、装置、设备及存储介质。
背景技术
在数据库异构加速计算领域,FPGA作为异构加速计算卡,具备流水计算的优势,以及电路固定的特性。FPGA在执行特定算子的加速计算时,可根据数据量和控制执行,预估当前操作的执行时间。
对于分布式数据库,单个查询操作的加速,时间开销包括数据传输开销和数据执行开销,以及FPGA加速卡上的算子重构开销。若是仅依据加速卡的空闲状态进行任务调度,会造成资源浪费以及加速效果差的问题。由此,如何根据FPGA加速卡的状态对查询任务进行加速以及如何提高任务加速的效果是本领域要解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种数据查询任务加速方法、装置、设备及存储介质,能够根据加速卡的工作状态进行加速任务的分配。其具体方案如下:
第一方面,本申请提供了一种数据查询任务加速方法,应用于分布式数据库中的任一主机,包括:
获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销;
基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销;
根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡;
判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
可选的,所述查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销,包括:
分别统计不同FPGA加速卡中所有未执行加速操作的任务对应的第一时间开销,并统计不同的所述FPGA加速卡中正在执行的加速操作的任务剩余的第二时间开销;
根据所述第一时间开销和所述第二时间开销计算出当前等待时间开销。
可选的,所述基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销之前,还包括:
生成包含若干种数据量的测试数据;
统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销;
统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销;
根据所述第一时间开销和所述第二时间开销生成本地的所述预设查询任务时间开销表,以便基于所述预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销。
可选的,所述统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销,包括:
基于所述测试数据生成针对不同FPGA加速卡的数据过滤加速指令;
统计不同的所述FPGA加速卡执行所述数据过滤加速指令所需的第一时间开销。
可选的,所述统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销,包括:
基于所述测试数据生成针对不同FPGA加速卡的数据排序加速指令;
统计不同的所述FPGA加速卡执行所述数据排序加速指令所需的第二时间开销。
可选的,所述基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销,包括:
根据所述当前查询任务确定出相应的若干个查询子操作;
基于本地的所述预设查询任务时间开销表确定出与若干个所述查询子操作对应的在各个FPGA加速卡上完成加速的加速时间开销。
可选的,所述向所述根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡,包括:
分别计算单个所述FPGA加速卡对应的所述当前等待时间开销与所述查询子操作对应的在该FPGA加速卡上完成加速所需所述加速时间开销的和,以得到所述查询子操作在不同的所述FPGA加速卡上完成加速所需的若干个所述总时间开销;
在若干个所述总时间开销中筛选出最小时间开销值,并将所述最小时间开销值对应的FPGA加速卡确定为与所述查询子操作对应的目标FPGA加速卡。
第二方面,本申请提供了一种数据查询任务加速装置,应用于分布式数据库中的任一主机,包括:
等待时间查询模块,用于获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销;
加速时间确定模块,用于基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销;
目标加速卡确定模块,用于根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡;
指令发送模块,用于判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如上述的数据查询任务加速方法。
第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的数据查询任务加速方法。
由此可见,本申请中先获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销;然后基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销;再根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡;然后判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。这样一来,本申请可以根据FPGA加速卡的工作状态,对需要进行加速的查询操作进行调度;可以避免加速资源的浪费,提高了对查询任务整体的加速效果。根据预设查询任务时间开销表确定出利用FPGA加速卡完成某个查询任务的加速所需的时间开销,获取各个FPGA加速卡的当前等待时间开销,根据这些时间开销可以估算出总时间开销最小的目标FPGA加速卡,然后将与当前查询任务对应的目标加速指令发送至相应主机的目标FPGA加速卡中,以完成对当前查询任务的加速过程;通过本地的预设查询任务时间开销表可以预估当前接收到的查询任务在不同主机的FPGA加速卡上进行加速操作的时间开销,可以便于后续根据各个FPGA加速卡的当前等待时间开销估算出目标FPGA加速卡。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种数据查询任务加速方法流程图;
图2为本申请公开的一种分布式数据库中主机之间结构示意图;
图3为本申请公开的一种具体的数据查询任务加速方法流程图;
图4为本申请公开的一种数据查询任务加速装置结构示意图;
图5为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在数据库异构加速计算领域,大多仅依据加速卡的空闲状态进行相应查询任务的加速调度,这样会产生一定的资源浪费,加速卡处于空闲状态就相当于没有完全利用相应的加速资源,以这样的方式进行任务加速,能够同时处理的任务是有一定上限的,若所有加速卡都处于工作状态,就会延迟加速卡的任务分配,这样的加速效率是很低的,容易在主机的查询任务分配过程中出现数据过载的情况。由此,本申请针对各个FPGA加速卡预先配备了查询任务时间开销表,用于记录FPGA加速卡对不同查询任务的加速时间开销。同时,在获取到需要进行加速的查询任务时,获取各个FPGA加速卡的当前等待时间开销,也即各个FPGA加速卡完成当前排队查询任务所需的总时间开销;这样可以根据当前等待时间开销以及加速时间开销确定出与当前查询任务对应的时间开销最小的目标FPGA加速卡,这样可以将原本在主机的查询任务分配过程中可能会出现的任务数量压力分散到各个FPGA加速卡的等待队列中,可以尽量避免出现FPGA加速卡出现空闲的情况,这样可以避免资源浪费,提高了整体的加速效率。
参见图1所示,本发明实施例公开了一种数据查询任务加速方法,应用于分布式数据库中的任一主机,包括:
步骤S11、获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销。
本申请中,可以理解的是,分布式数据库中而可以有若干个节点;节点之间通过交换机进行交互,各个节点中有不同的主机或加速卡,如图2所示,每个主机上有着若干个FPGA加速卡。本申请实施例中,当主机接收到需要进行加速的查询任务时,查询本地挂载的FPGA加速卡以及其他主机上挂载的FPGA加速卡的当前等待时间,需要指出的是,该当前等待时间为一个FPGA加速卡正在加速的任务以及等待队列中所有需要加速的查询任务全部都完成加速所需的总时间。进一步的,针对具体的查询任务,可以配置一个预估时间寄存器,用来记录该任务完成加速所需的时间,这样可以通过查询任务对应的预估时间寄存器来统计上述当前等待时间时。
进一步的,在一种具体的实施例中,所述查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销,包括:分别统计不同FPGA加速卡中所有未执行加速操作的任务对应的第一时间开销,并统计不同的所述FPGA加速卡中正在执行的加速操作的任务剩余的第二时间开销;根据所述第一时间开销和所述第二时间开销计算出当前等待时间开销。具体的,可以分别统计FPGA加速卡中未执行加速操作的所有任务对应的完成加速的第一时间开销,并且统计FPGA加速卡中正在执行加速操作的任务剩余的加速时间,即第二时间开销;然后根据第一时间开销以及第二时间开销可以计算出一个FPGA加速卡完成目前所有任务所需的总时间开销,即为该FPGA加速卡的当前等待时间开销,可以理解的是,FPGA加速卡对应的当前等待时间为加速前述当前查询任务的等待时间。
步骤S12、基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销。
本申请中,为统计不同查询操作,在不同数据量和表长度条件下的总时间开销,需要生成一批测试数据,进行数据测试,以统计出不同数据长度下的总时间开销,以及单位数据长度下的平均时间开销。需要指出的是,所述基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销之前,还可以包括:生成包含若干种数据量的测试数据;统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销;统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销;根据所述第一时间开销和所述第二时间开销生成本地的所述预设查询任务时间开销表,以便基于所述预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销。具体的,在分布式数据库单个节点的主机上生成不同数据量的测试数据;对于数据过滤,生成不同数据量的针对不同加速板卡的数据过滤加速指令,具体的实施例中可以包括真值表、数据表的行长度、数据表大小、过滤列等参数。然后根据过滤操作的加速指令,统计过滤加速操作的总时间开销,即第一时间开销。相应的,对于数据排序,生成不同数据量的针对不同加速板卡的数据排序加速指令。然后根据排序操作的加速指令,统计排序加速操作的总时间开销,即第二时间开销。之后可以根据若干个FPGA加速卡对应的加速不同数据量的第一时间开销以及第二时间开销,生成前述的预设查询任务时间开销表。
在具体的实施例中,所述统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销,可以包括:基于所述测试数据生成针对不同FPGA加速卡的数据过滤加速指令;统计不同的所述FPGA加速卡执行所述数据过滤加速指令所需的第一时间开销。相应的,所述统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销,可以包括:基于所述测试数据生成针对不同FPGA加速卡的数据排序加速指令;统计不同的所述FPGA加速卡执行所述数据排序加速指令所需的第二时间开销。具体的,首先根据测试数据生成针对不同FPGA加速卡的数据加速指令,然后统计FPGA加速卡在完成相应加速指令时的时间开销,这样通过测试数据可以得到针对不同FPGA加速卡的前述预设查询任务时间开销表,需要指出的是,不同的主机中有各自的预设查询任务时间开销表,用于估算本主机需要加速的不同数据量的查询任务与任一FPGA加速卡的加速时间开销。
步骤S13、根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡。
本申请实施例中,通过前述步骤得到各个FPGA加速卡对应的当前等待时间,以及通过预设查询任务时间开销表估算得到当前查询任务在各个FPGA加速卡上的加速时间开销之后,可以根据单个FPGA加速卡对应的当前等待时间以及与当前查询任务对应的加速时间开销计算出该FPGA加速卡完成该当前查询任务所需的总时间开销;进一步的,可以筛选出总时间开销最小的一个FPGA加速卡,将该FPGA加速卡确定为目标FPGA加速卡。
步骤S14、判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
本申请中,确定目标FPGA加速卡之后,若该目标FPGA加速卡是本地挂载的,则可以根据当前查询任务生成与目标FPGA加速卡对应的目标加速指令,以利用本地的目标FPGA加速卡完成加速操作;相应的,若该目标FPGA加速卡是在其他主机上挂载的,则可以将与当前查询任务对应的目标加速指令发送至该目标FPGA加速卡挂载的主机上,以便通过相应主机上的目标FPGA加速卡执行目标加速指令。需要指出的是,在发送目标加速指令时,需要进行加速的当前查询任务所对应的数据会与目标加速指令一起被发送至目标FPGA加速卡。
由此可见,本申请可以根据预设查询任务时间开销表确定出利用FPGA加速卡完成某个查询任务的加速操作所需的加速时间开销;通过预先进行数据测试,用不同数据量的测试数据,测试在不同FPGA加速卡上完成加速操作所需的时间开销,得到相应的表;这样在后续获取到新的查询任务时,可以根据数据量利用预设查询任务时间开销表估算出新的查询任务进行加速操作所需的加速时间开销;本申请可以获取各个FPGA加速卡的当前等待时间开销,根据加速时间开销以及等待时间开销可以估算出总时间开销最小的目标FPGA加速卡,然后将与当前查询任务对应的目标加速指令发送至相应主机的目标FPGA加速卡中,以完成对当前查询任务的加速过程;通过本地的预设查询任务时间开销表可以预估当前接收到的查询任务在不同主机的FPGA加速卡上进行加速操作的时间开销,可以便于后续根据各个FPGA加速卡的当前等待时间开销估算出目标FPGA加速卡。
参见图3所示,本发明实施例公开了一种数据查询任务加速方法,应用于分布式数据库中的任一主机,包括:
步骤S21、获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销。
步骤S22、根据所述当前查询任务确定出相应的若干个查询子操作。
本申请中,一个当前查询任务可以分为若干个查询子操作,可以针对每个需要进行加速的独立的查询子操作筛选目标FPGA加速卡。
步骤S23、基于本地的所述预设查询任务时间开销表确定出与若干个所述查询子操作对应的在各个FPGA加速卡上完成加速的加速时间开销。
本申请中,得到与当前查询任务对应的若干个查询子操作之后,可以根据本地的预设查询任务时间开销表确定各个查询子操作在各个FPGA加速卡上完成加速操作的加速时间开销。需要指出的是,针对每个查询子操作都单独进行处理。
步骤S24、分别计算单个所述FPGA加速卡对应的所述当前等待时间开销与所述查询子操作对应的在该FPGA加速卡上完成加速所需所述加速时间开销的和,以得到所述查询子操作在不同的所述FPGA加速卡上完成加速所需的若干个所述总时间开销。
本申请实施例中,根据各个FPGA加速卡的当前等待时间开销以及各个查询子操作在不同FPGA加速卡上完成加速的加速时间开销计算出单个查询子操作在单个FPGA加速卡上完成加速操作的总时间开销。可以理解的是,由于路径或其他因素,同一个查询子操作在不同的FPGA加速卡上完成加速操作的总时间开销是有可能不一样的;不同的查询子操作在同一个FPGA加速卡上完成加速的总时间开销也会有不一样的情况。所以查询子操作要单独进行总时间开销的计算,这样可以尽可能提高整体加速处理的效率。
步骤S25、在若干个所述总时间开销中筛选出最小时间开销值,并将所述最小时间开销值对应的FPGA加速卡确定为与所述查询子操作对应的目标FPGA加速卡。
本申请实施例中,针对单个查询子操作可以进一步筛选出总时间开销最小的一个FPGA加速卡,将该FPGA加速卡确定为与该查询子操作对应的目标FPGA加速卡,以利用目标FPGA加速卡完成该查询子操作的加速过程。
步骤S26、判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
其中,关于上述步骤S21和S26更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本申请中,确定出目标FPGA加速卡之后,可以利用该目标FPGA加速卡完成相应查询任务的加速过程,在具体的实施例中,可以利用与单个查询子操作对应的目标FPGA加速卡完成相应的加速过程。需要指出的是,当目标FPGA加速卡与对应的查询任务不在同一个数据库节点或不在同一个主机时,需要把与查询任务对应的目标加速指令以及与查询任务对应的数据发送至目标FPGA加速卡所在的主机,以通过目标FPGA加速卡执行目标加速指令。
由此可见,本申请可以根据预设查询任务时间开销表确定出利用FPGA加速卡完成某个查询子操作的加速操作所需的加速时间开销,获取各个FPGA加速卡的当前等待时间开销,针对单个查询子操作分别进行处理,根据加速时间开销以及等待时间开销可以估算出加速单个查询子操作的总时间开销最小的目标FPGA加速卡,然后将与当前查询任务对应的目标加速指令发送至相应主机的目标FPGA加速卡中,以完成对当前查询任务的加速过程;通过对查询子操作单独进行处理,可以提高对查询任务整体加速的效率。
如图4所示,本申请实施例公开了一种数据查询任务加速装置,应用于分布式数据库中的任一主机,包括:
等待时间查询模块11,用于获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销;
加速时间确定模块12,用于基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销;
目标加速卡确定模块14,用于根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡;
指令发送模块15,用于判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
由此可见,本申请可以根据FPGA加速卡的工作状态,对需要进行加速的查询操作进行调度;可以避免加速资源的浪费,提高了对查询任务整体的加速效果。根据预设查询任务时间开销表确定出利用FPGA加速卡完成某个查询任务的加速所需的时间开销,获取各个FPGA加速卡的当前等待时间开销,根据这些时间开销可以估算出总时间开销最小的目标FPGA加速卡,然后将与当前查询任务对应的目标加速指令发送至相应主机的目标FPGA加速卡中,以完成对当前查询任务的加速过程;通过本地的预设查询任务时间开销表可以预估当前接收到的查询任务在不同主机的FPGA加速卡上进行加速操作的时间开销,可以便于后续根据各个FPGA加速卡的当前等待时间开销估算出目标FPGA加速卡。
在一种具体的实施例中,所述等待时间查询模块11,可以包括:
第一时间开销统计单元,用于统计不同FPGA加速卡中所有未执行加速操作的任务对应的第一时间开销;
第二时间开销统计单元,用于统计不同的所述FPGA加速卡中正在执行的加速操作的任务剩余的第二时间开销;
等待时间开销计算单元,用于根据所述第一时间开销和所述第二时间开销计算出当前等待时间开销。
在一种具体的实施例中,所述装置,还可以包括:
测试数据生成单元,用于生成包含若干种数据量的测试数据;
过滤时间开销统计子模块,用于统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销;
排序时间开销统计子模块,用于统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销;
开销表生成单元,用于根据所述第一时间开销和所述第二时间开销生成本地的所述预设查询任务时间开销表,以便基于所述预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销。
相应的,在具体的实施例中,所述过滤时间开销统计子模块,可以包括:
过滤加速指令生成单元,用于基于所述测试数据生成针对不同FPGA加速卡的数据过滤加速指令;
过滤时间开销统计单元,用于统计不同的所述FPGA加速卡执行所述数据过滤加速指令所需的第一时间开销。
相应的,在具体的实施例中,所述排序时间开销统计子模块,可以包括:
排序加速指令生成单元,用于基于所述测试数据生成针对不同FPGA加速卡的数据排序加速指令;
排序时间开销统计单元,用于统计不同的所述FPGA加速卡执行所述数据排序加速指令所需的第二时间开销。
在一种具体的实施例中,所述加速时间确定模块12,可以包括:
查询子操作确定单元,用于根据所述当前查询任务确定出相应的若干个查询子操作;
子操作加速时间开销确定单元,用于基于本地的所述预设查询任务时间开销表确定出与若干个所述查询子操作对应的在各个FPGA加速卡上完成加速的加速时间开销。
在一种具体的实施例中,所述目标加速卡确定模块14,可以包括:
总时间开销计算单元,用于分别计算单个所述FPGA加速卡对应的所述当前等待时间开销与所述查询子操作对应的在该FPGA加速卡上完成加速所需所述加速时间开销的和,以得到所述查询子操作在不同的所述FPGA加速卡上完成加速所需的若干个所述总时间开销;
目标加速卡确定单元,用于在若干个所述总时间开销中筛选出最小时间开销值,并将所述最小时间开销值对应的FPGA加速卡确定为与所述查询子操作对应的目标FPGA加速卡。
进一步的,本申请实施例还公开了一种电子设备,图5是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的数据查询任务加速方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的数据查询任务加速方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的数据查询任务加速方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据查询任务加速方法,其特征在于,应用于分布式数据库中的任一主机,包括:
获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销;
基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销;
根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡;
判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
2.根据权利要求1所述的数据查询任务加速方法,其特征在于,所述查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销,包括:
分别统计不同FPGA加速卡中所有未执行加速操作的任务对应的第一时间开销,并统计不同的所述FPGA加速卡中正在执行的加速操作的任务剩余的第二时间开销;
根据所述第一时间开销和所述第二时间开销计算出当前等待时间开销。
3.根据权利要求1所述的数据查询任务加速方法,其特征在于,所述基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销之前,还包括:
生成包含若干种数据量的测试数据;
统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销;
统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销;
根据所述第一时间开销和所述第二时间开销生成本地的所述预设查询任务时间开销表,以便基于所述预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销。
4.根据权利要求3所述的数据查询任务加速方法,其特征在于,所述统计所有主机中的FPGA加速卡针对所述测试数据进行过滤操作时所需的第一时间开销,包括:
基于所述测试数据生成针对不同FPGA加速卡的数据过滤加速指令;
统计不同的所述FPGA加速卡执行所述数据过滤加速指令所需的第一时间开销。
5.根据权利要求3所述的数据查询任务加速方法,其特征在于,所述统计所有主机中的FPGA加速卡针对所述测试数据进行排序操作时所需的第二时间开销,包括:
基于所述测试数据生成针对不同FPGA加速卡的数据排序加速指令;
统计不同的所述FPGA加速卡执行所述数据排序加速指令所需的第二时间开销。
6.根据权利要求1至5任一项所述的数据查询任务加速方法,其特征在于,所述基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销,包括:
根据所述当前查询任务确定出相应的若干个查询子操作;
基于本地的所述预设查询任务时间开销表确定出与若干个所述查询子操作对应的在各个FPGA加速卡上完成加速的加速时间开销。
7.根据权利要求6所述的数据查询任务加速方法,其特征在于,所述向所述根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡,包括:
分别计算单个所述FPGA加速卡对应的所述当前等待时间开销与所述查询子操作对应的在该FPGA加速卡上完成加速所需所述加速时间开销的和,以得到所述查询子操作在不同的所述FPGA加速卡上完成加速所需的若干个所述总时间开销;
在若干个所述总时间开销中筛选出最小时间开销值,并将所述最小时间开销值对应的FPGA加速卡确定为与所述查询子操作对应的目标FPGA加速卡。
8.一种数据查询任务加速装置,其特征在于,应用于分布式数据库中的任一主机,包括:
等待时间查询模块,用于获取当前查询任务,并查询本地挂载的FPGA加速卡以及其他主机挂载的FPGA加速卡的当前等待时间开销;
加速时间确定模块,用于基于本地的预设查询任务时间开销表确定出所述当前查询任务在各个FPGA加速卡上完成加速的加速时间开销;
目标加速卡确定模块,用于根据各个所述FPGA加速卡对应的所述当前等待时间开销以及所述加速时间开销计算出总时间开销最小的目标FPGA加速卡;
指令发送模块,用于判断所述目标FPGA加速卡是否为本地挂载的FPGA加速卡,若是则通过本地挂载的FPGA加速卡执行所述当前查询任务对应的目标加速指令,若否则将所述目标加速指令发送至所述目标FPGA加速卡对应的目标主机,以便通过所述目标主机中的所述目标FPGA加速卡执行所述目标加速指令。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的数据查询任务加速方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据查询任务加速方法。
CN202310494709.0A 2023-04-28 2023-04-28 一种数据查询任务加速方法、装置、设备及存储介质 Pending CN116383248A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310494709.0A CN116383248A (zh) 2023-04-28 2023-04-28 一种数据查询任务加速方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310494709.0A CN116383248A (zh) 2023-04-28 2023-04-28 一种数据查询任务加速方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116383248A true CN116383248A (zh) 2023-07-04

Family

ID=86980807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310494709.0A Pending CN116383248A (zh) 2023-04-28 2023-04-28 一种数据查询任务加速方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116383248A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116991594A (zh) * 2023-09-26 2023-11-03 苏州元脑智能科技有限公司 一种负载均衡器创建方法、装置、设备及存储介质
CN117971906A (zh) * 2024-04-02 2024-05-03 山东浪潮科学研究院有限公司 一种多卡协同数据库查询方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116991594A (zh) * 2023-09-26 2023-11-03 苏州元脑智能科技有限公司 一种负载均衡器创建方法、装置、设备及存储介质
CN116991594B (zh) * 2023-09-26 2024-02-09 苏州元脑智能科技有限公司 一种负载均衡器创建方法、装置、设备及存储介质
CN117971906A (zh) * 2024-04-02 2024-05-03 山东浪潮科学研究院有限公司 一种多卡协同数据库查询方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN116383248A (zh) 一种数据查询任务加速方法、装置、设备及存储介质
US7631034B1 (en) Optimizing node selection when handling client requests for a distributed file system (DFS) based on a dynamically determined performance index
CN109246229B (zh) 一种分发资源获取请求的方法和装置
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
US8387059B2 (en) Black-box performance control for high-volume throughput-centric systems
CN109981744B (zh) 数据的分发方法、装置、存储介质及电子设备
CN111625331B (zh) 任务调度方法、装置、平台、服务器及存储介质
CN111045911B (zh) 性能测试方法、性能测试装置、存储介质与电子设备
CN113157422A (zh) 基于深度强化学习的云数据中心集群资源调度方法及装置
CN111858055B (zh) 任务处理方法、服务器及存储介质
CN107430526B (zh) 用于调度数据处理的方法和节点
US20200004757A1 (en) Database management apparatus and query dividing method
CN109343972A (zh) 任务处理方法及终端设备
CN110472109A (zh) 动态化数据质量分析方法及平台系统
CN111158904A (zh) 一种任务调度方法、装置、服务器及介质
CN106686619B (zh) 一种性能评估方法和设备
CN116842090A (zh) 一种对账系统、方法、设备及存储介质
CN113360353A (zh) 一种测试服务器和云平台
EP3429261B1 (en) Non-blocking request processing method and device
CN109189581A (zh) 一种作业调度方法和装置
CN111258729B (zh) 基于Redis的任务分配方法、装置、计算机设备及存储介质
CN115344370A (zh) 任务调度方法、装置、设备及存储介质
US8881155B2 (en) Apportioning summarized metrics based on unsummarized metrics in a computing system
CN111782688A (zh) 基于大数据分析的请求处理方法、装置、设备及存储介质
CN115061794A (zh) 调度任务及训练神经网络模型的方法、装置、终端和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230913

Address after: Office Area, 5th Floor, S02 Building, No. 1036 Langchao Road, High tech Zone, Jinan City, Shandong Province, 250000

Applicant after: Shandong Inspur Database Technology Co.,Ltd.

Address before: 250000 building S02, No. 1036, Gaoxin Inspur Road, Jinan, Shandong

Applicant before: Shandong Inspur Scientific Research Institute Co.,Ltd.

TA01 Transfer of patent application right