CN115098074A

CN115098074A - 接口创建方法、装置、设备、存储介质及计算机程序产品

Info

Publication number: CN115098074A
Application number: CN202210734939.5A
Authority: CN
Inventors: 潘能超
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-06-27
Filing date: 2022-06-27
Publication date: 2022-09-23

Abstract

本公开提供了一种接口创建方法、装置、设备、存储介质及计算机程序产品，涉及机器学习、前向计算、聚类处理、加速计算等人工智能技术领域。该方法包括：确定预设统计周期内接收到的各请求的实际长度和实际并发数；对各请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；对各请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；创建长度参数为任一目标长度、并发数参数为任一目标并发数的多个目标接口，目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。应用该方法可以使得创建出的多个目标接口更加符合实际需求，提升所创建目标接口的使用率、进一步提升前向计算的效率。

Description

接口创建方法、装置、设备、存储介质及计算机程序产品

技术领域

本公开涉及计算机技术领域，具体涉及机器学习、前向计算、聚类处理、加速计算等人工智能技术领域，尤其涉及一种接口创建方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术

Cuda_graph是英伟达所提供的一种接口，可以用来记录神经网络模型前向计算时kernel(核心)的计算顺序和参数指针。

相比常见的通过CPU(Central Processing Unit，中央处理器)持续向GPU(Graphics Processing Unit，图形处理器)发出指令的处理方式，使用Cuda_graph进行前传可以避免kernel启动的耗时，进而有效提高处理效率。

因此，如何在神经网络模型的前向计算阶段，使用更合适的Cuda_graph来提升处理效率，是本领域技术人员亟待解决的问题。

发明内容

本公开实施例提出了一种接口创建方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

第一方面，本公开实施例提出了一种接口创建方法，包括：确定预设统计周期内接收到的各请求的实际长度和实际并发数；对各请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；对各请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；创建长度参数为任一目标长度、并发数参数为任一目标并发数的多个目标接口；其中，目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。

第二方面，本公开实施例提出了一种接口创建装置，包括：实际参数确定单元，被配置成确定预设统计周期内接收到的各请求的实际长度和实际并发数；目标长度确定单元，被配置成对各请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；目标并发数确定单元，被配置成对各请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；目标接口创建单元，被配置成创建长度参数为任一目标长度、并发数参数为任一目标并发数的多个目标接口；其中，目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。

第三方面，本公开实施例提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的接口创建方法。

第四方面，本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的接口创建方法。

第五方面，本公开实施例提供了一种包括计算机程序的计算机程序产品，该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的接口创建方法的步骤。

本公开所提供的接口创建方案，通过对统计周期内接收到的各请求的长度和并发数进行聚类操作，从而根据聚类结果确定出科学、合理的多个目标长度和多个目标并发数，继而使得基于此创建出的多个目标接口更加符合实际需求，而不是盲目创建，进而提升所创建目标接口的使用率、进一步提升神经网络模型前向计算阶段的处理效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1是本公开可以应用于其中的示例性系统架构；

图2为本公开实施例提供的一种接口创建方法的流程图；

图3为本公开实施例提供的另一种接口创建方法的流程图；

图4为本公开实施例提供的一种去除偶发性长请求的方法的流程图；

图5为本公开实施例提供的一种利用目标接口处理新请求的方法的流程图；

图6为本公开实施例提供的一种接口创建装置的结构框图；

图7为本公开实施例提供的一种适用于执行接口创建方法的电子设备的结构示意图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

图1示出了可以应用本公开的接口创建方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用，例如接口创建类应用、模型训练类应用、即时通讯类应用等。

终端设备101、102、103和服务器105可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等；当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中，其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块，在此不做具体限定。当服务器105为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器；服务器为软件时，可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块，在此不做具体限定。

服务器105通过内置的各种应用可以提供各种服务，以可以提供模型加速训练服务的接口创建类应用为例，服务器105在运行该接口创建类应用时可实现如下效果：首先，通过网络104接收终端设备101、102、103传入的各种请求；然后，确定预设统计周期内接收到的各请求的实际长度和实际并发数；接着，对各所述请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；下一步，对各所述请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；最后，创建长度参数为任一所述目标长度、并发数参数为任一所述目标并发数的多个目标接口，该目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。

进一步的，服务器105也可以根据创建得到的多个目标接口用于对神经网络模型的前向计算阶段进行加速。

由于聚类操作需要占用较多的运算资源和较强的运算能力，因此本公开后续各实施例所提供的接口创建方法一般由拥有较强运算能力、较多运算资源的服务器105来执行，相应地，接口创建装置一般也设置于服务器105中。但同时也需要指出的是，在终端设备101、102、103也具有满足要求的运算能力和运算资源时，终端设备101、102、103也可以通过其上安装的接口创建类应用完成上述本交由服务器105做的各项运算，进而输出与服务器105同样的结果。尤其是在同时存在多种具有不同运算能力的终端设备的情况下，但接口创建类应用判断所在的终端设备拥有较强的运算能力和剩余较多的运算资源时，可以让终端设备来执行上述运算，从而适当减轻服务器105的运算压力，相应的，接口创建装置也可以设置于终端设备101、102、103中。在此种情况下，示例性系统架构100也可以不包括服务器105和网络104。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

请参考图2，图2为本公开实施例提供的一种接口创建方法的流程图，其中流程200包括以下步骤：

步骤201：确定预设统计周期内接收到的各请求的实际长度和实际并发数；

本步骤旨在由接口创建方法的执行主体(例如图1所示的服务器105)根据在预设统计周期内接收到的各请求，确定这些请求的实际长度和实际并发数。

其中，预设统计周期可以根据实际应用场景的实际情况灵活设定，例如1小时、6小时、1天甚至1周，以期通过设置合理的预设统计周期来收集到具有足够代表性的各请求，从而根据其长度参数和并发数参数进行后续处理。

其中，接收到的请求是神经网络模型在前向计算阶段所接收到的请求，进而表征神经网络模型在前向计算阶段的请求特征。

步骤202：对各请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；

在步骤201的基础上，本步骤旨在由上述执行主体对各请求的实际长度进行聚类处理，得到多个长度聚类中心，并进一步的确定可代表每个长度聚类中心下所包含多个实际长度的目标长度。其中，该目标长度可以为该聚类中心下所包含多个实际长度的平均数、中位数、众数、最大值等，或平均数、中位数、众数、最大值与某个修正系数的四则运算结果等，只要能够具有足够的代表性即可，而在不同应用场景下对代表性的要求不尽相同，可根据实际要求自行设定，例如在要求代表性应该覆盖该聚类中心下所有长度的情况下，可以选择最大值作为目标长度。

步骤203：对各请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；

在步骤201的基础上，本步骤旨在由上述执行主体对各请求的实际并发数进行聚类处理，得到多个并发数聚类中心，并进一步的确定可代表每个并发数聚类中心下所包含多个实际并发数的目标并发数。其中，该目标并发数可以为该聚类中心下所包含多个实际并发数的平均数、中位数、众数、最大值等，或平均数、中位数、众数、最大值与某个修正系数的四则运算结果等，只要能够具有足够的代表性即可，而在不同应用场景下对代表性的要求不尽相同，可根据实际要求自行设定。例如在要求代表性应该覆盖该聚类中心下所有并发数的情况下，可以选择最大值作为目标并发数。

另外，步骤202和步骤203属于两个并列的执行步骤，两者之间并不存在先后、因果或依赖关系，完全可以同时、分别执行，流程200所呈现的步骤顺序只是一个示意图。

步骤204：创建长度参数为任一目标长度、并发数参数为任一目标并发数的多个目标接口。

在步骤202和步骤203的基础上，本步骤旨在由上述执行主体根据各目标长度和各目标并发数来创建多个目标接口，即每个目标接口应当具有不同的长度参数和并发数参数，因此每个目标接口的长度参数应当为任一目标长度、并发数参数为任一目标并发数，即目标接口的最大数量即为目标长度数量与目标并发数数量的乘积。

由于请求为神经网络模型在前向计算阶段所接收到的请求，本公开所基于请求的长度聚类结果和并发数聚类结果创建出的多个目标接口，就是用于记录神经网络模型前向计算时核心的计算顺序和参数指针的Cuda_graph接口。

相比常见的通过CPU持续向GPU发出指令的前向计算处理方式，使用Cuda_graph进行神经网络模型的前向计算可以避免kernel启动的耗时，进而有效提高处理效率。

本公开实施例提供的接口创建方法，通过对统计周期内接收到的各请求的长度和并发数进行聚类操作，从而根据聚类结果确定出科学、合理的多个目标长度和多个目标并发数，继而使得基于此创建出的多个目标接口更加符合实际需求，而不是盲目创建，进而提升所创建目标接口的使用率、进一步提升神经网络模型前向计算阶段的处理效率。

请参考图3，图3为本公开实施例提供的另一种接口创建方法的流程图，其中流程300包括以下步骤：

步骤301：确定预设统计周期内接收到的各请求的实际长度和实际并发数；

步骤301与如图2所示的步骤201一致，相同部分内容请参见上一实施例的相应部分，此处不再进行赘述。

步骤302：根据预设的第一聚类中心数，对各请求的实际长度进行聚类处理，得到数量为第一聚类中心数的多个长度聚类中心；

步骤303：将每个长度聚类中心下的最大实际长度，确定为相应的长度聚类中心的目标长度；

针对流程200中的步骤202，本实施例通过步骤302-步骤303提供了一种更加具体的实现方案，即预先给定该第一聚类中心数，以使聚类算法在给定的第一聚类中心数的情况下，最终对各请求的实际长度进行聚类的结果为数量为第一聚类中心数的长度聚类中心。而考虑到每个长度聚类中心的目标长度最终是用于指导创建Cuda_graph接口，而拥有不同目标长度作为长度参数的Cuda_graph接口则用于处理后续哪些长度的请求是自身可以处理的，因此本实施例将每个长度聚类中心下的最大实际长度，确定为相应的长度聚类中心的目标长度，从而保证后续创建出的Cuda_graph接口正常发挥作用。

具体的，进行的聚类处理可以通过K-means聚类算法来实现，也可以换用其它可以实现相同效果的其它聚类算法，此处不做具体限定。

步骤304：根据预设的第二聚类中心数，对各请求的实际并发数进行聚类处理，得到数量为第二聚类中心数的多个并发数聚类中心；

步骤305：将每个并发数聚类中心下的最大实际并发数，确定为相应的并发数聚类中心的目标并发数；

针对流程200中的步骤203，本实施例通过步骤304-步骤305提供了一种更加具体的实现方案，即预先给定该第二聚类中心数，以使聚类算法在给定的第二聚类中心数的情况下，最终对各请求的实际并发数进行聚类的结果为数量为第二聚类中心数的聚类中心。而考虑到每个并发数聚类中心的目标并发数最终是用于指导创建Cuda_graph接口，而拥有不同目标并发数作为并发数参数的Cuda_graph接口则用于处理后续哪些并发数的请求是自身可以处理的，因此本实施例将每个并发数聚类中心下的最大实际并发数，确定为相应的并发数聚类中心的目标并发数，从而保证后续创建出的Cuda_graph接口正常发挥作用。

其中，第一聚类中心数和第二聚类中心数的具体大小可根据历史经验或对历史请求的特征分析得到，以尽可能的匹配实际情况。

步骤306：确定任一目标长度与任一目标并发数形成的所有参数组合；

步骤307：为每种参数组合生成一个相应的目标接口。

针对流程200中的步骤204，本实施例通过步骤306-步骤307提供了一种更加具体的实现方案，即首先确定任一目标长度与任一目标并发数形成的所有参数组合，即每一种目标长度都可以每一种目标并发数形成不重复的参数组合，且所有参数组合的数量为目标长度数量与目标并发数数量的乘积，即假定存在4个不同的目标长度、8个不同的目标并发数，则参数组合的数量最多可以有4×8＝32个，即本实施例将通过为每种参数组合均生成一个相应的接口，以覆盖至所有的参数组合，而不出现遗漏。

区别于流程200所示实施例，本实施例通过步骤302-步骤303提供了一种基于聚类算法确定出多个目标长度的更具体的实现方式，并结合实际用途将每个长度聚类中心下最大实际长度选作为相应的目标长度；通过步骤304-步骤305提供了一种基于算法确定出多个目标并发数的更具体的实现方式，同样结合实际用途将每个并发数聚类中心下最大实际并发数选作为相应的目标并发数；通过步骤306-步骤307提供了一种覆盖所有长度参数和并发数参数的参数组合的目标接口创建方式，以避免遗漏所有可能的参数组合。

另外，需要说明的是，步骤302-步骤303提供的下位实现方式、步骤304-步骤305提供的下位实现方案以及步骤306-步骤307提供的下位实现方案之间，并不存在因果或依赖关系，完全可以在流程200的基础上，单独替换相应的上位方案来得到多个不同的独立实施例，本实施例仅作为同时包含对三个上位方案均提供了相应下位方案的优选实施例存在。

在上述任意实施例的基础上，还可以在进行聚类处理(即按长度和按并发数进行聚类)之前，去除预设统计周期内接收到的偶发性长请求，以避免偶发性长请求影响后续的聚类结果的准确性。其中，偶发性长请求为拥有远大于其它请求的实际长度的、数量较少的请求。

一种包括且不限于的实现方式可请参见如图4所示的流程400，包括如下步骤：

步骤401：对预设统计周期内接收到的各请求按实际长度进行从大到小的排序，得到排序结果；

步骤402：去除排序结果中长度排名位于前预设比例的请求。

即步骤401-步骤402给出了一种去除长度排序结果中排名靠前的一些较长的请求，通常情况下，该预设比例可以设置为20％。

另外，除了去除长度排序结果中排名靠前的一些长请求，还可以通过对长度排序结果中相邻请求的长度差异，来确定是否存在异常大的长度差异变化，并将出现异常大长度差异的部分长请求作为偶发性长请求去除掉。

在上述任意实施例的基础上，就如何使用创建好的多个目标接口来具体加速神经网络模型的前向计算过程，本实施例还通过图5所示的流程图提供了一种具体的实现方式，其流程500包括如下步骤：

步骤501：利用各目标接口处理最大长度不超过自身处理能力的新请求；

针对后续到来的新请求，若该新请求的长度没有超过各目标接口的目标长度，就看当前累积的所有新请求的数量N和所有新请求的最大长度L，根据N和L去选择具有合适处理能力(即具有超过N的并发数参数和超过L的长度参数)的目标接口。

如果N大于目标接口的目标并发数，那当前就只计算目标并发数个，剩下的新请求就继续存在在请求池里，算完当前的目标并发数个之后，再通过重复上述步骤的方式继续计算，直至计算完请求池中的所有的新请求。

步骤502：对所有目标接口均无法处理的目标请求，转交由中央处理器进行处理。

针对所有目标接口均无法处理的目标请求(即超长请求)，考虑到这些目标请求的数量相对较少，单独为其创建合适的目标接口的代价较高，因此直接将其转交由中央处理器按照最常规的处理方式进行处理，即不再尝试使用Cuda_graph接口来加速处理过程。

进一步参考图6，作为对上述各图所示方法的实现，本公开提供了一种接口创建装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例的接口创建装置600可以包括：实际参数确定单元601、目标长度确定单元602、目标并发数确定单元603、目标接口创建单元604。其中，实际参数确定单元601，被配置成确定预设统计周期内接收到的各请求的实际长度和实际并发数；目标长度确定单元602，被配置成对各请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；目标并发数确定单元603，被配置成对各请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；目标接口创建单元604，被配置成创建长度参数为任一目标长度、并发数参数为任一目标并发数的多个目标接口；其中，目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。

在本实施例中，接口创建装置600中：实际参数确定单元601、目标长度确定单元602、目标并发数确定单元603、目标接口创建单元604的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，目标长度确定单元602可以被进一步配置成：

根据预设的第一聚类中心数，对各请求的实际长度进行聚类处理，得到数量为第一聚类中心数的多个长度聚类中心；

将每个长度聚类中心下的最大实际长度，确定为相应的长度聚类中心的目标长度。

在本实施例的一些可选的实现方式中，目标并发数确定单元603可以被进一步配置成：

根据预设的第二聚类中心数，对各请求的实际并发数进行聚类处理，得到数量为第二聚类中心数的多个并发数聚类中心；

将每个并发数聚类中心下的最大实际并发数，确定为相应的并发数聚类中心的目标并发数。

在本实施例的一些可选的实现方式中，目标接口创建单元601可以被进一步配置成：

确定任一目标长度与任一目标并发数形成的所有参数组合；

为每种参数组合生成一个相应的目标接口。

在本实施例的一些可选的实现方式中，接口创建装置600中还可以包括：

偶发性长请求去除单元，被配置成在进行聚类处理之前，去除预设统计周期内接收到的偶发性长请求；其中，偶发性长请求为拥有远大于其它请求的实际长度的、数量较少的请求。

在本实施例的一些可选的实现方式中，偶发性长请求去除单元可以被进一步配置成：

对预设统计周期内接收到的各请求按实际长度进行从大到小的排序，得到排序结果；

去除排序结果中长度排名位于前预设比例的请求。

新请求处理单元，被配置成利用各目标接口处理最大长度不超过自身处理能力的新请求；

目标请求处理单元，被配置成对所有目标接口均无法处理的目标请求，转交由中央处理器进行处理。

本实施例作为对应于上述方法实施例的装置实施例存在，本实施例提供的接口创建装置，通过对统计周期内接收到的各请求的长度和并发数进行聚类操作，从而根据聚类结果确定出科学、合理的多个目标长度和多个目标并发数，继而使得基于此创建出的多个目标接口更加符合实际需求，而不是盲目创建，进而提升所创建目标接口的使用率、进一步提升神经网络模型前向计算阶段的处理效率。

根据本公开的实施例，本公开还提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现上述任意实施例所描述的接口创建方法。

根据本公开的实施例，本公开还提供了一种可读存储介质，该可读存储介质存储有计算机指令，该计算机指令用于使计算机执行时能够实现上述任意实施例所描述的接口创建方法。

根据本公开的实施例，本公开还提供了一种计算机程序产品，该计算机程序在被处理器执行时能够实现上述任意实施例所描述的接口创建方法。

图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如接口创建方法。例如，在一些实施例中，接口创建方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的接口创建方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行接口创建方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物理主机与虚拟专用服务器(VPS，Virtual Private Server)服务中存在的管理难度大，业务扩展性弱的缺陷。

根据本公开实施例的技术方案，通过对统计周期内接收到的各请求的长度和并发数进行聚类操作，从而根据聚类结果确定出科学、合理的多个目标长度和多个目标并发数，继而使得基于此创建出的多个目标接口更加符合实际需求，而不是盲目创建，进而提升所创建目标接口的使用率、进一步提升神经网络模型前向计算阶段的处理效率。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种接口创建方法，包括：

确定预设统计周期内接收到的各请求的实际长度和实际并发数；

对各所述请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；

对各所述请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；

创建长度参数为任一所述目标长度、并发数参数为任一所述目标并发数的多个目标接口；其中，所述目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。

2.根据权利要求1所述的方法，其中，所述对各所述请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度，包括：

根据预设的第一聚类中心数，对各所述请求的实际长度进行聚类处理，得到数量为所述第一聚类中心数的多个长度聚类中心；

将每个所述长度聚类中心下的最大实际长度，确定为相应的长度聚类中心的目标长度。

3.根据权利要求1所述的方法，其中，所述对各所述请求的实际并发数进行聚类，并确定与每个并发数聚类中心对应的目标并发数，包括：

根据预设的第二聚类中心数，对各所述请求的实际并发数进行聚类处理，得到数量为所述第二聚类中心数的多个并发数聚类中心；

将每个所述并发数聚类中心下的最大实际并发数，确定为相应的并发数聚类中心的目标并发数。

4.根据权利要求1所述的方法，其中，所述创建长度参数为任一所述目标长度、并发数参数为任一所述目标并发数的多个目标接口，包括：

确定任一所述目标长度与任一所述目标并发数形成的所有参数组合；

为每种所述参数组合生成一个相应的目标接口。

5.根据权利要求1所述的方法，还包括：

在进行所述聚类处理之前，去除所述预设统计周期内接收到的偶发性长请求；其中，所述偶发性长请求为拥有远大于其它请求的实际长度的、数量较少的请求。

6.根据权利要求5所述的方法，其中，所述去除所述预设统计周期内接收到的偶发性长请求，包括：

对所述预设统计周期内接收到的各请求按所述实际长度进行从大小到小的排序，得到排序结果；

去除所述排序结果中长度排名位于前预设比例的请求。

7.根据权利要求1-6任一项所述的方法，还包括：

利用各所述目标接口处理最大长度不超过自身处理能力的新请求；

对所有所述目标接口均无法处理的目标请求，转交由中央处理器进行处理。

8.一种接口创建装置，包括：

实际参数确定单元，被配置成确定预设统计周期内接收到的各请求的实际长度和实际并发数；

目标长度确定单元，被配置成对各所述请求的实际长度进行聚类处理，并确定与每个长度聚类中心对应的目标长度；

目标并发数确定单元，被配置成对各所述请求的实际并发数进行聚类处理，并确定与每个并发数聚类中心对应的目标并发数；

目标接口创建单元，被配置成创建长度参数为任一所述目标长度、并发数参数为任一所述目标并发数的多个目标接口；其中，所述目标接口用于记录神经网络模型前向计算时核心的计算顺序和参数指针。

9.根据权利要求8所述的装置，其中，所述目标长度确定单元被进一步配置成：

10.根据权利要求8所述的装置，其中，所述目标并发数确定单元被进一步配置成：

11.根据权利要求8所述的装置，其中，所述目标接口创建单元被进一步配置成：

为每种所述参数组合生成一个相应的目标接口。

12.根据权利要求8所述的装置，还包括：

偶发性长请求去除单元，被配置成在进行所述聚类处理之前，去除所述预设统计周期内接收到的偶发性长请求；其中，所述偶发性长请求为拥有远大于其它请求的实际长度的、数量较少的请求。

13.根据权利要求12所述的装置，其中，所述偶发性长请求去除单元被进一步配置成：

去除所述排序结果中长度排名位于前预设比例的请求。

14.根据权利要求8-13任一项所述的装置，还包括：

新请求处理单元，被配置成利用各所述目标接口处理最大长度不超过自身处理能力的新请求；

目标请求处理单元，被配置成对所有所述目标接口均无法处理的目标请求，转交由中央处理器进行处理。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的接口创建方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的接口创建方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1-7中任一项所述接口创建方法的步骤。