CN113608751A - 推理服务平台的运行方法、装置、设备及存储介质 - Google Patents

推理服务平台的运行方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113608751A
CN113608751A CN202110892636.1A CN202110892636A CN113608751A CN 113608751 A CN113608751 A CN 113608751A CN 202110892636 A CN202110892636 A CN 202110892636A CN 113608751 A CN113608751 A CN 113608751A
Authority
CN
China
Prior art keywords
inference
service module
service
inference service
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110892636.1A
Other languages
English (en)
Other versions
CN113608751B (zh
Inventor
袁正雄
钱正宇
施恩
胡鸣人
李金麒
褚振方
李润青
黄悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110892636.1A priority Critical patent/CN113608751B/zh
Publication of CN113608751A publication Critical patent/CN113608751A/zh
Priority to US17/817,015 priority patent/US20220374742A1/en
Priority to EP22188822.5A priority patent/EP4060496A3/en
Application granted granted Critical
Publication of CN113608751B publication Critical patent/CN113608751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供了一种推理服务平台的运行方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及人工智能模型的推理服务领域。具体实现方案为:确定出针对推理服务平台的待分配的推理任务;确定出每个推理服务模组的流量权重,推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比;基于各个推理服务模组的流量权重,将待分配的推理任务中对应数量的推理任务分配给每个推理服务模组;利用推理服务模组执行推理任务。上述方法基于流量权重即可自动为每个推理服务模组分配对应数量的推理任务,大大地减轻了用户为推理服务模组因分配任务而增加的工作量,显著地提升了推理服务的工作效率。

Description

推理服务平台的运行方法、装置、设备及存储介质
技术领域
本公开涉及人工智能领域,尤其涉及人工智能模型的推理服务领域,具体涉及一种推理服务平台的运行方法、装置、设备及存储介质。
背景技术
随着人工智能技术在各行业的应用落地,复杂多样的业务应用场景对人工智能的推理服务提出了挑战,业务会要求人工智能模型的效果不断优化,因此生产环境的人工智能模型的版本迭代变更较为频繁。在相关技术中,同一人工智能模型的多个版本分别被应用到多个独立的推理服务模组中,用户(例如模型开发者)需要自行将多个推理任务分配给不同版本的推理服务模组,工作量较大且效率较低。
发明内容
本公开提供了一种推理服务平台的运行方法、装置、设备及存储介质。
根据本公开的一方面,提供了一种推理服务平台的运行方法,包括:
确定出针对推理服务平台的待分配的推理任务,所述推理服务平台包括至少两个推理服务模组,各个所述推理服务模组的版本不同、且用于执行相同类型的推理服务;
确定出每个所述推理服务模组的流量权重,所述推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比;
基于各个所述推理服务模组的流量权重,将所述待分配的推理任务中对应数量的推理任务分配给每个所述推理服务模组;
利用推理服务模组执行所述推理任务。
根据本公开的另一方面,提供了一种推理服务平台的运行装置,包括:
任务确定模块,用于确定出针对推理服务平台的待分配的推理任务,所述推理服务平台包括至少两个推理服务模组,各个所述推理服务模组的版本不同、且用于执行相同类型的推理服务;
权重确定模块,用于确定出每个所述推理服务模组的流量权重,所述推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比;
任务分配模块,用于基于各个所述推理服务模组的流量权重,将所述待分配的推理任务中对应数量的推理任务分配给每个所述推理服务模组;
任务执行模块,用于利用推理服务模组执行所述推理任务。
评价值提取模块,用于从资源生产方所生产的历史资源中,提取出多个预设的可评价事件中每个可评价事件的评价值,所述多个可评价事件至少包括基于历史资源的特征的可评价事件、基于历史资源的用户反馈的可评价事件;
目标评价值计算模块,用于基于所述多个预设的可评价事件中每个可评价事件的评价值,计算出所述历史资源的目标评价值;
资源质量确定模块,用于基于所述目标评价值确定所述历史资源的质量等级。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的推理服务平台的运行方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的推理服务平台的运行方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述的推理服务平台的运行方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本公开提供的技术方案带来的有益效果是:
本公开实施例提供的方案,将不同版本的推理服务模组部署在同一个推理服务平台中,基于流量权重即可自动为每个推理服务模组分配对应数量的推理任务,大大地减轻了用户为推理服务模组因分配任务而增加的工作量,显著地提升了推理服务的工作效率。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示出了本公开实施例提供的一种推理服务平台的运行方法的架构示意图;
图2示出了本公开实施例提供的一种推理服务平台的运行方法的流程示意图;
图3示出了本公开实施例提供的一种推理服务模组执行推理任务的流程示意图;
图4示出了本公开实施例提供的一种推理服务平台的运行装置的结构示意图之一;
图5示出了本公开实施例提供的一种推理服务平台的运行装置的结构示意图之二;
图6示出了可以用来实施本公开的实施例推理服务平台的运行方法的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开实施例提供的推理服务平台的运行方法、装置、设备及存储介质,旨在解决相关技术的如上技术问题中的至少一个。
本公开实施例提供了一种推理服务平台,图1示出了本公开实施例提供的推理服务平台的运行方法的架构示意图,如图1所示,推理服务平台采用分层结构,包括服务层、版本层、模块层和推理实例层,层次间的关联与同步由对应的模块管控。
服务层用于定义推理服务平台的整体元信息、整体规格和实时状态等。
具体来说,整体元信息可以包括以下信息:
服务名称:推理服务平台的唯一标识;
服务地址:推理服务平台供外部访问的调用地址;
服务创建时间:推理服务平台的创建时间,以时间戳表示;
服务规格版本:推理服务平台中推理服务模组的版本被修改的次数;
服务所属空间:在多租户场景下,每个租户对应一个空间。
服务规格可以包括以下信息:
路由类型:定义了路由转发的匹配方式,包括绝对匹配、前缀匹配与正则匹配;
路由地址:定义了推理服务平台对应的后端地址;
版本元信息:推理服务模组的元信息,将在版本层详细论述。
实时状态可包括以下信息:
服务状态:表示推理服务平台是否处于可运行状态;
服务最近调用时间:推理服务平台最近一次调用时间,以时间戳表示;
服务调用量:推理服务平台创建以来的调用次数;
服务QPS:当前推理服务平台每秒处理请求数。
服务层之下的版本层包含1个或多个版本的推理服务模组,版本层用于定义每个版本的推理服务模组的元信息,该元信息包含推理服务模组的版本的名称、流量权重等。路由控制模块在服务层与版本层之间起作用,支持为多个版本的推理服务模组设置推理任务分发策略。
每个版本的推理服务模组的元信息可以包括以下信息:
版本名称:推理服务模组在推理服务平台下的唯一标识;
版本创建时间:推理服务平台的创建时间,以时间戳表示。
推理服务平台的流量权重:转发至推理服务模组的流量比例,范围为0至100的整数,且所有版本的推理服务模组的流量权重之和为100,可以理解,流量权重可以指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比;
推理服务模块的元信息:模块级别的元信息,在模块层详细论述。
版本层之下的模块层包含各推理服务模组中的多个推理服务模块,模块层定义了每个推理服务模块的元信息,该元信息包括推理服务模块的名称、推理服务模块包含的推理实例数量等。
同一个推理服务模组中的多个推理服务模块中不同的推理服务模块分别用于执行推理服务中不同的子任务。假设推理服务模组用于执行的推理服务为“识别票据中的单号”,推理服务模组可以包括2个推理服务模块,其中一个推理服务模块用于在票据中识别出包含单号的目标区域,另一个推理服务模块用于在目标区域中识别出单号。
推理服务模块的元信息可以包括以下信息:
模块名称:推理服务模块在一个版本的推理服务模组下的唯一标识;
推理实例数量:推理服务模块包含的推理实例数量,一个推理服务模块所有推理实例是相同的;
推理服务模块的第一标识:用于指示对应推理服务模块的编排顺序,服务地址是基于推理服务模块对应的第一标识生成的;
推理实例的规格配置信息:在推理实例层中详细论述。
推理实例层包含各推理服务模块中的多个推理实例,推理实例层定义了启动推理实例所需的一系列规格配置信息,配置信息包含部署包地址、启动命令、开放的端口、接口协议、使用的计算资源等。与推理实例层匹配的推理实例管理模块可以控制推理实例进程的启动方式、探活机制等。
在公开实施例中,可选的,一个推理服务模块中的各个推理实例是完全相同的,用于执行相同的子任务,推理实例是由一个训练好的模型与该模型的运行代码封装而成的。例如,用于在票据中识别出包含单号的目标区域的推理服务模块可以包含多个推理实例,其中,推理实例是由一个训练好的模型和该模型的运行代码封装而成的,该模型用于在票据中识别出包含单号的目标区域。
推理实例的规格配置信息可以包括以下信息:
推理实例名称:推理实例在推理服务模块内的唯一标识;
地址:推理实例启动的部署包地址;
启动命令:推理实例启动命令;
环境变量:推理实例启动所需的环境变量;
开放端口:推理实例监听的端口,用于路由转发访问;
接口协议:推理实例使用的接口协议,例如HTTP和TCP;
探活方式及配置:推理实例探活的接口或脚本配置;
算力资源:推理实例启动所需的计算资源,包括内存、CPU核数、GPU算力、显存等资源信息;
存储资源:推理实例启动所需的外部存储,包括对象存储、文件存储等;
其他规格参数:包含推理实例启动前的准备脚本及推理实例销毁前的善后脚本等。
图2示出了本公开实施例提供的一种推理服务平台的运行方法的流程示意图,如图2所示,该方法主要可以包括以下步骤:
S110:确定出针对推理服务平台的待分配的推理任务。
在本公开实施例中,推理服务平台包括至少两个推理服务模组,各个推理服务模组的版本不同、且用于执行相同类型的推理服务。例如,服务平台包括两个推理服务模组,其中一个推理服务模组为初始版本的模组。另一个推理服务模组为最新版本,两个推理服务模组用于执行的推理服务均为“识别票据中的单号”。
在本公开实施例中,发送到推理服务平台的推理任务可以缓存在任务队列中,可以设置相应的触发条件从任务队列确定出待分配的推理任务。
可选地,可以在推理服务平台的任务队列中的任务数量达到预设数量时,将任务队列中的推理任务确定为待分配的推理任务。其中,预设数量的具体数值可以根据实际的需求而定,例如,预设数量为100,在推理服务平台的任务队列中的任务数量为100时,将这100个推理任务确定为待分配的推理任务。
可选地,可以每经过一个预设时间周期,将推理服务平台的任务队列在预设时间周期存储的推理任务确定为待分配的推理任务。其中,预设时间周期的具体数值可以根据实际的需求而定,例如,预设时间周期为100秒,每经过一个100秒,将推理服务平台的任务队列在这100秒内存储的推理任务确定为待分配的推理任务。
S120:确定出每个推理服务模组的流量权重。
在本公开实施例中,推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比。可选地,每个推理服务模组的流量权重为0至100的整数之间的任一整数,且所有版本的推理服务模组的流量权重之和为100。例如,服务平台包括两个推理服务模组,一个推理服务模组的流量权重为40,另一个推理服务模组的流量权重为60,则两个推理服务模组需要被分配的推理任务数量在推理任务总量中的占比分别为0.4和0.6。可选的,流量权重可以通过用户预先配置,或者,随机生成,或者,也可以基于推理服务模组的参数(例如规格配置信息或其他规格参数等)进行确定,本公开对此不做具体限定。
优选地,在本公开实施例中,可以响应于针对每个推理服务模组的权重配置操作,配置每个推理服务模组的流量权重;将每个推理服务模组的标识信息和对应的流量权重关联记录。具体来说,本公开实施例允许用户配置每个推理服务模组的流量权重,例如,用户可以将推理服务平台中的两个推理服务模组流量权重分别配置为40和60,将用户为每个推理服务模组配置的流量权重和推理服务模组的标识信息关联记录,其中,标识信息可以是推理服务模组在推理服务平台下的唯一标识。用户可以根据实际需要自行配置每个推理服务模组的流量权重,使得推理服务平台可以快速满足用户的实时需求。
在本公开实施例中,确定推理服务平台对应的服务场景,根据服务场景的类型,确定出每个推理服务模组的流量权重。其中,服务场景的类型包括推理服务模组的效果验证场景、推理服务模组的版本更新场景,推理服务模组对应于每个类型的服务场景的流量权重是预先配置好的。
可选地,用户可以针对每个类型的服务场景,为推理服务平台中的推理服务模组流量权重分别配置。例如,以推理服务平台包括两个推理服务模组为例,针对推理服务模组的效果验证场景,用户可以将推理服务平台中的两个推理服务模组流量权重分别配置为80和20,其中,原始版本的推理服务模组的流量权重为80,新版本的推理服务模组的流量权重为80;针对推理服务模组的版本更新场景,用户可以将推理服务平台中的两个推理服务模组流量权重分别配置为50和50。
S130:基于各个推理服务模组的流量权重,将待分配的推理任务中对应数量的推理任务分配给每个推理服务模组。
如前文所述,推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比。可选地,每个推理服务模组的流量权重为0至100的整数之间的任一整数,且所有版本的推理服务模组的流量权重之和为100。例如,服务平台包括两个推理服务模组,一个推理服务模组的流量权重为40,另一个推理服务模组的流量权重为60,则两个推理服务模组需要被分配的推理任务数量在推理任务总量中的占比分别为0.4和0.6。当待分配的推理任务的总量为200时,需要将这200个推理任务按照2:3(即0.4:0.6)的比例分成两组,其中一组包括80个推理任务,另一组包括120个推理任务,将80个推理任务分配给流量权重为40的推理服务模组,将120个推理任务分配给流量权重为60的推理服务模组。
S140:利用推理服务模组执行推理任务。
在本公开实施例中,推理服务模组包括多个推理服务模块,多个推理服务模块中不同的推理服务模块分别用于执行推理服务中不同的子任务。在利用利用推理服务模组执行推理任务时,具体来说,由推理服务模组中不同的推理服务模块分别用于执行推理服务中不同的子任务。
假设推理服务模组用于执行的推理服务为“识别票据中的单号”,推理服务模组可以包括2个推理服务模块,其中一个推理服务模块用于在票据中识别出包含单号的目标区域,之后由另一个推理服务模块用于在目标区域中识别出单号。
本公开实施提供的推理服务平台的运行方法,将不同版本的推理服务模组部署在同一个推理服务平台中,基于流量权重即可自动为每个推理服务模组分配对应数量的推理任务,大大地减轻了用户为推理服务模组因分配任务而增加的工作量,显著地提升了推理服务的工作效率。
另外,本公开的发明人发现,在相关技术中,对于包含多个不同推理服务模块的推理服务模组,需要基于DAG(有向无环图)编排推理服务模组中的多个推理服务模块,并需要在平台中设置中心调度模块,利用中心调度模块对多个推理服务模块的子任务进行串联,这会导致中心调度模块的接口适配开发的改造成本高、增加系统复杂度高以及增加单点承载风险。基于上述原因,本公开提供了一种推理服务模组执行推理任务的实现方式,图3示出了本公开实施例提供的一种推理服务模组执行推理任务的流程示意图,如图3所示,该流程主要可以包括以下步骤:
S210:针对多个推理服务模块中的每个推理服务模块,基于该推理服务模块接收推理服务中对应的子任务的待处理数据。
其中,待处理数据是与该推理服务模块相邻的前一个推理服务模块所生成的处理结果、或者推理服务中第一个子任务的原始数据。可以理解,一个推理任务可以包括多个需要按顺序完成的多个子任务,推理服务模组包括多个推理服务模块,多个推理服务模块中不同的推理服务模块分别用于执行推理服务中不同的子任务。对于用于执行第一个子任务的推理服务模块来说,其接收的子任务的待处理数据为推理服务中第一个子任务的原始数据;对于执行第一个子任务之外的其它子任务的推理模块来说,其接收的子任务的待处理数据为相邻的前一个推理服务模块所生成的处理结果,例如,用于执行第二个子任务的推理服务模块所接收的子任务的待处理数据,是用于执行第一个子任务的推理服务模块所生成的处理结果。
S220:基于该推理服务模块计算待处理数据对应的处理结果,并将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块。
可以理解,对于用于执行第一个子任务的推理服务模块来说,其计算得到第一个子任务的待处理数据对应的处理结果之后,可以将处理结果发送给与用于执行第二个子任务的推理服务模块,以此类推。在本公开实施例中,用于执行第一个子任务的推理服务模块可以作为推理服务模组中的数据输入和输出的模块,对于用于执行最后一个子任务的推理服务模块来说,其计算得到最后一个子任务的待处理数据对应的最终处理结果之后,可以将最终处理结果发送给与用于执行第一个子任务的推理服务模块,由用于执行第一个子任务的推理服务模将最终处理结果向外输出。
可选地,每个推理服务模块具有第一标识,第一标识用于指示对应推理服务模块的编排顺序,在本公开实施例可以基于每个推理服务模块的第一标识生成每个推理服务模块的服务地址,确保每个推理服务模块的服务地址的唯一性,通过推理服务模块的服务地址可以向该推理服务模块发送数据。
在本公开实施例中,可以将多个推理服务模块中的每个推理服务模块的服务地址已预先被储存到其他的推理服务模块中。例如,一个推理服务模组包括5个推理服务模块,分别是推理服务模块a、推理服务模块b、推理服务模块c、推理服务模块d和推理服务模块e。以推理服务模块a为例,可以将推理服务模块b、推理服务模块c、推理服务模块d和推理服务模块e的服务地址作为环境变量存储到推理服务模块a中,其他推理模块需要被存储的服务地址参照推理服务模块a,此处不再赘述。
在本公开实施例中,对于一个执行子任务的推理服务模块来说,可以从该推理服务模块中确定出与该推理服务模块相邻的下一个推理服务模的服务地址,之后将计算得到的子任务的待处理数据对应的处理结果,通过服务地址发送给下一个推理服务模块。例如,对于用于执行第一个子任务的推理服务模块来说,从该推理服务模块中确定出用于执行第二个子任务的推理服务模块的服务地址,在计算得到第一个子任务的待处理数据对应的处理结果之后,可以将该处理结果通过服务地址发送给用于执行第二个子任务的推理服务模块。
本公开实施例可由一个推理服务模块自身将处理结果发送给与该推理服务模块相邻的下一个推理服务模块,也就是说,各推理服务模块之间可以直接进行通信来实现模型编排,可以省去中心调度模块,有效地避免了基于中心调度模块的模型编排方式中的接口适配开发的改造成本高、系统复杂度高以及存在单点承载风险的问题。
基于与上述的推理服务平台的运行方法相同的原理,图4示出了本公开实施例提供的一种推理服务平台的运行装置的结构示意图之一,图5示出了本公开实施例提供的一种推理服务平台的运行装置的结构示意图之二。如图4所示,该推理服务平台的运行装置30包括任务确定模块310、权重确定模块320、任务分配模块330和任务执行模块340。
任务确定模块310用于确定出针对推理服务平台的待分配的推理任务,推理服务平台包括至少两个推理服务模组,各个推理服务模组的版本不同、且用于执行相同类型的推理服务。
权重确定模块320用于确定出每个推理服务模组的流量权重,推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比。
任务分配模块330用于基于各个推理服务模组的流量权重,将待分配的推理任务中对应数量的推理任务分配给每个推理服务模组。
任务执行模块340用于利用推理服务模组执行推理任务。
本公开实施提供的推理服务平台的运行装置,将不同版本的推理服务模组部署在同一个推理服务平台中,基于流量权重即可自动为每个推理服务模组分配对应数量的推理任务,大大地减轻了用户为推理服务模组因分配任务而增加的工作量,显著地提升了推理服务的工作效率。
在本开实施例中,任务确定模块310在用于确定出针对推理服务平台的待分配的推理任务时,还用于:
在推理服务平台的任务队列中的任务数量达到预设数量时,将任务队列中的推理任务确定为待分配的推理任务;
或者,每经过一个预设时间周期,将推理服务平台的任务队列在预设时间周期存储的推理任务确定为待分配的推理任务。
在本开实施例中,权重确定模块320在用于确定出每个推理服务模组的流量权重时,还用于:
确定推理服务平台对应的服务场景,服务场景的类型包括推理服务模组的效果验证场景、推理服务模组的版本更新场景;
根据服务场景的类型,确定出每个推理服务模组的流量权重,推理服务模组对应于每个类型的服务场景的流量权重是预先配置好的。
在本开实施例中,如图5所示,推理服务平台的运行装置30还包括权重配置模块350,权重配置模块350用于:
响应于针对每个推理服务模组的权重配置操作,配置每个推理服务模组的流量权重;
将每个推理服务模组的标识信息和对应的流量权重。
在本开实施例中,推理服务模组包括多个推理服务模块,多个推理服务模块中不同的推理服务模块分别用于执行推理服务中不同的子任务;任务执行模块340在用于利用推理服务模组执行推理任务时,还用于:
针对多个推理服务模块中的每个推理服务模块,基于该推理服务模块接收推理服务中对应的子任务的待处理数据,其中,待处理数据是与该推理服务模块相邻的前一个推理服务模块所生成的处理结果、或者推理服务中第一个子任务的原始数据;
基于该推理服务模块计算待处理数据对应的处理结果,并将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块。
在本开实施例中,任务执行模块340在用于将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块时,还用于:
从该推理服务模块中确定出与该推理服务模块相邻的下一个推理服务模的服务地址,其中,多个推理服务模块中的每个推理服务模块的服务地址已预先被储存到其他的推理服务模块中;
将该处理结果通过服务地址发送给下一个推理服务模块。
在本开实施例中,每个推理服务模块具有第一标识,第一标识用于指示对应推理服务模块的编排顺序;
每个推理服务模块的服务地址是基于推理服务模块对应的第一标识生成的。
可以理解的是,本公开实施例中的推理服务平台的运行装置的上述各模块具有实现上述的推理服务平台的运行方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述推理服务平台的运行装置的各模块的功能描述具体可以参见上述的推理服务平台的运行方法的对应描述,在此不再赘述。
在此需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例推理服务平台的运行方法的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如推理服务平台的运行方法。例如,在一些实施例中,推理服务平台的运行方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的推理服务平台的运行方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行推理服务平台的运行方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种推理服务平台的运行方法,包括:
确定出针对推理服务平台的待分配的推理任务,所述推理服务平台包括至少两个推理服务模组,各个所述推理服务模组的版本不同、且用于执行相同类型的推理服务;
确定出每个所述推理服务模组的流量权重,所述推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比;
基于各个所述推理服务模组的流量权重,将所述待分配的推理任务中对应数量的推理任务分配给每个所述推理服务模组;
利用推理服务模组执行所述推理任务。
2.根据权利要求1所述的方法,其中,所述确定出针对推理服务平台的待分配的推理任务,包括:
在所述推理服务平台的任务队列中的任务数量达到预设数量时,将所述任务队列中的推理任务确定为待分配的推理任务;
或者,每经过一个预设时间周期,将所述推理服务平台的任务队列在所述预设时间周期存储的推理任务确定为待分配的推理任务。
3.根据权利要求1所述的方法,其中,所述确定出每个所述推理服务模组的流量权重,包括:
确定所述推理服务平台对应的服务场景;
根据所述服务场景的类型,确定出每个所述推理服务模组的流量权重。
4.根据权利要求1所述的方法,在所述确定出每个所述推理服务模组的流量权重之前,还包括:
响应于针对每个所述推理服务模组的权重配置操作,配置每个所述推理服务模组的流量权重;
将每个所述推理服务模组的标识信息和对应的流量权重关联记录。
5.根据权利要求1至4中任一项所述的方法,其中,所述推理服务模组包括多个推理服务模块,所述多个推理服务模块中不同的推理服务模块分别用于执行所述推理服务中不同的子任务;
所述利用推理服务模组执行所述推理任务,包括:
针对所述多个推理服务模块中的每个推理服务模块:
基于该推理服务模块接收所述推理服务中对应的子任务的待处理数据,其中,所述待处理数据是与该推理服务模块相邻的前一个推理服务模块所生成的处理结果、或者所述推理服务中第一个子任务的原始数据;
基于该推理服务模块计算所述待处理数据对应的处理结果,并将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块。
6.根据权利要求5所述的方法,其中,所述将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块,包括:
从该推理服务模块中确定出与该推理服务模块相邻的下一个推理服务模的服务地址,其中,所述多个推理服务模块中的每个推理服务模块的服务地址已预先被存储到其他的推理服务模块中;
将该处理结果通过所述服务地址发送给所述下一个推理服务模块。
7.根据权利要求6所述的方法,每个所述推理服务模块具有第一标识,所述第一标识用于指示对应所述推理服务模块的编排顺序;
每个所述推理服务模块的服务地址是基于所述推理服务模块对应的第一标识生成的。
8.一种推理服务平台的运行装置,包括:
任务确定模块,用于确定出针对推理服务平台的待分配的推理任务,所述推理服务平台包括至少两个推理服务模组,各个所述推理服务模组的版本不同、且用于执行相同类型的推理服务;
权重确定模块,用于确定出每个所述推理服务模组的流量权重,所述推理服务模组的流量权重用于指示该推理服务模组需要被分配的推理任务数量在推理任务总量中的占比;
任务分配模块,用于基于各个所述推理服务模组的流量权重,将所述待分配的推理任务中对应数量的推理任务分配给每个所述推理服务模组;
任务执行模块,用于利用推理服务模组执行所述推理任务。
9.根据权利要求8所述的装置,其中,所述任务确定模块在用于确定出针对推理服务平台的待分配的推理任务时,还用于:
在所述推理服务平台的任务队列中的任务数量达到预设数量时,将所述任务队列中的推理任务确定为待分配的推理任务;
或者,每经过一个预设时间周期,将所述推理服务平台的任务队列在所述预设时间周期存储的推理任务确定为待分配的推理任务。
10.根据权利要求8所述的装置,其中,所述权重确定模块在用于确定出每个所述推理服务模组的流量权重时,还用于:
确定所述推理服务平台对应的服务场景;
根据所述服务场景的类型,确定出每个所述推理服务模组的流量权重。
11.根据权利要求8所述的装置,还包括权重配置模块,所述权重配置模块用于:
响应于针对每个所述推理服务模组的权重配置操作,配置每个所述推理服务模组的流量权重;
将每个所述推理服务模组的标识信息和对应的流量权重关联记录。
12.根据权利要求8至11中任一项所述的装置,其中,所述推理服务模组包括多个推理服务模块,所述多个推理服务模块中不同的推理服务模块分别用于执行所述推理服务中不同的子任务;
所述任务执行模块在用于利用推理服务模组执行所述推理任务时,还用于:
针对所述多个推理服务模块中的每个推理服务模块,基于该推理服务模块接收所述推理服务中对应的子任务的待处理数据,其中,所述待处理数据是与该推理服务模块相邻的前一个推理服务模块所生成的处理结果、或者所述推理服务中第一个子任务的原始数据;
基于该推理服务模块计算所述待处理数据对应的处理结果,并将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块。
13.根据权利要求12所述的装置,其中,所述任务执行模块在用于将该处理结果发送给与该推理服务模块相邻的下一个推理服务模块时,还用于:
从该推理服务模块中确定出与该推理服务模块相邻的下一个推理服务模的服务地址,其中,所述多个推理服务模块中的每个推理服务模块的服务地址已预先被储存到其他的推理服务模块中;
将该处理结果通过所述服务地址发送给所述下一个推理服务模块。
14.根据权利要求13所述的装置,每个所述推理服务模块具有第一标识,所述第一标识用于指示对应所述推理服务模块的编排顺序;
每个所述推理服务模块的服务地址是基于所述推理服务模块对应的第一标识生成的。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
CN202110892636.1A 2021-08-04 2021-08-04 推理服务平台的运行方法、装置、设备及存储介质 Active CN113608751B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110892636.1A CN113608751B (zh) 2021-08-04 2021-08-04 推理服务平台的运行方法、装置、设备及存储介质
US17/817,015 US20220374742A1 (en) 2021-08-04 2022-08-03 Method, device and storage medium for running inference service platform
EP22188822.5A EP4060496A3 (en) 2021-08-04 2022-08-04 Method, apparatus, device and storage medium for running inference service platform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110892636.1A CN113608751B (zh) 2021-08-04 2021-08-04 推理服务平台的运行方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113608751A true CN113608751A (zh) 2021-11-05
CN113608751B CN113608751B (zh) 2023-04-07

Family

ID=78306872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110892636.1A Active CN113608751B (zh) 2021-08-04 2021-08-04 推理服务平台的运行方法、装置、设备及存储介质

Country Status (3)

Country Link
US (1) US20220374742A1 (zh)
EP (1) EP4060496A3 (zh)
CN (1) CN113608751B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881235A (zh) * 2022-05-27 2022-08-09 北京百度网讯科技有限公司 推理服务调用方法、装置、电子设备及存储介质
CN117312388A (zh) * 2023-10-08 2023-12-29 江苏泰赋星信息技术有限公司 一种人工智能模型控制系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109951566A (zh) * 2019-04-02 2019-06-28 深圳市中博科创信息技术有限公司 一种Nginx负载均衡方法、装置、设备及可读存储介质
CN110888722A (zh) * 2019-11-15 2020-03-17 北京奇艺世纪科技有限公司 任务处理方法、装置、电子设备及计算机可读存储介质
CN111343235A (zh) * 2020-02-06 2020-06-26 北京百度网讯科技有限公司 数据处理方法和装置、访问系统、电子设备和存储介质
CN111461332A (zh) * 2020-03-24 2020-07-28 北京五八信息技术有限公司 深度学习模型在线推理方法、装置、电子设备和存储介质
CN111629061A (zh) * 2020-05-28 2020-09-04 苏州浪潮智能科技有限公司 一种基于Kubernetes的推理服务系统
CN111625245A (zh) * 2020-05-22 2020-09-04 苏州浪潮智能科技有限公司 一种推理服务部署方法、装置、设备及存储介质
CN111782185A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 人工智能开发平台的管理方法及设备、介质
CN112035218A (zh) * 2020-09-09 2020-12-04 马上消费金融股份有限公司 一种提供模型服务的方法、装置及设备
CN112333096A (zh) * 2020-10-16 2021-02-05 济南浪潮数据技术有限公司 一种微服务流量调度方法及相关组件

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014174671A1 (ja) * 2013-04-26 2014-10-30 株式会社日立製作所 計算機システム及び負荷分散方法
US10142407B2 (en) * 2016-06-30 2018-11-27 Nokia Of America Corporation Centralized load balancer with weighted hash function

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109951566A (zh) * 2019-04-02 2019-06-28 深圳市中博科创信息技术有限公司 一种Nginx负载均衡方法、装置、设备及可读存储介质
CN110888722A (zh) * 2019-11-15 2020-03-17 北京奇艺世纪科技有限公司 任务处理方法、装置、电子设备及计算机可读存储介质
CN111343235A (zh) * 2020-02-06 2020-06-26 北京百度网讯科技有限公司 数据处理方法和装置、访问系统、电子设备和存储介质
CN111461332A (zh) * 2020-03-24 2020-07-28 北京五八信息技术有限公司 深度学习模型在线推理方法、装置、电子设备和存储介质
CN111625245A (zh) * 2020-05-22 2020-09-04 苏州浪潮智能科技有限公司 一种推理服务部署方法、装置、设备及存储介质
CN111629061A (zh) * 2020-05-28 2020-09-04 苏州浪潮智能科技有限公司 一种基于Kubernetes的推理服务系统
CN111782185A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 人工智能开发平台的管理方法及设备、介质
KR20210034558A (ko) * 2020-06-30 2021-03-30 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 인공 지능 개발 플랫폼의 관리 방법 및 장치, 매체
CN112035218A (zh) * 2020-09-09 2020-12-04 马上消费金融股份有限公司 一种提供模型服务的方法、装置及设备
CN112333096A (zh) * 2020-10-16 2021-02-05 济南浪潮数据技术有限公司 一种微服务流量调度方法及相关组件

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881235A (zh) * 2022-05-27 2022-08-09 北京百度网讯科技有限公司 推理服务调用方法、装置、电子设备及存储介质
CN117312388A (zh) * 2023-10-08 2023-12-29 江苏泰赋星信息技术有限公司 一种人工智能模型控制系统
CN117312388B (zh) * 2023-10-08 2024-03-19 江苏泰赋星信息技术有限公司 一种人工智能模型控制系统

Also Published As

Publication number Publication date
EP4060496A2 (en) 2022-09-21
CN113608751B (zh) 2023-04-07
US20220374742A1 (en) 2022-11-24
EP4060496A3 (en) 2023-01-04

Similar Documents

Publication Publication Date Title
CN112165691B (zh) 内容分发网络调度方法、装置、服务器和介质
CN113608751B (zh) 推理服务平台的运行方法、装置、设备及存储介质
CN107534570A (zh) 虚拟化网络功能监控
CN113656179B (zh) 云计算资源的调度方法及装置、电子设备和存储介质
CN110661842B (zh) 一种资源的调度管理方法、电子设备和存储介质
CN111143039B (zh) 一种虚拟机的调度方法、装置及计算机存储介质
CN110990138A (zh) 资源调度方法、装置、服务器及存储介质
CN108829518B (zh) 用于推送信息的方法和装置
CN112988381A (zh) 为云资源生成优化信息的方法、装置和电子设备
CN114911598A (zh) 任务调度方法、装置、设备以及存储介质
US20200034209A1 (en) Information processing system and resource allocation method
CN109960579A (zh) 一种调整业务容器的方法及装置
CN114969144A (zh) 一种规则引擎在工业物联网上的应用方法
CN111555987B (zh) 限流配置方法、装置、设备及计算机存储介质
CN111767149A (zh) 调度方法、装置、设备及存储设备
CN111277626A (zh) 服务器升级方法、装置、电子设备及介质
CN112416488B (zh) 一种用户画像实现的方法、装置、计算机设备及计算机可读存储介质
CN115599552A (zh) 分布式任务的处理方法、装置、电子设备及存储介质
CN117579626B (zh) 基于分布式实现边缘计算下的优化方法及系统
CN113656268B (zh) 业务服务的性能测试方法、装置、电子设备和存储介质
CN111741097B (zh) 一种租户独占节点的方法、计算机设备及存储介质
CN116700950A (zh) 一种集群中节点调度方法、装置、存储介质及终端
CN116955214A (zh) OpenCL设备及其内存的管理方法
CN113535187A (zh) 服务上线方法、服务更新方法及服务提供方法
CN114647514A (zh) 工程系统的工程量计算方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant