CN115373733A - 模型服务的模型版本调整方法、装置和电子设备 - Google Patents

模型服务的模型版本调整方法、装置和电子设备 Download PDF

Info

Publication number
CN115373733A
CN115373733A CN202211316726.7A CN202211316726A CN115373733A CN 115373733 A CN115373733 A CN 115373733A CN 202211316726 A CN202211316726 A CN 202211316726A CN 115373733 A CN115373733 A CN 115373733A
Authority
CN
China
Prior art keywords
version
model
model version
list
processing node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211316726.7A
Other languages
English (en)
Other versions
CN115373733B (zh
Inventor
刘国明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Automobile Technology Co Ltd
Original Assignee
Xiaomi Automobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Automobile Technology Co Ltd filed Critical Xiaomi Automobile Technology Co Ltd
Priority to CN202211316726.7A priority Critical patent/CN115373733B/zh
Publication of CN115373733A publication Critical patent/CN115373733A/zh
Application granted granted Critical
Publication of CN115373733B publication Critical patent/CN115373733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提出一种模型服务的模型版本调整方法、装置和电子设备,其中,方法包括:获取第一处理节点对应的第一期望模型版本列表,根据该第一期望模型版本列表,对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表,响应于获取到目标版本配置中心根据目标实际模型版本列表调整得到的第二期望模型版本列表,采用第二期望模型版本列表,对第一处理节点获取的业务消息进行处理,实现了通过对第一处理节点的模型版本的数量和模型版本的状态的维护,降低了第一处理节点因模型版本调整导致的不可用时间,提高了第一处理节点的可用性,从而提高了模型服务的可用性。

Description

模型服务的模型版本调整方法、装置和电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种模型服务的模型版本调整方法、装置和电子设备。
背景技术
模型训练完成后,可上线提供服务,例如分布式模型服务,包含多个模型服务实例,即多个处理节点,在各个模型服务实例进行模型版本更新的过程中,会导致模型服务实例处理处于不可用状态,影响模型服务实例的可用性,进而影响模型在线提供服务的可用性。
发明内容
本申请提出一种模型服务的模型版本调整方法、装置和电子设备,提高了模型在线提供服务的可用性。
本申请一方面实施例提出了一种模型服务的模型版本调整方法,由执行模型服务的至少一个处理节点中的第一处理节点执行,包括:
获取版本配置中心同步的所述第一处理节点对应的第一期望模型版本列表;
根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
将所述目标实际模型版本列表同步至所述版本配置中心;所述目标实际模型版本列表,用于调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
响应于获取到所述第二期望模型版本列表,根据所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
本申请另一方面方面实施例提出了一种模型服务的模型版本调整方法,由执行模型服务的版本配置中心执行,包括:
确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表;
将所述第一期望模型版本列表,同步给所述第一处理节点;其中,所述第一期望模型版本列表,用于对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
获取所述第一处理节点同步至所述版本配置中心的所述目标实际模型版本列表;
根据所述目标实际模型版本列表中的模型版本信息调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
将所述第二期望模型版本列表同步至所述第一处理节点;其中,所述第二期望模型版本列表,用于所述第一处理节点采用所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
本申请另一方面方面实施例提出了一种模型服务的模型版本调整装置,设置于执行模型服务的至少一个处理节点中的第一处理节点,包括:
获取模块,用于获取版本配置中心同步的所述第一处理节点对应的第一期望模型版本列表;
第一处理模块,用于根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
同步模块,用于将所述目标实际模型版本列表同步至所述版本配置中心;所述目标实际模型版本列表,用于调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
第二处理模块,用于响应于获取到所述第二期望模型版本列表,根据所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
本申请另一方面方面实施例提出了一种模型服务的模型版本调整装置,设置在执行模型服务的版本配置中心,包括:
确定模块,用于确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表;
同步模块,用于将所述第一期望模型版本列表,同步给所述第一处理节点;其中,所述第一期望模型版本列表,用于对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
获取模块,用于获取所述第一处理节点同步至所述版本配置中心的所述目标实际模型版本列表;
调整模块,用于根据所述目标实际模型版本列表中模型的版本信息调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
所述同步模块,还用于将所述第二期望模型版本列表同步至所述第一处理节点;其中,所述第二期望模型版本列表,用于所述第一处理节点采用所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
本申请另一方面方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述方法实施例所述的模型服务的模型版本调整方法。
本申请另一方面方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的模型服务的模型版本调整方法。
本申请另一方面方面实施例提出了一种计算机程序产品,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的模型服务的模型版本调整方法。
本申请提出的模型服务的模型版本调整方法、装置和电子设备,获取版本配置中心同步的第一处理节点对应的第一期望模型版本列表,根据该第一期望模型版本列表,对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表,将目标实际模型版本列表同步至版本配置中心,响应于获取到第二期望模型版本列表,采用第二期望模型版本列表中的模型版本信息,对第一处理节点获取的业务消息进行处理,实现了根据获取到的更新得到的第一期望模型版本列表中的模型版本信息,对第一处理节点中的模型版本的数量和模型版本信息的维护,降低了第一处理节点因模型版本调整导致的不可用时间,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种模型服务的模型版本调整方法的流程示意图;
图2为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图;
图3为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图;
图4为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图;
图5为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图;
图6为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图;
图7为本申请实施例提供的一种模型服务的模型版本调整方法的场景示意图;
图8为本申请实施例提供的一种模型服务的模型版本调整装置的结构示意图;
图9为本申请实施例提供的另一种模型服务的模型版本调整装置的结构示意图;
图10为本申请实施例提供的一种电子设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的模型服务的模型版本调整方法、装置和电子设备。
图1为本申请实施例所提供的一种模型服务的模型版本调整方法的流程示意图。
模型服务,又称为在线模型服务,在线模型服务通常是分布式的,即包含分布式的多个模型服务实例,还可以包含用于配置模型服务实例的服务部署中心和版本配置中心,各个模型服务实例通过运行对应的模型版本,实现模型服务的部分功能,例如,查询服务、分类服务等等。每一个模型服务实例通过和版本配置中心的交互,对模型服务实例中配置的模型版本的数量和模型版本信息进行维护。每一模型服务实例为一个处理节点,而每一个模型服务实例进行模型版本的数量和模型版本信息进行维护的过程相同,因此,本申请实施例中以其中一个处理节点为例进行说明,称为第一处理节点。
本申请实施例的模型服务的模型版本调整方法的执行主体为模型服务的模型版本调整装置,该装置可设置于执行模型服务的至少一个处理节点中。
如图1所示,该方法可以包括以下步骤:
步骤101,获取版本配置中心同步的第一处理节点对应的第一期望模型版本列表。
本申请实施例中,版本配置中心维护有各个处理节点对应的第一期望模型版本列表和第一实际模型版本列表,各个处理节点对应的第一期望模型版本列表,是版本配置中心对各个处理节点对应的初始期望模型版本列表更新得到的。更新方法后续实施例中会进行说明。
作为一种实现方式,可采用基于订阅-发布机制的同步方法,例如Watch 机制的同步方法进行同步。其中,第一期望模型版本列表中,包括需要第一处理节点加载的模型版本信息。其中,模型版本信息包含版本标识、版本状态和版本的存储位置,其中,版本的标识用于唯一指示对应的模型版本,版本状态包含启用状态、禁用状态和异常状态等,可根据需求进行划分。版本的存储位置,指示了模型版本的存储地址,例如为URL地址。
本申请实施例中,获取到的第一期望模型版本列表是版本配置中心基于需求,根据第一处理节点对应的第一实际模型版本列表对初始期望模型版本列表进行更新得到的,作为一种示例,第一实际模型版本列表,包括第一处理节点已经加载的模型版本信息,如下表1所示:
表1
版本标识 版本状态 版本地址
版本A 启用 地址1
版本B 启用 地址2
版本C 禁用 地址3
第一期望模型版本列表,即版本配置中心根据版本更新需求和第一实际模型版本列表,配置的期望第一处理节点加载的模型版本信息,如表2所示:
表2
版本标识 版本状态 版本地址
版本A 禁用 地址1
版本B 启用 地址2
版本C 启用 地址3
步骤102,根据第一期望模型版本列表,对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表。
本申请实施例中,根据第一期望模型版本列表中的模型版本信息,可对第一处理节点中已经加载的模型版本数量进行维护,并在第一处理节点中的模型版本的数量维护完成后,基于第一期望模型版本列表中的模型版本信息对第一处理节点中的第一实际模型版本列表中的模型版本信息进行维护,实现对第一处理节点中的模型版本的数量和模型版本信息的维护。
步骤103,将目标实际模型版本列表同步至版本配置中心。
其中,目标实际模型版本列表,用于版本配置中心根据目标实际模型版本列表中的模型版本信息调整第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表。
本申请实施例中,在调整得到目标实际模型版本列表的情况下,将目标实际模型版本列表同步至版本配置中心,作为一种实现方式,可采用基于订阅-发布机制的同步方法,例如Watch 机制的同步方法进行同步。其中,目标实际模型版本列表,用于版本配置中心根据目标实际模型版本列表调整第一期望模型版本列表,包括调整第一期望模型版本列表中包含的模型版本的数量和/或模型版本信息,以得到第二期望模型版本列表,以实现对第一处理节点实际可使用的模型版本和模型版本信息进行配置,实现了对第一处理节点加载的模型版本的调整,或者说是对第一处理节点加载的模型版本的更新,实现了通过对待调整的模型版本的模型版本信息的控制,降低了模型版本升级过程中模型的不可用时间,提高了第一处理节点的可用性,进而提高了在线模型服务的可用性。
步骤104,响应于获取到第二期望模型版本列表,根据第二期望模型版本列表中的模型版本信息,对第一处理节点获取的业务消息进行处理。
本申请实施例中,响应于获取到版本配置中心同步的第二期望模型版本列表,采用第二期望模型版本列表中的模型版本信息,确定模型版本信息中版本状态为启用状态的模型版本,采用启用状态的模型版本,对第一处理节点获取到的业务消息进行处理,提高了第一处理节点对消息处理的可靠性,从而提高了在线的模型服务的可靠性,满足了不同场景下的服务需求。
其中,其它处理节点的模型版本的调整方法原理相同,此处不再赘述。
本申请实施例的模型服务的模型版本调整方法中,获取版本配置中心同步的第一处理节点对应的第一期望模型版本列表,根据第一期望模型版本列表,对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表,将目标实际模型版本列表同步至版本配置中心,响应于获取到第二期望模型版本列表,采用第二期望模型版本列表中的模型版本信息,对第一处理节点获取的业务消息进行处理,实现了根据获取到的第一期望模型版本列表中的模型版本信息,对第一处理节点中的模型版本的数量和模型版本信息的维护,降低了第一处理节点因模型版本调整导致的不可用时间,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
基于上述实施例,在本申请实施例的一种实现方式中,根据第一期望模型版本列表,对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表,具体通过以下方式来实现:
根据第一期望模型版本列表,对第一处理节点中的模型版本进行维护,以得到第一处理节点已加载的模型版本。
本申请实施例中,将该第一期望模型版本列表中的模型版本信息和第一实际模型版本列表中的模型版本信息进行比较,以从该第一期望模型版本列表中确定待维护的第一目标版本,其中,待维护的第一目标版本为新增的模型版本、删除的模型版本,或者是模型版本信息发生变化的模型版本,进而,根据第一目标版本,对第一处理节点中已加载的模型版本进行维护,以得到维护后第一处理节点已加载的模型版本,即根据待维护的第一目标版本的版本信息,实现了对第一处理节点已加载的模型版本数量进行维护。
需要说明的是,维护,包括不调整第一处理节点已加载的模型版本的数量,即第一处理节点已加载的模型版本数量不改变,或者,调整第一处理节点已加载的模型版本的数量,即第一处理节点已加载的模型版本数量发生改变。
进而,根据第一处理节点已加载的模型版本和该第一期望模型版本列表,对第一处理节点中的第一实际模型版本列表中的模型版本信息进行维护,以得到目标实际模型版本列表。
本申请实施例中,根据维护后第一处理节点已加载的模型版本,和该第一期望模型版本列表中的模型版本信息,调整第一处理节点中的第一实际模型版本列表中的模型版本信息,使得第一实际模型版本列表中的模型版本信息发生变化,在第一种场景下,即新增模型版本的场景下,使得第一实际模型版本列表中增加了第一处理节点中新增的模型版本信息;在第二种场景下,即删除模型版本的场景下,使得第一实际模型版本列表中删除了第一处理节点中删除的模型版本信息;在第三种场景下,即无新增或删除模型版本的场景下,使得第一实际模型版本列表中第一处理节点已加载的模型版本对应的模型版本信息发生变化,实现了对第一处理节点中已加载的模型版本的模型版本信息的维护。
基于上述实施例,图2为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图,说明了在模型有新增的模型版本的情况下,如何根据版本配置中心同步的第一期望模型版本列表,调整第一处理节点加载的模型版本和模型版本信息,以降低模型的不可用时长,提高可用性。
如图2所示,该方法包含以下步骤:
步骤201,获取版本配置中心同步的第一处理节点对应的第一期望模型版本列表。
其中,步骤201可参照前述实施例中的解释说明,原理相同,此处不再赘述。
步骤202,将第一期望模型版本列表中的模型版本信息和第一实际模型版本列表中的模型版本信息进行比较,以从第一期望模型版本列表中确定待维护的第一目标版本。
本申请实施例中,以在第一处理节点中新增模型版本为例进行说明,实际应用场景下,当第一处理节点中的模型版本需要升级时,则会采用增加一个新的模型版本替换原有的旧模型版本,以实现模型版本的升级。
本申请实施例中,当第一处理节点有需要新增的模型版本的情况下,版本配置中心会在第一期望模型版本列表中添加新增的模型版本的模型版本信息,并基于同步机制将第一期望模型版本列表同步至第一处理节点,其中,同步机制,可以为Watch机制,本申请实施例中不进行限定。作为一种实现方式,第一处理节点在获取到版本配置中心同步的第一期望模型版本列表后,调用第一处理节点中的模型装载卸载器,将第一期望模型版本列表中的模型版本信息和第一实际模型版本列表中的模型版本信息进行比较,以从第一期望模型版本列表中确定待维护的第一目标版本。
步骤203,响应于第一目标版本为新增的模型版本,在第一处理节点中加载新增的模型版本,以得到维护后第一处理节点已加载的模型版本。
本申请实施例中,在确定第一目标版本为新增的模型版本的情况下,在第一处理节点中加载该新增的模型版本,作为一种实现方式,可根据新增的模型版本的模型版本信息中携带的地址信息,将新增的模型版本下载至第一处理节点中用于存储各个模型版本的设定存储单元中,以得到维护后的第一处理节点已加载的模型版本,也就是说第一处理节点已加载的模型版本中多了新增的模型版本。作为一种示例,第一期望模型版本列表中包含了一个新增的模型版本A,第一处理节点的模型装载卸载器根据第一期望模型版本列表中包含的新增的模型版本A,确定待调整的第一目标版本为新增的模型版本A,则将A下载至第一处理节点的设定存储单元中,实现了基于版本配置中心同步的第一期望模型版本列表对第一处理节点内加载的模型版本的数量的管理。
步骤204,根据维护后第一处理节点已加载的模型版本中的新增的模型版本,查找第一期望模型版本列表以得到新增的模型版本的模型版本信息。
步骤205,将新增的模型版本的模型版本信息添加至第一实际模型版本列表,以得到目标实际模型版本列表。
其中,新增的模型版本的模型版本信息包含的版本状态为禁用状态。
作为一种示例,在第一处理节点已加载新增的模型版本A的情况下,第一处理节点已经具备了新增的模型版本A的使用条件,进而,查找第一期望模型版本列表以获取新增的模型版本A的模型版本信息,并将新增的模型版本的模型版本信息添加至第一实际模型版本列表,以得到实际模型版本列表目标实际模型版本列表,也就是说实际模型版本列表目标实际模型版本列表中已经包括了新增的模型版本A的模型版本信息,实现了第一期望模型版本列表和实际模型版本列表目标实际模型版本列表中模型版本的同步。
需要理解的是,在新增模型版本的场景下,第一期望模型版本列表中新增的模型版本的版本状态为禁用状态,以避免在新增的模型版本还未在第一处理节点中的情况下即基于第一期望模型版本进行调用,导致消息处理失败,从而调整后目标实际模型版本列表中新增的模型版本的版本状态为禁用状态。
步骤206,将目标实际模型版本列表同步至版本配置中心。
本申请实施例的一种实现方式中,目标实际模型版本列表,用于版本配置中心根据目标实际模型版本列表中新增的模型版本的禁用状态,调整第一期望模型版本列表中新增的模型版本的版本状态为启用状态,以得到第二期望模型版本列表,例如,版本配置中心,查找目标实际模型版本列表确定新增的模型版本A的版本状态为禁用状态,而版本配置中心收到目标实际模型版本列表,说明第一处理节点中已经加载了新增的模型版本A,则调整第一期望模型版本列表中新增的模型版本A的版本状态为启用状态,以得到第二期望模型版本列表,并将第二期望模型版本列表同步至第一处理节点中。本申请实施例中,对于新增的模型版本,通过控制新增的模型版本的版本状态由禁用状态到启用状态,使得新增的模型版本在下载至第一处理节点后,再启用对新增的模型版本的使用,降低了第一处理节点在模型版本调整过程中的不可用时间,相比于相关技术中,直接将新增的模型版本的版本状态设置为启用状态,使得第一处理节点将待处理的消息分配至未加载但是已经启用的第一处理节点中,导致的第一处理节点在模型版本调整过程中不可用的问题,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
步骤207,响应于获取到第二期望模型版本列表,根据第二期望模型版本列表中的模型版本信息,对第一处理节点获取的业务消息进行处理。
本申请实施例中,可采用第一处理节点中包含的请求分配器,响应于获取到第二期望模型版本列表,采用第二期望模型版本列表对第一处理节点获取的业务消息进行处理,具体来说,请求分配器根据第二期望模型版本列表中的模型版本信息,确定启用状态的模型版本和禁用状态的模型版本,其中,对禁用状态的模型版本不分配业务消息进行处理,对启用状态的模型版本分配业务消息进行处理。在启用状态的模型版本为多个时,作为一种实现方式,可从多个启用状态的模型版本中,随机确定一个模型版本,以对业务消息进行处理。作为第二种实现方式,可从多个启用状态的模型版本中,按照平均分配的原则,确定对当前的业务消息进行响应的模型版本,以实现多个版本的均衡使用。作为第三种实现方式,可从多个启用状态的模型版本中,根据各个模型版本分配的响应总次数或者是权重,确定对当前的业务消息进行处理的模型版本。实现基于第二期望模型版本列表对第一处理节点中启用状态的各个模型版本的使用,提高了第一处理节点提供服务的可用性和处理效率,从而提高了在线模型服务的可用性和处理效率。
需要说明的是,第一处理节点在每次获取到版本配置中心同步的期望模型版本列表后,会按照当前同步得到的期望模型版本列表,对第一处理节点获取的业务消息进行处理,原理相同,此处不再赘述。
本申请实施例的模型服务的模型版本调整方法中,对于新增的模型版本,通过控制新增的模型版本的版本状态由禁用状态到启用状态,使得新增的模型版本在下载至第一处理节点后,再启用对新增的模型版本的使用,避免了第一处理节点在模型版本更新过程中不可用的问题,相比于相关技术中,直接将新增的模型版本的版本状态设置为启用状态,使得第一处理节点将待处理的消息分配至未加载但是已经启用的第一处理节点中,导致的第一处理节点在模型版本更新过程中不可用的问题,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
基于上述实施例,图3为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图,说明了在第一处理节点中模型版本需要回退的情况下,根据版本配置中心同步的第一期望模型版本列表,维护第一处理节点加载的模型版本的数量,并调整第一实际模型版本列表中的模型版本信息,以降低模型的不可用时长,提高可用性。
如图3所示,该方法包含以下步骤:
步骤301,获取版本配置中心同步的第一处理节点对应的第一期望模型版本列表。
其中,步骤301可参照前述实施例中的解释说明,原理相同,此处不再赘述。
步骤302,将第一期望模型版本列表中的模型版本信息和第一实际模型版本列表中的模型版本信息进行比较,以从第一期望模型版本列表中确定待维护的第一目标版本。
本申请实施例中,以在第一处理节点中模型版本回退为例进行说明,其中,模型版本回退,是指当第一处理节点中启用的模型版本出现异常,需要禁用该启用的异常版本,并启用正常的模型版本,其中,正常的模型版本,例如为异常版本之前的历史版本;或者,基于业务需求,需要将启用的模型版本从一个版本更换为另一个版本,例如将M模型版本由启用状态调整为禁用状态,而将N模型版本由禁用状态调整为启用状态。
其中,第一目标版本包括版本信息发生变化的第二目标版本和第三目标版本,其中,第一目标版本、第二目标版本和第三目标版本用于区别不同的模型版本。其中,第二目标版本可以为待回退的模型版本,第三目标版本为需要回退至的目标版本;或者,第三目标版本为待回退的模型版本,第二目标版本为需要回退至的目标版本。
需要说明的是,前述实施例中的相关解释说明,也适用于本实施例,此处不再赘述。
步骤303,响应于第一目标版本包括版本信息变化的第二目标版本和第三目标版本,则对第一处理节点中的模型版本进行维持,以得到维护后第一处理节点已加载的模型版本。
本申请实施例中,第一处理节点采用模型装载卸载器确定第一目标版本包括版本信息变化的第二目标版本和第三目标版本,即确定了第一处理节点中没有新增或删除的模型版本,则对第一处理节点加载的模型版本进行维持,以得到维护后第一处理节点已加载的模型版本。
步骤304,根据维护后第一处理节点已加载的模型版本中的第二目标版本和第三目标版本,查找第一期望模型版本列表,以得到第二目标版本的版本状态为禁用状态和第三目标版本的版本状态为启用状态。
其中,模型版本信息包含版本状态,在一种版本回退的场景下,第三目标版本为第二目标版本之前的历史版本,也就是说第二目标版本为待回退的目标版本,第三目标版本为回退至的目标版本。
步骤305,根据第二目标版本的禁用状态和第三目标版本的启用状态,调整第一实际模型版本列表中第二目标版本的版本状态为禁用状态和第三目标版本的版本状态为启用状态,以得到目标实际模型版本列表。
作为一种示例,第二目标版本为C,历史版本即第三目标版本为D,第二目标版本C因异常需要下线,历史版本即第三目标版本D代替第二目标版本C上线,查找第一期望模型版本列表以获取第二目标版本C的版本状态为禁用状态,第三目标版本D的版本状态为启用状态。进而,根据第二目标版本C的禁用状态,第三目标版本D的启用状态,调整第一实际模型版本列表中第二目标版本C的版本状态禁用状态,第三目标版本D的版本状态为启用状态,实现了第一期望模型版本列表和目标实际模型版本列表中模型版本的版本信息的同步。
步骤306,将目标实际模型版本列表同步至版本配置中心。
本申请实施例的一种实现方式中,目标实际模型版本列表,用于版本配置中心在确定目标实际模型版本列表中第二目标版本的版本状态为禁用状态的情况下,则确定第一处理节点中已经完成模型版本的版本状态的维护,则根据目标实际模型版本列表中第二目标版本的禁用状态,删除第一期望模型版本列表中第二目标版本的版本信息,以得到第二期望模型版本列表。
作为一种示例,目标实际模型版本列表,用于版本配置中心在获取到目标实际模型版本列表后,查找目标实际模型版本列表,确定目标实际模型版本列表中第二目标版本的版本状态为禁用状态,则确定目标实际模型版本列表中已经完成同步,同时,由于第一处理节点在基于第一期望模型版本列表分配业务消息时,由于第二目标版本的版本状态为禁用状态,则不再分配新的业务消息给第二目标版本处理,而在获取到第一期望模型版本列表之前分配至第二目标版本处理的业务消息也应该已经处理完成,因此,在这种情况下,可删除第一期望模型版本列表中第二目标版本的版本信息,实现对第一处理节点加载的模型版本的回退,降低了第一处理节点中的模型版本在模型版本更新过程中的不可用时间,相比于相关技术中,直接将需要下线回退的第二目标版本删除,导致分配至第二目标版本的业务消息无法正常向客户端反馈,使得在模型版本更新过程中客户端认为第一处理节点异常或不可用,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
步骤307,响应于获取到第二期望模型版本列表,根据第二期望模型版本列表中的模型版本信息,对第一处理节点获取的业务消息进行处理。
具体地,步骤307可参照前述实施例中的解释说明,原理相同,此处不再赘述。
步骤308,响应于获取到第二期望模型版本列表,将第二期望模型版本列表中的模型版本信息和目标实际模型版本列表中的模型版本信息进行比较。
步骤309,响应于目标实际模型版本列表中不包含第二目标版本的版本信息,则在第一处理节点中卸载第二目标版本,以得到维护后第一处理节点已加载的模型版本。
本申请实施例中,响应于获取到第二期望模型版本列表,第一处理节点中的模型加载卸载器在确定目标实际模型版本列表中不包含第二目标版本,也就是说第二目标版本因为版本异常删除或者是基于业务需求删除,则在第一处理节点中卸载第二目标版本,以得到卸载后第一处理节点已加载的模型版本,实现了在第一处理节点中对加载的模型版本的维护,降低了第一处理节点中内存资源的消耗,提高了第一处理节点的处理性能。
进一步,本申请实施例的另一种实现方式中,在第二目标版本不是因为异常而下线的情况下,目标实际模型版本列表,还可以用于版本配置中心根据目标实际模型版本列表中第二目标版本的禁用状态,维持第一期望模型版本列表中第二目标版本的版本状态为禁用状态,以得到第二期望模型版本列表。进而,将第二期望模型版本列表同步至第一处理节点后,第一处理节点会根据第二期望模型版本列表对第一处理节点加载的模型版本进行维持,以满足不同场景下的模型版本调整需求。
本申请实施例的模型服务的模型版本调整方法中,对于需要版本回退的场景下,通过控制需要进行版本回退的第二目标版本和第三目标版本的版本状态的改变,使得需要下线的第二目标版本在延迟一定时长后才下线删除,避免了第一处理节点在模型版本回退的过程中不可用的问题,相比于相关技术中,直接将需要下线回退的第二目标版本删除,导致分配至第二目标版本的业务消息无法正常向客户端反馈,使得在模型版本更新过程中客户端认为第一处理节点异常或不可用,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
基于上述实施例,本申请实施例提供了另一种模型服务的模型版本调整方法,图4为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图,执行主体为执行模型服务的版本配置中心,如图4所示,该方法包含以下步骤:
步骤401,确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表。
其中,第一处理节点对应的初始期望模型版本列表,为未更新前的期望模型版本列表,第一期望模型版本列表,为对初始期望模型版本列表更新得到的期望模型版本列表。
本申请实施例中,版本配置中心维护有各个处理节点对应的期望模型版本列表,本申请实施例中以第一处理节点对应的第一期望模型版本列表为例进行说明。在第一处理节点对应的模型版本的数量和/或模型版本信息发生更新的情况下,例如,版本新增、版本删除和版本状态信息发生变化中的至少一个,则版本配置中心会基于模型版本的更新信息更新初始期望模型版本列表以得到第一期望模型版本列表,将第一期望模型版本列表同步至第一处理节点。其中,第一期望模型版本列表中,包括需要第一处理节点加载的模型版本信息。其中,模型版本信息包含版本标识、版本状态和版本的存储位置,其中,版本标识用于唯一指示对应的模型版本,版本状态包含启用状态、禁用状态和异常状态等,可根据需求进行划分。版本的存储位置,指示了模型版本的存储地址,例如为URL地址。
具体地可参照前述实施例中的解释说明,原理相同,此处不再赘述。
步骤402,将第一期望模型版本列表同步给第一处理节点。
其中,第一期望模型版本列表,用于对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表。
本申请实施例的一种实现方式中,采用同步技术,例如Watch同步技术,将更新或调整得到第一处理节点对应的第一期望模型版本列表,同步至第一处理节点。
具体地可参照前述实施例中的解释说明,原理相同,此处不再赘述。
步骤403,获取第一处理节点同步至版本配置中心的目标实际模型版本列表。
步骤404,根据目标实际模型版本列表中的模型版本信息调整第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表。
本申请实施例中,第一实际模型版本列表调整完成后,实现了对第一处理节点实际加载的模型版本数量和模型版本信息的维护,则将目标实际模型版本列表同步至版本配置中心,作为一种实现方式,可采用基于Watch 机制的同步方法进行同步。其中,目标实际模型版本列表,用于版本配置中心根据目标实际模型版本列表调整第一期望模型版本列表,包括调整第一期望模型版本列表中包含的模型版本信息,以得到第二期望模型版本列表,以实现对第一处理节点实际可使用的模型版本和模型版本信息进行配置,实现了对第一处理节点加载的模型版本的维护,同时在维护过程中,通过对待维护的模型版本的模型版本信息的控制,降低了模型版本升级过程中模型的不可用时间,提高了第一处理节点的可用性,进而提高了在线模型服务的可用性。
步骤405,将第二期望模型版本列表同步至第一处理节点。
需要说明的是,前述方法实施例的相关解释说明也适用于本实施例中,原理相同,此处不再赘述。
本申请实施例的模型服务的模型版本调整方法中,根据更新或调整得到的第一期望模型版本列表中包含的模型版本信息,维护第一处理节点加载的模型版本的数量和模型版本信息,降低了第一处理节点因版本更新导致的不可用时间,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
基于上述实施例,本申请实施例提供了另一种模型服务的模型版本调整方法,图5为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图,执行主体为执行模型服务的版本配置中心,如图5所示,该方法包含以下步骤:
步骤501,确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表。
步骤502,将第一期望模型版本列表,同步给第一处理节点。
步骤503,获取第一处理节点同步至版本配置中心的目标实际模型版本列表。
其中,版本信息包含版本状态,目标实际模型版本列表中包括第一处理节点中加载的新增的模型版本的模型版本信息,新增的模型版本的模型版本信息包括的版本状态为禁用状态。
步骤504,根据目标实际模型版本列表中新增的模型版本的禁用状态,将第一期望模型版本列表中新增的模型版本的版本状态由禁用状态调整为启用状态,以得到第二期望模型版本列表。
步骤505,将第二期望模型版本列表同步至第一处理节点。
需要说明的是,前述方法实施例的相关解释说明和有益效果也适用于本实施例中,原理相同,此处不再赘述。
基于上述实施例,本申请实施例提供了另一种模型服务的模型版本调整方法,图6为本申请实施例提供的另一种模型服务的模型版本调整方法的流程示意图,执行主体为执行模型服务的版本配置中心,如图6所示,该方法包含以下步骤:
步骤601,确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表。
步骤602,将第一期望模型版本列表,同步给第一处理节点。
步骤603,获取第一处理节点同步至版本配置中心的目标实际模型版本列表。
其中,目标实际模型版本列表中包括第一处理节点中加载的第二目标版本的模型版本信息,第二目标版本的模型版本信息包括的版本状态为禁用状态。
步骤604,根据目标实际模型版本列表中第二目标版本的禁用状态,删除第一期望模型版本列表中第二目标版本的模型版本信息,以得到第二期望模型版本列表。
其中,第二目标版本的版本状态为禁用状态。
步骤605,将第二期望模型版本列表同步至第一处理节点。
需要说明的是,前述方法实施例的相关解释说明和有益效果也适用于本实施例中,原理相同,此处不再赘述。
基于上述实施例,图7为本申请实施例提供的一种模型服务的模型版本调整方法的场景示意图。
如图7所示,在线模型服务,通常是分布式的,即包含分布式的多个模型服务实例,还可以包含用于配置模型服务实例的服务部署中心和版本配置中心,每一模型服务实例即为一个处理节点,图7中以在线模型服务包括3个模型服务实例为例,3个模型服务实例分别为模型服务实例1、模型服务实例2和模型服务实例3。本申请实施例中对在线模型服务包括的模型服务实例的数量不进行限定。各个模型服务实例中均配置有对应的模型版本,在线模型服务实例的模型版本更新,可以是基于至少一个模型服务实例的模型版本更新来完成。
以模型服务实例1进行版本回退为例,其中,版本配置中心,根据要进行回退的目标模型版本A,确定目标模型版本A要回退至到历史模型版本B,则版本配置中心更新模型服务实例1对应的第一期望模型版本列表1,即将第一期望模型版本列表1中的目标模型版本A的版本状态更改为禁用状态,将历史模型版本B的版本状态更改为启用状态,得到更新的第一期望模型版本列表1,并将更新的第一期望模型版本列表1发送至模型服务实例1。模型服务实例1在接收到版本配置中心同步的更新的第一期望模型版本列表1以后,覆盖本身已存在的期望模型版本列表。
进而,模型装载卸载器,将更新的第一期望模型版本列表1中包含的各个模型版本的版本标识和第一实际模型版本列表1中包含的各个模型版本的版本标识进行比对,以确定更新的第一期望模型版本列表1和第一实际模型版本列表1中是否版本标识相同,以对第一处理节点中的模型版本和模型版本信息进行维护,以得到第一处理节点的目标实际模型版本列表1,实现了对模型服务实例1中模型版本的维护。具体的可参照前述实施例中的解释说明,原理相同,此处不再赘述。
进而,将目标实际模型版本列表1同步至版本配置中心,版本配置中心根据目标实际模型版本列表1,对更新的第一期望模型版本列表再次进行更新,以得到第二期望模型版本列表1,并将第二期望模型版本列表1同步至第一处理节点。
进一步,在获取到版本配置中心同步的第二期望模型版本列表1后,请求分配器对获取到的业务消息,若从第二期望模型版本列表1中确定出版本状态为启用状态的多个模型版本C,最后从多个模型版本C中,确定对模型服务实例1获取的业务消息进行处理的目标模型版本D,以对业务消息进行响应。
需要说明的是,在存在多个处理节点的情况下,各个处理节点的版本维护可以是同步进行的,也可以是逐个滚动进行的,以降低模型服务不可用时间。
需要理解的是,相关技术中各个模型服务实例在进行模型维护,例如更新或回退的场景下,各个模型服务实例需要进行重启才能更新服务进行所维护的模型版本,而各个模型服务实例在重启过程中是出于不可用状态,导致不可用时长较长,而本申请中在模型版本维护的过程中,各个模型服务实例一直在运行,不需要进行模型服务实例的重启,而同步对应的期望版本列表的时间可以作为毫秒级,因此,也降低了各个模型服务实例的不可用时间。
需要说明的是,前述实施例中相关的解释说明和有益效果可适用于本实施例中,此处不再赘述。
为了实现上述实施例,本申请实施例还提出一种模型服务的模型版本调整装置。
图8为本申请实施例提供的一种模型服务的模型版本调整装置的结构示意图。
如图8所示,该装置可以包括:
获取模块81,用于获取版本配置中心同步的所述第一处理节点对应的第一期望模型版本列表;
第一处理模块82,用于根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
同步模块83,用于将所述目标实际模型版本列表同步至所述版本配置中心;所述目标实际模型版本列表,用于调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
第二处理模块84,用于响应于获取到所述第二期望模型版本列表,根据所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
进一步,在本申请实施例的一种实现方式中,第一处理模块82,用于:
根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本;
根据维护后所述第一处理节点已加载的模型版本和所述第一期望模型版本列表,对所述第一处理节点中的第一实际模型版本列表中的模型版本信息进行维护,以得到所述目标实际模型版本列表。
在本申请实施例的一种实现方式中,第一处理模块82,具体用于:
将所述第一期望模型版本列表中的模型版本信息和所述第一实际模型版本列表中的模型版本信息进行比较,以从所述第一期望模型版本列表中确定待维护的第一目标版本;
根据所述第一目标版本,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本。
在本申请实施例的一种实现方式中,所述第一目标版本为新增的模型版本,第一处理模块82,具体用于:
响应于所述第一目标版本为新增的模型版本,在所述第一处理节点中加载所述新增的模型版本,以得到维护后所述第一处理节点已加载的模型版本。
本申请实施例的一种实现方式中,第一处理模块82,具体用于:
根据维护后所述第一处理节点已加载的模型版本中的所述新增的模型版本,查找所述第一期望模型版本列表以得到所述新增的模型版本的模型版本信息;
将所述新增的模型版本的模型版本信息添加至所述第一实际模型版本列表,以得到所述目标实际模型版本列表;所述新增的模型版本的模型版本信息包含的版本状态为禁用状态。
本申请实施例的一种实现方式中,所述第二期望模型版本列表中所述新增的模型版本的版本状态为启用状态。
本申请实施例的一种实现方式中,所述第一目标版本包括版本信息变化的第二目标版本和第三目标版本,第一处理模块82,具体用于:
响应于所述第一目标版本包括版本信息变化的第二目标版本和第三目标版本,则对所述第一处理节点中的模型版本进行维持,以得到维护后所述第一处理节点已加载的模型版本。
本申请实施例的一种实现方式中,版本信息包含版本状态,第一处理模块82,具体用于:
根据维护后所述第一处理节点已加载的模型版本中的所述第二目标版本和所述第三目标版本,查找所述第一期望模型版本列表,以得到所述第二目标版本的版本状态为禁用状态和所述第三目标版本的版本状态为启用状态;
根据所述第二目标版本的禁用状态和所述第三目标版本的启用状态,调整所述第一实际模型版本列表中所述第二目标版本的版本状态为禁用状态和所述第三目标版本的版本状态为启用状态,以得到所述目标实际模型版本列表。
本申请实施例的一种实现方式中,所述第二期望模型版本列表中不包括所述第二目标版本的模型版本信息。
本申请实施例的一种实现方式中,该装置还包括:
卸载模块,用于将所述第二期望模型版本列表中的模型版本信息和所述目标实际模型版本列表中的模型版本信息进行比较;响应于所述目标实际模型版本列表中不包含所述第二目标版本的模型版本信息,则在所述第一处理节点中卸载所述第二目标版本,以得到维护后所述第一处理节点已加载的模型版本。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本申请实施例的模型服务的模型版本调整装置中,根据获取到的第一期望模型版本列表中包含的模型版本信息,维护第一处理节点加载的模型的模型版本数量和模型版本的版本状态,降低了第一处理节点因模型版本更新导致的不可用时间,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
为了实现上述实施例,本申请实施例还提出一种模型服务的模型版本调整装置,设置于执行模型服务的版本配置中心。
图9为本申请实施例提供的一种模型服务的模型版本调整装置的结构示意图。
如图9所示,该装置可以包括:
确定模块91,用于确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表;
同步模块92,用于将所述第一期望模型版本列表,同步给所述第一处理节点,其中,所述第一期望模型版本列表,用于对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表。
获取模块93,用于获取所述第一处理节点同步至所述版本配置中心的所述目标实际模型版本列表。
调整模块94,用于根据所述目标实际模型版本列表中模型的版本信息调整所述第一期望模型版本列表中模型的版本信息,以得到第二期望模型版本列表。
所述同步模块92,还用于将所述第二期望模型版本列表同步至所述第一处理节点;其中,所述第二期望模型版本列表,用于所述第一处理节点采用所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
进一步,在本申请实施例的一种实现方式中,模型版本信息包含版本状态,所述目标实际模型版本列表中包括所述第一处理节点中加载的新增的模型版本的版本状态为禁用状态,调整模块94,具体用于:
根据所述目标实际模型版本列表中所述新增的模型版本的禁用状态,将所述第一期望模型版本列表中所述新增的模型版本的版本状态由禁用状态调整为启用状态,以得到所述第二期望模型版本列表。
在本申请实施例的一种实现方式中,模型版本信息包含版本状态,所述目标实际模型版本列表中包括所述第一处理节点中加载的第二目标版本的版本状态为禁用状态,调整模块94,具体用于:
根据所述目标实际模型版本列表中所述第二目标版本的禁用状态,删除所述第一期望模型版本列表中所述第二目标版本的模型版本信息,以得到所述第二期望模型版本列表。
需要说明的是,前述对方法实施例的解释说明和有益效果也适用于该实施例的装置,此处不再赘述。
本申请实施例的模型服务的模型版本调整装置中,根据更新得到的第一期望模型版本列表中包含的至少一个模型版本的模型版本信息,维护第一处理节点加载的模型版本和模型版本信息,通过对模型版本的版本状态的控制,降低了第一处理节点因模型版本更新导致的不可用时间,提高了第一处理节点的可用性,从而提高了模型服务的可用性。
为了实现上述实施例,本申请还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述方法实施例所述的方法。
为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如前述方法实施例所述的方法。
为了实现上述实施例,本申请还提出一种计算机程序产品,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的方法。
图10为本申请一示例性实施例提供的一种电子设备的框图。该电子设备包括处理器1001,以及用于存储处理器1001可执行指令的存储器1002。其中,处理器1001被配置为执行所述指令,以实现本申请前述方法实施例中的方法。在实际应用中,该电子设备还可以包括网络接口1003、I/O控制器1004、大容量存储设备1005,以及用于连接它们的总线1006。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器1002,上述指令可由电子设备的处理器1001执行以实现前述方法实施例中的方法。可选地,存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
存储器1002被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,数据,消息,图片等。存储器1002可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
在示例性实施例中,电子设备可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1002,上述指令可由电子设备的处理器1001执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (17)

1.一种模型服务的模型版本调整方法,其特征在于,由执行模型服务的至少一个处理节点中的第一处理节点执行,包括:
获取版本配置中心同步的所述第一处理节点对应的第一期望模型版本列表;
根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
将所述目标实际模型版本列表同步至所述版本配置中心;所述目标实际模型版本列表,用于调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
响应于获取到所述第二期望模型版本列表,根据所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表,包括:
根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本;
根据维护后所述第一处理节点已加载的模型版本和所述第一期望模型版本列表,对所述第一处理节点中的第一实际模型版本列表中的模型版本信息进行维护,以得到所述目标实际模型版本列表。
3.如权利要求2所述的方法,其特征在于,所述根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本,包括:
将所述第一期望模型版本列表中的模型版本信息和所述第一实际模型版本列表中的模型版本信息进行比较,以从所述第一期望模型版本列表中确定待维护的第一目标版本;
根据所述第一目标版本,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本。
4.如权利要求3所述的方法,其特征在于,所述第一目标版本为新增的模型版本,所述根据所述第一目标版本,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本,包括:
响应于所述第一目标版本为新增的模型版本,在所述第一处理节点中加载所述新增的模型版本,以得到维护后所述第一处理节点已加载的模型版本。
5.如权利要求4所述的方法,其特征在于,所述根据维护后所述第一处理节点已加载的模型版本和所述第一期望模型版本列表,对所述第一处理节点中的第一实际模型版本列表中的模型版本信息进行维护,以得到所述目标实际模型版本列表,包括:
根据维护后所述第一处理节点已加载的模型版本中的所述新增的模型版本,查找所述第一期望模型版本列表以得到所述新增的模型版本的模型版本信息;
将所述新增的模型版本的模型版本信息添加至所述第一实际模型版本列表,以得到所述目标实际模型版本列表;所述新增的模型版本的模型版本信息包含的版本状态为禁用状态。
6.如权利要求5所述的方法,其特征在于,所述第二期望模型版本列表中所述新增的模型版本的版本状态为启用状态。
7.如权利要求3所述的方法,其特征在于,所述第一目标版本包括版本信息变化的第二目标版本和第三目标版本,所述根据所述第一目标版本,对所述第一处理节点中的模型版本进行维护,以得到维护后所述第一处理节点已加载的模型版本,包括:
响应于所述第一目标版本包括版本信息变化的第二目标版本和第三目标版本,则对所述第一处理节点中的模型版本进行维持,以得到维护后所述第一处理节点已加载的模型版本。
8.如权利要求7所述的方法,其特征在于,所述版本信息包含版本状态;所述根据维护后所述第一处理节点已加载的模型版本和所述第一期望模型版本列表,对所述第一处理节点中的第一实际模型版本列表中的模型版本信息进行维护,以得到所述目标实际模型版本列表,包括:
根据维护后所述第一处理节点已加载的模型版本中的所述第二目标版本和所述第三目标版本,查找所述第一期望模型版本列表,以得到所述第二目标版本的版本状态为禁用状态和所述第三目标版本的版本状态为启用状态;
根据所述第二目标版本的禁用状态和所述第三目标版本的启用状态,调整所述第一实际模型版本列表中所述第二目标版本的版本状态为禁用状态和所述第三目标版本的版本状态为启用状态,以得到所述目标实际模型版本列表。
9.如权利要求8所述的方法,其特征在于,所述第二期望模型版本列表中不包括所述第二目标版本的模型版本信息。
10.如权利要求9所述的方法,其特征在于,响应于获取到所述第二期望模型版本列表之后,还包括:
将所述第二期望模型版本列表中的模型版本信息和所述目标实际模型版本列表中的模型版本信息进行比较;
响应于所述目标实际模型版本列表中不包括所述第二目标版本的模型版本信息,则在所述第一处理节点中卸载所述第二目标版本,以得到维护后所述第一处理节点已加载的模型版本。
11.一种模型服务的模型版本调整方法,其特征在于,由执行模型服务的版本配置中心执行,包括:
确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表;
将所述第一期望模型版本列表,同步给所述第一处理节点;其中,所述第一期望模型版本列表,用于对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
获取所述第一处理节点同步至所述版本配置中心的所述目标实际模型版本列表;
根据所述目标实际模型版本列表中的模型版本信息调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
将所述第二期望模型版本列表同步至所述第一处理节点;其中,所述第二期望模型版本列表,用于所述第一处理节点采用所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
12.如权利要求11所述的方法,其特征在于,所述模型版本信息包含版本状态,所述目标实际模型版本列表中包括所述第一处理节点中加载的新增的模型版本的版本状态为禁用状态,所述根据所述目标实际模型版本列表中的模型版本信息调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表,包括:
根据所述目标实际模型版本列表中所述新增的模型版本的禁用状态,将所述第一期望模型版本列表中所述新增的模型版本的版本状态由禁用状态调整为启用状态,以得到所述第二期望模型版本列表。
13.如权利要求11所述的方法,其特征在于,所述模型版本信息包含版本状态,所述目标实际模型版本列表中包括所述第一处理节点中加载的第二目标版本的版本状态为禁用状态,所述根据所述目标实际模型版本列表中的模型版本信息调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表,包括:
根据所述目标实际模型版本列表中所述第二目标版本的禁用状态,删除所述第一期望模型版本列表中所述第二目标版本的模型版本信息,以得到所述第二期望模型版本列表。
14.一种模型服务的模型版本调整装置,其特征在于,设置于执行模型服务的至少一个处理节点中的第一处理节点,包括:
获取模块,用于获取版本配置中心同步的所述第一处理节点对应的第一期望模型版本列表;
第一处理模块,用于根据所述第一期望模型版本列表,对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
同步模块,用于将所述目标实际模型版本列表同步至所述版本配置中心;所述目标实际模型版本列表,用于调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
第二处理模块,用于响应于获取到所述第二期望模型版本列表,根据所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
15.一种模型服务的模型版本调整装置,其特征在于,设置于执行模型服务的版本配置中心,包括:
确定模块,用于确定对第一处理节点对应的初始期望模型版本列表更新得到的第一期望模型版本列表;
同步模块,用于将所述第一期望模型版本列表,同步给所述第一处理节点;其中,所述第一期望模型版本列表,用于对所述第一处理节点中的模型版本和模型版本信息进行维护,以得到所述第一处理节点的目标实际模型版本列表;
获取模块,用于获取所述第一处理节点同步至所述版本配置中心的所述目标实际模型版本列表;
调整模块,用于根据所述目标实际模型版本列表中模型的版本信息调整所述第一期望模型版本列表中的模型版本信息,以得到第二期望模型版本列表;
所述同步模块,还用于将所述第二期望模型版本列表同步至所述第一处理节点;其中,所述第二期望模型版本列表,用于所述第一处理节点采用所述第二期望模型版本列表中的模型版本信息,对所述第一处理节点获取的业务消息进行处理。
16.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-10中任一所述的方法,或实现如权利要求11-13中任一所述的方法。
17.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-10中任一所述的方法,或实现如权利要求11-13中任一所述的方法。
CN202211316726.7A 2022-10-26 2022-10-26 模型服务的模型版本调整方法、装置和电子设备 Active CN115373733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211316726.7A CN115373733B (zh) 2022-10-26 2022-10-26 模型服务的模型版本调整方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211316726.7A CN115373733B (zh) 2022-10-26 2022-10-26 模型服务的模型版本调整方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN115373733A true CN115373733A (zh) 2022-11-22
CN115373733B CN115373733B (zh) 2023-01-24

Family

ID=84073625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211316726.7A Active CN115373733B (zh) 2022-10-26 2022-10-26 模型服务的模型版本调整方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN115373733B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1160666A2 (en) * 2000-04-27 2001-12-05 Ncr International Inc. Switching versions of software in a system background
CN110633096A (zh) * 2018-06-21 2019-12-31 阿里巴巴集团控股有限公司 节点控制方法及装置、版本控制方法及装置、分布式系统
CN113296687A (zh) * 2020-06-10 2021-08-24 阿里巴巴集团控股有限公司 数据处理方法、装置、计算设备和介质
CN113791798A (zh) * 2020-06-28 2021-12-14 北京沃东天骏信息技术有限公司 模型更新方法及装置、计算机存储介质、电子设备
CN114385207A (zh) * 2021-12-30 2022-04-22 上海浦东发展银行股份有限公司 基于微服务架构的应用发布方法、装置、计算机设备
CN114925084A (zh) * 2022-05-31 2022-08-19 易保网络技术(上海)有限公司 分布式事务处理方法、系统、设备及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1160666A2 (en) * 2000-04-27 2001-12-05 Ncr International Inc. Switching versions of software in a system background
CN110633096A (zh) * 2018-06-21 2019-12-31 阿里巴巴集团控股有限公司 节点控制方法及装置、版本控制方法及装置、分布式系统
CN113296687A (zh) * 2020-06-10 2021-08-24 阿里巴巴集团控股有限公司 数据处理方法、装置、计算设备和介质
CN113791798A (zh) * 2020-06-28 2021-12-14 北京沃东天骏信息技术有限公司 模型更新方法及装置、计算机存储介质、电子设备
CN114385207A (zh) * 2021-12-30 2022-04-22 上海浦东发展银行股份有限公司 基于微服务架构的应用发布方法、装置、计算机设备
CN114925084A (zh) * 2022-05-31 2022-08-19 易保网络技术(上海)有限公司 分布式事务处理方法、系统、设备及可读存储介质

Also Published As

Publication number Publication date
CN115373733B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
US8074213B1 (en) Automatic software updates for computer systems in an enterprise environment
US20100262960A1 (en) Communication Terminal
CN111273871B (zh) 容器平台上动态分配存储资源的方法及装置
US8380951B1 (en) Dynamically updating backup configuration information for a storage cluster
CN107404509B (zh) 分布式服务配置系统及信息管理方法
CN108829720B (zh) 数据处理方法及装置
CN107453932B (zh) 一种分布式存储系统管理方法及其装置
CN111400285B (zh) mySQL数据分片处理方法、装置、计算机设备和可读存储介质
WO2013040906A1 (zh) 一种基站软件版本管理的方法和系统
CN114385561A (zh) 文件管理方法和装置及hdfs系统
CN111726388A (zh) 一种跨集群高可用的实现方法、装置、系统及设备
CN114844879B (zh) 镜像管理方法、电子设备和存储介质
CN114866570A (zh) 一种信息处理方法、装置、电子设备及存储介质
US8499080B2 (en) Cluster control apparatus, control system, control method, and control program
CN113190619B (zh) 分布式kv数据库的数据读写方法、系统、设备和介质
CN115373733B (zh) 模型服务的模型版本调整方法、装置和电子设备
CN115766715B (zh) 一种超融合集群监控方法和系统
CN110096285B (zh) 软件系统的部署方法、装置、计算机设备及存储介质
CN114675950A (zh) 任务调度方法及其装置
CN116599841B (zh) 一种大规模云存储系统扩容方法、装置、设备及存储介质
US20240143318A1 (en) Efficient configuration management in continuous deployment
US20240143315A1 (en) Efficient configuration management in continuous deployment
CN115473802B (zh) 节点管理方法、系统、设备及存储介质
US20230367632A1 (en) Job management system and control method thereof
US20230403324A1 (en) Data sharing system, data sharing method and non-transitory computer-readable recording medium for data sharing program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant