CN114398188A - 模型管理方法、模型管理服务、客户端及存储介质 - Google Patents
模型管理方法、模型管理服务、客户端及存储介质 Download PDFInfo
- Publication number
- CN114398188A CN114398188A CN202210044896.8A CN202210044896A CN114398188A CN 114398188 A CN114398188 A CN 114398188A CN 202210044896 A CN202210044896 A CN 202210044896A CN 114398188 A CN114398188 A CN 114398188A
- Authority
- CN
- China
- Prior art keywords
- model
- information
- meta
- service
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003860 storage Methods 0.000 title claims abstract description 419
- 238000007726 management method Methods 0.000 title claims abstract description 250
- 238000000034 method Methods 0.000 claims abstract description 80
- 238000004458 analytical method Methods 0.000 claims abstract description 42
- 230000004044 response Effects 0.000 claims description 37
- 230000008859 change Effects 0.000 claims description 33
- 238000012217 deletion Methods 0.000 claims description 27
- 230000037430 deletion Effects 0.000 claims description 27
- 238000004140 cleaning Methods 0.000 claims description 23
- 230000001360 synchronised effect Effects 0.000 claims description 22
- 238000012795 verification Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 34
- 230000006870 function Effects 0.000 description 16
- 238000009826 distribution Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 206010039203 Road traffic accident Diseases 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请实施例提供一种模型管理方法、模型管理服务、客户端及存储介质,其中,所述方法包括:在所述模型管理服务满足预设同步条件的情况下,从对象存储服务中同步目标模型的目标模型文件和目标模型元信息;响应于视图解析服务的加载请求,将所述目标模型文件和所述目标模型元信息发送至所述视图解析服务。
Description
技术领域
本申请实施例涉及机器学习领域,涉及但不限于一种模型管理方法、模型 管理服务、客户端及存储介质。
背景技术
随着市场规模增大,视图分析接入规模也越来越大。这些模型在支持上千 个视图解析服务的开放视觉平台上使用时,占用大量的磁盘空间,在反复传输 过程中也占用大量带宽和磁盘空间,使得智能分析系统启动变慢,而且给存储 系统和分布式系统整个网络系统带来极大压力。
发明内容
本申请实施例提供一种模型管理方法。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种模型管理方法,应用于模型管理服务,所述方法包 括:
在所述模型管理服务满足预设同步条件的情况下,从对象存储服务中同步 目标模型的目标模型文件和目标模型元信息;
响应于视图解析服务的加载请求,将所述目标模型文件和所述目标模型元 信息发送至所述视图解析服务。
在一些实施例中,所述在所述模型管理服务满足预设同步条件的情况下, 从对象存储服务中同步目标模型的目标模型文件和目标模型元信息之前,所述 方法还包括:接收客户端发送的模型的上传请求;所述模型包括:模型文件和 模型元信息;响应所述上传请求,将所述模型文件和所述模型元信息上传至所 述对象存储服务。如此,通过在对象存储服务中分离存储模型文件和模型元信 息,能够加快模型的上传速度和传输速度。
在一些实施例中,所述响应所述上传请求,将所述模型文件和所述模型元 信息上传至所述对象存储服务,包括:响应所述上传请求,将所述模型文件和 所述模型元信息按照不同的存储地址上传至所述对象存储服务。这样,将模型 文件和模型元信息存储在对象存储服务的不同位置,能够实现模型文件和模型 元信息的分开存储,节省传输带宽。
在一些实施例中,所述响应所述上传请求,将所述模型文件和所述模型元 信息按照不同的存储地址上传至所述对象存储服务,包括:基于所述模型元信 息,确定所述对象存储服务中是否包括所述模型文件;响应于所述对象存储服 务中不包括所述模型文件,将所述模型文件按照预设存储地址上传至所述对象 存储服务;基于所述预设存储地址,对所述模型元信息进行更新;将更新后的 模型元信息按照多级存储地址上传至所述对象存储服务。如此,现了模型文件 和模型元信息在对象存储服务中的分离存储,能够快速完成模型的上传,而且 便于客户端能够基于该更新后的模型元信息定位模型文件。
在一些实施例中,所述基于所述模型元信息,确定所述对象存储服务中是 否包括所述模型文件,包括:
确定所述模型元信息指向预设模型文件的引用路径;
基于所述引用路径对所述模型文件进行校验,得到校验结果;
基于所述校验结果,确定所述对象存储服务中是否包括所述模型文件。
在一些实施例中,所述模型管理服务满足预设同步条件,至少包括以下之 一:
所述模型管理服务接收到所述对象存储服务发送的事件通知消息;其中, 所述事件通知消息表征所述对象存储服务中的模型变化事件;
所述模型管理服务进行数据同步的历史时刻与当前时刻之间的时间间隔达 到第一预设时长;
所述模型管理服务在第二预设时长内未发起数据同步,且接收到客户端发 送的模型同步指令;其中,所述第二预设时长大于所述第一预设时长。
在一些实施例中,其特征在于,所述在所述模型管理服务满足预设同步条 件的情况下,从对象存储服务中同步目标模型的目标模型文件和目标模型元信 息,包括:
确定在所述预设同步条件下所述对象存储服务中的模型变化事件;
获取所述对象存储服务中与所述模型变化事件匹配的第一模型列表;
在所述第一模型列表中,确定所述目标模型文件和所述目标模型元信息;
基于所述目标模型文件和所述目标模型元信息,同步所述模型管理服务中 的第二模型列表;其中,模型列表包括多个模型文件,以及每一模型文件对应 的至少一组模型元信息。
在一些实施例中,在所述模型变化事件包括模型添加的情况下,在所述第 一模型列表中,确定所述目标模型文件和所述目标模型元信息,包括:
在所述第一模型列表中,确定与所述第二模型列表不同的所述目标模型文 件和所述目标模型元信息;
所述基于所述目标模型文件和所述目标模型元信息,同步所述模型管理服 务中的第二模型列表,包括:
从所述对象存储服务中下载所述目标模型文件和所述目标模型元信息;
将所述目标模型文件和所述目标模型元信息添加至所述第二模型列表。
在一些实施例中,在所述模型变化事件包括模型删除的情况下,所述在所 述第一模型列表中,确定所述目标模型文件和所述目标模型元信息,包括:
接收所述客户端发送的模型删除请求;其中,所述模型删除请求携带第三 存储地址;
基于所述第三存储地址,从所述第一模型列表中确定所述目标模型元信息;
确定所述目标模型元信息在所述第一模型列表中指向的所述目标模型文件。
在一些实施例中,所述基于所述目标模型文件和所述目标模型元信息,同 步所述模型管理服务中的第二模型列表,包括:
响应于所述模型删除请求,对所述对象存储服务中的所述目标模型元信息 和所述目标模型文件进行删除,以使所述对象存储服务广播所述同步清理指令;
接收所述对象存储服务在删除所述目标模型文件和所述目标模型元信息之 后广播的所述同步清理指令;
响应于所述同步清理指令,在述第二模型列表中删除所述目标模型文件和 所述目标模型元信息。
在一些实施例中,所述响应于所述模型删除请求,对所述对象存储服务中 的所述待删除模型元信息和所述待删除模型文件进行删除,包括:
响应于所述模型删除请求,在所述对象存储服务中删除所述目标模型元信 息;
按照预设时长间隔,在所述对象存储服务中删除所述目标模型文件。
在一些实施例中,所述方法还包括:
响应于接收到所述客户端发送的模型元信息的检索请求,确定所述检测请 求携带的多级存储地址的索引参数;
基于所述多级存储地址的索引参数中的至少一级存储地址的索引参数,对 所述对象存储服务中的模型元信息进行检索,得到匹配所述检索请求的待反馈 模型元信息;
将所述待反馈模型元信息反馈至所述客户端。
在一些实施例中,在所述对象存储服务中的模型变化事件包括模型添加的 情况下,所述响应于视图解析服务的加载请求,将所述目标模型文件和所述目 标模型元信息发送至所述视图解析服务,包括:
接收所述视图解析服务在运行运行软件工具包的情况下发送的模型下载请 求;其中,所述运行软件工具包包括所述模型管理服务的接口;
响应于所述模型下载请求,通过所述接口将所述目标模型文件和所述目标 模型元信息发送至所述视图解析服务。
本申请实施例提供一种模型管理方法,应用于客户端,所述方法包括:向 模型管理服务发送目标模型的加载请求;所述目标模型包括:目标模型文件和 目标模型元信息;接收所述模型管理服务基于所述加载请求发送的所述目标模 型元信息在对象存储服务中的多级存储地址;基于所述多级存储地址,在所述 对象存储服务中确定所述目标模型元信息和所述目标模型元信息对应的所述目 标模型文件。如此,客户端能够从模型管理服务同步加载目标模型元信息和目 标模型文件,从而能够快速实现客户端与模型管理服务之间的数据同步。
在一些实施例中,所述基于所述多级存储地址,在所述对象存储服务中确 定所述目标模型元信息和所述目标模型元信息对应的所述目标模型文件,包括: 基于所述多级存储地址存储地址在所述对象存储服务中定位所述目标模型元信 息;确定所述目标模型元信息携带的所述目标模型文件在所述对象存储服务中 的存储地址;基于所述目标模型文件在所述对象存储服务中的存储地址,在所 述对象存储服务中定位所述目标模型文件。如此,使得客户端能够快速且准确 地从对象存储服务查询目标模型元信息和目标模型文件。
在一些实施例中,所述客户端包括至少一个视图解析服务,所述基于所述 多级存储地址,在所述对象存储服务中确定所述目标模型元信息和所述目标模 型元信息对应的所述目标模型文件之后,所述方法还包括:缓存所述目标模型 文件和所述目标模型元信息;将所述目标模型文件和所述目标模型元信息共享 至所述至少一个视图解析服务。如此,使得客户端的多个视图解析服务之间能 够共享客户端缓存的目标模型文件和目标模型元信息
本申请实施例提供一种模型管理服务,所述模型管理服务包括:
第一同步模块,用于在所述模型管理服务满足预设同步条件的情况下,从 对象存储服务中同步目标模型的目标模型文件和目标模型元信息;
第一响应模块,用于响应于视图解析服务的加载请求,将所述目标模型文 件和所述目标模型元信息发送至所述视图解析服务。
本申请实施例提供一种客户端,所述客户端包括:
处理器、存储有所述处理器可执行指令的存储器;其中,所述处理器用于:
向模型管理服务发送目标模型的加载请求;所述目标模型包括:目标模型 文件和目标模型元信息;
接收所述模型管理服务基于所述加载请求发送的所述目标模型元信息在对 象存储服务中的存储地址;
基于所述存储地址,在所述对象存储服务中确定所述目标模型元信息和所 述目标模型元信息对应的所述目标模型文件。
对应地,本申请实施例提供一种计算机存储介质,所述计算机存储介质上 存储有计算机可执行指令,该计算机可执行指令被执行后,能够实现上述的模 型管理方法。
本申请实施例提供一种模型管理方法、模型管理服务、客户端及存储介质, 在模型管理服务满足预设同步条件的情况下,模型管理服务与对象存储服务进 行数据同步,从对象存储服务中同步目标模型的目标模型文件和目标模型元信 息。这样,将一个目标模型的目标模型文件和目标模型元信息以分离的方式存 储在对象存储服务中,能够提高传输带宽,从而提高智能分析系统的启动速度。 接收到视图解析服务的加载请求后,通过模型管理服务将目标模型文件和目标 模型元信息同步到视图解析服务;如此,通过多级缓存分发的方式进行数据同 步,能够满足更大规模更大压力的模型的需求。
附图说明
图1为本申请实施例提供的模型管理方法的实现流程示意图;
图2为本申请实施例提供的模型管理方法的另一实现流程示意图;
图3为本申请实施例提供的模型管理方法的另一实现流程示意图;
图4为本申请实施例提供的模型管理方法的实现流程示意图;
图5为本申请实施例提供的模型管理方法的实现架构图;
图6为本申请实施例提供的对象管理方法的实现流程交互示意图;
图7为本申请实施例模型管理服务的结构组成示意图;
图8为本申请实施例客户端的组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请 实施例中的附图,对发明的具体技术方案做进一步详细描述。以下实施例用于 说明本申请,但不用来限制本申请的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集, 但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集, 并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对 象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情 况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除 了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术 领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申 请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词 和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI),是研究、开发用于模拟、延伸 和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智 能是计算机科学的一个分支,试图了解智能的实质,并生产出一种新的能以人 类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、 图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日 益成熟,应用领域也不断扩大。人工智能可以对人的意识、思维的信息过程的 模拟。
2)计算机视觉,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测 量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送 给仪器检测的图像。
3)对象存储,用来描述解决和处理离散单元的方法的通用术语。对象在一 个层结构中不会再有层级结构,是以扩展元数据为特征的。
4)元信息,是关于信息的信息,元信息允许服务器提供所发送数据的信息; 在一些实施例中,如超文本传输协议可以提高所发的对象语言和对象,也可以 用元信息来实现有条件请求以及报告事务完成。收到数据的浏览器可以根据元 信息确定服务器发来的是什么内容,预料有什么数据,确知是否接收完整的数 据,以及过程中是否出错,这样客户就可以知道传输对象的类型。在本申请实 施例中,模型元信息用于描述模型的详细信息,包括模型所适用的硬件信息、 软件信息以及模型内的网络参数等。
下面说明本申请实施例提供的模型管理设备的示例性应用,本申请实施例 提供的设备可以实施为具有数据处理功能的笔记本电脑,平板电脑,台式计算 机,移动设备(例如,个人数字助理,专用消息设备,便携式游戏设备)等各 种类型的用户终端,也可以实施为服务器。下面,将说明设备实施为终端或服 务器时示例性应用。
该方法可以应用于电子设备,该方法所实现的功能可以通过电子设备中的 处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可 见,该电子设备至少包括处理器和存储介质。
本申请实施例提供一种模型管理方法,该方法应用于模型管理服务,如图 1所示,结合如图1所示步骤进行说明:
步骤S101,在所述模型管理服务满足预设同步条件的情况下,从对象存储 服务中同步目标模型的目标模型文件和目标模型元信息。
在一些实施例中,预设同步条件用于表示模型管理服务与对象存储服务进 行数据同步的条件;模型管理服务满足预设同步条件可以理解为模型管理服务 满足与对象存储服务进行数据同步的条件;因此,在模型管理服务满足预设同 步条件的情况下,模型管理服务启动同步机制,实现与对象存储服务的数据同 步。模型管理服务用于对上传到模型管理系统的算法模型进行管理。对象存储 服务用于接收客户端上传的模型的模型文件和模型元信息,并通过分开存储的 方式,在存储桶中存储模型的模型文件和模型元信息。目标模型可以是任一算 法模型,比如,实现目标识别的神经网络模型,或者进行语义分割的深度神经 网络模型等。
在一些可能的实现方式中,将需要上传的模型设计为模型元信息和模型文 件,其中,模型元信息描述模型的所有信息,比如,模型应用的硬件,加速卡, 运行环境,模型名称等。模型元信息中还可以包括开发人员添加的硬件、软件 或程序的描述信息等。模型文件为原始二进制模型文件,包括该模型的实现程 序和实现工作流等;模型元信息和模型文件二者分开存储,且不同的模型元信 息可以指向(或引用)同一个模型文件。在一个具体例子中,以目标模型为目 标识别的神经网络模型为例,模型文件为该神经网络模型的实现程序以及算法 工作流等二进制数据,模型元信息包括该神经网络模型适用的硬件参数,加速卡的相关参数、运行环境、存储路径、程序的描述信息以及该神经网络模型的 名称等。
在一些可能的实现方式中,客户端发出模型上传请求后,将该模型的模型 元信息和模型文件均上传至对象存储服务,并且在对象存储服务中分开存储模 型元信息和模型文件;这样,将模型的模型元信息和模型文件进行分离,能够 节省存储空间和传输带宽。
步骤S102,响应于视图解析服务的加载请求,将所述目标模型文件和所述 目标模型元信息发送至所述视图解析服务。
在一些实施例中,视图解析服务使用模型管理服务提供的软件工具包,下 载模型目标模型文件和所述目标模型元信息。视图解析服务在计算机视觉的开 放视觉平台上,对接入的模型中输入的数据(比如,图像或者视频数据等)进 行分析,以实现该模型的功能。比如,以对交通图像中的发生交通事故识别为 例,识别交通视频中或者图像中是否有交通事故;该过程可以分为两个部分, 首先,将程序代码写到一个业务逻辑(即实现交通事故识别的业务逻辑),将交 通视频或图像输入到该模型;然后,对输入的视频或图像进行解析解码,解码 出来之后,分析每一帧;最后,将每一帧的车辆检测框,输入到算法模型相关 的算法中,算法启动的时候就会调用该模型,加载网络参数、算子,以推理出 来是否存在交通事故。
在一些可能的实现方式中,模型管理服务从对象存储服务同步目标模型文 件和目标模型元信息之,以供视图解析服务根据引用路径从模型管理服务下载 目标模型文件和目标模型元信息。模型管理服务提供软件工具包,视图解析服 务集成该软件工具包,并能够调用该工具包中的函数。运行中的视图解析服务 向模型管理服务发送模型下载请求,以通过该模型管理服务的本地磁盘读取目 标模型文件和目标模型元信息,实现将目标模型文件和目标模型元信息同步至 视图解析服务。
在本申请实施例中,在模型管理服务满足预设同步条件的情况下,与对象 存储服务进行数据同步,从对象存储服务中同步目标模型的目标模型文件和目 标模型元信息。这样,将一个目标模型的目标模型文件和目标模型元信息以分 离的方式存储在对象存储服务中,能够节省存储空间和传输带宽,从而提高智 能分析系统的启动速度。通过模型管理服务将目标模型文件和目标模型元信息 同步到视图解析服务。这样,模型管理服务从对象存储服务中同步目标模型文 件和目标模型元信息,并将目标模型文件和目标模型元信息同步至视图解析服 务,如此,通过多级缓存分发的方式进行数据同步,能够满足更大规模更大压 力的模型的需求。
在一些实施例中,通过响应客户端的模型上传请求,将多个模型的模型文 件和模型元信息上传到对象存储服务,即在上述步骤S101之前,还包括如图2 所示的步骤S201和S202,结合图2所示的步骤进行以下说明:
步骤S201,接收客户端发送的模型的上传请求。
在一些实施例中,模型包括:模型文件和模型元信息。在客户端将需要上 传的模型分离为模型文件和模型元信息,进行上传。将该模型的模型文件和模 型元信息携带于上传请求。模型管理服务接收客户端发送的上传请求,以响应 该上传请求管理对象存储服务。
步骤S202,响应所述上传请求,将所述模型文件和所述模型元信息上传至 所述对象存储服务。
在一些实施例中,模型管理服务响应于该上传请求,将上传请求上携带的 模型文件和模型元信息上传至对象存储服务。对象存储服务接收到上传的模型 文件和模型元信息之后,以不同存储路径存储模型文件和模型元信息。这样, 通过响应客户端的多个上传请求,向对象存储服务上传多个模型的模型文件和 模型元信息,使得对象存储服务中存储的多个模型文件和模型元信息。如此, 通过在对象存储服务中分离存储模型文件和模型元信息,能够加快模型的上传 速度和传输速度。
在一些实施例中,按照不同的存储路径存储模型文件和模型元信息,即上 述步骤S202可以是响应所述上传请求,将所述模型文件和所述模型元信息按照 不同的存储地址上传至所述对象存储服务。这样,将模型文件和模型元信息存 储在对象存储服务的不同位置,能够实现模型文件和模型元信息的分开存储, 节省传输带宽。
在一些实施例中,接收到上传请求之后,通过判断对象存储服务中是否已 经存在该上传请求对应模型的模型文件,确定是否将该模型的模型文件和元信 息上传至对象存储服务,即上述步骤S202可以通过以下步骤S221至S224(图 示未示出)实现:
步骤S221,基于所述模型元信息,确定所述对象存储服务中是否包括所述 模型文件。
在一些实施例中,接收到客户端的模型上传请求之后,模型管理服务按照 需要上传的模型的模型元信息,在对象存储服务中查找是否有与该模型元信息 相匹配的模型文件;如果对象存储服务中存在与该模型元信息相匹配的模型文 件,则不需要将该模型文件上传至对象存储服务;如果对象存储服务中不存在 与该模型元信息相匹配的模型文件,将该模型文件上传至对象存储服务。
在一些可能的实现方式中,通过校验模型元信息对预设模型文件的引用路 径与该模型文件,能够确定对象存储服务中是否包括所述模型文件,即上述步 骤S221可以通过以下步骤实现:
第一步,确定所述模型元信息指向预设模型文件的引用路径。
在一些实施例中,预设模型文件可以是该模型元信息在对象存储服务中所 指向的模型文件,还可以理解为该预设模型文件可以是该模型元信息在对象存 储服务中引用的模型文件。每一个模型元信息均会指向一个模型文件,即每一 个模型元信息均会引用一个模型文件,不同的模型元信息也可以引用同一个模 型文件;确定待上传的模型的模型元信息之后,可以确定该模型元信息在对象 存储服务中指向自身匹配的预设模型文件的引用路径。
第二步,基于所述引用路径对所述模型文件进行校验,得到校验结果。
在一些实施例中,按照该引用路径可以在对象存储服务中,检索该引用路 径下是否存在模型文件,以及存在的模型文件是否为待上传的模型的模型文件, 从而实现对模型文件的校验。基于此,校验结果为该引用路径下不存在模型文 件,或该引用路径下的模型文件不是待上传的模型的模型文件,或该引用路径 下的模型文件为待上传的模型的模型文件。
第三步,基于所述校验结果,确定所述对象存储服务中是否包括所述模型 文件。
在一些实施例中,如果校验结果为对象存储服务在该引用路径下不存在模 型文件,或该引用路径下的模型文件不是待上传的模型的模型文件,确定对象 存储服务中不包括所述模型文件;如果校验结果为该引用路径下的模型文件为 待上传的模型的模型文件,确定对象存储服务中包括所述模型文件,即待上传 的模型已经存在于对象存储服务。如此,通过模型元信息指向模型文件的引用 路径,能够准确且便捷地确定对象存储服务中是否存在待上传的模型的模型文 件。
步骤S222,响应于所述对象存储服务中不包括所述模型文件,将所述模型 文件按照预设存储地址上传至所述对象存储服务。
在一些实施例中,如果对象存储服务中不包括所述模型文件,说明该上传 请求所对应的待上传的模型还未上传至对象存储服务,因此,将该模型文件按 照预设存储地址上传至对象存储服务,并存储在对象存储服务的存储桶或本地 磁盘中。
步骤S223,基于所述预设存储地址,对所述模型元信息进行更新。
在一些实施例中,模型管理服务获取该模型文件在对象存储服务中的存储 地址,比如,该模型文件存储在对象存储服务的本地磁盘,那么将该本地存储 的路径作为预设存储地址。将该预设存储地址添加至模型元信息,实现对模型 元信息的更新,这样,更新后的模型元信息中包括模型的详细描述信息以及用 户自定义的元信息。
步骤S224,将更新后的模型元信息按照多级存储地址上传至所述对象存储 服务。
在一些实施例中,模型管理服务按照预设存储地址对模型元信息进行更新 之后,将更新后的模型元信息,即携带该预设存储地址的模型元信息上传至对 象存储服务。
模型管理服务将更新后的模型元信息上传至对象存储服务之后,获取该更 新后的模型元信息在对象存储服务中的存储地址,即多级存储地址;多级存储 地址可以与预设存储地址相同,也可以不同。比如,更新后的模型元信息按照 多级存储地址进行存储,模型文件按照固定地址存储,源存储是在对象存储服 务中,其他同步过来数据通过多级磁盘缓存。多级存储地址即为多级存储目录, 包括以下至少两级:类型→子类型→硬件类型→软件类型→模型名称。按照“类 型→子类型→硬件类型→软件类型→模型名称”中的至少两级,在对象存储服 务中存储该模型元信息。
在本申请实施例中,通过校验对象存储服务中是否已经存储需要上传的模 型文件,在对象存储服务中不存储需要上的模型文件的情况下,将模型文件上 传至对象存储服务中;并且通过模型文件的存储地址更新模型元信息,从而能 够将更新后的模型元信息独立于模型文件存储在对象存储服务中,实现了模型 文件和模型元信息在对象存储服务中的分离存储,能够快速完成模型的上传, 而且便于客户端能够基于该更新后的模型元信息定位模型文件。
在一些实施例中,模型管理服务在达到以下任一预设同步条件的情况下, 启动同步机制,从对象存储服务中同步目标模型文件和目标模型元信息,其中, 预设同步条件至少包括以下之一:
条件一:所述模型管理服务接收到所述对象存储服务发送的事件通知消息。
这里,所述事件通知消息表征所述对象存储服务中的模型变化事件;该模 型变化事件为对象存储服务中存储的模型文件或模型元信息的数量发生变化的 事件。即在对象存储服务中模型的数量发生变化的情况下,对象存储服务向模 型管理服务反馈事件通知消息。比如,对象存储服务中添加了新的模型文件和 模型元信息,那么对象存储服务向模型管理服务反馈模型增加消息。
条件二:所述模型管理服务进行数据同步的历史时刻与当前时刻之间的时 间间隔达到第一预设时长。
这里,设定第一预设时长,这样模型管理服务每间隔一定的预设时长进行 一次数据同步;所以,当上次进行数据同步的历史时刻与当前时刻之间的时间 间隔达到设定的第一预设时长,即进行下一次的数据同步。
条件三:所述模型管理服务在第二预设时长内未发起数据同步,且接收到 客户端发送的模型同步请求。
这里,所述第二预设时长大于所述第一预设时长。如果模型管理服务上一 次进行数据同步的时刻距离当前时刻虽然已达到第一预设时长,但是模型管理 服务仍然未启动数据同步机制,那么用户可以通过客户端手动触发模型管理服 务的接口,以启动数据同步。即通过客户端向模型管理服务的接口发送模型同 步请求,以使模型管理服务响应于该模型同步请求进行数据同步。
在本申请实施例中,无论模型管理服务满足以上哪一种同步条件,均进行 与对象存储服务的数据同步,然后模型管理服务再将数据同步至视图解析服务, 这样,采用从视图解析服务到模型管理服务再到对象存储服务,多级分发的方 式能满足更大规模更大压力的模型下载需要。
在一些实施例中,模型管理服务达到同步条件之后,按照该同步条件下对 象存储服务中的模型变化事件,同步该模型管理服务中的模型文件以及模型元 信息,即上述步骤S101可以通过图3所示的步骤实现:
步骤S301,确定在所述预设同步条件下所述对象存储服务中的模型变化事 件。
在一些实施例中,在模型管理服务满足预设同步条件的情况下,确定该预 设同步条件下对象存储服务中模型的数量发生变化的事件;比如,模型添加事 件或模型删除事件。
步骤S302,获取所述对象存储服务中与所述模型变化事件匹配的第一模型 列表。
在一些实施例中,第一模型列表包括多个模型文件,以及每一模型文件对 应的至少一组模型元信息。与模型变化事件匹配的第一模型列表可以是发生该 模型变化事件后对象存储服务中的模型列表,即发生模型变化事件后对象存储 服务中存储的多个模型文件,每一模型文件对应的模型元信息。
步骤S303,在所述第一模型列表中,确定所述目标模型文件和所述目标模 型元信息。
在一些实施例中,如果模型变化事件为添加模型的事件,那么在所述第一 模型列表中,确定与所述模型管理模型中的第二模型列表不同的所述目标模型 文件和目标模型元信息;如果模型变化事件为删除模型的事件,那么目标模型 文件和目标模型元信息为删除请求中所指的需要删除的模型文件和模型元信息。
步骤S304,基于所述目标模型文件和所述目标模型元信息,同步所述模型 管理服务中的第二模型列表。
在一些实施例中,按照对象存储服务中的目标模型文件和目标模型元信息, 模型管理服务进行数据同步,即对自身的第二模型列表进行更新。比如,目标 模型文件和目标模型元信息是新增到对象存储服务中的,那么模型管理服务从 对象存储服务下载目标模型文件和目标模型元信息,以同步增加到第二模型列 表中。
在本申请实施例中,通过比较模型管理服务中的模型列表与对象存储服务 中的模型列表,能够实现模型管理服务的精准同步。
在一些可能的实现方式中,模型变化事件不同,对第二模型列表进行同步 到的过程不同,在模型变化事件包括模型添加的情况下,通过从对象存储服务 中下载目标模型文件和目标模型元信息,实现数据同步;即上述步骤S303和步 骤S304,可以通过以下步骤S341至S343(图示未示出)实现:
步骤S341,在所述第一模型列表中,确定与所述第二模型列表不同的所述 目标模型文件和所述目标模型元信息。
在一些实施例中,如果对象存储服务中上传了目标模型文件和目标模型元 信息,那么在第一模型列表中即增加了目标模型文件和目标模型元信息;这样, 通过比较第二模型列表与第一模型列表之间的差异,即可确定第一模型列表中 增加的模型文件和模型元信息,得到该目标模型文件和目标模型元信息。
步骤S342,从所述对象存储服务中下载所述目标模型文件和所述目标模型 元信息。
在一些实施例中,如果客户端向对象存储服务上传了模型文件和目标元信 息,那么在对象存储服务中可以生成事件通知消息,通过内存消息队列将该事 件通知消息发送到模型管理服务,以通知模型管理服务进行数据同步;模型管 理服务接收到事件通知消息之后,即启动同步机制,从对象存储服务中下载所 述目标模型文件和所述目标模型元信息。
还可以是模型管理服务进行数据同步的时间间隔达到第一预设时长,模型 管理服务启动同步机制,从所述对象存储服务中下载所述目标模型文件和所述 目标模型元信息至本地缓存。
还可以是模型管理服务接收到客户端发送的模型同步指令,启动同步机制, 从所述对象存储服务中下载所述目标模型文件和所述目标模型元信息至本地缓 存。
步骤S343,将所述目标模型文件和所述目标模型元信息添加至所述第二模 型列表。
在一些实施例中,将目标模型文件和所述目标模型元信息缓存在本地,并 通知添加至第二模型列表中,实现对第二模型列表的数据同步;这里,各个模 型管理服务是进行实时同步的,或者是各个模型管理服务是共享第二模型列表 的,这样能够减少数据存储的空间占用率。
在本申请实施例中,对象存储服务中上传目标模型文件之后,如果模型管 理服务获取到上传消息,那么模型管理服务启动同步过程;从对象存储服务中 将新上传的目标模型文件和所述目标模型元信息下载到本地,并添加到第二模 型列表。如此,多个模型管理服务之间能够共享模型文件和模型元信息,能够 快速实现多个模型管理服务与对象存储服务的数据同步。
在一些实施例中,在模型变化事件包括模型删除的情况下,在第一模型列 表中待删除的模型文件和模型元信息,即为目标模型文件和目标模型元信息, 即上述步骤S303,可以通过以下步骤S331至步骤S333(图示未示出)实现:
步骤S331,接收所述客户端发送的模型删除请求。
在一些实施例中,所述模型删除请求携带第三存储地址。该第三存储地址 用于表示需要删除的模型元信息在对象存储服务中的存储地址。客户端需要删 除任一模型的模型元信息时,可以向模型管理服务发送携带该第三存储地址的 删除请求,以使模型管理服务响应该删除请求,删除对应的模型元信息。
步骤S332,基于所述第三存储地址,从所述第一模型列表中确定所述目标 模型元信息。
这里,按照该第三存储地址,从对象存储服务存储的模型元信息中查找该 地址下的待删除的模型元信息,即得到该目标模型元信息。
步骤S333,确定所述目标模型元信息在所述第一模型列表中指向的所述目 标模型文件。
在一些实施例中,由于模型元信息具有唯一引用的模型文件,那么按照模 型元信息所引用的模型文件的路径,即可得到存储地址;该存储地址即为目标 模型元信息所引用的模型文件的存储地址,因此可得到目标元信息在对象存储 服务中指向的目标模型文件。
在本申请实施例中,通过响应客户端的模型删除请求,能够通过删除接口 删除目标模型文件和目标模型元信息在对象存储服务中的记录,既能够准确删 除对象存储服务的模型文件和元信息,还能够丰富模型管理系统能够实现的功 能。
在一些实施例中,在模型变化事件包括模型删除的情况下,通过响应对象 存储服务广播的删除指令,删除目标模型文件和目标模型元信息,实现数据同 步;即上述步骤S304,可以通过以下步骤S344至S346(图示未示出)实现:
步骤S344,响应于所述模型删除请求,对所述对象存储服务中的所述目标 模型元信息和所述目标模型文件进行删除,以使所述对象存储服务广播所述同 步清理指令。
在一些实施例中,接收到客户端发送的模型删除请求之后,确定出需要删 除的目标模型文件和目标模型元信息,首先在对象存储服务中删除目标模型文 件和目标模型元信息,然后,对象存储服务在删除目标模型文件和目标模型元 信息之后,向各个模型管理服务广播同步清理指令,以使各个模型管理服务进 行同步清理。在对象存储服务中可以是同时删除目标模型文件和目标模型元信 息;还可以是异步目标模型文件和目标模型元信息,比如,在对象存储服务中 先删除目标模型元信息,间隔一定时长后再删除目标模型文件。
步骤S345,接收所述对象存储服务在删除所述目标模型文件和所述目标模 型元信息之后广播的同步清理指令。
在一些实施例中,客户端向模型管理服务发送模型删除请求,模型管理服 务将该模型删除请求发送至对象存储服务,以在对象存储服务中删除该模型删 除请求所指示的目标模型文件和目标模型元信息;对象存储服务删除目标模型 文件和目标模型元信息的同时,向各个模型管理服务广播同步清理指令,以提 示各个模型管理服务进行同步清理。
步骤S346,响应于所述同步清理指令,在述第二模型列表中删除所述目标 模型文件和所述目标模型元信息。
在一些实施例中,模型管理服务接收到对象存储服务广播的同步清理指令, 删除目标模型文件和目标模型元信息,并同时更新第二模型列表。
在本申请实施例中,对象存储服务中删除目标模型文件和目标元信息之后, 向模型管理服务广播删除指令,从而多个模型管理服务能够同时删除该目标模 型文件和目标模型元信息,能够快速实现多个模型管理服务与对象存储服务的 数据同步。
在一些可能的实现方式中,通过设置定时清理时长,模型管理服务能够定 时对需要删除的目标模型文件,即上步骤S344可以通过以下步骤实现:
第一步,响应于所述模型删除请求,在所述对象存储服务中删除所述目标 模型元信息。
在一些实施例中,接收到客户端发送的模型删除请求之后,模型管理服务 响应于该模型删除请求,立即删除对象存储服务中的目标模型元信息。
第二步,按照预设时长间隔,在所述对象存储服务中删除所述目标模型文 件。
在一些实施例中,模型管理服务设定预设时长间隔,每当达到该预设时长 间隔时,模型管理服务判断对象存储服务中是否有需要删除的目标模型文件; 如果对象存储服务中有需要删除的目标模型文件,那么模型管理服务对该对象 存储服务中的目标模型文件进行清理;同时,对象存储服务会按照该预设时长 间隔向模型管理服务广播同步清理指令。从而模型管理服务可以按照预设时长 间隔清理第二模型列表中待删除的模型文件和模型元信息。
在本申请实施例中,通过设定定时清理模型文件的间隔时长,模型管理服 务可以每间隔一定时长清理一次要删除的模型文件;这样,能够减少频繁地执 行删除操作,还能够定时对模型管理服务进行清理。
在一些实施例中,该模型管理系统中还具有快速检索功能,通过多级引用 路径,实现模糊匹配快速检索,以检索到所需的模型元信息,可以通过以下步 骤实现:
第一步,响应于接收到所述客户端发送的模型元信息的检索请求,确定所 述检测请求携带的多级存储地址的索引参数。
在一些实施例中,该检索请求为客户端向模型管理服务发送的,用于请求 检索模型元信息。多级存储地址的索引参数可以是该元信息在对象存储服务中 进行存储的多级存储路径。多级存储地址的索引参数与多级存储地址对应,即 多级存储地址的索引参数也可以是:类型→子类型→硬件类型→软件类型→模 型名称。
第二步,基于所述多级存储地址的索引参数中的至少一级存储地址的索引 参数,对所述对象存储服务中的模型元信息进行查询,得到匹配所述检索请求 的待反馈模型元信息。
在一些实施例中,至少一级存储地址的索引参数可以是多级存储地址的索 引参数中的第一级、最后一级,还可以是该多级存储地址的索引参数中的任一 级或多级等。
在一些可能的实现方式中,至少一级存储地址的索引参数包括多级存储地 址的索引参数中的第一级和最后一级,那么按照第一级和最后一级对应的索引 参数在对象存储服务中,对模型元信息进行前后缀模糊匹配的快速检索,返回 检索到的模型元信息,即待反馈模型元信息。
第三步,将待反馈模型元信息反馈至所述客户端。
在一些实施例中,将检索功能返回的模型元信息,反馈至客户端,以使客 户端能够在本地缓存该模型元信息,供多个视图解析服务之间共享模型元信息。
在本申请实施例中,模型管理服务接收到检索请求后,通过多级存储地址 的索引参数中的至少一级,实现对象存储服务中的模型元信息的模糊匹配检索, 从而能够快速检索到匹配该检索请求的待反馈模型元信息,丰富了模型管理系 统的功能。
在一些实施例中,在所述对象存储服务中的模型变化事件包括模型添加的 情况下,通过在模型解析服务中集成模型管理服务的软件工具包(Software Development Kit,SDK),从而通过调用该SDK中的接口即可实现模型的分发 和下载,即上述步骤S102可以通过以下步骤S121和S122(图示未示出)实现:
步骤S121,接收所述视图解析服务在运行软件工具包的情况下发送的模型 下载请求。
在一些实施例中,所述SDK包括所述模型管理服务的接口;或者,该SDK 是通过集成模型管理服务的接口得到的。将目标模型文件和目标模型元信息上 传至对象存储服务之后,在视图解析服务中集成该模型管理服务的客户端SDK; 视图解析服务在运行该SDK时,如果需要进行数据同步,则向模型管理服务发 送模型下载请求。
步骤S122,响应于所述模型下载请求,通过所述接口将所述目标模型文件 和所述目标模型元信息发送至所述视图解析服务。
在一些实施例中,模型管理服务响应于该模型下载请求,通过调用SDK中 的相关接口,即可将目标模型文件和目标模型元信息传输至视图解析服务。
如此,在解析或者检索服务中集成该模型管理服务的客户端SDK,通过调 用相关接口即可完成模型部署、分发和下载使用等。
本申请实施例提供一种模型管理方法,应用于客户端,客户端能 够通过模型元信息的存储地址定位查询模型元信息,可以通过以下步 骤进行以下说明:
步骤S321,向模型管理服务发送目标模型的加载请求。
这里,所述目标模型包括:目标模型文件和目标模型元信息。
步骤S322,接收所述模型管理服务基于所述加载请求发送的所述目标模型 元信息在对象存储服务中的多级存储地址。
这里,目标模型元信息在对象存储服务中的存储地址为多级存储地址,而 且目标模型元信息携带有目标模型文件在对象存储服务中的多级存储地址。
步骤S323,基于所述多级存储地址,在所述对象存储服务中确定所述目标 模型元信息和所述目标模型元信息对应的所述目标模型文件。
这里,模型管理服务将更新后的模型元信息在对象存储服务中的存储地址 发送给客户端,这样客户端能够基于多级存储地址读取目标模型元信息,并基 于目标模型元信息中携带的模型文件的预设存储地址,在对象存储服务中定位 查询该目标模型文件。如此,通过将目标模型元信息在对象存储服务中的存储 地址反馈给客户端,从而客户端能够通过查询目标模型元信息,精确定位查询 该目标模型元信息所对应的目标模型文件。
在一些实施例中,客户端通过按照模型管理服务发送的多级存储地址,在 对象存储服务中定位目标模型元信息,并查询该目标模型元信息对应的目标模 型文件,即上述步骤S323可以通过以下步骤实现:
第一步,基于所述多级存储地址在所述对象存储服务中定位所述目标模型 元信息。
这里,按照该多级存储地址,客户端在对象存储服务中能够查询定位到目 标模型元信息。
第二步,确定所述目标模型元信息携带的所述目标模型文件在所述对象存 储服务中的存储地址。
这里,由于在存储模型文件和模型元信息时,将模型文件在对象存储服务 中的存储地址添加在模型元信息中,所以在查询到目标模型元信息之后,能够 在目标模型元信息中确定出目标模型文件在对象存储服务中的存储地址。
第三步,基于所述目标模型文件在所述对象存储服务中的存储地址,在所 述对象存储服务中定位所述目标模型文件。
这里,客户端能够按照确定出的目标模型文件在所述对象存储服务中的存 储地址,精确定位查询该目标模型元信息所对应的目标模型文件。
在一些实施例中,客户端也能够进行模型下载,并将下载的模型文件和模 型元信息在本地缓存,以供其他解析服务共享,可以通过以下步骤实现:
第一步,缓存所述目标模型文件和所述目标模型元信息。
在一些实施例中,从对象存储服务下载目标模型文件和目标模型元信息之 后,客户端可以将目标模型文件和目标模型元信息缓存在本地。
第二步,将所述目标模型文件和所述目标模型元信息共享至所述至少一个 视图解析服务。
在一些实施例中,客户端在本地缓存该目标模型文件和目标模型元信息, 从而使得客户端的多个视图解析服务之间能够共享客户端缓存的目标模型文件 和目标模型元信息。
在本申请实施例中,通过在客户端缓存下载的目标模型文件和目标模型元 信息,从而能够便于共享给该模型管理服务上的其他解析服务使用,进而能够 节省客户端的存储空间。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用,以基 于对象存储的模型分发管理系统为例,进行说明。
相关技术中,大量人工智能算法被开发出来用于生产实践。算法在不断迭 代的过程中产生了大量模型文件,且算法参数越来越多,模型越来越大;随着 市场规模增大,视图分析接入规模也越来越大。这些模型在支持上千个视图解 析服务的开放视觉平台上使用时,会跟随应用程序打包到镜像中,占用大量的 磁盘空间,在反复传输过程中也占用大量带宽和磁盘输入/输出,一方面让智能 分析系统启动变慢,另一方面给存储系统和分布式系统整个网络系统带来极大 压力。
本申请实施例提供一种模型管理方法,本申请实施例提供的管理系统基于 对象存储系统和多级磁盘缓存分发的思想,能够解耦算法模型和智能分析程序, 实现高效传输和存储算法模型。该模型管理方法可以通过以下步骤实现:
第一步,实现算法模型上传和后端存储功能。
在一些实施例中,算法模型上传和后端存储功能的实现过程如以下步骤1.1 至1.4所示,其中:
步骤1.1,将算法模型设计为模型元信息(meta)和模型文件。
这里,模型元信息描述算法模型的所有信息,比如,描述模型用于哪种硬 件,哪种加速卡,模型运行时的环境,模型的名字等等。模型文件为原始二进 制模型文件;模型元信息和模型文件分开存储,且不同元信息可以指向同(引 用)一个模型文件。对应用来说,可以通过元信息定位到模型文件,没有元信 息就无法查询定位该模型文件。
步骤1.2,提供上传服务接口以上传算法模型,通过对模型文件和引用路径 进行校验后,如果服务器不存在此算法模型,则将该算法模型上传到后端对象 存储服务。
这里,上传算法模型的过程如图4所示,图4为本申请实施例提供的模型 管理方法的实现流程示意图,结合图4所示的步骤进行以下说明:
步骤S401,启动上传算法模型的过程。
步骤S402,判断对象存储服务中是否已经存在该算法模型。
这里,如果对象存储服务中已经存在该算法模型,则不需上传该算法模型。 如果对象存储服务中不存在该算法模型,进入步骤S403。如果对象存储服务中 存在该算法模型,结束整个过程。
步骤S403,通过模型管理服务将算法模型的模型文件上传至对象存储服务。
步骤S404,将该算法模型的元信息上传至对象存储服务,如果上传失败, 则进行数据回滚。
这里,如果将算法模型的元信息上传对象存储服务失败,则进行数据回滚。
步骤S405,结束上传算法模型的过程。
步骤1.3,在模型管理系统中提供删除功能,即删除接口以及删除算法模型 在对象存储服务的记录,在后台实际的算法模型中异步执行删除操作,并删除 模型管理服务上的磁盘缓存数据。
步骤1.4,在模型管理系统中提供算法模型前后缀模糊匹配快速检索功能。
这里,通过多级引用路径实现算法模型前后缀模糊匹配快速检索功能;检 索功能可以返回模型元信息,模型元信息包括模型详细信息及用户自定义meta 信息。
在本申请实施例中,模型管理系统可以单独存储模型而不用打包到程序镜 像中,保证相同模型的共享和引用不产生额外空间占用和传输时间带宽成本。
第二步,实现算法模型分发机制。
在一些实施例中,在大规模视图解析平台中,通过多级缓存和模型同步分 发解决模型的拉取问题,可以通过以下过程实现
首先,将对象存储服务数据实时同步到模型管理服务。
其次,视图解析服务从模型管理服务下载模型到视图解析服务。
最后,视图解析服务的所有解析服务可以共享使用模型数据,以应对大规 模模型文件的下载压力。
如图5所示,图5为本申请实施例提供的模型管理方法的实现架构图,其 中,minio-服务51(minio-service)可适用其他支持S3接口的对象存储服务; 模型管理服务52包括:模型管理1(model-manager-1)、模型管理2 (model-manager-2)、模型管理n(model-manager-n)指n个模型管理服务节点 (对应于上述实施例中的模型管理服务);节点缓存501至节点缓存503 (node-cache)指视图解析服务的本地缓存。在图5中可以看出,首先,系统包 括多个视图解析服务:节点0(node-0),节点x(node-x)节点n(node-n);其 中,每一节点中包括多个并行处理子任务的工作进程(worker),比如,节点-0 中包括8个并行的工作进程,工作进程0至工作进程7,并将工作进程0至工 作进程7处理的数据缓存在节点缓存501中;节点-x中包括多个并行的工作进 程,并将多个工作进程处理的数据缓存在节点缓存502中;节点-n中包括m个 并行的工作进程,其中,m为大于1的整数;工作进程0至工作进程m,并将 工作进程0至工作进程m处理的数据缓存在节点缓存503中。然后,将各节点 缓存中的缓存数据下发到模型管理服务;比如,节点缓存501和502中数据下 发模型管理1中,节点缓存503中的数据下发到模型管理2和模型管理n中。 最后,将各个模型管理服务中接收到的数据下发到对象存储服务504。如此, 该模型管理和分发系统后端存储基于兼容S3接口开发,支持各种对象存储系统, 提供模型管理(上传、下载、列举和删除等)功能;
在一些实施例中,算法模型分发机制可以通过以下步骤2.1至2.4实现,其 中:
步骤2.1,实现节点模型数据的实时同步。
这里,使用对象存储服务的事件通知机制,通过监听特定的存储桶(bucket) 的写事件实现节点模型数据的实时同步。如果向对象存储服务上传了算法模型 文件,通过内存消息队列将该事件通知到模型管理服务;模型管理服务监听到 该事件后启动同步过程;模型管理服务比较模型管理服务中的模型列表与对象 管理服务中当前模型文件列表的差异(比如,对象管理服务中包括模型信息列 表1,模型管理服务上有模型信息列表2,模型管理服务将模型信息列表1和模 型信息列表2进行比较),将这些新上传的算法模型从对象存储服务下载到本地 缓存起来。
步骤2.2,如果任一模型管理服务接收到模型删除指令,同样先删除对象存 储服务上的模型,通过事件机制广播到各个模型存储服务,这些模型存储服务 接收到通知后,后台开始删除对应的模型。
这里,各模型管理服务上存储的模型文件和模型元文件是相同的。
步骤2.3,为减少事件通知遗漏或处理不及时,后台增加一个定时同步过程, 计时器超时后进行一次同步,从对象存储服务同步对齐模型列表。
这里,如果超时同步机制仍然无效,还可以通过同步触发接口手动下发同 步命令。
步骤2.4,为减少删除操作过于频繁,收到模型删除指令时只删除模型元信 息,而不会立即删除二进制模型文件,而是定时地在后台做清理。
这里,在对象存储服务中设置一个哨兵对象,当清理这些不再被引用的模 型后,更新该哨兵对象,通知到所有的模型管理服务,同步进行清理操作。这 样,通过事件通知和定时触发机制保证高效模型上传和同步,并能够实时分发 到模型管理服务并缓存,视图解析服务从模型管理服务下载并缓存目标模型文 件和目标模型元信息,所有视图解析服务可以共享使用模型;从而能够节省存 储空间,实现多个视图解析服务的同步。
在本申请实施例中,通过多级缓存和模型同步分发实现模型拉取,如图6 所示,图6为本申请实施例提供的对象管理方法的实现流程交互示意图,结合 图6所示的步骤进行以下说明:
步骤S601,客户端向第一模型管理服务上传模型。
这里,客户点向第一模型管理服务上传模型包括上传模型文件和模型元信 息。
步骤S602,第一模型管理服务将模型上传至对象存储服务。
步骤S603,对象存储服务向第一模型管理服务反馈上传完成的通知信息。
步骤S604,第一模型管理服务向客户端反馈上传完成的通知信息。
步骤S605,对象存储服务向第一模型管理服务反馈生成的新增模型事件通 知,并同时将该新增模型事件通知发送至第二模型管理服务。
步骤S606,第一模型管理服务从对象存储服务中拉取模型。
步骤S607,对象存储服务向第一模型管理服务反馈模型拉取完成信息。
步骤S608,第二模型管理服务同步从对象存储服务中拉取模型。
步骤S609,对象存储服务向第二模型管理服务反馈模型拉取完成信息。
这里,步骤S606和步骤S608是同步执行的。即对象存储服务向各个模型 管理节点发送新增模型事件通知之后,各个模型管理节点同步从对象存储服务 拉取模型。
第三步,视图解析服务共享和使用上传到对象存储服务的模型。
在一些实施例中,模型分发到模型管理服务后,视图解析服务集成模型管 理服务接口的客户端软件开发工具包后,安装SDK,运行的视图解析服务下载 模型时,会通过相应的模型管理服务的本地磁盘读取模型;客户端节点下载模 型后也会在本地缓存一次模型,以便共享给该节点上的其他解析服务使用该模 型。如此,通过提供客户端工具和SDK方便模型管理和应用程序使用。
在本申请实施例中,在视图分析平台,用户面对大规模接入和数百吉比特 的模型文件时,可以选择部署模型管理服务到系统;并且分离视图解析或检索 程序和模型文件,通过使用模型管理系统客户端SDK单独上传模型,并且在解 析或者检索服务中集成该模型管理系统的客户端SDK,调用相关接口完成模型 部署,分发和下载适用。如此,通过分离模型大大减少视图解析服务镜像体积, 节省存储空间和传输带宽;这种模型分发缓存方式能满足更大规模更大压力的 模型下载需要,模型管理服务可弹性伸缩;通过结构化的模型元信息描述算法 模型,将模型元信息与模型文件分开管理,同一个模型可以做到被不同路径引 用,实现异步清理。
本申请实施例提供一种模型管理装置,图7为本申请实施例模型管理服务 的结构组成示意图,如图7所示,所述模型管理服务700包括:
第一同步模块701,用于在所述模型管理服务满足预设同步条件的情况下, 从对象存储服务中同步目标模型的目标模型文件和目标模型元信息;
第一响应模块702,用于响应于视图解析服务的加载请求,将所述目标模 型文件和所述目标模型元信息发送至所述视图解析服务。
在一些实施例中,所述在所述模型管理服务满足预设同步条件的情况下, 所述模型管理服务还包括:
第一接收模块,用于接收客户端发送的模型的上传请求;所述模型包括: 模型文件和模型元信息;
第一上传模块,用于响应所述上传请求,将所述模型文件和所述模型元信 息上传至所述对象存储服务。
在一些实施例中,所述第一上传模块,还用于响应所述上传请求,将所述 模型文件和所述模型元信息按照不同的存储地址上传至所述对象存储服务。
在一些实施例中,所述第一上传模块,包括:
第一确定子模块,用于基于所述模型元信息,确定所述对象存储服务中是 否包括所述模型文件;
第一上传子模块,用于响应于所述对象存储服务中不包括所述模型文件, 将所述模型文件按照预设存储地址上传至所述对象存储服务;
第一更新子模块,用于基于所述预设存储地址,对所述模型元信息进行更 新;
第二上传子模块,用于将更新后的模型元信息按照多级存储地址上传至所 述对象存储服务。
在一些实施例中,所述第一确定子模块,包括:
第一确定单元,用于确定所述模型元信息指向预设模型文件的引用路径;
第一校验单元,用于基于所述引用路径对所述模型文件进行校验,得到校 验结果;
第二确定单元,用于基于所述校验结果,确定所述对象存储服务中是否包 括所述模型文件。
在一些实施例中,所述模型管理服务满足预设同步条件,至少包括以下之 一:
所述模型管理服务接收到所述对象存储服务发送的事件通知消息;其中, 所述事件通知消息表征所述对象存储服务中的模型变化事件;
所述模型管理服务进行数据同步的历史时刻与当前时刻之间的时间间隔达 到第一预设时长;
所述模型管理服务在第二预设时长内未发起数据同步,且接收到客户端发 送的模型同步指令;其中,所述第二预设时长大于所述第一预设时长。
在一些实施例中,所述第一同步模块701,包括:
第二确定子模块,用于确定在所述预设同步条件下所述对象存储服务中的 模型变化事件;
第一获取子模块,用于获取所述对象存储服务中与所述模型变化事件匹配 的第一模型列表;
第三确定子模块,用于在所述第一模型列表中,确定所述目标模型文件和 所述目标模型元信息;
第一同步子模块,用于基于所述目标模型文件和所述目标模型元信息,同 步所述模型管理服务中的第二模型列表;其中,模型列表包括多个模型文件, 以及每一模型文件对应的至少一组模型元信息。
在一些实施例中,在所述模型变化事件包括模型添加的情况下,所述第三 确定子模块,包括:
第三确定单元,用于在所述第一模型列表中,确定与所述第二模型列表不 同的所述目标模型文件和所述目标模型元信息;
所述第一同步子模块,包括:
第一下载单元,用于从所述对象存储服务中下载所述目标模型文件和所述 目标模型元信息;
第一添加单元,用于将所述目标模型文件和所述目标模型元信息添加至所 述第二模型列表。
在一些实施例中,在所述模型变化事件包括模型删除的情况下,所述第三 确定子模块,包括:
第一接收单元,用于接收所述客户端发送的模型删除请求;其中,所述模 型删除请求携带第三存储地址;
第四确定单元,用于基于所述第三存储地址,从所述第一模型列表中确定 所述目标模型元信息;
第五确定单元,用于确定所述目标模型元信息在所述第一模型列表中指向 的所述目标模型文件。
在一些实施例中,所述第一同步子模块,包括:
第一删除单元,用于响应于所述模型删除请求,对所述对象存储服务中的 所述目标模型元信息和所述目标模型文件进行删除,以使所述对象存储服务广 播所述同步清理指令;
第二接收单元,用于接收所述对象存储服务在删除所述目标模型文件和所 述目标模型元信息之后广播的所述同步清理指令;
第二删除单元,用于响应于所述同步清理指令,在述第二模型列表中删除 所述目标模型文件和所述目标模型元信息。
在一些实施例中,所述第一删除单元,包括:
第一删除子单元,用于响应于所述模型删除请求,在所述对象存储服务中 删除所述目标模型元信息;
第二删除子单元,用于按照预设时长间隔,在所述对象存储服务中删除所 述目标模型文件。
在一些实施例中,所述模型管理服务还包括:
第二确定模块,用于响应于接收到所述客户端发送的模型元信息的检索请 求,确定所述检测请求携带的多级存储地址的索引参数;
第一检索模块,用于基于所述多级存储地址的索引参数中的至少一级存储 地址的索引参数,对所述对象存储服务中的模型元信息进行检索,得到匹配所 述检索请求的待反馈模型元信息;
反馈模块,用于将所述待反馈模型元信息反馈至所述客户端。
在一些实施例中,在所述对象存储服务中的模型变化事件包括模型添加的 情况下,所述第一响应模块702,包括:
第一接收子模块,用于接收所述视图解析服务在运行运行软件工具包的情 况下发送的模型下载请求;其中,所述运行软件工具包包括所述模型管理服务 的接口;
第一调用单元,用于响应于所述模型下载请求,通过所述接口将所述目标 模型文件和所述目标模型元信息发送至所述视图解析服务。
本申请实施例提供一种客户端,所述客户端包括:处理器、存储有所述处 理器可执行指令的存储器;其中,所述处理器用于:
向模型管理服务发送目标模型的加载请求;所述目标模型包括:目标模型 文件和目标模型元信息;
接收所述模型管理服务基于所述加载请求发送的所述目标模型元信息在对 象存储服务中的多级存储地址;
基于所述多级存储地址,在所述对象存储服务中确定所述目标模型元信息 和所述目标模型元信息对应的所述目标模型文件。
在一些实施例中,所述处理器,还用于基于所述存储地址在所述对象存储 服务中定位所述目标模型元信息;
确定所述目标模型元信息携带的所述目标模型文件在所述对象存储服务中 的存储地址;
基于所述目标模型文件在所述对象存储服务中的存储地址,在所述对象存 储服务中定位所述目标模型文件。
在一些实施例中,所述处理器,还用于缓存所述目标模型文件和所述目标 模型元信息;
将所述目标模型文件和所述目标模型元信息共享至所述至少一个视图解析 服务。
需要说明的是,以上装置实施例的描述,与上述方法实施例的描述是类似 的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技 术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的 模型管理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可 读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对 现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品 存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是终端、 服务器等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质 包括:U盘、运动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者 光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定 的硬件和软件结合。
对应地,本申请实施例再提供一种计算机程序产品,所述计算机程序产品 包括计算机可执行指令,该计算机可执行指令被执行后,能够实现本申请实施 例提供的模型管理方法中的步骤。
相应的,本申请实施例再提供一种计算机存储介质,所述计算机存储介质 上存储有计算机可执行指令,所述该计算机可执行指令被处理器执行时实现上 述实施例提供的模型管理方法的步骤。
相应的,本申请实施例提供一种客户端,图8为本申请实施例客户端的组 成结构示意图,如图8所示,所述客户端800包括:一个处理器801、至少一 个通信总线、通信接口802、至少一个外部通信接口和存储器803。其中,通信 接口802配置为实现这些组件之间的连接通信。其中,通信接口802可以包括 显示屏,外部通信接口可以包括标准的有线接口和无线接口。其中所述处理器 801,配置为执行存储器中图像处理程序,以实现上述实施例提供的模型管理方 法的步骤。
以上模型管理系统、电子设备和存储介质实施例的描述,与上述方法实施 例的描述是类似的,具有同相应方法实施例相似的技术描述和有益效果,限于 篇幅,可案件上述方法实施例的记载,故在此不再赘述。对于本申请模型管理 系统、电子设备和存储介质实施例中未披露的技术细节,请参照本申请方法实 施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实 施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此, 在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指 相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合 在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序 号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻 辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例 序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装 置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为 这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由 语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物 品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可 以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所 述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式, 如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽 略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦 合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可 以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为 单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可 以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来 实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中, 也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一 个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软 件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例 的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储 于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步 骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory, ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立 的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样 的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可 以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包 括若干指令用以使得一台电子设备(可以是个人计算机、服务器、或者网络设 备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括: 移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。以上所 述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟 悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换, 都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要 求的保护范围为准。
Claims (19)
1.一种模型管理方法,其特征在于,应用于模型管理服务,所述方法包括:
在所述模型管理服务满足预设同步条件的情况下,从对象存储服务中同步目标模型的目标模型文件和目标模型元信息;
响应于视图解析服务的加载请求,将所述目标模型文件和所述目标模型元信息发送至所述视图解析服务。
2.根据权利要求1所述的方法,其特征在于,所述在所述模型管理服务满足预设同步条件的情况下,从对象存储服务中同步目标模型的目标模型文件和目标模型元信息之前,所述方法还包括:
接收客户端发送的模型的上传请求;所述模型包括:模型文件和模型元信息;
响应所述上传请求,将所述模型文件和所述模型元信息上传至所述对象存储服务。
3.根据权利要求2所述的方法,其特征在于,所述响应所述上传请求,将所述模型文件和所述模型元信息上传至所述对象存储服务,包括:
响应所述上传请求,将所述模型文件和所述模型元信息按照不同的存储地址上传至所述对象存储服务。
4.根据权利要求3所述的方法,其特征在于,所述响应所述上传请求,将所述模型文件和所述模型元信息按照不同的存储地址上传至所述对象存储服务,包括:
基于所述模型元信息,确定所述对象存储服务中是否包括所述模型文件;
响应于所述对象存储服务中不包括所述模型文件,将所述模型文件按照预设存储地址上传至所述对象存储服务;
基于所述预设存储地址,对所述模型元信息进行更新;
将更新后的模型元信息按照多级存储地址上传至所述对象存储服务。
5.根据权利要求4所述的方法,其特征在于,所述基于所述模型元信息,确定所述对象存储服务中是否包括所述模型文件,包括:
确定所述模型元信息指向预设模型文件的引用路径;
基于所述引用路径对所述模型文件进行校验,得到校验结果;
基于所述校验结果,确定所述对象存储服务中是否包括所述模型文件。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述模型管理服务满足预设同步条件,至少包括以下之一:
所述模型管理服务接收到所述对象存储服务发送的事件通知消息;其中,所述事件通知消息表征所述对象存储服务中的模型变化事件;
所述模型管理服务进行数据同步的历史时刻与当前时刻之间的时间间隔达到第一预设时长;
所述模型管理服务在第二预设时长内未发起数据同步,且接收到客户端发送的模型同步指令;其中,所述第二预设时长大于所述第一预设时长。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述在所述模型管理服务满足预设同步条件的情况下,从对象存储服务中同步目标模型的目标模型文件和目标模型元信息,包括:
确定在所述预设同步条件下所述对象存储服务中的模型变化事件;
获取所述对象存储服务中与所述模型变化事件匹配的第一模型列表;
在所述第一模型列表中,确定所述目标模型文件和所述目标模型元信息;
基于所述目标模型文件和所述目标模型元信息,同步所述模型管理服务中的第二模型列表;其中,模型列表包括多个模型文件,以及每一模型文件对应的至少一组模型元信息。
8.根据权利要求7所述的方法,其特征在于,在所述模型变化事件包括模型添加的情况下,所述在所述第一模型列表中,确定所述目标模型文件和所述目标模型元信息,包括:
在所述第一模型列表中,确定与所述第二模型列表不同的所述目标模型文件和所述目标模型元信息;
所述基于所述目标模型文件和所述目标模型元信息,同步所述模型管理服务中的第二模型列表,包括:
从所述对象存储服务中下载所述目标模型文件和所述目标模型元信息;
将所述目标模型文件和所述目标模型元信息添加至所述第二模型列表。
9.根据权利要求7所述的方法,其特征在于,在所述模型变化事件包括模型删除的情况下,所述在所述第一模型列表中,确定所述目标模型文件和所述目标模型元信息,包括:
接收所述客户端发送的模型删除请求;其中,所述模型删除请求携带第三存储地址;
基于所述第三存储地址,从所述第一模型列表中确定所述目标模型元信息;
确定所述目标模型元信息在所述第一模型列表中指向的所述目标模型文件。
10.根据权利要求9所述的方法,其特征在于,所述基于所述目标模型文件和所述目标模型元信息,同步所述模型管理服务中的第二模型列表,包括:
响应于所述模型删除请求,对所述对象存储服务中的所述目标模型元信息和所述目标模型文件进行删除,以使所述对象存储服务广播所述同步清理指令;
接收所述对象存储服务在删除所述目标模型文件和所述目标模型元信息之后广播的所述同步清理指令;
响应于所述同步清理指令,在述第二模型列表中删除所述目标模型文件和所述目标模型元信息。
11.根据权利要求10所述的方法,其特征在于,所述响应于所述模型删除请求,对所述对象存储服务中的所述待删除模型元信息和所述待删除模型文件进行删除,包括:
响应于所述模型删除请求,在所述对象存储服务中删除所述目标模型元信息;
按照预设时长间隔,在所述对象存储服务中删除所述目标模型文件。
12.根据权利要求2至11任一项所述的方法,其特征在于,所述方法还包括:
响应于接收到所述客户端发送的模型元信息的检索请求,确定所述检测请求携带的多级存储地址的索引参数;
基于所述多级存储地址的索引参数中的至少一级存储地址的索引参数,对所述对象存储服务中的模型元信息进行检索,得到匹配所述检索请求的待反馈模型元信息;
将所述待反馈模型元信息反馈至所述客户端。
13.根据权利要求1至12任一项所述的方法,其特征在于,在所述对象存储服务中的模型变化事件包括模型添加的情况下,所述响应于视图解析服务的加载请求,将所述目标模型文件和所述目标模型元信息发送至所述视图解析服务,包括:
接收所述视图解析服务在运行软件工具包的情况下发送的模型下载请求;其中,所述运行软件工具包包括所述模型管理服务的接口;
响应于所述模型下载请求,通过所述接口将所述目标模型文件和所述目标模型元信息发送至所述视图解析服务。
14.一种模型管理方法,其特征在于,应用于客户端,所述方法包括:
向模型管理服务发送目标模型的加载请求;其中,所述目标模型包括:目标模型文件和目标模型元信息;
接收所述模型管理服务基于所述加载请求发送的所述目标模型元信息在对象存储服务中的多级存储地址;
基于所述多级存储地址,在所述对象存储服务中确定所述目标模型元信息和所述目标模型元信息对应的所述目标模型文件。
15.根据权利要求14所述的方法,其特征在于,所述基于所述多级存储地址,在所述对象存储服务中确定所述目标模型元信息和所述目标模型元信息对应的所述目标模型文件,包括:
基于所述多级存储地址在所述对象存储服务中定位所述目标模型元信息;
确定所述目标模型元信息携带的所述目标模型文件在所述对象存储服务中的存储地址;
基于所述目标模型文件在所述对象存储服务中的存储地址,在所述对象存储服务中定位所述目标模型文件。
16.根据权利要求14或15所述的方法,其特征在于,所述客户端包括至少一个视图解析服务,所述基于所述多级存储地址,在所述对象存储服务中确定所述目标模型元信息和所述目标模型元信息对应的所述目标模型文件之后,所述方法还包括:
缓存所述目标模型文件和所述目标模型元信息;
将所述目标模型文件和所述目标模型元信息共享至所述至少一个视图解析服务。
17.一种模型管理服务,其特征在于,所述模型管理服务包括:
第一同步模块,用于在所述模型管理服务满足预设同步条件的情况下,从对象存储服务中同步目标模型的目标模型文件和目标模型元信息;
第一响应模块,用于响应于视图解析服务的加载请求,将所述目标模型文件和所述目标模型元信息发送至所述视图解析服务。
18.一种客户端,其特征在于,所述客户端包括:处理器、存储有所述处理器可执行指令的存储器;其中,所述处理器用于:
向模型管理服务发送目标模型的加载请求;所述目标模型包括:目标模型文件和目标模型元信息;
接收所述模型管理服务基于所述加载请求发送的所述目标模型元信息在对象存储服务中的多级存储地址;
基于所述多级存储地址,在所述对象存储服务中确定所述目标模型元信息和所述目标模型元信息对应的所述目标模型文件。
19.一种计算机可读存储介质,其上存储有程序,应用于计算机设备中,其特征在于,所述程序被处理器执行时,实现如权利要求1至13任一项所述的方法,或,所述程序被处理器执行时,实现如权利要求14至16任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210044896.8A CN114398188A (zh) | 2022-01-14 | 2022-01-14 | 模型管理方法、模型管理服务、客户端及存储介质 |
PCT/CN2022/129066 WO2023134275A1 (zh) | 2022-01-14 | 2022-11-01 | 模型管理方法、模型管理服务、客户端、存储介质及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210044896.8A CN114398188A (zh) | 2022-01-14 | 2022-01-14 | 模型管理方法、模型管理服务、客户端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114398188A true CN114398188A (zh) | 2022-04-26 |
Family
ID=81231262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210044896.8A Withdrawn CN114398188A (zh) | 2022-01-14 | 2022-01-14 | 模型管理方法、模型管理服务、客户端及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114398188A (zh) |
WO (1) | WO2023134275A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023134275A1 (zh) * | 2022-01-14 | 2023-07-20 | 上海商汤智能科技有限公司 | 模型管理方法、模型管理服务、客户端、存储介质及程序 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117744630B (zh) * | 2024-02-19 | 2024-05-28 | 卓世智星(天津)科技有限公司 | 模型接入方法、装置及电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103812939B (zh) * | 2014-02-17 | 2017-02-08 | 大连云动力科技有限公司 | 一种大数据存储系统 |
US10348562B2 (en) * | 2016-01-11 | 2019-07-09 | Netapp, Inc. | Methods and systems for selecting compatible resources in networked storage environments |
CN108764808B (zh) * | 2018-03-29 | 2020-03-27 | 北京九章云极科技有限公司 | 数据分析处理系统及其在线模型部署方法 |
CN113419750B (zh) * | 2021-08-24 | 2021-11-02 | 北京华品博睿网络技术有限公司 | 一种模型推理服务调用系统和方法 |
CN114398188A (zh) * | 2022-01-14 | 2022-04-26 | 深圳市商汤科技有限公司 | 模型管理方法、模型管理服务、客户端及存储介质 |
-
2022
- 2022-01-14 CN CN202210044896.8A patent/CN114398188A/zh not_active Withdrawn
- 2022-11-01 WO PCT/CN2022/129066 patent/WO2023134275A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023134275A1 (zh) * | 2022-01-14 | 2023-07-20 | 上海商汤智能科技有限公司 | 模型管理方法、模型管理服务、客户端、存储介质及程序 |
Also Published As
Publication number | Publication date |
---|---|
WO2023134275A1 (zh) | 2023-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102142024B (zh) | 在分布式数据库中使用递增捕捉来进行逻辑数据备份和回退 | |
CN114398188A (zh) | 模型管理方法、模型管理服务、客户端及存储介质 | |
CN108664331A (zh) | 分布式数据处理方法及装置、电子设备、存储介质 | |
US10078509B2 (en) | Method and system for processing lifelong learning of terminal and apparatus | |
WO2015100307A1 (en) | Providing access to a cloud based content management system on a mobile device | |
CN111061498B (zh) | 一种配置信息管理系统 | |
CN102187329B (zh) | 通过基于知识的同步来忘记项 | |
US11210212B2 (en) | Conflict resolution and garbage collection in distributed databases | |
CN110413684B (zh) | 一种数据库同步方法、装置及系统 | |
CN116841713A (zh) | 任务扫描方法、装置、电子设备以及存储介质 | |
CN109189813B (zh) | 一种数据共享方法及装置 | |
CN114020850B (zh) | 数据库数据同步方法、装置、设备及可读存储介质 | |
CN110062112A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN109558417B (zh) | 一种数据处理方法和系统 | |
CN114422600A (zh) | 基于云存储的文件调度系统及基于云存储的文件调度方法 | |
CN113157716A (zh) | 一种数据处理方法、装置、设备及介质 | |
CN109582795B (zh) | 基于全生命周期的数据处理方法、设备、系统和介质 | |
CN111352985A (zh) | 一种基于计算机系统的数据服务平台、方法、存储介质 | |
CN107480300B (zh) | 一种数据存储的方法及装置 | |
CN112000425A (zh) | 一种基于idv模式下的镜像管理系统 | |
CN114143279B (zh) | 交互记录的采样方法、装置以及存储介质 | |
CN117472365A (zh) | 数据处理方法、终端设备以及存储介质 | |
CN116340411B (zh) | 一种数据处理的方法及装置 | |
CN116644065A (zh) | 数据库表管理方法、装置及电子设备 | |
CN109739535B (zh) | 一种对产品进行驱动维护的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220426 |
|
WW01 | Invention patent application withdrawn after publication |