CN115374318A - 模型调用方法、装置、计算机设备及存储介质 - Google Patents

模型调用方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN115374318A
CN115374318A CN202211082533.XA CN202211082533A CN115374318A CN 115374318 A CN115374318 A CN 115374318A CN 202211082533 A CN202211082533 A CN 202211082533A CN 115374318 A CN115374318 A CN 115374318A
Authority
CN
China
Prior art keywords
model
target
type
preset
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211082533.XA
Other languages
English (en)
Inventor
蒋佳峻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202211082533.XA priority Critical patent/CN115374318A/zh
Publication of CN115374318A publication Critical patent/CN115374318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,尤其涉及一种模型调用方法、装置、计算机设备及存储介质。该方法通过请求网址与类型字符串的比对结果,确定需求模型类型,并从解码方式集合中确定对应需求模型类型的目标解码方式对接收到的编码后的请求数据进行解码,得到模型名称,根据模型名称从内存映射中确定目标通道,将请求数据发送至目标通道并采用目标模型中进行计算,将计算结果通过目标通道返回至调用方,根据模型名称直接确定对应的目标模型,避免出现模型不适配的情况,提高了模型调用的效率,且调用方与模型完全解耦,在模型出现变动时,仍可以通过模型名称分配目标通道,节省了模型维护方与调用方的沟通协调成本,提高了模型调用的效率。

Description

模型调用方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种模型调用方法、装置、计算机设备及存储介质。
背景技术
由于复杂网络模型需要庞大的存储空间和计算资源,常规计算机设备难以满足复杂网络模型的需求,目前,通常采用模型调用的方式来提高网络模型的利用率,将复杂网络模型部署于计算性能高的服务器中,各个调用方通过请求网址调用服务器,再将待处理数据发送至服务器中,在服务器内部执行计算过程,再将计算结果返回调用方。
通常情况下请求网址格式是固定的,在服务器中模型类型较多时,会出现调用方难以区分模型的情况,因此,一种解决方法是在服务器中为每个模型指定一个访问域名以进行模型的访问,但是,在模型出现变动、迁移的情况时,其对应的访问域名也会发生变动,此时需要通知调用方修改对应的访问域名,降低了模型调用的效率。因此,如何提高模型调用的效率成为亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种模型调用方法、装置、计算机设备及存储介质,以解决模型调用的效率较低的问题。
第一方面,本发明实施例提供一种模型调用方法,所述模型调用方法包括:
获取调用方的请求网址和编码后的请求数据,将所述请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定所述类型字符串为需求模型类型;
根据所述需求模型类型,从预设的解码方式数据库中确定对应所述需求模型类型的目标解码方式,根据所述目标解码方式对所述编码后的请求数据进行解码,得到模型名称;
根据所述模型名称从预设的内存映射中确定目标通道,将所述请求数据发送至所述目标通道,所述内存映射包括模型名称与通道的对应关系,所述目标通道用于连接所述调用方与加载好的目标模型;
将所述请求数据输入所述加载好的目标模型中进行计算,将计算结果通过所述目标通道返回至所述调用方。
第二方面,本发明实施例提供一种模型调用装置,所述模型调用装置包括:
类型确定模块,用于获取调用方的请求网址和编码后的请求数据,将所述请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定所述类型字符串为需求模型类型;
数据解码模块,用于根据所述需求模型类型,从预设的解码方式数据库中确定对应所述需求模型类型的目标解码方式,根据所述目标解码方式对所述编码后的请求数据进行解码,得到模型名称;
通道确定模块,用于根据所述模型名称从预设的内存映射中确定目标通道,将所述请求数据发送至所述目标通道,所述内存映射包括模型名称与通道的对应关系,所述目标通道用于连接所述调用方与加载好的目标模型;
模型调用模块,用于将所述请求数据输入所述加载好的目标模型中进行计算,将计算结果通过所述目标通道返回至所述调用方。
第三方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的模型调用方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的模型调用方法。
本发明实施例与现有技术相比存在的有益效果是:
获取调用方的请求网址和编码后的请求数据,将请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定类型字符串为需求模型类型,根据需求模型类型,从预设的解码方式集合中确定对应需求模型类型的目标解码方式,根据目标解码方式对请求数据进行解码,得到模型名称,根据模型名称从预设的内存映射中确定目标通道,将请求数据发送至目标通道,目标通道用于连接调用方与目标模型,将请求数据输入目标模型中进行计算,将计算结果通过目标通道返回至调用方,解析请求网址得到需求模型类型,确定对应的目标结构定义对请求数据进行解码,获取到模型名称,再根据模型名称确定目标模型与调用方的目标通道,能够根据模型名称直接确定对应的目标模型,避免出现模型不适配的情况,提高了模型调用的效率,且调用方与模型完全解耦,在模型出现变动时,仍可以通过模型名称分配目标通道,节省了模型维护方与调用方的沟通协调成本,提高了模型调用的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种模型调用方法的一应用环境示意图;
图2是本发明实施例一提供的一种模型调用方法的流程示意图;
图3是本发明实施例二提供的一种模型调用方法的流程示意图;
图4是本发明实施例三提供的一种模型调用装置的结构示意图;
图5是本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本发明说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本发明说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本发明说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明实施例一提供的一种模型调用方法,可应用在如图1的应用环境中,其中,服务端与客户端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、云端终端设备、个人数字助理(personal digital assistant,PDA)等计算机设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
参见图2,是本发明实施例一提供的一种模型调用方法的流程示意图,上述模型调用方法可以应用于图1中的服务端,服务端与客户端对应的计算机设备连接,以获取调用方发送的请求网址和编码后的请求数据,调用方可以是指客户端的用户,服务端内部署有至少一种加载好的模型,为调用方提供模型调用服务。如图2所示,该模型调用方法可以包括以下步骤:
步骤S201,获取调用方的请求网址和编码后的请求数据,将请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定类型字符串为需求模型类型。
其中,调用方可以是指需要进行模型调用服务的用户,用户通过客户端对应的计算机设备输入模型调用服务的请求,由客户端对应的计算机设备生成请求网址和编码后的请求数据,请求网址可以是指同一资源定位符(Uniform Resource Locator,URL),请求网址包括但不限于协议、主机名和路径,在本实施例中,协议可以采用gRPC协议,gRPC协议是基于HTTP/2协议实现的,主机名可以是指客户端对应的计算机设备的标识,路径可以是指编码后的请求数据在客户端对应的计算机设备内的位置。
HTTP/2协议包括服务、方法和数据结构,数据结构可以是指模型类型,模型类型可以是指模型所属的框架,框架可以包括TensorFlow、Pytorch等模型搭建框架,服务可以是指需要被调用模型执行的内容,服务可以包括预测服务、GRPC推理服务等,方法可以是指被调用模型执行服务时采用的处理方法,方法可以包括预测、模型推理等。
编码后的请求数据可以包括模型名称和待处理数据,待处理数据可以是指需要经调用的模型进行计算的数据,模型名称可以是指模型的具体名称,模型名称可以包括预测模型、分类模型、实例分割模型、语义分割模型等。
类型字符串可以是指预设的模型类型字符串,类型字符串包括至少一个模型类型字符串,类型字符串根据服务端所部署的模型所属的模型搭建框架确定。
字符串比对可以是指在请求网址中查找一类型字符串,查找方式根据不同的语言有不同的查找方式,以Python语言举例,查找可以采用find函数、index函数、rfind函数等。
具体地,比对结果一致可以是指在一类型字符串在请求网址中被查找到,此时说明该类型字符串对应的模型类型是请求网址所请求的模型类型,确定类型字符串为需求模型类型。
可选的是,在将请求网址与预设的类型字符串进行字符串比对之后,还包括:
若比对结果不一致,则采用预设的标识字符串与请求网址进行字符串比对,得到标识字符串在请求网址中的位置;
根据位置和预设的分隔符,在请求网址中提取出待更新字符串,从解码方式集合中确定对应待更新字符串的更新解码方式,根据更新解码方式对请求数据进行解码,得到模型名称;
在检测到内存映射中包含模型名称时,将待更新字符串更新至类型字符串。
其中,预设的类型字符串包含至少一个类型字符串,比对结果不一致可以是指任一类型字符串均未在请求网址中被查找到。
标识字符串可以是指服务、方法、数据结构等对应的标识信息,例如,数据结构对应的标识为package、服务对应的标识为service、方法对应的标识为method,位置可以是指以分隔符为依据,标识字符串的起始字符在请求网址中的位置,例如,字符位置可以是请求网址中第2个分隔符后的第一个字符。
预设的分隔符可以是指不同字符串内容之间的分隔字符,例如分隔字符可以是标点符号,标点符号可以是指句号、分号等,待更新字符串可以是指需要更新至类型字符串的字符串信息。
更新解码方式可以是指对应待更新字符串的解码方式,模型名称可以包括预测模型、分类模型、实例分割模型、语义分割模型等,内存映射可以是指服务端各个部署模型对应描述信息的集合,描述信息可以包括模型名称、物理访问地址等,物理访问地址可以是指在服务端访问模型时的物理地址。
具体地,请求网址形如“/package.service/method”,标识字符为句号和斜线,则标识字符串package由于不在任一分隔符后,因此标识字符串package在请求网址中的位置为第一个字符,标识字符service在第一个分隔符后,则标识字符串service在请求网址中的位置为第一个分隔符后的第一个字符。
由于标识字符串的位置实际是标识字符串起始字符的位置,则标识字符串的位置到下一分隔符之间的字符串即为待更新字符串,即待更新字符串以一分隔符之后的第一个字符为起始字符,到下一分隔符之前的第一个字符为终止字符。
本实施例适用于服务端已部署属于一模型搭建框架的模型,但预设的类型字符串尚未包含该模型搭建框架对应的类型字符串,由于模型更新与类型字符串更新不耦合,因此可能会出现类型字符串更新滞后的情况。此时,根据本实施例的方式对类型字符串进行更新。
内存映射与服务端部署的模型具有耦合关系,即当服务端部署的模型更新后,对应更新内存映射,以确保模型能够被正常访问。
在检测到内存映射中包含模型名称时,说明服务端内包含此次请求需要调用的模型,但该需要调用的模型对应的类型字符串尚未在预设的类型字符串内更新,此时,执行将待更新字符串更新至类型字符串。
需要说明的是,通常情况下,在服务端部署新的模型搭建框架时,需要在解码方式集合中更新对应的解码方式,因此,若从解码方式集合中无法找到对应待更新字符串的更新解码方式,说明解码方式集合更新滞后或者服务端未部署对应的模型搭建框架。
本实施例根据标识字符串和分隔符,从请求网址中确定待更新字符串,并将待更新字符串更新至类型字符串中,能够避免在服务端模型搭建框架更新后,请求网址中对应的新字符串无法被预设的类型字符串识别,导致无法执行相应的模型调用,且通过内存映射验证请求中需要调用的模型是否已部署,在确认已部署需要调用的模型后,再对类型字符串进行更新,避免直接对类型字符串更新后,出现请求被响应但无法在服务端内找到需要调用的模型的情况,从而减少无效响应,从而提高了模型调用的效率。
上述获取调用方的请求网址和编码后的请求数据,将请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定类型字符串为需求模型类型的步骤,预先根据请求网址确定需求模型类型,无需对编码后的请求数据进行解码操作,能够节省计算资源,提高模型调用的效率。
步骤S202,根据需求模型类型,从预设的解码方式集合中确定对应需求模型类型的目标解码方式,根据目标解码方式对编码后的请求数据进行解码,得到模型名称。
其中,解码方式集合可以包括至少一种解码方式,解码方式与需求模型类型对应,在协议为gRPC协议时,解码方式为protocol buffer(pb)解码方式,但对应不同的需求模型类型,有不同的pb解码定义方式,目标解码方式可以是指对应需求模型类型的解码定义方式。
请求数据由调用方根据需求模型类型对应的编码方式进行编码,得到编码后的请求数据,编码的目的可以包括压缩传输字节、提高数据安全性等。
上述根据需求模型类型,从预设的解码方式集合中确定对应需求模型类型的目标解码方式,根据目标解码方式对编码后的请求数据进行解码,得到模型名称的步骤,能够对数据的传输字节进行压缩,提高数据传输的效率,同时增强数据传输过程的安全性。
步骤S203,根据模型名称从预设的内存映射中确定目标通道,将请求数据发送至目标通道。
其中,内存映射包括模型名称与通道的对应关系,预设的内存映射可以包括每个模型名称对应模型的物理访问地址,物理访问地址可以是指通道的一个端口,即内存映射包括模型名称与通道端口的对应关系,目标通道可以是指长连接,目标通道用于连接调用方与加载好的目标模型,加载好的目标模型可以是指训练好的目标模型,目标模型可以是指需要调用的模型。
具体地,根据模型名称在内存映射中查找目标模型的模型端口地址,将模型端口地址与调用方的请求端口地址连接,得到目标通道,目标通道仅用于目标模型和调用方之间的数据传输,调用方将编码后的请求数据发送到目标通道,也即通过目标通道发送至模型端口地址。
可选的是,需求模型类型包括至少两个模型架构类型,一模型架构类型在内存映射中对应一通道;
在根据模型名称从预设的内存映射中确定目标通道之前,还包括:
对获取到的至少两个历史请求网址的需求模型类型进行统计,根据统计结果得到每个模型架构类型的历史请求数量;
将每个模型架构类型的历史请求数量按照模型架构类型维度拼接为参考数量向量,从预设的流量配比向量中确定与参考数量向量最相似的目标配比向量,根据目标配比向量对所有通道进行流量配比。
其中,模型架构类型可以是指模型构建框架类型,通道可以是模型端口,历史请求网址可以是指在接收到调用方发送的请求之前接收到的请求网址,历史请求数据可以是指在预设目标时间段内服务端接收到的所有请求数据。
一模型架构类型的历史请求数量可以是指所有历史请求网址中,属于该模型架构类型的历史请求网址数量,参考数量向量中的一元素表示对应模型架构类型的历史请求网址数量,流量配比向量可以是指预设各个通道的参考流量分配方式,目标配比向量可以是指各个通道的实际流量分配方式,流量配比用于使目标通道的流量满足请求数据的计算需求。
举例说明,设历史请求网址的数量为N,需求模型类型的类别数为C,第c个需求模型类型统计得到的历史请求数量为nc,有
Figure BDA0003833943000000101
即所有需求模型类型的历史请求数量之和为历史请求网址的数量,将每个模型架构类型的历史请求数量按照模型架构类型维度拼接为参考数量向量,参考数量向量可以表示为[n1,n2,…,nc,…,nC],参考数量向量的尺寸为1*C,也即一行C列,每一列均对应一个模型架构类型。
同样地,流量配比向量也为1*C列尺寸,第k个流量配比向量可以表示为
Figure BDA0003833943000000102
且满足
Figure BDA0003833943000000103
其中M可以是指服务端的最大流量,k的取值范围为[1,2,…,K],K可以是流量配比向量的总个数,在相似度计算时,相似度计算方法可以采用曼哈顿距离、欧式距离、余弦相似度等,在本实施例中,采用余弦相似度进行相似度计算,即
Figure BDA0003833943000000104
其中,αk可以是指第k个流量配比向量与参考数量向量计算得到的余弦相似度,n表示向量[n1,n2,…,nc,…,nC],mk表示项
Figure BDA0003833943000000105
余弦相似度距离越大,说明该流量配比向量与参考数量向量越相似,则确定max(αk)对应的流量配比向量为目标匹配向量。
本实施例根据模型架构类型的历史请求数量为各个通道进行流量配比,起到负载均衡的效果,避免服务端在为目标通道确定流量后,无法有效处理同时段的其他请求,从而有效提高了模型调用的效率。
可选的是,在将所有历史请求数量按照模型架构类型的维度拼接为参考数量向量之后,包括:
获取每个模型架构类型的平均处理时长,针对任一模型架构类型,将对应模型架构类型的历史请求数量和对应模型架构类型的平均处理时长相乘,得到对应模型架构类型的相乘结果;
将每个模型架构类型的相乘结果按照模型架构类型维度拼接为参考数量向量。
其中,一模型架构类型的平均处理时长可以是指在目标时间段内该模型架构类型的所有请求对应的处理时长的均值。
具体地,将模型架构类型的历史请求数量和对应模型架构类型的平均处理时长相乘,第c个模型架构类型的历史请求数量为nc,设第c个模型架构类型的平均处理时长为tc,则相乘结果为nc*tc,将每个模型架构类型的相乘结果按照模型架构类型维度拼接为参考数量向量,此时参考数量向量可以表示为[n1*t1,n2*t2,…,nc*tc,…,nC*tC],相应地,在后续确定的目标配比向量时,也采用上述参考数量向量进行相似度计算。
本实施例中,将平均处理时长和历史请求数量相乘来得到参考数量向量,以处理时长来表征不同模型架构类型对应的计算资源量,从而提高了流量配比的合理性,进而进一步提高了模型调用的效率。
可选的是,从预设的流量配比向量中确定与参考数量向量最相似的目标配比向量包括:
针对任一流量配比向量,将预设系数初始化为预设值,将流量配比向量与预设系数相乘,将相乘结果与参考数量向量逐元素相减,得到相减结果,确定所有相减结果的绝对值之和为差异值;
按照预设步长更新预设系数,并再次执行将流量配比向量与预设系数相乘的步骤,直至根据更新后预设系数计算得到的相减结果大于根据更新前预设系数计算得到的相减结果,确定更新前预设系数计算得到的相减结果为优化参数;
将所有流量配比向量对应的优化参数进行比较,确定优化参数最小的流量配比向量为目标配比向量。
其中,预设系数可以是指流量配比向量的放缩系数,预设值可以为1,预设步长可以是指预设系数调整时的调整量,在本实施例中预设步长可以为0.5。
具体地,设预设系数为Q,则将流量配比向量与预设系数相乘后的相乘结果可以表示为
Figure BDA0003833943000000121
将相乘结果与参考数量向量逐元素相减,并将所有相减结果的绝对值之和作为差异值,即差异值β表示为
Figure BDA0003833943000000122
设预设系数的初始值为Q1,则以初始值计算得到的差异值可以表示为β1
按照预设步长更新预设系数,预设步长设为l,以相加的方式调整预设系数的值,即采用Q=Q+l的方式对预设系数Q进行赋值,并再次计算差异值β2,比较β1和β2,若β1大于β2,说明调整后的预设系数使流量配比向量放缩后更接近参考数量向量,继续调整预设系数可能使流量配比向量放缩后进一步接近参考数量向量,则继续按照预设步长更新预设系数,采用Q=Q+l的方式对预设系数Q进行赋值,并再次计算差异值β3,重复该步骤直至第v个差异值小于第v+1个差异值,说明此时调整预设系数只会使流量配比向量放缩后远离参考数量向量,确定第v个差异值为优化参数。
将所有流量配比向量对应的优化参数进行比较,优化参数最小的流量配比向量即为与参考数量向量最符合的流量配比方式,因此以优化参数最小的流量配比向量作为目标配比向量。
本实施例中,采用预设系数作为放缩系数迭代搜索最优差异值,进而确定目标配比向量,相较于常规相似度计算方法,能够更准确地确定与参考数量向量最相似的流量配比向量,从而在服务端进行更准确的负载均衡,进一步提高了模型调用的效率。
可选的是,将请求数据发送至目标通道包括:
根据对应目标解码方式的编码方式对解码后的请求数据进行重新编码,得到重编码数据;
将重编码数据发送至目标通道。
其中,重编码数据可以是指对解码后的请求数据再次编码得到的数据。
具体地,在编解码中,解码方式通常与编码方式一一对应,在已知目标解码方式的情况下,默认对应目标解码方式的编码方式已知。
由于服务端需要面对多个调用方,且服务端的存储空间有限,在对编码后的请求数据解码后,为节省存储空间,不对编码后的请求数据进行保留,但在目标通道的传输过程中需要以请求数据的编码形式传输,以确保传输效率,因此,对解码后的请求数据进行重新编码。
本实施例中采用重新编码的方式得到重编码数据,从而无需占用服务端的存储空间,提高服务端并行处理模型调用请求的能力,进而提高了模型调用的效率。
上述根据模型名称从预设的内存映射中确定目标通道,将请求数据发送至目标通道的步骤,通过设置目标通道连接目标模型和调用方,调用方在发送请求时,仅需要将请求发送至服务端的接收端口,再由服务端为调用方和目标模型建立目标通道,在服务端内模型出现变动或更新时,调用方无需更改发送地址,节省了调用方与模型维护方之间的沟通成本,同时,便于后续模型维护方对模型服务动态转发、扩缩,从而提高了模型调用的效率。
步骤S204,将请求数据输入加载好的目标模型中进行计算,将计算结果通过目标通道返回至调用方。
其中,加载好的目标模型用于对编码后的请求数据进行解析,得到用于模型计算的待处理数据,加载好的目标模型将待处理数据作为输入数据进行模型推理,得到最终的输出,也即计算结果。
具体地,当调用方接收到计算结果后,将目标通道初始化,即删除目标模型端口与调用方端口的连接关系,服务端等待接收其他调用方发送的调用请求,此时目标模型端口可以用于分配其他调用方的模型调用任务。
上述将请求数据输入加载好的目标模型中进行计算,将计算结果通过目标通道返回至调用方的步骤,通过服务端内加载好的目标模型对请求数据进行处理,再通过目标通道将处理结果发送给调用方,从而实现了复杂模型的非本地调用。
本实施例解析请求网址得到需求模型类型,确定对应的目标结构定义对请求数据进行解码,获取到模型名称,再根据模型名称确定目标模型与调用方的目标通道,能够根据模型名称直接确定对应的目标模型,避免出现模型不适配的情况,提高了模型调用的效率,且调用方与模型完全解耦,在模型出现变动时,仍可以通过模型名称分配目标通道,节省了模型维护方与调用方的沟通协调成本,提高了模型调用的效率。
参见图3,是本发明实施例二提供的一种模型调用方法的流程示意图,该模型调用方法中,在调用方的模型调用服务完成后,可以直接删除调用方与目标模型的连接关系,即初始化目标通道,也可以根据请求数据的接收时间间隔对目标通道进行保留。
在调用方的模型调用服务完成后,初始化目标通道的过程参见实施例一,在此不再赘述。
在调用方的模型调用服务完成后,根据请求数据的接收时间间隔对目标通道进行保留的过程包括:
步骤S301,获取调用方的请求数据序列,计算请求数据序列中相邻请求数据的时间间隔均值;
步骤S302,在时间间隔均值小于预设时间阈值时,保留目标通道;
步骤S303,在接收到调用方发送的第二请求网址和编码后的第二请求数据,且对编码后的第二请求数据解码得到的第二名称与模型名称一致时,将第二请求数据直接发送至目标通道。
其中,请求数据序列可以是指目标时间段内该调用方发送的所有调用请求以及对应的发送时间戳,时间间隔均值可以是指所有相邻请求数据的发送时间戳间隔的均值。
在本实施例中,预设时间阈值可以设置为30分钟,第二请求网址和编码后的第二请求数据可以是指调用方发送的新的模型调用请求内容。
具体地,在时间间隔均值小于预设时间阈值时,说明调用方需要频繁使用模型调用服务,此时,在每次模型调用服务后对目标通道初始化的处理,会导致较多额外的通道连接开销,因此,直接保留目标通道,即目标服务器的端口与调用方保持连接。
需要说明的是,在目标通道被保留后,若在预设时间阈值内未接收到调用方的模型调用请求,则初始化目标通道,避免资源占用。
本实施例根据请求数据的接收时间间隔对目标通道进行保留,避免同一调用方后续请求再新建连接的开销,提高了模型调用的效率。
对应于上文实施例的模型调用方法,图4示出了本发明实施例三提供的模型调用装置的结构框图,上述模型调用装置应用于服务端,服务端与客户端对应的计算机设备连接,以获取调用方发送的请求网址和编码后的请求数据,调用方可以是指客户端的用户,服务端内部署有至少一种加载好的模型,为调用方提供模型调用服务。为了便于说明,仅示出了与本发明实施例相关的部分。
参见图4,该模型调用装置包括:
类型确定模块41,用于获取调用方的请求网址和编码后的请求数据,将请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定类型字符串为需求模型类型;
数据解码模块42,用于根据需求模型类型,从预设的解码方式数据库中确定对应需求模型类型的目标解码方式,根据目标解码方式对编码后的请求数据进行解码,得到模型名称;
通道确定模块43,用于根据模型名称从预设的内存映射中确定目标通道,将请求数据发送至目标通道,内存映射包括模型名称与通道的对应关系,目标通道用于连接调用方与加载好的目标模型;
模型调用模块44,用于将请求数据输入加载好的目标模型中进行计算,将计算结果通过目标通道返回至调用方。
可选的是,需求模型类型包括至少两个模型架构类型,一模型架构类型在内存映射中对应一通道;
上述模型调用装置还包括:
请求统计模块,用于对获取到的至少两个历史请求网址的需求模型类型进行统计,根据统计结果得到每个模型架构类型的历史请求数量;
流量配比模块,用于将每个模型架构类型的历史请求数量按照模型架构类型维度拼接为参考数量向量,从预设的流量配比向量中确定与参考数量向量最相似的目标配比向量,根据目标配比向量对所有通道进行流量配比,流量配比用于使目标通道的流量满足请求数据的计算需求。
可选的是,上述流量配比模块包括:
时长修正单元,用于获取每个模型架构类型的平均处理时长,针对任一模型架构类型,将对应模型架构类型的历史请求数量和对应模型架构类型的平均处理时长相乘,得到对应模型架构类型的相乘结果;
向量拼接单元,用于将每个模型架构类型的相乘结果按照模型架构类型维度拼接为参考数量向量。
可选的是,上述流量配比模块包括:
差异计算单元,用于针对任一流量配比向量,将预设系数初始化为预设值,将流量配比向量与预设系数相乘,将相乘结果与参考数量向量逐元素相减,确定所有相减结果的绝对值之和为差异值;
系数更新单元,用于按照预设步长更新预设系数,并再次执行将流量配比向量与预设系数相乘的步骤,直至根据更新后预设系数计算得到的差异值大于根据更新前预设系数计算得到的差异值,确定更新前预设系数计算得到的差异值为优化参数;
向量确定单元,用于将所有流量配比向量对应的优化参数进行比较,确定优化参数最小的流量配比向量为目标配比向量。
可选的是,上述模型调用装置还包括:
标识比对模块,用于若比对结果不一致,则采用预设的标识字符串与请求网址进行字符串比对,得到标识字符串在请求网址中的位置;
字符串更新模块,用于根据位置和预设的分隔符,在请求网址中提取出待更新字符串,将待更新字符串更新至类型字符串。
可选的是,上述字符串更新模块包括:
数据解码单元,用于从解码方式集合中确定对应待更新字符串的更新解码方式,根据更新解码方式对请求数据进行解码,得到模型名称;
内存检测单元,用于在检测到内存映射中包含模型名称时,将待更新字符串更新至类型字符串。
可选的是,上述通道确定模块43包括:
重编码单元,用于根据对应目标解码方式的编码方式对解码后的请求数据进行重新编码,得到重编码数据;
数据发送单元,用于将重编码数据发送至目标通道。
可选的是,上述模型调用装置还包括:
序列分析模块,用于获取调用方的请求数据序列,计算请求数据序列中相邻请求数据的时间间隔均值;
通道保留模块,用于在时间间隔均值小于预设时间阈值时,保留目标通道;
通道发送模块,用于在接收到调用方发送的第二请求网址和编码后的第二请求数据,且对编码后的第二请求数据解码得到的第二名称与模型名称一致时,将第二请求数据直接发送至目标通道。
需要说明的是,上述模块、单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图5为本发明实施例四提供的一种计算机设备的结构示意图。如图5所示,该实施例的计算机设备包括:至少一个处理器(图5中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个模型调用方法实施例中的步骤。
该计算机设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图5仅仅是计算机设备的举例,并不构成对计算机设备的限定,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是计算机设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是计算机设备的硬盘,在另一些实施例中也可以是计算机设备的外部存储设备,例如,计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在计算机设备上运行时,使得计算机设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种模型调用方法,其特征在于,所述方法包括:
获取调用方的请求网址和编码后的请求数据,将所述请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定所述类型字符串为需求模型类型;
根据所述需求模型类型,从预设的解码方式集合中确定对应所述需求模型类型的目标解码方式,根据所述目标解码方式对所述编码后的请求数据进行解码,得到模型名称;
根据所述模型名称从预设的内存映射中确定目标通道,将所述请求数据发送至所述目标通道,所述内存映射包括模型名称与通道的对应关系,所述目标通道用于连接所述调用方与加载好的目标模型;
将所述请求数据输入所述加载好的目标模型中进行计算,将计算结果通过所述目标通道返回至所述调用方。
2.根据权利要求1所述的模型调用方法,其特征在于,所述需求模型类型包括至少两个模型架构类型,一模型架构类型在所述内存映射中对应一通道;
在所述根据所述模型名称从预设的内存映射中确定目标通道之前,还包括:
对获取到的至少两个历史请求网址的需求模型类型进行统计,根据统计结果得到每个模型架构类型的历史请求数量;
将所述每个模型架构类型的历史请求数量按照模型架构类型维度拼接为参考数量向量,从预设的流量配比向量中确定与所述参考数量向量最相似的目标配比向量,根据所述目标配比向量对所有通道进行流量配比,所述流量配比用于使所述目标通道的流量满足所述请求数据的计算需求。
3.根据权利要求2所述的模型调用方法,其特征在于,在所述将所有历史请求数量按照模型架构类型的维度拼接为参考数量向量之后,包括:
获取每个模型架构类型的平均处理时长,针对任一模型架构类型,将对应所述模型架构类型的历史请求数量和对应所述模型架构类型的平均处理时长相乘,得到对应所述模型架构类型的相乘结果;
将每个模型架构类型的相乘结果按照所述模型架构类型维度拼接为所述参考数量向量。
4.根据权利要求2所述的模型调用方法,其特征在于,所述从预设的流量配比向量中确定与所述参考数量向量最相似的目标配比向量包括:
针对任一流量配比向量,将预设系数初始化为预设值,将所述流量配比向量与所述预设系数相乘,将相乘结果与所述参考数量向量逐元素相减,确定所有相减结果的绝对值之和为差异值;
按照预设步长更新所述预设系数,并再次执行将所述流量配比向量与所述预设系数相乘的步骤,直至根据更新后预设系数计算得到的差异值大于根据更新前预设系数计算得到的差异值,确定所述更新前预设系数计算得到的差异值为优化参数;
将所有流量配比向量对应的优化参数进行比较,确定优化参数最小的流量配比向量为所述目标配比向量。
5.根据权利要求1所述的模型调用方法,其特征在于,在所述将所述请求网址与预设的类型字符串进行字符串比对之后,还包括:
若比对结果不一致,则采用预设的标识字符串与所述请求网址进行字符串比对,得到所述标识字符串在所述请求网址中的位置;
根据所述位置和预设的分隔符,在所述请求网址中提取出待更新字符串,从所述解码方式集合中确定对应所述待更新字符串的更新解码方式,根据所述更新解码方式对所述请求数据进行解码,得到所述模型名称;
在检测到所述内存映射中包含所述模型名称时,将所述待更新字符串更新至所述类型字符串。
6.根据权利要求1所述的模型调用方法,其特征在于,所述将所述请求数据发送至所述目标通道包括:
根据对应所述目标解码方式的编码方式对解码后的所述请求数据进行重新编码,得到重编码数据;
将所述重编码数据发送至所述目标通道。
7.根据权利要求1至6任一项所述的模型调用方法,其特征在于,在所述将所述请求数据发送至所述目标通道之后,还包括:
获取所述调用方的请求数据序列,计算所述请求数据序列中相邻请求数据的时间间隔均值;
在所述时间间隔均值小于预设时间阈值时,保留所述目标通道;
在接收到所述调用方发送的第二请求网址和编码后的第二请求数据,且对所述编码后的第二请求数据解码得到的第二名称与所述模型名称一致时,将所述第二请求数据直接发送至所述目标通道。
8.一种模型调用装置,其特征在于,所述模型调用装置包括:
类型确定模块,用于获取调用方的请求网址和编码后的请求数据,将所述请求网址与预设的类型字符串进行字符串比对,若比对结果一致,则确定所述类型字符串为需求模型类型;
数据解码模块,用于根据所述需求模型类型,从预设的解码方式数据库中确定对应所述需求模型类型的目标解码方式,根据所述目标解码方式对所述编码后的请求数据进行解码,得到模型名称;
通道确定模块,用于根据所述模型名称从预设的内存映射中确定目标通道,将所述请求数据发送至所述目标通道,所述内存映射包括模型名称与通道的对应关系,所述目标通道用于连接所述调用方与加载好的目标模型;
模型调用模块,用于将所述请求数据输入所述加载好的目标模型中进行计算,将计算结果通过所述目标通道返回至所述调用方。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的模型调用方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的模型调用方法。
CN202211082533.XA 2022-09-06 2022-09-06 模型调用方法、装置、计算机设备及存储介质 Pending CN115374318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211082533.XA CN115374318A (zh) 2022-09-06 2022-09-06 模型调用方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211082533.XA CN115374318A (zh) 2022-09-06 2022-09-06 模型调用方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN115374318A true CN115374318A (zh) 2022-11-22

Family

ID=84070545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211082533.XA Pending CN115374318A (zh) 2022-09-06 2022-09-06 模型调用方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN115374318A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576545A (zh) * 2024-01-16 2024-02-20 成都同步新创科技股份有限公司 一种多算法全匹配接入适配器接入方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576545A (zh) * 2024-01-16 2024-02-20 成都同步新创科技股份有限公司 一种多算法全匹配接入适配器接入方法
CN117576545B (zh) * 2024-01-16 2024-04-05 成都同步新创科技股份有限公司 一种多算法全匹配接入适配器接入方法

Similar Documents

Publication Publication Date Title
CN109542361B (zh) 一种分布式存储系统文件读取方法、系统及相关装置
CN108540508B (zh) 用于推送信息的方法、装置和设备
CN107465693B (zh) 请求消息处理方法和装置
CN111368551B (zh) 一种确定事件主体的方法和装置
CN115374318A (zh) 模型调用方法、装置、计算机设备及存储介质
CN111368697A (zh) 一种信息识别方法和装置
CN113900907A (zh) 一种映射构建方法和系统
CN113761565B (zh) 数据脱敏方法和装置
CN113282590A (zh) 基于5g消息的接口联调方法及装置
CN113742389A (zh) 一种业务处理方法和装置
CN115794494A (zh) 基于动态策略的数据备份方法、系统、装置、设备及介质
CN112487765B (zh) 一种生成通知文本的方法和装置
CN114579054A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
US11456996B2 (en) Attribute-based quasi-identifier discovery
CN109471849B (zh) 模型处理方法及装置、存储介质和电子设备
CN113760343A (zh) 一种处理业务请求的方法和装置
CN113590322A (zh) 一种数据处理方法和装置
CN113010666A (zh) 摘要生成方法、装置、计算机系统及可读存储介质
CN107222559B (zh) 信息调用方法
CN111967001A (zh) 一种基于双容器的解码与编码安全隔离方法
CN116911304B (zh) 一种文本推荐方法及装置
US11842077B2 (en) Method, device, and computer program product for transmitting data for object storage
CN113362097B (zh) 一种用户确定方法和装置
CN113468389B (zh) 一种基于特征序列比对的用户画像建立方法和装置
CN110992067B (zh) 消息推送方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination