CN111897832A - 模型部署方法、设备及可读存储介质 - Google Patents

模型部署方法、设备及可读存储介质 Download PDF

Info

Publication number
CN111897832A
CN111897832A CN202010769837.8A CN202010769837A CN111897832A CN 111897832 A CN111897832 A CN 111897832A CN 202010769837 A CN202010769837 A CN 202010769837A CN 111897832 A CN111897832 A CN 111897832A
Authority
CN
China
Prior art keywords
statement
model
representation
selection
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010769837.8A
Other languages
English (en)
Other versions
CN111897832B (zh
Inventor
李冕和
黄启军
唐兴兴
林冰垠
李诗琦
卓本刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010769837.8A priority Critical patent/CN111897832B/zh
Publication of CN111897832A publication Critical patent/CN111897832A/zh
Application granted granted Critical
Publication of CN111897832B publication Critical patent/CN111897832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种模型部署方法、设备及可读存储介质,所述模型部署方法包括:获取待部署模型,并基于预设第一SQL语句模板,对所述待部署模型进行嵌套转换,获得模型结构表示语句,基于预设第二SQL语句模板和所述模型结构表示语句,生成所述待部署模型对应的模型输出表示语句。本申请解决了模型部署效率低的技术问题。

Description

模型部署方法、设备及可读存储介质
技术领域
本申请涉及金融科技(Fintech)的人工智能领域,尤其涉及一种模型部 署方法、设备及可读存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如 分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技 术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机软件和人工智能的不断发展,机器学习的应用领域也越来越 广泛,其中,在应用GBDT(Gradient Boosting Decision Tree,梯度提升决策 树)模型时,通常将模型转换为SQL(Structured Query Language,结构化查 询语言)代码进行生产部署,目前,SQL代码通常通过手工生成,其步骤包 括建模->导出模型文件->SQL编写->人工复核等,然而当前大数据快速发展导 致GBDT模型迭代频繁,进而将GBDT模型手工转换为SQL代码的效率通常 无法满足GBDT模型迭代频繁的需求,也即,将GBDT模型手工转换为SQL 代码的效率过低,且由于GBDT模型包括数量极多的特征,进而进一步加大 了通过手工生成SQL代码将GBDT模型转换为SQL代码的工作量,也即, 进一步降低了将GBDT模型手工转换为SQL代码的效率,所以,导致模型部 署的效率较低。
发明内容
本申请的主要目的在于提供一种模型部署方法、设备及可读存储介质, 旨在解决现有技术中模型部署效率低的技术问题。
为实现上述目的,本申请提供一种模型部署方法,所述模型部署方法应 用于模型部署设备,所述模型部署方法包括:
获取待部署模型,并基于预设第一SQL语句模板,对所述待部署模型进 行嵌套转换,获得模型结构表示语句;
基于预设第二SQL语句模板和所述模型结构表示语句,生成所述待部署 模型对应的模型输出表示语句。
可选地,所述预设第一SQL语句模板包括条件选择语句块,所述待部署 模型至少包括一模型决策树,所述模型决策树至少包括一决策树节点,所述 模型结构表示语句至少包括一个模型决策树表示语句,
所述基于预设第一SQL语句模板,对所述待部署模型进行嵌套转换,获 得模型结构表示语句的步骤包括:
获取各所述决策树节点对应的节点分裂条件和对应的孩子节点;
基于所述条件选择语句块、各所述节点分裂条件和各所述孩子节点,分 别生成各所述决策树节点对应的目标条件选择语句;
基于各所述决策树节点之间的父子关系信息,将各所述目标条件选择语 句进行嵌套,获得所述模型决策树表示语句。
可选地,所述基于所述条件选择语句块、各所述节点分裂条件和各所述 孩子节点,分别生成各所述决策树节点对应的目标条件选择语句的步骤包括:
将各所述节点分裂条件作为选择条件,并将各所述孩子节点作为选择分 支;
分别将各所述决策树节点对应的选择条件和对应的选择分支输入所述条 件选择语句块,获得各所述决策树节点对应的所述目标条件选择语句。
可选地,所述基于各所述决策树节点之间的父子关系信息,将各所述目 标条件选择语句进行嵌套,获得所述模型决策树表示语句的步骤包括:
在各所述决策树节点中确定根节点,将所述根节点作为第一父节点;
基于所述父子关系信息,确定所述第一父子节点对应的各第一孩子节点;
将各所述第一孩子节点的目标条件选择语句作为第一选择分支嵌套在所 述第一父节点的目标条件选择语句中,获得当前嵌套语句;
将各所述第一孩子节点作为各第二父节点,并基于所述父子关系信息, 确定各所述第二父子节点分别对应的各第二孩子节点;
将各第二孩子节点的目标条件选择语句作为第二选择分支分别嵌套在对 应的各所述第一选择分支中,以更新所述当前嵌套语句,直至到达所述模型 决策树的叶子节点,将所述当前嵌套语句作为所述模型决策树表示语句。
可选地,所述基于预设第二SQL语句模板和所述模型结构表示语句,生 成所述待部署模型对应的模型输出表示语句的步骤包括:
判断所述待部署模型的模型类型,获得模型类型判断结果;
获取各所述模型结构表示语句对应的树输出结果,并基于各所述树输出 结果,计算所述待部署模型的各轮迭代对应的累计回归值表示;
基于各所述模型结构表示语句、各所述累计回归值表示和所述选择语句 块,构建所述模型类型判断结果对应的模型输出表示语句。
可选地,所述模型类型判断结果包括回归树类型,
所述基于各所述模型结构表示语句、各所述累计回归值表示和所述选择 语句块,构建所述模型类型判断结果对应的模型输出表示语句的步骤包括:
将各所述累计回归值表示作为选择结果,并将各所述模型结构表示语句 作为第一待选择数据集;
将各所述选择结果和所述第一待选择数据集输入所述选择语句块,生成 所述回归树类型对应的模型输出表示语句。
可选地,所述模型输出表示语句包括第一中间输出表示语句和第一最终 输出表示语句,所述模型类型判断结果包括二分类树类型,
所述基于所述模型类型判断结果、各所述模型结构表示语句和所述选择 语句块,构建所述模型输出表示语句的步骤包括:
计算各所述累计回归值表示对应的分类概率表示,并基于各所述分类概 率表示、各所述模型结构表示语句和所述选择语句块,构建所述二分类树类 型对应的第一中间输出表示语句;
在各所述分类概率表示中确定第一目标分类概率表示,并确定所述第一 目标分类概率表示对应的第一类别输出概率表示和对应的第二类别输出概率 表示;
基于所述第一类别输出概率表示、所述第二类别输出概率表示、各所述 第一中间输出表示语句和所述选择语句块,构建所述二分类树类型对应的第 一最终输出表示语句。
可选地,所述模型输出表示语句包括第二中间输出表示语句和第二最终 输出表示语句,所述模型类型判断结果包括多分类树类型,
所述基于各所述模型结构表示语句、各所述累计回归值表示和所述选择 语句块,构建所述模型类型判断结果对应的模型输出表示语句的步骤包括:
基于各所述累计回归值表示,计算所述待部署模型的各轮迭代对应的分 类概率数组表示;
基于各所述分类概率数组表示、各所述模型结构表示语句和所述选择语 句块,构建所述多分类树类型对应的第二中间输出表示语句;
在各所述分类概率数组表示中确定目标分类概率数组表示,并基于所述 目标分类概率数组表示中的各类别事件概率表示,构建所述多分类树类型对 应的第二最终输出表示语句。
可选地,所述基于所述目标分类概率数组表示中的各类别事件概率表示, 构建所述多分类树类型对应的第二最终输出表示语句的步骤包括:
基于所述预设条件选择语句块,在各所述第二事件概率表示中选取第二 目标事件概率表示;
基于所述第二目标事件概率表示、各所述第二中间输出表示语句、所述 第二目标事件概率表示对应的类别标识和所述选择语句块,构建所述第二最 终输出表示语句。
本申请还提供一种模型部署装置,所述模型部署装置为虚拟装置,且所 述模型部署装置应用于模型部署设备,所述模型部署装置包括:
模型结构表示模块,用于获取待部署模型,并基于预设第一SQL语句模 板,对所述待部署模型进行嵌套转换,获得模型结构表示语句;
模型输出表示模块,用于基于预设第二SQL语句模板和所述模型结构表 示语句,生成所述待部署模型对应的模型输出表示语句。
可选地,所述模型结构表示模块包括:
获取子模块,用于获取各所述决策树节点对应的节点分裂条件和对应的 孩子节点;
生成子模块,用于基于所述条件选择语句块、各所述节点分裂条件和各 所述孩子节点,分别生成各所述决策树节点对应的目标条件选择语句;
嵌套子模块,用于基于各所述决策树节点之间的父子关系信息,将各所 述目标条件选择语句进行嵌套,获得所述模型决策树表示语句。
可选地,所述生成子模块包括:
第一选择单元,用于将各所述节点分裂条件作为选择条件,并将各所述 孩子节点作为选择分支;
第一输入生成单元,用于分别将各所述决策树节点对应的选择条件和对 应的选择分支输入所述条件选择语句块,获得各所述决策树节点对应的所述 目标条件选择语句。
可选地,所述嵌套子模块包括:
第一确定单元,用于在各所述决策树节点中确定根节点,将所述根节点 作为第一父节点;
第二确定单元,用于基于所述父子关系信息,确定所述第一父子节点对 应的各第一孩子节点;
第一嵌套单元,用于将各所述第一孩子节点的目标条件选择语句作为第 一选择分支嵌套在所述第一父节点的目标条件选择语句中,获得当前嵌套语 句;
第三确定单元,用于将各所述第一孩子节点作为各第二父节点,并基于 所述父子关系信息,确定各所述第二父子节点分别对应的各第二孩子节点;
第二嵌套单元,用于将各第二孩子节点的目标条件选择语句作为第二选 择分支分别嵌套在对应的各所述第一选择分支中,以更新所述当前嵌套语句, 直至到达所述模型决策树的叶子节点,将所述当前嵌套语句作为所述模型决 策树表示语句。
可选地,所述模型输出表示模块包括:
判断子模块,用于判断所述待部署模型的模型类型,获得模型类型判断 结果;
计算子模块,用于获取各所述模型结构表示语句对应的树输出结果,并 基于各所述树输出结果,计算所述待部署模型的各轮迭代对应的累计回归值 表示;
构建子模块,用于基于各所述模型结构表示语句、各所述累计回归值表 示和所述选择语句块,构建所述模型类型判断结果对应的模型输出表示语句。
可选地,所述构建子模块包括:
第二选择单元,用于将各所述累计回归值表示作为选择结果,并将各所 述模型结构表示语句作为第一待选择数据集;
第二生成单元,用于将各所述选择结果和所述第一待选择数据集输入所 述选择语句块,生成所述回归树类型对应的模型输出表示语句。
可选地,所述构建子模块还包括:
第一构建单元,用于计算各所述累计回归值表示对应的分类概率表示, 并基于各所述分类概率表示、各所述模型结构表示语句和所述选择语句块, 构建所述二分类树类型对应的第一中间输出表示语句;
第四确定单元,用于在各所述分类概率表示中确定第一目标分类概率表 示,并确定所述第一目标分类概率表示对应的第一类别输出概率表示和对应 的第二类别输出概率表示;
第二构建单元,用于基于所述第一类别输出概率表示、所述第二类别输 出概率表示、各所述第一中间输出表示语句和所述选择语句块,构建所述二 分类树类型对应的第一最终输出表示语句。
可选地,所述构建子模块还包括:
计算单元,用于基于各所述累计回归值表示,计算所述待部署模型的各 轮迭代对应的分类概率数组表示;
第三构建单元,用于基于各所述分类概率数组表示、各所述模型结构表 示语句和所述选择语句块,构建所述多分类树类型对应的第二中间输出表示 语句;
第四构建单元,用于在各所述分类概率数组表示中确定目标分类概率数 组表示,并基于所述目标分类概率数组表示中的各类别事件概率表示,构建 所述多分类树类型对应的第二最终输出表示语句。
可选地,所述第四构建单元包括:
选择子单元,用于基于所述预设条件选择语句块,在各所述第二事件概 率表示中选取第二目标事件概率表示;
构建子单元,用于基于所述第二目标事件概率表示、各所述第二中间输 出表示语句、所述第二目标事件概率表示对应的类别标识和所述选择语句块, 构建所述第二最终输出表示语句。
本申请还提供一种模型部署设备,所述模型部署设备为实体设备,所述 模型部署设备包括:存储器、处理器以及存储在所述存储器上并可在所述处 理器上运行的所述模型部署方法的程序,所述模型部署方法的程序被处理器 执行时可实现如上述的模型部署方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现模型 部署方法的程序,所述模型部署方法的程序被处理器执行时实现如上述的模 型部署方法的步骤。
本申请提供了一种模型部署方法、设备和可读存储介质,相比于现有技 术采用手工将GBDT模型转换为SQL代码进行生产部署的技术手段,本申请 在获取待部署模型之后,基于预设第一SQL语句模板,对待部署模型进行嵌 套转换,以将所述待部署模型转换为模型结构表示语句,进而可实现将待部 署模型的模型结构自动转换为模型结构表示语句的目的,进一步地,获基于 预设第二SQL语句模板、所述模型结构表示语句,即可生成所述待部署模型 对应的模型输出表示语句,进而可实现将待部署模型的模型输出自动转换为 模型输出表示语句的目的,进而实现了将待部署模型自动且高效地转换为 SQL语句的目的,提高了将模型转换为SQL语句的效率,进而基于所述模型 结构表示语句和所述模型输出表示语句,即可快速且高效地部署所述待部署 模型,克服了现有技术中将GBDT模型手工转换为SQL代码效率过低而导致 模型部署效率低的技术缺陷,所以,提高了模型部署的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申 请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于 本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这 些附图获得其他的附图。
图1为本申请模型部署方法第一实施例的流程示意图;
图2为本申请模型部署方法实施例中模型决策树的示意图;
图3本申请模型部署方法实施例中将待部署模型转换为SQL语句进行表示 的示意图;
图4为本申请模型部署方法第二实施例的流程示意图;
图5为本申请模型部署方法第三实施例的流程示意图;
图6为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说 明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定 本申请。
本申请实施例提供一种模型部署方法,在本申请模型部署方法的第一实 施例中,参照图1,所述模型部署方法包括:
步骤S10,获取待部署模型,并基于预设第一SQL语句模板,对所述待 部署模型进行嵌套转换,获得模型结构表示语句;
在本实施例中,需要说明的是,所述待部署模型为待部署的GBDT模型, 所述GBDT模型至少包括一模型决策树,所述模型决策树为二分树,也即, 所述模型决策树中每一非叶子节点对应两个孩子节点,分别为左孩子节点和 右孩子节点,所述模型结构表示语句为表示所述待部署模型的内部模型结构 的SQL语句,所述预设第一SQL语句模板包括条件选择语句块和选择语句块, 其中,所述条件选择语句块为条件选择语句模板,在一种可选的方案中,所 述条件选择语句块为“case when…then…else…end”语句块,所述选择 语句块为select…from…”语句。
获取待部署模型,并基于预设第一SQL语句模板,对所述待部署模型进 行嵌套转换,获得模型结构表示语句,具体地,获取待部署模型,并确定所 述待部署模型对应的各模型决策树,进而对于每一所述模型决策树的各树分 支,均采用所述预设条件选择语句块进行表示,获得每一所述模型决策树的 各树分支对应的树分支表示语句,进一步地,基于每一所述模型决策树的各 树分支之间的连接关系,对各所述树分支表示语句进行嵌套,获得每一所述 模型决策树对应的模型决策树表示语句,进而将各所述模型决策树表示语句 输入所述选择语句块,获得所述模型结构表示语句,例如,假设如图2所示 为模型决策树的示意图,其中,age为年龄特征,sex为性别特征,salary为工 资收入特征,所述条件选择语句块为“case when…then…else…end”语 句块,进而所述模型决策树对应的模型决策树表示语句如下所示:
Figure BDA0002611690470000091
,并将所述模型决策树语句记为“tree<i>”,其中,i由0开始计数,且假定 GBDT模型由共n棵模型决策树树组成,则若所述选择语句块为select… from…”语句,则所述模型结构表示语句为“select<tree<0>表达式>, <tree<1>表达式>,…,<tree<n-1>表达式>from<模型输入数据集>”,其中, 表达式即为所述模型决策树表示语句。
其中,所述预设第一SQL语句模板包括条件选择语句块,所述待部署模 型至少包括一模型决策树,所述模型决策树至少包括一决策树节点,
所述基于预设第一SQL语句模板,对所述待部署模型进行嵌套转换,获 得模型结构表示语句的步骤包括:
步骤S11,获取各所述决策树节点对应的节点分裂条件和对应的孩子节 点;
在本实施例中,需要说明的是,所述模型决策树至少包括一决策树节点, 所述孩子节点包括左孩子节点和右孩子节点,所述节点分裂条件为决定当前 样本是属于左孩子节点还是属于右孩子节点的条件,例如,假设所述决策树 节点对应的特征为年龄特征,则所述节点分裂条件为年龄小于40岁的样本属 于左孩子节点,年龄大于或者等于40岁的样本属于右孩子节点。
步骤S12,基于所述条件选择语句块、各所述节点分裂条件和各所述孩子 节点,分别生成各所述决策树节点对应的目标条件选择语句;
在本实施例中,需要说明的是,所述目标条件选择语句为表示决策树节 点和所述决策树节点对应的孩子节点共同对应的树结构的SQL语句。
基于所述条件选择语句块、各所述节点分裂条件和各所述孩子节点,分 别生成各所述决策树节点对应的目标条件选择语句,具体地,对于每一非叶 子节点类型的决策树节点均执行以下步骤:
将所述节点分裂条件作为所述条件选择语句块的选择条件,将所述左孩 子节点对应的第一条件选择语句和所述右孩子节点对应的第二条件选择语句 作为所述条件选择语句块的选择分支,进而将所述选择条件和各所述选择分 支输入所述条件选择语句块,获得所述决策树节点对应的目标条件选择语句, 其中,需要说明的是,若所述左孩子节点为非叶子节点类型的节点,则所述 左孩子节点具有子节点,也即,具有孩子节点,则所述第一条件选择语句为 表示所述左孩子节点及其子节点共同对应的树结构的SQL语句,若所述左孩 子节点为叶子节点类型的节点,则所述左孩子节点无子节点,所述第一条件 选择语句为表示所述左孩子节点对应的输出回归值的SQL语句,相同地,若 所述右孩子节点为非叶子节点类型的节点,则所述右孩子节点具有子节点, 也即,具有孩子节点,则所述第二条件选择语句为表示所述右孩子节点及其 子节点共同对应的树结构的SQL语句,若所述右孩子节点为叶子节点类型的 节点,则所述右孩子节点无子节点,所述第二条件选择语句为表示所述右孩 子节点对应的输出回归值的SQL语句。
其中,所述基于所述条件选择语句块、各所述节点分裂条件和各所述孩 子节点,分别生成各所述决策树节点对应的目标条件选择语句的步骤包括:
步骤S121,将各所述节点分裂条件作为选择条件,并将各所述孩子节点 作为选择分支;
在本实施例中,需要说明的是,所述条件选择语句块为条件选择语句的 模板,所述选择条件为所述条件选择语句中用于判定样本属于哪个选择分支 的条件,所述选择分支包括第一选择分支和第二选择分支,其中,所述第一 选择分支为所述左孩子节点对应的选择分支,若基于所述选择条件,判断样 本走第一选择分支,则说明样本属于左孩子节点,所述第二选择分支为所述 右孩子节点对应的选择分支,若基于所述选择条件,判断样本走第二选择分 支,则说明样本属于右孩子节点。
步骤S122,分别将各所述决策树节点对应的选择条件和对应的选择分支 输入所述条件选择语句块,获得各所述决策树节点对应的所述目标条件选择 语句。
在本实施例中,分别将各所述决策树节点对应的选择条件和对应的选择 分支输入所述条件选择语句块,获得各所述决策树节点对应的所述目标条件 选择语句,具体地,将每一所述决策树节点对应的选择条件、对应的第一选 择分支和对应的第二选择分支分别输入所述条件选择语句块,生成每一所述 决策树节点对应的目标条件选择语句。
步骤S13,基于各所述决策树节点之间的父子关系信息,将各所述目标条 件选择语句进行嵌套,获得所述模型决策树表示语句。
在本实施例中,需要说明的是,所述父子关系信息为各所述决策树节点 之间的从属关系,例如,假设节点A具有左孩子节点B和右孩子节点C,则 左孩子节点B和右孩子节点C均从属于节点A。
基于各所述决策树节点之间的父子关系信息,将各所述目标条件选择语 句进行嵌套,获得所述模型决策树表示语句,具体地,基于各所述决策树节 点之间的父子关系信息,将各所述决策树节点中的每一子节点对应的目标条 件选择语句嵌套至每一所述子节点对应的父节点的目标条件选择语句中,直 至各所述目标条件选择语句均嵌套至所述模型决策树的根节点对应的目标条 件选择语句中,获得所述目标决策树表示语句,例如,假设所述模型决策树 包括节点A、节点B、节点C、节点D和节点E,其中,节点A为根节点, 节点B和节点C均为节点A的孩子节点,节点D和节点E均为节点B的孩 子节点,则将所述节点D对应的目标条件选择语句d和节点E对应的目标条 件选择语句e均作为所述节点B对应的目标条件选择语句b的选择分支,嵌 套在所述目标条件选择语句b中,获得第一嵌套语句,进而将所述第一嵌套 语句和节点C对应的目标条件选择语句c均作为节点A对应的目标条件选择语句a的选择分支,嵌套在目标条件选择语句a中,获得第二嵌套语句,并将 所述第二嵌套语句作为所述模型决策树表示语句。
其中,所述基于各所述决策树节点之间的父子关系信息,将各所述目标 条件选择语句进行嵌套,获得所述模型决策树表示语句的步骤包括:
步骤S131,在各所述决策树节点中确定根节点,将所述根节点作为第一 父节点;
步骤S132,基于所述父子关系信息,确定所述第一父子节点对应的各第 一孩子节点;
在本实施例中,需要说明的是,所述第一孩子节点包括所述根节点对应 的左孩子节点和所述根节点对应的右孩子节点。
步骤S133,将各所述第一孩子节点的目标条件选择语句作为第一选择分 支嵌套在所述第一父节点的目标条件选择语句中,获得当前嵌套语句;
在本实施例中,将各所述第一孩子节点的目标条件选择语句作为第一选 择分支嵌套在所述第一父节点的目标条件选择语句中,获得当前嵌套语句, 具体地,获取所述根节点的各第一孩子节点的目标条件选择语句,并将各所 述第一孩子节点的目标推荐选择语句作为所述第一父节点对应的目标条件选 择语句的第一选择分支,将各所述第一选择分支代入所述第一父节点对应的 目标条件选择语句,获得所述当前嵌套语句。
步骤S134,将各所述第一孩子节点作为各第二父节点,并基于所述父子 关系信息,确定各所述第二父子节点分别对应的各第二孩子节点;
在本实施例中,需要说明的是,所述第二孩子节点为所述第一孩子节点 的子节点,优选地,一父节点对应一左孩子节点和一右孩子节点共2个子节 点。
步骤S135,将各第二孩子节点的目标条件选择语句作为第二选择分支分 别嵌套在对应的各所述第一选择分支中,以更新所述当前嵌套语句,直至到 达所述模型决策树的叶子节点,将所述当前嵌套语句作为所述模型决策树表 示语句。
在本实施例中,将各第二孩子节点的目标条件选择语句作为第二选择分 支分别嵌套在对应的各所述第一选择分支中,以更新所述当前嵌套语句,直 至到达所述模型决策树的叶子节点,将所述当前嵌套语句作为所述模型决策 树表示语句,具体地,将每一所述第二孩子节点的目标条件选择语句作为对 应的第一选择分支中的目标条件选择语句中的选择分支,获得每一所述第一 选择分支对应的各第二选择分支,并将每一所述第二选择分支嵌套至对应的 第一选择分支的目标条件选择语句中,以将各所述第二选择分支加入当前嵌 套语句,以更新所述当前嵌套语句,直至所述模型决策树的所有决策树节点 对应的目标条件选择语句均在更新后的所述当前嵌套语句中,将更新后的当 前嵌套语句作为所述模型决策树表示语句。
步骤S20,基于预设第二SQL语句模板和所述模型结构表示语句,生成 所述待部署模型对应的模型输出表示语句,以部署所述待部署模型;
在本实施例中,需要说明的是,所述预设第二SQL语句模板包括选择语 句块。
基于预设第二SQL语句模板和所述模型结构表示语句,生成所述待部署 模型对应的模型输出表示语句,以部署所述待部署模型,具体地,基于各所 述模型结构表示语句的树输出结果,并基于各所述树输出结果,计算各所述 模型决策树对应的累计回归值,进而基于各所述累计回归值和所述选择语句 块,生成所述待部署模型对应的模型输出表示语句,以基于所述模型结果表 示语句和所述模型输出结果表示语句,将所述待部署模型转换为SQL语句代 码进行部署。
其中,所述基于预设第二SQL语句模板和所述模型结构表示语句,生成 所述待部署模型对应的模型输出表示语句的步骤包括:
步骤S21,判断所述待部署模型的模型类型,获得模型类型判断结果;
在本实施例中,所述模型类型包括回归树类型、二分类树类型和多分类 树类型,在一种可实施的方案中,若所述模型类型为回归树类型,则所述待 部署模型的模型输出为累计回归值,若所述模型类型为二分类树类型,则所 述待部署模型的模型输出为2个类别的分类概率,若所述模型类型为多分类 树模型,则所述待部署模型的模型输出为k个类别的分类概率组成的概率数 组。
步骤S22,获取各所述模型结构表示语句对应的树输出结果,并基于各所 述树输出结果,计算所述待部署模型的各轮迭代对应的累计回归值表示;
在本实施例中,需要说明的是,所述树输出结果为所述模型结构表示语 句对应的模型决策树的回归值,所述累计回归值标表示为计算累计回归值的 SQL语言形式的表达式。
获取各所述模型结构表示语句对应的树输出结果,并基于各所述树输出 结果,计算所述待部署模型的各轮迭代对应的累计回归值表示,具体地,获 取所述待部署模型的预设基础数值,其中,所述预设基础数值为预先设定好 的基础回归数值,可选地,所述预设基础数值可取0.5,进而获取各所述模型 结构表示语句对应的树输出结果,也即获取各所述模型决策树对应的回归值, 进而将所述预设基础数值和各所述回归值代入预设累计回归值计算公式,获 得各所述模型决策树对应的累计回归值表示,其中,所述预设累计回归值计 算公式如下:
m=base+t.tree<0>+t.tree<1>+…+t.tree<i-1>
其中,预设累计回归值计算公式为所述累计回归值表示,m为第i颗模型决策 树的累计回归值,base为所述预设基础数值,tree<0>为第1颗模型决策树对 应的模型结构表示语句,t.tree<0>为第1颗模型决策树对应的模型结构表示语 句的树输出结果,t.tree<i-1>为第i颗模型决策树对应的模型结构表示语句的 树输出结果。
步骤S23,基于各所述模型结构表示语句、各所述累计回归值表示和所述 选择语句块,构建所述模型类型判断结果对应的模型输出表示语句。
在本实施例中,基于各所述模型结构表示语句、各所述累计回归值表示 和所述选择语句块,构建所述模型类型判断结果对应的模型输出表示语句, 具体地,将各所述模型结构表示语句作为所述选择语句块的待选择数据集, 若所述模型类型判断结果为回归树类型,则将各所述模型决策树的累计回归 值表示作为选择结果输入所述选择语句块,获得所述回归树类型的模型输出 表示语句,若所述模型类型判断结果为二分类树类型,则基于各所述累计回 归值表示,计算各所述累计回归值表示对应的分类概率表示,并将各所述分类概率表示作为选择结果输入所述选择语句块,获得所述二分类树类型对应 的模型输出表示语句,若所述模型类型判断结果为多分类树类型,则基于各 所述累计回归值表示,计算所述待部署模型的各轮迭代对应的概率数组表示, 其中,所述概率数组表示包括所述待部署模型对应的各分类类别对应的分类 概率表示,并将各所述概率数组表示作为选择结果输入所述选择语句块,获 得所述多分类树类型对应的模型输出表示语句,在一种可实施的方案中,如 图3为将待部署模型转换为SQL语句进行表示的示意图,其中,树即为模型 决策树,预测值和最终预测值为各累计回归值表示的输出,即为各累计回归 值,中间事件概率和预测概率为各分类概率表示的输出,即为分类概率,中 间概率数组为各所述概率数组表示的输出,即为多分类树类型的待部署模型 的各轮迭代对应的概率数组,预测类别为求取的预测概率对应的分类类别, 最大值为所述待部署模型的最后一轮迭代的概率数组中的最大概率值,序号 为最大概率值对应的分类类别的序号。
其中,所述模型类型判断结果包括回归树类型,
所述基于各所述模型结构表示语句、各所述累计回归值表示和所述选择 语句块,构建所述模型类型判断结果对应的模型输出表示语句的步骤包括:
步骤S231,将各所述累计回归值表示作为选择结果,并将各所述模型结 构表示语句作为第一待选择数据集;
在本实施例中,需要说明的是,当所述模型类型判断结果为回归树类型 时,则各所述累计回归值作为选择结果是所述选择语句块的输出,各所述模 型结构表示语句作为所述第一待选择数据集是所述选择语句块的输入。
将各所述累计回归值表示作为选择结果,并将各所述模型结构表示语句 作为第一待选择数据集,具体地,将每一所述累计回归值记为对应的初始选 择结果,并基于各所述累计回归值对应的预测字段标识,对各所述初始选择 结果进行标记,以标识各所述初始选择结果归属的模型决策树和归属的预测 字段,获得各所述选择结果,并将各所述模型结构表示语句作为第一待选择 数据集,且所述模型结构表示语句的输出为对应的累计回归值表示的输入。
步骤S232,将各所述选择结果和所述第一待选择数据集输入所述选择语 句块,生成所述回归树类型对应的模型输出表示语句。
在本实施例中,将各所述选择结果和所述第一待选择数据集输入所述选 择语句块,生成所述回归树类型对应的模型输出表示语句,具体地,将所述 第一待选择数据集作为所述选择语句块的待选择项输入所述选择语句块,并 将各所述选择结果作为选择结果项输入所述选择语句块,获得所述模型输出 表示语句,在一种可实施的方案中,所述模型输出表示语句为“select< predict_<target_name>_0表达式>,<predict_<target_name>_1表达式>,…,< predict_<target_name>_<n-1>表达式>from<t表达式>”,其中,“select…from…”语句为所述选择语句块,target_name为所述预测字段标识,< predict_<target_name>_0表达式>为第1颗模型决策树的累计回归值表示,predict_<target_name>_<n-1>表达式>为第n颗模型决策树的累计回归值表示, <t表达式>为各所述模型结构表示语句,t为所述模型结构表示语句的输出, 也即,为树输出结果。
本实施例提供了一种模型部署方法,相比于现有技术采用手工将GBDT 模型转换为SQL代码进行生产部署的技术手段,本实施例在获取待部署模型 之后,基于预设第一SQL语句模板,对待部署模型进行嵌套转换,以将所述 待部署模型转换为模型结构表示语句,进而可实现将待部署模型的模型结构 自动转换为模型结构表示语句的目的,进一步地,获基于预设第二SQL语句 模板、所述模型结构表示语句,即可生成所述待部署模型对应的模型输出表 示语句,进而可实现将待部署模型的模型输出自动转换为模型输出表示语句 的目的,进而实现了将待部署模型自动且高效地转换为SQL语句的目的,提 高了将模型转换为SQL语句的效率,进而基于所述模型结构表示语句和所述 模型输出表示语句,即可快速且高效地部署所述待部署模型,克服了现有技 术中将GBDT模型手工转换为SQL代码效率过低而导致模型部署效率低的技 术缺陷,所以,提高了模型部署的效率。
进一步地,参照图4,基于本申请中第一实施例,在本申请的另一实施例 中,所述模型输出表示语句包括第一中间输出表示语句和第一最终输出表示 语句,所述模型类型判断结果包括二分类树类型,
所述基于所述模型类型判断结果、各所述模型结构表示语句和所述选择 语句块,构建所述模型输出表示语句的步骤包括:
步骤A10,计算各所述累计回归值表示对应的分类概率表示,并基于各 所述分类概率表示、各所述模型结构表示语句和所述选择语句块,构建所述 二分类树类型对应的第一中间输出表示语句;
在本实施例中,需要说明的是,所述分类概率表示为计算分类概率的SQL 语句形式的表达式,所述第一中间输出表示语句为计算所述待部署模型的各 模型决策树的概率输出的SQL语句,在一种可实施的方案中,预设分类概率 表示计算公式如下所示:
predict_prob_event_i=1/(1+exp(-(t.tree<0>+t.tree<1>+…+t.tree<i-1>+sigmoid-1(base))))
其中,tree<0>为第1颗模型决策树对应的模型结构表示语句,t.tree<0>为第1 颗模型结构表示语句的输出,也即,为树输出结果,base为预设基础数值, t.tree<i-1>为第i颗模型结构表示语句的输出,其中,predict_prob_event_i为第 i颗模型决策树对应的分类概率表示的输出值,也即为分类概率,等号左侧为 所述分类概率表示。
计算各所述累计回归值表示对应的分类概率表示,并基于各所述分类概 率表示、各所述模型结构表示语句和所述选择语句块,构建所述二分类树类 型对应的第一中间输出表示语句,具体地,将每一所述累计回归值表示对应 的各树输出结果和对应的预设基础数值输入预设分类概率表示计算公式,获 得各所述累计回归值对应的分类概率表示,进而将各所述分类概率表示作为 所述选择语句块的输出,将各所述模型结构表示语句的输出作为所述选择语 句块的输入,生成所述第一中间输出表示语句,其中,所述第一中间输出表 示语句为“select<predict_prob_event_0表达式>,<predict_prob_event_1表 达式>,…,<predict_prob_event_<n-1>表达式>from<t表达式>”,其中,< predict_prob_event_<n-1>表达式>为第n颗模型决策树的分类概率表示对应 的输出,<t表达式>为所述模型结构表示语句,t为所述模型结构表示语句的 输出。
步骤A20,在各所述分类概率表示中确定第一目标分类概率表示,并确 定所述第一目标分类概率表示对应的第一类别输出概率表示和对应的第二类 别输出概率表示;
在本实施例中,需要说明的是,所述二分类树类型的待部署模型的最终 预测值有2个,且2个最终预测值之和为1,其中,所述第一类别输出概率表 示和第二类别输出概率表示均为计算所述最终预测值的SQL语言形式的表达 式。
在各所述分类概率表示中确定第一目标分类概率表示,并确定所述第一 目标分类概率表示对应的第一类别输出概率表示和对应的第二类别输出概率 表示,具体地,在各所述分类概率表示中确定所述待部署模型各轮迭代中最 后一轮迭代对应的分类概率表示作为第一目标分类概率表示,且由于所述模 型类型判断结果为二分类树类型,则将所述第一目标分类概率表示的输出与 预设目标概率进行比对,若所述第一目标分类概率表示的输出大于预设目标 概率,则将所述第一目标分类概率表示作为第一类别输出概率表示,所述第 一类别输出概率表示的输出即为第一类别输出概率,并计算所述第一类别输 出概率与1之间的第一概率差值,获得第二类别输出概率,并将所述第一概 率差值的计算表达式作为所述第二类别输出概率表示,若所述第一目标分类 概率表示的输出小于或者等于预设目标概率,则将所述第一目标分类概率表 示作为第二类别输出概率表示,所述第二类别输出概率表示的输出即为第二 类别输出概率,并计算所述第二类别输出概率与1之间的第二概率差值,获 得第一类别输出概率,并将所述第二概率差值的计算表达式作为所述第一类 别输出概率表示。
步骤A30,基于所述第一类别输出概率表示、所述第二类别输出概率表 示、各所述第一中间输出表示语句和所述选择语句块,构建所述二分类树类 型对应的第一最终输出表示语句。
在本实施例中,需要说明的是,所述第一最终输出表示语句为计算二分 树类型的待部署模型的最终预测值的SQL语句。
基于所述第一类别输出概率表示、所述第二类别输出概率表示、各所述 第一中间输出表示语句和所述选择语句块,构建所述二分类树类型对应的第 一最终输出表示语句,具体地,将所述第一类别输出概率表示和所述第二类 别输出概率表示均作为所述选择语句块的输出,将各所述第一中间输出表示 语句作为所述选择语句块的输入,生成所述第一最终输出表示语句,在一种 可实施的方案中,所述第一最终输出表示语句为“select g.*,< predict_<target_name>表达式>,<predict_prob_<target_name>表达式>from<g 表达式>”,其中,predict_<target_name>表达式>和<predict_prob_<target_name> 表达式>分别为第一类别输出概率表示和第二类别输出概率表示,target_name 为预设字段标识,用于标识分类类别,<g表达式>为所述第一中间输出表示语 句。
本实施例提供了一种二分类树类型的待部署模型的模型输出的SQL语句 表示方法,也即,在获得各累计回归值表示之后,计算各累计回归值表示对 应的分类概率表示,进而基于各分类概率表示和预设选择语句块,即可将每 一模型决策树的二分类输出以SQL语句进行表示,进而在各所述分类概率表 示中确定第一目标分类概率表示,并确定所述第一目标分类概率表示对应的 第一类别输出概率表示和对应的第二类别输出概率表示,基于所述第一类别 输出概率表示、所述第二类别输出概率表示、各所述第一中间输出表示语句和所述选择语句块,构建所述二分类树类型对应的第一最终输出表示语句, 即可将待部署模型的最终输出以SQL语句进行表示,进而实现了将二分类树 类型的待部署模型的模型输出以SQL语句进行表示的目的,进而为将二分类 树类型的待部署模型以SQL语句进行部署奠定了基础。
进一步地,参照图5,基于本申请中第一实施例和第二实施例,在本申请 的另一实施例中,所述模型输出表示语句包括第二中间输出表示语句和第二 最终输出表示语句,所述模型类型判断结果包括多分类树类型,
所述基于各所述模型结构表示语句、各所述累计回归值表示和所述选择 语句块,构建所述模型类型判断结果对应的模型输出表示语句的步骤包括:
步骤B10,基于各所述累计回归值表示,计算所述待部署模型的各轮迭 代对应的分类概率数组表示;
在本实施例中,需要说明的是,所述分类概率数组表示为计算多个分类 概率组成的数组的SQL语句形式的表达式,在一种可实施的方案中,多分类 树类型的待部署模型对应k个分类类别,则多分类树类型的待部署模型的每 轮迭代需要构建k颗模型决策树,则多分类树类型的待部署模型的第i轮迭代 的分类概率数组表示如下所示:
Array(exp(t.tree<0>+t.tree<k>+...+t.tree<i*k >)/(exp(t.tree<0>+t.tree<k>…+t.tree<i*k>) +exp(t.tree<1>+t.tree<k+1>+...+t.tree<i*k+1 >)+…+exp(t.tree<k-1>+t.tree<2*k-1 >+...+t.tree<i*k+k-1>)),
exp(t.tree<1>+t.tree<k+1>+...+t.tree<i*k+1 >)>)/(exp(t.tree<0>+t.tree<k >+...+t.tree<i*k>)+exp(t.tree<1 >+t.tree<k+1>+...+t.tree<i*k+1 >)+…+exp(t.tree<k-1>+t.tree <2*k-1>+...+t.tree<i*k+k-1>)),
Figure RE-GDA0002643719200000201
,其中,所述分类概率数组表示记为predict_prob_<target_name>_list_i,t.tree<k>为模型结构表示语句的输出,也即为第k颗模型决策树的累计回归值, k为对应的模型决策树的编号为k。
基于各所述累计回归值表示,计算所述待部署模型的各轮迭代对应的 分类概率数组表示,具体地,在各所述累计回归值中确定所述待部署模型的 每一轮迭代中的每一模型决策树对应的累计回归值,并基于每一轮迭代对应 的各累计回归值与预设分类概率数组计算公式,计算所述待部署模型的各轮 迭代对应的概率数值,并将各所述概率数组的计算表达式作为所述分类概率 数组表示。
步骤B20,基于各所述分类概率数组表示、各所述模型结构表示语句和 所述选择语句块,构建所述多分类树类型对应的第二中间输出表示语句;
在本实施例中,需要说明的是,所述第二中间输出表示语句为计算多分 类树类型的待部署模型的各轮迭代的概率数组的SQL语句。
基于各所述分类概率数组表示、各所述模型结构表示语句和所述选择语 句块,构建所述多分类树类型对应的第二中间输出表示语句,具体地,将各 所述分类概率数组表示作为所述选择语句块的输出,将各所述模型结构表示 语句的输出作为所述选择语句块的输入,生成所述第二中间输出表示语句, 其中,所述第二中间输出表示语句为“select<predict_prob_<target_name>_list_0>,<predict_prob_<target_name>_list_1>,…, <predict_prob_<target_name>_list_<n-1>表达式>from>t表达式>”,其中,< predict_prob_<target_name>_list_<n-1>表达式>为第n颗模型决策树的分类概 率数组表示对应的输出,<t表达式>为所述模型结构表示语句,t为所述模型 结构表示语句的输出。
步骤B30,在各所述分类概率数组表示中确定目标分类概率数组表示, 并基于所述目标分类概率数组表示中的各类别事件概率表示,构建所述多分 类树类型对应的第二最终输出表示语句。
在本实施例中,需要说明的是,所述第二最终输出表示语句为计算多分 类树类型的待部署模型的最终预测值的SQL语句。
在各所述分类概率数组表示中确定目标分类概率数组表示,并基于所述 目标分类概率数组表示中的各类别事件概率表示,构建所述多分类树类型对 应的第二最终输出表示语句,具体地,在各所述分类概率数组表示中确定所 述待部署模型各轮迭代中最后一轮迭代对应的分类概率数组表示作为目标分 类概率数组表示,进而获取各所述目标分类概率数组表示中的各类别事件概 率表示,其中,所述类别事件概率表示为多分类树类型的待部署模型的各分 类类别的分类概率的SQL语句的表现形式,进而基于各所述类别时间概率表 示和所述预设选择语句块,生成所述多分类树类型对应的第二最终输出表示 语句。
其中,所述基于所述目标分类概率数组表示中的各类别事件概率表示, 构建所述多分类树类型对应的第二最终输出表示语句的步骤包括:
步骤B31,基于所述预设条件选择语句块,在各所述第二事件概率表示 中选取第二目标事件概率表示;
在本实施例中,基于所述预设条件选择语句块,在各所述第二事件概率 表示中选取第二目标事件概率表示,具体地,基于所述预设条件选择语句块, 在各所述第二事件概率表示对应的输出中确定最大输出,并将最大输出对应 的第二事件概率表示作为第二目标事件概率表示,其中,所述第二目标事件 概率表示为多分类树类型的待部署模型的最后一轮迭代对应的最终概率数组 中最大概率的SQL语言形式的计算表达式,其中,在一种可实施的方案中, 可使用预设条件选择语句块,将最终概率数组中的各分类类别对应的概率进 行两两之间的比对,以选取最大概率。
步骤B32,基于所述第二目标事件概率表示、各所述第二中间输出表示 语句、所述第二目标事件概率表示对应的类别标识和所述选择语句块,构建 所述第二最终输出表示语句。
在本实施例中,基于所述第二目标事件概率表示、各所述第二中间输出 表示语句、所述第二目标事件概率表示对应的类别标识和所述选择语句块, 构建所述第二最终输出表示语句,具体地,获取基于所述第二目标事件概率 表示的概率输出,并计算概率输出与1之间的概率输出差值,也即获得样本 不属于所述第二目标事件概率表示对应的分类类别的概率,并将计算所述概 率输出差值的表达式作为概率输出差值表示,并将所述第二目标事件概率表 示和所述概率输出差值表示作为所述选择语句块的输出,并基于各所述类别 标识,标记所述第二目标事件概率表示和概率输出差值表示,将各所述第二 中间输出表示语句作为所述选择语句块的输入,生成所述第二最终输出表示 语句,其中,在一种可实施的方案中,所述第二最终输出表示语句为“select g.*, <predict_<target_name>表达式>,<predict_prob_<target_name>表达式>from <g表达式>”,其中,<predict_<target_name>表达式>和 <predict_prob_<target_name>表达式>分别为所述第二目标事件概率表示和概 率输出差值表示,target_name为所述类别标识,<g表达式>为所述第二中间 输出表示语句。
本实施例提供了一种多分类树类型的待部署模型的模型输出的SQL语句 表示方法,也即,在获得各累计回归值表示之后,计算所述待部署模型的各 轮迭代的分类概率数组表示,进而基于各所述分类概率数组表示、各所述模 型结构表示语句和所述选择语句块,即可将所述待部署模型的各轮迭代的中 间输出以SQL语句进行表示,获得各第二中间输出表示语句,进而在各所述 分类概率数组表示中确定目标分类概率数组表示,并基于所述目标分类概率 数组表示中的各类别事件概率表示,构建所述多分类树类型对应的第二最终 输出表示语句,即可将多分类树类型的待部署模型的最终输出以SQL语句进 行表示,进而实现了将多分类树类型的待部署模型的模型输出以SQL语句进 行表示的目的,进而为将多分类树类型的待部署模型以SQL语句进行部署奠 定了基础。
参照图6,图6是本申请实施例方案涉及的硬件运行环境的设备结构示意 图。
如图6所示,该模型部署设备可以包括:处理器1001,例如CPU,存储 器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储 器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳 定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的 还可以是独立于前述处理器1001的存储设备。
可选地,该模型部署设备还可以包括矩形用户接口、网络接口、摄像头、 RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。矩 形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard), 可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的 可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图6中示出的模型部署设备结构并不构成对模 型部署设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件, 或者不同的部件布置。
如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系 统、网络通信模块以及模型部署程序。操作系统是管理和控制模型部署设备 硬件和软件资源的程序,支持模型部署程序以及其它软件和/或程序的运行。 网络通信模块用于实现存储器1005内部各组件之间的通信,以及与模型部署 系统中其它硬件和软件之间通信。
在图6所示的模型部署设备中,处理器1001用于执行存储器1005中存 储的模型部署程序,实现上述任一项所述的模型部署方法的步骤。
本申请模型部署设备具体实施方式与上述模型部署方法各实施例基本相 同,在此不再赘述。
本申请实施例还提供一种模型部署装置,所述模型部署装置应用于模型 部署设备,所述模型部署装置包括:
模型结构表示模块,用于获取待部署模型,并基于预设第一SQL语句模 板,对所述待部署模型进行嵌套转换,获得模型结构表示语句;
模型输出表示模块,用于基于预设第二SQL语句模板和所述模型结构表 示语句,生成所述待部署模型对应的模型输出表示语句。
可选地,所述模型结构表示模块包括:
获取子模块,用于获取各所述决策树节点对应的节点分裂条件和对应的 孩子节点;
生成子模块,用于基于所述条件选择语句块、各所述节点分裂条件和各 所述孩子节点,分别生成各所述决策树节点对应的目标条件选择语句;
嵌套子模块,用于基于各所述决策树节点之间的父子关系信息,将各所 述目标条件选择语句进行嵌套,获得所述模型决策树表示语句。
可选地,所述生成子模块包括:
第一选择单元,用于将各所述节点分裂条件作为选择条件,并将各所述 孩子节点作为选择分支;
第一输入生成单元,用于分别将各所述决策树节点对应的选择条件和对 应的选择分支输入所述条件选择语句块,获得各所述决策树节点对应的所述 目标条件选择语句。
可选地,所述嵌套子模块包括:
第一确定单元,用于在各所述决策树节点中确定根节点,将所述根节点 作为第一父节点;
第二确定单元,用于基于所述父子关系信息,确定所述第一父子节点对 应的各第一孩子节点;
第一嵌套单元,用于将各所述第一孩子节点的目标条件选择语句作为第 一选择分支嵌套在所述第一父节点的目标条件选择语句中,获得当前嵌套语 句;
第三确定单元,用于将各所述第一孩子节点作为各第二父节点,并基于 所述父子关系信息,确定各所述第二父子节点分别对应的各第二孩子节点;
第二嵌套单元,用于将各第二孩子节点的目标条件选择语句作为第二选 择分支分别嵌套在对应的各所述第一选择分支中,以更新所述当前嵌套语句, 直至到达所述模型决策树的叶子节点,将所述当前嵌套语句作为所述模型决 策树表示语句。
可选地,所述模型输出表示模块包括:
判断子模块,用于判断所述待部署模型的模型类型,获得模型类型判断 结果;
计算子模块,用于获取各所述模型结构表示语句对应的树输出结果,并 基于各所述树输出结果,计算所述待部署模型的各轮迭代对应的累计回归值 表示;
构建子模块,用于基于各所述模型结构表示语句、各所述累计回归值表 示和所述选择语句块,构建所述模型类型判断结果对应的模型输出表示语句。
可选地,所述构建子模块包括:
第二选择单元,用于将各所述累计回归值表示作为选择结果,并将各所 述模型结构表示语句作为第一待选择数据集;
第二生成单元,用于将各所述选择结果和所述第一待选择数据集输入所 述选择语句块,生成所述回归树类型对应的模型输出表示语句。
可选地,所述构建子模块还包括:
第一构建单元,用于计算各所述累计回归值表示对应的分类概率表示, 并基于各所述分类概率表示、各所述模型结构表示语句和所述选择语句块, 构建所述二分类树类型对应的第一中间输出表示语句;
第四确定单元,用于在各所述分类概率表示中确定第一目标分类概率表 示,并确定所述第一目标分类概率表示对应的第一类别输出概率表示和对应 的第二类别输出概率表示;
第二构建单元,用于基于所述第一类别输出概率表示、所述第二类别输 出概率表示、各所述第一中间输出表示语句和所述选择语句块,构建所述二 分类树类型对应的第一最终输出表示语句。
可选地,所述构建子模块还包括:
计算单元,用于基于各所述累计回归值表示,计算所述待部署模型的各 轮迭代对应的分类概率数组表示;
第三构建单元,用于基于各所述分类概率数组表示、各所述模型结构表 示语句和所述选择语句块,构建所述多分类树类型对应的第二中间输出表示 语句;
第四构建单元,用于在各所述分类概率数组表示中确定目标分类概率数 组表示,并基于所述目标分类概率数组表示中的各类别事件概率表示,构建 所述多分类树类型对应的第二最终输出表示语句。
可选地,所述第四构建单元包括:
选择子单元,用于基于所述预设条件选择语句块,在各所述第二事件概 率表示中选取第二目标事件概率表示;
构建子单元,用于基于所述第二目标事件概率表示、各所述第二中间输 出表示语句、所述第二目标事件概率表示对应的类别标识和所述选择语句块, 构建所述第二最终输出表示语句。
本申请模型部署装置的具体实施方式与上述模型部署方法各实施例基本 相同,在此不再赘述。
本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一 个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上 的处理器执行以用于实现上述任一项所述的模型部署方法的步骤。
本申请可读存储介质具体实施方式与上述模型部署方法各实施例基本相 同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是 利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间 接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (11)

1.一种模型部署方法,其特征在于,所述模型部署方法包括:
获取待部署模型,并基于预设第一SQL语句模板,对所述待部署模型进行嵌套转换,获得模型结构表示语句;
基于预设第二SQL语句模板和所述模型结构表示语句,生成所述待部署模型对应的模型输出表示语句。
2.如权利要求1所述模型部署方法,其特征在于,所述预设第一SQL语句模板包括条件选择语句块,所述待部署模型至少包括一模型决策树,所述模型决策树至少包括一决策树节点,所述模型结构表示语句至少包括一个模型决策树表示语句,
所述基于预设第一SQL语句模板,对所述待部署模型进行嵌套转换,获得模型结构表示语句的步骤包括:
获取各所述决策树节点对应的节点分裂条件和对应的孩子节点;
基于所述条件选择语句块、各所述节点分裂条件和各所述孩子节点,分别生成各所述决策树节点对应的目标条件选择语句;
基于各所述决策树节点之间的父子关系信息,将各所述目标条件选择语句进行嵌套,获得所述模型决策树表示语句。
3.如权利要求2所述模型部署方法,其特征在于,所述基于所述条件选择语句块、各所述节点分裂条件和各所述孩子节点,分别生成各所述决策树节点对应的目标条件选择语句的步骤包括:
将各所述节点分裂条件作为选择条件,并将各所述孩子节点作为选择分支;
分别将各所述决策树节点对应的选择条件和对应的选择分支输入所述条件选择语句块,获得各所述决策树节点对应的所述目标条件选择语句。
4.如权利要求2所述模型部署方法,其特征在于,所述基于各所述决策树节点之间的父子关系信息,将各所述目标条件选择语句进行嵌套,获得所述模型决策树表示语句的步骤包括:
在各所述决策树节点中确定根节点,将所述根节点作为第一父节点;
基于所述父子关系信息,确定所述第一父子节点对应的各第一孩子节点;
将各所述第一孩子节点的目标条件选择语句作为第一选择分支嵌套在所述第一父节点的目标条件选择语句中,获得当前嵌套语句;
将各所述第一孩子节点作为各第二父节点,并基于所述父子关系信息,确定各所述第二父子节点分别对应的各第二孩子节点;
将各第二孩子节点的目标条件选择语句作为第二选择分支分别嵌套在对应的各所述第一选择分支中,以更新所述当前嵌套语句,直至到达所述模型决策树的叶子节点,将所述当前嵌套语句作为所述模型决策树表示语句。
5.如权利要求1所述模型部署方法,其特征在于,所述基于预设第二SQL语句模板和所述模型结构表示语句,生成所述待部署模型对应的模型输出表示语句的步骤包括:
判断所述待部署模型的模型类型,获得模型类型判断结果;
获取各所述模型结构表示语句对应的树输出结果,并基于各所述树输出结果,计算所述待部署模型的各轮迭代对应的累计回归值表示;
基于各所述模型结构表示语句、各所述累计回归值表示和所述选择语句块,构建所述模型类型判断结果对应的模型输出表示语句。
6.如权利要求5所述模型部署方法,其特征在于,所述模型类型判断结果包括回归树类型,
所述基于各所述模型结构表示语句、各所述累计回归值表示和所述选择语句块,构建所述模型类型判断结果对应的模型输出表示语句的步骤包括:
将各所述累计回归值表示作为选择结果,并将各所述模型结构表示语句作为第一待选择数据集;
将各所述选择结果和所述第一待选择数据集输入所述选择语句块,生成所述回归树类型对应的模型输出表示语句。
7.如权利要求5所述模型部署方法,其特征在于,所述模型输出表示语句包括第一中间输出表示语句和第一最终输出表示语句,所述模型类型判断结果包括二分类树类型,
所述基于所述模型类型判断结果、各所述模型结构表示语句和所述选择语句块,构建所述模型输出表示语句的步骤包括:
计算各所述累计回归值表示对应的分类概率表示,并基于各所述分类概率表示、各所述模型结构表示语句和所述选择语句块,构建所述二分类树类型对应的第一中间输出表示语句;
在各所述分类概率表示中确定第一目标分类概率表示,并确定所述第一目标分类概率表示对应的第一类别输出概率表示和对应的第二类别输出概率表示;
基于所述第一类别输出概率表示、所述第二类别输出概率表示、各所述第一中间输出表示语句和所述选择语句块,构建所述二分类树类型对应的第一最终输出表示语句。
8.如权利要求5所述模型部署方法,其特征在于,所述模型输出表示语句包括第二中间输出表示语句和第二最终输出表示语句,所述模型类型判断结果包括多分类树类型,
所述基于各所述模型结构表示语句、各所述累计回归值表示和所述选择语句块,构建所述模型类型判断结果对应的模型输出表示语句的步骤包括:
基于各所述累计回归值表示,计算所述待部署模型的各轮迭代对应的分类概率数组表示;
基于各所述分类概率数组表示、各所述模型结构表示语句和所述选择语句块,构建所述多分类树类型对应的第二中间输出表示语句;
在各所述分类概率数组表示中确定目标分类概率数组表示,并基于所述目标分类概率数组表示中的各类别事件概率表示,构建所述多分类树类型对应的第二最终输出表示语句。
9.如权利要求8所述模型部署方法,其特征在于,所述基于所述目标分类概率数组表示中的各类别事件概率表示,构建所述多分类树类型对应的第二最终输出表示语句的步骤包括:
基于所述预设条件选择语句块,在各所述第二事件概率表示中选取第二目标事件概率表示;
基于所述第二目标事件概率表示、各所述第二中间输出表示语句、所述第二目标事件概率表示对应的类别标识和所述选择语句块,构建所述第二最终输出表示语句。
10.一种模型部署设备,其特征在于,所述模型部署设备包括:存储器、处理器以及存储在存储器上的用于实现所述模型部署方法的程序,
所述存储器用于存储实现模型部署方法的程序;
所述处理器用于执行实现所述模型部署方法的程序,以实现如权利要求1至9中任一项所述模型部署方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现模型部署方法的程序,所述实现模型部署方法的程序被处理器执行以实现如权利要求1至9中任一项所述模型部署方法的步骤。
CN202010769837.8A 2020-07-31 2020-07-31 模型部署方法、设备及可读存储介质 Active CN111897832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010769837.8A CN111897832B (zh) 2020-07-31 2020-07-31 模型部署方法、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010769837.8A CN111897832B (zh) 2020-07-31 2020-07-31 模型部署方法、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN111897832A true CN111897832A (zh) 2020-11-06
CN111897832B CN111897832B (zh) 2024-04-12

Family

ID=73183267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010769837.8A Active CN111897832B (zh) 2020-07-31 2020-07-31 模型部署方法、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111897832B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971032A (zh) * 2021-12-24 2022-01-25 百融云创科技股份有限公司 一种代码生成的机器学习模型全流程自动部署方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070185896A1 (en) * 2006-02-01 2007-08-09 Oracle International Corporation Binning predictors using per-predictor trees and MDL pruning
CN102693310A (zh) * 2012-05-28 2012-09-26 无锡成电科大科技发展有限公司 一种基于关系数据库的资源描述框架查询方法和系统
CN107451153A (zh) * 2016-05-31 2017-12-08 北京京东尚科信息技术有限公司 输出结构化查询语句的方法和装置
US20190065507A1 (en) * 2017-08-22 2019-02-28 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for information processing
CN110597847A (zh) * 2019-09-19 2019-12-20 深圳前海微众银行股份有限公司 Sql语句自动生成方法、装置、设备及可读存储介质
CN111324344A (zh) * 2020-02-28 2020-06-23 深圳前海微众银行股份有限公司 代码语句的生成方法、装置、设备及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070185896A1 (en) * 2006-02-01 2007-08-09 Oracle International Corporation Binning predictors using per-predictor trees and MDL pruning
CN102693310A (zh) * 2012-05-28 2012-09-26 无锡成电科大科技发展有限公司 一种基于关系数据库的资源描述框架查询方法和系统
CN107451153A (zh) * 2016-05-31 2017-12-08 北京京东尚科信息技术有限公司 输出结构化查询语句的方法和装置
US20190065507A1 (en) * 2017-08-22 2019-02-28 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for information processing
CN110597847A (zh) * 2019-09-19 2019-12-20 深圳前海微众银行股份有限公司 Sql语句自动生成方法、装置、设备及可读存储介质
CN111324344A (zh) * 2020-02-28 2020-06-23 深圳前海微众银行股份有限公司 代码语句的生成方法、装置、设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
崔娜;: "面向数据库性能的SQL语句解析与翻译", 现代电子技术, no. 11 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971032A (zh) * 2021-12-24 2022-01-25 百融云创科技股份有限公司 一种代码生成的机器学习模型全流程自动部署方法及系统

Also Published As

Publication number Publication date
CN111897832B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
US11604896B2 (en) Systems and methods to improve data clustering using a meta-clustering model
US11036483B2 (en) Method for predicting the successfulness of the execution of a DevOps release pipeline
CN114547072A (zh) 自然语言查询转换sql方法、系统、设备及存储介质
US11164044B2 (en) Systems and methods for tagging datasets using models arranged in a series of nodes
CN116594748B (zh) 针对任务的模型定制处理方法、装置、设备和介质
CN116663938B (zh) 基于企业数据中台系统的信息化管理方法及其相关装置
CN112860736A (zh) 大数据查询优化方法、设备及可读存储介质
CN110597847A (zh) Sql语句自动生成方法、装置、设备及可读存储介质
CN112817560B (zh) 一种基于表函数的计算任务处理方法、系统及计算机可读存储介质
CN111897832B (zh) 模型部署方法、设备及可读存储介质
KR102153259B1 (ko) 데이터 도메인 추천 방법 및 추천된 도메인을 이용하여 통합 데이터 저장소 관리 시스템을 구축하는 방법
WO2023078009A1 (zh) 一种模型权重获取方法以及相关系统
CN111324344A (zh) 代码语句的生成方法、装置、设备及可读存储介质
CN116433799A (zh) 一种基于语义相似度和子图匹配的流程图生成方法和装置
CN115878864A (zh) 一种数据检索方法、装置、设备及可读存储介质
CN116302088A (zh) 一种代码克隆检测方法、存储介质及设备
CN115905293A (zh) 作业执行引擎的切换方法及装置
CN112084753B (zh) 一种文档辅助编辑的方法和系统
CN114913008A (zh) 基于决策树的债券价值分析方法、装置、设备及存储介质
US11645125B2 (en) Method and apparatus for executing workflow including functions written in heterogeneous programing language
CN114625967A (zh) 基于大数据业务优化的用户信息挖掘方法及人工智能系统
CN114329128A (zh) 标注数据的获取方法、装置、计算机设备和存储介质
CN113722584A (zh) 任务推送方法、装置及存储介质
CN112348045B (zh) 神经网络的训练方法、训练装置和电子设备
CN113591979A (zh) 行业类目识别方法、设备、介质及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant