CN110659261A - 一种数据挖掘模型发布方法及模型和模型服务管理方法 - Google Patents

一种数据挖掘模型发布方法及模型和模型服务管理方法 Download PDF

Info

Publication number
CN110659261A
CN110659261A CN201910886529.0A CN201910886529A CN110659261A CN 110659261 A CN110659261 A CN 110659261A CN 201910886529 A CN201910886529 A CN 201910886529A CN 110659261 A CN110659261 A CN 110659261A
Authority
CN
China
Prior art keywords
model
data mining
mining model
service
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910886529.0A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shuzhilian Technology Co Ltd
Original Assignee
Chengdu Shuzhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shuzhilian Technology Co Ltd filed Critical Chengdu Shuzhilian Technology Co Ltd
Priority to CN201910886529.0A priority Critical patent/CN110659261A/zh
Publication of CN110659261A publication Critical patent/CN110659261A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据挖掘模型发布方法及模型和模型服务管理方法,包括:在线创建数据挖掘训练任务并在线训练生成数据挖掘模型;收集数据挖掘模型信息并存储在模型信息数据库,将数据挖掘模型存储在模型服务器;根据数据挖掘模型信息,创建数据挖掘模型服务信息并存储在模型服务信息数据库,根据模型服务信息配置服务运行的环境变量,并将环境变量配置文件存储在模型服务器,根据环境变量配置文件创建数据挖掘模型服务。本方法能够将数据挖掘模型发布为Web服务,支持模型预测、模型信息查询等功能,有助于降低Web应用开发成本以及科学管理模型和模型服务。

Description

一种数据挖掘模型发布方法及模型和模型服务管理方法
技术领域
本发明涉及机器学习算法模型在线部署领域,具体地,涉及一种数据挖掘模型发布方法及模型和模型服务管理方法。
背景技术
随着机器学习、数据挖掘等领域的发展,将模型部署到线上提供在线获取模型服务,使得开发人员利用机器学习模型解决业务问题更加便捷。
传统的模型在线服务方法主要是将训练好的模型导成PMML文件,并存储在Web服务器,需要在Web应用程序内部加载模型,并且为每个模型搭建单独的模型应用程序,从而将模型部署为在线服务。PMML文件虽然能够跨多种平台使用,但存在模型文件过大、模型加载速度较慢等缺点;并且Web应用开发人员需要根据不同模型搭建不同的模型应用程序,提高了开发成本;各个模型服务嵌入应用内部,致使模型维护困难。如何将模型高效部署成线上服务以及模型的科学管理成为需要解决的重要问题。
发明内容
本发明的目的是为了降低数据挖掘模型在线应用设计成本,为用户提供一站式模型线上部署和获取模型服务的接口。
本发明提供了一种数据挖掘模型发布方法及模型和模型服务管理方法,本方法能够将数据挖掘模型发布为Web服务,支持模型预测、模型信息查询等功能,有助于降低Web应用开发成本以及科学管理模型和模型服务。
本发明提供了一种数据挖掘模型发布方法,所述方法包括:
建立模型,通过在线创建数据挖掘训练任务并在线训练生成模型完成模型构建。
持久化存储模型,接收用户存储模型的事件,收集模型信息存入模型信息数据库,所述模型信息包括模型ID、模型名称、模型描述信息、模型存储路径等,持久化存储模型文件在模型服务器。
发布模型,接收用户的模型发布请求事件,根据所述模型信息构建模型服务信息并存储在模型服务信息数据库,所述模型服务信息包括模型服务ID、模型存储路径、模型服务名称、模型服务描述等,根据所述模型服务信息配置服务运行的环境变量并将环境变量配置文件保存在所述模型服务器,根据所述环境变量启动模型服务程序以将模型部署到线上。模型服务启动程序首先加载环境变量并进行用户安全认证,通过认证后加载模型,启动容器服务并生成请求地址。所述模型服务成功启动后持续监听用户请求,根据所述用户请求预测以及反馈模型信息。
本方法还提供了一种基于数据挖掘的模型和模型服务管理方法,包括:
模型管理,对于持久化存储的模型,用户可以进行编辑、删除、下载、发布等操作。所述模型编辑即修改所述模型信息数据库中存储的模型信息;所述模型删除,首先删除持久化存储的模型文件,然后删除模型信息数据库中存储的模型文件对应的模型信息;所述模型下载是将模型文件下载到本地文件系统;所述模型发布是将持久化存储的模型发布为在线服务。
模型服务管理,对于已发布的模型服务,用户可以进行编辑、删除、查看请求地址等操作。所述编辑模型服务即修改模型服务信息数据库中存储的模型服务信息;所述删除模型服务,首先停止并删除模型服务的容器,然后删除模型服务对应的环境变量配置文件,最后删除模型服务信息数据库中存储的模型服务信息;所述模型服务的请求地址是用户获取模型服务的Restful API。
本申请提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明采用容器技术为用户提供一种微服务模型部署方式,用户只需访问模型的RestfulAPI即可获取模型服务,极大降低了模型在线应用集成WEB应用的开发成本。用户根据自己需要的Web应用设计,可以发布多个模型服务,每个模型都独立部署,使用户拥有一组粒度相对较细的模型服务,各个模型的维护也相对容易。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1示出了本发明实施例提供的一种数据挖掘模型发布与管理整体流程示意图;
图2示出了本发明实施例提供的一种将模型发布为Web服务的流程示意图;
图3示出了本发明实施例提供的一种启动模型容器服务的流程示意图;
图4示出了本发明实施例提供的一种模型服务响应用户请求的流程示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,本发明实施例提供的数据挖掘模型的发布与管理整体流程:
步骤S101,在线创建数据挖掘训练任务并在线训练生成模型;
本发明实施例所述数据挖掘训练任务是针对能够完成数据挖掘任务,但未经优化的模型,训练优化模型参数,当训练结果达到要求时模型训练完成。如果用户选择存储模型,本发明实施例提供了将模型持久化存储在模型服务器的方法,通过提取模型的固有信息(如模型的meta信息、模型存储路径等),同时加入如模型ID、模型描述等字段构建模型信息并存入模型信息数据库,模型信息数据库中一条模型信息即代表一个持久化存储的模型。
步骤S102,用户对持久化存储在模型服务器的模型执行编辑、下载、删除、发布等操作;
本发明实施例提供编辑已完成持久化存储的模型的方法,可编辑的内容为模型名称和模型描述信息,通过修改模型信息数据库存储的模型信息完成编辑操作。本发明实施例提供模型下载方法,服务器接收用户的下载请求,与客户端建立通信连接,完成下载任务。本发明实施例提供模型删除方法,先删除存储在模型服务器的模型文件,然后删除模型信息数据库中存储的模型文件对应的模型信息。本发明实施例提供模型发布方法,接收到用户的发布请求时即进入下一步,执行模型发布。
步骤S103,如果进行所述发布操作,则收集模型必要信息,构建模型服务信息,执行模型发布程序,将模型发布为Web服务;
如图2所示模型发布流程,首先提取所述模型信息,根据所述模型信息构建模型服务信息,模型服务信息包括:模型服务ID、模型服务名称、模型服务描述信息、模型存储路径等,然后将模型服务信息存入模型服务信息数据库,一条模型服务信息即代表一个模型服务。再根据模型服务信息配置模型服务运行的环境变量(包括模型的存储路径等),并将环境变量的配置文件存入模型服务器。最后根据环境变量发布模型服务。
所述模型服务是部署为线上容器服务,所述模型服务的启动流程如图3所示。本发明实施例提供的模型服务启动方法,首先读取所述环境变量并进行用户安全认证,所述环境变量包含模型的存储路径,根据存储路径加载模型,然后启动http服务,暴露服务器服务端口,生成模型服务的请求地址(Restful API),模型服务启动完成。如图4所示,用户在自己的应用程序中访问所述请求地址并发送post请求,即可进行预测,发送get请求即可获取模型的meta信息。所述容器服务顺利启动,则模型服务就一直处于活跃状态,可执行模型服务管理操作。
步骤S104,用户对发布的模型服务执行编辑、删除、查看请求地址等操作。
本实施例提供编辑模型服务的方法,可编辑内容为模型服务的名称和模型服务描述信息,通过修改该模型服务在模型服务信息数据库中存储的模型服务信息完成;本实施例提供删除模型服务的方法,首先停止并删除容器服务,然后删除容器服务对应的环境变量配置文件,最后删除容器服务对应的模型服务信息。用户可直接在客户端查看模型服务的请求地址,本发明实施例提供的模型服务请求地址编码格式为“服务器地址:端口映射地址”。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种数据挖掘模型发布方法,其特征在于,所述方法包括:
在线创建数据挖掘训练任务并在线训练生成数据挖掘模型;
接收用户存储数据挖掘模型的事件信息,收集数据挖掘模型信息并存储到模型信息数据库,将数据挖掘模型存储在模型服务器;
接收用户数据挖掘模型发布请求事件信息,根据数据挖掘模型信息创建数据挖掘模型服务信息并存储在模型服务信息数据库,根据模型服务信息配置服务运行的环境变量,并将环境变量配置文件存储在模型服务器,根据环境变量配置文件创建数据挖掘模型服务。
2.根据权利要求1所述的一种数据挖掘模型发布方法,其特征在于,数据挖掘模型持久化存储在模型服务器。
3.根据权利要求1所述的一种数据挖掘模型发布方法,其特征在于,数据挖掘模型信息包括但不限于:数据挖掘模型ID、数据挖掘模型名称、数据挖掘模型描述信息和数据挖掘模型存储路径。
4.根据权利要求1所述的一种数据挖掘模型发布方法,其特征在于,数据挖掘模型服务信息包括但不限于:数据挖掘模型服务ID、数据挖掘模型存储路径、数据挖掘模型服务名称和数据挖掘模型服务描述。
5.根据权利要求1所述的一种数据挖掘模型发布方法,其特征在于,环境变量配置文件至少包括数据挖掘模型存储路径。
6.根据权利要求1所述的一种数据挖掘模型发布方法,其特征在于,数据挖掘模型服务读取环境变量配置文件后进行用户安全认证,通过认证后加载数据挖掘模型,生成服务请求地址并持续监听用户请求信息,根据用户请求信息反馈用户预测结果或数据挖掘模型信息。
7.一种采用权利要求1-6任意一个所述的一种数据挖掘模型发布方法所发布的数据挖掘模型管理方法,其特征在于,数据挖掘模型管理方法包括:对存储在模型服务器的目标数据挖掘模型执行编辑、删除、下载和发布操作。
8.根据权利要求7所述的数据挖掘模型管理方法,其特征在于,模型编辑为:修改模型信息数据库中目标数据挖掘模型信息的数据挖掘模型名称、数据挖掘模型描述;模型删除为:首先删除存储在模型服务器中的目标数据挖掘模型,然后删除模型信息数据库存储的对应目标数据挖掘模型信息。
9.一种采用权利要求1-6任意一个所述的一种数据挖掘模型发布方法所创建的数据挖掘模型服务管理方法,其特征在于,数据挖掘模型服务管理方法包括:对已经发布的数据挖掘模型服务执行编辑、删除、查看请求地址操作。
10.根据权利要求9所述的数据挖掘模型服务管理方法,其特征在于,数据挖掘模型服务编辑为:修改模型服务信息数据库中目标数据挖掘模型服务信息的数据挖掘模型服务名称、数据挖掘模型服务描述;数据挖掘模型服务删除为:首先停止并删除目标数据挖掘模型服务,然后删除目标数据挖掘模型服务的环境变量配置文件,最后删除模型服务信息数据库存储的目标数据挖掘模型服务信息。
CN201910886529.0A 2019-09-19 2019-09-19 一种数据挖掘模型发布方法及模型和模型服务管理方法 Pending CN110659261A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910886529.0A CN110659261A (zh) 2019-09-19 2019-09-19 一种数据挖掘模型发布方法及模型和模型服务管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910886529.0A CN110659261A (zh) 2019-09-19 2019-09-19 一种数据挖掘模型发布方法及模型和模型服务管理方法

Publications (1)

Publication Number Publication Date
CN110659261A true CN110659261A (zh) 2020-01-07

Family

ID=69037283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910886529.0A Pending CN110659261A (zh) 2019-09-19 2019-09-19 一种数据挖掘模型发布方法及模型和模型服务管理方法

Country Status (1)

Country Link
CN (1) CN110659261A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967613A (zh) * 2020-08-24 2020-11-20 浙江百应科技有限公司 Nlp模型训练发布识别系统
CN112069226A (zh) * 2020-08-12 2020-12-11 福建博思软件股份有限公司 一种数据挖掘模型跨平台共享的方法和存储设备
CN112256760A (zh) * 2020-10-23 2021-01-22 平安科技(深圳)有限公司 一种数据预测方法、装置、计算机设备及存储介质
CN112667702A (zh) * 2020-12-03 2021-04-16 成都大数据产业技术研究院有限公司 基于大数据的数据挖掘系统
CN113556375A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 云计算服务方法、装置、电子设备和计算机存储介质
WO2021244377A1 (zh) * 2020-06-04 2021-12-09 华为技术有限公司 一种模型更新方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250987A (zh) * 2016-07-22 2016-12-21 无锡华云数据技术服务有限公司 一种机器学习方法、装置及大数据平台
CN109271602A (zh) * 2018-09-05 2019-01-25 腾讯科技(深圳)有限公司 深度学习模型发布方法及装置
CN109358842A (zh) * 2018-09-25 2019-02-19 广州城市信息研究所有限公司 一种服务实现方法、电子设备及存储介质
CN109978062A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种模型在线监控方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250987A (zh) * 2016-07-22 2016-12-21 无锡华云数据技术服务有限公司 一种机器学习方法、装置及大数据平台
CN109271602A (zh) * 2018-09-05 2019-01-25 腾讯科技(深圳)有限公司 深度学习模型发布方法及装置
CN109358842A (zh) * 2018-09-25 2019-02-19 广州城市信息研究所有限公司 一种服务实现方法、电子设备及存储介质
CN109978062A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种模型在线监控方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556375A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 云计算服务方法、装置、电子设备和计算机存储介质
WO2021244377A1 (zh) * 2020-06-04 2021-12-09 华为技术有限公司 一种模型更新方法及装置
CN112069226A (zh) * 2020-08-12 2020-12-11 福建博思软件股份有限公司 一种数据挖掘模型跨平台共享的方法和存储设备
CN112069226B (zh) * 2020-08-12 2022-05-17 福建博思软件股份有限公司 一种数据挖掘模型跨平台共享的方法和存储设备
CN111967613A (zh) * 2020-08-24 2020-11-20 浙江百应科技有限公司 Nlp模型训练发布识别系统
CN112256760A (zh) * 2020-10-23 2021-01-22 平安科技(深圳)有限公司 一种数据预测方法、装置、计算机设备及存储介质
CN112256760B (zh) * 2020-10-23 2021-07-06 平安科技(深圳)有限公司 一种数据预测方法、装置、计算机设备及存储介质
WO2022011946A1 (zh) * 2020-10-23 2022-01-20 平安科技(深圳)有限公司 一种数据预测方法、装置、计算机设备及存储介质
CN112667702A (zh) * 2020-12-03 2021-04-16 成都大数据产业技术研究院有限公司 基于大数据的数据挖掘系统

Similar Documents

Publication Publication Date Title
CN110659261A (zh) 一种数据挖掘模型发布方法及模型和模型服务管理方法
CN106020930B (zh) 一种基于应用容器的应用管理方法及系统
CN107370786B (zh) 一种基于微服务架构的通用信息管理系统
CN104380261B (zh) 本地支持的基于云端的存储
CN105677250B (zh) 对象存储系统中的对象数据的更新方法和更新装置
CN104395855A (zh) 用户组之间的基于云端的数据项共享和协作
CN106407757B (zh) 数据库的访问权限处理方法、装置及系统
CN107885551A (zh) 一种服务部署方法、装置、可读介质及存储控制器
CN111596932B (zh) 一种镜像文件生成方法、装置和计算机可读存储介质
CN106357791A (zh) 业务处理方法、装置及系统
CN114791846B (zh) 一种针对云原生混沌工程实验实现可观测性的方法
CN103942281A (zh) 一种对持久化存储的对象进行操作的方法及装置
CN110389766A (zh) HBase容器集群部署方法、系统、设备及计算机可读存储介质
CN114880100A (zh) 容器动态调度方法、装置、计算机设备和存储介质
CN115454420A (zh) 人工智能算法模型部署系统、方法、设备及存储介质
CN114006815A (zh) 云平台节点的自动化部署方法、装置、节点及存储介质
CN111176834A (zh) 自动伸缩策略运维方法、系统和可读存储介质
CN108334374A (zh) 组件动态加载与执行的方法和装置
CN110781137A (zh) 分布式系统的目录读取方法、装置、服务器和存储介质
CN112130864A (zh) 一种私有云平台服务软件的部署方法及部署装置
CN113435489B (zh) 部署系统的方法、装置、计算机可读存储介质及处理器
CN109919762A (zh) 客户信息的报备方法、装置、设备及存储介质
CN114490073A (zh) 电子地图运维方法、电子地图数据使用方法及服务系统
CN114282210A (zh) 沙箱自动构建方法、系统、计算机设备及可读存储介质
CN113326052A (zh) 业务组件的升级方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 610000 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan

Applicant after: Chengdu shuzhilian Technology Co.,Ltd.

Address before: 610000 No.2, 4th floor, building 1, Jule Road intersection, West 1st section of 1st ring road, Wuhou District, Chengdu City, Sichuan Province

Applicant before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200107