CN110333930A - 数字化平台系统 - Google Patents

数字化平台系统 Download PDF

Info

Publication number
CN110333930A
CN110333930A CN201910356830.0A CN201910356830A CN110333930A CN 110333930 A CN110333930 A CN 110333930A CN 201910356830 A CN201910356830 A CN 201910356830A CN 110333930 A CN110333930 A CN 110333930A
Authority
CN
China
Prior art keywords
module
host
container
digital platform
platform system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910356830.0A
Other languages
English (en)
Inventor
李恒强
房建伟
丛新法
冯强
侯青军
蒋家伟
李�瑞
毛聪
卢昌温
张凯
杨涛
陈怡静
曹鑫玉
邹本法
靳毅
闫颖莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201910356830.0A priority Critical patent/CN110333930A/zh
Publication of CN110333930A publication Critical patent/CN110333930A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/447Target code generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种数字化平台系统,包括:主机池系统;其中,主机池系统包括多个主机,多个主机中设置有共享资源,共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;在多个主机中存在发生故障的故障主机的情况下,通过分布式资源管理模块确定正常主机,其中,正常主机为:多个主机中没有发生故障的主机;通过负载均衡模块将故障主机的业务迁移到正常主机;基于软件容器模块在正常主机运行故障主机的业务。本申请提供的数字化平台系统多个主机可以提供更强大的计算能力,容器化技术使得系统中某个主机出现故障时,可以迅速基于软件容器模块在其他主机上实现该出现故障主机的业务运行,提高运维效率。

Description

数字化平台系统
技术领域
本申请涉及电子技术领域,尤其涉及一种数字化平台系统。
背景技术
数字化运营平台通常指以核心业务为切入点,通过接口调用、应用运行、平台状态监控等,实现客户端到服务器端的监控和调度职能。
现有技术中,数字化运营平台通常布置在服务提供商的一台服务器上,通过服务器实现相关的运营管理功能。
但是由于数字化运营平台处理的数据量大、任务多,单台服务器的性能限制了平台的部署规模,并且当运营平台中单点故障之后,可能会影响整体的运营情况,使得系统运维的难度较大,效率较低。
发明内容
本申请提供一种数字化平台系统,以提升数字化运营平台的运维效率。
本申请第一方面提供一种数字化平台系统,包括:
主机池系统;其中,所述主机池系统包括多个主机,所述多个主机中设置有共享资源,所述共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;所述分布式资源管理模块用于调度所述主机池系统的硬件资源;所述负载均衡模块用于调度所述主机池系统的负载资源;所述软件容器模块用于将所述主机池系统的应用打包在容器中;
所述主机池系统用于,在所述多个主机中存在发生故障的故障主机的情况下,通过所述分布式资源管理模块确定正常主机,其中,所述正常主机为:所述多个主机中没有发生故障的主机;通过所述负载均衡模块将所述故障主机的业务迁移到正常主机;基于所述软件容器模块在所述正常主机运行所述故障主机的业务。
可选的,所述容器对应有镜像,以通过所述镜像实现对所述容器的调用,所述系统还包括:
门户展现系统,所述门户展现系统包括镜像管理模块和用户界面模块;所述镜像管理模块用于管理所述容器的镜像;所述用户界面模块用于接收输入信息;
所述门户展现系统,用于在接收到输入信息的情况下,确定所述输入信息对应的目标镜像,以通过与所述目标镜像匹配的目标容器提供用户服务。
可选的,还包括核心应用系统,所述核心应用系统包括:定时器模块、调度器模块;
其中,所述定时器模块用于根据预设的定时策略获取所述多个主机的运行信息;所述调度器模块用于根据所述运行信息判定所述多个主机中是否存在故障主机。
可选的,所述调度器模块还用于,将所述运行信息与预设的故障信息表匹配,若所述运行信息与所述故障信息表中的故障信息匹配,确定所述多个主机中存在故障主机。
可选的,所述核心应用系统还包括:第一报警模块;
所述第一报警模块用于在所述调度器模块判定存在故障主机的情况下进行报警提示。
可选的,所述核心应用系统还包括:容器监控模块和第二报警模块;
所述容器监控模块用于监控所述容器,获取所述容器的监控数据,将所述监控数据转换为预设格式的目标监控数据,根据所述目标监控数据判定所述容器是否发生故障;所述第二报警模块用于在所述容器发生故障的情况下进行报警提示。
可选的,所述核心应用系统还包括:网页服务模块和信息解析器模块;
所述网页服务模块用于存储所述运行信息;所述信息解析器模块用于所述数字化平台运行中的业务和指令转发。
可选的,所述门户展现系统包括:服务管理模块和开源组件模块;
所述服务管理模块用于提供运维管理接口,以通过所述服务管理模块对所述数字化平台系统进行监控管理;
所述开源组件模块用于接收插件插入所述数字化平台系统。
可选的,所述共享资源还包括:分布式键值存储模块;
所述分布式键值存储模块用于根据预设的模板将所述软件容器模块容器中的容器信息进行模板配置。
可选的,还包括:浏览器接入系统;所述浏览器接入系统包括:区域运维模块和用户访问模块;
所述区域运维模块用于接受不同区域的运维信息;所述用户访问模块用于接收用户访问。
本申请实施例相对于现有技术的有益效果:
本申请实施例提供的一种数字化平台系统,在数字化平台系统设置了分布式框架的主机池系统,具体的,主机池系统包括多个主机,该多个主机中设置有共享资源,共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;其中,分布式资源管理模块用于调度主机池系统的硬件资源;负载均衡模块用于调度主机池系统的负载资源;软件容器模块用于将主机池系统的应用打包在容器中,使得主机池系统在多个主机中存在发生故障的故障主机的情况下,可以通过分布式资源管理模块确定没有发生故障的正常主机,通过负载均衡模块将故障主机的业务迁移到正常主机,基于软件容器模块在正常主机运行故障主机的业务。也即,本申请实施例提供的数字化平台系统,采用分布式框架将共享资源布设在多个主机中,利用容器化技术将应用打包在容器中,多个主机可以提供更强大的计算能力,容器化技术使得系统中某个主机出现故障时,可以迅速基于软件容器模块在其他主机上实现该出现故障主机的业务运行,不至于影响整体数字化平台系统的功能,从而提高了数字化平台系统的运维效率。
附图说明
图1为本申请实施例提供的数字化平台系统的结构示意图;
图2为本申请实施例提供的数字化平台系统的另一结构示意图;
图3为本申请实施例提供的数字化平台系统的应用部署的步骤流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本申请实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本申请实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
本申请实施例在数字化平台系统设置了分布式框架的主机池系统,具体的,主机池系统包括多个主机,该多个主机中设置有共享资源,共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;其中,分布式资源管理模块用于调度主机池系统的硬件资源;负载均衡模块用于调度主机池系统的负载资源;软件容器模块用于将主机池系统的应用打包在容器中,使得主机池系统在多个主机中存在发生故障的故障主机的情况下,可以通过分布式资源管理模块确定没有发生故障的正常主机,通过负载均衡模块将故障主机的业务迁移到正常主机,基于软件容器模块在正常主机运行故障主机的业务。也即,本申请实施例提供的数字化平台系统,采用分布式框架将共享资源布设在多个主机中,利用容器化技术将应用打包在容器中,多个主机可以提供更强大的计算能力,容器化技术使得系统中某个主机出现故障时,可以迅速基于软件容器模块在其他主机上实现该出现故障主机的业务运行,不至于影响整体数字化平台系统的功能,从而提高了数字化平台系统的运维效率。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本申请实施例提供的数字化平台系统的结构示意图。如图1所示,本申请提供的数字化平台系统包括:
主机池系统100;其中,所述主机池系统100包括多个主机(图中未示出),所述多个主机中设置有共享资源,所述共享资源包括:分布式资源管理模块101、负载均衡模块102和软件容器模103;所述分布式资源管理模块101用于调度所述主机池系统100的硬件资源;所述负载均衡模块102用于调度所述主机池系统100的负载资源;所述软件容器模块103用于将所述主机池系统100的应用打包在容器中;所述主机池系统100用于,在所述多个主机中存在发生故障的故障主机的情况下,通过所述分布式资源管理模块101确定正常主机,其中,所述正常主机为:所述多个主机中没有发生故障的主机;通过所述负载均衡模块102将所述故障主机的业务迁移到正常主机;基于所述软件容器模块103在所述正常主机运行所述故障主机的业务。
本申请实施例中,主机池系统100中可以包括多个主机,共享资源可以分布式的设置在该多个主机中,使得每个独立的主机可以只承担一部分共享资源的负荷,实现多个主机基于共享资源对数字化平台系统进行共同运行和维护。示例的,主机可以是服务器。
具体应用中,每台主机中可以布设基于X86的CPU(Central Processing Unit,中央处理器)架构、以及基本网络等,使得每台主机都可以支持共享资源的运行;可以理解,主机的具体架构还可以根据实际的应用场景进行其他设定,本申请实施例对主机不做具体限定。
示例的,分布式资源管理模块101可以是基于开源分布式资源管理框架Mesos实现的模块,分布式资源管理模块101可以调度主机池系统100的硬件资源和集群;硬件资源具体可以是:主机池系统100内的多个主机的CPU、内存、硬盘等硬件资源;可以理解,分布式资源管理模块101的具体架构也可以根据实际的应用场景进行其他设定,本申请实施例对此不做具体限定。
示例的,负载均衡模块102可以是基于负载均衡工具Marathon-lb实现的模块,Marathon-lb集成有haproxy(开放源代码软件),能自动获取各个应用程序的信息,为每一组应用程序生成应用程序配置,通过虚拟主机提供服务。Marathon-lb运行时绑定在各组应用程序定义的服务端口(servicePort,如果应用程序不定义servicePort,Marathon会随机分配端口号)上,可以通过Marathon-lb所在节点的相关服务端口访问各组应用程序。负载均衡模块102可以调度主机池系统100的负载资源,负载资源可以是各个主机上运行的应用程序以及常驻服务(long-running service)等,可以理解,分负载均衡模块102的具体实现也可以根据实际的应用场景进行其他设定,本申请实施例对此不做具体限定。
示例的,软件容器模块103可以是基于容器技术Docker实现的模块,在基于Docker实现的软件容器模块中,所有运行一个应用程序所需的资源都会被打包到一个单独的容器中,容器不需要绑定一个完整的操作系统,只需要运行某个应用程序所需的类库和相关设置,可以在多个主机上部署多个容器。这种方式更加高效、轻量级并保证无论部署在什么环境,应用程序都能保持一致的运行效果,因而大大提高了资源利用率,并且提升了I/O(输入/输出)等方面的性能。本申请实施例中,软件容器模块103可以用于将主机池系统100的运行各应用程序所需的资源分别打包在独立的容器中,使得各主机基于容器均能运行各应用程序。
本申请实施例中,主机池系统100可以在多个主机中存在发生故障的故障主机的情况下,通过分布式资源管理模块101确定正常主机,其中,正常主机为:多个主机中没有发生故障的主机;通过负载均衡模块102将故障主机的业务迁移到正常主机;基于软件容器模块103在正常主机运行故障主机的业务。
示例的,分布式资源管理模块101中可以存储有各个主机与主机标识的映射关系,若其中一台或几台主机故障,可以筛选出没有发生故障的正常主机的主机标识,负载均衡模块102通过该主机标识将故障主机的业务迁移到正常主机中,该正常主机可以基于软件容器模块103运行故障主机的业务;在一种具体的应用场景中,例如,故障主机的业务为运行A应用程序,则可以基于软件容器模块103中打包有A应用程序的容器,在正常主机中运行该A程序,从而不会影响整体数字化平台系统的功能。
示例的,主机发生故障的场景可以是:主机硬件故障,无法接受或发送信息;或者,主机负载过大,超出主机的最大负载阈值;等,本申请实施例对主机发生故障的具体场景不做限定。
可以理解,实际应用中,可以通过一些监控工具监控主机的运行状况,从而判定主机是否发生故障,本申请实施例对发现主机故障的方式不做具体限定。
本申请实施例提供的一种数字化平台系统,在数字化平台系统设置了分布式框架的主机池系统,具体的,主机池系统包括多个主机,该多个主机中设置有共享资源,共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;其中,分布式资源管理模块用于调度主机池系统的硬件资源;负载均衡模块用于调度主机池系统的负载资源;软件容器模块用于将主机池系统的应用打包在容器中,使得主机池系统在多个主机中存在发生故障的故障主机的情况下,可以通过分布式资源管理模块确定没有发生故障的正常主机,通过负载均衡模块将故障主机的业务迁移到正常主机,基于软件容器模块在正常主机运行故障主机的业务。也即,本申请实施例提供的数字化平台系统,采用分布式框架将共享资源布设在多个主机中,利用容器化技术将应用打包在容器中,多个主机可以提供更强大的计算能力,容器化技术使得系统中某个主机出现故障时,可以迅速基于软件容器模块在其他主机上实现该出现故障主机的业务运行,不至于影响整体数字化平台系统的功能,从而提高了数字化平台系统的运维效率。
可选的,在图1的基础上,参照图2,示出了本申请实施例提供的数字化平台系统的另一结构示意图。如图2所示,本申请实施例提供的数字化平台系统中,可选的:
所述容器对应有镜像,以通过所述镜像实现对所述容器的调用,所述系统还包括:门户展现系统200,所述门户展现系统200包括镜像管理模块204和用户界面模块202;所述镜像管理模块204用于管理所述容器的镜像;所述用户界面模块202用于接收输入信息;所述门户展现系统200,用于在接收到输入信息的情况下,确定所述输入信息对应的目标镜像,以通过与所述目标镜像匹配的目标容器提供用户服务。
本申请实施例中,容器设置在主机池系统100的软件容器模块中,各容器均对应有镜像,镜像可以由门户展现系统200的镜像管理模块204进行管理,例如镜像管理模块204中可以通过镜像列表的形式管理主机池系统中设置的容器,适应的,户展现系统200中的用户界面模块202可以展示该镜像列表,可以理解,一个容器可以对应一个应用程序,因此,用户可以通过在用户界面模块202所展示的镜像列表中通过点击等操作发出调用某一应用程序的指令,则门户展现系统200可以接收到输入信息,并基于该输入信息确定对应的目标镜像,进而调用该目标镜像匹配的目标容器为用户提供用户服务。实际应用中,门户展现系统200设置在终端,用户可以在门户界面模块202中还可以进行其他各类操作,例如搜索平台信息等,则也可以通过搜索应用对应的容器为用户提供用户服务,本申请实施例对此不做具体限定。
本申请实施例中,因为容器是以镜像的方式在门户展现系统100中展示,无论目标镜像对应的目标容器发生版本升级、或者目标容器从一个故障主机迁移到一个正常主机、或者在主机上布设新的容器等,该目标容器对应的镜像在门户展现系统100中可以没有任何变化,因此对于用户来讲,用户仍然可以通过选择目标镜像就能调用到相应的目标容器,得到相应的服务,即数字化平台系统本身的维护部署等,不会在用户侧造成影响,因此能够持续满足用户业务需求。
可选的,参照图2,在实际的数字化平台系统中,所述门户展现系统包括:服务管理模块201和开源组件模块203;所述服务管理模块201用于提供运维管理接口,以通过所述服务管理模块对所述数字化平台系统进行监控管理;所述开源组件模块203用于接收插件插入所述数字化平台系统。
本申请实施例中,在门户展现系统200设置服务管理模块201,用于为数字化平台系统的运维人员提供专门的接口,使得运维人员可以通过服务管理模块201对数字化平台系统进行监控和管理;在门户展现系统200设置开源组件模块202,用于通过开源组件模块202支持在数字化平台系统中插入插件,可以理解,插件可以有第三方开发,以根据第三方的实际需求对数字化平台系统做适应调整,插件也可有数字化平台系统开发,以实现对数字化平台系统的更改维护,本申请实施例对此不做具体限定。
可选的,参照图2,本申请实施例提供的数字化平台系统中,还包括核心应用系统300,所述核心应用系统300包括:定时器模块301、调度器模块302;其中,所述定时器模块301用于根据预设的定时策略获取所述多个主机的运行信息;所述调度器模块302用于根据所述运行信息判定所述多个主机中是否存在故障主机。
本申请实施例中,定时器模块301可以根据预设的定时策略获取所述多个主机的运行信息,示例的,定时策略可以是,以某种频率在某个时间段内获取某个主机的某种运行信息,运行信息具体可以是:负载信息、响应信息等;调度器模块302可以根据运行信息判定所述多个主机中是否存在故障主机,示例的,若运行信息是响应信息,响应信息可以包括:B主机在1秒内一直未回复响应信息,则调度器模块302可以将响应最长阈值与1秒进行比对,若1秒大于该响应最长阈值,则可以认为B主机故障。
作为本申请实施例的一种具体实现,所述调度器模块302还用于,将所述运行信息与预设的故障信息表匹配,若所述运行信息与所述故障信息表中的故障信息匹配,确定所述多个主机中存在故障主机。
本申请实施例中,故障信息表可以是根据经验设定的,例如,主机的CPU若负载大于89%则可能运行出错,主机的硬盘占用若大于91%则可能运行出错,则可以将CPU的最高负载阈值以及硬盘的最高占用阈值列入到故障信息表中,进一步将运行信息与故障信息表匹配,若运行信息与故障信息表中的故障信息匹配,则可以确定存在故障主机。示例的,若运行信息是负载信息,负载信息可以包括:C主机的CPU负载90%,则调度器模块302可以将故障信息表中的CPU的最高负载阈值与90%进行比对,若90%大于该CPU的最高负载阈值,则可以认为C主机故障。
本申请实施例中,通过定时器模块301和调度器模块302可以实现对数字化平台系统运行信息的自动监控,使得数字化平台系统能够进一步跟进自动监控的情况,自动进行业务迁移等操作,实现了数字化平台系统的持续自适应管理。
可选的,参照图2,本申请实施例的数字化平台系统中,所述核心应用系统300还包括:第一报警模块303;所述第一报警模块303用于在所述调度器模块302判定存在故障主机的情况下进行报警提示。
本申请实施例中,在调度模块302判定存在故障主机的情况下,还可以通过第一报警模块303进行报警提示,以提示运维人员及时对故障主机进行处理,以保证数字化平台系统的正常运营。示例的,可以在第一警报模块303中预先配置运维人员的手机号码、邮箱号码、微信号码等社交账号,以通过短信、邮件、微信等方式向运维人员进行报警提示,以便于运维人员及时对故障主机进行处理。
可选的,参照图2,本申请实施例的数字化平台系统中,所述核心应用系统300还包括:容器监控模块304和第二报警模块305;所述容器监控模块304用于监控所述容器,获取所述容器的监控数据,将所述监控数据转换为预设格式的目标监控数据,根据所述目标监控数据判定所述容器是否发生故障;所述第二报警模块305用于在所述容器发生故障的情况下进行报警提示。
本申请实施例中,考虑到容器与镜像在运行过程中可能发生故障,例如,镜像错误、无法镜像、容器内的应用程序无法正常运行等,则会导致数字化系统平台无法正常工作,因此,在核心应用系统300中设置容器监控模块304和第二报警模块305,容器监控模块304用于监控容器,获取容器的监控数据,将监控数据转换为预设格式的目标监控数据,根据目标监控数据判定所述容器是否发生故障;适应的,第二报警模块305用于在容器发生故障的情况下进行报警提示。具体应用中,监控数据以及预设格式等可以根据实际的应用场景确定,只要能判定容易是否故障即可,本申请实施例对此不做具体限定。示例的,可以在第二警报模块305中预先配置运维人员的手机号码、邮箱号码、微信号码等社交账号,以通过短信、邮件、微信等方式向运维人员进行报警提示,以便于运维人员及时对故障容器进行处理。
可选的,参照图2,本申请实施例的数字化平台系统中,所述核心应用系统300还包括:网页服务模块307和信息解析器模块306;所述网页服务模块307用于存储所述运行信息;所述信息解析器模块306用于所述数字化平台系统运行中的业务和指令转发。
本申请实施例中,网页服务模块307可以将运行信息进行存储,使得通过对网页服务模块307的调用,可以知晓数字化平台系统的运行情况,可选的,还可以根据网页服务模块307存储的运行信息,在主机或门户展现系统中对数字化平台系统的运行情况进行展示,便于了解数字化平台系统的运行情况;通过独立的信息解析器模块306实现数字化平台系统运行中的业务和指令转发,可以使得业务和指令转发更加及时高效。
可选的,参照图2,本申请实施例的数字化平台系统中,所述共享资源还包括:分布式键值存储模块104;所述分布式键值存储模块104用于根据预设的模板将所述软件容器模块容器中的容器信息进行模板配置。
本申请实施例中,考虑到软件容器模块的容器中所设置的应用程序安装需求的容器信息,可能是在测试过程中设置的,也可能是在数字化平台系统运行中设置的;由于测试环境和正常运行环境的不同,可能导致容器信息存在差异,该差异可能导致对容器进行迁移后,出现无法调用的情况,导致迁移失败,因此,采用分布式键值存储模块104根据预设的模板将软件容器模块容器中的容器信息进行模板配置,去除各容器信息的差异,因此可以提高迁移成功率,使得数字化平台系统更加稳定。
可以理解,实际应用中,通常会存在一些共享文件,所以可以在共享资源中包括分布式文件共享模块105,用于实现文件共享,本申请实施例对此不做具体限定。
可选的,参照图2,本申请实施例的数字化平台系统中,还可以包括:浏览器接入系统400,所述浏览器接入系统400包括:区域运维模块401和用户访问模块404;所述区域运维模块401用于接受不同区域的运维信息;所述用户访问模块404用于接收用户访问。
浏览器接入系统400可以是设定在不同的区域,例如布设在不同的省份等,使得不同区域的用户可以通过用户访问模块404访问数字化平台系统,不同区域的运维人员可以通过区域运维模块401对数字化平台系统进行运维。实际应用中,还可以根据需求在浏览器接入系统400中设置集中运维模块402和系统管理模块403,以便于集中运维人员、系统管理人员等可以通过浏览器接入系统400接入系统接入到数字化平台系统,进行适应的维护和管理。
综上所述,本申请实施例提供的一种数字化平台系统,在数字化平台系统设置了分布式框架的主机池系统,具体的,主机池系统包括多个主机,该多个主机中设置有共享资源,共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;其中,分布式资源管理模块用于调度主机池系统的硬件资源;负载均衡模块用于调度主机池系统的负载资源;软件容器模块用于将主机池系统的应用打包在容器中,使得主机池系统在多个主机中存在发生故障的故障主机的情况下,可以通过分布式资源管理模块确定没有发生故障的正常主机,通过负载均衡模块将故障主机的业务迁移到正常主机,基于软件容器模块在正常主机运行故障主机的业务。也即,本申请实施例提供的数字化平台系统,采用分布式框架将共享资源布设在多个主机中,利用容器化技术将应用打包在容器中,多个主机可以提供更强大的计算能力,实现应用弹性负载,容器化技术使得系统中某个主机出现故障时,可以迅速基于软件容器模块在其他主机上实现该出现故障主机的业务运行,不至于影响整体数字化平台系统的功能,从而提高了数字化平台系统的运维效率,实现弹性调度,且该分布式的数字化平系统中可以的分布式架构和开源组件设置可以支持多种类型消息解析转发、异步集群化处理、支撑外围系统接入和采集框架适配。
参照图3,示出了本申请实施中对上述的数字化平台系统进行应用部署的步骤流程图。具体的,该应用部署方法可以包括下述步骤:
步骤S501:接收源代码。
具体的,源代码可以是开发人员编写的代码,该代码可以通过IDE(IntegratedDeviceElectronics,集成设备电路)或者命令行提交代码到GitLab(用于仓库管理系统的开源项目),则GitLab可以接收到源代码。
步骤S502:将所述源代码编译为目标可执行文件。
具体应用中,Jenkins(开源软件项目,是基于Java开发的一种持续集成工具,用于监控持续重复的工作,旨在提供一个开放易用的软件平台,使软件的持续集成变成可能)通告预先配置的hook(勾取代码工件)拉取相应的源代码,将源代码编译为目标可执行文件。
步骤S503:创建目标可执行文件的容器镜像。
具体应用中,可以通过预先在Jenkins配置的构建后操作指令,在得到目标可执行文件后,创建该目标可执行文件的容器镜像。
步骤S504:上传所述容器镜像。
具体应用中,容器镜像创建成功后,可以自动将容器镜像上传Docker Harbor(容器仓库)。
步骤S505:申请所述容器镜像的目标硬件资源。
具体应用中,可以按照预先配置Json(JavaScript Object Notation,JS对象简谱)命令行方式部署容器镜像到Marathon,然后由Marathon向Mesos申请资源。
步骤S506:将所述目标可执行文件布设在所述目标硬件资源中。
具体应用中,可以从Docker Harbor拉取最新镜像,将目标可执行文件布设在目标硬件资源中,完成容器应用部署。
本申请实施例中,通过应用部署后的数字化平台系统,可以基于容器提供相应的应用服务。
本申请还提供一种电子设备,包括:处理器,存储器以及计算机程序;其中,所述计算机程序被存储在所述存储器中,并且被配置为由所述处理器执行,所述计算机程序包括用于执行如前述实施例中任一项所述的方法的指令。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如前述实施例中任一项所述的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种数字化平台系统,其特征在于,包括:
主机池系统;其中,所述主机池系统包括多个主机,所述多个主机中设置有共享资源,所述共享资源包括:分布式资源管理模块、负载均衡模块和软件容器模块;所述分布式资源管理模块用于调度所述主机池系统的硬件资源;所述负载均衡模块用于调度所述主机池系统的负载资源;所述软件容器模块用于将所述主机池系统的应用打包在容器中;
所述主机池系统用于,在所述多个主机中存在发生故障的故障主机的情况下,通过所述分布式资源管理模块确定正常主机,其中,所述正常主机为:所述多个主机中没有发生故障的主机;通过所述负载均衡模块将所述故障主机的业务迁移到正常主机;基于所述软件容器模块在所述正常主机运行所述故障主机的业务。
2.根据权利要求1所述的数字化平台系统,其特征在于,所述容器对应有镜像,以通过所述镜像实现对所述容器的调用,所述系统还包括:
门户展现系统,所述门户展现系统包括镜像管理模块和用户界面模块;所述镜像管理模块用于管理所述容器的镜像;所述用户界面模块用于接收输入信息;
所述门户展现系统,用于在接收到输入信息的情况下,确定所述输入信息对应的目标镜像,以通过与所述目标镜像匹配的目标容器提供用户服务。
3.根据权利要求2所述的数字化平台系统,其特征在于,还包括核心应用系统,所述核心应用系统包括:定时器模块、调度器模块;
其中,所述定时器模块用于根据预设的定时策略获取所述多个主机的运行信息;所述调度器模块用于根据所述运行信息判定所述多个主机中是否存在故障主机。
4.根据权利要求3所述的数字化平台系统,其特征在于,所述调度器模块还用于,将所述运行信息与预设的故障信息表匹配,若所述运行信息与所述故障信息表中的故障信息匹配,确定所述多个主机中存在故障主机。
5.根据权利要求3所述的数字化平台系统,其特征在于,所述核心应用系统还包括:第一报警模块;
所述第一报警模块用于在所述调度器模块判定存在故障主机的情况下进行报警提示。
6.根据权利要求2所述的数字化平台系统,其特征在于,所述核心应用系统还包括:容器监控模块和第二报警模块;
所述容器监控模块用于监控所述容器,获取所述容器的监控数据,将所述监控数据转换为预设格式的目标监控数据,根据所述目标监控数据判定所述容器是否发生故障;所述第二报警模块用于在所述容器发生故障的情况下进行报警提示。
7.根据权利要求2所述的数字化平台系统,其特征在于,所述核心应用系统还包括:网页服务模块和信息解析器模块;
所述网页服务模块用于存储所述运行信息;所述信息解析器模块用于所述数字化平台运行中的业务和指令转发。
8.根据权利要求2所述的数字化平台系统,其特征在于,所述门户展现系统包括:服务管理模块和开源组件模块;
所述服务管理模块用于提供运维管理接口,以通过所述服务管理模块对所述数字化平台系统进行监控管理;
所述开源组件模块用于接收插件插入所述数字化平台系统。
9.根据权利要求1至8任一项所述的数字化平台系统,其特征在于,所述共享资源还包括:分布式键值存储模块;
所述分布式键值存储模块用于根据预设的模板将所述软件容器模块容器中的容器信息进行模板配置。
10.根据权利要求1至8任一项所述的数字化平台系统,其特征在于,还包括:浏览器接入系统;所述浏览器接入系统包括:区域运维模块和用户访问模块;
所述区域运维模块用于接受不同区域的运维信息;所述用户访问模块用于接收用户访问。
CN201910356830.0A 2019-04-29 2019-04-29 数字化平台系统 Pending CN110333930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910356830.0A CN110333930A (zh) 2019-04-29 2019-04-29 数字化平台系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910356830.0A CN110333930A (zh) 2019-04-29 2019-04-29 数字化平台系统

Publications (1)

Publication Number Publication Date
CN110333930A true CN110333930A (zh) 2019-10-15

Family

ID=68139331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910356830.0A Pending CN110333930A (zh) 2019-04-29 2019-04-29 数字化平台系统

Country Status (1)

Country Link
CN (1) CN110333930A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111355988A (zh) * 2020-03-31 2020-06-30 苏州科达科技股份有限公司 业务灾备方法、设备及可读存储介质
CN112269694A (zh) * 2020-10-23 2021-01-26 北京浪潮数据技术有限公司 一种管理节点确定方法、装置、电子设备及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176831A (zh) * 2011-12-22 2013-06-26 中国移动通信集团公司 一种虚拟机系统及其管理方法
CN103197952A (zh) * 2012-01-09 2013-07-10 华为技术有限公司 基于云基础设施的针对应用系统维护部署的管理系统和方法
CN103503376A (zh) * 2011-12-29 2014-01-08 华为技术有限公司 云计算系统和管理云计算系统中存储资源的方法
CN107766157A (zh) * 2017-11-02 2018-03-06 山东浪潮云服务信息科技有限公司 基于国产cpu和os的分布式容器集群框架实现方法
US20180143856A1 (en) * 2016-11-18 2018-05-24 Sap Se Flexible job management for distributed container cloud platform
CN108304250A (zh) * 2018-03-05 2018-07-20 北京百度网讯科技有限公司 用于确定运行机器学习任务的节点的方法和装置
CN108958927A (zh) * 2018-05-31 2018-12-07 康键信息技术(深圳)有限公司 容器应用的部署方法、装置、计算机设备和存储介质
CN109343963A (zh) * 2018-10-30 2019-02-15 杭州数梦工场科技有限公司 一种容器集群的应用访问方法、装置及相关设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176831A (zh) * 2011-12-22 2013-06-26 中国移动通信集团公司 一种虚拟机系统及其管理方法
CN103503376A (zh) * 2011-12-29 2014-01-08 华为技术有限公司 云计算系统和管理云计算系统中存储资源的方法
CN103197952A (zh) * 2012-01-09 2013-07-10 华为技术有限公司 基于云基础设施的针对应用系统维护部署的管理系统和方法
US20180143856A1 (en) * 2016-11-18 2018-05-24 Sap Se Flexible job management for distributed container cloud platform
CN107766157A (zh) * 2017-11-02 2018-03-06 山东浪潮云服务信息科技有限公司 基于国产cpu和os的分布式容器集群框架实现方法
CN108304250A (zh) * 2018-03-05 2018-07-20 北京百度网讯科技有限公司 用于确定运行机器学习任务的节点的方法和装置
CN108958927A (zh) * 2018-05-31 2018-12-07 康键信息技术(深圳)有限公司 容器应用的部署方法、装置、计算机设备和存储介质
CN109343963A (zh) * 2018-10-30 2019-02-15 杭州数梦工场科技有限公司 一种容器集群的应用访问方法、装置及相关设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵征: "基于Docker的公共计算管理平台设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111355988A (zh) * 2020-03-31 2020-06-30 苏州科达科技股份有限公司 业务灾备方法、设备及可读存储介质
CN111355988B (zh) * 2020-03-31 2022-11-11 苏州科达科技股份有限公司 业务灾备方法、设备及可读存储介质
CN112269694A (zh) * 2020-10-23 2021-01-26 北京浪潮数据技术有限公司 一种管理节点确定方法、装置、电子设备及可读存储介质
CN112269694B (zh) * 2020-10-23 2023-12-22 北京浪潮数据技术有限公司 一种管理节点确定方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
WO2021017301A1 (zh) 基于Kubernetes集群的管理方法、装置及计算机可读存储介质
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
WO2021017279A1 (zh) 基于Kubernetes和网络域的集群安全管理方法、装置及存储介质
CN110493080B (zh) 一种区块链节点监控方法、装置及电子设备和存储介质
WO2023142054A1 (zh) 一种面向容器微服务的性能监控告警方法及告警系统
JP5684946B2 (ja) イベントの根本原因の解析を支援する方法及びシステム
WO2019006654A1 (zh) 金融自助设备维修派单生成方法、手持终端及电子设备
CN106487574A (zh) 自动化运行维护监测系统
CN107534570A (zh) 虚拟化网络功能监控
US20200186594A1 (en) Rule-based action triggering in a provider network
CN101719852B (zh) 一种中间件性能的监控方法和设备
AU2022203400B2 (en) Rule-based action triggering in a provider network
CN108762966A (zh) 系统异常拦截方法、装置、计算机设备及存储介质
CN109614227A (zh) 任务资源调配方法、装置、电子设备及计算机可读介质
CN112579288A (zh) 一种基于云计算智能安全用数据管理系统
CN113391901A (zh) Rpa机器人的管理方法、装置、设备及存储介质
CN109783151A (zh) 规则变更的方法和装置
CN103259684A (zh) 互联网业务监控方法和系统
CN109669835A (zh) MySQL数据库监控方法、装置、设备及可读存储介质
CN109361525A (zh) 重启分布式部署多服务的方法、装置、控制终端及介质
CN110333930A (zh) 数字化平台系统
US11785085B2 (en) Control interface for the deployment of an application, system and method using such a control interface
CN107426012B (zh) 一种基于超融合架构的故障恢复方法及其装置
CN109257256A (zh) 设备监控方法、装置、计算机设备及存储介质
US11394750B1 (en) System and method for generating network security policies in a distributed computation system utilizing containers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015