CN106789158A - 一种云服务保险定损方法和系统 - Google Patents

一种云服务保险定损方法和系统 Download PDF

Info

Publication number
CN106789158A
CN106789158A CN201611043671.1A CN201611043671A CN106789158A CN 106789158 A CN106789158 A CN 106789158A CN 201611043671 A CN201611043671 A CN 201611043671A CN 106789158 A CN106789158 A CN 106789158A
Authority
CN
China
Prior art keywords
service
data
resource
source
trouble
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611043671.1A
Other languages
English (en)
Inventor
陈屹力
郭雪
栗蔚
沈滢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Information and Communications Technology CAICT
Original Assignee
China Academy of Telecommunications Research CATR
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Telecommunications Research CATR filed Critical China Academy of Telecommunications Research CATR
Priority to CN201611043671.1A priority Critical patent/CN106789158A/zh
Publication of CN106789158A publication Critical patent/CN106789158A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5006Creating or negotiating SLA contracts, guarantees or penalties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提出一种云服务保险定损方法和系统,包括数据采集模块、数据分级模块、故障分析模块、定损模块;数据采集模块包含至少一个服务域数据接口;数据采集模块用于采集服务域数据,输出标准指标数据;数据分级模块用于对所述标准指标数据进行分级,确定故障业务;故障分析模块用于搜索与所述故障业务相关的服务域数据,确定故障源;定损模块用于根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失。本发明实施例还公开一种云服务保险定损方法,包括采集服务域数据、对标准指标数据进行分级,确定故障业务;搜索服务域数据,确定故障源;根据故障源确定责任方、计算用户损失。本发明解决定损过程效率低、易于产生人为过失的问题。

Description

一种云服务保险定损方法和系统
技术领域
本申请涉及计算机技术领域,尤其涉及一种互联网云服务故障分析处理的方法和系统。
背景技术
云计算作为一种新兴的IT服务模式,市场规模快速增长,将成为未来基础设施架构的必然趋势,针对目前云计算的技术风险,国内外云计算服务的保险产品也陆续推出,定损是保险产品的必要环节。目前的云保险产品大多是云服务商联合保险公司双方共同推出的产品,定损定责依赖于云服务提供商,当用户云服务发生故障时,定损手段主要由云服务商依据管理平台监控到的平台和用户服务状态信息,基于人工审查为主的故障调查分析,形成故障报告,依据云服务商服务等级协议(SLA),对故障导致云服务用户的损失进行相应的赔付。因此,云服务商作为云服务提供方,同时又作为服务故障定损方。现有技术存在的问题主要体现在:一、定损效率较低。定损过程主要由人工操作,工作量大、人力成本高、处理时间长,云服务用户不容易快速获得理赔。二、定损结果客观性差。由于缺乏客观的资源状态数据,云服务商和用户双方掌握额度数据不一致;此外在定损流程中易于发生人为过失。
发明内容
本发明提出一种云服务保险定损方法和系统,解决互联网云服务保险定损过程效率低、易于产生人为过失的问题。
本申请实施例提供一种云服务保险定损系统,包括数据采集模块、数据分级模块、故障分析模块、定损模块;所述数据采集模块,包含至少一个服务域数据接口;所述数据采集模块,用于通过所述服务域数据接口采集服务域数据,输出标准指标数据;所述数据分级模块,用于对所述标准指标数据进行分级,确定故障业务;所述故障分析模块,用于搜索与所述故障业务相关的服务域数据,确定故障源;所述定损模块,用于根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失。
优选地,在本发明的系统中,所述服务域数据包含资源状态、数据生成时间、资源标识;所述资源状态,包含物理资源状态、业务虚拟资源状态、平台运行状态、业务运行状态、操作日志、告警日志;所述标准指标数据,包含适用于多个服务域数据的标准集、对应的数据生成时间、资源标识。
优选地,在本发明的系统中,所述物理资源状态,包含计算资源总量、计算资源可用量、存储资源总量、存储资源可用量、网络资源总量、网络资源可用量;所述业务虚拟资源状态,包含逻辑计算资源总量、逻辑计算资源可用量、逻辑存储资源总量、逻辑存储资源可用量、逻辑网络资源总量、逻辑网络资源可用量;所述平台运行状态,包含物理设备、操作系统、应用软件、网络可达性;所述业务运行状态,包含服务进程、端口、通信协议;所述操作日志,包含开机、关机、重启;所述告警日志,包含告警时间、告警信息,告警级别。
进一步优选地,在本发明的系统中,所述数据采集模块包含系统单元和服务域单元;所述服务域单元,用于采集服务域数据,定时上传到所述系统单元;所述系统单元,用于对所述服务域数据进行适配,输出标准指标数据。
作为本发明的系统进一步优选的其他实施例,所述数据采集模块通过服务域开放数据接口调取所述服务域数据,或者,所述数据采集模块定期接收服务域按照所述标准指标数据上报的信息。
本发明实施例还公开一种云服务保险定损方法,包括以下步骤:
采集服务域数据,输出标准指标数据;
对所述标准指标数据进行分级,确定故障业务;
搜索与所述故障业务相关的服务域数据,确定故障源;
根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失。
其中,所述服务域数据包含资源状态、资源标识;所述资源状态,包含物理资源状态、业务虚拟资源状态、平台运行状态、业务运行状态、操作日志、告警日志;标准指标数据,包含适用于多个服务域的资源状态的标准集、对应的数据生成时间、资源标识。
优选地,本发明方法所述采集服务域数据的步骤,包含以下一种或多种方式:在服务域设置探针程序采集服务域数据;通过服务域开放数据接口调取所述服务域数据;定期接收服务域按照所述标准指标数据上报的信息。
优选地,本发明方法所述对所述标准指标数据进行分级,确定故障业务的步骤包含:将所述标准指标数据分为高危操作、资源状态异常、业务状态异常、告警、误操作、正常;根据预设的数据分级基准选择对应的资源标识,作为故障业务的资源标识。
优选地,本发明方法所述搜索与所述故障业务相关的服务域数据,确定故障源的步骤进一步包含:根据故障业务的资源标识,搜索与所述资源标识相对应的服务域数据;分析业务运行状态是否正常;如果所述业务运行状态处于不可用,则分析平台运行状态是否正常;如果所述平台运行状态处于不可用,则分析告警日志、操作日志,确定故障发生时间、故障发生位置、故障因子权重;根据所述故障发生位置,在至少一个云服务商、至少一个业务用户中确定故障源主体。
优选地,本发明方法所述根据故障源确定责任方的步骤进一步包含:将属于同一故障源主体的多个故障因子权重累计;当所述累计值超过阈值时,将所述故障源主体确定为责任方。
优选地,所述根据故障源总量和不可用时长计算用户损失的方法进一步包含:在所述业务运行状态或平台运行状态不可用时,统计所述故障发生位置的物理资源、业务虚拟资源,得出故障源总量;检测故障发生时间和恢复时间,计算不可用时长;根据所述故障源总量和不可用时长,计算用户损失。
本发明实施例采用的上述至少一个技术方案能够达到以下有益效果:
采用本发明的技术手段定损定责,提高效率。由于本发明的系统统一采集服务域(即云服务商平台)数据,通过技术手段对云服务状态进行数据分析,通过专门的分析平台系统能够自动化筛选出故障原因,直接给出故障责任判断结果,大大降低云保险定损的人工复杂度,减少工作量。在保险定损过程中,最大程度实现定损流程自动化,能有效降低人为的主观因素对定损结果的影响,实现客观、准确。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为云服务保险定损系统的实施例框图;
图2为云服务保险定损系统数据采集模块的实施例框图;
图3为云服务保险定损方法实施例流程图;
图4为云服务保险定损方法对标准指标数据分级的步骤实施例流程图;
图5为云服务保险定损方法确定故障源的步骤实施例流程图;
图6为云服务保险定损方法确定责任方的步骤实施例流程图;
图7为云服务保险定损方法确定用户损失的步骤实施例流程图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明的技术手段,通过采集服务域数据,获得资源状态信息,当云服务不可用或者数据丢失故障发生后,通过系统分析所述服务域数据,筛选明显的故障业务,确定故障源,自动判断故障责任方、确定用户损失的结果。
本发明所述服务域,是指云服务商通过网络物理资源和逻辑资源为互联网业务用户提供服务的网络软硬件集合。当本发明的系统与一个云服务商的服务域结合时,能够用于监测和分析该云服务商的网络资源状态,对该云服务商和云服务用户的故障责任进行区分,对损失进行分析和计算。当本发明的系统与多个云服务商的服务域结合时,能够用于监测和分析该多个云服务商的网络资源状态,对该多个云服务商之间、云服务商和云服务用户之间的故障责任都能进行区分,并对损失进行分析和计算。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为云服务保险定损系统的实施例。本实施例提供一种云服务保险定损系统,包括数据采集模块10、数据分级模块20、故障分析模块30、定损模块40;所述数据采集模块,包含至少一个服务域数据接口;所述数据采集模块,用于通过所述服务域数据接口采集服务域数据,输出标准指标数据;所述数据分级模块,用于对所述标准指标数据进行分级,确定故障业务;所述故障分析模块,用于搜索与所述故障业务相关的服务域数据,确定故障源;所述定损模块,用于根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失。
优选地,在本发明的系统中,所述服务域数据包含资源状态、数据生成时间、资源标识;所述资源状态,包含物理资源状态、业务虚拟资源状态、平台运行状态、业务运行状态、操作日志、告警日志;所述标准指标数据,包含适用于多个服务域的资源状态的标准集、对应的数据生成时间、资源标识。
所述资源标识,是指云服务用户基本信息,以及云服务商资源情况的信息,用于确定服务故障时用户的身份信息和服务资源信息。
优选地,本发明的系统还包含数据库50,用于存储所述服务域数据、标准指标数据、故障业务数据、故障源数据。所述数据采集模块、数据分级模块、故障分析模块都能访问所述数据库,实现数据存储。
需要指出的是,由于本发明可实现对多个云服务商进行保险故障责任判定,对多个服务域进行统一数据采集时所述数据采集模块包含多个服务域数据接口(I1,I2,…,In),每个服务域数据接口用于采集一个服务域的数据。例如,系统基于C/S架构,独立于服务域,由数据采集模块搜集服务域数据,生成标准指标数据。
本发明系统中所述服务域数据,主要包括资源状态、数据生成时间、资源标识等,具体地,涉及云服务用户基本资源信息、云服务商平台运行状态、云服务用户的业务运行状态、运维操作日志、故障告警日志等。由于各家云服务商的数据格式很难达到一致,定损要求的数据采集具体指标、参数需要进行标准化,在数据来源上进行规范化,这样的好处是可以在不同的云服务商进行数据的统一,在定损的方法上标准统一。
表1为标准指标数据集的例子。优选地,在本发明的系统中,所述物理资源状态,包含计算资源总量、计算资源可用量、存储资源总量、存储资源可用量、网络资源总量、网络资源可用量;所述业务虚拟资源状态,包含逻辑计算资源总量、逻辑计算资源可用量、逻辑存储资源总量、逻辑存储资源可用量、逻辑网络资源总量、逻辑网络资源可用量;所述平台运行状态,包含物理设备、操作系统、应用软件、网络可达性;所述业务运行状态,包含服务进程、端口、通信协议;所述操作日志,包含开机、关机、重启;所述告警日志,包含告警时间、告警信息,告警级别。
表1、服务域数据
在采集计算资源数据时,涉及云平台物理及虚拟化计算资源,查看服务的CPU、内存资源的实时运行状态,确认计算资源是否处于正常状态。
在采集存储资源数据时,涉及云平台物理及虚拟化存储资源,查看服务的磁盘资源的实时运行状态,包括读、写、IOPS等信息,判断磁盘是否处于正常状态。如多个磁盘需要追加此信息。
在采集网络资源数据时,涉及云平台物理及虚拟化网络资源,查看云服务公网和内网的网卡实时信息,确认网络资源状态是否正常。
在采集平台运行状态数据时,涉及云服务所依赖的各个组件服务的状态信息,如物理设备、操作系统、虚拟化软件、应用软件、网络等信息状态。
在采集业务运行状态数据时,涉及云平台上提供的应用服务,对于应用服务的信息包括服务进程、端口状态、通信协议的实时状态。
在采集运维操作日志数据时,主要涉及云服务商针对云服务平台的日常维护信息,包括运维人员以及用户在平台上的操作、堡垒机审计的日志。
在采集告警日志数据时,涉及服务域云平台、云服务用户的告警信息。
图2为云服务保险定损系统实现服务域数据采集的实施例。在本发明的系统中,在图1所示系统的基础上,进一步优选地,所述数据采集模块包含系统单元11和服务域单元12;所述服务域单元,用于采集服务域数据D1,定时上传到所述系统单元;所述系统单元,用于对所述服务域数据进行适配,输出标准指标数据。
作为本发明的系统进一步优选的其他实施例,所述数据采集模块通过服务域开放数据接口调取所述服务域数据D2,或者,所述数据采集模块定期接收服务域按照所述标准指标数据上报的信息D3。
需要说明的是,所述保险定损系统支持三种数据采集方式,是由于云服务提供商业务的差异化,接口类型、数据格式以及安全策略方面各不相同。
所述服务域单元位于服务域网络设施的方案,运行探针程序。在获取云服务用户和云服务提供商的授权下,在云服务商或者云服务用户网络内部署探针程序,通过该程序收集云服务商71及云服务用户81,82的资源状态和具体指标,数据定时批量上传到所述系统单元进行汇总。
所述数据采集模块通过服务域开放数据接口调取所述服务域数据的方案,针对云服务商已经具备服务能力API开放接口,所述保险定损系统直接可以调用云服务商71开放的数据接口进行数据的采集,系统汇总云服务运行状况及操作日志数据。此种方式可以减少云服务商平台相应的开发工作。
所述数据采集模块定期接收服务域按照所述标准指标数据上报的信息的方案,云服务商71可通过标准JSON数据接口方式,统一上报数据到定损系统服务端,云服务商进行数据上报到定损系统服务端。此种方式对于安全级别较高的用户较为适用。
图3为云服务保险定损方法实施例流程图。本发明实施例公开一种云服务保险定损方法,包括以下步骤:
步骤100、采集服务域数据,输出标准指标数据;
其中,所述服务域数据包含资源状态、资源标识;所述资源状态,包含物理资源状态、业务虚拟资源状态、平台运行状态、业务运行状态、操作日志、告警日志;标准指标数据,包含适用于多个服务域的资源状态的标准集、对应的数据生成时间、资源标识。
优选地,本发明方法所述采集服务域数据的步骤,包含以下一种或多种方式:在服务域设置探针程序采集服务域数据;通过服务域开放数据接口调取所述服务域数据;定期接收服务域按照所述标准指标数据上报的信息。
需要指出的是,在数据采集方式上,优先考虑通过标准数据接口上报和通过调用云服务商开放接口的方式,避免使用agent程序方式对用户服务业务产生影响以及消除用户对数据隐私的顾虑,使用Agent方式是在用户同意且授权的情况下采用的部署方式,以上三种方式,云服务商和云服务用户都可以根据实际情况选择任意一种。
步骤200、对所述标准指标数据进行分级,确定故障业务;
步骤300、搜索与所述故障业务相关的服务域数据,确定故障源;
步骤400、根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失。
图4为云服务保险定损方法对标准指标数据分级的步骤实施例流程图。优选地,本发明方法所述对所述标准指标数据进行分级,确定故障业务的步骤包含:
步骤201、将所述标准指标数据分级,例如,高危操作、资源状态异常、业务状态异常、告警、误操作、正常;
例如,数据采集通过定时任务批量上传到系统的数据库50,通过对云平台运行状态、业务运行状态、运维操作标准格式日志进行服务特征进行筛选,如云平台物理设备及虚拟化资源异常状态,关机、重启,网络中断,运维高危操作记录关键字,应用层服务健康检查进行状态异常状态标记,按照故障级别分类,将warn和error信息暂标识为故障状态,缩小故障分析范围。
步骤202、根据预设的数据分级基准选择对应的资源标识,作为故障业务的资源标识。
通过采集以上标准指标数据集,定损系统实时监测云服务各个指标状态,首先筛选云服务各个层面的异常状态,其中包括如物理设备、云平台、告警信息、运维服务状态等几个方面,确定故障的资源标识。
图5为云服务保险定损方法确定故障源的步骤实施例流程图;优选地,本发明方法所述搜索与所述故障业务相关的服务域数据,确定故障源的步骤进一步包含:
步骤301、根据故障业务的资源标识,搜索与所述资源标识相对应的服务域数据;
通过资源ID进行服务状态的关联,按照故障级别汇总,列举所有针对此故障服务的所有物理设备、服务信息以及运维日志,并按资源池、时间、服务类型进行关联分析,举例说明:当用户虚拟机服务处于脱机状态,通过数据采集到的信息,定损系统将该服务标记为不可用状态标识即M(i),根据该故障时间节点之前的日志和采集数据,系统开始分析故障发生前跟该资源标识一致的所有操作记录,搜索范围会逐步扩大,通过操作行为的动作分类,如果是云服务商运维人员角色操作的如:关机、重启等操作,会被系统识别标记为高权重的违规操作。
步骤302、分析业务运行状态是否正常;
步骤303、如果所述业务运行状态处于不可用,则分析平台运行状态是否正常;
步骤304、如果所述平台运行状态处于不可用,则分析告警日志、操作日志,确定故障发生时间、故障发生位置、故障因子权重;
针对故障特征明显的事件,系统直接提取故障原因。例如,通过初步分析云服务状态是否处于异常,关联平台状态进行匹配,然后再逐步依据告警信息,运维操作日志信息记录对故障的原因进行分析。
以下以服务不可用为例说明。服务不可用主要有应用服务状态不可用、网络不可达两种情况。服务不可用包括物理设备、云平台、应用服务的故障导致,不排除用户行为导致(用户行为导致借助人工定损手段)。定损系统根据用户服务故障状态触发系统分析,如用户虚拟机服务状态为非运行状态,定损系统在故障发生时间节点前后分析通过关联用户操作,云服务商运维操作以及云平台服务状态是否正常判断,如果有任何一个非正常状态即标记为影响因子M(i),并且在定损系统平台进行预警。网络不可用首先根据用户服务网卡流量信息是否正常,再判断是否有运维人员在故障发生时间前后的网络配置操作,如有网络操作也计入影响因子M(i),进行系统预判。举例说明:当服务外部或者网络IO突然下降或者无流量信息的情况发生,定损系统也会根据历史流量值分析是否为正常状态,如果过低则初步标识为不可用状态M(1),外部网络延时M(2),丢包率M(3),三个影响因子都会根据一定的阀值(IO吞吐量、延时值、丢包率)进行判断是否为网络的不可用,当确定为不可用,分析故障节点之前是否有相关的网络操作记录,操作方用户角色,是否有系统预设的影响因子M(i),用户网络操作,服务商运维操作,网络配置变更。
步骤305、根据所述故障发生位置,在至少一个云服务商、至少一个业务用户中确定故障源主体。
图6为云服务保险定损方法确定责任方的步骤实施例流程图。优选地,本发明方法所述根据故障源确定责任方的步骤进一步包含:
步骤401、将属于同一故障源主体的多个故障因子权重累计;
步骤402、当所述累计值超过阈值时,将所述故障源主体确定为责任方。
根据系统预设因子权重e(i),当影响因子累计到用户及云服务商预设的一定阈值F,则预判的结果是某一方原因导致,根据预判结果进入相对应的核定步骤。预设因子权重从高到低排序,当超过一定阀值系统将直接给出判定结果为云服务商原因导致的故障。
本发明的方案针对于云服务不可用及数据丢失都可以进行定损,云服务在遇到不可用及数据丢失情况时,故障原因错综复杂,一般分为内部因素和外部因素两种,其中内部因素包括云服务平台自身服务系统、管理系统、运维意外、黑客攻击或者云服务用户自己行为过失等原因导致,外部因素主要包括第三方原因导致的故障,如网络中断、电力设施中断等其他不可控人为因素。
这里数据丢失是指硬件设备故障导致的数据丢失,根据采集的服务状态以及物理设备状态。例如系统发现云服务商存储设备故障,用户数据存放位置和此设备匹配,并且用户数据不可用、不可恢复,系统直接判断是云服务商责任。
图7是云服务保险定损方法确定用户损失的步骤实施例流程图。优选地,所述根据故障源总量和不可用时长计算用户损失的方法进一步包含:
步骤411、在所述业务运行状态或平台运行状态不可用时,统计所述故障发生位置的物理资源、业务虚拟资源,得出故障源总量;
步骤412、检测故障发生时间和恢复时间,计算不可用时长;
步骤413、根据所述故障源总量和不可用时长,计算用户损失。
例如,当定损系统确认为服务故障时,服务不可用量化指标根据定损监测到故障发生时间到恢复时间,计算不可用时长,并依据用户受影响的服务资源总量,计算总的不可用时长,依据SLA承诺的20-100倍赔偿机制进行服务单价换算,数据丢失量化指标主要依据定损系统监测到用户磁盘空间大小,并按照每G比特为单位进行计算服务损失,同样根据SLA服务协议条款20-100倍的赔偿机制进行赔付,如用户服务故障时长为10分钟,受影响的服务资源总量每分钟换算为2元/分钟,SLA承诺赔偿倍数为100倍,那么计算用户服务损失为10×2×100=2000元。
在实施本发明方案的基础上,也可借助外部辅助手段,结合内部外部证据,量化故障影响范围及服务损失,最终给出定损的判断结果。
本发明的方法针对云服务保险产品,能够实现基于独立第三方进行统一定损,在云服务发生中断、数据丢失时,由第三方提供整个定损的流程,在云服务商、云服务用户、保险公司之间做出公平公正的定损结果。
本发明在参数指标的选择上进行了有效的筛选,与现有技术的数据采集星币,简化定损参数指标,降低操作的复杂性,尽可能压缩数据指标项数量、也降低了网络开销。用户服务基本信息数据通过云平台管理系统获取,避免直接对云服务用户数据进行采集。
本发明中对所述服务域数据进行采集的步骤,最大程度地满足了云服务商和云服务用户的实际需求,增强收集数据的灵活性,提高了定损的可操作性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种云服务保险定损系统,其特征在于,包括:数据采集模块、数据分级模块、故障分析模块、定损模块;
所述数据采集模块,包含至少一个服务域数据接口;
所述数据采集模块,用于通过所述服务域数据接口采集服务域数据,输出标准指标数据;
所述数据分级模块,用于对所述标准指标数据进行分级,确定故障业务;
所述故障分析模块,用于搜索与所述故障业务相关的服务域数据,确定故障源;
所述定损模块,用于根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失。
2.如权利要求1所述云服务保险定损系统,其特征在于,
所述服务域数据包含资源状态、数据生成时间、资源标识;所述资源状态,包含物理资源状态、业务虚拟资源状态、平台运行状态、业务运行状态、操作日志、告警日志;
所述标准指标数据,包含适用于多个服务域的资源状态的标准集、对应的数据生成时间、资源标识。
3.如权利要求1所述云服务保险定损系统,其特征在于
所述数据采集模块包含系统单元和服务域单元;
所述服务域单元,用于采集服务域数据,定时上传到所述系统单元;
所述系统单元,用于对所述服务域数据进行适配,输出标准指标数据。
4.如权利要求1所述云服务保险定损系统,其特征在于
所述数据采集模块通过服务域开放数据接口调取所述服务域数据,或者
所述数据采集模块定期接收服务域按照所述标准指标数据上报的信息。
5.如权利要求2所述云服务保险定损系统,其特征在于
所述物理资源状态,包含计算资源总量、计算资源可用量、存储资源总量、存储资源可用量、网络资源总量、网络资源可用量;
所述业务虚拟资源状态,包含逻辑计算资源总量、逻辑计算资源可用量、逻辑存储资源总量、逻辑存储资源可用量、逻辑网络资源总量、逻辑网络资源可用量;
所述平台运行状态,包含物理设备、操作系统、应用软件、网络可达性;
所述业务运行状态,包含服务进程、端口、通信协议;
所述操作日志,包含开机、关机、重启;
所述告警日志,包含告警时间、告警信息,告警级别。
6.一种云服务保险定损方法,其特征在于,包括以下步骤
采集服务域数据,输出标准指标数据;
对所述标准指标数据进行分级,确定故障业务;
搜索与所述故障业务相关的服务域数据,确定故障源;
根据故障源确定责任方、并根据故障源总量和不可用时长计算用户损失;
其中,
所述服务域数据包含资源状态、资源标识;
所述资源状态,包含物理资源状态、业务虚拟资源状态、平台运行状态、业务运行状态、操作日志、告警日志;
标准指标数据,包含适用于多个服务域的资源状态的标准集、对应的数据生成时间、资源标识。
7.如权利要求6所述云服务保险定损方法,其特征在于,所述采集服务域数据的步骤,包含以下一种或多种方式:
在服务域设置探针程序采集服务域数据;
通过服务域开放数据接口调取所述服务域数据;
定期接收服务域按照所述标准指标数据上报的信息。
8.如权利要求6所述云服务保险定损方法,其特征在于,所述对标准指标数据进行分级,确定故障业务的步骤,进一步包含:
将所述标准指标数据分为高危操作、资源状态异常、业务状态异常、告警、误操作、正常;
根据预设的数据分级基准选择对应的资源标识。
9.如权利要求6所述云服务保险定损方法,其特征在于,所述搜索与所述故障业务相关的服务域数据,确定故障源的步骤进一步包含:
根据故障业务的资源标识,搜索与所述资源标识相对应的服务域数据;
分析业务运行状态是否正常;如果所述业务运行状态处于不可用,则
分析平台运行状态是否正常;如果所述平台运行状态处于不可用,则
分析告警日志、操作日志,确定故障发生时间、故障发生位置、故障因子权重;
根据所述故障发生位置,在至少一个云服务商、至少一个业务用户中确定故障源主体。
10.如权利要求6所述云服务保险定损方法,其特征在于,
所述根据故障源确定责任方的步骤进一步包含:
将属于同一故障源主体的多个故障因子权重累计;
当所述累计值超过阈值时,将所述故障源主体确定为责任方;
所述根据故障源总量和不可用时长计算用户损失的方法进一步包含:
在所述业务运行状态或平台运行状态不可用时,统计所述故障发生位置的物理资源、业务虚拟资源,得出故障源总量;
检测故障发生时间和恢复时间,计算不可用时长;
根据所述故障源总量和不可用时长,计算用户损失。
CN201611043671.1A 2016-11-11 2016-11-11 一种云服务保险定损方法和系统 Pending CN106789158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611043671.1A CN106789158A (zh) 2016-11-11 2016-11-11 一种云服务保险定损方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611043671.1A CN106789158A (zh) 2016-11-11 2016-11-11 一种云服务保险定损方法和系统

Publications (1)

Publication Number Publication Date
CN106789158A true CN106789158A (zh) 2017-05-31

Family

ID=58974725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611043671.1A Pending CN106789158A (zh) 2016-11-11 2016-11-11 一种云服务保险定损方法和系统

Country Status (1)

Country Link
CN (1) CN106789158A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427627A (zh) * 2018-02-05 2018-08-21 阿里巴巴集团控股有限公司 统计系统稳定性的方法及装置和电子设备
CN112272126A (zh) * 2020-10-26 2021-01-26 中国联合网络通信集团有限公司 业务应用的失效监测方法、计算机设备和存储介质
CN113610372A (zh) * 2021-07-27 2021-11-05 远景智能国际私人投资有限公司 服务等级协议的确定方法,装置,终端及可读存储介质
CN114024825A (zh) * 2021-11-02 2022-02-08 中邮科通信技术股份有限公司 一种云计算环境下业务端到端的故障监测方法
CN115865719A (zh) * 2022-11-04 2023-03-28 中电信数智科技有限公司 5g定制网业务sla监控保障方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103731278A (zh) * 2011-12-31 2014-04-16 华茂云天科技(北京)有限公司 云计算平台的服务计费系统
CN103986625A (zh) * 2014-05-29 2014-08-13 中国科学院软件研究所 一种基于统计监测的云应用故障诊断系统
CN105763868A (zh) * 2014-12-15 2016-07-13 北京文安科技发展有限公司 云台故障的检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103731278A (zh) * 2011-12-31 2014-04-16 华茂云天科技(北京)有限公司 云计算平台的服务计费系统
CN103986625A (zh) * 2014-05-29 2014-08-13 中国科学院软件研究所 一种基于统计监测的云应用故障诊断系统
CN105763868A (zh) * 2014-12-15 2016-07-13 北京文安科技发展有限公司 云台故障的检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邓仲华等: "云环境下的信息服务等级协议研究", 《图书与情报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427627A (zh) * 2018-02-05 2018-08-21 阿里巴巴集团控股有限公司 统计系统稳定性的方法及装置和电子设备
CN112272126A (zh) * 2020-10-26 2021-01-26 中国联合网络通信集团有限公司 业务应用的失效监测方法、计算机设备和存储介质
CN113610372A (zh) * 2021-07-27 2021-11-05 远景智能国际私人投资有限公司 服务等级协议的确定方法,装置,终端及可读存储介质
CN114024825A (zh) * 2021-11-02 2022-02-08 中邮科通信技术股份有限公司 一种云计算环境下业务端到端的故障监测方法
CN115865719A (zh) * 2022-11-04 2023-03-28 中电信数智科技有限公司 5g定制网业务sla监控保障方法

Similar Documents

Publication Publication Date Title
CN105488610B (zh) 一种电力应用系统故障实时分析诊断方法
CN106789158A (zh) 一种云服务保险定损方法和系统
CN107943668A (zh) 计算机服务器集群日志监控方法及监控平台
CN105426292B (zh) 一种游戏日志实时处理系统及方法
CN108763957A (zh) 一种数据库的安全审计系统、方法及服务器
CN107885642A (zh) 基于机器学习的业务监控方法及系统
CN105095052B (zh) Soa环境下的故障检测方法及装置
CN106656627A (zh) 一种基于业务的性能监控和故障定位的方法
CN110223146B (zh) 客户购电服务全过程监控系统及方法
US9817742B2 (en) Detecting hardware and software problems in remote systems
CN109977089A (zh) 日志管理方法、装置、计算机设备及计算机可读存储介质
CN105302697B (zh) 一种密集数据模型数据库的运行状态监控方法及系统
CN109670690A (zh) 数据信息中心监控预警方法、系统及设备
CN113190423B (zh) 业务数据的监控方法、装置及系统
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN110162445A (zh) 基于主机日志及性能指标的主机健康评价方法及装置
CN106055608A (zh) 自动采集和分析交换机日志的方法和装置
CN108989136A (zh) 业务端到端性能监控方法及装置
CN106708700A (zh) 一种应用于服务端的运维监控方法和装置
CN109495291B (zh) 调用异常的定位方法、装置和服务器
CN107544832A (zh) 一种虚拟机进程的监控方法、装置和系统
CN106254137A (zh) 监管系统的告警根源分析系统及方法
CN103295155A (zh) 证券核心业务系统监控方法
CN112699007A (zh) 监控机器性能的方法、系统、网络设备及存储介质
CN105939234A (zh) 数据监控方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication