CN110348684A - 服务调用风险模型生成方法、预测方法及各自装置 - Google Patents

服务调用风险模型生成方法、预测方法及各自装置 Download PDF

Info

Publication number
CN110348684A
CN110348684A CN201910493536.4A CN201910493536A CN110348684A CN 110348684 A CN110348684 A CN 110348684A CN 201910493536 A CN201910493536 A CN 201910493536A CN 110348684 A CN110348684 A CN 110348684A
Authority
CN
China
Prior art keywords
service call
service
data
linear regression
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910493536.4A
Other languages
English (en)
Other versions
CN110348684B (zh
Inventor
赖倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910493536.4A priority Critical patent/CN110348684B/zh
Publication of CN110348684A publication Critical patent/CN110348684A/zh
Application granted granted Critical
Publication of CN110348684B publication Critical patent/CN110348684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供服务调用风险模型生成方法、预测方法及各自装置,其中所述服务调用风险模型生成方法包括:收集服务被调用时生成的日志流;从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集;将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型,所述服务调用风险预测方法基于该服务调用风险预测模型针对实时收到的服务预测出服务调用结果,从而实现了不依赖于人工经验,预测效率高,实现难度低的风险预测。

Description

服务调用风险模型生成方法、预测方法及各自装置
技术领域
本申请涉及计算机领域,特别涉及一种服务调用风险模型生成方法、预测方法及各自装置。
背景技术
随着互联网技术的发展,满足人们各种需求的服务系统日益庞大,从而导致服务是否能够被正确调用,成为了人们关注的问题。目前,主要由系统管理人员根据人工经验分析出服务调用的风险,通过编写脚本对分析出的服务风险进行核对。但是,这种方式主要依赖于人工经验,不仅风险预测效率低,实现难度也比较大。
发明内容
有鉴于此,本申请实施例提供了一种服务调用风险模型生成方法、预测方法及各自装置,以解决现有技术中存在的技术缺陷。
根据本申请实施例的第一方面,提供了一种服务调用风险模型生成方法,包括:收集服务被调用时生成的日志流;从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集;将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
可选地,所述线性回归算法为正则化线性回归算法,所述正则化线性回归算法通过调节正则化参数来寻找最小化代价函数的参数。
可选地,所述数据库链路数据样本包括:数据库链路中涉及的数据库的表、表的相关字段及字段值。
根据本申请实施例的第二方面,提供了一种服务调用风险模型生成装置,包括:收集模块,被配置为收集服务被调用时生成的日志流;样本集生成模块,被配置为从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集;训练模块,被配置为将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
可选地,所述训练模块中的线性回归算法为正则化线性回归算法,所述正则化线性回归算法通过调节正则化参数来寻找最小化代价函数的参数。
可选地,所述样本集生成模块,被配置为从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库的表、表的相关字段及字段值加入训练样本集。
根据本申请实施例的第三方面,提供了一种服务调用风险预测方法,包括:响应于服务被调用,获取所述服务被调用时的数据库链路数据;将所述数据库链路数据输入到基于本申请实施例第一个方面任意一项服务调用风险模型生成方法训练得到的服务调用风险预测模型中进行预测;输出所述服务调用风险预测模型针对所述服务预测出的服务调用结果。
根据本申请实施例的第四方面,提供了一种服务调用风险预测装置,包括:获取模块,被配置为响应于服务被调用,获取所述服务被调用时的数据库链路数据。预测模块,被配置为将所述数据库链路数据输入到基于本申请实施例第一个方面任意一项服务调用风险模型生成方法训练得到的服务调用风险预测模型中进行预测。输出模块,被配置为输出所述服务调用风险预测模型针对所述服务预测出的服务调用结果。
根据本申请实施例的第五方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述本申请实施例第一方面中服务调用风险模型生成方法或第三方面中服务调用风险模型预测方法的步骤。
根据本申请实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述本申请实施例第一方面中服务调用风险模型生成方法或第三方面中服务调用风险模型预测方法的步骤。
本申请实施例中,一方面通过收集服务被调用时生成的日志流,从日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集,将服务调用结果样本作为线性回归方程的输出,将数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型,另一方面基于该服务调用风险预测模型针对实时收到的服务预测出服务调用结果,从而实现了不依赖于人工经验,预测效率高,实现难度低的风险预测。
附图说明
图1是本申请实施例提供的计算设备的结构框图;
图2是本申请实施例提供的服务调用风险模型生成方法的流程图;
图3是本申请实施例提供的日志流的示意图;
图4是本申请实施例提供的服务调用风险模型生成装置的框图;
图5是本申请实施例提供的服务调用风险预测方法的流程图;
图6是本申请实施例提供的服务调用风险预测装置的框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
日志流:由于用户使用程序而生成的日志,包括系统中硬件、软件和系统问题的信息,同时还包括监视系统中发生的事件所产生的事件信息,是随时间延续而增长的动态数据集合。
服务:在后台运行的应用程序,可以由用户操作某种行为产生调用。
数据库链路数据:服务被调用时涉及的数据库表存储的链路中的数据,可以包括数据库的表、表的相关字段及字段值、等等。
线性回归算法:是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
在本申请中,提供了一种服务调用风险模型生成方法、预测方法及各自装置,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。
计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备100还可以是移动式或静止式的服务器。
其中,处理器120可以执行图2所示服务调用风险模型生成方法中的步骤。处理器120也可以执行图5所示服务调用风险预测方法中的步骤。图2示出了根据本申请一实施例的服务调用风险模型生成方法的流程图,包括步骤202至步骤206。
步骤202:收集服务被调用时生成的日志流。
例如,可以利用Spark,一种专为大规模数据处理而设计的快速通用的计算引擎来进行日志流的收集。例如,收集到的部分日志流如图3所示,包含服务调用结果“活动参与用户频次超限”及数据库链路数据中的部分因子如“xxxFacade.quey”、“AE151160202224xx”、“179ms”等。
步骤204:从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集。
通过收集到的日志流,可以从中提取出大量样本数据。其中,数据库链路数据样本可以包括若干因子,比如数据库链路中涉及的数据库的表、表的相关字段及字段值。由于数据库链路中涉及的数据库的表、表的相关字段及字段值是能够表现库链路状态的典型数据,因此,采用这三个因子作为数据库链路数据样本能够有效训练出预测效果更好的服务调用风险预测模型。另外,还可以从日志流中提取服务方案,服务传入参数,服务输出结果加入训练样本集,作为线性回归方程的输入进行训练,以便训练出预测效果更好的服务调用风险预测模型。
步骤206:将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
为了参与线性回归计算,可以将服务调用结果样本集数据库链路数据样本通过枚举值或者数值标准化方式进行数据转换。
为了提高训练效果,本申请还可以进行特征选择,也称特征子集选择,从原始特征中选择出一些最有效特征以降低数据集维度,从而提高学习算法性能的。
在本申请中,可以基于线性回归算法的基本线性回归方程f(Xi)=θ0X01X1+…+θiXi进行训练。其中,X1~Xi是线性回归方程各输入因子。θ1~θi是可变参数,也就是线性回归方程各输入因子的权重。基于线性回归算法对训练样本集进行训练就是通过调整各输入因子的权重找到一条直线尽可能的拟合所有的点,以此来表示数据库链路数据与服务调用结果之间的定量关系。
采用线性回归进行机器学习,可能会产生欠拟合或过拟合的情况,本申请采用正则化的线性回归算法进行训练,以解决这一问题。正则化的线性回归算法通过调节正则化参数来寻找最小化代价函数的参数,能够平衡拟合训练的目的和保持参数值较小的目的,也就是控制欠拟合和过拟合之间的平衡。其中,最小化代价函数为minJ(θ)。其中,hθ(x(i))为线性回归基本方程预测的值,y(i)为真实值,λ即为正则化参数,通过调节λ去找到最小化代价函数的参数θ。
本申请的申请人发现数据库链路数据与服务调用结果之间存在相互依赖的定量关系,因此,通过收集服务被调用时生成的日志流,从日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集,将服务调用结果样本作为线性回归方程的输出,将数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
与上述服务调用风险模型生成方法实施例相对应,本申请还提供了服务调用风险模型生成装置实施例,图4示出了本申请一个实施例的服务调用风险模型生成装置的结构示意图。如图4所示,该装置可以包括:收集模块410、样本集生成模块420、训练模块430。
该收集模块410,可以被配置为收集服务被调用时生成的日志流。
该样本集生成模块420,可以被配置为从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集。
该训练模块430,可以被配置为将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
本申请的申请人发现数据库链路数据与服务调用结果之间存在相互依赖的定量关系,因此,通过收集服务被调用时生成的日志流,从日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集,将服务调用结果样本作为线性回归方程的输出,将数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
考虑到采用线性回归进行机器学习,可能会产生欠拟合或过拟合的情况,本申请一可能的实施方式中,所述训练模块430中的线性回归算法为正则化线性回归算法,所述正则化线性回归算法通过调节正则化参数来寻找最小化代价函数的参数。能够平衡拟合训练的目的和保持参数值较小的目的,也就是控制欠拟合和过拟合之间的平衡。
又一可能的实施方式中,所述样本集生成模块420可以被配置为从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库的表、表的相关字段及字段值加入训练样本集。由于数据库链路中涉及的数据库的表、表的相关字段及字段值是能够表现库链路状态的典型数据,因此,采用这三个因子作为数据库链路数据样本能够有效训练出预测效果更好的服务调用风险预测模型。
图5示出了根据本申请一实施例的服务调用风险预测方法的流程图,包括步骤502至步骤506。
步骤502:响应于服务被调用,获取所述服务被调用时的数据库链路数据。
步骤504:将所述数据库链路数据输入到基于本申请实施例所述的服务调用风险模型生成方法训练得到的服务调用风险预测模型中进行预测。
步骤506:输出所述服务调用风险预测模型针对所述服务预测出的服务调用结果。
由于数据库链路数据与服务调用结果之间存在相互依赖的定量关系,本申请基于线性回归算法训练得到服务调用风险预测模型,从而能够基于该服务调用风险预测模型进行服务调用风险的预测,实现了不依赖于人工经验,预测效率高,实现难度低的风险预测。
与上述服务调用风险预测方法实施例相对应,本申请还提供了服务调用风险预测装置实施例,图6示出了本申请一个实施例的服务调用风险预测装置的结构示意图。如图6所示,该装置可以包括:获取模块610、预测模块620、输出模块630。
该获取模块610,可以被配置为响应于服务被调用,获取所述服务被调用时的数据库链路数据。
该预测模块620,可以被配置为将所述数据库链路数据输入到基于本申请实施例所述服务调用风险模型生成方法训练得到的服务调用风险预测模型中进行预测。
该输出模块630,可以被配置为输出所述服务调用风险预测模型针对所述服务预测出的服务调用结果。
由于数据库链路数据与服务调用结果之间存在相互依赖的定量关系,本申请基于线性回归算法训练得到服务调用风险预测模型,从而能够基于该服务调用风险预测模型进行服务调用风险的预测,实现了不依赖于人工经验,预测效率高,实现难度低的风险预测。
本申请一实施例中还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述的服务调用风险模型生成方法的步骤,也可以执行所述指令时实现所述的服务调用风险预测方法的步骤。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述服务调用风险模型生成方法的步骤,也可以执行时实现如前所述服务调用风险预测方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的服务调用风险模型生成方法的技术方案属于同一构思,也可以与上述的服务调用风险预测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述服务调用风险模型生成方法或服务调用风险预测方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (10)

1.一种服务调用风险模型生成方法,其特征在于,包括:
收集服务被调用时生成的日志流;
从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集;
将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
2.根据权利要求1所述的方法,其特征在于,所述线性回归算法为正则化线性回归算法,所述正则化线性回归算法通过调节正则化参数来寻找最小化代价函数的参数。
3.根据权利要求1所述的方法,其特征在于,所述数据库链路数据样本包括:
数据库链路中涉及的数据库的表、表的相关字段及字段值。
4.一种服务调用风险模型生成装置,其特征在于,包括:
收集模块,被配置为收集服务被调用时生成的日志流;
样本集生成模块,被配置为从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库链路数据样本加入训练样本集;
训练模块,被配置为将所述服务调用结果样本作为线性回归方程的输出,将所述数据库链路数据样本作为对应的输入,基于线性回归算法对所述训练样本集进行训练,得到服务调用风险预测模型。
5.根据权利要求4所述的装置,其特征在于,所述训练模块中的线性回归算法为正则化线性回归算法,所述正则化线性回归算法通过调节正则化参数来寻找最小化代价函数的参数。
6.根据权利要求4所述的装置,其特征在于,所述样本集生成模块,被配置为从所述日志流中提取服务调用结果样本及对应服务被调用时涉及的数据库的表、表的相关字段及字段值加入训练样本集。
7.一种服务调用风险预测方法,其特征在于,包括:
响应于服务被调用,获取所述服务被调用时的数据库链路数据;
将所述数据库链路数据输入到基于权利要求1-3任意一项方法训练得到的服务调用风险预测模型中进行预测;
输出所述服务调用风险预测模型针对所述服务预测出的服务调用结果。
8.一种服务调用风险预测装置,其特征在于,包括:
获取模块,被配置为响应于服务被调用,获取所述服务被调用时的数据库链路数据;
预测模块,被配置为将所述数据库链路数据输入到基于权利要求1-3任意一项方法训练得到的服务调用风险预测模型中进行预测;
输出模块,被配置为输出所述服务调用风险预测模型针对所述服务预测出的服务调用结果。
9.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-3或者7任意一项所述方法的步骤。
10.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-3或者7任意一项所述方法的步骤。
CN201910493536.4A 2019-06-06 2019-06-06 服务调用风险模型生成方法、预测方法及各自装置 Active CN110348684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910493536.4A CN110348684B (zh) 2019-06-06 2019-06-06 服务调用风险模型生成方法、预测方法及各自装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910493536.4A CN110348684B (zh) 2019-06-06 2019-06-06 服务调用风险模型生成方法、预测方法及各自装置

Publications (2)

Publication Number Publication Date
CN110348684A true CN110348684A (zh) 2019-10-18
CN110348684B CN110348684B (zh) 2023-07-18

Family

ID=68181660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910493536.4A Active CN110348684B (zh) 2019-06-06 2019-06-06 服务调用风险模型生成方法、预测方法及各自装置

Country Status (1)

Country Link
CN (1) CN110348684B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095052A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 Soa环境下的故障检测方法及装置
WO2017045472A1 (zh) * 2015-09-16 2017-03-23 华为技术有限公司 资源预测方法、系统和容量管理装
CN106899447A (zh) * 2016-06-28 2017-06-27 阿里巴巴集团控股有限公司 一种链路确定的方法及装置
CN108665175A (zh) * 2018-05-16 2018-10-16 阿里巴巴集团控股有限公司 一种保险业务风险预测的处理方法、装置及处理设备
CN108985517A (zh) * 2018-07-27 2018-12-11 南京理工大学 基于线性回归的短时交通流量预测方法
CN109190943A (zh) * 2018-08-20 2019-01-11 公安部沈阳消防研究所 基于机器学习的动态火灾风险评估方法、装置及服务器
CN109634828A (zh) * 2018-12-17 2019-04-16 浪潮电子信息产业股份有限公司 故障预测方法、装置、设备及存储介质
CN109656778A (zh) * 2018-11-28 2019-04-19 金蝶软件(中国)有限公司 数据获取方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095052A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 Soa环境下的故障检测方法及装置
WO2017045472A1 (zh) * 2015-09-16 2017-03-23 华为技术有限公司 资源预测方法、系统和容量管理装
CN106899447A (zh) * 2016-06-28 2017-06-27 阿里巴巴集团控股有限公司 一种链路确定的方法及装置
CN108665175A (zh) * 2018-05-16 2018-10-16 阿里巴巴集团控股有限公司 一种保险业务风险预测的处理方法、装置及处理设备
CN108985517A (zh) * 2018-07-27 2018-12-11 南京理工大学 基于线性回归的短时交通流量预测方法
CN109190943A (zh) * 2018-08-20 2019-01-11 公安部沈阳消防研究所 基于机器学习的动态火灾风险评估方法、装置及服务器
CN109656778A (zh) * 2018-11-28 2019-04-19 金蝶软件(中国)有限公司 数据获取方法、装置、计算机设备和存储介质
CN109634828A (zh) * 2018-12-17 2019-04-16 浪潮电子信息产业股份有限公司 故障预测方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BAHMAN RASHIDI等: "Android resource usage risk assessment using hidden Markov model and online learning", 《COMPUTERS & SECURITY》 *
刘晨: "基于内核函数监控的Linux系统防护方法的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
胡家香等: "基于面向服务架构的供应链风险预警与决策管理系统", 《东南大学学报(自然科学版)》 *

Also Published As

Publication number Publication date
CN110348684B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN107766929B (zh) 模型分析方法及装置
CN109886498B (zh) 一种基于特征选择的emd-gru短期电力负荷预测方法
CN109800807B (zh) 分类网络的训练方法及分类方法和装置、电子设备
CN112633316B (zh) 一种基于边界估值理论的负荷预测方法和装置
CN110417607B (zh) 一种流量预测方法、装置及设备
CN108628964B (zh) 一种智能场景化企业大数据系统
CN112464058B (zh) 一种基于XGBoost算法的电信互联网诈骗识别方法
CN110209802A (zh) 一种提取摘要文本的方法及装置
CN110110915A (zh) 一种基于cnn-svr模型的负荷集成预测方法
CN112732786A (zh) 金融数据处理方法、装置、设备及存储介质
CN114358445A (zh) 一种业务流程剩余时间预测模型推荐方法及系统
CN110276587A (zh) 项目审批的方法、装置、计算设备及计算机可读存储介质
CN113282623A (zh) 数据处理方法及装置
CN109597894A (zh) 一种关联模型生成方法及装置、一种数据关联方法及装置
CN112153636A (zh) 一种基于机器学习预测电信业用户携号转出的方法
CN109460872B (zh) 一种面向移动通信用户流失不平衡数据预测方法
CN113485993A (zh) 数据识别方法以及装置
WO2020151017A1 (zh) 一种可扩展的领域人机对话系统状态跟踪方法及设备
CN110334185A (zh) 一种平台中数据的处理方法和装置
CN113919763A (zh) 一种基于模糊评判矩阵的电网灾害分析方法及装置
CN112508254A (zh) 变电站工程项目投资预测数据的确定方法
CN110348684A (zh) 服务调用风险模型生成方法、预测方法及各自装置
CN114862098A (zh) 资源分配方法以及装置
CN113962748A (zh) 基于元路径的全貌信息表示异质电商平台用户对齐方法
CN112446593A (zh) 一种lstm神经网络的短期负荷预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201009

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201009

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant