CN108509325B - 系统超时时间的动态确定方法与装置 - Google Patents

系统超时时间的动态确定方法与装置 Download PDF

Info

Publication number
CN108509325B
CN108509325B CN201810188306.2A CN201810188306A CN108509325B CN 108509325 B CN108509325 B CN 108509325B CN 201810188306 A CN201810188306 A CN 201810188306A CN 108509325 B CN108509325 B CN 108509325B
Authority
CN
China
Prior art keywords
time
request processing
period
timeout
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810188306.2A
Other languages
English (en)
Other versions
CN108509325A (zh
Inventor
金留可
张振华
高洋波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201810188306.2A priority Critical patent/CN108509325B/zh
Publication of CN108509325A publication Critical patent/CN108509325A/zh
Application granted granted Critical
Publication of CN108509325B publication Critical patent/CN108509325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供一种系统超时时间的动态确定方法与装置。系统超时时间的动态确定方法包括:根据系统在第一时段内的请求处理数据来训练时间序列模型;基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;根据所述分布特征来确定所述系统在所述第二时段的超时时间。本公开提供的系统超时时间的动态确定方法可以根据系统运行情况动态确定系统超时时间,提高运维效率。

Description

系统超时时间的动态确定方法与装置
技术领域
本公开涉及机器学习技术领域,具体而言,涉及一种通过机器学习实现的系统超时时间的动态确定方法与装置。
背景技术
在多系统、多模块的集成开发设计中,系统与系统、模块与模块之间往往会构成上下游依赖关系。为了保证整个集成系统正常且稳定地运转,需要为每个子系统或子模块设置超时时间,从而保证整个系统可以在规定的时间内,返回一个有效的反馈。目前超时时间的设置主要依赖于管理人员的经验配置或开发人员的反复测试。同时,在线上系统流量变化莫测的情况下,把超时时间设置成固定的值,在处理流量异常变化、失败请求方面无法起到很好的调节作用。
为了解决超时时间的设置问题,保证系统稳定性和可靠性,本方案提出了一种基于时间序列数学模型的动态确定系统超时时间的方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种系统超时时间的动态确定方法与系统超时时间的动态确定装置,用于至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或多个问题。
根据本公开实施例的第一方面,提供一种系统超时时间的动态确定方法,包括:根据系统在第一时段内的请求处理数据来训练时间序列模型;基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征根据所述分布特征来确定所述系统在所述第二时段的超时时间。
根据本公开实施例的第二方面,提供一种系统超时时间的动态确定装置,包括:模型训练模块,设置为根据系统在第一时段内的请求处理数据来训练时间序列模型;请求处理时间预测模块,设置为基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;超时时间确定模块,设置为根据所述分布特征来确定所述系统在所述第二时段的超时时间。
根据本公开的第三方面,提供一种电子设备,包括:存储器;以及耦合到所属存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上述任意一项所述的方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上述任意一项所述的系统超时时间的动态确定方法。
本公开提供的系统超时时间的动态调整方法,通过使用机器学习模型对系统过去一段时间的请求处理时间进行分析总结,可以预测出未来预设时间范围内系统的合理请求处理时间,有利于应对多种运营情景及时调整系统超时时间的设置,提高运维效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出本公开示例性实施例中系统超时时间的动态确定方法的流程图。
图2示意性示出本公开示例性实施例中系统超时时间的动态确定方法的子流程图。
图3示意性示出本公开示例性实施例中系统超时时间的动态确定方法的子流程图。
图4示意性示出本公开示例性实施例中系统超时时间的动态确定方法的子流程图。
图5示意性示出本公开示例性实施例中概率函数的示意图。
图6示意性示出本公开示例性实施例中另一种系统超时时间的动态确定方法的流程图。
图7示意性示出本公开示例性实施例中系统超时时间的动态确定方法的子流程图。
图8示意性示出本公开示例性实施例中再一种系统超时时间的动态确定方法的流程图。
图9示意性示出本公开一个示例性实施例中一种系统超时时间的动态确定装置的方框图。
图10示意性示出本公开一个示例性实施例中一种电子设备的方框图。
图11示意性示出本公开一个示例性实施例中一种计算机可读存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面结合附图对本公开示例实施方式进行详细说明。
图1示意性示出本公开示例性实施例中系统超时时间的动态确定方法的流程图。参考图1,系统超时时间的动态确定方法100可以包括:
步骤S102,根据系统在第一时段内的请求处理数据来训练时间序列模型;
步骤S104,基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;
步骤S106,根据所述分布特征来确定所述系统在所述第二时段的超时时间。
本公开提供的系统超时时间的动态调整方法,通过使用机器学习模型对系统过去一段时间的请求处理时间进行分析总结,可以预测出未来预设时间范围内系统的合理请求处理时间,有利于应对多种运营情景及时调整系统超时时间的设置,提高运维效率。
下面,对系统超时时间的动态确定方法100的各步骤进行详细说明。
在步骤S102,根据系统在第一时段内的请求处理数据来训练时间序列模型。
时间序列模型是一种根据历史观测得到的时间序列数据来建立数学模型的理论和方法,一般采用曲线拟合和参数估计方法(如非线性最小二乘法)来进行。本公开的实施例将时间序列模型应用于系统超时时间的预测分析。
首先,在总系统运行开始时,可以为每个子系统配置一个预设最大超时时间,从而在之后的请求处理过程中,记录下每个子系统对每一个请求的请求处理数据。然后,可以设置一个样本采集时间段,即第一时段,例如一个月,从而在设置一个子系统的超时时间时,采集该子系统在最近一个月的请求处理数据作为时间序列模型的训练数据。第一时段的设置可以有多种,本公开不以此为限。
为语言简洁,在本公开实施例中将总系统中的子系统简称为系统。
图2是本公开示例性实施例中一种生成模型训练数据的流程图。参考图2,步骤S102可以包括:
步骤S1021,通过滑动时间窗口对所述请求处理数据采样,获取多个序列的特征数据和与其对应的目标数据;
步骤S1022,根据所述特征数据与所述目标数据来训练循环神经网络模型,得到所述特征数据与所述目标数据的映射关系。
采用滑动时间窗口的方法扩充样本,可以在有限的样本内获取足够的训练数据集。例如,可以将滑动时间窗口的窗口大小设置为一个小时,选取系统一个小时内的请求处理数据作为特征数据,该小时后10分钟内的请求处理时间作为预测的目标数据。如表1所示:
表1:
特征数据段X 目标数据段Y
10:00–11:00 11:00–11:10
10:10–11:10 11:10–11:20
10:20–11:20 11:20–11:30
在如表1所示的实施例中,将10:00-11:30作为第一时段,记录系统在该时段内的多个请求处理数据。通过窗口大小为1小时的滑动时间窗口取出三段特征数据,并取每个特征数据之后的10分钟内的数据作为预测的目标数据,对时间序列模型进行训练。可以理解的是,两组不同训练数据中的目标数据与特征数据可以重叠。
基于时间序列模型的训练方式,将每组特征数据按时间等分为多个序列,以使每个序列的时间长度均与目标数据的时间长度相等。在本公开的其他实施例中,时间窗口的大小随目标数据时间长度的变化而变化,但均为目标数据时间长度的整数倍。
以目标数据时间长度等于10分钟为例,时间窗口大小为1小时,此时可以把特征数据按时间等分为6个序列作为输入数据X,并分别表示为(x1,x2,x3,x4,x5,x6),对每一序列按照预设特征进行特征提取。
在本公开的一种示例性实施例中,预设特征主要可以分为基本特征、短时特征、周期特征。
基本特征可以包括单位时间内系统的总的请求数、失败请求数、异常报警数、IO数、系统资源利用率、日期、小时、节假日等。
短时特征可以包括1分钟/3分钟/5分钟内/10分钟内系统运行的平均时间、最大时间、最小时间、变化标准差等。
周期特征可以包括统计近一个月该时间段运行时间的最大值、最小值、平均值以及标准差等。
通过对每一序列的特征数据进行提取,可以将每个序列的特征数据抽象为一个特征向量。对特征的提取可以由模型执行。预设特征的设置影响模型预测精确度,因此,本领域技术人员可以根据实际情况自行设置预设特征的种类。
在步骤S1022中,可以利用RNN(Recurrent neural Network,循环神经网络)模型来实现本公开的技术方案。近年来,随着人工智能的普及与发展,将深度学习算法应用于时间序列模型的训练和预测成为一种新的趋势。由于RNN对于涉及顺序的机器学习任务可以达到很高的精度,本实施例以RNN模型作为上述时间序列模型的一个示例加以说明,但本公开的实施例显然不限于此。
在本公开的一种示例性实施例中,可以利用循环神经网络(Recurrent NeuralNetwork,RNN)模型来实现本公开的技术方案。假设一段时间内系统的运行时间符合正态分布,用RNN模型处理输入数据X:
hi=sigmoid(xi·w′+hi-1·w″+bi) (1)
Figure BDA0001590966040000061
Figure BDA0001590966040000062
Figure BDA0001590966040000063
其中,n表示一条训练数据的序列长度,xi表示序列中第i个输入的特征表示,hi表示序列中第i个节点的隐层特征表示,w'和w”分别表示输入层和隐藏层、隐藏层和隐藏层之间的连接矩阵,bi表示偏置向量。Sigmoid表示隐藏层的激活函数,w”'表示最后一个节点的隐藏层和输出层之间的连接矩阵。
Figure BDA0001590966040000071
表示预测的结果,yn表示实际的目标结果,loss表示实际值和误差之间的损失,m表示训练数据的数量。
基于历史数据已知的特征数据和目标数据,可根据式(4)计算的损失经反向传播最终输出RNN的各连接矩阵参数。之后,利用参数确定后的RNN模型,输入当前时间序列的特征数据X可基于式(1)-(3)得到下一时间序列的预测数据
Figure BDA0001590966040000072
步骤S104,基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征。
图3是本公开实施例的一个子流程图。
参考图3,在本公开的一个实施例中,步骤S104可以包括:
步骤S1041,将最近一个时间窗口的请求处理数据输入所述循环神经网络;
步骤S1042,基于所述循环神经网络模型的输出获取所述系统的请求处理时间在所述第二时段内分布的期望与标准差。
对于已经训练好的时间序列模型,可以从获取的第一时段的请求处理数据中取出最后一个时间窗口的数据作为模型输入数据,获取系统在未来第二时段的请求处理时间的分布特征。例如,可以将系统最近一个小时的请求处理数据作为输入数据,预测今后10分钟的请求处理时间的分布特征。
在本公开一个实施例中,假设请求处理时间的分布符合正态分布,使用循环神经网络模型获取系统的请求处理时间在第二时段内分布的期望与标准差。
在本公开其他实施例中,如果假设请求处理时间符合其他规律,也可以提取其他分布特征,本领域技术人员可以根据实际情况自行设置。
步骤S106,根据所述分布特征来确定所述系统在所述第二时段的超时时间。
图4是本公开实施例的一个子流程图。
参考图4,在本公开的一个实施例中,步骤S106可以包括:
步骤S1061,获取所述系统的请求处理时间在所述第二时段内分布的期望与标准差;
步骤S1062,根据所述期望与标准差确定所述第二时段内所述请求处理时间的概率函数;
步骤S1063,基于预设的请求处理成功概率和所述概率函数确定所述系统在所述第二时段的超时时间。
步骤S1061的实施可以参考图3所示实施例,于此不再赘述。
下面通过图5对步骤S1062进行说明。
图5是本公开示例性实施例中概率函数的示意图。
参考图5,根据步骤S1061获取的期望与标准差,可以画出第二时段(未来10分钟)内的请求处理时间正态分布图。
在该正态分布图中,横坐标t表示第二时段的请求处理时间的取值,纵坐标表示第二时段内每个请求处理时间概率密度,以横坐标x=ξ的直线为分界,直线左侧的阴影部分面积表示请求处理时间的取值小于等于ξ的概率。
如此,可以得出请求处理时间的概率函数:
Figure BDA0001590966040000081
在步骤S1063,可以根据系统需求预设请求处理成功概率,例如90%,从而使P(t≤ξ)=0.9,根据公式(5)反推出能够使请求处理成功比例约为90%的请求处理时间的取值ξ。将该取值ξ作为系统的超时时间,可以允许系统在未来10分钟内正常处理大约90%的请求,而对大约其余10%的处理时间较长的请求返回请求处理失败消息。
通过根据系统最近请求处理情况设置系统的超时时间,可以适应多种运维环境,灵活合理地设置系统超时时间。
在本公开的一种示例性实施例中,还可以按预设周期获取所述系统在第一时段内的请求处理数据,更新所述时间序列模型。例如,每10分钟获取最近一个月的请求处理数据,重新对时间序列模型进行训练。将最近一个小时的请求处理数据作为输入数据获取系统在未来10分钟的系统超时时间。
为节约计算成本,训练模型的频率可以低于计算超时时间的频率。例如,可以在每天00:00获取最近一个月的请求处理数据,重新训练模型,并在当天每10分钟获取最近一个小时的请求处理数据作为模型输入数据,获取未来10分钟的系统超时时间。
通过根据最新运行数据训练模型并对近期超时时间进行预测,可以灵活应对系统变化,合理调整不同运维情况下的系统超时时间。
图6是本公开示例性实施例中对系统超时时间的一种应用。
参考图6,在一实施例中,系统超时时间的动态确定方法还可以包括:
步骤S601,确定存在依赖关系的系统集合,为所述系统集合中的每个系统确定超时时间;
步骤S602,在一个系统发生请求处理异常时,基于当前系统运行总时长以及所述系统之后的每个系统的超时时间来确定是否启动请求处理重试。
图7是本公开示例性实施例的一个子流程图。
参考图7,在一个实施例中,步骤S602可以包括:
步骤S6021,响应于所述系统的请求处理异常消息,获取当前系统运行总时长以及所述系统之后每个系统的超时时间;
步骤S6022,在确定所述当前系统运行总时长与所述超时时间的总和不大于预设阈值时启动请求处理重试。
假设总系统中存在依赖关系的系统(节点)有a1,a2,a3,…ai,…,an,该请求处理路径上各系统的执行时间依次为t1,t2,t3,…,ti,…,tn,对每个系统预测的超时时间分别为t'1,t'2,t'3,…,t'i,…,t'n,那么当系统ai发生请求处理异常时,如果启动请求处理重试,此时总系统最长的请求处理时间s将是:
Figure BDA0001590966040000091
其中,
Figure BDA0001590966040000092
是总系统当前已经耗费的请求处理时长,
Figure BDA0001590966040000093
是发生异常后,系统重试异常请求之后预测需要耗费的请求时长。即,最长的请求处理时间将是当前请求处理时长与每个后续系统的最长请求处理时间之和的总和。
设置一预设系统阈值时长T,即允许的系统请求处理最长时间。当s>T时,如果启动请求处理重试,则总系统的请求处理时间有可能超过系统阈值时长,此时决定不发送请求处理重试命令,判定本次请求处理失败;当s<=T时,系统的最长请求处理时间也不超过系统阈值时长,此时发送请求处理重试命令,使当前系统重新处理该请求。
图8是添加系统重试判断的系统超时时间的动态确定方法的示意图。
参考图8,在步骤S801,获取总系统的依赖系统集合。
在步骤S802,设置子系统的超时时间。初次设置时可以设置一尽量大的值,二次或更多次设置时,可以通过数学模型的计算进行。
在步骤S803,启动请求处理流程,并监控是否出现请求处理异常;
在步骤S804,出现请求处理异常时,根据设置的超时时间评估启动请求处理重试的时间;
在步骤S805,判断启动请求处理重试后请求处理时长是否会超过预设系统阈值时长T,若否,发送请求处理重试命令,重新启动请求处理流程;
在步骤S806,如果启动请求处理重试会导致请求处理时长可能超过预设系统阈值时长T,返回请求处理失败信息,结束请求处理流程;或者,整个请求处理流程均未出现请求处理异常,结束请求处理流程。
在步骤S807,记录子系统的一组请求处理数据;
在步骤S808,根据记录的请求处理数据生成模型训练数据;
在步骤S809~步骤S810,根据模型训练数据训练模型,并输出预测结果;
在步骤S811,根据预测结果计算未来一段时间的系统超时时间,并更新系统设置。
通过设置系统重试判断机制,可以更细致地优化运维流程,设置更合理的系统超时时间。
对应于上述方法实施例,本公开还提供一种系统超时时间的动态确定装置,可以用于执行上述方法实施例。
图9示意性示出本公开一个示例性实施例中一种系统超时时间的动态确定装置的方框图。
参考图9,系统超时时间的动态确定装置900可以包括:
模型训练模块902,设置为根据系统在第一时段内的请求处理数据来训练时间序列模型;
模型训练模块904,设置为基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;
超时时间确定模块906,设置为根据所述分布特征来确定所述系统在所述第二时段的超时时间。
由于装置900的各功能已在其对应的方法实施例中予以详细说明,本公开于此不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图10来描述根据本发明的这种实施方式的电子设备1000。图10显示的电子设备1000仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,电子设备1000以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于:上述至少一个处理单元1010、上述至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1010执行,使得所述处理单元1010执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1010可以执行如图1中所示的步骤S102:根据系统在第一时段内的请求处理数据来训练时间序列模型;步骤S104:基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;步骤S106:根据所述分布特征来确定所述系统在所述第二时段的超时时间。
存储单元1020可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)10201和/或高速缓存存储单元10202,还可以进一步包括只读存储单元(ROM)10203。
存储单元1020还可以包括具有一组(至少一个)程序模块10205的程序/实用工具10204,这样的程序模块10205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1030可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1000也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且,电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1060通过总线1030与电子设备1000的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图11所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品1100,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和构思由权利要求指出。

Claims (8)

1.一种系统超时时间的动态确定方法,其特征在于,包括:
根据系统在第一时段内的请求处理数据来训练时间序列模型;
基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;
根据所述分布特征来确定所述系统在所述第二时段的超时时间;
其中,所述根据系统在第一时段内的请求处理数据来训练时间序列模型包括:
通过滑动时间窗口对所述请求处理数据采样,获取多个序列的特征数据和与其对应的目标数据;以及根据所述特征数据与所述目标数据来训练循环神经网络模型,得到所述特征数据与所述目标数据的映射关系;
所述的基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征包括:
将最近一个时间窗口的请求处理数据输入所述循环神经网络模型;以及基于所述循环神经网络模型的输出获取所述系统的请求处理时间在所述第二时段内分布的期望与标准差。
2.如权利要求1所述的系统超时时间的动态确定方法,其特征在于,所述根据所述分布特征来确定所述系统在所述第二时段的超时时间包括:
获取所述系统的请求处理时间在所述第二时段内分布的期望与标准差;
根据所述期望与标准差确定所述第二时段内所述请求处理时间的概率函数;以及
基于预设的请求处理成功概率和所述概率函数确定所述系统在所述第二时段的超时时间。
3.如权利要求1所述的系统超时时间的动态确定方法,其特征在于,还包括:
确定存在依赖关系的系统集合,为所述系统集合中的每个系统确定超时时间;
在一个系统发生请求处理异常时,基于当前系统运行总时长以及所述系统之后的每个系统的超时时间来确定是否启动请求处理重试。
4.如权利要求3所述的系统超时时间的动态确定方法,所述的在一个系统发生请求处理异常时,基于当前系统运行总时长以及所述系统之后的每个系统的超时时间来确定是否启动请求处理重试包括:
响应于所述系统的请求处理异常消息,获取当前系统运行总时长以及所述系统之后每个系统的超时时间;
在确定所述当前系统运行总时长与所述超时时间的总和不大于预设阈值时启动请求处理重试。
5.如权利要求1所述的系统超时时间的动态确定方法,其特征在于,还包括:
按预设周期获取所述系统在第一时段内的请求处理数据,更新所述时间序列模型。
6.一种系统超时时间的动态确定装置,其特征在于,包括:
模型训练模块,设置为根据系统在第一时段内的请求处理数据来训练时间序列模型;
请求处理时间预测模块,设置为基于所述时间序列模型来预测所述系统在第二时段内的请求处理时间的分布特征;
超时时间确定模块,设置为根据所述分布特征来确定所述系统在所述第二时段的超时时间;
其中,所述模型训练模块设置为通过滑动时间窗口对所述请求处理数据采样,获取多个序列的特征数据和与其对应的目标数据;以及根据所述特征数据与所述目标数据来训练循环神经网络模型,得到所述特征数据与所述目标数据的映射关系;
所述请求时间预测模块设置为将最近一个时间窗口的请求处理数据输入所述循环神经网络模型;以及基于所述循环神经网络模型的输出获取所述系统的请求处理时间在所述第二时段内分布的期望与标准差。
7.一种电子设备,其特征在于,包括:
存储器;以及
耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-5任一项所述的系统超时时间的动态确定方法。
8.一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如权利要求1-5任一项所述的系统超时时间的动态确定方法。
CN201810188306.2A 2018-03-07 2018-03-07 系统超时时间的动态确定方法与装置 Active CN108509325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810188306.2A CN108509325B (zh) 2018-03-07 2018-03-07 系统超时时间的动态确定方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810188306.2A CN108509325B (zh) 2018-03-07 2018-03-07 系统超时时间的动态确定方法与装置

Publications (2)

Publication Number Publication Date
CN108509325A CN108509325A (zh) 2018-09-07
CN108509325B true CN108509325B (zh) 2021-01-15

Family

ID=63377125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810188306.2A Active CN108509325B (zh) 2018-03-07 2018-03-07 系统超时时间的动态确定方法与装置

Country Status (1)

Country Link
CN (1) CN108509325B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144700B (zh) * 2018-09-03 2022-09-23 创新先进技术有限公司 超时时长的确定方法、装置、服务器和数据处理方法
CN109543988A (zh) * 2018-11-16 2019-03-29 中国银行股份有限公司 优化交易超时阀值的方法、装置和存储介质
CN111245559B (zh) * 2018-11-29 2023-04-18 阿里巴巴集团控股有限公司 信息确定方法、信息判断方法、装置及计算设备
CN109753408B (zh) * 2018-12-11 2022-03-25 江阴逐日信息科技有限公司 一种基于机器学习的流程异常预测方法
CN110012093B (zh) * 2019-04-02 2021-12-24 北京奇艺世纪科技有限公司 一种调整连接超时时间的方法及装置
CN110166572A (zh) * 2019-06-06 2019-08-23 北京达佳互联信息技术有限公司 网络处理方法、装置、电子设备及存储介质
CN110768861B (zh) * 2019-09-20 2021-07-06 北京字节跳动网络技术有限公司 一种获取超时阈值的方法、装置、介质和电子设备
CN113641508A (zh) * 2020-04-27 2021-11-12 北京京东振世信息技术有限公司 一种业务处理方法和装置
CN112887432B (zh) * 2021-03-31 2023-07-18 中国工商银行股份有限公司 分布式系统重建运维方法、运维节点及系统
CN113824603B (zh) * 2021-11-25 2022-02-08 天津众颐科技有限责任公司 一种前端调用微服务接口时的超时时间的动态配置方法
CN114546611A (zh) * 2022-01-18 2022-05-27 上海万物新生环保科技集团有限公司 一种调整接口调用超时时间的方法、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012121747A1 (en) * 2011-03-04 2012-09-13 Ultratick, Inc. Predicting the performance of a financial instrument
CN103020448A (zh) * 2012-12-11 2013-04-03 南京航空航天大学 一种基于时间序列分析的机场噪声瞬时值预测方法及其系统
GB2513677A (en) * 2013-10-17 2014-11-05 Imagination Tech Ltd Channel impulse response
CN104503874A (zh) * 2014-12-29 2015-04-08 南京大学 一种云计算平台的硬盘故障预测方法
CN105912436A (zh) * 2015-09-17 2016-08-31 乐视网信息技术(北京)股份有限公司 基于指数平滑预测的系统计算资源预测方法及装置
CN106161140A (zh) * 2016-06-28 2016-11-23 中国联合网络通信集团有限公司 确定被监控节点工作状态的方法、监控节点和集群系统
CN106971545A (zh) * 2017-05-16 2017-07-21 青岛大学 一种公交车到站时间预测方法
CN106992937A (zh) * 2017-04-19 2017-07-28 天津大学 基于garch时间序列算法的拥塞控制方法
CN107015900A (zh) * 2016-01-27 2017-08-04 中国科学院声学研究所 一种视频网站的服务性能预测方法
CN107247198A (zh) * 2017-05-09 2017-10-13 安徽继远软件有限公司 一种配电设备故障预测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10452467B2 (en) * 2016-01-28 2019-10-22 Intel Corporation Automatic model-based computing environment performance monitoring

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012121747A1 (en) * 2011-03-04 2012-09-13 Ultratick, Inc. Predicting the performance of a financial instrument
CN103020448A (zh) * 2012-12-11 2013-04-03 南京航空航天大学 一种基于时间序列分析的机场噪声瞬时值预测方法及其系统
GB2513677A (en) * 2013-10-17 2014-11-05 Imagination Tech Ltd Channel impulse response
CN104503874A (zh) * 2014-12-29 2015-04-08 南京大学 一种云计算平台的硬盘故障预测方法
CN105912436A (zh) * 2015-09-17 2016-08-31 乐视网信息技术(北京)股份有限公司 基于指数平滑预测的系统计算资源预测方法及装置
CN107015900A (zh) * 2016-01-27 2017-08-04 中国科学院声学研究所 一种视频网站的服务性能预测方法
CN106161140A (zh) * 2016-06-28 2016-11-23 中国联合网络通信集团有限公司 确定被监控节点工作状态的方法、监控节点和集群系统
CN106992937A (zh) * 2017-04-19 2017-07-28 天津大学 基于garch时间序列算法的拥塞控制方法
CN107247198A (zh) * 2017-05-09 2017-10-13 安徽继远软件有限公司 一种配电设备故障预测方法及装置
CN106971545A (zh) * 2017-05-16 2017-07-21 青岛大学 一种公交车到站时间预测方法

Also Published As

Publication number Publication date
CN108509325A (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN108509325B (zh) 系统超时时间的动态确定方法与装置
CN109478045B (zh) 使用预测来控制目标系统
Nguyen et al. {AGILE}: elastic distributed resource scaling for {infrastructure-as-a-service}
JP6609050B2 (ja) 時間的因果グラフにおける異常フュージョン
CN108089921B (zh) 用于云端大数据运算架构的服务器及其运算资源最佳化方法
JP4756675B2 (ja) コンピュータ資源のキャパシティを予測するためのシステム、方法およびプログラム
CN109753356A (zh) 一种容器资源调度方法、装置及计算机可读存储介质
Yu et al. Integrating clustering and learning for improved workload prediction in the cloud
US20230376855A1 (en) Anomaly detection and tuning recommendation system
CN109272348B (zh) 活跃用户数量确定方法及装置、存储介质和电子设备
CN113837427B (zh) 用于对资产执行预测性健康分析的方法和计算系统
CN112508723B (zh) 基于自动择优建模的金融风险预测方法、装置和电子设备
US20220382614A1 (en) Hierarchical neural network-based root cause analysis for distributed computing systems
CN114208127A (zh) 预测操作数据管理系统中的服务质量的机器学习
CN114860542A (zh) 趋势预测模型的优化方法、优化装置、电子设备和介质
CN114726758A (zh) 工业网络异常确定方法、装置、计算机设备及存储介质
CN108897673B (zh) 系统容量评估方法与装置
Torquato et al. Availability and reliability modeling of VM migration as rejuvenation on a system under varying workload
CN114529019A (zh) 一种基于任务成功率的备件保障概率确定方法及装置
Brandt et al. Quantifying effectiveness of failure prediction and response in HPC systems: Methodology and example
CN110689137B (zh) 参数确定方法、系统、介质和电子设备
US11200989B1 (en) Aperiodic data driven cognitive control system
CN115314402A (zh) 网元负载监控方法、装置、存储介质和电子设备
US20210232917A1 (en) Estimating useful life
CN114297453A (zh) 告警预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant