CN118093206B - 面向企业应用服务的信息处理方法及系统 - Google Patents

面向企业应用服务的信息处理方法及系统 Download PDF

Info

Publication number
CN118093206B
CN118093206B CN202410510110.6A CN202410510110A CN118093206B CN 118093206 B CN118093206 B CN 118093206B CN 202410510110 A CN202410510110 A CN 202410510110A CN 118093206 B CN118093206 B CN 118093206B
Authority
CN
China
Prior art keywords
program
application service
activity
node
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410510110.6A
Other languages
English (en)
Other versions
CN118093206A (zh
Inventor
李昕玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongguancun Kejin Technology Co Ltd
Original Assignee
Beijing Zhongguancun Kejin Technology Co Ltd
Filing date
Publication date
Application filed by Beijing Zhongguancun Kejin Technology Co Ltd filed Critical Beijing Zhongguancun Kejin Technology Co Ltd
Priority to CN202410510110.6A priority Critical patent/CN118093206B/zh
Publication of CN118093206A publication Critical patent/CN118093206A/zh
Application granted granted Critical
Publication of CN118093206B publication Critical patent/CN118093206B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请实施例提供一种面向企业应用服务的信息处理方法及系统,通过获取目标报告标签和程序运行节点,利用程序报告生成模型估计每个程序运行节点的应用服务程序活动序列,进而生成具有多个程序运行节点的目标企业应用服务程序报告,能够准确、全面地反映企业应用服务程序在运行过程中的函数调用、资源占用和代码执行路径等关键信息,为企业提供详尽的程序运行状况分析和优化建议。通过生成的目标企业应用服务程序报告,企业可以更加直观地了解程序在不同运行节点的行为特征,及时发现潜在的性能瓶颈和资源浪费问题,从而有针对性地进行程序优化和资源调配,提高企业应用服务的运行效率和稳定性。

Description

面向企业应用服务的信息处理方法及系统
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种面向企业应用服务的信息处理方法及系统。
背景技术
随着企业信息化建设的不断深入,企业应用服务程序在企业的日常运营中扮演着越来越重要的角色,这些程序不仅涉及企业的核心业务逻辑,还直接关系到企业的生产效率、客户体验和数据安全等方面。因此,对企业应用服务程序进行有效的监控和管理,以确保其稳定、高效运行,已成为企业信息化建设的重要任务之一。
然而,传统的企业应用服务程序监控方法往往只能提供有限的运行信息,难以全面、准确地反映程序的运行状态和行为特征。特别是在复杂的分布式系统环境下,企业应用服务程序往往由多个组件和模块组成,且这些组件和模块之间存在着复杂的交互和依赖关系,这就给程序的监控和管理带来了极大的挑战。
发明内容
为了至少克服现有技术中的上述不足,本申请实施例的目的在于提供一种面向企业应用服务的信息处理方法及系统。
根据本申请的一个方面,提供一种面向企业应用服务的信息处理方法,所述方法包括:
获取所需生成的企业应用服务程序报告的目标报告标签,并获取用于进行程序报告生成的K个程序运行节点;K为正整数;
依据程序报告生成模型分别在每个程序运行节点估计所述目标报告标签关联的应用服务程序活动序列;任意一个程序运行节点对应的应用服务程序活动序列包括:所述任意一个程序运行节点对应的函数调用活动、资源占用活动或代码执行片段的执行路径活动;所述任意一个程序运行节点对应的资源占用活动表征所述任意一个程序运行节点上程序对系统资源的占用行为矢量,所述任意一个程序运行节点对应的代码执行片段用于表征所述任意一个程序运行节点与所述任意一个程序运行节点的下一程序运行节点间的代码执行片段,所述任意一个程序运行节点对应代码执行片段的执行路径活动表征所述任意一个程序运行节点对应代码执行片段的执行路径流动矢量;
依据所述每个程序运行节点各自对应的应用服务程序活动序列生成所述目标报告标签下的目标企业应用服务程序报告;所述目标企业应用服务程序报告具有所述K个程序运行节点。
在第一方面的一种可能的实施方式中,依据所述程序报告生成模型在所述任意一个程序运行节点估计所述目标报告标签关联的函数调用活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用类型的第一置信度;
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用控制参数的第二置信度;
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用实例的第三置信度;
基于在所述任意一个程序运行节点估计的针对各个函数调用类型的第一置信度、针对各个函数调用控制参数的第二置信度及针对各个函数调用实例的第三置信度,确定所述任意一个程序运行节点对应的函数调用活动。
在第一方面的一种可能的实施方式中,所述基于在所述任意一个程序运行节点估计的针对各个函数调用类型的第一置信度、针对各个函数调用控制参数的第二置信度及针对各个函数调用实例的第三置信度,确定所述任意一个程序运行节点对应的函数调用活动,包括:
基于所述多个函数调用类型中对应第一置信度不小于第一门限值的函数调用类型生成函数调用类型提取序列;
基于所述多个函数调用控制参数中对应第二置信度不小于第二门限值的函数调用控制参数生成函数调用控制参数提取序列;
基于所述多个函数调用实例中对应第三置信度不小于第三门限值的函数调用实例生成函数调用实例提取序列;
分别对所述函数调用类型提取序列、所述函数调用控制参数提取序列和所述函数调用实例提取序列进行采样,并基于采样获得的函数调用类型、函数调用控制参数和函数调用实例,确定所述任意一个程序运行节点对应的函数调用活动。
在第一方面的一种可能的实施方式中,所述任意一个程序运行节点对应代码执行片段的执行路径活动包含所述任意一个程序运行节点对应代码执行片段的执行路径节点;依据所述程序报告生成模型在所述任意一个程序运行节点估计代码执行片段的执行路径活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个执行路径节点的第四置信度;
基于所述多个执行路径节点中对应第四置信度不小于第四门限值的执行路径节点生成执行路径节点提取序列;
对所述执行路径节点提取序列进行采样,基于采样生成的执行路径节点确定所述任意一个程序运行节点对应代码执行片段的执行路径活动。
在第一方面的一种可能的实施方式中,所述任意一个程序运行节点对应的资源占用活动包含所述任意一个程序运行节点上程序关联的系统资源类型活动;
依据所述程序报告生成模型估计所述任意一个程序运行节点对应的资源占用活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个系统资源占用行为的第五置信度;
基于所述多个系统资源占用行为中对应第五置信度不小于第五门限值的系统资源占用行为生成系统资源占用行为提取序列;
对所述系统资源占用行为提取序列进行采样,基于采样生成的系统资源占用行为确定所述任意一个程序运行节点对应的资源占用活动。
在第一方面的一种可能的实施方式中,所述任意一个程序运行节点对应的资源占用活动包含所述任意一个程序运行节点上程序关联的系统资源类型组合活动;依据所述程序报告生成模型估计所述任意一个程序运行节点对应的资源占用活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个系统资源组合占用行为的第六置信度;
基于所述多个系统资源组合占用行为中对应第六置信度不小于第六门限值的系统资源组合占用行为生成系统资源组合占用行为提取序列;
对所述系统资源组合占用行为提取序列进行采样,基于采样生成的系统资源组合占用行为确定所述任意一个程序运行节点对应的资源占用活动。
在第一方面的一种可能的实施方式中,所述依据所述每个程序运行节点各自对应的应用服务程序活动序列生成所述目标报告标签下的目标企业应用服务程序报告,包括:
依据所述每个程序运行节点对应的应用服务程序活动序列进行模拟特征矢量提取,生成所述每个程序运行节点对应的模拟特征矢量数据;
对所述每个程序运行节点对应的模拟特征矢量数据进行运行轨迹模拟,生成所述每个程序运行节点各自对应的模拟运行轨迹数据;
对所述K个程序运行节点对应的模拟运行轨迹数据进行融合,生成所述目标企业应用服务程序报告;
在第一方面的一种可能的实施方式中,所述依据所述每个程序运行节点对应的应用服务程序活动序列进行模拟特征矢量提取,生成所述每个程序运行节点对应的模拟特征矢量数据的步骤,包括:
获取企业应用服务程序的不同外部数据源,所述外部数据源包括系统日志数据、性能监控数据、用户反馈数据,并将不同外部数据源之间的时间戳对齐后,与对应的程序运行节点的应用服务程序活动序列的数据进行关联,获得目标应用服务程序活动数据;
对所述目标应用服务程序活动数据中的函数调用活动进行解析,构建对应的动态调用链,所述动态调用链包括跨线程和跨进程的调用关系;
利用预先定义的模式识别网络分析所述目标应用服务程序活动数据中的资源占用活动的时序模式,识别出资源占用时序序列中不同的资源占用模式,所述资源占用模式包括周期性占用模式和突发性占用模式中的至少一种;
结合控制流图CFG和动态执行信息,分析所述目标应用服务程序活动数据中的代码执行片段的实际执行路径数据,所述实际执行路径数据包括条件分支的实际走向路径数据;
对所述动态调用链和实际执行路径数据进行图嵌入处理,提取图嵌入低维向量表示作为图表示特征,并使用循环神经网络对所述资源占用时序序列进行编码生成对应的时序依赖关系特征;
对所述目标应用服务程序活动数据中的函数调用关系和资源占用关系构建对应的社区结构网络特征;
对所述图表示特征、所述时序依赖关系特征和所述社区结构网络特征进行交叉组合,生成对应的复合交互作用特征数据;
基于互信息的特征选择从所述复合交互作用特征数据中筛选出与所述目标报告标签关联的特征数据子集后,使用主成分分析对所述特征数据子集进行降维处理,生成所述模拟特征矢量数据,并将生成的模拟特征矢量数据存储在数据结构中,建立索引以便检索查询;
在第一方面的一种可能的实施方式中,所述对所述每个程序运行节点对应的模拟特征矢量数据进行运行轨迹模拟,生成所述每个程序运行节点各自对应的模拟运行轨迹数据的步骤,包括:
为每个所述程序运行节点的模拟特征矢量数据定义初始状态,所述初始状态包括程序运行节点的起始点、资源占用初始值、函数调用起始栈;
配置模拟过程中的模拟参数,所述模拟参数包括时间步长、模拟时长、随机种子;
根据程序运行节点的节点特征选择关联的动态模型,所述动态模型包括隐马尔可夫模型、动态贝叶斯网络、循环神经网络;
按照设定的模拟参数执行模拟过程,在每个模拟周期内根据当前状态和所述动态模型预测下一个状态,并在模拟过程中引入随机因素,以模拟真实环境中的不确定性,所述随机因素包括系统噪声因素和外部干扰因素;
根据状态预测结果更新程序运行节点的状态,并记录每个模拟周期的状态信息,形成初始模拟运行轨迹数据,并对生成的初始模拟运行轨迹数据进行平滑处理后,从平滑后的初始模拟运行轨迹数据中标注关键特征,生成所述模拟运行轨迹数据,所述关键特征包括趋势特征、周期性特征、突变点特征。
在第一方面的一种可能的实施方式中,所述方法还包括:
获取范例报告标签下的范例企业应用服务程序报告,并获取用于进行程序报告生成的K个范例程序运行节点;所述范例企业应用服务程序报告在每个范例程序运行节点均具有对应的标注应用服务程序活动序列,所述每个范例程序运行节点对应的标注应用服务程序活动序列是对所述范例企业应用服务程序报告进行活动检测获得;
依据基础程序报告生成模型分别在每个范例程序运行节点估计所述范例报告标签关联的范例应用服务程序活动序列;任意一个范例程序运行节点对应的范例应用服务程序活动序列包括:所述任意一个范例程序运行节点对应的函数调用活动、资源占用活动或代码执行片段的执行路径活动;所述任意一个范例程序运行节点对应的资源占用活动表征所述任意一个范例程序运行节点上程序对系统资源的占用行为矢量,所述任意一个范例程序运行节点对应的代码执行片段用于表征所述任意一个范例程序运行节点与所述任意一个范例程序运行节点的下一程序运行节点间的代码执行片段,所述任意一个范例程序运行节点对应代码执行片段的执行路径活动表征所述任意一个范例程序运行节点对应代码执行片段的执行路径流动矢量;
依据所述每个范例程序运行节点各自对应的标注应用服务程序活动序列和范例应用服务程序活动序列,分别确定所述基础程序报告生成模型在所述每个范例程序运行节点处的训练误差参数;
依据所述每个范例程序运行节点对应的训练误差参数更新所述基础程序报告生成模型的模型参数信息,并将模型参数信息更新后的基础程序报告生成模型输出为所述程序报告生成模型;
在第一方面的一种可能的实施方式中,所述K个范例程序运行节点中任意一个表示为目标范例程序运行节点;
所述依据所述每个范例程序运行节点各自对应的标注应用服务程序活动序列和范例应用服务程序活动序列,分别确定所述基础程序报告生成模型在所述每个范例程序运行节点处的训练误差参数,包括:
将所述目标范例程序运行节点对应的标注应用服务程序活动序列表示为第一活动集合,并将所述目标范例程序运行节点对应的范例应用服务程序活动序列表示为第二活动集合;
获取所述第一活动集合和所述第二活动集合之间的特征距离,并基于所述特征距离确定所述基础程序报告生成模型在所述目标范例程序运行节点处的训练误差参数。
依据本申请实施例的一个方面,提供了一种企业应用服务系统,所述企业应用服务系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现前述任意一种可能的实施方式中的面向企业应用服务的信息处理方法。
依据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述三方面的各种可选实现方式中提供的方法。
在本申请的一些实施例所提供的技术方案中,通过获取目标报告标签和程序运行节点,利用程序报告生成模型估计每个程序运行节点的应用服务程序活动序列,进而生成具有多个程序运行节点的目标企业应用服务程序报告,能够准确、全面地反映企业应用服务程序在运行过程中的函数调用、资源占用和代码执行路径等关键信息,为企业提供详尽的程序运行状况分析和优化建议。通过生成的目标企业应用服务程序报告,企业可以更加直观地了解程序在不同运行节点的行为特征,及时发现潜在的性能瓶颈和资源浪费问题,从而有针对性地进行程序优化和资源调配,提高企业应用服务的运行效率和稳定性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要启用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的基础上,还可以结合这些附图提取其它相关的附图。
图1为本申请实施例提供的面向企业应用服务的信息处理方法的流程示意图;
图2为本申请实施例提供的用于实现上述的面向企业应用服务的信息处理方法的企业应用服务系统的架构示意框图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施和结合本申请,并且该描述是在特定的应用场景及其要求的环境下提供的。对于本领域的普通技术人员来讲,显然可以对所公开的实施例作出各种改变,并且在不偏离本申请的原则和范围时,本申请中所定义的普遍原则可以适用于其它实施例和应用场景。因此,本申请并不限于所描述的实施例,而应该被给予与权利要求一致的最广泛的范围。
图1是本申请一种实施例提供的面向企业应用服务的信息处理方法的流程示意图,下面对该面向企业应用服务的信息处理方法进行详细介绍。
步骤S110,获取所需生成的企业应用服务程序报告的目标报告标签,并获取用于进行程序报告生成的K个程序运行节点。K为正整数。
详细地,所述企业应用服务程序报告是一种专门为企业级应用程序服务的报告,通常用于分析、监控和优化企业应用程序的性能、安全性、稳定性等方面。例如,假设一个大型企业使用了一个复杂的客户关系管理(CRM)系统,该系统由多个服务程序组成。为了了解这个CRM系统的性能瓶颈,企业可能需要生成一个关于该系统某个关键服务程序(如订单处理服务)的性能报告。
所述目标报告标签可以是用于标识和分类报告内容的关键词或短语。指明了报告的主题、重点或分析对象。例如,在上述CRM系统的例子中,目标报告标签可以是“订单处理服务性能分析报告”,这个标签明确了报告的重点是分析订单处理服务的性能。
所述程序运行节点指的是应用程序运行的具体环境或实例,可以是一台物理服务器、虚拟机、容器或云服务实例等。例如,假设企业的CRM系统部署在三个不同的数据中心,每个数据中心有多台服务器运行CRM系统的不同服务。在这种情况下,每一台运行CRM系统服务的服务器都可以被视为一个程序运行节点。
也即,基于以上说明,本实施例中,假设企业应用服务系统接收到一个请求,要求生成关于某个特定功能模块(如“订单处理模块”)的企业应用服务程序报告。企业应用服务系统首先确定这个目标报告标签为“订单处理模块性能分析报告”。接着,企业应用服务系统根据该功能模块的运行情况,选择了K个程序运行节点,这些程序运行节点可以是分布在不同的物理企业应用服务系统或虚拟机上的实例,用于收集和分析该功能模块在不同运行环境下的数据。
步骤S120,依据程序报告生成模型分别在每个程序运行节点估计所述目标报告标签关联的应用服务程序活动序列。任意一个程序运行节点对应的应用服务程序活动序列包括:所述任意一个程序运行节点对应的函数调用活动、资源占用活动或代码执行片段的执行路径活动。所述任意一个程序运行节点对应的资源占用活动表征所述任意一个程序运行节点上程序对系统资源的占用行为矢量,所述任意一个程序运行节点对应的代码执行片段用于表征所述任意一个程序运行节点与所述任意一个程序运行节点的下一程序运行节点间的代码执行片段,所述任意一个程序运行节点对应代码执行片段的执行路径活动表征所述任意一个程序运行节点对应代码执行片段的执行路径流动矢量。
详细地,所述程序报告生成模型是一个预先定义或训练好的模型,用于根据收集到的数据生成关于应用程序服务活动的报告,这个程序报告生成模型包含了数据处理、分析、聚合和可视化的逻辑。例如,假设企业使用了一种基于机器学习的程序性能分析模型,该模型能够根据程序运行时的各种指标(如CPU使用率、内存占用、函数调用次数等)来预测和评估程序的性能,这个模型就可以被视为一个程序报告生成模型。
所述函数调用活动指的是在程序运行过程中,各个函数被调用的情况,包括调用的函数名、调用次数、调用顺序、调用关系等。例如,在一个订单处理服务程序中,可以有多个函数被调用,如验证用户名和密码的函数、查询用户信息的函数、生成登录令牌的函数等,这些函数的调用情况(如哪个函数先被调用,哪个函数被调用了多少次等)就属于函数调用活动。
所述资源占用行为矢量是一个描述程序在运行过程中对系统资源(如CPU、内存、磁盘I/O等)占用行为的量化表示,可以是一个多维度的向量,每个维度代表一种资源的占用行为。例如,假设一个程序在运行过程中占用了10%的CPU资源、20%的内存资源和5%的磁盘I/O资源,那么这个程序的资源占用行为矢量就可以表示为[0.1, 0.2, 0.05]。
所述代码执行片段指的是程序中的一段连续执行的代码,可以是一个函数、一个循环、一个条件语句等。在程序运行过程中,不同的代码执行片段可以根据输入、状态或条件的不同而被执行或跳过。例如,在一个处理用户请求的程序中,可以有一个判断用户是否已登录的代码执行片段。如果用户已登录,则执行处理用户请求的代码;否则,执行引导用户登录的代码,这两个不同的执行路径就可以被视为两个不同的代码执行片段。
所述执行路径流动矢量是一个描述程序在运行过程中代码执行路径变化的量化表示,可以是一个指示不同代码执行片段之间跳转关系的向量或矩阵。例如,假设一个程序有三个可能的执行路径A、B和C,其中A可以跳转到B或C,B只能跳转到C,C是程序的结束点。那么,这个程序的执行路径流动矢量就可以表示为一个3x3的矩阵,其中矩阵的元素表示从一个执行路径跳转到另一个执行路径的概率或次数。
也即,在本实施例中,企业应用服务系统在每个选定的程序运行节点上部署了程序报告生成模型,这些程序报告生成模型开始工作,分别估计与“订单处理模块性能分析报告”标签相关联的应用服务程序活动序列,这些应用服务程序活动序列包括函数调用活动、资源占用活动和代码执行片段的执行路径活动。
示例性的,函数调用活动:程序报告生成模型分析订单处理模块在代码执行过程中调用了哪些函数,以及这些函数的调用顺序、参数和返回值等。
资源占用活动:程序报告生成模型监控订单处理模块在运行过程中对系统资源(如CPU、内存、磁盘I/O等)的占用行为,并生成相应的资源占用行为矢量。
代码执行片段的执行路径活动:程序报告生成模型追踪订单处理模块中特定代码片段的执行路径,记录代码的执行流程、分支条件和跳转点等,并生成执行路径流动矢量。
步骤S130,依据所述每个程序运行节点各自对应的应用服务程序活动序列生成所述目标报告标签下的目标企业应用服务程序报告。所述目标企业应用服务程序报告具有所述K个程序运行节点。
本实施例中,企业应用服务系统收集到每个程序运行节点上的模型生成的应用服务程序活动序列后,开始整合这些应用服务程序活动序列。首先提取每个节程序运行点的模拟特征矢量数据,这些模拟特征矢量数据反映了订单处理模块在不同程序运行节点上的运行特征。然后,企业应用服务系统对这些模拟特征矢量数据进行运行轨迹模拟,生成每个程序运行节点各自的模拟运行轨迹数据。最后,企业应用服务系统将K个程序运行节点的模拟运行轨迹数据融合在一起,生成了一份全面的“订单处理模块性能分析报告”,这份报告详细描述了订单处理模块在不同运行环境下的性能表现、资源占用行为和代码执行路径等信息,为企业的应用开发和维护提供了有价值的参考依据。
也即,所述目标企业应用服务程序报告是一个专为企业级应用程序服务定制的报告,其内容是基于对每个程序运行节点的应用服务程序活动序列的分析和整合得出的,这份目标企业应用服务程序报告的目的是提供关于企业应用程序性能、稳定性、安全性或其他关键方面的深入见解和建议,是为了满足特定的业务需求或解决特定的问题而生成的。例如,假设某企业的CRM系统近期出现了性能下降的问题,为了找出问题的原因和优化系统的性能,企业决定生成一份关于CRM系统订单处理服务的性能分析报告,这份报告就会详细分析订单处理服务在各个程序运行节点上的活动序列,包括函数调用、资源占用和代码执行路径等,从而帮助企业了解系统的性能瓶颈和优化方向,这份报告就是一个典型的目标企业应用服务程序报告。
基于以上步骤,通过获取目标报告标签和程序运行节点,利用程序报告生成模型估计每个程序运行节点的应用服务程序活动序列,进而生成具有多个程序运行节点的目标企业应用服务程序报告,能够准确、全面地反映企业应用服务程序在运行过程中的函数调用、资源占用和代码执行路径等关键信息,为企业提供详尽的程序运行状况分析和优化建议。通过生成的目标企业应用服务程序报告,企业可以更加直观地了解程序在不同运行节点的行为特征,及时发现潜在的性能瓶颈和资源浪费问题,从而有针对性地进行程序优化和资源调配,提高企业应用服务的运行效率和稳定性。
在一种可能的实施方式中,依据所述程序报告生成模型在所述任意一个程序运行节点估计所述目标报告标签关联的函数调用活动的步骤,包括:
步骤A110,依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用类型的第一置信度。
本实施例中,假设企业应用服务系统正在运行一个电商平台的订单处理服务。为了生成关于该订单处理服务的程序报告,企业应用服务系统首先利用程序报告生成模型来分析订单处理服务中的函数调用活动。该服务包含多种函数调用类型,如数据库查询函数、用户验证函数、订单状态更新函数等。
程序报告生成模型会根据历史数据和实时监控数据,针对每个函数调用类型估计一个第一置信度。例如,对于数据库查询函数,模型可以分析该函数在订单处理过程中的调用频率、响应时间等因素,然后给出一个高置信度的评估结果,表明这个函数在订单处理服务中扮演了关键角色。
进一步地,在企业应用服务系统运行的订单处理服务中,每次处理一个订单都可以触发一系列函数调用实例,这些函数调用实例是具体的函数调用执行过程,包括函数调用的输入参数、返回值和执行时间等信息。
步骤A120,依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用控制参数的第二置信度。
在订单处理服务中,每个函数调用都可能包含一些控制参数,这些参数会影响函数的执行方式和结果。例如,数据库查询函数可能需要指定查询条件、返回字段等参数。
程序报告生成模型会进一步分析这些函数调用控制参数,并为每个参数估计一个第二置信度,这个第二置信度反映了函数调用控制参数对函数调用结果的重要性。例如,如果某个查询条件参数经常导致数据库查询失败或性能下降,那么该参数的第二置信度可以比较低。
步骤A130,依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用实例的第三置信度。
程序报告生成模型会针对每个函数调用实例进行分析,并估计一个第三置信度,这个第三置信度反映了实例在整体函数调用活动中的代表性和重要性。例如,如果某个函数调用实例在处理大量订单时都表现出色,那么它的第三置信度可以比较高。
步骤A140,基于在所述任意一个程序运行节点估计的针对各个函数调用类型的第一置信度、针对各个函数调用控制参数的第二置信度及针对各个函数调用实例的第三置信度,确定所述任意一个程序运行节点对应的函数调用活动。
综合以上三个步骤的分析结果,企业应用服务系统可以得出一个关于订单处理服务中函数调用活动的全面视图,这个全面视图包括了每个函数调用类型的重要性(通过第一置信度体现)、每个函数调用控制参数的影响(通过第二置信度体现)以及每个函数调用实例的代表性(通过第三置信度体现)。
基于这个全面视图,企业应用服务系统可以生成一份详细的程序报告,报告中包含了订单处理服务中函数调用活动的各种统计信息、性能分析和优化建议等内容,可以帮助开发人员和管理人员更好地理解服务的运行状况,并作为优化和改进的依据。
在一种可能的实施方式中,步骤A140可以包括:
步骤A141,基于所述多个函数调用类型中对应第一置信度不小于第一门限值的函数调用类型生成函数调用类型提取序列。
本实施例中,电商平台的订单处理服务可以包含多种函数调用类型,如订单验证函数、库存检查函数、支付处理函数和订单状态更新函数等。企业应用服务系统使用程序报告生成模型来分析这些函数调用类型的重要性,从而为每个函数调用类型计算一个第一置信度,该第一置信度反映了该类型在订单处理流程中的关键性。企业应用服务系统设定了一个第一门限值,只有那些第一置信度不低于这个第一门限值的函数调用类型才会被选中,形成一个函数调用类型提取序列。例如,如果订单验证函数和支付处理函数的第一置信度都高于门限值,它们就会被加入到函数调用类型提取序列中。
步骤A142,基于所述多个函数调用控制参数中对应第二置信度不小于第二门限值的函数调用控制参数生成函数调用控制参数提取序列。
在订单处理服务中,订单验证函数可能需要验证订单的金额、用户身份等参数,而支付处理函数可能需要支付方式、支付金额等参数,这些参数都是函数调用控制参数,会影响函数的执行结果。
程序报告生成模型会为这些订单验证函数调用控制参数计算第二置信度,以评估它们对函数调用结果的影响程度。企业应用服务系统设定了一个第二门限值,只有那些第二置信度不低于这个门限值的参数才会被选中,形成一个函数调用控制参数提取序列。例如,订单金额和用户身份由于对于订单验证至关重要,它们的第二置信度可以很高,因此被选入提取序列。
步骤A143,基于所述多个函数调用实例中对应第三置信度不小于第三门限值的函数调用实例生成函数调用实例提取序列。
每次订单处理都会生成一系列具体的函数调用实例,记录了函数调用的具体参数、返回值和执行时间等信息。程序报告生成模型会为这些实例计算第三置信度,以评估它们在整体订单处理流程中的代表性和重要性。
企业应用服务系统设定了一个第三门限值,只有那些第三置信度不低于这个第三门限值的函数调用实例才会被选中,形成一个函数调用实例提取序列。例如,某个成功处理了高额订单的函数调用实例,由于其重要性和代表性较高,可以被选入该序列。
步骤A144,分别对所述函数调用类型提取序列、所述函数调用控制参数提取序列和所述函数调用实例提取序列进行采样,并基于采样获得的函数调用类型、函数调用控制参数和函数调用实例,确定所述任意一个程序运行节点对应的函数调用活动。
现在,企业应用服务系统拥有了三个提取序列:函数调用类型提取序列(如订单验证函数、支付处理函数),函数调用控制参数提取序列(如订单金额、用户身份),和函数调用实例提取序列(如成功处理高额订单的实例)。
为了生成关于订单处理服务的程序报告,企业应用服务系统需要对这些序列进行采样。采样可以基于不同的策略,如随机采样或基于权重的采样。根据采样结果,企业应用服务系统选择一部分函数调用类型、控制参数和实例来代表整体的函数调用活动,并将这些信息整合到程序报告中。
在一种可能的实施方式中,所述任意一个程序运行节点对应代码执行片段的执行路径活动包含所述任意一个程序运行节点对应代码执行片段的执行路径节点。依据所述程序报告生成模型在所述任意一个程序运行节点估计代码执行片段的执行路径活动的步骤,包括:
步骤B110,依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个执行路径节点的第四置信度。
本实施例中,电商平台的订单处理服务代码包含多个执行路径,每个执行路径代表了一种可能的代码执行流程。例如,当用户提交订单时,代码可以根据订单的金额、库存状态等因素选择不同的执行路径。
为了生成关于这段代码执行路径活动的程序报告,企业应用服务系统使用程序报告生成模型来分析这些执行路径节点。模型会为每个执行路径节点计算一个第四置信度,该第三置信度反映了该执行路径节点在代码执行过程中的重要性和可能性。
例如,在某个执行路径中,有一个执行路径节点负责检查订单的金额是否超过了用户的信用额度。如果这个执行路径节点的第四置信度很高,说明在订单处理过程中,对用户信用额度的检查是一个非常重要的步骤,且这个步骤被频繁执行。
步骤B120,基于所述多个执行路径节点中对应第四置信度不小于第四门限值的执行路径节点生成执行路径节点提取序列。
本实施例中,企业应用服务系统设定了一个第三门限值,用于筛选重要的执行路径节点。只有那些第四置信度不低于这个第四门限值的节点才会被选中,形成一个执行路径节点提取序列。
以订单处理服务为例,假设有两个执行路径节点A和B。执行路径节点A负责检查订单金额是否超过用户信用额度,而执行路径节点B负责更新订单状态。如果执行路径节点A的第四置信度高于门限值,而执行路径节点B的置信度低于门限值,那么只有执行路径节点A会被选入执行路径节点提取序列。
步骤B130,对所述执行路径节点提取序列进行采样,基于采样生成的执行路径节点确定所述任意一个程序运行节点对应代码执行片段的执行路径活动。
现在,企业应用服务系统拥有了一个执行路径节点提取序列,其中包含了多个重要的执行路径节点。为了生成程序报告,企业应用服务系统需要对这个执行路径节点提取序列进行采样。
采样过程可以基于不同的策略进行,如随机采样、基于权重的采样等。企业应用服务系统根据采样结果选择一部分执行路径节点来代表整体的执行路径活动,这些被选中的节点将被用于构建程序报告中的执行路径活动部分。
例如,在订单处理服务的执行路径节点提取序列中,如果节点A(检查订单金额是否超过用户信用额度)和节点C(发送订单确认邮件给用户)被选中,那么程序报告中将会包含这两个节点在执行路径活动中的信息。
在一种可能的实施方式中,所述任意一个程序运行节点对应的资源占用活动包含所述任意一个程序运行节点上程序关联的系统资源类型活动。
依据所述程序报告生成模型估计所述任意一个程序运行节点对应的资源占用活动的步骤,包括:
步骤C110,依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个系统资源占用行为的第五置信度。
步骤C120,基于所述多个系统资源占用行为中对应第五置信度不小于第五门限值的系统资源占用行为生成系统资源占用行为提取序列。
步骤C130,对所述系统资源占用行为提取序列进行采样,基于采样生成的系统资源占用行为确定所述任意一个程序运行节点对应的资源占用活动。
本实施例中,电商平台的订单处理服务在运行时会占用多种系统资源,如CPU、内存、磁盘I/O和网络带宽等。为了生成关于该程序运行节点的资源占用活动报告,企业应用服务系统使用程序报告生成模型来分析这些系统资源占用行为。
程序报告生成模型会为每个系统资源占用行为计算一个第五置信度,该置信度反映了该行为在资源占用活动中的重要性和频繁程度。例如,如果订单处理服务在高峰时段频繁地进行磁盘I/O操作以读取和写入订单数据,那么磁盘I/O占用行为的第五置信度可以很高。
其中,企业应用服务系统设定了一个第五门限值,用于筛选重要的系统资源占用行为。只有那些第五置信度不低于这个第五门限值的资源占用行为才会被选中,形成一个系统资源占用行为提取序列。
以订单处理服务为例,假设有三个系统资源占用行为:CPU占用、内存占用和磁盘I/O占用。如果CPU占用的第五置信度低于第五门限值,而内存占用和磁盘I/O占用的置信度高于第五门限值,那么只有内存占用和磁盘I/O占用会被选入系统资源占用行为提取序列。
现在,企业应用服务系统拥有了一个系统资源占用行为提取序列,其中包含了多个重要的系统资源占用行为。为了生成资源占用活动报告,企业应用服务系统需要对这个序列进行采样。
采样过程可以基于不同的策略进行,如随机采样、基于时间段的采样等。企业应用服务系统根据采样结果选择一部分系统资源占用行为来代表整体的资源占用活动,这些被选中的行为将被用于构建程序报告中的资源占用活动部分。
例如,在系统资源占用行为提取序列中,如果内存占用和磁盘I/O占用被选中,那么程序报告中将会包含这两个行为在资源占用活动中的信息,如占用率、占用时长等。
在一种可能的实施方式中,所述任意一个程序运行节点对应的资源占用活动包含所述任意一个程序运行节点上程序关联的系统资源类型组合活动。依据所述程序报告生成模型估计所述任意一个程序运行节点对应的资源占用活动的步骤,包括:
步骤D110,依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个系统资源组合占用行为的第六置信度。
步骤D120,基于所述多个系统资源组合占用行为中对应第六置信度不小于第六门限值的系统资源组合占用行为生成系统资源组合占用行为提取序列。
步骤D130,对所述系统资源组合占用行为提取序列进行采样,基于采样生成的系统资源组合占用行为确定所述任意一个程序运行节点对应的资源占用活动。
本实施例中,在处理订单时,电商平台的订单处理服务服务通常会同时占用多种系统资源,如CPU、内存、网络带宽和磁盘I/O,形成不同的系统资源组合占用行为。为了更全面地了解资源占用情况,企业应用服务系统F使用程序报告生成模型来分析这些组合行为。
程序报告生成模型会考虑不同资源之间的相互作用和依赖关系,为每个系统资源组合占用行为计算一个第六置信度,这个第六置信度反映了该组合行为在资源占用活动中的重要性、频繁程度以及可能对系统性能的影响。例如,当订单处理服务在高负载情况下同时占用大量CPU和内存资源时,这种组合行为的第六置信度可以很高。
企业应用服务系统F设定了一个第六门限值,用于筛选出那些重要且显著的系统资源组合占用行为。只有第六置信度不低于这个第六门限值的组合行为才会被选中,并形成一个系统资源组合占用行为提取序列。
以订单处理服务为例,假设存在以下几种系统资源组合占用行为:CPU+内存、CPU+网络带宽、内存+磁盘I/O。如果CPU+内存的组合占用行为第六置信度高于第六门限值,而其他组合低于第六门限值,那么只有CPU+内存的组合会被选入提取序列。
现在,企业应用服务系统F拥有了一个系统资源组合占用行为提取序列,其中包含了多个重要的系统资源组合占用行为。为了生成更具代表性的资源占用活动报告,企业应用服务系统F需要对这个序列进行采样。
采样过程可以根据实际情况选择不同的策略,如基于时间窗口的采样、基于权重的采样等。企业应用服务系统F根据采样结果选择一部分系统资源组合占用行为来代表整体的资源占用活动,这些被选中的组合行为将被用于构建程序报告中的资源占用活动部分。
例如,在系统资源组合占用行为提取序列中,如果CPU+内存的组合占用行为被选中,那么程序报告中将会包含这个组合在资源占用活动中的详细信息,如占用率、占用时长、对系统性能的影响等。
在一种可能的实施方式中,步骤S130包括:
步骤S131,依据所述每个程序运行节点对应的应用服务程序活动序列进行模拟特征矢量提取,生成所述每个程序运行节点对应的模拟特征矢量数据。
本实施例中,这些应用服务程序活动序列记录了每个程序运行节点在执行过程中的各种活动和事件,如函数调用、资源占用、执行路径等。企业应用服务系统使用特征提取算法从这些应用服务程序活动序列中提取出关键信息,形成模拟特征矢量数据,这些模拟特征矢量数据以向量的形式表示了每个程序运行节点的活动特征,便于后续的分析和处理。
步骤S132,对所述每个程序运行节点对应的模拟特征矢量数据进行运行轨迹模拟,生成所述每个程序运行节点各自对应的模拟运行轨迹数据。
企业应用服务系统拥有了每个程序运行节点的模拟特征矢量数据后,接下来进行运行轨迹模拟,这个过程旨在根据提取的特征数据重建每个程序运行节点的执行过程,以了解它们在实际运行中的行为和性能。
运行轨迹模拟可以采用不同的方法和技术,如基于时间序列的分析、机器学习模型预测等。企业应用服务系统根据模拟特征矢量数据中的信息,模拟每个节点在处理请求、调用函数、占用资源等方面的行为,并生成模拟运行轨迹数据,这些模拟运行轨迹数据以时间序列的形式记录了每个节点的模拟执行过程。
步骤S133,对所述K个程序运行节点对应的模拟运行轨迹数据进行融合,生成所述目标企业应用服务程序报告。
最后,企业应用服务系统需要将所有程序运行节点的模拟运行轨迹数据融合起来,生成一份完整的目标企业应用服务程序报告,这份目标企业应用服务程序报告旨在提供关于整个应用服务程序在运行过程中的全面信息和洞察。
数据融合可以采用不同的策略和方法,如加权平均、时间序列对齐等。企业应用服务系统根据每个程序运行节点的模拟运行轨迹数据以及它们之间的关联关系,将这些数据融合成一个统一的数据集。然后,对这个数据集进行进一步的分析和处理,提取出关键指标、性能瓶颈、异常事件等信息,并生成相应的报告。
以电商平台为例,企业应用服务系统会将处理用户登录请求的程序运行节点的模拟运行轨迹数据与其他节点的数据进行融合,分析整个电商平台在处理用户请求、管理商品信息、处理订单等方面的性能和行为,并生成一份包含关键指标和性能分析的报告,这份报告可以帮助企业了解电商平台的整体性能和运营情况,为优化和改进提供有价值的依据。
在一种可能的实施方式中,步骤S131可以包括:
步骤S1311,获取企业应用服务程序的不同外部数据源,所述外部数据源包括系统日志数据、性能监控数据、用户反馈数据,并将不同外部数据源之间的时间戳对齐后,与对应的程序运行节点的应用服务程序活动序列的数据进行关联,获得目标应用服务程序活动数据。
本实施例中,企业应用服务系统可以额外从多个外部数据源收集信息,这些外部数据源包括系统日志数据(记录系统事件和错误)、性能监控数据(如CPU使用率、内存占用等)和用户反馈数据(如用户投诉、满意度调查等)。
企业应用服务系统首先从这些外部数据源中获取原始数据,并确保这些原始数据的时间戳是对齐的。时间戳对齐是为了确保不同数据源中的事件可以在时间上进行准确关联。然后,企业应用服务系统将这些外部数据源与程序运行节点的应用服务程序活动序列数据进行关联,这样,企业应用服务系统就可以获得一个完整且时间同步的目标应用服务程序活动数据集。
步骤S1312,对所述目标应用服务程序活动数据中的函数调用活动进行解析,构建对应的动态调用链,所述动态调用链包括跨线程和跨进程的调用关系。
本实施例中,在目标应用服务程序活动数据中,函数调用活动是一个重要组成部分。企业应用服务系统会对这些函数调用活动进行解析,以了解它们之间的调用关系,这包括跨线程和跨进程的调用,因为电商订单服务可能同时处理多个用户的请求,每个请求都可能在不同的线程或进程中执行。
通过解析函数调用活动,企业应用服务系统可以构建一个动态调用链,这个动态调用链展示了函数之间的执行顺序和依赖关系,有助于开发人员理解程序的执行流程。
步骤S1313,利用预先定义的模式识别网络分析所述目标应用服务程序活动数据中的资源占用活动的时序模式,识别出资源占用时序序列中不同的资源占用模式,所述资源占用模式包括周期性占用模式和突发性占用模式中的至少一种。
本实施例中,资源占用活动是程序运行过程中的另一个关键方面。企业应用服务系统使用预先定义的模式识别网络来分析这些资源占用活动的时序模式,这个模式识别网络可以识别出周期性占用模式(如定期执行的数据库查询)和突发性占用模式(如突然增加的用户请求导致的CPU占用率上升)。
通过识别这些时序模式,企业应用服务系统可以更好地理解程序的资源需求和行为特征,从而为优化资源分配提供依据。
步骤S1314,结合控制流图CFG和动态执行信息,分析所述目标应用服务程序活动数据中的代码执行片段的实际执行路径数据,所述实际执行路径数据包括条件分支的实际走向路径数据。
本实施例中,控制流图CFG是表示程序执行流程的一种图形化表示方法。企业应用服务系统结合CFG和动态执行信息来分析目标应用服务程序活动数据中的代码执行片段,可以帮助企业应用服务系统了解在实际运行过程中哪些代码路径被执行了,以及这些路径的执行频率和性能特征。
这种分析对于发现性能瓶颈和优化代码执行路径至关重要。例如,如果某个代码路径经常被执行且性能不佳,开发人员可以优先考虑对其进行优化。
步骤S1315,对所述动态调用链和实际执行路径数据进行图嵌入处理,提取图嵌入低维向量表示作为图表示特征,并使用循环神经网络对所述资源占用时序序列进行编码生成对应的时序依赖关系特征。
为了进一步处理和分析动态调用链和实际执行路径数据,企业应用服务系统使用图嵌入技术将这些数据结构转换为低维向量表示,这种表示方法可以在保留原始数据结构信息的同时降低数据的复杂性。
同时,企业应用服务系统还使用循环神经网络(RNN)对资源占用时序序列进行编码。RNN可以捕捉序列数据中的时序依赖关系,并生成对应的特征表示,这些特征表示可以进一步用于分析和预测程序的资源占用行为。
步骤S1316,对所述目标应用服务程序活动数据中的函数调用关系和资源占用关系构建对应的社区结构网络特征。
在程序运行过程中,函数调用和资源占用之间往往存在复杂的关联关系。为了捕捉这些关系,企业应用服务系统构建了一个社区结构网络来表示函数调用和资源占用之间的关联。在这个社区结构网络中,相似的函数调用和资源占用被组织在同一个社区内。
通过分析这个社区结构网络的特征,企业应用服务系统可以了解函数调用和资源占用之间的紧密程度和相互影响,这对于理解程序的整体结构和行为模式非常有帮助。
步骤S1317,对所述图表示特征、所述时序依赖关系特征和所述社区结构网络特征进行交叉组合,生成对应的复合交互作用特征数据。
为了更全面地描述程序的行为特征,企业应用服务系统将前面提取的图表示特征、时序依赖关系特征和社区结构网络特征进行交叉组合,这种交叉组合可以生成复合交互作用特征数据,反映了不同特征之间的相互作用和影响,这种复合特征数据为后续的分析和预测提供了更丰富的信息来源。例如,它可以帮助开发人员发现那些单独考虑时难以察觉的性能问题或潜在风险。
步骤S1318,基于互信息的特征选择从所述复合交互作用特征数据中筛选出与所述目标报告标签关联的特征数据子集后,使用主成分分析对所述特征数据子集进行降维处理,生成所述模拟特征矢量数据,并将生成的模拟特征矢量数据存储在数据结构中,建立索引以便检索查询。
在生成复合交互作用特征数据后,企业应用服务系统使用基于互信息的特征选择方法来筛选出与目标报告标签(如性能瓶颈、异常检测等)关联的特征数据子集。互信息是一种衡量两个变量之间相关性的统计量,它可以帮助企业应用服务系统识别出那些对目标报告标签预测最有用的特征。
接下来,企业应用服务系统使用主成分分析(PCA)对筛选出的特征数据子集进行降维处理。PCA可以将高维数据转换为低维表示,同时保留数据中的主要变化模式,这样生成的模拟特征矢量数据既减少了冗余信息又保留了关键特征。
最后,企业应用服务系统将生成的模拟特征矢量数据存储在合适的数据结构中(如数组、矩阵等),并建立索引以便后续检索和查询,这些模拟特征矢量数据将作为输入用于生成目标企业应用服务程序报告。
在一种可能的实施方式中,步骤S132可以包括:
步骤S1321,为每个所述程序运行节点的模拟特征矢量数据定义初始状态,所述初始状态包括程序运行节点的起始点、资源占用初始值、函数调用起始栈。
本实施例中,假设企业应用服务系统是处理一个在线订单系统的模拟特征矢量数据。对于每个程序运行节点,企业应用服务系统首先定义其初始状态,这个初始状态包括程序运行节点的起始点(如订单流程的起始步骤)、资源占用初始值(如初始内存占用、CPU使用率等)以及函数调用起始栈(记录订单流程开始时调用的函数序列)。
这些初始状态信息为后续的运行轨迹模拟提供了基础。
步骤S1322,配置模拟过程中的模拟参数,所述模拟参数包括时间步长、模拟时长、随机种子。
在进行运行轨迹模拟之前,企业应用服务系统需要配置一些模拟参数,这些模拟参数包括时间步长(每个模拟周期的时间长度)、模拟时长(整个模拟过程的总时间)和随机种子(用于初始化随机数生成器,以确保模拟的可重复性)。
例如,企业应用服务系统可以设置时间步长为10毫秒,模拟时长为1分钟,并选择一个特定的随机种子。
步骤S1323,根据程序运行节点的节点特征选择关联的动态模型,所述动态模型包括隐马尔可夫模型、动态贝叶斯网络、循环神经网络。
不同的程序运行节点可能具有不同的行为特征。为了更准确地模拟这些节点的运行轨迹,企业应用服务系统会根据程序运行节点的特征选择合适的动态模型,这些动态模型可以是隐马尔可夫模型(HMM)、动态贝叶斯网络(DBN)或循环神经网络(RNN)等。
例如,对于处理用户订单请求的节点,由于其行为具有较强的时序依赖性,企业应用服务系统可以选择使用RNN来模拟其运行轨迹。
步骤S1324,按照设定的模拟参数执行模拟过程,在每个模拟周期内根据当前状态和所述动态模型预测下一个状态,并在模拟过程中引入随机因素,以模拟真实环境中的不确定性,所述随机因素包括系统噪声因素和外部干扰因素。
根据配置的模拟参数和选择的动态模型,企业应用服务系统开始执行模拟过程。在每个模拟周期内,根据当前状态和动态模型预测下一个状态。为了模拟真实环境中的不确定性,企业应用服务系统还会在模拟过程中引入一些随机因素,如系统噪声因素(模拟硬件故障、网络延迟等)和外部干扰因素(模拟突发的用户请求峰值、外部攻击等),这些随机因素的引入使得模拟结果更加接近实际情况。
步骤S1325,根据状态预测结果更新程序运行节点的状态,并记录每个模拟周期的状态信息,形成初始模拟运行轨迹数据,并对生成的初始模拟运行轨迹数据进行平滑处理后,从平滑后的初始模拟运行轨迹数据中标注关键特征,生成所述模拟运行轨迹数据,所述关键特征包括趋势特征、周期性特征、突变点特征。
在每个模拟周期结束后,企业应用服务系统会根据状态预测结果更新程序运行节点的状态,并记录该周期的状态信息(如资源占用情况、函数调用栈变化等)。随着时间的推移,这些状态信息逐渐形成了初始模拟运行轨迹数据。
然而,由于随机因素的引入和模拟过程的复杂性,初始模拟运行轨迹数据可能存在一定的噪声和波动。为了提取更有意义的信息,企业应用服务系统会对这些数据进行平滑处理(如使用移动平均或滤波算法)。平滑处理后的数据更加清晰地反映了程序运行节点的行为趋势。
最后,企业应用服务系统会从平滑后的初始模拟运行轨迹数据中标注关键特征,这些关键特征包括趋势特征(如资源占用的上升趋势)、周期性特征(如定期出现的性能峰值)和突变点特征(如突然增加的错误率或响应时间延长),这些标注的关键特征构成了最终的模拟运行轨迹数据,为后续的报告生成提供了重要依据。
在一种可能的实施方式中,所述方法还包括:
步骤S101,获取范例报告标签下的范例企业应用服务程序报告,并获取用于进行程序报告生成的K个范例程序运行节点。所述范例企业应用服务程序报告在每个范例程序运行节点均具有对应的标注应用服务程序活动序列,所述每个范例程序运行节点对应的标注应用服务程序活动序列是对所述范例企业应用服务程序报告进行活动检测获得。
步骤S102,依据基础程序报告生成模型分别在每个范例程序运行节点估计所述范例报告标签关联的范例应用服务程序活动序列。任意一个范例程序运行节点对应的范例应用服务程序活动序列包括:所述任意一个范例程序运行节点对应的函数调用活动、资源占用活动或代码执行片段的执行路径活动。所述任意一个范例程序运行节点对应的资源占用活动表征所述任意一个范例程序运行节点上程序对系统资源的占用行为矢量,所述任意一个范例程序运行节点对应的代码执行片段用于表征所述任意一个范例程序运行节点与所述任意一个范例程序运行节点的下一程序运行节点间的代码执行片段,所述任意一个范例程序运行节点对应代码执行片段的执行路径活动表征所述任意一个范例程序运行节点对应代码执行片段的执行路径流动矢量。
步骤S103,依据所述每个范例程序运行节点各自对应的标注应用服务程序活动序列和范例应用服务程序活动序列,分别确定所述基础程序报告生成模型在所述每个范例程序运行节点处的训练误差参数。
步骤S104,依据所述每个范例程序运行节点对应的训练误差参数更新所述基础程序报告生成模型的模型参数信息,并将模型参数信息更新后的基础程序报告生成模型输出为所述程序报告生成模型。
本实施例中,企业应用服务系统首先采集带有范例报告标签的范例企业应用服务程序报告,这个范例企业应用服务程序报告是为了训练和优化程序报告生成模型而准备的。接下来,企业应用服务系统从该范例企业应用服务程序报告中识别并提取了K个范例程序运行节点,这些范例程序运行节点是范例企业应用服务程序报告中关键的部分,每个范例程序节点都代表了程序在运行过程中的一个重要阶段或活动。
企业应用服务系统已经拥有了一个基础程序报告生成模型,这个基础程序报告生成模型能够根据程序运行节点的信息估计出应用服务程序的活动序列。对于每个范例程序运行节点,企业应用服务系统都使用这个基础程序报告生成模型来估计其对应的范例应用服务程序活动序列,这些范例应用服务程序活动序列包括了函数调用活动、资源占用活动和代码执行片段的执行路径活动等。例如,在某个范例程序运行节点上,可能估计出了一系列函数调用活动,这些函数调用活动反映了该范例程序运行节点上程序对系统函数的调用情况。
在估计出范例应用服务程序活动序列后,企业应用服务系统将这些估计结果与对应的标注应用服务程序活动序列进行比较。标注应用服务程序活动序列是事先由专家进行标注的真实活动序列,它们被视为标准答案。通过比较估计应用服务程序活动序列和标注应用服务程序活动序列之间的差异,企业应用服务系统能够计算出基础程序报告生成模型在每个范例程序运行节点处的训练误差参数,这些误差参数反映了模型在估计活动序列时的准确性和性能。
在获得训练误差参数后,企业应用服务系统开始对这些训练误差参数进行分析和处理,例如使用梯度下降算法来根据误差参数调整基础程序报告生成模型的模型参数信息,这个过程是一个迭代的过程,企业应用服务系统会不断地调整模型参数,直到模型的性能达到一个满意的水平或迭代次数达到预设的上限。最终,企业应用服务系统将模型参数信息更新后的基础程序报告生成模型输出为程序报告生成模型,这个输出的模型已经经过了优化和改进,能够更准确地生成企业应用服务程序报告。
在一种可能的实施方式中,所述K个范例程序运行节点中任意一个表示为目标范例程序运行节点。
步骤S103可以包括:
步骤S1031,将所述目标范例程序运行节点对应的标注应用服务程序活动序列表示为第一活动集合,并将所述目标范例程序运行节点对应的范例应用服务程序活动序列表示为第二活动集合。
步骤S1032,获取所述第一活动集合和所述第二活动集合之间的特征距离,并基于所述特征距离确定所述基础程序报告生成模型在所述目标范例程序运行节点处的训练误差参数。
企业应用服务系统在处理范例企业应用服务程序报告时,从K个范例程序运行节点中选择一个作为目标范例程序运行节点,这个选择可以是随机的,也可以是基于某种特定策略,比如选择误差最大的节点作为优化重点。假设企业应用服务系统选择了节点N作为目标范例程序运行节点,节点N代表了程序在运行过程中的一个关键阶段。
企业应用服务系统接下来获取目标范例程序运行节点N对应的标注应用服务程序活动序列和范例应用服务程序活动序列。标注应用服务程序活动序列是由专家事先进行标注的真实活动序列,反映了节点N上程序的实际运行情况,这个序列被表示为第一活动集合。范例应用服务程序活动序列则是通过基础程序报告生成模型估计得到的活动序列,这个序列被表示为第二活动集合。
企业应用服务系统使用一种特征提取方法从第一活动集合和第二活动集合中提取出关键特征,并计算这两个集合之间的特征距离。特征距离是一个量化指标,用于衡量两个活动序列之间的相似性或差异性。特征距离的计算可以采用多种方法,如欧氏距离、余弦相似度等。在这个场景中,企业应用服务系统选择了合适的特征距离计算方法,并计算出了第一活动集合和第二活动集合之间的特征距离。
基于计算出的特征距离,企业应用服务系统确定了基础程序报告生成模型在目标范例程序运行节点N处的训练误差参数。训练误差参数反映了模型在估计活动序列时的准确性和性能。如果特征距离较大,说明估计的活动序列与真实的活动序列存在较大差异,模型的性能有待提高。企业应用服务系统可以将这个训练误差参数用于后续的模型优化和改进过程中。通过不断地调整模型参数和减小训练误差,企业应用服务系统可以逐步提高程序报告生成模型的准确性和性能。
图2示出了本申请实施例提供的用于实现上述的面向企业应用服务的信息处理方法的企业应用服务系统100的硬件结构意图,如图2所示,企业应用服务系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
一种可替代的实施例中,企业应用服务系统100可以是单个服务器,也可以是服务器组。所述服务器组可以是集中式的,也可以是分布式的(例如,企业应用服务系统100可以是分布式的系统)。一种可替代的实施例中,企业应用服务系统100可以是本地的,也可以是远程的。例如,企业应用服务系统100可以经由网络访问存储于机器可读存储介质120中的信息和/或数据。又例如,企业应用服务系统100可以直接连接到机器可读存储介质120以访问存储的信息和/或数据。一种可替代的实施例中,企业应用服务系统100可以在云平台上实施。仅作为示例,该云平台可以包括私有云、公共云、聚合云、社区云、分布云、内部云、多层云等或其任意集成。
机器可读存储介质120可以储存数据和/或指令。一种可替代的实施例中,机器可读存储介质120可以存储从外部终端获取的数据。一种可替代的实施例中,机器可读存储介质120可以储存企业应用服务系统100用来执行或使用来完成本申请中描述的示例性方法的数据及/或指令。一种可替代的实施例中,机器可读存储介质120可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器等或其任意集成。示例性的大容量存储器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。
在具体实现过程中,多个处理器110执行机器可读存储介质120存储的计算机可执行指令,使得处理器110可以执行如上方法实施例的面向企业应用服务的信息处理方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于描述通信单元140的收发动作。
处理器110的具体实现过程可参见上述企业应用服务系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本申请实施例还提供一种可读存储介质,所述可读存储介质中预置有计算机可执行指令,当处理器进行所述计算机可执行指令时,实现如上面向企业应用服务的信息处理方法。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本申请实施例的描述中,有时会将多个特征归并至一个实施例、附图或对其的描述中。

Claims (8)

1.一种面向企业应用服务的信息处理方法,其特征在于,所述方法包括:
获取所需生成的企业应用服务程序报告的目标报告标签,并获取用于进行程序报告生成的K个程序运行节点;K为正整数;
依据程序报告生成模型分别在每个程序运行节点估计所述目标报告标签关联的应用服务程序活动序列;任意一个程序运行节点对应的应用服务程序活动序列包括:所述任意一个程序运行节点对应的函数调用活动、资源占用活动或代码执行片段的执行路径活动;所述任意一个程序运行节点对应的资源占用活动表征所述任意一个程序运行节点上程序对系统资源的占用行为矢量,所述任意一个程序运行节点对应的代码执行片段用于表征所述任意一个程序运行节点与所述任意一个程序运行节点的下一程序运行节点间的代码执行片段,所述任意一个程序运行节点对应代码执行片段的执行路径活动表征所述任意一个程序运行节点对应代码执行片段的执行路径流动矢量;
依据所述每个程序运行节点各自对应的应用服务程序活动序列生成所述目标报告标签下的目标企业应用服务程序报告;所述目标企业应用服务程序报告具有所述K个程序运行节点;
所述依据所述每个程序运行节点各自对应的应用服务程序活动序列生成所述目标报告标签下的目标企业应用服务程序报告,包括:
依据所述每个程序运行节点对应的应用服务程序活动序列进行模拟特征矢量提取,生成所述每个程序运行节点对应的模拟特征矢量数据;
对所述每个程序运行节点对应的模拟特征矢量数据进行运行轨迹模拟,生成所述每个程序运行节点各自对应的模拟运行轨迹数据;
对所述K个程序运行节点对应的模拟运行轨迹数据进行融合,生成所述目标企业应用服务程序报告;
所述依据所述每个程序运行节点对应的应用服务程序活动序列进行模拟特征矢量提取,生成所述每个程序运行节点对应的模拟特征矢量数据的步骤,包括:
获取企业应用服务程序的不同外部数据源,所述外部数据源包括系统日志数据、性能监控数据、用户反馈数据,并将不同外部数据源之间的时间戳对齐后,与对应的程序运行节点的应用服务程序活动序列的数据进行关联,获得目标应用服务程序活动数据;
对所述目标应用服务程序活动数据中的函数调用活动进行解析,构建对应的动态调用链,所述动态调用链包括跨线程和跨进程的调用关系;
利用预先定义的模式识别网络分析所述目标应用服务程序活动数据中的资源占用活动的时序模式,识别出资源占用时序序列中不同的资源占用模式,所述资源占用模式包括周期性占用模式和突发性占用模式中的至少一种;
结合控制流图和动态执行信息,分析所述目标应用服务程序活动数据中的代码执行片段的实际执行路径数据,所述实际执行路径数据包括条件分支的实际走向路径数据;
对所述动态调用链和实际执行路径数据进行图嵌入处理,提取图嵌入低维向量表示作为图表示特征,并使用循环神经网络对所述资源占用时序序列进行编码生成对应的时序依赖关系特征;
对所述目标应用服务程序活动数据中的函数调用关系和资源占用关系构建对应的社区结构网络特征;
对所述图表示特征、所述时序依赖关系特征和所述社区结构网络特征进行交叉组合,生成对应的复合交互作用特征数据;
基于互信息的特征选择从所述复合交互作用特征数据中筛选出与所述目标报告标签关联的特征数据子集后,使用主成分分析对所述特征数据子集进行降维处理,生成所述模拟特征矢量数据,并将生成的模拟特征矢量数据存储在数据结构中,建立索引以便检索查询;
所述对所述每个程序运行节点对应的模拟特征矢量数据进行运行轨迹模拟,生成所述每个程序运行节点各自对应的模拟运行轨迹数据的步骤,包括:
为每个所述程序运行节点的模拟特征矢量数据定义初始状态,所述初始状态包括程序运行节点的起始点、资源占用初始值、函数调用起始栈;
配置模拟过程中的模拟参数,所述模拟参数包括时间步长、模拟时长、随机种子;
根据程序运行节点的节点特征选择关联的动态模型,所述动态模型包括隐马尔可夫模型、动态贝叶斯网络、循环神经网络;
按照设定的模拟参数执行模拟过程,在每个模拟周期内根据当前状态和所述动态模型预测下一个状态,并在模拟过程中引入随机因素,以模拟真实环境中的不确定性,所述随机因素包括系统噪声因素和外部干扰因素;
根据状态预测结果更新程序运行节点的状态,并记录每个模拟周期的状态信息,形成初始模拟运行轨迹数据,并对生成的初始模拟运行轨迹数据进行平滑处理后,从平滑后的初始模拟运行轨迹数据中标注关键特征,生成所述模拟运行轨迹数据,所述关键特征包括趋势特征、周期性特征、突变点特征。
2.根据权利要求1所述的面向企业应用服务的信息处理方法,其特征在于,依据所述程序报告生成模型在所述任意一个程序运行节点估计所述目标报告标签关联的函数调用活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用类型的第一置信度;
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用控制参数的第二置信度;
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个函数调用实例的第三置信度;
基于在所述任意一个程序运行节点估计的针对各个函数调用类型的第一置信度、针对各个函数调用控制参数的第二置信度及针对各个函数调用实例的第三置信度,确定所述任意一个程序运行节点对应的函数调用活动。
3.根据权利要求2所述的面向企业应用服务的信息处理方法,其特征在于,所述基于在所述任意一个程序运行节点估计的针对各个函数调用类型的第一置信度、针对各个函数调用控制参数的第二置信度及针对各个函数调用实例的第三置信度,确定所述任意一个程序运行节点对应的函数调用活动,包括:
基于所述多个函数调用类型中对应第一置信度不小于第一门限值的函数调用类型生成函数调用类型提取序列;
基于所述多个函数调用控制参数中对应第二置信度不小于第二门限值的函数调用控制参数生成函数调用控制参数提取序列;
基于所述多个函数调用实例中对应第三置信度不小于第三门限值的函数调用实例生成函数调用实例提取序列;
分别对所述函数调用类型提取序列、所述函数调用控制参数提取序列和所述函数调用实例提取序列进行采样,并基于采样获得的函数调用类型、函数调用控制参数和函数调用实例,确定所述任意一个程序运行节点对应的函数调用活动。
4.根据权利要求1所述的面向企业应用服务的信息处理方法,其特征在于,所述任意一个程序运行节点对应代码执行片段的执行路径活动包含所述任意一个程序运行节点对应代码执行片段的执行路径节点;依据所述程序报告生成模型在所述任意一个程序运行节点估计代码执行片段的执行路径活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个执行路径节点的第四置信度;
基于所述多个执行路径节点中对应第四置信度不小于第四门限值的执行路径节点生成执行路径节点提取序列;
对所述执行路径节点提取序列进行采样,基于采样生成的执行路径节点确定所述任意一个程序运行节点对应代码执行片段的执行路径活动。
5.根据权利要求1所述的面向企业应用服务的信息处理方法,其特征在于,所述任意一个程序运行节点对应的资源占用活动包含所述任意一个程序运行节点上程序关联的系统资源类型活动;
依据所述程序报告生成模型估计所述任意一个程序运行节点对应的资源占用活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个系统资源占用行为的第五置信度;
基于所述多个系统资源占用行为中对应第五置信度不小于第五门限值的系统资源占用行为生成系统资源占用行为提取序列;
对所述系统资源占用行为提取序列进行采样,基于采样生成的系统资源占用行为确定所述任意一个程序运行节点对应的资源占用活动。
6.根据权利要求1所述的面向企业应用服务的信息处理方法,其特征在于,所述任意一个程序运行节点对应的资源占用活动包含所述任意一个程序运行节点上程序关联的系统资源类型组合活动;依据所述程序报告生成模型估计所述任意一个程序运行节点对应的资源占用活动的步骤,包括:
依据所述程序报告生成模型在所述任意一个程序运行节点估计针对多个系统资源组合占用行为的第六置信度;
基于所述多个系统资源组合占用行为中对应第六置信度不小于第六门限值的系统资源组合占用行为生成系统资源组合占用行为提取序列;
对所述系统资源组合占用行为提取序列进行采样,基于采样生成的系统资源组合占用行为确定所述任意一个程序运行节点对应的资源占用活动。
7.根据权利要求1所述的面向企业应用服务的信息处理方法,其特征在于,所述方法还包括:
获取范例报告标签下的范例企业应用服务程序报告,并获取用于进行程序报告生成的K个范例程序运行节点;所述范例企业应用服务程序报告在每个范例程序运行节点均具有对应的标注应用服务程序活动序列,所述每个范例程序运行节点对应的标注应用服务程序活动序列是对所述范例企业应用服务程序报告进行活动检测获得;
依据基础程序报告生成模型分别在每个范例程序运行节点估计所述范例报告标签关联的范例应用服务程序活动序列;任意一个范例程序运行节点对应的范例应用服务程序活动序列包括:所述任意一个范例程序运行节点对应的函数调用活动、资源占用活动或代码执行片段的执行路径活动;所述任意一个范例程序运行节点对应的资源占用活动表征所述任意一个范例程序运行节点上程序对系统资源的占用行为矢量,所述任意一个范例程序运行节点对应的代码执行片段用于表征所述任意一个范例程序运行节点与所述任意一个范例程序运行节点的下一程序运行节点间的代码执行片段,所述任意一个范例程序运行节点对应代码执行片段的执行路径活动表征所述任意一个范例程序运行节点对应代码执行片段的执行路径流动矢量;
依据所述每个范例程序运行节点各自对应的标注应用服务程序活动序列和范例应用服务程序活动序列,分别确定所述基础程序报告生成模型在所述每个范例程序运行节点处的训练误差参数;
依据所述每个范例程序运行节点对应的训练误差参数更新所述基础程序报告生成模型的模型参数信息,并将模型参数信息更新后的基础程序报告生成模型输出为所述程序报告生成模型;
其中,所述K个范例程序运行节点中任意一个表示为目标范例程序运行节点;
所述依据所述每个范例程序运行节点各自对应的标注应用服务程序活动序列和范例应用服务程序活动序列,分别确定所述基础程序报告生成模型在所述每个范例程序运行节点处的训练误差参数,包括:
将所述目标范例程序运行节点对应的标注应用服务程序活动序列表示为第一活动集合,并将所述目标范例程序运行节点对应的范例应用服务程序活动序列表示为第二活动集合;
获取所述第一活动集合和所述第二活动集合之间的特征距离,并基于所述特征距离确定所述基础程序报告生成模型在所述目标范例程序运行节点处的训练误差参数。
8.一种企业应用服务系统,其特征在于,所述企业应用服务系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现权利要求1-7中任意一项的面向企业应用服务的信息处理方法。
CN202410510110.6A 2024-04-26 面向企业应用服务的信息处理方法及系统 Active CN118093206B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410510110.6A CN118093206B (zh) 2024-04-26 面向企业应用服务的信息处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410510110.6A CN118093206B (zh) 2024-04-26 面向企业应用服务的信息处理方法及系统

Publications (2)

Publication Number Publication Date
CN118093206A CN118093206A (zh) 2024-05-28
CN118093206B true CN118093206B (zh) 2024-07-02

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001248608A1 (en) * 2000-06-10 2002-03-14 Bae Systems Plc Ring-wing aircraft
CN107301347A (zh) * 2017-07-26 2017-10-27 南京邮电大学 一种基于静态分析获取Hbuilder App调用图的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001248608A1 (en) * 2000-06-10 2002-03-14 Bae Systems Plc Ring-wing aircraft
CN107301347A (zh) * 2017-07-26 2017-10-27 南京邮电大学 一种基于静态分析获取Hbuilder App调用图的方法

Similar Documents

Publication Publication Date Title
Verenich et al. Survey and cross-benchmark comparison of remaining time prediction methods in business process monitoring
EP3889777A1 (en) System and method for automating fault detection in multi-tenant environments
US20200044926A1 (en) Method, system and program product for allocation and/or prioritization of electronic resources
US20170109657A1 (en) Machine Learning-Based Model for Identifying Executions of a Business Process
Whittaker et al. A Markov chain model for statistical software testing
US20170109676A1 (en) Generation of Candidate Sequences Using Links Between Nonconsecutively Performed Steps of a Business Process
US20170109668A1 (en) Model for Linking Between Nonconsecutively Performed Steps in a Business Process
US20110078106A1 (en) Method and system for it resources performance analysis
CN108052528A (zh) 一种存储设备时序分类预警方法
US20170109667A1 (en) Automaton-Based Identification of Executions of a Business Process
US20170109636A1 (en) Crowd-Based Model for Identifying Executions of a Business Process
US20160055044A1 (en) Fault analysis method, fault analysis system, and storage medium
CN1894892B (zh) 使用动作中心方案来提供对网络化系统的自主管理的系统和方法
US20170109639A1 (en) General Model for Linking Between Nonconsecutively Performed Steps in Business Processes
US20220038330A1 (en) Systems and methods for predictive assurance
CN107003931B (zh) 将测试验证从测试执行分离
Sîrbu et al. Towards data-driven autonomics in data centers
US20170109638A1 (en) Ensemble-Based Identification of Executions of a Business Process
US9740986B2 (en) System and method for deducing user interaction patterns based on limited activities
Sîrbu et al. Towards operator-less data centers through data-driven, predictive, proactive autonomics
Eismann et al. Modeling of parametric dependencies for performance prediction of component-based software systems at run-time
Cai et al. A real-time trace-level root-cause diagnosis system in alibaba datacenters
Tong et al. A missing QoS prediction approach via time-aware collaborative filtering
WO2017023299A1 (en) Composing future tests
CN115455429A (zh) 基于大数据的漏洞分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant