CN109597757B - 一种基于多维时间序列熵的软件网络间相似度的度量方法 - Google Patents

一种基于多维时间序列熵的软件网络间相似度的度量方法 Download PDF

Info

Publication number
CN109597757B
CN109597757B CN201811317716.9A CN201811317716A CN109597757B CN 109597757 B CN109597757 B CN 109597757B CN 201811317716 A CN201811317716 A CN 201811317716A CN 109597757 B CN109597757 B CN 109597757B
Authority
CN
China
Prior art keywords
entropy
data
software
similarity
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811317716.9A
Other languages
English (en)
Other versions
CN109597757A (zh
Inventor
杨顺昆
张宇涵
李红曼
李大庆
苟晓冬
黄婷婷
曾福萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201811317716.9A priority Critical patent/CN109597757B/zh
Publication of CN109597757A publication Critical patent/CN109597757A/zh
Application granted granted Critical
Publication of CN109597757B publication Critical patent/CN109597757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)

Abstract

本发明一种基于多维时间序列熵的软件网络间的相似度的度量方法,其步骤如下:获取用于度量的多种度量元;构建基于不同版本下软件的多种度量元的时间序列;计算所述软件在不同维度下的熵值;确定与缺陷数据最相关的熵值以及该熵值所在的度量元维度;基于所述最相关的熵值,评估不同版本的软件复杂网络间的相似度。本发明能实现通过获取不同版本下的软件的度量值,构成多维时间序列,并通过编译程序得到度量元在多个维度下的熵值,对不同版本的软件的相似度进行度量,得到熵值与相似度之间的正相关的关系,这有利于本领域技术人员对软件版本之间相似度作出简单有效的评估与预测。

Description

一种基于多维时间序列熵的软件网络间相似度的度量方法
技术领域
本发明一种基于多维时间序列熵的软件网络间相似度的度量方法,属于软件缺陷预测技术领域。
背景技术
随着互联网技术、信息技术和网络技术等技术的高速发展,数据已经逐渐成为人们生产和生活息息相关的一部分,而信息和数据资源已经逐渐成为促进科技发展的重要因素。软件技术的不断发展带来软件版本的不断更新,软件的复杂度不断攀升,带来软件开发、维护难度以及故障率的增加,在挖掘软件不同版本之间的联系时,本领域技术人员主要基于多种度量元,建立静态模型对软件不同版本所对应复杂网络进行评估与预测。
在一种进步的方法中,更有研究人员通过建立不同版本软件对应的复杂网络,比对各个网络间的差异,以此来评估不同版本的复杂网络的差异性,但是这种方法需要耗费较多的精力,若只通过人工比对与评估具有主观性和不准确性,于是本领域技术人员追求一种能准确判别复杂网络间的相似性的度量方法,以实现更为简单有效的评估与预测。
发明内容
(一)目的
本发明一种基于多维时间序列熵的软件网络间相似度的度量方法,属于软件缺陷预测技术领域,可以解决现有问题中不能快速衡量不同版本的软件对应的复杂网络的相似度的问题,能准确判别复杂网络间的相似性关系,以实现更为简单有效的评估与预测。
(二)技术方案
本发明提供了一种基于多维时间序列熵的软件网络间相似度的度量方法,其具体实施步骤如下:
步骤1:获取用于度量的多种度量元;
步骤2:构建基于不同版本下软件的多种度量元的时间序列;
步骤3:计算所述软件在不同维度下的熵值;
步骤4:确定与缺陷数据最相关的熵值以及该熵值所在的度量元维度;
步骤5:基于所述最相关的熵值,评估不同版本的软件复杂网络间的相似度;
通过以上步骤,可以实现通过获取不同版本下的软件的度量值,构成多维时间序列,并通过编译程序得到度量元在多个维度下的熵值,对不同版本的软件的相似度进行度量,得到熵值与相似度之间的正相关的关系,这有利于本领域技术人员对软件版本之间相似度作出简单有效的评估与预测。
其中,在步骤1中所述的“度量元”,是指用于度量软件网络的属性,包括软件的内在属性以及外在特征。
其中,在步骤1中所述的“获取用于度量的多种度量元”,其具体做法如下:获取软件的基本属性包括软件的内在特征以及软件的外在特征,根据给定的软件,以函数为节点,以函数间的调用关系为边建立函数调用关系网络,基于该复杂网络,获取多个度量元,该度量元包括:渗流均值、节点数量、边、平均度、聚集系数、平均路径和社团数量;其中,静态的拓扑结构指标包括节点数量、边、平均度、聚集系数、平均路径和社团数量;动态指标为渗流均值,渗流均值通过渗流过程中采集多个渗流值并取平均值得到。
其中,在步骤2中所述的“构建基于不同版本下软件的多种度量元的多维时间序列”,其具体做法如下:将不同格式的原始数据,也即是不同版本下软件的多种度量元转化为标准的多维时间序列数据;具体的,运用一数据处理工具,以及一编译语言,首先读取数据并校验数据格式,如果数据格式正则表达式匹配成功,从针对特定数据格式的数据格式解析器库中获取相应的解析器,如果匹配相应的数据格式正则表达式失败,则放弃数据转化与接下来的数据处理,并提示修改数据格式匹配正则表达式,根据获取到的数据格式匹配正则表达式。
其中,在步骤3所述的“计算所述软件在不同维度下的熵值”,其具体做法如下:将不同版本下的每一种度量元作为多维时间序列的一个维度,每个数据项可描述为aj=[aj,1,aj,2,…,aj,d],其中d表示维度数,L=a0,a1,a2,…为每一维度下的数据项逐个连续到达未知版本的数据列,定义m为数据列中总的数据项,mi表数据项出现的次数,n表当前计算维度数据项的集合大小,定义熵
Figure GDA0001953248590000031
当所述数据项相同时,熵取最小值0,当所到达的数据项都不相同时,熵取最大值lb(m);每一维度下的时间序列的近似熵的具体计算方法如下:将m个数据点的时间序列按照数据点的排序将其以n个数据点作为一个子片段进行划分,总共分为(m-n+1)个子序列片段,并将子序列片段用X(i)进行标记,计算和当前第i个子片段序列相似的其他序列所占的比例;计算当前第i个子片段X(i)和其他(m-n)个子序列之间的距离d[X(i),X(j)],计算距离的次数为m-n次,将上述m-n各距离分别与给定阈值进行比较,当计算的距离小于阈值时,认为当前对应的两个子序列之间是相似的,对和当前序列相似的序列进行计数作为被除数,总的子片段序列(m-n+1)作为除数,所得商为近似熵值;分别计算每一维度下的时间序列的近似熵,得到d个距离列以及d个熵值;当n取2时,则可以判定相邻两个版本间的复杂网络间的相似度;在一种实施方式中,建立所述软件不同维度下熵值与缺陷数据之间的关系图根据软件在每一维度下的熵值与所述不同维度下的数据列,作出横轴为时间(版本),纵轴为单位值的关系图。
其中,在步骤4中所述的“确定与缺陷数据最相关的熵值以及该熵值所在的度量元维度”,其具体做法如下:根据所述熵值与度量元之间的相似关系,可得到不同度量元下的熵值与所述缺陷数据之间的关联性,筛选出最相关的度量元以及该度量元下的熵值;其中,熵值与度量元之间的相似关系通过普通最小二乘法、加权最小二乘法以及似不相关法将所述熵值数列以及缺陷数据列进行整合,基于一数据分析工具,得到当前数据间的相关性系数;在一种实施方式中,分别建立熵值列与所述缺陷数据之间的关系图,人为识别与缺陷数据走势相近的熵值列。
其中,在步骤5中所述的“基于所述最相关的熵值,评估不同版本的软件复杂网络间的相似度”,其具体做法如下:根据所选熵值列对比缺陷数据之间的线性以及非线性关系,在缺陷数据相同的情况下,根据对应熵值之间的差异性,评价软件在对应版本下的相似度;所述熵值能有效的度量系统参数分布的变化情况,当两版本下的数据集为分布相近时,熵值最大,也即是熵值与相似度呈正相关关系。
(三)优点及功效
通过以上步骤,可以实现通过获取不同版本下的软件的度量值,构成多维时间序列,并通过编译程序得到度量元在多个维度下的熵值,对不同版本的软件的相似度进行度量,得到熵值与相似度之间的正相关的关系,这有利于本领域技术人员对软件版本之间相似度作出简单有效的评估与预测。
附图说明
图1是本发明实施例提供的方法流程图;
图2是本发明实施例提供的一种基于多维时间序列熵的软件网络间相似度的度量方法的示意图。
具体实施方式
这里将详细的对示例性实施例进行说明,以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式;相反,它们仅是与所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本发明提供了一种基于多维时间序列熵的软件网络间相似度的度量方法,为使本发明的目的、技术方案和优点更加清楚,下面将结合附图1-2对本发明实施方式作详细描述:
本发明一种基于多维时间序列熵的软件网络间相似度的度量方法,如图1所示,其实施步骤如下:
101、获取用于度量的多种度量元。
其中,所述获取软件的基本属性包括软件的内在特征以及软件的外在特征,根据给定的软件,以函数为节点,以函数间的调用关系为边建立函数调用关系网络,基于该复杂网络,获取多个度量元,该度量元包括:渗流均值、节点数量、边、平均度、聚集系数、平均路径和社团数量;其中,静态的拓扑结构指标包括节点数量、边、平均度、聚集系数、平均路径和社团数量;动态指标为渗流均值,渗流均值通过渗流过程中采集多个渗流值并取平均值得到。
在一种实施方式中,在一种通过随机删除网络的节点模拟网络遭遇随机攻击的情景中,渗流值是指网络崩溃时的删除节点的比例,并记为渗流阈值,而渗流均值是指进行多次随机删除节点尽兴多次渗流得到的渗流阈值的平均值。
102、构建基于不同版本下软件的多种度量元的多维时间序列。
将不同格式的原始数据,也即是不同版本下软件的多种度量元转化为标准的多维时间序列数据。具体的,运用一数据处理工具,以及一编译语言,首先读取数据并校验数据格式,如果数据格式正则表达式匹配成功,从针对特定数据格式的数据格式解析器库中获取相应的解析器,如果匹配相应的数据格式正则表达式失败,则放弃数据转化与接下来的数据处理,并提示修改数据格式匹配正则表达式,根据获取到的数据格式匹配正则表达式。其具体步骤与表示如图2所示。
在一种实施方式中,采用MapReduce(一种软件工具)实现,选用Java(一种编码语言)代码进行编译。进一步的,本实施例还可以通过投影寻踪方法进行降维处理,分析后得到每个度量元的最佳投影值,将所述度量元构成模糊聚类的原始数据矩阵;将模糊原始数据矩阵应用数量积法生成模糊相似矩阵;根据相似矩阵以及最佳投影值,提取模糊规则,根据计算模糊贴进度对所述多维时间序列与缺陷数据之间的相关性进行评估。
103、计算所述软件在不同维度下的熵值。
将不同版本下的每一种度量元作为多维时间序列的一个维度,每个数据项可描述为aj=[aj,1,aj,2,…,aj,d],其中d表示维度数,L=a0,a1,a2,…为每一维度下的数据项逐个连续到达未知版本的数据列,定义m为数据列中总的数据项,mi表数据项出现的次数,n表当前计算维度数据项的集合大小,定义熵
Figure GDA0001953248590000071
当所述数据项相同时,熵取最小值0,当所到达的数据项都不相同时,熵取最大值lb(m)。每一维度下的时间序列的近似熵的具体计算方法如下:将m个数据点的时间序列按照数据点的排序将其以n个数据点作为一个子片段进行划分,总共分为(m-n+1)个子序列片段,并将子序列片段用X(i)进行标记,计算和当前第i个子片段序列相似的其他序列所占的比例;计算当前第i个子片段X(i)和其他(m-n)个子序列之间的距离d[X(i),X(j)],计算距离的次数为m-n次,将上述m-n各距离分别与给定阈值进行比较,当计算的距离小于阈值时,认为当前对应的两个子序列之间是相似的,对和当前序列相似的序列进行计数作为被除数,总的子片段序列(m-n+1)作为除数,所得商为近似熵值。分别计算每一维度下的时间序列的近似熵,得到d个距离列以及d个熵值。当n取2时,则可以判定相邻两个版本间的复杂网络间的相似度。在一种实施方式中,建立所述软件不同维度下熵值与缺陷数据之间的关系图根据软件在每一维度下的熵值与所述不同维度下的数据列,作出横轴为时间(版本),纵轴为单位值的关系图。在一种实施方式中,feature可表示每个聚类下的数据列的标识,也即是feature可在不同的维度下取值,[n]k=Dom(featurej,k)={1,2,3,…,nk}为当前熵值计算维度k上的取值空间。基于上述方法,可以对熵值的计算进行程序编码,编码所得熵值估算过程如下:Se=0;For每个维度为K;For recodek链表中的每个recodekiC=recodek,j(counter);If recodek,j(iscounter)=true;Sk,e=Sk,e+clb(c);Else Xk,j=m*(clb(c)-(c-1)lb(c-1));End If;End For;Sk,m=avg[X];Sk=Sk,e+Sk,m;End For;return S1,S2,S3,…,Sd
104、确定与缺陷数据最相关的熵值以及该熵值所在的度量元维度。
根据所述熵值与度量元之间的相似关系,可得到不同度量元下的熵值与所述缺陷数据之间的关联性,筛选出最相关的度量元以及该度量元下的熵值。其中,熵值与度量元之间的相似关系通过普通最小二乘法、加权最小二乘法以及似不相关法将所述熵值数列以及缺陷数据列进行整合,基于一数据分析工具,得到当前数据间的相关性系数。在一种实施方式中,分别建立熵值列与所述缺陷数据之间的关系图,人为识别与缺陷数据走势相近的熵值列。
105、基于所述最相关的熵值,评估不同版本的软件复杂网络间的相似度。
根据所选熵值列对比缺陷数据之间的线性以及非线性关系,在缺陷数据相同的情况下,根据对应熵值之间的差异性,评价软件在对应版本下的相似度。所述熵值能有效的度量系统参数分布的变化情况,当两版本下的数据集为分布相近时,熵值最大,也即是熵值与相似度呈正相关关系。在另一种可行的实施方式中,采用多维熵值分类的分析方法,认为各维度熵值时间序列在正常情况下和异常发生时都存在相关性,充分利用数据列上高效熵值计算算法以及各维度熵值之间的相关性有效提高不同版本下的软件复杂网络之间的相似程度。
通过以上步骤,可以实现通过获取不同版本下的软件的度量值,构成多维时间序列,并通过编译程序得到度量元在多个维度下的熵值,对不同版本的软件的相似度进行度量,得到熵值与相似度之间的正相关的关系,这有利于本领域技术人员对软件版本之间相似度作出简单有效的评估与预测。
以上所述仅为本发明较佳的实施例,并不用以限制本发明,凡是在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于多维时间序列熵的软件网络间相似度的度量方法,其特征在于:其具体实施步骤如下:
步骤1:获取用于度量的复数种度量元;
步骤2:构建基于不同版本下软件的复数种度量元的时间序列;
步骤3:计算所述软件在不同维度下的熵值;
步骤4:确定与缺陷数据最相关的熵值以及该熵值所在的度量元维度;
步骤5:基于所述最相关的熵值,评估不同版本的软件复杂网络间的相似度;
在步骤2中所述的“构建基于不同版本下软件的复数种度量元的多维时间序列”,其具体做法如下:将不同格式的原始数据,也即是不同版本下软件的复数种度量元转化为标准的多维时间序列数据;具体的,运用一数据处理工具,以及一编译语言,首先读取数据并校验数据格式,如果数据格式正则表达式匹配成功,从针对特定数据格式的数据格式解析器库中获取相应的解析器,如果匹配相应的数据格式正则表达式失败,则放弃数据转化与接下来的数据处理,并提示修改数据格式匹配正则表达式,根据获取到的数据格式匹配正则表达式。
2.根据权利要求1所述的一种基于多维时间序列熵的软件网络间相似度的度量方法,其特征在于:在步骤1中所述的“获取用于度量的复数种度量元”,其具体做法如下:获取软件的基本属性包括软件的内在特征以及软件的外在特征,根据给定的软件,以函数为节点,以函数间的调用关系为边建立函数调用关系网络,基于该复杂网络,获取复数个度量元,该度量元包括:渗流均值、节点数量、边、平均度、聚集系数、平均路径和社团数量;其中,静态的拓扑结构指标包括节点数量、边、平均度、聚集系数、平均路径和社团数量;动态指标为渗流均值,渗流均值通过渗流过程中采集复数个渗流值并取平均值得到。
3.根据权利要求1所述的一种基于多维时间序列熵的软件网络间相似度的度量方法,其特征在于:在步骤3所述的“计算所述软件在不同维度下的熵值”,其具体做法如下:将不同版本下的每一种度量元作为多维时间序列的一个维度,每个数据项描述为aj=[aj,1,aj,2,…,aj,d],其中d表示维度数,L=a0,a1,a2,…为每一维度下的数据项逐个连续到达未知版本的数据列,定义m为数据列中总的数据项,mi表数据项出现的次数,n表当前计算维度数据项的集合大小,定义熵
Figure FDA0002945319580000021
当所述数据项相同时,熵取最小值0,当所到达的数据项都不相同时,熵取最大值lb(m);每一维度下的时间序列的近似熵的具体计算方法如下:将m个数据点的时间序列按照数据点的排序将其以n个数据点作为一个子片段进行划分,总共分为(m-n+1)个子序列片段,并将子序列片段用X(i)进行标记,计算和当前第i个子片段序列相似的其他序列所占的比例;计算当前第i个子片段X(i)和其他(m-n)个子序列之间的距离d[X(i),X(j)],计算距离的次数为m-n次,将上述m-n的距离分别与给定阈值进行比较,当计算的距离小于阈值时,认为当前对应的两个子序列之间是相似的,对和当前序列相似的序列进行计数作为被除数,总的子片段序列(m-n+1)作为除数,所得商为近似熵值;分别计算每一维度下的时间序列的近似熵,得到d个距离列以及d个熵值;当n取2时,则能判定相邻两个版本间的复杂网络间的相似度;建立所述软件不同维度下熵值与缺陷数据之间的关系图根据软件在每一维度下的熵值与所述不同维度下的数据列,作出横轴为时间,即版本,纵轴为单位值的关系图。
4.根据权利要求1所述的一种基于多维时间序列熵的软件网络间相似度的度量方法,其特征在于:在步骤4中所述的“确定与缺陷数据最相关的熵值以及该熵值所在的度量元维度”,其具体做法如下:根据所述熵值与度量元之间的相似关系,得到不同度量元下的熵值与所述缺陷数据之间的关联性,筛选出最相关的度量元以及该度量元下的熵值;其中,熵值与度量元之间的相似关系通过普通最小二乘法、加权最小二乘法以及似不相关法将所述熵值数列以及缺陷数据列进行整合,基于一数据分析工具,得到当前数据间的相关性系数;分别建立熵值列与所述缺陷数据之间的关系图,人为识别与缺陷数据走势相近的熵值列。
5.根据权利要求1所述的一种基于多维时间序列熵的软件网络间相似度的度量方法,其特征在于:在步骤5中所述的“基于所述最相关的熵值,评估不同版本的软件复杂网络间的相似度”,其具体做法如下:根据所选熵值列对比缺陷数据之间的线性以及非线性关系,在缺陷数据相同的情况下,根据对应熵值之间的差异性,评价软件在对应版本下的相似度;所述熵值能有效的度量系统参数分布的变化情况,当两版本下的数据集为分布相近时,熵值最大,也即是熵值与相似度呈正相关关系。
CN201811317716.9A 2018-11-07 2018-11-07 一种基于多维时间序列熵的软件网络间相似度的度量方法 Active CN109597757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811317716.9A CN109597757B (zh) 2018-11-07 2018-11-07 一种基于多维时间序列熵的软件网络间相似度的度量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811317716.9A CN109597757B (zh) 2018-11-07 2018-11-07 一种基于多维时间序列熵的软件网络间相似度的度量方法

Publications (2)

Publication Number Publication Date
CN109597757A CN109597757A (zh) 2019-04-09
CN109597757B true CN109597757B (zh) 2021-04-30

Family

ID=65957525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811317716.9A Active CN109597757B (zh) 2018-11-07 2018-11-07 一种基于多维时间序列熵的软件网络间相似度的度量方法

Country Status (1)

Country Link
CN (1) CN109597757B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991470B (zh) * 2019-07-03 2022-04-15 北京市应急管理科学技术研究院 数据降维方法、画像构建方法及系统、可读存储介质
CN110516526A (zh) * 2019-07-03 2019-11-29 杭州电子科技大学 一种基于特征原型度量学习的小样本目标识别方法
CN111338972A (zh) * 2020-03-30 2020-06-26 北京计算机技术及应用研究所 基于机器学习的软件缺陷与复杂度关联关系分析方法
CN111708681B (zh) * 2020-06-15 2021-05-07 北京优特捷信息技术有限公司 一种日志处理方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106406870A (zh) * 2016-09-06 2017-02-15 北京航空航天大学 一种基于软件复杂网络的四维软件演化度量分析方法
CN107395440A (zh) * 2017-08-28 2017-11-24 电子科技大学 基于复杂网络的互联网拓扑探测节点优化部署方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8316038B2 (en) * 2010-06-02 2012-11-20 Hewlett-Packard Development Company, L.P. Collecting and analyzing user activities on mobile computing devices

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106406870A (zh) * 2016-09-06 2017-02-15 北京航空航天大学 一种基于软件复杂网络的四维软件演化度量分析方法
CN107395440A (zh) * 2017-08-28 2017-11-24 电子科技大学 基于复杂网络的互联网拓扑探测节点优化部署方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于熵的复杂网络结构特性研究;张齐;《中国优秀硕士学位论文全文数据库》;20180115;第40-46页 *

Also Published As

Publication number Publication date
CN109597757A (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
CN109597757B (zh) 一种基于多维时间序列熵的软件网络间相似度的度量方法
Bai et al. Entropic dynamic time warping kernels for co-evolving financial time series analysis
CN110008254B (zh) 一种变电设备台账核查处理方法
CN107682319A (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN110444011B (zh) 交通流高峰识别方法、装置、电子设备及存储介质
CN112819299A (zh) 一种基于中心优化的差分K-means负荷聚类方法
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN114861788A (zh) 一种基于dbscan聚类的负荷异常检测方法及系统
CN111291824B (zh) 时间序列的处理方法、装置、电子设备和计算机可读介质
CN112905380A (zh) 一种基于自动化监控日志的系统异常检测方法
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN115794803B (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
CN115394383A (zh) 磷光材料的发光波长预测方法及系统
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN116894687A (zh) 一种基于机器学习的用电量分析方法及系统、电子设备
CN118152836A (zh) 一种用于电能表运行过程的稳定性评估方法
CN116561230B (zh) 一种基于云计算的分布式存储与检索系统
CN114372093A (zh) 一种变压器dga在线监测数据的处理方法
CN117371861A (zh) 基于数字化的家政服务质量智能分析方法及系统
Jin et al. Power load curve clustering algorithm using fast dynamic time warping and affinity propagation
CN109739840A (zh) 数据空值处理方法、装置及终端设备
CN112732773B (zh) 一种继电保护缺陷数据的唯一性校核方法及系统
CN109086373B (zh) 一种构建公平的链接预测评估系统的方法
CN111898666A (zh) 一种随机森林算法结合模群种群的数据变量选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant