CN108446711B - 一种基于迁移学习的软件缺陷预测方法 - Google Patents

一种基于迁移学习的软件缺陷预测方法 Download PDF

Info

Publication number
CN108446711B
CN108446711B CN201810101265.9A CN201810101265A CN108446711B CN 108446711 B CN108446711 B CN 108446711B CN 201810101265 A CN201810101265 A CN 201810101265A CN 108446711 B CN108446711 B CN 108446711B
Authority
CN
China
Prior art keywords
data
matrix
probability distribution
representing
test data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810101265.9A
Other languages
English (en)
Other versions
CN108446711A (zh
Inventor
张洋洋
荆晓远
吴飞
孙莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201810101265.9A priority Critical patent/CN108446711B/zh
Publication of CN108446711A publication Critical patent/CN108446711A/zh
Application granted granted Critical
Publication of CN108446711B publication Critical patent/CN108446711B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于迁移学习的软件缺陷预测方法,该方法利用降维迁移学习的思想,综合考虑不同项目数据样本之间概率分布以及条件概率分布,在源项目和目标项目之间建立一个新的特征表示,在一个新的空间中最小化二者之间的差异,训练出一个新的分类器,进而实现迁移学习。算法首先采用了一种不同分布之间的距离度量方式,最大均方差异来量化源数据和目标数据之间的分布差异和条件分布差异,通过最小化这种度量来获得一个模型,通过这个模型映射过后的训练数据和测试数据几乎具有相同的概率分布和条件概率分布;然后就可以采用传统的机器学习算法对测试数据进行分类。

Description

一种基于迁移学习的软件缺陷预测方法
技术领域
本发明涉及软件工程技术领域,特别是一种基于迁移学习的软件缺陷预测方法。
背景技术
在过去30年里,软件缺陷预测逐步变为了一个意义重大的研究方向,致力于估计一个软件系统西立面到底有多少的保留缺陷。软件缺陷预测能够在系统开发初期,及时准确的预测软件模块是否包含缺陷,合理分配测试资源,针对性的对缺陷模块进行分析以提高产品质量。近年来,随着统计学习和机器学习技术的发展及其出色的预测性能,基于统计学习方法和机器学习方法的软件缺陷预测方法逐渐被研究者采用,并且成为主流的缺陷预测技术。
然而这些分类技术通常都会面临一个问题:当需要对新的项目进行缺陷预测的时候,所拥有的的训练样本过少,难以训练正确的模型。另一方面,一类项目通常含有大量的相似项目,这些相似项目训练的软件缺陷预测模型又不能直接用来预测。假设我们已经训练了大量的C++编写的项目的缺陷分类器,而目前又有一个新的Java项目,通常的做法是在当前项目下利用有限的样本标记重新训练分类器,但是这种方式忽略了项目之间的相关性,尽管项目的语言不同,其内部的程序设计架构和算法机理一样,因此项目之间有很强的相关性,如果利用这种相关性进行迁移训练,将会大大缩小模型所需的样本数。
跨公司软件缺陷预测问题不同于传统的及其学习问题,它的训练数据和测试数据属于不同的分布。为了解决这个问题,Turhan等使用一种最近邻滤波器自从源数据中选择与测试数据相似的数据作为训练数据。这种方法的缺点是:样本选择过程中丢弃掉的不相似数据也会导致其中所包含的的有用信息被丢弃掉。Zimmermann等使用决策树帮助项目管理者进行跨工程预测前对精确度,召回率和准确度进行估计。但是,从已有的跨工程预测性能来看,这种方法不能够产生较好的预测结果。
发明内容
本发明所要解决的技术问题是克服现有技术的不足而提供一种基于迁移学习的软件缺陷预测方法,本发明方法充分考虑源数据和目标数据之间的分布差异和条件分布差异,度量并最小化它们后采用传统及其学习分类,相比较其他方法取得了更好的缺陷预测准确率。
本发明为解决上述技术问题采用以下技术方案:
根据本发明提出的一种基于迁移学习的软件缺陷预测方法,包括以下步骤:
步骤1、使用主成分分析法PCA做数据重构,得到最优的低维特征表示Z;
步骤2、计算步骤1中低维特征表示Z中训练数据和测试数据之间的均值之差,通过最小化目标数据和源数据之间的概率分布距离以及条件概率分布距离训练得到一个适配矩阵A;
步骤3、将目标数据和源数据都通过适配矩阵A进行映射,映射过后的特征空间上训练数据和测试数据具有相同的特征分布;
步骤4、在步骤3映射过后得到的特征空间上进行机器学习,对测试数据进行分类预测。
作为本发明所述的一种基于迁移学习的软件缺陷预测方法进一步优化方案,步骤1具体如下:使用
Figure BDA0001566338060000021
作为输入数据的矩阵,数据集X包括测试数据和训练数据,xi表示训练数据第i个样本,1≤i≤n,
Figure BDA0001566338060000022
表示a×d实数空间,a是测试数据和训练数据的总数量,d是每个样本的维度,
Figure BDA0001566338060000023
代表中心矩阵,a=n+m且Q表示大小为a×a的全1矩阵,n表示训练数据数量,m表示测试数据数量,I为大小是a×a的单位矩阵;PCA学习的目标就是找到一个适配矩阵
Figure BDA0001566338060000024
以最大化以下问题;
Figure BDA0001566338060000025
表示d×k的实数空间,k是一个小于a的参数;
Figure BDA0001566338060000026
tr(·)表示矩阵的迹,上标T表示转置,XHXTA=AΦ,
Figure BDA0001566338060000027
表示k×k实数空间;其中,φ1,...,φk是前k个最大的特征值,Φ就是由φ1,...,φk作为对角线元素所构造的矩阵,除对角线外其他元素为0;然后得到最优的低维特征表示Z:Z=[z1,...,za]=ATX。
作为本发明所述的一种基于迁移学习的软件缺陷预测方法进一步优化方案,步骤2中通过最小化目标数据和源数据之间的概率分布距离以及条件概率分布距离训练得到一个适配矩阵;具体如下:
2.1)最小化目标数据和源数据之间的概率分布距离定义为:
Figure BDA0001566338060000028
xj表示训练数据第j个样本,M0就是MMD矩阵,并且通过下列公式来计算:
Figure BDA0001566338060000029
(M0)ij表示M0矩阵在第i行第j列的元素,L表示训练数据,V表示测试数据,ti,tj分别表示测试数据中第i和第j个样本;
2.2)最小化目标数据和源数据之间的条件概率分布距离;
通过修改MMD来度量两种条件分布之间的距离:
Figure BDA0001566338060000031
其中,n(c)表示训练数据中类别为c的样本个数,L(c)表示在训练数据中属于类别c的所有样本点,V(c)表示在测试数据属于类别c的所有样本点,vj表示测试数据中第j个样本,m(c)表示测试数据中类别为c的样本个数;因此改进的MMD矩阵Mc通过下列公式来计算:
Figure BDA0001566338060000032
(Mc)ij表示矩阵Mc在第i行第j列的元素;
2.3)将最小化目标数据和源数据之间的概率分布距离以及条件概率分布距离的目标任务整合起来,最终的到总的优化目标:
Figure BDA0001566338060000033
其中,λ是一个正则化参数,C代表输入数据中所有的类别数,
Figure BDA0001566338060000034
表示矩阵A的F范数,对于非线性问题,考虑核映射:ψ:x→ψ(x),ψ表示核函数,x表示自变量,ψ(x)表示对自变量x的一个映射,核矩阵
Figure BDA0001566338060000035
表示大小为a×a的实数空间;上述优化问题转化为:
Figure BDA0001566338060000036
其中,K代表核映射矩阵;从而最终得到适配矩阵A。
作为本发明所述的一种基于迁移学习的软件缺陷预测方法进一步优化方案,步骤2中采用最大平均差异MMD作为距离度量方法来计算训练数据和测试数据之间的均值之差。
作为本发明所述的一种基于迁移学习的软件缺陷预测方法进一步优化方案,步骤1中Z是一种新的特征表示。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明方法充分考虑源数据和目标数据之间的分布差异和条件分布差异,度量并最小化它们后采用传统及其学习分类,相比较其他方法取得了更好的缺陷预测准确率。
附图说明
图1是本发明的方法流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
不同于以上方法,本发明针对新项目需要每次重新训练预测分类器的问题,提出一种成为基于联合概率分布匹配特征映射(Joint Distribution Based Feature Map,JDBFM)的软件缺陷预测方法。该方法利用降维迁移学习的思想,综合考虑不同项目数据样本之间概率分布以及条件概率分布,在源项目和目标项目之间建立一个新的特征表示,在一个新的空间中最小化二者之间的差异,训练出一个新的分类器,进而实现迁移学习。
图1是本发明的方法流程图,方法包括以下步骤:
步骤1,使用主成分分析法(PCA)做数据重构,得到最优的低维特征表示。
步骤2,使用最大均方差异(MMD)做为距离度量,最小化源数据和目标数据之间的分布距离和条件分布距离来训练模型,得到一个适配矩阵。
步骤3,通过得到的适配矩阵分别对源数据和目标数据进行映射。
步骤4,在映射过后的数据上进行传统的机器学习分类。
为说明本算法的优越性,将JDBFM算法与两种较早提出的算法TNB和NN-filter进行比较。分别在AEEEM和ReLink数据库上进行试验。
本发明采用召回率、精确度和F-measure值来评估模型的预测效果。这些度量基于表1示的混淆矩阵。
表1混淆矩阵
预测为有缺陷 预测为无缺陷
真实有缺陷 A B
真实无缺陷 C D
召回率(recall)是正确预测缺陷模块数与真实有缺陷数模块数比值,一般来说其值越高越好。计算公式如下:
Figure BDA0001566338060000041
精确度(precision)就是正确预测缺陷模块数与预测缺陷模块数的比值,一般来说其值越高越好。计算公式如下:
Figure BDA0001566338060000042
由于高的召回率往往要以低精确度为代价,反之亦然。因此,可以使用F-measure将召回率和精确度综合起来进行评价。F-measure召回率和查准率的调和平均数,值越高性能越好,计算公式如下:
Figure BDA0001566338060000051
在要做实验的3个算法中,对于NN-filter算法,每个测试数据都要从训练数据中选择k个最近邻的样本构成训练数据集来训练软件缺陷预测模型,本发明选取k=10。而本发明提出的算法JDBFM中有两个参数需要设置:子空间基数k和正则项系数λ,在下列数据集上的实验中证实了在一个很大的参数返回内实验可以得到一个相对稳定的效果。本次我们设置k=100,λ=1.0。表2是ReLink数据集上6组跨项目软件缺陷预测F-measure值对比,表3是EEM数据集上6组跨项目软件缺陷预测F-measure值对比。
表2ReLink数据集上6组跨项目软件缺陷预测F-measure值对比
Train->test NN-filter TNB JDBFM
ZXing->Safe 0.4596 0.5189 0.5210
ZXing->Apache 0.5201 0.5562 0.5572
Safe->ZXing 0.3306 0.3053 0.3329
Safe->Apache 0.4685 0.5620 0.5878
Apache->ZXing 0.3589 0.4120 0.4123
Apache->Safe 0.6712 0.7112 0.7351
Average 0.4681 0.5109 0.5243
表3EEEM数据集上6组跨项目软件缺陷预测F-measure值对比
Figure BDA0001566338060000052
Figure BDA0001566338060000061
通过以上实验结果可以看出,NN-filter算法所获得的实验结果F-measure值较TNB和JDBFM算法都要低一些,这是因为,NN-filter算法在构建软件缺陷预测模型的时候要熊训练集中选择出测试数据样本中的每一个样本对应的训练集中k个最近邻的数据样本,而训练样本中的其他数据被丢弃掉了,而被丢弃掉的这些样本中可能也含有很多对软件缺陷预测模型很有用的信息,进而影响了最后的准确率。对于TNB算法和本发明所提出的JDBFM算法相比,由于JDBFM算法既考虑了训练数据样本和测试数据样本之间分布,又考虑了源和目标数据的条件概率分布,分别最小化两种分布之间的MMD距离,将源数据和目标数据映射到了另外一种特征表示,在这种特征表示中源数据和目标数据特征分布几乎是一致的,因而在这个特证空间中采取传统分类算法取得了很好的效果。实验结果也证明,我们所构建出的软件缺陷模型的F-measure值均优于TNB算法,验证了JDBFM算法优于TNB算法。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (3)

1.一种基于迁移学习的软件缺陷预测方法,其特征在于,包括以下步骤:
步骤1、使用主成分分析法PCA做数据重构,得到最优的低维特征表示Z;
步骤2、计算步骤1中低维特征表示Z中训练数据和测试数据之间的均值之差,通过最小化目标数据和源数据之间的概率分布距离以及条件概率分布距离训练得到一个适配矩阵A;
步骤3、将目标数据和源数据都通过适配矩阵A进行映射,映射过后的特征空间上训练数据和测试数据具有相同的特征分布;
步骤4、在步骤3映射过后得到的特征空间上进行机器学习,对测试数据进行分类预测;
步骤1具体如下:使用
Figure FDA0003520136250000011
作为输入数据的矩阵,数据集X包括测试数据和训练数据,xi表示训练数据第i个样本,1≤i≤n,
Figure FDA0003520136250000012
表示a×d实数空间,a是测试数据和训练数据的总数量,d是每个样本的维度,
Figure FDA0003520136250000013
代表中心矩阵,a=n+m且Q表示大小为a×a的全1矩阵,n表示训练数据数量,m表示测试数据数量,I为大小是a×a的单位矩阵;PCA学习的目标就是找到一个适配矩阵
Figure FDA0003520136250000014
以最大化以下问题;
Figure FDA0003520136250000015
表示d×k的实数空间,k是一个小于a的参数;
Figure FDA0003520136250000016
tr(·)表示矩阵的迹,上标T表示转置,XHXTA=AΦ,
Figure FDA0003520136250000017
Figure FDA0003520136250000018
表示k×k实数空间;其中,φ1,...,φk是前k个最大的特征值,Φ就是由φ1,...,φk作为对角线元素所构造的矩阵,除对角线外其他元素为0;然后得到最优的低维特征表示Z:Z=[z1,...,za]=ATX;
步骤2中通过最小化目标数据和源数据之间的概率分布距离以及条件概率分布距离训练得到一个适配矩阵;具体如下:
2.1)最小化目标数据和源数据之间的概率分布距离定义为:
Figure FDA0003520136250000019
xj表示训练数据第j个样本,M0就是MMD矩阵,并且通过下列公式来计算:
Figure FDA00035201362500000110
(M0)ij表示M0矩阵在第i行第j列的元素,L表示训练数据,V表示测试数据,ti,tj分别表示测试数据中第i和第j个样本;
2.2)最小化目标数据和源数据之间的条件概率分布距离;
通过修改MMD来度量两种条件分布之间的距离:
Figure FDA0003520136250000021
其中,n(c)表示训练数据中类别为c的样本个数,L(c)表示在训练数据中属于类别c的所有样本点,V(c)表示在测试数据属于类别c的所有样本点,vj表示测试数据中第j个样本,m(c)表示测试数据中类别为c的样本个数;因此改进的MMD矩阵Mc通过下列公式来计算:
Figure FDA0003520136250000022
(Mc)ij表示矩阵Mc在第i行第j列的元素;
2.3)将最小化目标数据和源数据之间的概率分布距离以及条件概率分布距离的目标任务整合起来,最终的到总的优化目标:
Figure FDA0003520136250000023
其中,λ是一个正则化参数,C代表输入数据中所有的类别数,
Figure FDA0003520136250000024
表示矩阵A的F范数,对于非线性问题,考虑核映射:ψ:x→ψ(x),ψ表示核函数,x表示自变量,ψ(x)表示对自变量x的一个映射,核矩阵
Figure FDA0003520136250000025
Figure FDA0003520136250000026
表示大小为a×a的实数空间;上述优化问题转化为:
Figure FDA0003520136250000027
其中,K代表核映射矩阵;从而最终得到适配矩阵A。
2.根据权利要求1所述的一种基于迁移学习的软件缺陷预测方法,其特征在于,步骤2中采用最大平均差异MMD作为距离度量方法来计算训练数据和测试数据之间的均值之差。
3.根据权利要求1所述的一种基于迁移学习的软件缺陷预测方法,其特征在于,步骤1中Z是一种新的特征表示。
CN201810101265.9A 2018-02-01 2018-02-01 一种基于迁移学习的软件缺陷预测方法 Active CN108446711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810101265.9A CN108446711B (zh) 2018-02-01 2018-02-01 一种基于迁移学习的软件缺陷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810101265.9A CN108446711B (zh) 2018-02-01 2018-02-01 一种基于迁移学习的软件缺陷预测方法

Publications (2)

Publication Number Publication Date
CN108446711A CN108446711A (zh) 2018-08-24
CN108446711B true CN108446711B (zh) 2022-04-22

Family

ID=63191648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810101265.9A Active CN108446711B (zh) 2018-02-01 2018-02-01 一种基于迁移学习的软件缺陷预测方法

Country Status (1)

Country Link
CN (1) CN108446711B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102126B (zh) * 2018-08-30 2021-12-10 燕山大学 一种基于深度迁移学习的理论线损率预测模型
CN111209180B (zh) * 2018-11-21 2023-04-25 中国移动通信集团浙江有限公司 一种基于模糊匹配的回归测试方法和装置
CN110389154B (zh) * 2019-05-23 2021-05-14 电子科技大学 基于红外热成像的指数熵加性模糊缺陷特征分析重构方法
CN110175726B (zh) * 2019-06-18 2021-03-26 中国人民解放军国防科技大学 一种基于迁移性分析的跨项目缺陷预测方法
CN110490275B (zh) * 2019-06-28 2020-07-07 北京理工大学 一种基于迁移学习的驾驶行为预测方法
CN110489348B (zh) * 2019-08-23 2023-08-25 山东浪潮科学研究院有限公司 一种基于迁移学习的软件功能缺陷挖掘方法
CN110728377B (zh) * 2019-10-21 2020-06-09 山东大学 一种面向机电设备的智能故障诊断方法及系统
CN111105082A (zh) * 2019-12-05 2020-05-05 山东浪潮人工智能研究院有限公司 基于机器学习的工件质量预测模型构建方法及预测方法
CN111091290B (zh) * 2019-12-17 2020-07-28 广东工业大学 一种基于迁移学习的手机装配工艺知识框架模型构建方法
CN111198820B (zh) * 2020-01-02 2022-08-26 南京邮电大学 一种基于共享隐层自编码器的跨项目软件缺陷预测方法
CN111881048B (zh) * 2020-07-31 2022-06-03 武汉理工大学 一种跨项目软件老化缺陷预测方法
CN112036301B (zh) * 2020-08-31 2021-06-22 中国矿业大学 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
CN112214406B (zh) * 2020-10-10 2021-06-15 广东石油化工学院 一种基于选择性伪标记子空间学习的跨项目缺陷预测方法
CN112463640B (zh) * 2020-12-15 2022-06-03 武汉理工大学 一种基于联合概率域适应的跨项目软件老化缺陷预测方法
CN115858209B (zh) * 2022-11-17 2023-06-20 北京航空航天大学 基于信息保留协同优化的异构跨项目软件缺陷预测方法
CN117421244B (zh) * 2023-11-17 2024-05-24 北京邮电大学 多源跨项目软件缺陷预测方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991049A (zh) * 2017-04-01 2017-07-28 南京邮电大学 一种软件缺陷预测方法及预测系统
CN107025503A (zh) * 2017-04-18 2017-08-08 武汉大学 基于迁移学习和缺陷数量信息的跨公司软件缺陷预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991049A (zh) * 2017-04-01 2017-07-28 南京邮电大学 一种软件缺陷预测方法及预测系统
CN107025503A (zh) * 2017-04-18 2017-08-08 武汉大学 基于迁移学习和缺陷数量信息的跨公司软件缺陷预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Transfer Defect Learning;Jaechang Nam等;《2013 35th International Conference on Software Engineering (ICSE)》;20130526;第1-3章 *
基于迁移学习的软件缺陷预测;程铭等;《电子学报》;20160131;第1-2章 *

Also Published As

Publication number Publication date
CN108446711A (zh) 2018-08-24

Similar Documents

Publication Publication Date Title
CN108446711B (zh) 一种基于迁移学习的软件缺陷预测方法
CN108459955B (zh) 基于深度自编码网络的软件缺陷预测方法
CN110728656A (zh) 基于元学习的无参考图像质量数据处理方法、智能终端
JP2023526161A (ja) 人工知能(ai)モデル選択のための方法
CN112115967B (zh) 一种基于数据保护的图像增量学习方法
WO2021035412A1 (zh) 一种自动机器学习AutoML系统、方法及设备
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN110555459A (zh) 基于模糊聚类和支持向量回归的成绩预测方法
CN106156805A (zh) 一种样本标签缺失数据的分类器训练方法
CN112184089B (zh) 试题难度预测模型的训练方法、装置、设备及存储介质
CN108009571A (zh) 一种新的直推式半监督数据分类方法及系统
CN111597760A (zh) 一种实现小样本条件下获取气路参数偏差值的方法
CN112529063B (zh) 一种适用于帕金森语音数据集的深度域适应分类方法
WO2024082796A1 (zh) 一种面向多域图像的光谱跨域迁移超分重建方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN109409394A (zh) 一种基于半监督聚类的cop-kmeans方法与系统
CN117893786A (zh) 基于自监督主动学习的图像分类方法、装置、设备及存储介质
CN112733340A (zh) 一种基于数据驱动储层改造候选井的选井方法及设备
CN107544447A (zh) 一种基于核学习的化工过程故障分类方法
CN117035710A (zh) 人才评估量化方法、系统、设备及介质
CN117252083A (zh) 一种结合退化阶段划分和子域自适应的轴承剩余寿命预测方法及系统
CN116341929A (zh) 一种基于聚类和自适应梯度提升决策树的预测方法
CN112860531B (zh) 基于深度异构图神经网络的区块链广泛共识性能评测方法
CN116257758A (zh) 模型训练方法、人群拓展方法、介质、装置和计算设备
CN112801163B (zh) 基于动态图结构的小鼠模型海马生物标记物的多目标特征选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant