WO2021012894A1 - 获取神经网络测试报告的方法、装置、设备和存储介质 - Google Patents
获取神经网络测试报告的方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- WO2021012894A1 WO2021012894A1 PCT/CN2020/098841 CN2020098841W WO2021012894A1 WO 2021012894 A1 WO2021012894 A1 WO 2021012894A1 CN 2020098841 W CN2020098841 W CN 2020098841W WO 2021012894 A1 WO2021012894 A1 WO 2021012894A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- neural network
- refers
- feature data
- parameter
- data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Debugging And Monitoring (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
一种获取神经网络测试报告的方法、装置、设备和存储介质。该方法包括:获取特征数据(101)。将所述特征数据以及特征输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w(102)。根据w对所述特征数据进行降维(103),以获得降维后的特征数据。将所述降维后的特征数据输入至第二神经网络(104)。获取所述第二神经网络参数的变化状态信息,以及执行状态信息(105)。将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告(106)。产生的监控报告更好的监控到参数的变化以及检测训练错误的环节,更好的根据参数的变化调整神经网络模型的超参数,获得符合需求的神经网络模型超参数。
Description
本申请要求于2019年07月23日提交中国专利局、申请号为201910666325.6,发明名称为“获取神经网络测试报告的方法、装置、设备和存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及智能决策领域,提供了获取神经网络测试报告的方法、装置、设备和存储介质。
发明人意识到,在信保贷款领域中,不同的信保贷款平台在保存的数据会存在差异性以及记录的数据可能存在异常或者缺失。所以导致数据对模型进行训练时,导致模型输入的数据存在许多异常的数据,使得神经网络模型训练时出错的环节比较多,模型所出具的测试报告质量较低,使得研究员无法知道是哪个环节出错以及根据测试报告去调整模型的超参数,进而研究员要浪费大量的时间去调整超参数,从而导致资源的浪费。超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据,例如神经网络的学习率(多种模式),深层神经网络隐藏层数以及k均值聚类中的簇数。
发明内容
本申请提供了一种通过封装的页面开发功能的方法,能够解决现有技术中页面开发效率的过低、无法对版本做快熟迭代的问题。
第一方面,本申请提供一种获取神经网络测试报告方法,包括:
获取特征数据。
将所述特征数据输,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w。所述特征是指特征数据里的至少一项信息,所述第一神经网络的代价函数为:
根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据。
将所述降维后的特征数据输入至第二神经网络。
获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息。
将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
第二方面,本申请提供一种获取神经网络测试报告装置,具有实现对应于上述第一方面提供的获取神经网络测试报告的方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。
所述获取神经网络测试报告装置包括:
输入输出模块模块,用于获取特征数据。
处理模块,用于将将所述特征数据输入至第一神经网络,通过第一神经网络的代价函 数训练所述第一神经网络模型,以得到模型参数w。所述特征是指特征数据里的至少一项信息,所述第一神经网络的代价函数为:
其中y
(i)是指所述特征,w是指所述第一神经网络的模型参数,x
(i)是指所述特征数据,λ为正数,||w||
1表示参数w的L1范数。根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据。将所述降维后的特征数据输入至第二神经网络。获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息。将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
本申请又一方面提供了一种获取神经网络测试报告的设备,其包括至少一个连接的处理器、存储器、输入输出单元,其中,所述输入输出单元、所述处理器、和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述存储器的所述程序指令,其中:
获取特征数据;
将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w;,所述第一神经网络的代价函数为:
根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据;
将所述降维后的特征数据输入至第二神经网络;
获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息;
将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
本申请又一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,用于实现以下步骤:
获取特征数据;
将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w;,所述第一神经网络的代价函数为:
根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据;
将所述降维后的特征数据输入至第二神经网络;
获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息;
将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
相较于现有技术,本申请提供的方案中,通过预处理将与神经网络模型的无关数据剔除以及检测神经网络模型训练的出错环节,完成对神经网络模型训练过程中无关参数的检测以及减少训练的参数。由于训练参数的减少以及训练环节的检测,监控报告可以更好的 监控到参数的变化以及检测训练错误的环节,可以更好的根据参数的变化调整神经网络模型的超参数,获得更符合需求的神经网络模型。
图1为本申请实施例中获取神经网络测试报告方法的一种流程示意图;
图2为本申请实施例获取神经网络测试报告的流程示意图;
图3为本申请实施例获取神经网络测试报告的功能模块示意图。
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行。
请参照图1,以下对本申请提供一种获取神经网络测试报告的方法进行举例说明,所述方法包括:
101、获取特征数据。
所述特征数据至少包括用户性别、用户月收入、用户月支出、用户征信记录、用户住址以及用户月保费。
所述特征数据可以通过单元格格式、xml格式、propretis格式以及yml格式进行保存。所述特征数据可以通过网络获取,也可以通过数据库获取。例如网络获取可以通过python的爬虫进行获取。
102、将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w。
所述特征是指特征数据里的至少一项信息,所述第一神经网络的代价函数为:
所述神经网络是指开发者所建立预测客户贷后还款的神经网络模型。其中,神经网络是指一种复制这种密集的神经元网络的方法。通过一次处理多个数据流,计算机能够显著减少处理数据所需的时间。将这种技术应用于深度学习已经产生了人工神经网络。这些人工神经网络由输入节点、输出节点和节点层组成。
输入节点,用于接收数据的输入节点。
输出节点,用于输出结果数据。
节点层,用于将从输入节点输入的数据转换为输出节点可以使用的内容。节点层是指在输入节点和输出节点之间的多个隐藏节点,节点层也可以成为隐藏层。当数据通过这些隐藏节点前进时,神经网络使用逻辑来决定将数据传递给下一个隐藏节点。
103、根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据。
通过w可以将对训练过程中不产生作用的特征数据数的权重置0。其中客户性别信息在对实际模型训练中不产生任何效果,就要将客户性别信息删除或者对其他信息进行提取,从而加快AI模型的训练速度。
104、将所述降维后的特征数据输入至第二神经网络。
所述第二神经网络可以为任意神经网络模型。例如所述神经网络模型可以是K均值聚类算法(K-means),支持向量机(Support Vector Machine,SVM)以及线性回归。所述聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。
105、获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息。
例如2进制数的第0位代表传第1层神经网络的执行状态。执行完整个流程后,返回一个32位的2进制数作为指标检测神经网络节点执行状态,若第0位是1,则第1层神经网络执行成功,若第0位是0,则执行失败,通过此方法判断所出现问题的神经网络节点。又例如通过神经网络训练时,提取设定节点层的参数作为指标来反馈节点层的训练状况。
106、将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
所述测试报告通过可视化图表统计和展示测试报告的信息。所述可视化图表至少包括条形图、直方图、折线图和饼图。所述可视化图表通过选择可视化图表类型进行选择,可以保存展示任意一项或者多项可视化图表。
一些实施方式中,所述根据所述日志生成测试报告之后,所述方法还包括:
根据所述报告评估所述第二神经网络训练是否成功。
所述根据所述报告评估所述第二神经网络训练是否成功,包括:
根据所述执行状态信息判断训练过程是否出现错误,若没出现错误,则判断所述第二神经网络训练成功。
或者,根据所述第二神经网络参数的上限以及下限,确定参数的范围;所述参数至少包括学习率η、准确率以及损失函数的值;
根据所述变化状态信息以及所述第二神经网络参数范围判断第二神经网络参数是否落在所述参数范围内,若第二神经网络参数落在所述参数范围,则判断所述第二神经网络训练成功。
或者,判断第二神经网络的损失函数的值是否高于阈值,若没高于阈值则判断所述第二神经网络训练成功。所述损失函数是指,其中所述是指损失函数,是指所述降维后的特征数据输入至所述第二神经网络的期望输出,是指所述降维后的特征数据输入至所述第二神经网络的实际输出。
上述实施方式中,抽取所述超参数不同特征组合下的模型的精确度,根据汇总出来的测试报告,选择最优的特征组合。
一些实施方式中,所述根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据之后,所述方法还包括:
对所述降维后的特征数据做归一化处理。所述归一化是指对所述降维后的特征数据进行线性变换,使降维后的特征数据映射到[0,1]之间。所述归一化通过以下数学公式执行:
x
i*=(x
i-min
i)/(max
i-min
i)
其中max
i是指所述降维后的特征数据的第i个特征的最大值,min
i是指所述降维后的 特征数据的第i个特征的最小值,x
i是指所述降维后的特征数据的第i个特征的任意数据,x
i*是指转换后的降维后的特征数据第i个特征特征对应的数据。
上述实施方式中,通过数据归一化可以加快神经网络的训练以及增加神经网络的精确度。
一些实施方式中,所述获取特征数据之前,所述方法还包括:
处理所述特征数据的缺失值。
上述实施方式中,通过处理特征数据的缺失值,使得缺失值可以加载入神经网络模型。
一些实施方式中,所述处理所述特征数据的缺失值至少包括以下实现方式之一:
通过平均值、众数以及中位数对所述缺失值进行填充。
或者,将所述缺失值作为一种状态进行记录。
或者,将缺失值的记录进行删除。
上述实施方式中,通过上述可以对缺失值进行填充。
一些实施方式中,所述获取特征数据之后,所述方法还包括:
对所述特征数据做特征衍生,以得到新的特征。所述特征衍生是指用所述特征数据通过过计数、求和、求比例、做时间差以及寻找所述特征数据的波动率进行衍生。
上述实施方式中,所述特征至少包括预设时间的贷款的次数、预设时间的消费总额、贷款申请额度和预设时间的占比。
一些实施方式中,所述第一神经网络以及所述第二神经网络通过激活函数进行映射神经网络的输出;所述激活函数的数学表现形式如下:
其中y是指所述第一神经网络以及第二神经网络的神经元的输出,x是指所述第一神经网络以及第二神经网络的的神经元的输入,a为非零常数。
上述实施方式中,所述激活函数(Activation Function),就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。
相较于现有技术,本申请提供的方案中,通过预处理将与神经网络模型的无关数据剔除以及检测神经网络模型训练的出错环节,完成对神经网络模型训练过程中无关参数的检测以及减少训练的参数。由于训练参数的减少以及训练环节的检测,监控报告可以更好的监控到参数的变化以及检测训练错误的环节,可以更好的根据参数的变化调整神经网络模型的超参数,获得更符合需求的神经网络模型。
如图2所示的一种获取神经网络测试报告的装置20的结构示意图,其可应用于获取神经网络测试报告。本申请实施例中的获取神经网络测试报告的装置能够实现对应于上述图1所对应的实施例中所执行的获取神经网络测试报告的方法的步骤。获取神经网络测试报告的装置20实现的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。所述获取神经网络测试报告的装置可包括输入输出模块201和处理模块202,所述处理模块202和输入输出模块201的功能实现可参考图1所对应的实施例中所执行的操作,此处不作赘述。输入输出模块201可用于控制所述输入输出模块201的输入、输出以及获取操作。
一些实施方式中,输入输出模块模块,用于获取特征数据。
处理模块,用于将所述特征数据至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w。所述特征是指特征数据里的至少一项信息, 所述第一神经网络的代价函数为:
其中y
(i)是指所述特征,w是指所述第一神经网络的模型参数,x
(i)是指所述特征数据,λ为正数,||w||
1表示参数w的L1范数。根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据。将所述降维后的特征数据输入至第二神经网络。获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息。将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
在一些可能的设计中,所述处理模块202还用于:
根据所述报告评估所述第二神经网络训练是否成功。
所述根据所述报告评估所述第二神经网络训练是否成功,包括:
根据所述执行状态信息判断训练过程是否出现错误,若没出现错误,则判断所述第二神经网络训练成功。
或者,根据所述第二神经网络参数的上限以及下限,确定参数的范围;所述参数至少包括学习率η、准确率以及损失函数的值;
根据所述变化状态信息以及所述第二神经网络参数范围判断第二神经网络参数是否落在所述参数范围内,若第二神经网络参数落在所述参数范围,则判断所述第二神经网络训练成功。
或者,判断第二神经网络的损失函数的值是否高于阈值,若没高于阈值则判断所述第二神经网络训练成功。所述损失函数是指,其中所述是指损失函数,是指所述降维后的特征数据输入至所述第二神经网络的期望输出,是指所述降维后的特征数据输入至所述第二神经网络的实际输出。
在一些可能的设计中,所述处理模块202还用于:
对所述降维后的特征数据做归一化处理。所述归一化是指对所述降维后的特征数据进行线性变换,使降维后的特征数据映射到[0,1]之间。所述归一化通过以下数学公式执行:
x
i*=(x
i-min
i)/(max
i-min
i)
其中max
i是指所述降维后的特征数据的第i个特征的最大值,min
i是指所述降维后的特征数据的第i个特征的最小值,x
i是指所述降维后的特征数据的第i个特征的任意数据,x
i*是指转换后的降维后的特征数据第i个特征特征对应的数据。
在一些可能的设计中,所述处理模块202还用于:
处理所述特征数据的缺失值。
在一些可能的设计中,所述处理模块202还用于:
通过平均值、众数以及中位数对所述缺失值进行填充。
或者,将所述缺失值作为一种状态进行记录。
或者,将缺失值的记录进行删除。
在一些可能的设计中,所述处理模块202还用于:
对所述特征数据做特征衍生,以得到新的特征。所述特征衍生是指用所述特征数据通过过计数、求和、求比例、做时间差以及寻找所述特征数据的波动率进行衍生。
在一些可能的设计中,所述处理模块202还用于:
所述第一神经网络以及所述第二神经网络通过激活函数进行映射神经网络的输出;所述激活函数的数学表现形式如下:
其中y是指所述第一神经网络以及第二神经网络的神经元的输出,x是指所述第一神经网络以及第二神经网络的的神经元的输入,a为非零常数。
上面从模块化功能实体的角度分别介绍了本申请实施例中的创建装置,以下从硬件角度介绍一种计算机设备,如图3所示,其包括:处理器、存储器、输入输出单元(也可以是收发器,图3中未标识出)以及存储在所述存储器中并可在所述处理器上运行的计算机程序。例如,该计算机程序可以为图1所对应的实施例中获取神经网络测试报告的方法对应的程序。例如,当计算机设备实现如图2所示的获取神经网络测试报告的装置20的功能时,所述处理器执行所述计算机程序时实现上述图2所对应的实施例中由获取神经网络测试报告的装置20执行的获取神经网络测试报告的方法中的各步骤。或者,所述处理器执行所述计算机程序时实现上述图2所对应的实施例的获取神经网络测试报告的装置20中各模块的功能。又例如,该计算机程序可以为图1所对应的实施例中获取神经网络测试报告的方法对应的程序。
所称处理器可以是中央处理单元(Centra lProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述输入输出单元也可以用接收器和发送器代替,可以为相同或者不同的物理实体。为相同的物理实体时,可以统称为输入输出单元。该输入输出可以为收发器。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本申请各个实施例所述的方法。其中,所述计算机可读存储介质可以是非易失性,也可以是易失性。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运 用在其他相关的技术领域,这些均属于本申请的保护之内。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (20)
- 一种获取神经网络测试报告的方法,其中,所述方法包括:获取特征数据;将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w;,所述第一神经网络的代价函数为:根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据;将所述降维后的特征数据输入至第二神经网络;获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息;将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
- 根据权利要求1所述的方法,其中,所述根据所述日志生成测试报告之后,所述方法还包括:根据所述报告评估所述第二神经网络训练是否成功;所述根据所述报告评估所述第二神经网络训练是否成功,包括:根据所述执行状态信息判断训练过程是否出现错误,若没出现错误,则判断所述第二神经网络训练成功;或者,根据所述第二神经网络参数的上限以及下限,确定参数的范围;所述参数至少包括学习率η、准确率以及损失函数的值;根据所述变化状态信息以及所述第二神经网络参数范围判断第二神经网络参数是否落在所述参数范围内,若第二神经网络参数落在所述参数范围,则判断所述第二神经网络训练成功;或者,判断第二神经网络的损失函数的值是否高于阈值,若没高于阈值则判断所述第二神经网络训练成功;所述损失函数是指L[(Y,f(X)]=[Y-f(X)] 2,其中所述L[(Y,f(X)]是指损失函数,Y是指所述降维后的特征数据输入至所述第二神经网络的期望输出,f(X)是指所述降维后的特征数据输入至所述第二神经网络的实际输出。
- 根据权利要求1所述的方法,其中,所述根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据之后,所述方法还包括:对所述降维后的特征数据做归一化处理;所述归一化是指对所述降维后的特征数据进行线性变换,使降维后的特征数据映射到[0,1]之间;所述归一化通过以下数学公式执行:x i*=(x i-min i)/(max i-min i)其中max i是指所述降维后的特征数据的第i个特征的最大值,min i是指所述降维后的特征数据的第i个特征的最小值,x i是指所述降维后的特征数据的第i个特征的任意数据,x i*是指转换后的所述降维后的特征数据第i个特征对应的数据。
- 根据权利要求1所述的方法,其中,所述获取特征数据之前,所述方法还包括:处理所述特征数据的缺失值。
- 根据权利要求4所述的方法,其中,所述处理所述特征数据的缺失值至少包括以下实现方式之一:通过平均值、众数以及中位数对所述缺失值进行填充;或者,将所述缺失值作为一种状态进行记录;或者,将缺失值的记录进行删除。
- 根据权利要求1所述的方法,其中,所述获取特征数据之后,所述方法还包括:对所述特征数据做特征衍生,以得到新的特征;所述特征衍生是指用所述特征数据通过过计数、求和、求比例、做时间差以及寻找所述特征数据的波动率进行衍生。
- 一种获取神经网络测试报告的装置,其中,所述装置包括:输入输出模块,获取特征数据;处理模块,将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w;所述特征是指特征数据里的至少一项信息,所述第一神经网络的代价函数为: 其中y (i)是指所述特征,w是指所述第一神经网络的模型参数,x (i)是指所述特征数据,λ为正数,||w|| 1表示参数w的L1范数;根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据;将所述降维后的特征数据输入至第二神经网络;获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络模型训练、入参、出参以及计算过程的执行状态信息;将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
- 一种计算机设备,其中,所述计算机设备包括至少一个处理器、存储器和输入输出单元,所述输入输出单元、所述处理器、和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述存储器的所述程序指令,其中:获取特征数据;将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w;,所述第一神经网络的代价函数为:根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据;将所述降维后的特征数据输入至第二神经网络;获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息;将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
- 根据权利要求9所述的计算机设备,其中,所述处理器用于:根据所述报告评估所述第二神经网络训练是否成功;所述根据所述报告评估所述第二神经网络训练是否成功,包括:根据所述执行状态信息判断训练过程是否出现错误,若没出现错误,则判断所述第二神经网络训练成功;或者,根据所述第二神经网络参数的上限以及下限,确定参数的范围;所述参数至少包括学习率η、准确率以及损失函数的值;根据所述变化状态信息以及所述第二神经网络参数范围判断第二神经网络参数是否落在所述参数范围内,若第二神经网络参数落在所述参数范围,则判断所述第二神经网络训练成功;或者,判断第二神经网络的损失函数的值是否高于阈值,若没高于阈值则判断所述第二神经网络训练成功;所述损失函数是指L[(Y,f(X)]=[Y-f(X)] 2,其中所述L[(Y,f(X)]是指损失函数,Y是指所述降维后的特征数据输入至所述第二神经网络的期望输出,f(X)是指所述降维后的特征数据输入至所述第二神经网络的实际输出。
- 根据权利要求9所述的计算机设备,其中,所述处理器用于:对所述降维后的特征数据做归一化处理;所述归一化是指对所述降维后的特征数据进行线性变换,使降维后的特征数据映射到[0,1]之间;所述归一化通过以下数学公式执行:x i*=(x i-min i)/(max i-min i)其中max i是指所述降维后的特征数据的第i个特征的最大值,min i是指所述降维后的特征数据的第i个特征的最小值,x i是指所述降维后的特征数据的第i个特征的任意数据,x i*是指转换后的所述降维后的特征数据第i个特征对应的数据。
- 根据权利要求9所述的计算机设备,其中,所述处理器用于:处理所述特征数据的缺失值。
- 根据权利要求12所述的计算机设备,其中,所述处理器用于:通过平均值、众数以及中位数对所述缺失值进行填充;或者,将所述缺失值作为一种状态进行记录;或者,将缺失值的记录进行删除。
- 根据权利要求9所述的计算机设备,其中,所述处理器用于:对所述特征数据做特征衍生,以得到新的特征;所述特征衍生是指用所述特征数据通过过计数、求和、求比例、做时间差以及寻找所述特征数据的波动率进行衍生。
- 一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,用于实现以下步骤:获取特征数据;将所述特征数据输入至第一神经网络,通过第一神经网络的代价函数训练所述第一神经网络模型,以得到模型参数w;,所述第一神经网络的代价函数为:根据模型参数w对所述特征数据进行降维,以获得降维后的特征数据;将所述降维后的特征数据输入至第二神经网络;获取所述第二神经网络训练过程中的所述第二神经网络参数的变化状态信息,以及获取所述第二神经网络训练、入参、出参以及计算过程的执行状态信息;将所述变化状态信息以及所述执行状态信息汇总成日志,根据所述日志生成测试报告。
- 根据权利要求16所述的计算机可读存储介质,其中,所述程序指令被处理器执行时,还用于实现以下步骤:根据所述报告评估所述第二神经网络训练是否成功;所述根据所述报告评估所述第二神经网络训练是否成功,包括:根据所述执行状态信息判断训练过程是否出现错误,若没出现错误,则判断所述第二神经网络训练成功;或者,根据所述第二神经网络参数的上限以及下限,确定参数的范围;所述参数至少包括学习率η、准确率以及损失函数的值;根据所述变化状态信息以及所述第二神经网络参数范围判断第二神经网络参数是否落在所述参数范围内,若第二神经网络参数落在所述参数范围,则判断所述第二神经网络训练成功;或者,判断第二神经网络的损失函数的值是否高于阈值,若没高于阈值则判断所述第二神经网络训练成功;所述损失函数是指L[(Y,f(X)]=[Y-f(X)] 2,其中所述L[(Y,f(X)]是指损失函数,Y是指所述降维后的特征数据输入至所述第二神经网络的期望输出,f(X)是指所述降维后的特征数据输入至所述第二神经网络的实际输出。
- 根据权利要求16所述的计算机可读存储介质,其中,所述程序指令被处理器执行时,还用于实现以下步骤:对所述降维后的特征数据做归一化处理;所述归一化是指对所述降维后的特征数据进行线性变换,使降维后的特征数据映射到[0,1]之间;所述归一化通过以下数学公式执行:x i*=(x i-min i)/(max i-min i)其中max i是指所述降维后的特征数据的第i个特征的最大值,min i是指所述降维后的特征数据的第i个特征的最小值,x i是指所述降维后的特征数据的第i个特征的任意数据,x i*是指转换后的所述降维后的特征数据第i个特征对应的数据。
- 根据权利要求16所述的计算机可读存储介质,其中,所述程序指令被处理器执行时,还用于实现以下步骤:处理所述特征数据的缺失值。
- 根据权利要求19所述的计算机可读存储介质,其中,所述程序指令被处理器执行时,还用于实现以下步骤:通过平均值、众数以及中位数对所述缺失值进行填充;或者,将所述缺失值作为一种状态进行记录;或者,将缺失值的记录进行删除。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910666325.6 | 2019-07-23 | ||
CN201910666325.6A CN110503198A (zh) | 2019-07-23 | 2019-07-23 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021012894A1 true WO2021012894A1 (zh) | 2021-01-28 |
Family
ID=68586705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2020/098841 WO2021012894A1 (zh) | 2019-07-23 | 2020-06-29 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110503198A (zh) |
WO (1) | WO2021012894A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503198A (zh) * | 2019-07-23 | 2019-11-26 | 平安科技(深圳)有限公司 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
CN111738886B (zh) * | 2020-06-30 | 2021-04-30 | 上海松鼠课堂人工智能科技有限公司 | 基于神经网络的学习报告分析系统 |
CN111898742A (zh) * | 2020-08-05 | 2020-11-06 | 上海眼控科技股份有限公司 | 一种用于监控神经网络模型训练状态的方法与设备 |
CN114338248B (zh) * | 2022-03-15 | 2022-08-05 | 北京大学 | 基于机器学习的用户异常行为检测方法及装置 |
CN115261963A (zh) * | 2022-09-27 | 2022-11-01 | 南通如东依航电子研发有限公司 | 一种用于pcb板深镀能力提高的方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003021528A2 (en) * | 2001-08-29 | 2003-03-13 | Honeywell International Inc. | A combinatorial approach for supervised neural network learning |
CN105787500A (zh) * | 2014-12-26 | 2016-07-20 | 日本电气株式会社 | 基于人工神经网络的特征选择方法和装置 |
CN106779051A (zh) * | 2016-11-24 | 2017-05-31 | 厦门中控生物识别信息技术有限公司 | 一种卷积神经网络模型参数处理方法及系统 |
CN108491927A (zh) * | 2018-03-16 | 2018-09-04 | 新智认知数据服务有限公司 | 一种基于神经网络的数据处理方法和装置 |
CN109344968A (zh) * | 2018-10-10 | 2019-02-15 | 郑州云海信息技术有限公司 | 一种神经网络的超参数处理的方法及装置 |
CN110503198A (zh) * | 2019-07-23 | 2019-11-26 | 平安科技(深圳)有限公司 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11100399B2 (en) * | 2017-11-21 | 2021-08-24 | International Business Machines Corporation | Feature extraction using multi-task learning |
CN108711100A (zh) * | 2018-05-20 | 2018-10-26 | 冯世程 | 一种基于神经网络的p2p平台运营风险评估的系统 |
CN109443382B (zh) * | 2018-10-22 | 2022-05-17 | 北京工业大学 | 基于特征提取与降维神经网络的视觉slam闭环检测方法 |
CN109544190A (zh) * | 2018-11-28 | 2019-03-29 | 北京芯盾时代科技有限公司 | 一种欺诈识别模型训练方法、欺诈识别方法及装置 |
US20190164057A1 (en) * | 2019-01-30 | 2019-05-30 | Intel Corporation | Mapping and quantification of influence of neural network features for explainable artificial intelligence |
-
2019
- 2019-07-23 CN CN201910666325.6A patent/CN110503198A/zh active Pending
-
2020
- 2020-06-29 WO PCT/CN2020/098841 patent/WO2021012894A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003021528A2 (en) * | 2001-08-29 | 2003-03-13 | Honeywell International Inc. | A combinatorial approach for supervised neural network learning |
CN105787500A (zh) * | 2014-12-26 | 2016-07-20 | 日本电气株式会社 | 基于人工神经网络的特征选择方法和装置 |
CN106779051A (zh) * | 2016-11-24 | 2017-05-31 | 厦门中控生物识别信息技术有限公司 | 一种卷积神经网络模型参数处理方法及系统 |
CN108491927A (zh) * | 2018-03-16 | 2018-09-04 | 新智认知数据服务有限公司 | 一种基于神经网络的数据处理方法和装置 |
CN109344968A (zh) * | 2018-10-10 | 2019-02-15 | 郑州云海信息技术有限公司 | 一种神经网络的超参数处理的方法及装置 |
CN110503198A (zh) * | 2019-07-23 | 2019-11-26 | 平安科技(深圳)有限公司 | 获取神经网络测试报告的方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110503198A (zh) | 2019-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021012894A1 (zh) | 获取神经网络测试报告的方法、装置、设备和存储介质 | |
Chen et al. | Selecting critical features for data classification based on machine learning methods | |
CN111178456B (zh) | 异常指标检测方法、装置、计算机设备和存储介质 | |
US20200401939A1 (en) | Systems and methods for preparing data for use by machine learning algorithms | |
US20200210899A1 (en) | Machine learning model training method and device, and electronic device | |
Young et al. | A survey of methodologies for the treatment of missing values within datasets: Limitations and benefits | |
WO2019205325A1 (zh) | 确定用户风险等级的方法、终端设备及计算机可读存储介质 | |
WO2017013529A1 (en) | System and method for determining credit worthiness of a user | |
CN110991474A (zh) | 一种机器学习建模平台 | |
CN110471945B (zh) | 活跃数据的处理方法、系统、计算机设备和存储介质 | |
US20230004979A1 (en) | Abnormal behavior detection method and apparatus, electronic device, and computer-readable storage medium | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN112365007A (zh) | 模型参数确定方法、装置、设备及存储介质 | |
CN116414815A (zh) | 数据质量检测方法、装置、计算机设备和存储介质 | |
CN111949496B (zh) | 一种数据检测方法及装置 | |
CN114238062B (zh) | 板卡烧录装置性能分析方法、装置、设备及可读存储介质 | |
CN116188174A (zh) | 基于模块度和互信息的保险欺诈检测方法及系统 | |
CN116384502B (zh) | 联邦学习中参与方价值贡献计算方法、装置、设备及介质 | |
CN114741673B (zh) | 行为风险检测方法、聚类模型构建方法、装置 | |
CN114510518B (zh) | 一种海量结构化数据的自适应聚合方法、系统及电子设备 | |
US20220318327A1 (en) | Ranking similar users based on values and personal journeys | |
US20240095598A1 (en) | Data processing methods and computer systems for wavelakes signal intelligence | |
CN117743169A (zh) | 自动化测试模型的训练方法、装置、设备和存储介质 | |
CN117911172A (zh) | 财务数据处理方法、装置、计算机设备和存储介质 | |
CN114398778A (zh) | 一种广告异常流量检测模型建立方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20843414 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20843414 Country of ref document: EP Kind code of ref document: A1 |