CN108334935B - 精简输入的深度学习神经网络方法、装置和机器人系统 - Google Patents
精简输入的深度学习神经网络方法、装置和机器人系统 Download PDFInfo
- Publication number
- CN108334935B CN108334935B CN201711331068.8A CN201711331068A CN108334935B CN 108334935 B CN108334935 B CN 108334935B CN 201711331068 A CN201711331068 A CN 201711331068A CN 108334935 B CN108334935 B CN 108334935B
- Authority
- CN
- China
- Prior art keywords
- input variable
- neural network
- deep learning
- input
- learning neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种深度学习神经网络方法,该方法包括:对第一深度学习神经网络进行测试得到第一输出正确率,将第一深度学习神经网络的输入层的每个输入变量作为一个输入变量组合组成尝试删除输入变量组合的集合,尝试删除输入变量组合的集合中选取一个输入变量组合,根据输入变量组合得到第二深度学习神经网络,对得到的第二深度学习神经网络进行测试得到第二输出正确率,根据第一输出正确率和第二输出正确率生成了可选删除输入变量组合的集合,在可选删除输入变量组合的集合中选取优选删除的输入变量组合,根据优选删除的输入变量组合得到第三深度学习神经网络。此外,还提供了一种深度学习神经网络装置、一种计算机设备、一种机器人系统和计算机可读存储介质。
Description
技术领域
本发明涉及机器学习领域,特别是涉及一种精简输入的深度学习神经网络方法、装置、计算机设备、机器人系统和存储介质。
背景技术
人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为“神经网络”或类神经网络。
传统技术中,因为缺乏对必要输入变量的确定方法,使得很多输入变量都是多余的,而对于神经网络根据输入变量预测输出,有些输入变量并没有起到决定性的作用,反而增加了数据采集的成本,造成了人力物力的浪费。
发明内容
基于此,有必要针对上述问题,提供一种能够有效避免由于输入变量冗余导致数据采集成本过高的精简输入的深度学习神经网络方法、装置、计算机设备、机器人系统和存储介质。
一种深度学习神经网络方法,该方法包括:
对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率;
将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合;
从尝试删除输入变量组合的集合中选取一个输入变量组合;
将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率;
根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合;
从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
在其中一个实施例中,根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合,包括:根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合;根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合。
在其中一个实施例中,根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合,包括:当第一输出正确率与第二输出正确率的差值大于预设阈值时,则将选取的输入变量组合从尝试删除输入变量组合的集合中删除;反之,则将选取的输入变量组合从尝试删除输入变量组合的集合中删除,并将输入变量组合加入可删除输入变量组合的集合。
在其中一个实施例中,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合,包括:判断更新后的尝试删除输入变量组合的集合是否为空,若否,则返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;若是,则判断更新后的可删除输入变量组合的集合是否为空,如果更新后的可删除输入变量组合的集合不为空,则将可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合的集合中。
在其中一个实施例中,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合之后,包括:将可选删除输入变量组合的输入变量两两组合得到新的输入变量组合;当新的输入变量组合在可选删除输入变量组合中不存在时,则将新的输入变量组合加入到尝试删除输入变量组合的集合中,返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤。
在其中一个实施例中,对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据作为第一深度学习神经网络的输入进行测试,得到第一实际输出标签;获取第一实际输出标签与预期标签一致的次数占总测试次数的比值,得到第一输出正确率;
对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据中对应的未删除输入变量对应的数据作为第二深度学习神经网络的输入进行测试,得到第二实际输出标签;获取第二实际输出标签与预期标签一致的次数占总测试次数的比值,得到第二输出正确率。
在其中一个实施例中,从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,包括:当可选删除输入变量组合的集合不为空时,从可选删除输入变量组合的集合中选取输入变量对应的数据采集成本最高的输入变量组合作为优选删除的输入变量组合。
一种深度学习神经网络装置,该装置包括:
第一输出正确率获取模块,用于对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率;
第一生成模块,用于将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合;
选取模块,用于从尝试删除输入变量组合的集合中选取一个输入变量组合;
第一创建模块,用于将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
第二输出正确率获取模块,用于对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率;
第二生成模块,用于根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合;
第二创建模块,用于从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行所述程序时实现以下步骤:
对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率;
将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合;
从尝试删除输入变量组合的集合中选取一个输入变量组合;
将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率;
根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合;
从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率;
将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合;
从尝试删除输入变量组合的集合中选取一个输入变量组合;
将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率;
根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合;
从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
一种机器人系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的机器人程序,该处理器执行所述程序时实现以下步骤:
对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率;
将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合;
从尝试删除输入变量组合的集合中选取一个输入变量组合;
将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率;
根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合;
从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
上述精简输入的深度学习神经网络方法、装置、计算机设备和存储介质,通过对第一深度学习神经网络进行测试得到第一输出正确率,在将第一深度学习神经网络的输入层的每个输入变量作为一个输入变量组合组成尝试删除输入变量组合的集合,在这个尝试删除输入变量组合的集合中随机选取一个输入变量组合,根据该输入变量组合得到第二深度学习神经网络,并对得到的第二深度学习神经网络进行测试得到第二输出正确率,根据得到的第一输出正确率和第二输出正确率生成了可选删除输入变量组合的集合,在这些可选删除输入变量组合的集合中选取优选删除的输入变量组合,根据优选删除的输入变量组合得到第三深度学习神经网络。在最后得到的第三深度学习神经网络的输入变量中就没有很多非必要输入变量,因此,不需要采集过多的输入变量,从而大大地降低了数据采集成本。
附图说明
图1为一个实施例中深度学习神经网络方法的应用环境图;
图2为一个实施例中计算机设备的内部结构图;
图3为一个实施例中深度学习神经网络方法的流程图;
图4为一个实施例中根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合的流程图;
图5为一个实施例中根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合的流程图;
图6为另一个实施例中根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合的流程图;
图7为另一个实施例中深度学习神经网络方法的流程图;
图8为一个实施例中深度学习神经网络装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了一个实施例中深度学习神经网络方法的应用环境图。参照图1,该深度学习神经网络方法可应用于深度学习神经网络方法的系统中,该系统包括多个终端110和服务器120,终端110通过网络与服务器120连接。终端110可以是但不限于各种能运行游戏应用的个人计算机、笔记本电脑、个人数字助理、智能手机、平板电脑等。服务器120可以是实现单一功能的服务器,也可以是实现多种功能的服务器,具体可以是独立的物理服务器,也可以是物理服务器集群。终端110上可通过特定的应用显示数据输入界面,服务器120可接收终端110从尝试删除输入变量组合的集合中选取一个输入变量组合,服务器120再根据选取的输入变量组合对应的第一深度学习神经网络的输入节点删除得到第二深度学习神经网络。具体的,当服务器120对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率,将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合,再从尝试删除输入变量组合的集合中选取一个输入变量组合,服务器120根据选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络,进一步对第二深度学习神经网络进行测试,得到第二深度学习神经网络网络的第二输出正确率,再根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合,最后从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
图2为一个实施例中计算机设备的内部结构示意图。该计算机设备具体可以是如图1中的服务器120。如图2所示,计算机设备包括通过系统总线连接的处理器、存储介质、内存储器、网络接口、显示屏和输入神经网络系统。其中,该处理器用于提供计算和控制能力,支撑整个终端的运行。计算机设备的存储介质存储有操作系统以及计算机程序,该计算机程序被处理器执行时,使得处理器实现一种深度学习神经网络方法。计算机设备中的内存储器也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种深度学习神经网络方法。计算机设备的网络接口用于与服务器120通信。计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是外接的键盘、触控板或鼠标等,输入装置可获取用户使用手指对显示屏显示的操作界面产生的指令,例如从尝试删除输入变量组合的集合中选取一个输入变量组合等。显示屏可用于显示输入界面或输出变量的数据结果。
本领域技术人员可以理解,图2中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,机器人系统包括通过系统总线连接的处理器、存储介质、内存储器、网络接口、显示屏和输入神经网络系统。其中,该处理器用于提供计算和控制能力,支撑整个终端的运行。机器人系统的存储介质存储有操作系统以及机器人程序,该机器人程序被处理器执行时,使得处理器实现一种深度学习神经网络方法。机器人系统中的内存储器也可储存有机器人程序,该机器人程序被处理器执行时,可使得处理器执行一种深度学习神经网络方法。机器人系统的网络接口用于与服务器120通信。机器人系统的输入装置可以是显示屏上覆盖的触摸层,也可以是外接的键盘、触控板或鼠标等,输入装置可获取用户使用手指对显示屏显示的操作界面产生的指令,例如从尝试删除输入变量组合的集合中选取一个输入变量组合等。显示屏可用于显示输入界面或输出变量的数据结果。
如图3所示,在一个实施例中,提供了一种深度学习神经网络方法,该方法以应用于如图1所示的服务器中进行举例说明。包括:
步骤302,对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率。
由于可以根据训练好的深度学习神经网络进行预测,但是需要对训练好的第一深度学习神经网络进行测试才能得知第一深度学习神经网络的的第一输出正确率,具体的,第一输出正确率越大说明第一深度学习神经网络根据输入数据得到输出标签与该输入数据对应的预期标签一致的数量越多。
在每次测试中,将输入数据输入第一深度学习神经网络,计算得到输出标签,并比较该输出标签与该个输入数据对应的预期标签是否一致。将输出标签与预期标签一致的测试次数除以总测试次数,得到第一深度学习神经网络的第一输出正确率。
步骤304,将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合。
由于训练好的第一深度学习神经网络的都设置有输入变量,将训练好的第一深度学习神经网络的每个输入变量作为一个组合,将所有输入变量组合组成尝试删除输入变量组合的集合,也就是说,输入变量组合是尝试删除输入变量组合的集合的子集。
步骤306,从尝试删除输入变量组合的集合中选取一个输入变量组合。
步骤308,将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络。
在尝试删除输入变量组合的集合中随机选取一个输入变量组合,将该随机选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,其中,尝试删除输入变量组合的集合是指等待后面进行尝试删除输入变量组合的总集合,输入节点指的是组成第一深度学习神经网络输入层的多个输入节点,也就是说,每个输入节点对应一个输入变量,如果选取的输入变量组合有多个输入变量,那么就需要将这多个输入变量对应的输入节点在第一深度学习神经网络中的输入层删除,包括这个输入节点以及该输入节点与其他隐层节点的所有连接都要删除,才能够得到第二深度学习神经网络。
步骤310,对第二深度学习神经网络进行测试,得到第二深度学习神经网络网络的第二输出正确率。
由于需要对第二深度学习神经网络进行测试,同样的,测试得到第二深度学习神经网络的第二输出正确率越大代表第二深度学习神经网络根据输入数据计算得到的输出标签与该输入数据对应的预期标签一致的次数越多。
在每次测试中,将输入数据输入第二深度学习神经网络,计算得到输出标签,并比较该输出标签与该个输入数据对应的预期标签是否一致。将输出标签与预期标签一致的测试次数除以总测试次数,得到第二深度学习神经网络的第二输出正确率。
步骤312,根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合。
在对第一深度学习神经网络进行测试得到第一输出正确率和对第二深度学习神经网络进行测试得到第二输出正确率时,在尝试删除中由于会对从尝试删除输入变量组合的集合中选取的一个输入变量组合进行尝试删除,再根据第一输出正确率和第二输出正确率判断第二深度学习神经网络是否符合要求,当第二深度学习神经网络符合要求时,需要将选取的输入变量组合加入到可删除输入变量组合的集合中,所以又获得了新的可删除输入变量组合的集合,但是需要将这些可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合中。
步骤314,从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
由于很多可删除输入变量组合的集合中的输入变量组合加入到了可选删除输入变量组合的集合中,所以选取一个输入变量组合作为优选删除的输入变量组合,其中,优选删除的输入变量组合是指最值得删除的输入变量组合,由于每个优选删除的输入变量组合中的各输入变量都有对应的输入节点,将这些输入节点在对应的第二深度学习网络中的输入层删除,包括这些输入节点以及这些输入节点与其他节点的所有连接都进行删除,才能得到第三深度学习神经网络。
本实施例中,通过对第一深度学习神经网络进行测试得到第一输出正确率,在将第一深度学习神经网络的输入层的每个输入变量作为一个输入变量组合组成尝试删除输入变量组合的集合,在这个尝试删除输入变量组合的集合中随机选取一个输入变量组合,根据该输入变量组合得到第二深度学习神经网络,并对得到的第二深度学习神经网络进行测试得到第二输出正确率,根据得到的第一输出正确率和第二输出正确率生成了可选删除输入变量组合的集合,在这些可选删除输入变量组合的集合中选取优选删除的输入变量组合,根据优选删除的输入变量组合得到第三深度学习神经网络。最后得到的第三深度学习神经网络的输入层就并没有那么多非必要的输入变量,因此,不需要在采集过多的输入变量才能预测出输入变量对应的标签了。
如图4所示,在一个实施例中,根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合,包括:
步骤402,根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合。
可以根据第一输出正确率和第二输出正确率得知第二深度学习神经网络是否符合要求,如果不符合要求,说明尝试删除选取的输入变量组合失败了。又因为从尝试删除删除输入变量组合中选取的输入变量组合已经尝试过删除,虽然失败了,但是还是需要将这个输入变量组合从尝试删除输入变量组合的集合中删除,防止后续重复对该输入变量组合进行测试。反之,如果输入变量组合尝试删除成功了,不仅需要将该输入变量组合从尝试删除输入变量组合的集合中删除,还需要将该输入变量组合加入到可删除输入变量组合的集合。
步骤404,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合。
在对尝试删除输入变量组合的集合进行更新后,需要对尝试删除输入变量组合的集合进行判断,如果该尝试删除输入变量组合的集合不为空,就说明尝试删除输入变量组合的集合中还有输入变量组合没有进行尝试删除,需要对这些输入变量组合继续进行尝试删除直到尝试删除输入变量组合的集合都为空,同样的,还需要对可删除输入变量组合的集合进行判断,如果尝试删除输入变量组合的集合为空,但是可删除输入变量组合的集合不为空时,说明在测试中又获得了新的可删除输入变量组合的集合中的输入变量组合,所以需要将这些新的可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合的集合中,又需要将可删除输入变量组合的集合清空供以后的步骤使用。
本实施例中,通过生成尝试删除输入变量组合的集合、可删除输入变量组合的集合以及可选删除输入变量组合的集合,通过一次次测试将这些集合清空,避免重复对同一个输入变量组合进行尝试删除,同时保证最后得到第三深度学习神经网络的输入层没有很多非必要的输入变量。
如图5所示,在一个实施例中,根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合,包括:
步骤502,判断第一输出正确率与第二输出正确率的差值是否大于预设阈值,若是,则进入步骤504,若否,则进入步骤506。
在判断第一输出正确率与第二输出正确率的差值之前,已经设置好预设阈值,当第一输出正确率与第二输出正确率的差值大于预设阈值,说明第二深度学习神经网络的第二输出正确率不符合要求,与第一深度学习神经网络的第一输出正确率的差距超过了可以容忍的预设阈值,则进入步骤504,反之,如果第一输出正确率与第二输出正确率的差值小于或等于预设阈值,则说明第二深度学习神经网络的第二输出正确率与第一深度学习神经网络的第一输出正确率的差距未超过了可以容忍的预设阈值,则进入步骤506。
步骤504,选取的输入变量组合从尝试删除输入变量组合的集合中删除。
当第二深度学习神经网络的第二输出正确率与第一深度学习神经网络的第一输出正确率的差距超过了预设阈值,说明可以放弃之前从尝试删除输入变量组合的集合中选取的输入变量组合,尝试删除选取输入变量组合失败,但是又由于该输入变量组合已经尝试删除过了,所以需要将该输入变量组合从待删除输入变量组合的集合中删除,防止后面对该输入变量组合重复测试。例如,预设阈值为5%,对第一深度学习神经网络进行测试得到的第一输出正确率为99%,对第二深度学习神经网络进行测试得到的第二输出正确率为92%,输入变量组合为输入变量组合P,因为99%-92%=7%大于预设阈值5%,所以说明输入变量组合P已经尝试删除失败了,需要将输入变量组合P从尝试删除输入变量组合的集合中删除。
步骤506,选取的输入变量组合从尝试删除输入变量组合的集合中删除,并将输入变量组合加入可删除输入变量组合的集合。
当第二深度学习神经网络的第二输出正确率与第一深度学习神经网络的第一输出正确率的差距未超过预设阈值,说明第二深度学习神经网络的第二输出正确率符合要求,之前从尝试删除输入变量组合的集合中选取的输入变量组合尝试删除成功,所以要将可删除输入变量组合的集合中的输入变量组合加入到可删除输入变量组合的集合中,同样的,因为输入变量组合已经尝试过删除了,所以也需要将该输入变量组合从尝试删除删除输入变量组合中删除。例如,预设阈值为10%,对第一深度学习神经网络进行测试得到的第一输出正确率为99%,对第二深度学习神经网络进行测试得到的第二输出正确率为92%,输入变量组合为输入变量组合P,因为99%-92%=7%小于预设阈值10%,所以说明输入变量组合P已经尝试删除成功了,需要将输入变量组合P加入到可删除输入变量组合的集合中,并且将输入变量组合P从尝试删除输入变量组合的集合中删除。
在一个实施例中,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合,包括:判断更新后的尝试删除输入变量组合的集合是否为空,若否,则返回所述从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;若是,则判断更新后的可删除输入变量组合的集合是否为空,如果更新后的可删除输入变量组合的集合不为空,则将可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合的集合中。
如图6所示,在一个实施例中,根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合,包括:
步骤602,根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合。
如上所述,根据第一输出正确率和第二输出正确率可以判断第二深度学习神经网络是否符合要求,但是不管是否符合要求,由于从尝试删除输入变量组合随机选取的输入变量组合已经尝试过删除了,所以都需要从尝试删除输入变量组合的集合中随机选取的一个输入变量组合从尝试删除输入变量组合的集合中删除,但是由于第二深度学习神经网络的输出正确率符合要求,除了删除选取的输入变量组合之外,还需要将选取的输入变量组合加入到可删除输入变量组合的集合中。
步骤604,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合。
由于将选取的输入变量组合从尝试删除输入变量组合的集合中删除,对尝试删除输入变量组合的集合进行了更新,进一步地生成了可删除输入变量组合的集合,如上所述,如果尝试删除输入变量组合的集合不为空,就得重新进行从尝试删除输入变量组合的集合中选取一个输入变量组合进行尝试删除,直到尝试删除输入变量组合的集合为空,但是如果尝试删除输入变量组合的集合为空,又需要将可删除输入变量组合的集合的所有输入变量加入到可选删除输入变量组合的集合中,然后对可删除输入变量组合的集合进行清空以供将来使用。
步骤606,将可选删除输入变量组合的输入变量两两组合得到新的输入变量组合。
在将可删除输入变量组合的集合的所有输入变量加入到可选删除输入变量组合的集合后,由于在可删除输入变量组合的集合中的输入变量组合的加入,那么可选删除输入变量组合的输入变量进行组合时会形成新的输入变量组合。
步骤608,当新的输入变量组合在可选删除输入变量组合中不存在时,则将新的输入变量组合加入到尝试删除输入变量组合的集合中,返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤。
在生成新的输入变量组合之后,需要对新的输入变量组合进行判断,如果新的输入变量组合存在可选删除输入变量组合的集合中,那么肯定是在以前就加入过的尝试删除输入变量组合的集合中而且并测试过,所以不需要重复进行测试,也就不需要加入尝试删除输入变量组合的集合中,但是,如果新的输入变量组合不存在可选删除输入变量组合的集合中,才需要将生成的新的输入变量组合加入到尝试删除输入变量组合的集合中,由于这些加入到尝试删除输入变量组合的集合中的新的输入变量组合还没有在第一深度学习神经网络中进行尝试删除,所以需要返回到从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤中进行尝试删除。
在一个实施例中,对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据作为第一深度学习神经网络的输入进行测试,得到第一实际输出标签;获取第一实际输出标签与预期标签一致的次数占总测试次数的比值,得到第一输出正确率。
本实施例中,通过获取带有预期标签的多个输入数据及其对应的预期标签,将每个输入数据作为测试的第一深度学习神经网络的输入得到第一实际输出标签,将该第一实际输出标签与该预期标签判断是否一致,计算第一实际输出标签与预期标签一致的次数占总测试次数的比值,得到第一深度学习神经网络的第一输出正确率。例如,有10000个带有预期标签的多个输入数据。每次测试将每个输入数据输入第一深度学习神经网络,得到第一实际输出标签,并比较该第一实际输出标签与该输入数据对应的预期标签是否相同。统计发现第一实际输出标签与预期标签一致的测试次数为9900,测试总次数为10000,那么输入数据对应的第一实际输出标签与对应的预期标签一致的概率为9900/10000,得到第一深度学习神经网络的第一输出正确率为99%。
在一个实施例中,对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据中对应的未删除输入变量对应的数据作为第二深度学习神经网络的输入进行测试,得到第二实际输出标签;获取第二实际输出标签与所述预期标签一致的次数占总测试次数的比值,得到第二输出正确率。
本实施例中,由于在得到第二输出正确率之前,将测试过的第一深度学习神经网络的输入变量作为一个输入组合加入尝试删除删除输入变量的组合的集合,在这个尝试删除输入变量组合的集合中选取一个输入变量组合,将这个输入变量组合对应的第一深度学习神经网络的输入层的输入节点删除,包括与该输入节点连接的其他节点都删除才能够得到第二深度学习神经网络,所以需要根据带有预期标签的多个输入数据中对应未删除输入变量的数据作为第二深度学习神经网络的输入得到第二实际输出数据,计算第二实际输出数据与该输入数据对应的预期标签一致的次数占总测试次数的比值,得到第二输入正确率。例如,将预先的10000个带有预期标签的多个输入数据。每次测试将每个输入数据中对应未删除输入变量的数据输入到第二深度学习神经网络,得到第二实际输出标签,并比较该第二实际输出标签与该输入数据对应的预期标签是否相同。统计发现第二实际输出标签与预期标签一致的测试次数为9200,测试总次数为10000,那么输入数据对应的第二实际输出标签与对应的预期标签一致的概率为9200/10000,得到第二深度学习神经网络的输出正确率92%。
在一个实施例中,从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,包括:当可选删除输入变量组合的集合不为空时,从可选删除输入变量组合的集合中选取输入变量对应的数据采集成本最高的输入变量组合作为优选删除的输入变量组合。
本实施例中,当获得的可选删除输入变量组合的集合不为空时,需要从集合中选一个输入变量组合作为优选删除的输入变量组合,其中,优选删除的输入变量组合指的是可选删除输入变量组合的集合中的输入变量对应的数据采集成本最高的输入变量组合。在选取优选删除的输入变量组合后,得到的第三深度学习神经网络的输入变量对应的数据采集成本就能降低很多。例如,可选删除输入变量组合的集合中有多个输入变量组合:(血液检查结果、体重),(血液检查结果),(体重),且各个输入变量的成本为:血液检查结果的获取成本>尿液检查结果的获取成本>血压的获取成本>体重的获取成本,则成本最高的显然是(血液检查结果、体重)。
如图7所示,在一个实施例中,提供了一种深度学习神经网络方法,该方法以应用于如图1所示的服务器中进行举例说明。包括:
步骤702,对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率。
因为训练过的第一深度学习神经网络可以进行预测,所以需要对第一深度学习神经网络进行测试,得到对应的第一输出正确率。其中,第一输出正确率越高代表第一深度学习神经网络的预测准确率越高。
步骤704,将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合。
由于已经测试过的第一深度学习神经网络都设置有输入变量,将测试过的第一深度学习神经网络的输入层的每个输入变量作为一个组合,将所有输入变量的组合组成尝试删除输入变量组合的集合。其中,尝试删除输入变量组合的集合是指等尝试删除的输入变量组合组成的集合。例如,第一深度学习神经网络的输入层的所有输入变量为“体重、血压、血液检查结果、尿液检查结果”,则将每个输入变量作为一个输入变量组合,即将输入变量组合“体重”、输入变量组合“血压”、输入变量组合“血液检查结果”、输入变量组合“尿液检查结果”加入尝试删除输入变量组合的集合。
步骤706,从尝试删除输入变量组合的集合中选取一个输入变量组合。
步骤708,将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络。
在尝试删除输入变量组合的集合中随机选取一个输入变量组合,因为每个输入变量组合在第一深度学习神经网络的输入层都有一个对应的输入节点,每个输入节点都会连接着其他输入节点,所以将随机选取的输入变量组合对应的输入节点从第一深度学习神经网络中的输入层删除,包括这个输入节点以及与该输入节点连接的其他输入节点都从第一深度学习神经网络中的输入层中删除,得到第二深度学习神经网络。例如,从尝试删除输入变量组合的集合{输入变量组合“体重”、输入变量组合“血压”、输入变量组合“血液检查结果”、输入变量组合“尿液检查结果”}中选取一个输入变量组合“体重”,将输入变量组合“体重”对应的第一深度学习神经网络的输入层的输入节点删除,同时删除该输入节点与其他节点的所有连接,得到第二深度学习神经网络。
步骤710,对第二深度学习神经网络进行测试,得到所述第二深度学习神经网络的第二输出正确率。
同样的,因为训练过的第二深度学习神经网络可以进行预测,所以需要对第二深度学习神经网络进行测试,得到对应的第二输出正确率。其中,第二输出正确率越高代表第二深度学习神经网络的预测准确率越高。具体的,获取带有预期标签的多个输入数据以及对应的预期标签,将多个输入数据作为第二深度学习神经网络的输入得到对应的实际输出标签,计算实际输出标签与该输入数据对应的预期标签一致的次数占总测试次数,得到第二输出正确率。
步骤712,根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合。
通过已经得到第一输出正确率和第二输出正确率对尝试删除输入变量组合的集合进行更新,在更新的过程中生成可删除输入变量组合的集合,其中,可删除输入变量组合的集合是指测试成功删除的输入变量组合组成的集合。具体的,通过第一输出正确率和第二输出正确率判断第二深度神经学习网络是否符合要求,如果不符合要求,就说明第二深度学习神经网络与第一深度学习神经网络的输出正确率的差值超过了预设阈值,所以对选取的输入变量组合尝试删除失败,又因为选取的输入变量组合已经尝试删除过了,所以需要将选取的输入变组合从尝试删除输入变量组合的集合中删除;如果通过第一输出正确率和第二输出正确率判断第二深度神经学习网络符合要求,就说明第二深度学习神经网络与第一深度学习神经网络的输出正确率的差值未超过了预设阈值,对选取的输入变量组合尝试删除成功,所以需要将尝试删除成功的选取的输入变量组合加入到可删除输入变量组合的集合中,同样的,不管第二深度学习神经网络是否符合要求,因为选取的输入变量组合都已经进行过尝试删除了,所以都需要将输入变量组合从尝试删除输入变量组合的集合中删除,防止后续对测试过的输入变量组合重复尝试删除。
步骤714,判断更新后的尝试删除输入变量组合的集合是否为空,若是,则进入步骤716,若否,则进入步骤706。
在更新尝试删除输入变量组合后,需要判断更新后的尝试删除输入变量组合的集合,如果更新后的尝试删除输入变量组合的集合为空,说明尝试删除输入变量组合的集合中的所有输入变量组合都已经进行尝试删除了,进入步骤716。
反之,如果更新后的尝试删除输入变量组合的集合不为空,说明尝试删除输入变量组合的集合中还有输入变量组合没有进行尝试删除,正是由于尝试删除输入变量组合的集合中还有输入变量组合没有进行尝试删除,所以需要返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤706进行删除测试,直到尝试删除输入变量组合的集合中的所有输入变量组合都进行删除测试,即尝试删除输入变量组合的集合为空。
步骤716,判断更新后的可删除输入变量组合的集合是否为空,若否,则进入步骤718,若是,则进入步骤724。
如果尝试删除输入变量组合的集合已经为空了,那需要对在测试中又获得的新的可删除输入变量组合的集合中的输入变量组合进行判断,如果更新后的可删除输入变量组合的集合为空,则进入步骤724,反之,则进入步骤718。
步骤718,将可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合的集合中。
当更新后的可删除输入变量组合的集合不为空时,说明需要将可删除输入变量组合的集合清空以供将来使用,所以将可删除输入变量组合的集合中的所有输入变量加入到可选删除输入变量组合的集合中,将可删除输入变量组合的集合清空。
步骤720,将可选删除输入变量组合的输入变量两两组合得到新的输入变量组合。
在将可删除输入变量组合的集合的所有输入变量加入到可选删除输入变量组合的集合后,由于可删除输入变量组合的集合中的输入变量组合的加入,则需要对候选输入变量组合的输入变量进行两两组合,得到新的输入变量组合。
步骤722,判断新的输入变量组合是否在可选删除输入变量组合的集合中,若是,则进入步骤724;反之,则进入步骤730。
在生成新的输入变量组合之后,需要对新的输入变量组合进行判断,如果新的输入变量组合存在可选删除输入变量组合的集合中,说明是在以前就在尝试删除输入变量组合的集合中并且已经对其进行尝试删除过,因此不需要重复对其进行尝试删除,则进入步骤724。反之,如果新的输入变量组合不存在可选删除输入变量组合的集合中,则需要将生成的新的输入变量组合加入到尝试删除输入变量组合的集合中,进入步骤730。
步骤724,判断可选删除输入变量组合的集合是否为空,若是,则进入步骤726,若否,则进入步骤728。
可选删除输入变量组合的集合由于可删除输入变量组合的集合的输入变量组合的加入,则需要对可选删除输入变量组合的集合是否为空进行判断,如果可选删除输入变量组合的集合为空,则进入步骤726,如果可选删除输入变量组合的集合不为空,则进入步骤728。
步骤726,输出“没有可删除的输入变量组合”。
当可选删除的输入变量组合的集合为空时,则说明没有可以删除的输入变量组合,将该结果作为输出结果输出。
步骤728,从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
当可选删除输入变量组合的集合不为空时,则需要从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,其中,优选删除的输入变量组合包括但不限于输入变量组合对应的数据采集成本。将选取的优选删除输入变量作为最值得删除的输入变量组合,将该优选删除的输入变量组合对应的输入节点在第一深度学习神经网络的输入层中删除,得到第三深度学习神经网络。例如,在疾病诊疗的场景下,选删除输入变量组合的集合中选取输入变量作为优选删除的输入变量组合,输入变量如:血液检查结果的获取成本>尿液检查结果的获取成本>血压的获取成本>体重的获取成本。如果输入变量组合中包含多个输入变量,那么输入变量组合的成本等于其中包含的所有输入变量的成本之和。
步骤730,将新的输入变量组合加入到尝试删除删除输入变量组合中。
由于新的输入变量组合不存在可选删除输入变量组合的集合中,则需要将生成的新的输入变量组合加入到尝试删除输入变量组合的集合中,由于这些加入到尝试删除输入变量组合的集合中的新的输入变量组合还没有在第一深度学习神经网络中进行尝试删除,所以需要返回到从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤中进行尝试删除,即返回步骤706。
如图8所示,在一个实施例中,提供了一种深度学习神经网络装置,该装置包括:
第一输出正确率获取模块802,用于对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率。
第一生成模块804,用于将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合。
选取模块806,用于从尝试删除输入变量组合的集合中选取一个输入变量组合。
第一创建模块808,用于将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络。
第二输出正确率获取模块810,用于对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率。
第二生成模块812,用于根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合。
第二创建模块814,用于从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
在一个实施例中,第二生成模块812包括可删除输入变量组合生成单元(图中未示出)和可选删除输入变量组合生成单元(图中未示出),其中:
可删除输入变量组合生成单元,用于根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合。
可选删除输入变量组合生成单元,用于根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合。
在一个实施例中,可选删除输入变量组合生成单元(图中未示出)还用于当第一输出正确率与第二输出正确率的差值大于预设阈值时,则将选取的输入变量组合从尝试删除输入变量组合的集合中删除;反之,则将选取的输入变量组合从尝试删除输入变量组合的集合中删除,并将输入变量组合加入可删除输入变量组合的集合。
在一个实施例中,可选删除输入变量组合生成单元(图中未示出)还用于判断更新后的尝试删除输入变量组合的集合是否为空,若否,则返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;若是,则判断更新后的可删除输入变量组合的集合是否为空,如果更新后的可删除输入变量组合的集合不为空,则将可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合的集合中。
在一个实施例中,第二生成模块812还包括组合单元(图中未示出)和检测单元(图中未示出),其中:
组合单元,用于将可选删除输入变量组合的输入变量两两组合得到新的输入变量组合。
检测单元,用于当新的输入变量组合在所述可选删除输入变量组合中不存在时,则将新的输入变量组合加入到所述尝试删除输入变量组合的集合中,则选取模块806用于从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤。
在一个实施例中,对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据作为第一深度学习神经网络的输入进行测试,得到第一实际输出标签;获取第一实际输出标签与预期标签一致的次数占总测试次数的比值,得到第一输出正确率;对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据中对应的未删除输入变量对应的数据作为第二深度学习神经网络的输入进行测试,得到第二实际输出标签;获取第二实际输出标签与预期标签一致的次数占总测试次数的比值,得到第二输出正确率。
在一个实施例中,从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,包括:当可选删除输入变量组合的集合不为空时,从可选删除输入变量组合的集合中选取输入变量对应的数据采集成本最高的输入变量组合作为优选删除的输入变量组合。
在一个实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率;将第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合;从尝试删除输入变量组合的集合中选取一个输入变量组合;将选取的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率;根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合;从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,将优选删除的输入变量组合对应的第一深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
在一个实施例中,根据第一输出正确率和第二输出正确率生成可选删除输入变量组合的集合,包括:根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合;根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合。
在一个实施例中,根据第一输出正确率和第二输出正确率更新尝试删除输入变量组合的集合,并生成可删除输入变量组合的集合,包括:当第一输出正确率与第二输出正确率的差值大于预设阈值时,则将选取的输入变量组合从尝试删除输入变量组合的集合中删除;反之,则将选取的输入变量组合从尝试删除输入变量组合的集合中删除,并将输入变量组合加入可删除输入变量组合的集合。
在一个实施例中,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合,包括:判断更新后的尝试删除输入变量组合的集合是否为空,若否,则返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;若是,则判断更新后的可删除输入变量组合的集合是否为空,如果更新后的可删除输入变量组合的集合不为空,则将可删除输入变量组合的集合中的输入变量组合加入到可选删除输入变量组合的集合中。
在一个实施例中,根据更新后的尝试删除输入变量组合的集合和可删除输入变量组合的集合生成可选删除输入变量组合的集合之后,包括:将可选删除输入变量组合的输入变量两两组合得到新的输入变量组合;当新的输入变量组合在可选删除输入变量组合中不存在时,则将新的输入变量组合加入到尝试删除输入变量组合的集合中,返回从尝试删除输入变量组合的集合中选取一个输入变量组合的步骤。
在一个实施例中,对第一深度学习神经网络进行测试,得到第一深度学习神经网络的第一输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据作为第一深度学习神经网络的输入进行测试,得到第一实际输出标签;获取第一实际输出标签与预期标签一致的次数占总测试次数的比值,得到第一输出正确率;
对第二深度学习神经网络进行测试,得到第二深度学习神经网络的第二输出正确率,包括:获取带有预期标签的多个输入数据及其对应的预期标签;将每个输入数据中对应的未删除输入变量对应的数据作为第二深度学习神经网络的输入进行测试,得到第二实际输出标签;获取第二实际输出标签与预期标签一致的次数占总测试次数的比值,得到第二输出正确率。
在一个实施例中,从可选删除输入变量组合的集合中选取输入变量组合作为优选删除的输入变量组合,包括:当可选删除输入变量组合的集合不为空时,从可选删除输入变量组合的集合中选取输入变量对应的数据采集成本最高的输入变量组合作为优选删除的输入变量组合。
需要说明的是,本申请各实施例中的“第一”、“第二”只是相对概念,仅用作区分,并不用于大小、从属、先后等其他方面的限定。例如,“第一输出正确率”和“第二输出正确率”用于区分第一深度学习神经网络与第二深度学习神经网络的输出正确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的非易失性存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种深度学习神经网络方法,其特征在于,所述方法包括:
对第一深度学习神经网络进行测试,得到所述第一深度学习神经网络的第一输出正确率;
将所述第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合,所述输入变量包括不同类型的检查结果数据;
从所述尝试删除输入变量组合的集合中选取一个输入变量组合;
将选取的输入变量组合对应的所述第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
对所述第二深度学习神经网络进行测试,得到所述第二深度学习神经网络的第二输出正确率;当第一输出正确率与第二输出正确率的差值大于预设阈值时,则将所述选取的输入变量组合从所述尝试删除输入变量组合的集合中删除;
反之,则将所述选取的输入变量组合从所述尝试删除输入变量组合的集合中删除,并将所述选取的输入变量组合加入可删除输入变量组合的集合;
根据更新后的尝试删除输入变量组合的集合和所述可删除输入变量组合的集合生成可选删除输入变量组合的集合;
将所述可选删除输入变量组合的输入变量两两组合得到新的输入变量组合;
当所述新的输入变量组合在所述可选删除输入变量组合中不存在时,则将所述新的输入变量组合加入到所述尝试删除输入变量组合的集合中,返回所述从所述尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;
从所述可选删除输入变量组合的集合中选取输入变量对应的数据采集成本最高的输入变量组合作为优选删除的输入变量组合,将所述优选删除的输入变量组合对应的所述第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
2.根据权利要求1所述的方法,其特征在于,所述根据更新后的尝试删除输入变量组合的集合和所述可删除输入变量组合的集合生成可选删除输入变量组合的集合,包括:
判断更新后的尝试删除输入变量组合的集合是否为空,若否,则返回所述从所述尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;
若是,则判断更新后的可删除输入变量组合的集合是否为空,如果更新后的可删除输入变量组合的集合不为空,则将所述可删除输入变量组合的集合中的输入变量组合加入到所述可选删除输入变量组合的集合中。
3.根据权利要求1所述的方法,其特征在于,所述对第一深度学习神经网络进行测试,得到所述第一深度学习神经网络的第一输出正确率,包括:
获取带有预期标签的多个输入数据及其对应的预期标签;
将每个所述输入数据作为所述第一深度学习神经网络的输入进行测试,得到第一实际输出标签;
获取所述第一实际输出标签与所述预期标签一致的次数占总测试次数的比值,得到第一输出正确率;
所述对所述第二深度学习神经网络进行测试,得到所述第二深度学习神经网络的第二输出正确率,包括:
获取带有预期标签的多个输入数据及其对应的预期标签;
将每个所述输入数据中对应的未删除输入变量对应的数据作为第二深度学习神经网络的输入进行测试,得到第二实际输出标签;
获取所述第二实际输出标签与所述预期标签一致的次数占总测试次数的比值,得到第二输出正确率。
4.根据权利要求1所述的方法,其特征在于,所述将选取的输入变量组合对应的所述第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络,包括:
在所述第一深度学习神经网络中,删除所述选取的输入变量组合对应的输入节点,删除所述选取的输入变量组合对应的输入节点与其他隐层节点的所有连接,得到所述第二深度学习神经网络。
5.根据权利要求1所述的方法,其特征在于,所述不同类型的检查结果数据包括体重、血压、血液检查结果、尿液检查结果。
6.一种深度学习神经网络装置,其特征在于,所述装置包括:
第一输出正确率获取模块,用于对第一深度学习神经网络进行测试,得到所述第一深度学习神经网络的第一输出正确率;
第一生成模块,用于将所述第一深度学习神经网络的每个输入变量作为一个输入变量组合,生成尝试删除输入变量组合的集合,所述输入变量包括不同类型的检查结果数据;
选取模块,用于从所述尝试删除输入变量组合的集合中选取一个输入变量组合;
第一创建模块,用于将选取的输入变量组合对应的所述第一深度学习神经网络的输入节点删除,得到第二深度学习神经网络;
第二输出正确率获取模块,用于对所述第二深度学习神经网络进行测试,得到所述第二深度学习神经网络的第二输出正确率;
第二生成模块,用于当第一输出正确率与第二输出正确率的差值大于预设阈值时,则将所述选取的输入变量组合从所述尝试删除输入变量组合的集合中删除;反之,则将所述选取的输入变量组合从所述尝试删除输入变量组合的集合中删除,并将所述选取的输入变量组合加入可删除输入变量组合的集合;根据更新后的尝试删除输入变量组合的集合和所述可删除输入变量组合的集合生成可选删除输入变量组合的集合;将所述可选删除输入变量组合的输入变量两两组合得到新的输入变量组合;当所述新的输入变量组合在所述可选删除输入变量组合中不存在时,则将所述新的输入变量组合加入到所述尝试删除输入变量组合的集合中,返回所述从所述尝试删除输入变量组合的集合中选取一个输入变量组合的步骤;
第二创建模块,用于从所述可选删除输入变量组合的集合中选取输入变量对应的数据采集成本最高的输入变量组合作为优选删除的输入变量组合,将所述优选删除的输入变量组合对应的所述第二深度学习神经网络的输入节点删除,得到第三深度学习神经网络。
7.根据权利要求6所述的装置,其特征在于,所述第一输出正确率获取模块还用于获取带有预期标签的多个输入数据及其对应的预期标签;将每个所述输入数据作为所述第一深度学习神经网络的输入进行测试,得到第一实际输出标签;获取所述第一实际输出标签与所述预期标签一致的次数占总测试次数的比值,得到第一输出正确率,所述第二输出正确率获取模块还用于获取带有预期标签的多个输入数据及其对应的预期标签;将每个所述输入数据中对应的未删除输入变量对应的数据作为第二深度学习神经网络的输入进行测试,得到第二实际输出标签;获取所述第二实际输出标签与所述预期标签一致的次数占总测试次数的比值,得到第二输出正确率。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-5任意一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-5任意一项所述方法的步骤。
10.一种机器人系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的机器人程序,其特征在于,所述处理器执行所述程序时实现权利要求1-5任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711331068.8A CN108334935B (zh) | 2017-12-13 | 2017-12-13 | 精简输入的深度学习神经网络方法、装置和机器人系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711331068.8A CN108334935B (zh) | 2017-12-13 | 2017-12-13 | 精简输入的深度学习神经网络方法、装置和机器人系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108334935A CN108334935A (zh) | 2018-07-27 |
CN108334935B true CN108334935B (zh) | 2021-01-22 |
Family
ID=62923179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711331068.8A Active CN108334935B (zh) | 2017-12-13 | 2017-12-13 | 精简输入的深度学习神经网络方法、装置和机器人系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108334935B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110962120B (zh) * | 2018-09-30 | 2021-03-26 | 北京猎户星空科技有限公司 | 网络模型的训练方法及装置、机械臂运动控制方法及装置 |
CN112200684B (zh) * | 2020-09-15 | 2024-05-07 | 深圳大学 | 一种检测医保欺诈的方法、系统及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780460A (zh) * | 2016-12-13 | 2017-05-31 | 杭州健培科技有限公司 | 一种用于胸部ct影像的肺结节自动检测系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040010481A1 (en) * | 2001-12-07 | 2004-01-15 | Whitehead Institute For Biomedical Research | Time-dependent outcome prediction using neural networks |
TWI267012B (en) * | 2004-06-03 | 2006-11-21 | Univ Nat Cheng Kung | Quality prognostics system and method for manufacturing processes |
CN103679269A (zh) * | 2013-12-05 | 2014-03-26 | 河海大学 | 基于主动学习的分类器样本选择方法及其装置 |
CN104573741A (zh) * | 2014-12-24 | 2015-04-29 | 杭州华为数字技术有限公司 | 一种特征选择方法及装置 |
CN107368892B (zh) * | 2017-06-07 | 2020-06-16 | 无锡小天鹅电器有限公司 | 基于机器学习的模型训练方法和装置 |
-
2017
- 2017-12-13 CN CN201711331068.8A patent/CN108334935B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780460A (zh) * | 2016-12-13 | 2017-05-31 | 杭州健培科技有限公司 | 一种用于胸部ct影像的肺结节自动检测系统 |
Non-Patent Citations (1)
Title |
---|
"Computer-aided detection of bladder mass within non-contrast-enhanced region of CT Urography (CTU)";Kenny H. Cha等;《SPIE Proceedings》;20160324;第9785卷;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108334935A (zh) | 2018-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12020134B2 (en) | Debugging correctness issues in training machine learning models | |
CN111340237B (zh) | 数据处理和模型运行方法、装置和计算机设备 | |
EP3561734A1 (en) | Generating a machine learning model for objects based on augmenting the objects with physical properties | |
WO2018179765A1 (ja) | 情報処理装置、情報処理方法、及びコンピュータ可読記憶媒体 | |
US11854674B2 (en) | Determining rate of recruitment information concerning a clinical trial | |
US20210365813A1 (en) | Management computer, management program, and management method | |
CN108334935B (zh) | 精简输入的深度学习神经网络方法、装置和机器人系统 | |
Mostaeen et al. | Clonecognition: machine learning based code clone validation tool | |
CN112700006A (zh) | 网络架构搜索方法、装置、电子设备及介质 | |
CN112069294A (zh) | 一种数学题处理方法、装置、设备及存储介质 | |
US12014296B2 (en) | Test and training data | |
CN116862580A (zh) | 短信触达时间预测方法、装置、计算机设备及存储介质 | |
JP7073171B2 (ja) | 学習装置、学習方法及びプログラム | |
US11676050B2 (en) | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes | |
US20120089869A1 (en) | Pessimistic Model-Based Testing | |
CN113836005A (zh) | 一种虚拟用户的生成方法、装置、电子设备和存储介质 | |
Samet et al. | Building Risk Prediction Models for Diabetes Decision Support System | |
EP4318318A1 (en) | Information processing device for improving quality of generator of generative adversarial network (gan) | |
US11710068B2 (en) | Labeling a dataset | |
US11681516B2 (en) | Computer-implemented method and device for the update management of different versions of distributed software with the aid of machine learning methods | |
CN112668597B (zh) | 一种特征比对方法、装置及设备 | |
JP2018151974A (ja) | 学習成果識別装置、学習成果識別方法、及びそのプログラム | |
US20230409956A1 (en) | Machine learning prediction of additional steps of a computerized workflow | |
Bakar et al. | An agent model for rough classifiers | |
CN118071388A (zh) | 互联网产品运营系统的控制方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |