CN111539479A

CN111539479A - 生成样本数据的方法和装置

Info

Publication number: CN111539479A
Application number: CN202010341762.3A
Authority: CN
Inventors: 希滕; 张刚; 温圣召
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-04-27
Filing date: 2020-04-27
Publication date: 2020-08-14
Anticipated expiration: 2040-04-27
Also published as: CN111539479B

Abstract

本申请涉及人工智能领域，公开了生成样本数据的方法和装置。该方法包括：获取初始的预测器模型，通过多轮迭代操作对预测器模型进行迭代优化，预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系；响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据；迭代操作包括：采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；基于当前样本数据训练预设神经网络模型，获取训练后的预设神经网络模型的实际性能；根据预设性能与实际性能之间的偏差更新预测器模型的参数。该方法能获得可训练出性能良好的神经网络模型的样本数据。

Description

生成样本数据的方法和装置

技术领域

本公开的实施例涉及计算机技术领域，具体涉及人工智能领域，尤其涉及生成样本数据的方法和装置。

背景技术

随着人工智能技术和数据存储技术的发展，深度神经网络在许多领域的任务中取得了重要的成果。深度神经网络通常需要经过多轮训练来优化其参数。

深度神经网络的训练中，样本的选取对模型的训练速度和精度至关重要。分布较为集中的样本难以快速训练出高精度的深度神经网络。目前的样本构建方法通常是收集已有的数据，未考虑样本的选择对深度神经网络的性能的影响。

发明内容

本公开的实施例提供了生成样本数据的方法和装置、电子设备以及计算机可读存储介质。

根据第一方面，提供了一种生成样本数据的方法，包括：获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化，预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系；响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据；其中，迭代操作包括：采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；基于当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能；根据预设性能与实际性能之间的偏差更新预测器模型的参数。

根据第二方面，提供了一种生成样本数据的装置，包括：优化单元，被配置为获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化，预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系；生成单元，被配置为响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据；其中，优化单元包括预测子单元、训练子单元以及第一更新子单元；预测子单元，被配置为执行迭代操作中的如下步骤：采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；训练子单元，被配置为执行迭代操作中的如下步骤：基于当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能；第一更新子单元，被配置为执行迭代操作中的如下步骤：根据预设性能与实际性能之间的偏差更新预测器模型的参数。

根据第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行第一方面提供的生成样本数据的方法。

根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行第一方面提供的生成样本数据的方法。

根据本申请的技术能够自动地确定出可训练出具有良好性能的神经网络模型的训练样本数据。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1是本公开的生成样本数据的方法的一个实施例的流程图；

图2是本公开的生成样本数据的方法的另一个实施例的流程图；

图3是本公开的生成样本数据的方法的又一个实施例的流程图；；

图4是本公开的生成样本数据的装置的一个实施例的结构示意图；

图5是用来实现本公开的实施例的生成样本数据的方法的电子设备的框图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开的方法或装置可以应用于终端设备或服务器，或者可以应用于包括终端设备、网络和服务器的系统架构。其中，网络用以在终端设备和服务器之间提供通信链路的介质，可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

终端设备可以是用户端设备，其上可以安装有各种客户端应用。例如，图像处理类应用、搜索应用、语音服务类应用等。终端设备可以是硬件，也可以是软件。当终端设备为硬件时，可以是各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器可以是运行各种服务的服务器，例如运行基于图像、视频、语音、文本、数字信号等数据的目标检测与识别、文本或语音识别、信号转换等服务的服务器。服务器可以获取各种媒体数据作为深度学习任务的训练样本数据，如图像数据、音频数据、文本数据等。服务器还可以根据具体的深度学习任务从训练样本数据中搜索出最优的样本数据，并基于搜索出的样本数据训练神经网络模型。

服务器还可以通过网络将搜索出的样本数据或训练完成的神经网络模型发送至终端设备。终端设备根据接收到的样本数据训练神经网络模型或者直接根据接收到的神经网络模型的结构信息部署并运行神经网络，以执行相应的深度学习任务。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是，本公开的实施例所提供的生成样本数据的方法可以由终端设备或服务器执行，相应地，生成样本数据的装置可以设置于终端设备或服务器中。

请参考图1，其示出了根据本公开的生成样本数据的方法的一个实施例的流程100。该生成样本数据的方法，包括如下步骤101和步骤102：

步骤101，获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化。

预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系。在本实施例中，可以基于概率模型、卷积神经网络模型等对训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系进行建模，并初始化构建的模型的参数得到初始的预测器模型。

在实践中，预测器模型的输入和输出分别可以是表征训练样本数据的序列编码和基于对应的深度学习任务(如图像处理、语音合成、文本翻译等任务)、利用对应的训练样本数据训练后的神神经网络模型的性能的编码。在这里，神经网络模型的性能可以是准确率、召回率、硬件延时、训练或运行过程中的内存占用率。

在本实施例中，可以通过多轮迭代操作优化预测器模型的参数。具体地，迭代操作包括步骤1011、步骤1012和步骤1013。

在步骤1011中，采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据。

可以首先基于收集到的媒体数据构建训练样本数据的搜索空间。训练样本数据的搜索空间可以包含各种有标签或无标签的样本数据。样本数据可以是图像、文本等媒体数据。每一次迭代操作中，可以将预设性能作为预测器模型的期望输出，利用当前的预测器模型从训练样本数据的搜索空间中采样出可满足该期望输出的部分训练样本数据，作为当前样本数据。

根据当前的预测器模型，基于当前样本数据训练后的预设神经网络可以达到上述预设性能。在这里，预设神经网络是执行预设深度学习任务的神经网络模型。预设性能可以是预设的准确率范围、预设的召回率范围、预设的硬件延时范围等等。

接着，在步骤1012中，基于当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能。

可以基于当前样本数据对上述预设神经网络模型进行训练。在训练完成后，可以构建测试数据集，测试训练后的预设神经网络模型的实际性能。

在步骤1013中，根据预设性能与实际性能之间的偏差更新预测器模型的参数。

在本实施例中，可以比对上述预设性能以及训练后的预设神经网络的实际性能，获得当前的预测器模型的误差。将该误差前向反馈至预测器模型中，以使预测器模型根据该误差更新参数，并基于更新后的参数执行下一次迭代操作。由此实现了在迭代操作中对预测器模型的优化。

由于在迭代操作中根据当前预测器模型的误差更新了预测器模型的参数，这样，通过多次迭代操作，预测器模型的参数被逐步迭代优化，其误差逐渐缩小。

在每一次迭代操作之后，可以判断更新参数后的预测器模型是否达到预设的收敛条件，若未达到预设的收敛条件，则基于更新参数后的预测器模型返回执行下一次迭代操作。

预设的收敛条件可以包括但不限于以下至少一项：预测器模型的误差小于预设的误差阈值，在最近的若干次迭代操作中预测器模型的参数更新率持续低于预设的更新率阈值，迭代操作的次数达到预设的阈值。

步骤102，响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据。

在本实施例中，若在当前的迭代操作中确定当前的预测器模型已达到上述预设的收敛条件，则可以停止迭代操作，将当前的预测器模型作为完成迭代优化的预测器模型。

完成迭代优化的预测器模型可以应用于预测不同的训练样本数据对应的神经网络模型的性能。在本实施例中，可以利用完成迭代优化的预测器模型预测多组不同的训练样本数据对应的预设神经网络模型的性能，并且可以选择可以使预设神经网络模型的性能较优的一组或多组训练样本数据作为目标样本数据。

或者，可以利用完成迭代优化的预测器模型，按照预设的搜索策略，通过执行多轮搜索操作在训练样本数据的搜索空间中搜索出可使预设神经网络模型的性能达到预设条件的训练样本数据。其中，每一轮搜索操作可以重新组合搜索空间中的各条训练样本数据形成本轮搜索操作中搜索出的训练样本数据集合，通过多轮迭代搜索操作逐步优化搜索出的训练样本数据集合，使得训练样本数据集合中的训练样本数据分布均匀，这样在基于搜索出的目标样本数据训练神经网络模型时可以加快模型的训练速度，提升模型的性能。

本实施例的上述生成样本数据的方法，通过对表征训练样本数据与对应的神经网络模型的性能之间的关系的预测器进行多轮迭代优化，并利用优化后的预测器预测出目标样本数据，能够自动生成可训练出具有良好性能的神经网络模型的训练样本数据。

继续参考图2，其示出了本公开的生成样本数据的方法的另一个实施例的流程图。如图2所示，本实施例的生成样本数据的方法的流程200，包括如下步骤201和步骤202：

步骤201，获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化。

其中，预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系。

在本实施例中，生成样本数据的方法的执行主体可以构建预测器模型并初始化预测器模型的参数，得到初始的预测器模型，并通过多轮迭代操作优化预测器模型的参数。

在本实施例中，迭代操作包括：

步骤2011，采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据。

步骤2012，基于当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能。

步骤2013，根据预设性能与实际性能之间的偏差更新预测器模型的参数。

上述步骤2011、步骤2012、步骤2013分别与前述实施例的步骤1011、步骤1012、步骤1013一致，步骤2011、步骤2012、步骤2013的具体实现方式可以参考前述实施例的步骤1011、步骤1012、步骤1013的描述，此处不再赘述。

在本实施例中，迭代操作还包括：

步骤2014，响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值，根据预设的参数分布指标从当前的迭代操作中更新后的预测器模型的参数和当前最优参数中选择较优的，作为新的当前最优参数，基于新的当前最优参数更新预测器模型并执行下一轮迭代操作。

在每一轮迭代操作中，可以计算当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离。在这里，预测器模型的初始最优参数可以是初始的预测器模型的参数。

如果当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值，则可以从当前的迭代操作中更新后的预测器模型的参数和当前最优参数中选择较优的，作为新的当前最优参数，也即，若当前的迭代操作中更新后的预测器模型的参数优于当前最优参数，则将当前最优参数更新为当前的迭代操作中更新后的预测器模型的参数，否则不对当前最优参数进行更新。

上述预设的参数分布指标用于判别当前的迭代操作中更新后的预测器模型的参数是否优于当前最优参数。在这里，预设的参数分布指标可以包括参数矩阵的协方差、参数的概率分布对应的神经网络模型的信息熵或信息增益等。

可以记录新的当前最优参数并基于新的当前最优参数执行下一轮迭代操作。

通过步骤2014，可以在迭代操作中不断以较优的参数来更新预测器模型的当前最优参数，从而帮助逐步优化预测器模型的参数。

在每一次迭代操作之后，可以判断更新参数后的预测器模型是否达到预设的收敛条件，若未达到预设的收敛条件，则根据预测器模型的当前最优参数执行下一次迭代操作。可以将步骤2013中更新后的预测器模型的参数作为下一轮迭代操作中的当前预测器模型的参数，或者可以将当前最优参数作为下一轮迭代操作中的当前预测器模型的参数。

可选地，在步骤2014之后，上述迭代操作还可以包括：

响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离小于预设的距离阈值，将预测器模型的未更新轮次加1，其中，预测器模型的未更新轮次的初始值为0；以及响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值，将预测器模型的未更新轮次重置为0。其中预设的收敛条件可以包括：预测器模型的未更新轮次达到预设的次数阈值。

具体地，预测器模型的未更新轮次是用于记录预测器模型累计连续未更新轮次的参数，其初始值为0。在当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离小于预设的距离阈值时，可以认为当前的迭代操作中预测器模型的参数未更新，将当前轮的迭代操作记为预测器模型未更新的轮次，将预测器模型的未更新轮次加1。而在当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值时，可以认为当前的迭代操作中预测器模型的参数发生了更新，这时可以将预测器模型的未更新轮次重置为0。

当预测器模型的未更新轮次达到预设的次数阈值时，也即，当预测器模型在连续预设次数阈值个轮次内未发生更新时，可以停止对预测器模型的迭代优化，将当前的预测器模型作为完成迭代优化的预测器模型。

上述实施方式在预测器参数变化较小时认为预测器确定预测器模型未发生更新，通过累加预测器模型的未更新轮次，可以在预测器模型达到收敛状态时停止迭代操作，避免过量的迭代操作占用过多的内存资源，提升预测器模型的优化效率。

步骤202，响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据。

若在当前的迭代操作中确定当前的预测器模型已达到上述预设的收敛条件，则可以停止迭代操作，将当前最优参数作为完成迭代优化的预测器模型的最终参数，并可以利用完成迭代优化的预测器模型，从训练样本数据的搜索空间中确定出能训练得到较好性能的预设神经网络模型的目标样本数据。

本实施例的生成样本数据的方法通过在多轮迭代操作中对预测器模型的最优参数进行判别和更新，能够得到更准确的预测器模型，从而获得更可靠的目标样本数据。

继续参考图3，其示出了本公开的生成样本数据的方法的又一个实施例的流程示意图。如图3所示，本实施例的生成样本数据的方法的流程300，包括以下步骤301、步骤302以及步骤303：

步骤301，获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化，预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系；

其中，迭代操作包括：

步骤3011，采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；

步骤3012，基于当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能；

步骤3013，根据预设性能与实际性能之间的偏差更新预测器模型的参数。

上述步骤301、步骤3011、步骤3012、步骤3013分别与前述实施的步骤101、步骤1011、步骤1012、步骤1013一致，步骤301、步骤3011、步骤3012、步骤3013的具体实现方式可以参考前述实施例的步骤101、步骤1011、步骤1012、步骤1013的描述，此处不再赘述。

此外，在本实施例的一些可选实现方式中，迭代操作还可以包括上述步骤2014，以及，进一步可选地，还可以包括响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离小于预设的距离阈值，将预测器模型的未更新轮次加1，其中，预测器模型的未更新轮次的初始值为0；和响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值，将预测器模型的未更新轮次重置为0；其中，预设的收敛条件包括：预测器模型的未更新轮次达到预设的次数阈值。具体的实现方式可以参考前述流程200中相应步骤的描述，此处不再赘述。

步骤302，响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用预测器模型预测候选样本集合对应的神经网络模型的性能信息。

在完成预测器模型的迭代优化之后，可以采用基于循环神经网络的方法、强化学习算法或遗传算法，从预设的样本数据搜索空间中搜索出最优的候选样本集合。其中候选样本集合从预设的样本数据搜索空间中采样得出。

具体地，在步骤302中，可以迭代执行多次搜索操作，在每一次搜索操作中，采用基于循环神经网络的方法、强化学习算法或遗传算法构建的控制器，从上述预设的样本数据搜索空间中采样出一组样本数据作为一个候选样本集合，利用上述完成迭代优化的预测器模型预测搜索出的该候选样本集合对应的神经网络模型的性能信息。

步骤303，根据候选样本集合的性能信息的预测结果确定出至少一个候选样本集合作为目标样本数据。

接着，可以对各轮搜索操作中不同的候选样本集合的性能信息的预测结果进行比较，选择预测结果所表征的性能信息较优的候选样本集合中的训练样本数据作为目标样本数据。

可选地，可以获取与目标样本数据对应的媒体数据处理任务的预设性能需求信息；将性能信息的预测结果满足预设性能需求信息的候选样本集合中的样本数据，作为目标样本数据。

具体地，可以判断预测器模型对该候选样本集合的性能信息的预测结果是否满足预设的媒体数据处理任务的预设性能需求，若满足可以将该候选样本集合作为目标样本数据，并停止搜索操作或者执行下一次搜索操作以搜索出多个候选样本集合。若不满足，则可以将预测器模型对该候选样本集合的性能信息的预测结果与预设的性能需求之间的差异作为reward(反馈信息)反馈至上述控制器，执行下一轮搜索操作。控制器根据reward更新参数并在下一轮搜索操作中搜索出新的候选样本集合。这样可以进一步根据媒体数据处理任务(如图像数据处理任务、文本数据处理任务等)的性能需求搜索出合适的目标样本数据。

上述生成样本数据的方法的流程300，通过采用迭代优化后的预测器模型在预设的样本数据搜索空间中自动搜索出目标样本数据，提升了目标样本数据的搜索效率，进一步提升了目标样本数据的可靠性。

请参考图4，作为对上述生成样本数据的方法的实现，本公开提供了一种生成样本数据的装置的一个实施例，该装置实施例与上述各方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例的生成样本数据的装置400包括优化单元401和生成单元402。其中，优化单元401被配置为获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化，预测器模型表征训练样本数据与基于训练样本数据训练后的神经网络模型的性能之间的关系；生成单元402被配置为响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据。优化单元401包括预测子单元4011、训练子单元4012以及第一更新子单元4013；预测子单元4011，被配置为执行迭代操作中的如下步骤：采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；训练子单元4012，被配置为执行迭代操作中的如下步骤：基于当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能；第一更新子单元4013，被配置为执行迭代操作中的如下步骤：根据预设性能与实际性能之间的偏差更新预测器模型的参数。

在一些实施例中，上述优化单元401还包括：第二更新子单元，被配置为执行迭代操作中的如下步骤：响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值，根据预设的参数分布指标从基于当前的迭代操作中更新后的预测器模型的参数和当前最优参数中选择较优的，作为新的当前最优参数，基于新的当前最优参数更新预测器模型并执行下一轮迭代操作。

在一些实施例中，上述优化单元401还包括：收敛判断子单元，被配置为执行迭代操作中的如下步骤：响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离小于预设的距离阈值，将预测器模型的未更新轮次加1，其中，预测器模型的未更新轮次的初始值为0；响应于确定当前的迭代操作中更新后的预测器模型的参数与预测器模型的当前最优参数之间的距离不小于预设的距离阈值，将预测器模型的未更新轮次重置为0；其中，预设的收敛条件包括：预测器模型的未更新轮次达到预设的次数阈值。

在一些实施例中，上述生成单元402包括：采样子单元，被配置为利用预测器模型预测候选样本集合对应的神经网络模型的性能信息，其中候选样本集合从预设的样本数据搜索空间中采样得出；确定子单元，被配置为根据候选样本集合的性能信息的预测结果确定出至少一个候选样本集合作为目标样本数据。

在一些实施例中，上述确定子单元被进一步配置为按照如下方式确定出目标样本数据：获取与目标样本数据对应的媒体数据处理任务的预设性能需求信息；将性能信息的预测结果满足预设性能需求信息的候选样本集合中的样本数据，作为目标样本数据。

上述装置400与前述方法实施例中的步骤相对应。由此，上文针对生成样本数据的方法描述的操作、特征及所能达到的技术效果同样适用于装置400及其中包含的单元，在此不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图5所示，是根据本申请实施例的生成样本数据的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图5所示，该电子设备包括：一个或多个处理器501、存储器502，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。

存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中，存储器存储有可由至少一个处理器执行的指令，以使至少一个处理器执行本申请所提供的生成样本数据的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的生成样本数据的方法。

存储器502作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的生成样本数据的方法对应的程序指令/单元/模块(例如，附图4所示的优化单元401和生成单元402)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的生成样本数据的方法。

存储器502可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据用于生成神经网络的结构的电子设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器502可选包括相对于处理器501远程设置的存储器，这些远程存储器可以通过网络连接至用于生成神经网络的结构的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

生成样本数据的方法的电子设备还可以包括：输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线505或者其他方式连接，图5中以通过总线505连接为例。

输入装置503可接收输入的数字或字符信息，以及产生与用于生成神经网络的结构的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置Y04可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种生成样本数据的方法，包括：

获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化，所述预测器模型表征训练样本数据与基于所述训练样本数据训练后的神经网络模型的性能之间的关系；

响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据；

其中，所述迭代操作包括：

采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；

基于所述当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能；

根据所述预设性能与所述实际性能之间的偏差更新所述预测器模型的参数。

2.根据权利要求1所述的方法，其中，所述迭代操作还包括：

响应于确定当前的迭代操作中更新后的所述预测器模型的参数与所述预测器模型的当前最优参数之间的距离不小于预设的距离阈值，根据预设的参数分布指标从所述基于所述当前的迭代操作中更新后的所述预测器模型的参数和所述当前最优参数中选择较优的，作为新的当前最优参数，基于新的当前最优参数更新所述预测器模型并执行下一轮所述迭代操作。

3.根据权利要求2所述的方法，其中，所述迭代操作还包括：

响应于确定当前的迭代操作中更新后的所述预测器模型的参数与所述预测器模型的当前最优参数之间的距离小于预设的距离阈值，将所述预测器模型的未更新轮次加1，其中，所述预测器模型的未更新轮次的初始值为0；

响应于确定当前的迭代操作中更新后的所述预测器模型的参数与所述预测器模型的当前最优参数之间的距离不小于预设的距离阈值，将所述预测器模型的未更新轮次重置为0；

其中，所述预设的收敛条件包括：所述预测器模型的未更新轮次达到预设的次数阈值。

4.根据权利要求1-3任一项所述的方法，其中，所述利用迭代优化后的预测器模型生成目标样本数据，包括：

利用所述预测器模型预测候选样本集合对应的神经网络模型的性能信息，其中候选样本集合从预设的样本数据搜索空间中采样得出；

根据所述候选样本集合的性能信息的预测结果确定出至少一个候选样本集合作为目标样本数据。

5.根据权利要求4所述的方法，其中，所述根据所述候选样本集合的性能信息的预测结果确定出至少一个候选样本集合作为目标样本数据，包括：

获取与目标样本数据对应的媒体数据处理任务的预设性能需求信息；

将性能信息的预测结果满足所述预设性能需求信息的候选样本集合中的样本数据，作为目标样本数据。

6.一种生成样本数据的装置，包括：

优化单元，被配置为获取初始的预测器模型，并通过多轮迭代操作对预测器模型进行迭代优化，所述预测器模型表征训练样本数据与基于所述训练样本数据训练后的神经网络模型的性能之间的关系；

生成单元，被配置为响应于确定迭代优化后的预测器模型达到预设的收敛条件，利用迭代优化后的预测器模型生成目标样本数据；

其中，所述优化单元包括预测子单元、训练子单元以及第一更新子单元；

所述预测子单元，被配置为执行所述迭代操作中的如下步骤：采用当前的预测器模型，预测具有预设性能的神经网络模型对应的训练样本数据，作为当前样本数据；

所述训练子单元，被配置为执行所述迭代操作中的如下步骤：基于所述当前样本数据训练预设神经网络模型，并获取训练后的预设神经网络模型的实际性能；

所述第一更新子单元，被配置为执行所述迭代操作中的如下步骤：根据所述预设性能与所述实际性能之间的偏差更新所述预测器模型的参数。

7.根据权利要求6所述的装置，其中，所述优化单元还包括：

第二更新子单元，被配置为执行所述迭代操作中的如下步骤：

8.根据权利要求7所述的装置，其中，所述优化单元还包括：收敛判断子单元，被配置为执行所述迭代操作中的如下步骤：

9.根据权利要求6-8任一项所述的装置，其中，所述生成单元包括：

采样子单元，被配置为利用所述预测器模型预测候选样本集合对应的神经网络模型的性能信息，其中候选样本集合从预设的样本数据搜索空间中采样得出；

确定子单元，被配置为根据所述候选样本集合的性能信息的预测结果确定出至少一个候选样本集合作为目标样本数据。

10.根据权利要求9所述的装置，其中，所述确定子单元被进一步配置为按照如下方式确定出目标样本数据：

11.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。