CN111653271B

CN111653271B - 一种样本数据获取、模型训练方法、装置及计算机设备

Info

Publication number: CN111653271B
Application number: CN202010454439.7A
Authority: CN
Inventors: 王夏鸣
Original assignee: Volkswagen Mobvoi Beijing Information Technology Co Ltd
Current assignee: Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority date: 2020-05-26
Filing date: 2020-05-26
Publication date: 2023-09-05
Anticipated expiration: 2040-05-26
Also published as: CN111653271A

Abstract

本发明实施例公开了一种样本数据获取、模型训练方法、装置及计算机设备，包括：在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据；将所述样本关联数据作为目标样本数据。本发明实施例的技术方案能够保证样本数据的准确性，从而保证根据样本数据训练得到的模型的应用效果。

Description

一种样本数据获取、模型训练方法、装置及计算机设备

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种样本数据获取、模型训练方法、装置、计算机设备及存储介质。

背景技术

在机器学习领域，模型是机器学习的核心内容。模型的准确性决定了机器学习算法的性能，而用于训练模型的样本数据则决定了模型训练的效果。

现有技术中，在对模型进行训练之前，样本数据的采集通常是建立在已有数据的基础上进行。例如，将采集到的经典数据结合作为样本数据。或者，样本数据还可以根据需求进行实时采集，并将实时采集到的数据作为样本数据。

发明人在实现本发明的过程中，发现现有技术存在如下缺陷：现有技术中应用于模型训练的样本数据通常不会考虑应用模型设备在使用过程中的损耗情况，而使用统一类型的样本数据进行训练。例如，对于车载终端来说，随着车辆设备的车龄增长或车辆结构更换等操作会导致产生的噪声数据发生声学特性变化。显然，对车辆设备始终采用同一种样本数据训练得到的模型，会导致模型识别效果不理想的问题。

发明内容

本发明实施例提供一种样本数据获取、模型训练方法、装置、计算机设备及存储介质，以保证样本数据的准确性，从而保证根据样本数据训练得到的模型的应用效果。

第一方面，本发明实施例提供了一种样本数据获取方法，包括：

在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据；

将所述样本关联数据作为目标样本数据。

第二方面，本发明实施例还提供了一种模型训练方法，其特征在于，包括：

获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据第一方面所述的样本数据获取方法所获取的目标样本数据；

根据所述目标样本数据对所述目标模型进行训练。

第三方面，本发明实施例还提供了一种样本数据获取装置，包括：

样本关联数据获取模块，用于在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据；

第一目标样本数据获取模块，用于将所述样本关联数据作为目标样本数据。

第四方面，本发明实施例还提供了一种模型训练装置，其特征在于，包括：

第二目标样本数据获取模块，用于获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据第一方面所述的样本数据获取方法所获取的目标样本数据；

模型训练模块，用于根据所述目标样本数据对所述目标模型进行训练。

第五方面，本发明实施例还提供了一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明任意实施例所提供的样本数据获取方法，或实现本发明任意实施例所提供的模型训练方法。

第六方面，本发明实施例还提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任意实施例所提供的样本数据获取方法，或实现本发明任意实施例所提供的模型训练方法。

本发明实施例通过在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据，作为目标设备对应的目标样本数据，并根据目标样本数据对目标模型进行训练，解决现有采用统一固定的样本数据进行模型训练时导致模型的应用效果较差等问题，从而保证样本数据的准确性，进而保证根据样本数据训练得到的模型的应用效果。

附图说明

图1是本发明实施例一提供的一种样本数据获取方法的流程图；

图2是本发明实施例二提供的一种样本数据获取方法的流程图；

图3a是本发明实施例三提供的一种模型训练方法的流程图；

图3b是本发明实施例三提供的一种获取样本数据以及训练车载语音识别模型的流程示意图；

图4是本发明实施例四提供的一种样本数据获取装置的示意图；

图5是本发明实施例五提供的一种模型训练装置的示意图；

图6为本发明实施例六提供的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。

另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

本发明实施例的说明书和权利要求书及附图中的术语“第一”和“第二”等是用于区别不同的对象，而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元，而是可包括没有列出的步骤或单元。

实施例一

图1是本发明实施例一提供的一种样本数据获取方法的流程图，本实施例可适用于准确获取样本数据的情况，该方法可以由样本数据获取装置来执行，该装置可以由软件和/或硬件的方式来实现，并一般可集成在计算机设备中，与用于采集样本数据的目标设备配合使用。相应的，如图1所示，该方法包括如下操作：

S110、在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据。

其中，目标设备可以是应用目标样本数据训练得到的模型的设备，示例性的，车辆、无人机或智能机器人等均可以作为目标设备。目标设备可以装载模型对应的系统来进行语音、图像识别等功能。例如，车辆可以装载语音识别系统，用于进行语音识别，或装置图像识别系统用于进行图像识别等。目标设备可以对样本数据进行采集。样本数据包括但不限于语音数据或图像数据等，目标设备可以利用麦克风、摄像头或触摸屏等内部集成的结构或模块来采集需要的样本数据，本发明实施例并不对目标设备的类型，以及目标设备采集样本数据的方式进行限定。样本数据获取条件可以是用于判断目标设备是否需要重新进行样本采集的条件。样本关联数据可以包括样本数据以及与样本相关联的数据，如样本数据的采集时间以及采集位置等，本发明实施例并不对样本关联数据的具体类型进行限定。

在本发明实施例中，当确定目标设备满足样本数据获取条件时，可以获取同一类型目标设备在使用过程中实时采集的样本关联数据。例如，获取同一类型的车辆在实车使用过程中所采集的样本关联数据。

需要说明的是，同一类型目标设备不仅仅可以是目标设备的类型相同，还可以是目标设备的使用年限或目标设备的设备机构相同。例如，车辆1和车辆2是同一型号的车辆，且均做了相同的隔音改装或均在同一天更换了轮胎等，则可以认为车辆1和车辆2属于同一类型目标设备。也即，在本发明实施例中，同一类型的目标设备要尽可能保证目标设备的各个结构方面均相同。

S120、将所述样本关联数据作为目标样本数据。

在本发明实施例中，可以将同一类型目标设备在使用过程中实时采集的样本关联数据作为目标样本数据，以根据获取的目标样本数据训练所需的模型。这样设置的好处是：由于目标样本数据来自同一类型的目标设备，因此能够有效避免目标设备因使用老化或零部件更换等操作导致采集的样本数据发生特性变化的问题。例如，假设将实车采集的噪声数据作为样本关联数据，即使是同一型号的车辆，不同使用年限车辆在采集同一噪声数据时，采集到的样本关联数据也不相同。而同一型号的车辆并且车辆使用年限相同或经过相同的设备改造，则这些车辆所采集的样本关联数据的声学特性基本能够保持一致。由此可见，采用本发明实施例所提供的样本数据获取方法所获取的目标样本数据的准确性更高，使用其训练模型的训练效果也更加理想。

本发明实施例通过在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据，作为目标设备对应的目标样本数据，以保证样本数据的准确性。

实施例二

图2是本发明实施例二提供的一种样本数据获取方法的流程图，本实施例以上述实施例为基础进行具体化，在本实施例中，将样本关联数据细化为音频数据和音频位置数据，并给出了将所述样本关联数据作为目标样本数据的具体实现方式。相应的，如图2所示，本实施例的方法可以包括：

S210、在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据。

在本发明的一个可选实施例中，所述样本数据获取条件可以包括：所述目标设备的使用年限达到目标年限；或，所述目标设备的设备结构发生改变。

其中，目标年限可以根据实际需求设定，如2年、3年或5年等，或者，目标年限还可以是根据周期计算的年限。例如，目标年限可以是以年为周期计算的年限，如果目标设备的当前使用年限为2年，则目标年限可以是3年；或者，如果目标设备的当前使用年限为2年，则目标年限还可以是4年等，本发明实施例并不对目标年限的具体数值以及计算方式进行限定。

可选的，样本数据获取条件可以包括但不限于：目标设备的使用年限达到目标年限；或，目标设备的设备结构发生改变。示例性的，车辆的使用年限每增加1年可以确定满足样本数据获取条件，或者，无人机更换机翼后也可以确定满足样本数据获取条件。除此之外，还可以根据目标设备的特性制定其他的样本数据获取条件，如车辆的已跑公里数每增加2万公里可以确定满足样本数据获取条件，本发明实施例并不对样本数据获取条件的具体条件内容进行限定。

在本发明的一个可选实施例中，所述样本关联数据包括音频数据和音频位置数据。可选的，所述音频数据包括目标设备的噪声数据。

在本发明实施例中，样本关联数据可以包括音频数据和音频位置数据。其中，音频数据可以是目标设备的噪声数据，如车辆采集到的噪声数据，该噪声数据既可以包括车内噪声，也可以包括车外环境噪声，本发明实施例对此并不进行限制。音频位置数据可以是采集音频数据时对应的位置数据。例如，车辆同时开启GPS(Global Positioning System，全球定位系统)和麦克风，并利用麦克风根据GPS定位频率采集噪声数据，以将噪声数据和位置数据相关联，从而得到音频数据和音频位置数据。

S220、根据所述音频位置数据对所述音频数据进行切分处理，形成音频片段数据。

其中，音频片段数据可以是对音频数据进行切分后得到的数据。

在本发明实施例中，为了进一步有效利用音频数据，在采集到音频数据和音频位置数据后，可以对音频数据进行切分处理，得到音频片段数据。例如，如果GPS和麦克风没有同步保持开启状态，则可以根据GPS开启间隔对音频数据进行切分，将与GPS数据对应的音频数据切分为音频片段数据。如果GPS和麦克风同步保持开启状态，则可以按照一定的时间间隔对音频数据和GPS数据进行切分，得到对应的音频片段数据。也即，每个音频片段数据都包括对应的GPS数据信息。

S230、对所述音频片段数据进行人声检测。

S240、判断所述音频片段数据是否包括人声数据，若是，则执行S250，否则，执行S260。

S250、删除所述音频片段数据；

S260、保留所述音频片段数据。

在本发明实施例中，由于将目标设备采集的噪声数据作为音频数据，因此，在得到音频片段数据后，可以进行人声检测，以判断音频片段数据中是否包括人声数据。可选的，可以采用人声VAD(Voice Activity Detection，语音活动检测)模型进行人声检测。相应的，如果确定音频片段数据包括人声数据，则可以删除该音频片段数据；否则，保留音频片段数据。或者，也还可以在检测到人声数据后，将人声数据进行过滤处理，从而得到只包括噪声的音频片段数据。这样处理的好处是：可以保证最后得到的音频片段数据是纯噪声数据，以便利用纯噪声数据进一步处理得到最终的音频数据。

S270、根据所述音频数据对应的音频位置数据，确定所述音频数据匹配的场景类型；所述场景类型包括区域和/或轨迹。

其中，场景类型中的区域可以是现实环境中的各种类型的区域，例如，地下车库、空中作业区域或商场等。轨迹则可以是现实环境中的各种类型的活动轨迹，例如道路或飞行轨迹等。

考虑到目标设备在不同的场景中使用时，其采集到的音频数据也可能不同，因此，在本发明实施例中，引入了场景类型对音频数据进行分类统计。具体的，可以根据音频数据对应的音频位置数据，确定音频数据匹配的场景类型。其中，音频数据可以是经过切分处理和人声检测后得到的音频片段数据。

S280、根据所述音频数据匹配的场景类型，对所述音频数据进行分类处理。

S290、将各个场景类型下的音频数据作为所述目标样本数据。

相应的，在根据音频数据对应的音频位置数据，确定音频数据匹配的场景类型之后，可以根据音频数据匹配的场景类型，对音频数据进行分类处理。具体的，可以对最终得到的音频片段数据进行分类处理，从而将各个场景类型下的音频数据作为目标样本数据。例如，将属于同一区域或同一轨迹范围内的音频片段数据统一标记为对应区域或轨迹的音频数据。示例性的，对于车辆来说，不同的区域或轨迹对应着不同的驾驶场景，根据音频数据对应的音频位置数据，确定音频数据匹配的场景类型，可以得到不同驾驶场景下的噪声数据。

在本发明的一个可选实施例中，将所述样本关联数据作为目标样本数据，可以包括：将不同场景类型下所述目标设备的噪声数据与预设人声数据进行交叉组合，生成所述目标样本数据。

其中，预设人声数据可以是纯净的人声说话数据。

通过上述步骤所得到的目标样本数据为各个场景类型下的纯噪声数据，可以将不同场景类型下目标设备的噪声数据与预设人声数据进行交叉组合，从而得到带噪的拟真数据，并将带噪的拟真数据作为目标样本数据。通过对音频数据根据场景类型进行划分，可以赋予噪声数据特有的区域性特点，使得与预设人声数据进行交叉组合得到的数据也具备区域性特点，从而进一步提高样本数据的训练效果。

采用上述技术方案，通过在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的包括音频位置数据和音频数据的样本关联数据，以根据音频位置数据对音频数据进行切分处理，形成音频片段数据，并对音频片段数据进行人声检测，删除包括人声数据的音频片段数据，使得最后得到的音频片段数据均为纯噪声数据，然后根据音频位置数据确定音频数据匹配的场景类型，以对音频数据进行分类处理，将不同场景类型下目标设备的噪声数据与预设人声数据进行交叉组合，生成最终的目标样本数据，实现根据场景类型划分音频数据，以保证音频数据的准确性，进而保证样本数据的训练效果。

实施例三

图3a是本发明实施例三提供的一种模型训练方法的流程图，本实施例可适用于利用准确获取的样本数据训练模型的情况，该方法可以由模型训练装置来执行，该装置可以由软件和/或硬件的方式来实现，并一般可集成在计算机设备中。相应的，如图3a所示，该方法包括如下操作：

S310、获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据本发明任一实施例所述的样本数据获取方法所获取的目标样本数据。

S320、根据所述目标样本数据对所述目标模型进行训练。

其中，目标模型可以是任意类型的模型，如语音识别模型或图像识别模型等，本发明实施例并不对目标模型的具体类型进行限定。

在本发明实施例中，通过上述任一实施例所提供的样本数据获取方法获取到，目标样本数据后，即可根据目标样本数据对目标模型进行训练，得到理想的目标模型。

在本发明的一个可选实施例中，在根据所述目标样本数据对所述目标模型进行训练之后，还可以包括：利用所述目标模型自动更新当前使用模型。

相应的，目标模型训练完成后，即可利用目标模型自动更新目标设备的当前使用模型，从而保证目标设备的当前使用模型始终与目标设备的当前状态相匹配，以保证模型的使用效果。

在一个具体的例子中，以车载语音识别系统为例具体说明。目前的车载语音识别系统，语音识别模型训练所用的样本数据都是在产品研发阶段采集获取的。相关技术中可以针对车型单独采集样本并训练语音识别模型，虽然其识别效果可以针对车型实现优化，但样本数据需要针对大量的车型反复采集，导致巨大的样本数据采集成本。部分语音识别模型供应商为了节约成本采用的是通用样本数据训练的语音识别模型，无法保证针对某个车型达到最佳的识别效果。同时，随着后期车辆的使用，车辆的隔音降噪声学参数会受到车内零部件老化以及零部件更换等影响而发生变化，从而导致专车专用的语音识别模型无法自始至终保证对发生变化的声学环境提供最佳的识别效果。

为了解决上述问题，本发明实施例首先从样本数据的获取角度出发，提供了一种新的样本数据获取方法，以利用与实车相匹配的样本数据重新训练语音识别模型并实时更新实车的当前使用模型。图3b是本发明实施例三提供的一种获取样本数据以及训练车载语音识别模型的流程示意图。具体的，如图3b所示，在车辆的研发阶段，可以对各个车辆部署由统一的车载语音样本数据训练出的语音识别模型。该模型可以部署在云端或本地，或者也还可以同时在云端和本地部署。

车辆销售给消费者后，在车主日常使用车辆期间，可以通过麦克风采集音频数据，并通过GPS模块采集对应的GPS数据，按相同时间间隔t将采集的音频数据切分成音频片段数据上传到云端，每个音频片段数据均对应GPS坐标信息。对上传的音频片段数据，可以通过人声VAD模型进行人声检测，判断音频片段数据中是否包含人声，如果包含，则丢弃；如果不包含，则保留，从而得到纯噪音音频数据。

进一步的，将音频片段数据对应的GPS坐标信息进行聚类统计，统计出落在某一个区域或某条轨迹附近的两类GPS坐标信息，对同一区域/轨迹范围内的音频片段数据统一标记为对应区域/轨迹的音频数据。如此，可以将音频片段数据进行场景类型的划分，不同的区域/轨迹对应着不同的驾驶场景，从而得到不同驾驶场景下的噪声数据。由于所有的噪声数据都是由同一类型的车辆采集获得，因此，各个场景类型的噪声数据，可以作为同类型车辆的其他用户的样本数据。比如，同样都是地下车库场景下的噪声数据，或者同样是某小区内的噪声，将同一类型的多辆车辆采集到的同样场景的噪声数据归类到一起，可以快速扩大单独场景下的噪声数据库的量级，且各个场景类型的噪声数据对于同一类型的车辆均适用。

相应的，得到各个场景类型的噪声数据后，可以将噪声数据和纯净的人声说话数据进行交叉组合。比如，噪声数据总共有5个场景类型，人声说话数据有200条，则可以对噪声数据和人声说话数据进行交叉组合，批量合成5*200＝1000条行的带噪人声合成音频数据，作为带噪人声训练数据，也即最终的样本数据，其对应的标注数据即为人声说话数据原有的标注数据。相应的，最后得到的带噪人声合成音频数据可以作为新的样本数据，重新训练语音识别模型，并将新的语音识别模型部署应用。例如，使用新的语音识别模型对云端或本地的当前语音识别模型进行更新。为了达到最佳的识别效果，还可以对更新后的语音识别模型在使用过程中采集、生成的数据进行抽样，以根据抽取的数据对语音识别模型的一些指标进行评价。如果确定指标评价结果不满足需求，可以不断重复上述样本数据获取和模型训练的过程，直到新的语音识别模型的识别效果达到理想的识别效果。

在车龄每增加N年，比如2年，或者在车辆更换轮胎或改装隔音后，可以触发上述样本数据获取过程以及模型训练的过程。可选的，可以由用户手动触发车机上的样本数据采集功能，也可以由云端自动识别上述样本数据获取条件，并控制车机自动重新采集数据。获取到新的样本数据后，云端落将之前采集的噪声数据丢弃，并采用新采集的样本数据来更新语音识别模型。

由此可见，上述技术方案中，在车辆研发阶段无需针对车型单独采集样本数据，在用户使用实车过程中，可以先使用通用的语音识别模型，并自动采集实车使用环境中的实车噪声数据，从而自动生成大量的带噪人声合成音频数据训练语音识别模型。上述技术方案不仅可以自动筛选并辨别不同场景类型的噪声数据，且合成得到的带噪人声合成音频数据无需额外进行人工标注，可以极大的降低样本数据的采集成本，并且可以做到对每辆车样本数据的量身定制和不断迭代，解决了随着车辆使用老化和零部件更换而导致的声学特性变化，同样的车辆在不同的使用环境下噪声特性不尽相同，以及使用统一的专车数据训练模型无法解决模型适配性等问题。

需要说明的是，以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。

实施例四

图4是本发明实施例四提供的一种样本数据获取装置的示意图，如图4所示，所述装置包括：样本关联数据获取模块410以及第一目标样本数据获取模块420，其中：

样本关联数据获取模块410，用于在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据；

第一目标样本数据获取模块420，用于将所述样本关联数据作为目标样本数据。

可选的，所述样本关联数据包括音频数据和音频位置数据。

可选的，所述第一目标样本数据获取模块包括：场景类型确定单元，用于根据所述音频数据对应的音频位置数据，确定所述音频数据匹配的场景类型；所述场景类型包括区域和/或轨迹；分类处理单元，用于根据所述音频数据匹配的场景类型，对所述音频数据进行分类处理；第一目标样本数据获取单元，用于将各个场景类型下的音频数据作为所述目标样本数据。

可选的，样本数据获取装置还包括：音频片段数据获取模块，用于根据所述音频位置数据对所述音频数据进行切分处理，形成音频片段数据。

可选的，样本数据获取装置还包括：人声检测模块，用于对所述音频片段数据进行人声检测；音频片段数据删除模块，用于如果确定所述音频片段数据包括人声数据，则删除所述音频片段数据；音频片段数据保留模块，用于如果确定所述音频片段数据不包括人声数据，则保留所述音频片段数据。

可选的，所述音频数据包括目标设备的噪声数据；第一目标样本数据获取模块420，具体用于：将不同场景类型下所述目标设备的噪声数据与预设人声数据进行交叉组合，生成所述目标样本数据。

上述样本数据获取装置可执行本发明任意实施例所提供的样本数据获取方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例提供的样本数据获取方法。

由于上述所介绍的样本数据获取装置为可以执行本发明实施例中的样本数据获取方法的装置，故而基于本发明实施例中所介绍的样本数据获取方法，本领域所属技术人员能够了解本实施例的样本数据获取装置的具体实施方式以及其各种变化形式，所以在此对于该样本数据获取装置如何实现本发明实施例中的样本数据获取方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中样本数据获取方法所采用的装置，都属于本申请所欲保护的范围。

实施例五

图5是本发明实施例五提供的一种模型训练装置的示意图，如图5所示，所述装置包括：第二目标样本数据获取模块510以及模型训练模块520，其中：

第二目标样本数据获取模块510，用于获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据本发明任一实施例所述的样本数据获取方法所获取的目标样本数据；

模型训练模块520，用于根据所述目标样本数据对所述目标模型进行训练。

可选的，模型训练装置还包括：当前使用模型更新模块，用于利用所述目标模型自动更新当前使用模型。

上述模型训练装置可执行本发明任意实施例所提供的模型训练方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例提供的模型训练方法。

由于上述所介绍的模型训练装置为可以执行本发明实施例中的模型训练方法的装置，故而基于本发明实施例中所介绍的模型训练方法，本领域所属技术人员能够了解本实施例的模型训练装置的具体实施方式以及其各种变化形式，所以在此对于该模型训练装置如何实现本发明实施例中的模型训练方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中模型训练方法所采用的装置，都属于本申请所欲保护的范围。

实施例六

图6为本发明实施例六提供的一种计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于：一个或者多个处理器616，存储装置628，连接不同系统组件(包括存储装置628和处理器616)的总线618。

总线618表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture，ISA)总线，微通道体系结构(Micro Channel Architecture，MCA)总线，增强型ISA总线、视频电子标准协会(Video Electronics Standards Association，VESA)局域总线以及外围组件互连(Peripheral Component Interconnect，PCI)总线。

计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储装置628可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory，RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统634可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory，CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory，DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储装置628可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块626的程序636，可以存储在例如存储装置628中，这样的程序模块626包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块626通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、摄像头、显示器624等)通信，还可与一个或者多个使得用户能与该计算机设备612交互的设备通信，和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output，I/O)接口622进行。并且，计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(Local Area Network，LAN)，广域网Wide Area Network，WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备612使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arraysof Independent Disks，RAID)系统、磁带驱动器以及数据备份存储系统等。

处理器616通过运行存储在存储装置628中的程序，从而执行各种功能应用以及数据处理，例如实现本发明上述实施例所提供的样本数据获取方法或模型训练方法。

也即，所述处理单元执行所述程序时实现：在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据；将所述样本关联数据作为目标样本数据。

或者，所述处理单元执行所述程序时实现：获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据本发明任一实施例所述的样本数据获取方法所获取的目标样本数据；根据所述目标样本数据对所述目标模型进行训练。

实施例七

本发明实施例七还提供一种存储计算机程序的计算机存储介质，所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的样本数据获取方法：在确定目标设备满足样本数据获取条件时，获取同一类型目标设备在使用过程中实时采集的样本关联数据；将所述样本关联数据作为目标样本数据。

或者，所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的模型训练方法：获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据本发明任一实施例所述的样本数据获取方法所获取的目标样本数据；根据所述目标样本数据对所述目标模型进行训练。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory，ROM)、可擦式可编程只读存储器((Erasable Programmable ReadOnly Memory，EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种样本数据获取方法，其特征在于，包括：

将所述样本关联数据作为目标样本数据；

所述样本关联数据包括音频数据和音频位置数据；

将所述样本关联数据作为目标样本数据，包括：

根据所述音频数据对应的音频位置数据，确定所述音频数据匹配的场景类型；所述场景类型包括区域和/或轨迹；

根据所述音频数据匹配的场景类型，对所述音频数据进行分类处理；

将各个场景类型下的音频数据作为所述目标样本数据。

2.根据权利要求1所述的方法，其特征在于，所述样本数据获取条件包括：

所述目标设备的使用年限达到目标年限；或

所述目标设备的设备结构发生改变。

3.根据权利要求1所述的方法，其特征在于，在获取同一类型目标设备在使用过程中实时采集的样本关联数据之后，还包括：

根据所述音频位置数据对所述音频数据进行切分处理，形成音频片段数据。

4.根据权利要求3所述的方法，其特征在于，在根据所述音频位置数据对所述音频数据进行切分处理之后，还包括：

对所述音频片段数据进行人声检测；

如果确定所述音频片段数据包括人声数据，则删除所述音频片段数据；

如果确定所述音频片段数据不包括人声数据，则保留所述音频片段数据。

5.根据权利要求2-4任一所述的方法，其特征在于，音频数据包括目标设备的噪声数据；

将所述样本关联数据作为目标样本数据，包括：

将不同场景类型下所述目标设备的噪声数据与预设人声数据进行交叉组合，生成所述目标样本数据。

6.一种模型训练方法，其特征在于，包括：

获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据权利要求1-5任一所述的样本数据获取方法所获取的目标样本数据；

根据所述目标样本数据对所述目标模型进行训练。

7.一种样本数据获取装置，其特征在于，包括：

第一目标样本数据获取模块，用于将所述样本关联数据作为目标样本数据；

所述样本关联数据包括音频数据和音频位置数据；

所述第一目标样本数据获取模块包括：

场景类型确定单元，用于根据所述音频数据对应的音频位置数据，确定所述音频数据匹配的场景类型；所述场景类型包括区域和/或轨迹；

分类处理单元，用于根据所述音频数据匹配的场景类型，对所述音频数据进行分类处理；

第一目标样本数据获取单元，用于将各个场景类型下的音频数据作为所述目标样本数据。

8.根据权利要求7所述的装置，其特征在于，所述样本数据获取条件包括：

所述目标设备的使用年限达到目标年限；或

所述目标设备的设备结构发生改变。

9.一种模型训练装置，其特征在于，包括：

第二目标样本数据获取模块，用于获取训练目标模型所需的目标样本数据；其中，所述目标样本数据为根据权利要求1-5任一所述的样本数据获取方法所获取的目标样本数据；

10.一种计算机设备，其特征在于，所述计算机设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的样本数据获取方法，或者实现如权利要求6中所述的模型训练方法。