CN108197664B

CN108197664B - 模型获取方法、装置、电子设备及计算机可读存储介质

Info

Publication number: CN108197664B
Application number: CN201810070429.6A
Authority: CN
Inventors: 孙鹏飞; 张昊
Original assignee: Beijing Moqiu Technology Co ltd
Current assignee: Beijing Moqiu Technology Co ltd
Priority date: 2018-01-24
Filing date: 2018-01-24
Publication date: 2020-09-04
Anticipated expiration: 2038-01-24
Also published as: CN108197664A

Abstract

本公开实施例公开了模型获取方法、装置、电子设备及计算机可读存储介质。所述方法包括：获取用户标注数据；所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果；从预训练模型集中选取与所述用户标注数据相匹配的预训练模型；所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。通过本公开的实施方式，用户可以仅根据少量的用户标注数据，快速得到一个经过大量数据训练的预训练模型，由于服务器选择了最接近用户需求的预训练模型，用户可以直接部署该预训练模型并容忍少量误差，或者通过再训练的方式快速达到自身的需求，节省了用户成本，提高了用户体验。

Description

模型获取方法、装置、电子设备及计算机可读存储介质

技术领域

本公开涉及智能识别技术领域，具体涉及一种模型获取方法、装置、电子设备及计算机可读存储介质。

背景技术

近年来人工智能技术得到了飞速发展并逐步应用到更多的行业和领域中，其中的原因是机器学习作为一个分支得到了突破性的进展。机器学习方法作为人工智能的一个分支，其能够通过训练数据的增加而不断提升人工智能任务的性能。也就是说，人工智能技术的发展来自于将任务建立在利用更多的数据的方法之上。例如，机器学习中的一个分支深度学习就能够通过不断使用更多的训练数据，得到传统人工智能方法无法达到的水平，进而使得过去只能停留在实验室的技术可以在工业和民用领域得到实际应用。

发明内容

本公开实施例提供一种模型获取方法、装置、电子设备及计算机可读存储介质。

第一方面，本公开实施例中提供了一种模型获取方法，所述方法运行在服务器，包括：

获取用户标注数据；其中，所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果；

从预训练模型集中选取与所述用户标注数据相匹配的预训练模型；所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。

可选地，从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，包括：

根据所述用户标注数据识别所述用户对所述第一训练样本的用户标注标准；

从所述预训练模型集中选取与所述用户标注标准相匹配的所述预训练模型。

将所述第一训练样本输入到至少一个所述预训练模型中；

将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配；

根据匹配结果选取与所述第一标注结果的匹配度最高的所述预训练模型。

可选地，将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配，包括：

匹配所述第一标注结果所属第一种类的个数以及所述预训练模型的输出种类个数；所述第一种类的个数根据所述用户标注数据中多个第一训练样本对应的多个第一标注结果的不同种类确定；以及

匹配所述第一种类以及所述预训练模型的输出种类。

可选地，匹配所述第一种类以及所述预训练模型的输出种类，包括：

根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差。

可选地，根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差，包括：

确定属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本的交集；

根据所述交集中第一训练样本的数量计算所述第一种类与输出种类之间的误差。

可选地，根据匹配结果选取与所述第一标注结果的匹配度最高的所述输出结果对应的所述预训练模型，包括：

根据所有第一种类及其对应的输出种类之间的累计误差确定所述第一种类和输出种类之间的相似度；

根据所述第一种类个数与所述输出种类个数以及所述相似度选取所述预训练模型。

将所述用户标注数据与训练所述预训练模型集中的预训练模型的本地训练数据进行匹配；所述本地训练数据包括第二训练样本及其对应的第二标注结果；

确定匹配度最高的所述本地训练数据。

选取经过匹配度最高的所述本地训练数据训练过的预训练模型。

可选地，其特征在于，所述用户标注数据包括以下至少之一：

对所述预训练模型集中至少一个预训练模型进行了训练的本地训练数据；

用户自行产生的私有数据。

可选地，所述用户标注标准为用户从所述服务器获取的标注标准。

第二方面，本公开实施例中还提供一种模型获取方法，所述方法运行在客户端，包括：

将第一训练样本和第一标注结果发送至服务器；所述第一标注结果为根据用户标注标准对所述第一训练样本进行标注得到的结果；

从服务器获取与所述用户标注标准相匹配的预训练模型；

基于所述第一训练样本和第一标注结果对所述预训练模型进行训练。

可选地，所述方法还包括：

从所述服务器获得所述用户标注标准；和/或

从所述服务器获得所述第一训练样本和第一标注结果。

第三方面，本公开实施例还提供了一种模型获取装置，所述装置运行在服务器，包括：

第一获取模块，被配置为获取用户标注数据；其中，所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果；

选取模块，被配置为从预训练模型集中选取与所述用户标注数据相匹配的预训练模型；所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。

可选地，所述选取模块，包括：

第一识别子模块，被配置为根据所述用户标注数据识别所述用户对所述第一训练样本的用户标注标准；

第一选取子模块，被配置为从所述预训练模型集中选取与所述用户标注标准相匹配的所述预训练模型。

可选地，所述选取模块，包括：

第一输入子模块，被配置为将所述第一训练样本输入到至少一个所述预训练模型中；

第一匹配子模块，被配置为将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配；

第二选取子模块，被配置为根据匹配结果选取与所述第一标注结果的匹配度最高的所述预训练模型。

可选地，所述第一匹配子模块，包括：

第二匹配子模块，被配置为匹配所述第一标注结果所属第一种类的个数以及所述预训练模型的输出种类个数；所述第一种类的个数根据所述用户标注数据中多个第一训练样本对应的多个第一标注结果的不同种类确定；以及

第三匹配子模块，被配置为匹配所述第一种类以及所述预训练模型的输出种类。

可选地，所述第三匹配子模块，包括：

第一计算子模块，被配置为根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差。

可选地，所述第一计算子模块，包括：

第一确定子模块，被配置为确定属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本的交集；

第二计算子模块，被配置为根据所述交集中第一训练样本的数量计算所述第一种类与输出种类之间的误差。

可选地，所述第二选取子模块，包括：

第二确定子模块，被配置为根据所有第一种类及其对应的输出种类之间的累计误差确定所述第一种类和输出种类之间的相似度；

第三选取子模块，被配置为所述第一种类个数与所述输出种类个数以及所述相似度选取所述预训练模型。

可选地，所述选取模块，包括：

第四匹配子模块，被配置为将所述用户标注数据与训练所述预训练模型集中的预训练模型的本地训练数据进行匹配；所述本地训练数据包括第二训练样本及其对应的第二标注结果；

第三确定子模块，被配置为确定匹配度最高的所述本地训练数据。

可选地，所述选取模块，包括：

第四选取子模块，被配置为选取经过匹配度最高的所述本地训练数据训练过的预训练模型。

可选地，所述用户标注数据包括以下至少之一：

用户自行产生的私有数据。

第四方面，本公开实施例提供了一种模型获取装置，所述装置运行在客户端，包括：

发送模块，被配置为将第一训练样本和第一标注结果发送至服务器；所述第一标注结果为根据用户标注标准对所述第一训练样本进行标注得到的结果；

第二获取模块，被配置为从服务器获取与所述用户标注标准相匹配的预训练模型；

训练模块，被配置为基于所述第一训练样本和第一标注结果对所述预训练模型进行训练。

可选地，所述装置还包括：

第三获取模块，被配置为从所述服务器获得所述用户标注标准；和/或

第四获取模块，被配置为从所述服务器获得所述第一训练样本和第一标注结果。

所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，模型获取装置的结构中包括存储器和处理器，所述存储器用于存储一条或多条支持模型获取装置执行上述第一方面中模型获取方法的计算机指令，所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述模型获取装置还可以包括通信接口，用于模型获取装置与其他设备或通信网络通信。

第五方面，本公开实施例提供了一种电子设备，包括存储器和处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行以实现第一方面或第二方面所述的方法步骤。

第六方面，本公开实施例提供了一种计算机可读存储介质，用于存储模型获取装置所用的计算机指令，其包含用于执行上述第一方面或第二方面中模型获取方法所涉及的计算机指令。

本公开实施例提供的技术方案可以包括以下有益效果：

本公开实施例利用获取的用户标注数据，选取与所述用户标注数据相匹配的预训练模型。用户标注数据包括第一训练样本和对该第一训练样本的第一标注结果。预训练模型为预先经过训练的人工智能模型。通过这种方式，用户可以仅根据少量的用户标注数据，快速的得到一个经过大量数据训练的预训练模型，由于服务器选择了最接近用户需求的预训练模型，用户可以直接部署该预训练模型并容忍少量误差，或者通过再训练的方式快速达到自身的需求，节省了用户成本，提高了用户体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

结合附图，通过以下非限制性实施方式的详细描述，本公开的其它特征、目的和优点将变得更加明显。在附图中：

图1示出根据本公开一实施方式的模型获取方法的流程图；

图2示出根据图1所示实施方式的步骤S102的流程图；

图3示出根据本公开又一实施方式的模型获取方法的流程图；

图4示出根据本公开一实施方式的模型获取装置的结构框图；

图5示出根据本公开又一实施方式的模型获取装置的结构框图；

图6是适于用来实现根据本公开一实施方式的模型获取方法的电子设备的结构示意图。

具体实施方式

下文中，将参考附图详细描述本公开的示例性实施方式，以使本领域技术人员可容易地实现它们。此外，为了清楚起见，在附图中省略了与描述示例性实施方式无关的部分。

在本公开中，应理解，诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在，并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

随着人工智能技术的不断发展，可以用于训练人工智能模型的数据变得越来越有价值。在一些领域，通用的数据可以轻易获得，例如通过互联网存储的各种信息，可以得到海量的数据。然而，随着人工智能应用领域的扩大，一个重要的问题逐渐凸显出来。在一些专业领域，用于训练的数据并不容易获得，而且数量非常稀少。例如，可以用于癌症诊断的数据需要一个真实的病人才能获得，一个定制化的服务需要根据定制的需求积累很多年才能使得数据量足够大。这意味着由于数据的稀缺，限制了机器学习在某些重要领域的应用。

因此，通过网络的方式让数据流通起来，使得大家能够共享数据，甚至通过共享训练好的一些基础的人工智能模型，既能够促进人工智能技术的进一步发展，还能为社会节省成本。

图1示出根据本公开一实施方式的模型获取方法的流程图。如图1所示，所述模型获取方法包括以下步骤S101-S102：

在步骤S101中，获取用户标注数据；其中，所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果；

在步骤S102中，从预训练模型集中选取与所述用户标注数据相匹配的预训练模型；所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。

在本实施例中，用户标注数据包括第一训练样本以及用户对第一训练样本进行标注得到的第一标注结果，用户标注数据可以是由用户通过网络上传至服务器的数据，也可以是从网络上收集到的，还可以是本地产生的一些数据。例如，对于一家医疗研发企业，其可以在企业内部通过对病患进行临床试验得到患者的病情数据，也可以是其他医院的医生在工作过程中收集的病患诊断的临床病情数据以及对应于该临床病情数据的诊断结果，并由医生通过客户端上传至医疗研发企业的服务器，或者是在医生将这些数据存储至网络的数据库中后，由该医疗研发企业的服务器通过爬虫等方式搜索得到。

在服务器中可以包括一个模型存储模块，用于存储多种预训练模型集，每种预训练模型集中可以包括一个或多个预训练模型，例如人工智能分类或预测模型。在一种实施方式中，这些人工智能分类或预测模型可以是利用了不同的训练数据训练得到的机器学习模型，例如通过标注后的训练数据训练一个卷积神经网络、深度神经网络、循环神经网络等得到的。不同的分类或预测模型使用不同的标注数据或标注方法，使得分类或预测模型具有不同的属性。不同的分类模型使用不同的标注数据或标注方法，使得分类模型具有不同的属性。之所以使用多个分类模型而不是将所有训练数据通过统一的标注方法训练一个分类模型的原因在于，人类对分类方法的需求本身有所不同，尤其是在一些需要很多主观判断分类的领域，再或者具有不同的分类方法需求的领域。例如，农产品的品质分类就基于对形状、色泽等因素的主观性，颜色的分类，消费者群落的分类等等。也就是说，在一些领域，不同的用户对分类或预测模型的需求是不同的，同时他们拥有的标注数据也是不同的。此处用户是指一个需要使用人工智能分类模型的企业、个人、团体或研究机构等。例如一个通过标注数据训练的模型可以将车辆划分为轿车和越野轿车，也可以通过标注数据训练的模型将车辆划分为经济型轿车或豪华轿车。不同的用户对分类或预测的需求还可能是定制化的，也就是每个用户都有一套自己的分类或预测方法。一种最理想的情况是，每个用户都能够针对自身的需求，制定对应的分类或预测标准和方法，并使用私有或其他渠道获得的数据，训练一个私有的人工智能模型。然而，这就要求每个用户都标注大量的标注数据并完成模型的训练。这使得部署一个人工智能模型变得非常困难，例如无法获得足够多的标注数据，没有足够多的计算资源等问题。

因此，可以提供一种平台，将一些预先训练好的预训练模型存储起来，在需要的情况下，例如某用户为了统计当前人们穿着较为流行的花色，需要训练一个人工智能模型，通过该人工智能模型识别路上行人衣着的花色。这种情况下，该用户需要收集大量衣服的图像，且耗费时间和精力非常巨大，因此，用户可以自行收集一些图像样本，并以自己的标注标准将这些图像样本进行标注，之后再上传到平台，由平台根据用户上传的图像样本以及标注结果为用户选取相匹配的预训练模型，使得所选取的预训练模型能够按照用户的标准对图像样本进行分类识别。通过这种方式，首先平台可以从不同用户收集到各种各样的样本数据以及对应的标注结果，使得有价值的数据通过网络流通起来，并且能够进一步为平台训练更多的模型提供了基础；其次，用户可以通过平台获得自身需要的人工智能模型，而不需要用户自己对空白模型进行训练，方便了不具备收集大量样本数据的用户，同时节省了用户的时间、精力以及成本。当然可以理解的是，平台也可以通过网络收集或在本地产生一些样本数据以及标注结果，并通过本公开实施例的方法选取合适的预训练模型，对预训练模型做进一步的训练。

在本实施例的一个可选实现方式中，所述用户标注数据包括以下至少之一：对所述预训练模型集中至少一个预训练模型进行了训练的本地训练数据；用户自行产生的私有数据。

该可选的实现方式中，用户可以从服务器获得用户需要的一些样本数据，而这些样本数据可以是服务器用于训练预训练模型的本地训练数据。用户可以从服务器提供的接口通过输入自身需求查找到满足用户需求的样本数据，进而再将样本数据提供给服务器，由服务器为用户提供满足用户需求的预训练模型。在一实施例中，如果用户标注数据是用户从服务器上获取的本地训练数据，则服务器可以直接通过本地训练数据查找到被本地训练数据训练过的预训练模型，提供给用户使用。通过这种方式，用户可以方便地从服务器获得满足自身需求的样本数据，并进一步获得满足自身需求的预训练模型，用户只需根据需求确认样本数据是否满足自身全需求即可，而无需深入研究预训练模型的具体功能，简单直观，容易被用户掌握，极大地提高了用户体验。

当然，在另一实施例中，用户标注数据可以是用户通过自己的方式产生的私有数据，这种情况下，用户将自己产生的私有数据提供给服务器，服务器通过识别私有数据中的用户标注标准，为用户提供能够满足用户需求的预训练模型。

在本实施例的一个可选实现方式中，所述用户标注标准为用户从所述服务器获取的标注标准。该可选的实现方式中，用户对于在本地产生的私有数据进行标注时，可以基于用户自身的经验或者已有的规则进行标注，也可以从服务器获取标注标准，基于服务器提供的标注标准来标注私有数据。如果是从服务器获取的标注标准，则在提供用户标注数据的同时，还可以提供该标注标准，服务器可以直接根据该标注标准查找获得符合该标注标准的预训练模型。

在本实施例的一个可选实现方式中，如图2所示，所述步骤S102，即从预训练模型集中选取与所述用户标注数据相匹配的预训练模型的步骤，进一步包括以下步骤S201-S202：

在步骤S201中，根据所述用户标注数据识别所述用户对所述第一训练样本的用户标注标准；

在步骤S202中，从所述预训练模型集中选取与所述用户标注标准相匹配的所述预训练模型。

在该可选的实现方式中，在获取了用户标注数据后，如果没有直接获取到用户标注数据中的标注标准的话，可以基于用户标注数据识别用户标注标准，然后再选取与用户标注标准相匹配的预训练模型。与用户标注标准相匹配是指该预训练模型的分类或预测标准与用户标注标准一致。例如，用户标注数据包括多种布料样本图像的特征以及布料花色的标注结果，则可以通过用户标注数据识别出布料花色的分类标准。具体的识别方式在下面详细说明。

在该可选的实现方式下，对数据进行标注时，用户只需要按照自身的需求进行标注即可，而不需要考虑服务器中存储的预训练模型的具体属性。也就是说用户并不需要对多个预训练模型进行对比或性能分析，而是专注于按自身需求完成对一定量的数据的标注。在用户完成标注后，这些数据就包含了用户对分类或预测的要求，尽管其中具体的标注原则没有显性的记录下来，而是通过标注的信息与样本数据信息之间的关联隐性的记录下来。进一步，服务器在获得用户标注数据后，能够根据用户标注数据从多个预训练模型中选出与用户需求最相近的模型。

在本实施例的一个可选实现方式中，所述步骤S201，即根据所述用户标注数据识别所述用户对所述第一训练样本的用户标注标准的步骤，进一步包括以下步骤：

将所述第一训练样本输入到至少一个所述预训练模型中；

在该可选的实现方式中，可以通过将多个用户标注数据中的第一训练样本输入至一个预训练模型中，并得到多个用户标注数据在该预训练模型下的输出结果。同时，通过对输出结果与用户标注的第一标注结果进行匹配，最终根据匹配结果从多个预训练模型中选取匹配度最高的一个预训练模型。匹配度最高可以是指用户标注标准与预训练模型的分类或预测标准的差异性最小。例如，用户标注标准与预训练模型的分类或预测标准所包含的类别差异最小，以及每个类别具体包含的样本特征差异最小。例如，一个既包含纹理又包含颜色的样品的分类方式可以基于纹理的不同或基于颜色的不同，在服务器中存储有一个基于纹理的预训练模型同时存储一个基于颜色的预训练模型。当用户对数据进行标注时，可能基于一种主观的经验，该经验中主要参考了样本的纹理信息同时部分考虑了颜色信息。匹配模块将标注后的样本输入至预训练模型，则基于纹理的预训练模型将被选取为匹配度最高的模型。

在本实施例的一个可选实现方式中，上述步骤将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配，包括：

匹配所述第一标注结果所属第一种类的个数以及所述预训练模型的输出个数；所述第一种类的个数根据所述用户标注数据中多个第一训练样本对应的多个第一标注结果的不同种类确定；以及

匹配所述第一种类以及所述预训练模型的输出种类。

该可选的实现方式中，在匹配用户标注标准与预训练模型的分类或预测标准时，可以考虑两个方面：第一，用户标注标准中第一标注结果的种类个数(即第一种类个数)与预训练模型的输出个数之间的差异；第二，预训练模型的各个输出种类与第一标注结果所属的各个种类之间的差异。第一标注结果的种类个数可以通过获取的用户标注数据中所有训练样本对应的标注结果的种类进行统计得到；预训练模型的分类或预测种类与输出个数相同，因此预训练模型的输出个数也即预训练模型的分类或预测种类。一个完全符合用户需求的预训练模型的输出个数与用户标注标准中标注结果的种类可以完全相同，当然，由于无法保证能获得完全满足用户需求的预训练模型，因此也可以选取与用户标注标准中标注结果的种类相近的预训练模型。此外，用户标注标准中的第一种类与预训练模型的输出种类的匹配，可以通过对于同一训练样本，其对应的第一标注结果与预训练模型的输出结果进行匹配。那么对于用户标注数据中的多个第一训练样本，其对应的多个第一标注结果与预训练模型的输出结果都相同或者大部分都相同，则可以认为用户标注标准的各个种类与预训练模型的输出种类相匹配的。

在本实施例的一个可选实现方式中，匹配所述第一种类以及所述预训练模型的输出种类，包括：

该可选的实现方式中，为了确定用户标注标准中各个种类是否与预训练模型的输出种类相匹配，可以通过将用户标注数据中的多个第一训练样本分别输入至预训练模型，获得多个输出结果，之后再将多个输出结果与相应的第一标注结果进行比较，计算相同和不相同的第一训练样本个数。

在本实施例的一个可选实现方式中，根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差，包括：

该可选的实现方式中，通过计算输出结果与第一标注结果相同的训练样本个数来确定第一种类和输出种类之间的误差。例如，用户标注数据包括10个第一训练样本，将10个第一训练样本输入至预训练模型A和B后，预训练模型A得到的10个输出结果中有5个与相应的第一标注结果相同，有5个第一训练样本的输出结果与相应的第一标注结果不同，则第一种类和输出种类之间的误差为50％；预训练模型B得到的输出结果中，有6个第一训练样本的输出结果与相应的第一标注结果相同，而4个第一训练样本的输出结果与相应的第一标注结果不同，则第一种类和输出种类之间的误差为40％。

在本实施例的一个可选实现方式中，根据匹配结果选取与所述第一标注结果的匹配度最高的所述输出结果对应的所述预训练模型，包括：

根据所有第一种类及其对应的输出种类之间的累计误差确定所述用户标注结果与多个所述预训练模型的相似度；

在该可选的实现方式中，确定出用户标注数据中第一标注结果所属的所有第一种类及相应的预训练模型的输出种类之间的误差以后，可以基于各个第一种类及相应输出种类之间的误差的累计值确定第一种类和输出种类之间的相似度。例如，用户标注数据中第一标注结果所述的第一种类包括3种，分别为A1、A2和A3，预训练模型A的输出种类也包括3种(当然，预训练模型A的输出种类还可以多于或少于3种)，分别为B1、B2和B3，且A1与B1相对应，误差为30％，A2和B2相对应，误差为20％，A3和B3相对应，误差为5％，则三者的累计误差为45％；当然也可以计算累计误差的平均值，即15％，因此，基于累计误差的平均值可以认为用户标注数据的第一种类与预训练模型A的输出种类之间的相似度为85％。假如还存在预训练模型B，用户标注数据的第一种类与预训练模型B的输出种类之间的相似度为80％，且预训练模型B的输出种类为4种，则可以基于第一种类个数与输出种类个数、所述第一种类和输出种类之间的相似度确定预训练模型A为与用户标注数据最匹配的模型。

确定匹配度最高的所述本地训练数据。

该可选的实现方式中，还可以通过匹配用户标注数据与预训练模型的训练数据来确定两者的匹配度。人工智能模型的主要是通过机器自学习方法学习训练数据中隐含的一些特征，进而能够识别类似数据中的这些特征。因此，人工智能模型能够识别哪种数据主要取决于其训练数据。因此，该实施例通过将用户标注数据与预训练模型的训练数据进行比较，来确定两者的匹配度，匹配度最高的本地训练数据的标注标准与用户标注数据的标注标准最相近。预训练模型是预先由服务器通过一些本地训练数据进行训练而得到的，其包括第二训练样本和对应的第二标注结果。本地训练数据可以是服务器所在企业、机构等本地产生的样本数据，也可以是通过网络收集的样本数据，还可以是之前由其他用户上传至服务器的其他用户标注数据等。

在本实施例的一个可选实现方式中，所述步骤S102，即从预训练模型集中选取与所述用户标注数据相匹配的预训练模型的步骤，进一步包括：

该可选的实现方式中，在确定了与用户标注数据匹配度最高的本地训练数据后，可以确定经过该本地训练数据训练过的预训练模型为与用户标注数据相匹配的预训练模型。

图3示出根据本公开一实施方式的模型获取方法的流程图。如图3所示，所述模型获取方法包括以下步骤S301-S303：

在步骤S301中，将第一训练样本和第一标注结果发送至服务器；所述第一标注结果为根据用户标注标准对所述第一训练样本进行标注得到的结果；

在步骤S302中，从服务器获取与所述用户标注标准相匹配的预训练模型；

在步骤S303中，基于所述第一训练样本和第一标注结果对所述预训练模型进行训练。

在该可选的实现方式中，用户获得第一训练样本以及按照用户标注标准对第一训练样本进行标注得到的第一标注结果后，上传至服务器，服务器可以基于第一训练样本和第一标注结果为用户匹配出适用于用户标注标准的预训练模型，并将预训练模型提供给用户。用户在获得预训练模型后，利用第一训练样本和第一标注结果对预训练模型进行再训练，获得符合用户需求的人工智能模型。由于用户需求的多样化，能够满足用户需求的人工智能模型也是多种多样，而为了节省成本，方便用户，服务器可以预先训练一些较为通用的模型存储起来，用户可以将满足自身需求的第一训练样本和第一标注结果提供给服务器，服务器基于第一训练样本和第一标注结果的标注标准为用户选取与用户需求相近的预训练模型。用户可以在预训练模型的基础上，利用第一训练样本和第一标注结果再训练。通过这种方式，用户无需收集大量的训练样本，从空白模型开始训练，而可以仅根据少量的用户标注数据，快速的得到一个经过大量数据训练的预训练模型，进而在对该预训练模型进行再训练，最终得到适合用户需求的定制化模型。例如，用户可以仅仅标注几百张样本数据，就可以匹配得到一个经过数百万张数据训练过的预训练模型。由于服务器选择了最接近用户需求的预训练模型，用户可以直接部署该预训练模型并容忍少量误差，或者通过再训练的方式快速达到自身的需求。

在本实施例的一个可选实现方式中，所述方法还包括：

从所述服务器获得所述用户标注标准；和/或

从所述服务器获得所述第一训练样本和第一标注结果。

该可选的实现方式中，用户可以从服务器获得用户标注标准，进而根据用户标注标准对私有数据进行标注，得到第一训练样本和第一标注结果；用户还可以直接从服务器获得能够满足自身需求第一训练样本和第一标注结果。通过这种方式，能够极大地方便用户，提高用户体验。

下述为本公开装置实施例，可以用于执行本公开方法实施例。

图4示出根据本公开一实施方式的模型获取装置的结构框图，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。所述装置运行在服务器。如图4所示，所述模型获取装置包括第一获取模块401和选取模块402：

第一获取模块401，被配置为获取用户标注数据；其中，所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果；

选取模块402，被配置为从预训练模型集中选取与所述用户标注数据相匹配的预训练模型；所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。

在本实施例的一个可选实现方式中，所述选取模块402，包括：

在本实施例的一个可选实现方式中，所述第一识别子模块，包括：

在本实施例的一个可选实现方式中，所述第一匹配子模块，包括：

在本实施例的一个可选实现方式中，所述第三匹配子模块，包括：

在本实施例的一个可选实现方式中，所述第一计算子模块，包括：

在本实施例的一个可选实现方式中，所述第二选取子模块，包括：

在本实施例的一个可选实现方式中，所述识别子模块，包括：

在本实施例的一个可选实现方式中，所述用户标注数据包括以下至少之一：

用户自行产生的私有数据。

在本实施例的一个可选实现方式中，所述用户标注标准为用户从所述服务器获取的标注标准。

图5示出根据本公开一实施方式的模型获取装置的结构框图，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。所述装置运行在客户端。如图5所示，所述模型获取装置包括发送模块501、第二获取模块502和训练模块503：

发送模块501，被配置为将第一训练样本和第一标注结果发送至服务器；所述第一标注结果为根据用户标注标准对所述第一训练样本进行标注得到的结果；

第二获取模块502，被配置为从服务器获取与所述用户标注标准相匹配的预训练模型；

训练模块503，被配置为基于所述第一训练样本和第一标注结果对所述预训练模型进行训练。

在本实施例的一个可选实现方式中，所述装置还包括：

图6是适于用来实现根据本公开实施方式的模型获取方法的电子设备的结构示意图。

如图6所示，电子设备600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行上述图1所示的实施方式中的各种处理。在RAM603中，还存储有电子设备600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施方式，上文参考图1描述的方法可以被实现为计算机软件程序。例如，本公开的实施方式包括一种计算机程序产品，其包括有形地包含在及其可读介质上的计算机程序，所述计算机程序包含用于执行图1的方法的程序代码。在这样的实施方式中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。

附图中的流程图和框图，图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中，这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面，本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质；也可以是单独存在，未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序，所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种模型获取方法，其特征在于，所述方法运行在服务器，包括：

获取用户标注数据；其中，所述用户标注数据包括用户自行收集图像的第一训练样本和用户以自己的标注标准对所述第一训练样本进行标注的第一标注结果；

从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，使得所选取的预训练模型能够按照用户的标准对图像样本进行分类识别；其中，所述预训练模型集包括一个或多个预先利用了不同的训练数据经过机器学习训练的预训练模型。

2.根据权利要求1所述的模型获取方法，其特征在于，从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，包括：

根据所述用户标注数据识别所述用户对所述第一训练样本进行标注的用户标注标准；

3.根据权利要求1所述的模型获取方法，其特征在于，从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，包括：

将所述第一训练样本输入到至少一个所述预训练模型中；

4.根据权利要求3所述的模型获取方法，其特征在于，将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配，包括：

匹配所述第一种类以及所述预训练模型的输出种类。

5.根据权利要求4所述的模型获取方法，其特征在于，匹配所述第一种类以及所述预训练模型的输出种类，包括：

6.根据权利要求5所述的模型获取方法，其特征在于，根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差，包括：

7.根据权利要求6所述的模型获取方法，其特征在于，根据匹配结果选取与所述第一标注结果的匹配度最高的所述输出结果对应的所述预训练模型，包括：

8.根据权利要求1所述的模型获取方法，其特征在于，从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，包括：

确定匹配度最高的所述本地训练数据。

9.根据权利要求8所述的模型获取方法，其特征在于，从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，包括：

10.根据权利要求1-9任一项所述的模型获取方法，其特征在于，所述用户标注数据包括以下至少之一：

用户自行产生的私有数据。

11.根据权利要求2所述的模型获取方法，其特征在于，所述用户标注标准为用户从所述服务器获取的标注标准。

12.一种模型获取方法，其特征在于，所述方法运行在客户端，包括：

将用户自行收集图像的第一训练样本和第一标注结果发送至服务器；所述第一标注结果为根据用户标注标准对所述第一训练样本进行标注得到的结果；

从服务器的预训练模型集中获取与所述用户标注标准相匹配的预训练模型，使得所选取的预训练模型能够按照用户的标准对图像样本进行分类识别；其中，所述预训练模型集包括一个或多个预先利用了不同的训练数据经过机器学习训练的预训练模型；

13.根据权利要求12所述的模型获取方法，其特征在于，还包括：

从所述服务器获得所述用户标注标准；和/或

从所述服务器获得所述第一训练样本和第一标注结果。

14.一种模型获取装置，其特征在于，所述装置运行在服务器，包括：

第一获取模块，被配置为获取用户标注数据；其中，所述用户标注数据包括用户自行收集图像的第一训练样本和用户以自己的标注标准对所述第一训练样本进行标注的第一标注结果；

选取模块，被配置为从预训练模型集中选取与所述用户标注数据相匹配的预训练模型，使得所选取的预训练模型能够按照用户的标准对图像样本进行分类识别；其中，所述预训练模型集包括一个或多个预先利用了不同的训练数据经过机器学习训练的预训练模型。

15.根据权利要求14所述的模型获取装置，其特征在于，所述选取模块，包括：

第一识别子模块，被配置为根据所述用户标注数据识别所述用户对所述第一训练样本进行标注的用户标注标准；

16.根据权利要求14所述的模型获取装置，其特征在于，所述选取模块，包括：

17.根据权利要求16所述的模型获取装置，其特征在于，所述第一匹配子模块，包括：

18.根据权利要求17所述的模型获取装置，其特征在于，所述第三匹配子模块，包括：

19.根据权利要求18所述的模型获取装置，其特征在于，所述第一计算子模块，包括：

20.根据权利要求19所述的模型获取装置，其特征在于，所述第二选取子模块，包括：

21.根据权利要求14所述的模型获取装置，其特征在于，所述选取模块，包括：

22.根据权利要求21所述的模型获取装置，其特征在于，所述选取模块，包括：

23.根据权利要求14-22任一项所述的模型获取装置，其特征在于，所述用户标注数据包括以下至少之一：

用户自行产生的私有数据。

24.根据权利要求15所述的模型获取装置，其特征在于，所述用户标注标准为用户从所述服务器获取的标注标准。

25.一种模型获取装置，其特征在于，所述装置运行在客户端，包括：

发送模块，被配置为将用户自行收集图像的第一训练样本和第一标注结果发送至服务器；所述第一标注结果为根据用户标注标准对所述第一训练样本进行标注得到的结果；

第二获取模块，被配置为从服务器的预训练模型集中获取与所述用户标注标准相匹配的预训练模型，使得所选取的预训练模型能够按照用户的标准对图像样本进行分类识别；其中，所述预训练模型集包括一个或多个预先利用了不同的训练数据经过机器学习训练的预训练模型；

26.根据权利要求25所述的模型获取装置，其特征在于，还包括：

27.一种电子设备，其特征在于，包括存储器和处理器；其中，

所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行以实现权利要求1-13任一项所述的方法步骤。

28.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1-13任一项所述的方法步骤。