CN114764444A

CN114764444A - 图像生成及样本图像扩充方法、装置及计算机存储介质

Info

Publication number: CN114764444A
Application number: CN202210355913.XA
Authority: CN
Inventors: 花远肖; 蹇易
Original assignee: Yuncong Technology Group Co Ltd
Current assignee: Yuncong Technology Group Co Ltd
Priority date: 2022-04-06
Filing date: 2022-04-06
Publication date: 2022-07-19

Abstract

本申请提供一种图像生成及样本图像扩充方法、装置及计算机存储介质，包括根据目标单词的词特征，确定知识图谱中与目标单词关联的多个单词节点，并根据与目标单词关联的每一个单词节点的词特征，获得目标单词的扩展特征；利用映射预测模型，根据目标单词的扩展特征执行映射转换预测，生成目标单词的目标图像。借此，本申请可实现图像样本类别的自动扩充，以增加模型的识别类别数量，并提高模型识别结果的准确率。

Description

图像生成及样本图像扩充方法、装置及计算机存储介质

技术领域

本申请实施例涉及数据处理技术领域，特别涉及一种图像生成及样本图像扩充方法、装置及计算机存储介质。

背景技术

在许多实际应用场景中，若需要模型识别某类目标物体，需在训练阶段过程中，提供包含大量该类目标物体的图像数据并进行人工标注，以作为模型的训练数据。然而，大规模的图片数据标注任务，需要耗费大量的时间成本和人力成本，导致了由于训练数据不够充分，使得训练好的模型只能识别与训练数据相同的类别，而无法正确识别出训练数据中不包含的类别。

有鉴于此，如何在不增加训练成本的前提下，扩充模型的识别类别，以提升模型识别结果的准确率，即为本申请待解决的技术课题。

发明内容

鉴于上述问题，本申请提供一种图像生成及样本图像扩充方法、装置及计算机存储介质，可至少部分地解决上述现有技术中的问题。

本申请第一方面提供一种图像生成方法，包括：根据目标单词的词特征，确定知识图谱中与所述目标单词关联的多个单词节点，并根据与所述目标单词关联的每一个单词节点的词特征，获得所述目标单词的扩展特征；利用映射预测模型，根据所述目标单词的扩展特征执行映射转换预测，生成所述目标单词的目标图像。

本申请第二方面提供一种样本图像扩充方法，包括：获取待识别单词；利用上述第一方面所述的图像生成方法，生成所述待识别单词的单词图像；将所述待识别单词和所述待识别单词的单词图像分别作为新的样本单词和所述新的样本单词的样本图像，以扩充至样本数据库中。

本申请第三方面提供一种图像生成装置，包括：特征扩展模块，用于根据目标单词的词特征，确定知识图谱中与所述目标单词关联的多个单词节点，并根据与所述目标单词关联的每一个单词节点的词特征，获得所述目标单词的扩展特征；映射预测模型，用于根据所述目标单词的扩展特征执行映射转换预测，生成所述目标单词的目标图像。

本申请第四方面提供一种样本图像扩充装置，包括：获取模块，用于获取待识别单词；转换模块，用于上述第三方面所述的图像生成装置，生成所述待识别单词的单词图像；扩充模块，用于将所述待识别单词和所述待识别单词的单词图像分别作为新的样本单词和所述新的样本单词的样本图像，以扩充至样本数据库中。

本申请第五方面提供一种计算机存储介质，所述计算机存储介质中存储有用于执行上述第一方面所述的方法中各步骤的各指令，或用于执行上述第二方面所述的方法中各步骤的各指令。

综上所述，本申请可基于知识图谱以及目标单词的词特征，确定目标单词的扩展特征，再根据扩展特征执行映射转换预测，以生成目标单词对应的目标图像，据此，本申请提供了一种基于知识图谱的零次学习方法，通过知识图谱学习语义空间到特征空间的映射转换处理，可在无需额外进行人工样本标注的情况下，针对模型未训练到的样本图像类别进行扩充，以增加模型的识别类别数量，从而提升模型识别结果的准确性，且还可提升模型的整体泛化性能。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请示例性实施例的图像生成方法的处理流程图。

图2为本申请的知识图谱实施例示意图。

图3为本申请另一示例性实施例的图像生成方法的处理流程图。

图4为本申请示例性实施例的样本图像扩充方法的处理流程图。

图5为本申请另一实施例的样本图像扩充方法的处理流程图。

图6为本申请示例性实施例的图像生成装置的结构框图。

图7为本申请示例性实施例的样本图像扩充装置的结构框图。

具体实施方式

为了使本领域的人员更好地理解本申请实施例中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请实施例一部分实施例，而不是全部的实施例。基于本申请实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本申请实施例保护的范围。

目前的模型训练过程中，由于训练数据标注任务需耗费大量时间及人力成本，导致了由于训练数据不够充分，使得训练好的模型只能识别与训练数据相同的类别，而无法正确识别出训练数据中不包含的类别的问题，有鉴于此，本申请提供一种基于知识图谱的零次学习方法，可在无需额外进行人工样本标注的情况下，扩充模型的训练数据类别，以提升模型识别结果的准确性。

以下将结合各附图详细描述本申请的各实施例。

图1为本申请示例性实施例的图像生成方法的处理流程图。如图所示，本实施例主要包括以下处理步骤：

步骤S102,根据目标单词的词特征，确定知识图谱中与目标单词关联的多个单词节点，并根据与目标单词关联的每一个单词节点的词特征，获得目标单词的扩展特征。

可选地，可利用自然语言处理模型(Natural Language Processing；NLP)针对目标单词执行编码粗粒，以获取目标单词的词特征。

于本实施例中，知识图谱用于阐述人、事、物之间的关系，通过描述单词的文本语义，以建立实体关系的知识数据库。

可选地，知识图谱可通过以下方式构建：根据各单词对应的各词特征，确定各单词之间的关联关系，并根据各单词之间的关联关系，构建包含各单词节点的关系树结构的知识图谱(参考图2)。

可选地，可根据目标单词的词特征，将知识图谱中对应于目标单词的单词节点确定为源节点，并根据所确定的源节点，将知识图谱中与源节点关联的各级父节点和/或各级子节点确定为关联节点，并根据所确定源节点和每一个关联节点的词特征，确定目标单词的扩展特征。

例如，假设根据目标单词的词特征，确定知识图谱中与之对应的单词节点为单词节点b，则将单词节点b确定为源节点，根据知识图谱所示的关系树结构，可以看出，单词节点b存在一个父节点(即单词节点a)以及三个子节点(即单词节点c、d、e)，则可将单词节点c、d、e均确定为关联节点。

可选地，可将知识图谱中与源节点存在关联的所有子节点和/或父节点均确定为源节点的关联节点。

可选地，可根据预设追溯层级，将知识图谱中与源节点存在关联的且满足预设追溯层级的各个子节点和/或父节点确定为源节点的关联节点。

例如，假设预设追溯层级设定为2级时，可将源节点的父节点和先辈节点(即父节点的父节点)以及源节点的子节点和后代节点(即子节点的子节点)确定为源节点的关联节点。

需说明的是，预设追溯层级的层级数量并不以上述2级为限，且父节点的预设追溯层级与子节点的预设追溯层级可设为相同或不同，本申请对此不作限制。

可选地，可根据源节点的词特征和每一个关联节点的词特征的加权求和结果或加权平均结果，获得目标单词的扩展特征。

例如，可针对单词节点a、c、d、e各自的词特征执行加权求和运算或加权平均运算，以获得目标单词的扩展特征。

步骤S104,利用映射预测模型，根据目标单词的扩展特征执行映射转换预测，生成目标单词的目标图像。

于本实施例中，映射预测模型可包括多层感知器(Multilayer Perceptron；MLP)模型。

具体地，可利用映射预测模型根据目标单词的扩展特征，将自然语言空间中的词特征向量映射到图像空间中的图像特征向量，以生成目标单词对应的目标图像。

综上所述，本申请实施例提供的图像生成方法，基于知识图谱获取目标单词的扩展特征，并根据扩展特征执行自然语言空间至图像空间的映射转换，以生成目标单词的目标图像，从而可在无需人为干预的情况下，实现图像资源的自动扩充，以节省人力成本。

图3为本申请另一实施例的图像生成方法的处理流程图。本实施例主要示出了映射预测模型的训练方案，如图所示，本实施例主要包括以下步骤：

步骤S302，将样本单词的扩展特征作为输入，以供映射预测模型执行图像映射预测，生成样本单词的预测图像。

可选地，可针对样本单词执行编码处理，以获取样本单词的词特征，并基于知识图谱以及样本单词的词特征，获得样本单词的扩展特征。

上述样本单词的扩展特征的具体获取方案可参考前述步骤S102中针对目标单词的描述内容，本步骤不再予以赘述。

步骤S304,根据样本单词的真实图像和预测图像执行比对，获得映射预测模型的损失函数。

可选地，可比对样本单词的真实图像和预测图像之间的相似度(例如通过计算二者之间的欧氏距离)，并根据比对结果获得映射预测模型的损失函数。

可选地，可利用判别器根据样本单词的真实图像和预测图像执行真假对抗学习，据以确定映射预测模型的损失函数。

步骤S306,判断损失函数是否满足收敛条件，若是，则结束本步骤，以完成映射预测模型的训练，若否，则返回步骤S302,以基于损失函数重复训练映射预测模型。

可选地，可当样本单词的真实图像和预测图像的相似度值满足预设相似度阈值时(例如，真实图像和预测图像之间的欧式距离小于预设距离阈值时)，获得损失函数满足收敛条件的判断结果。

可选地，可当判别器无法判别出真实图像和预测图像二者之间的真假时，获得损失函数满足收敛条件的判断结果。

图4示出了本申请另一实施例的图像生成方法的处理流程图。本实施例可接续上述步骤S106继续执行。如图所示，本实施例主要包括以下处理步骤：

步骤S402,获取待识别单词。

于本实施例中，所获取的待识别单词可为样本数据库中未包含的样本数据类别。

步骤S404，利用图像生成方法，生成待识别单词的单词图像。

于本实施例中，可利用上述图1或图3所示的图像生成方法，生成待识别单词的单词图像。

具体地，可基于知识图谱和待识别单词的词特征，确定待识别单词的扩展特征，并根据扩展特征执行映射转换，以生成待识别单词的单词图像。

步骤S406,将待识别单词和待识别单词的单词图像分别作为新的样本单词和新的样本单词的样本图像，以扩充至样本数据库中。

综上所述，本申请实施例利用上述的图像生成方法，可实现样本数据库中数据类别的自动扩充，而无需人为执行样本标注，不仅可降低训练数据的制作成本，也可增加模型的识别类别数量，以提升模型识别结果的准确性。

图5为本申请另一示例性实施例的样本图像扩充方法，如图所示，本实施例主要包括以下步骤：

步骤S502,将待标识图像与样本数据库中的每一个样本图像执行相似度比对，获得每一个样本图像的相似度值。

可选地，可根据待标识图像的图像特征与每一个样本图像的图像特征进行相似度比对(例如，计算待标识图像与每一个样本图像之间的欧氏距离)，获得待标识图像相对于每一个样本图像的相似度值。

步骤S504，根据相似度值最高的样本图像的样本单词，确定待标识图像的类别标签。

可选地，可根据每一个样本图像的相似度值，确定相似度值最高的样本图像，并将所确定的样本图像的样本单词，作为待标识图像的类别标签。

步骤S506,将待标识图像和待标识图像的类别标签分别作为新的样本单词和新的样本单词的类别标签，以扩充至样本数据库中。

综上所述，本实施例可在无需利用模型针对新类别所对应的样本图片进行任何训练的情况下，扩展模型的识别类别数量，以实现零次物体识别的技术效果，可以有效降低模型训练成本，并提升模型识别结果的准确性。

图6为本申请示例性实施例的图像生成装置的结构框图。如图所示，本实施例的图像生成装置600主要包括：特征扩展模块602、映射预测模型604。

特征扩展模块602，用于根据目标单词的词特征，确定知识图谱中与所述目标单词关联的多个单词节点，并根据与所述目标单词关联的每一个单词节点的词特征，获得所述目标单词的扩展特征。

映射预测模型604，用于根据所述目标单词的扩展特征执行映射转换预测，生成所述目标单词的目标图像。

可选地，图像生成装置600还包括图谱构建模块，用于根据各单词对应的各词特征，确定各单词之间的关联关系；根据各单词之间的关联关系，构建包含各单词节点的关系树结构的所述知识图谱。

可选地，特征扩展模块602还用于：根据所述目标单词的词特征，将所述知识图谱中对应于所述目标单词的单词节点确定为源节点；根据所述源节点，将所述知识图谱中与所述源节点关联的各级父节点和/或各级子节点确定为关联节点。

可选地，特征扩展模块602还用于：根据所述源节点的词特征和每一个关联节点的词特征的加权求和结果或加权平均结果，获得所述目标单词的扩展特征。

可选地，图像生成装置600还包括训练模块，用于训练所述映射预测模型，其包括：执行图像预测步骤，将样本单词的扩展特征作为输入，以供所述映射预测模型执行图像映射预测，生成所述样本单词的预测图像；根据所述样本单词的真实图像和所述预测图像执行比对，获得所述映射预测模型的损失函数；基于所述损失函数重复执行所述图像预测步骤，直至所述损失函数满足收敛条件，以完成所述映射预测模型的训练。

图7示出了本申请示例性实施例的样本图像扩充装置的结构框图。如图所示，本实施例的样本图像扩充装置700主要包括：获取模块702、转换模块704、扩充模块706。

获取模块702，用于获取待识别单词。

转换模块704，用于利用图像生成装置600，生成所述待识别单词的单词图像。

扩充模块706，用于将所述待识别单词和所述待识别单词的单词图像分别作为新的样本单词和所述新的样本单词的样本图像，以扩充至样本数据库中。

可选地，扩充模块706还用于：将待标识图像与所述样本数据库中的每一个样本图像执行相似度比对，获得每一个样本图像的相似度值；根据相似度值最高的样本图像的样本单词，确定所述待标识图像的类别标签；将所述待标识图像和所述待标识图像的类别标签分别作为新的样本单词和所述新的样本单词的类别标签，以扩充至所述样本数据库中。

本申请示例性实施例还提供一种计算机存储介质，其特征在于，所述计算机存储介质中存储有用于执行上述图1或图3所述图像生成方法实施例中各步骤的各指令，或用于执行上述图4或图5所述样本图像扩充方法实施例中各步骤的各指令。

综上所述，本申请各实施例提供的图形生成及样本图像扩充方法、装置及计算机存储介质，可在无需人为标注样本的情况下，自动扩充训练样本的样本类别，以供模型在无需针对新类别所对应的样本图像执行任何训练的情况下(即零次物体识别)，增加模型的识别类别数量，降低了模型训练成本，并提升了模型识别结果的准确性。

最后应说明的是：以上实施例仅用以说明本申请实施例的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种图像生成方法，包括：

根据目标单词的词特征，确定知识图谱中与所述目标单词关联的多个单词节点，并根据与所述目标单词关联的每一个单词节点的词特征，获得所述目标单词的扩展特征；

利用映射预测模型，根据所述目标单词的扩展特征执行映射转换预测，生成所述目标单词的目标图像。

2.根据权利要求1所述的方法，其中，所述知识图谱通过以下方式构建：

根据各单词对应的各词特征，确定各单词之间的关联关系；

根据各单词之间的关联关系，构建包含各单词节点的关系树结构的所述知识图谱。

3.根据权利要求1或2所述的方法，其中，所述根据目标单词的词特征，确定知识图谱中与所述目标单词关联的多个单词节点，包括：

根据所述目标单词的词特征，将所述知识图谱中对应于所述目标单词的单词节点确定为源节点；

根据所述源节点，将所述知识图谱中与所述源节点关联的各级父节点和/或各级子节点确定为关联节点。

4.根据权利要求3所述的方法，其中，所述根据与所述目标单词关联的每一个单词节点的词特征，获得所述目标单词的扩展特征，包括：

根据所述源节点的词特征和每一个关联节点的词特征的加权求和结果或加权平均结果，获得所述目标单词的扩展特征。

5.根据权利要求1所述的方法，其中，所述映射预测模型通过以下方式训练：

执行图像预测步骤，将样本单词的扩展特征作为输入，以供所述映射预测模型执行图像映射预测，生成所述样本单词的预测图像；

根据所述样本单词的真实图像和所述预测图像执行比对，获得所述映射预测模型的损失函数；

基于所述损失函数重复执行所述图像预测步骤，直至所述损失函数满足收敛条件，以完成所述映射预测模型的训练。

6.一种样本图像扩充方法，包括：

获取待识别单词；

利用权利要求1至5中任一项所述的图像生成方法，生成所述待识别单词的单词图像；

将所述待识别单词和所述待识别单词的单词图像分别作为新的样本单词和所述新的样本单词的样本图像，以扩充至样本数据库中。

7.根据权利要求6所述的方法，其中，所述方法还包括：

将待标识图像与所述样本数据库中的每一个样本图像执行相似度比对，获得每一个样本图像的相似度值；

根据相似度值最高的样本图像的样本单词，确定所述待标识图像的类别标签；

将所述待标识图像和所述待标识图像的类别标签分别作为新的样本单词和所述新的样本单词的类别标签，以扩充至所述样本数据库中。

8.一种图像生成装置，包括：

特征扩展模块，用于根据目标单词的词特征，确定知识图谱中与所述目标单词关联的多个单词节点，并根据与所述目标单词关联的每一个单词节点的词特征，获得所述目标单词的扩展特征；

映射预测模型，用于根据所述目标单词的扩展特征执行映射转换预测，生成所述目标单词的目标图像。

9.一种样本图像扩充装置，包括：

获取模块，用于获取待识别单词；

转换模块，用于利用权利要求8所述的图像生成装置，生成所述待识别单词的单词图像；

扩充模块，用于将所述待识别单词和所述待识别单词的单词图像分别作为新的样本单词和所述新的样本单词的样本图像，以扩充至样本数据库中。

10.一种计算机存储介质，其特征在于，所述计算机存储介质中存储有用于执行上述权利要求1至5中任一项所述的方法中各步骤的各指令，或用于执行上述权利要求6至7中任一项所述的方法中各步骤的各指令。