CN116108211A

CN116108211A - 数据检索模型的训练方法、数据检索方法和相关设备

Info

Publication number: CN116108211A
Application number: CN202310124617.3A
Authority: CN
Inventors: 张学森
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2023-02-02
Filing date: 2023-02-02
Publication date: 2023-05-12

Abstract

本公开关于数据检索模型的训练方法、数据检索方法和相关设备，包括：获取数据样本；将数据样本输入数据检索模型，获得数据样本的特征向量和多个权重向量；基于数据样本的特征向量、多个权重向量以及指示数据样本的真实数据类型的标签，确定数据样本的类型预测概率；根据数据样本的类型预测概率，计算损失；通过根据损失调整数据检索模型的参数，对数据检索模型进行训练。这样，通过针对同一个数据类型设置多个子中心，即设置多个权重向量的方式，可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的特征中心，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变化，提升了检索准确度。

Description

数据检索模型的训练方法、数据检索方法和相关设备

技术领域

本公开涉及计算机技术领域，更具体地说，涉及数据检索模型的训练方法、数据检索方法和相关设备。

背景技术

随着科技的发展，涌现出了多种类型的多媒体资源推荐平台，每种类型的多媒体资源推荐平台均可以对应有自己的台标，即不同的多媒体资源推荐平台的台标彼此之间是不相同的。台标代表了多媒体资源的平台归属，在打击盗版方面存在重要作用。

但是，同一个多媒体资源推荐平台的台标可能存在多种不同的视觉形态。例如，针对同一种台标进行颜色、字体、背景等方面的调整，就会获得视觉上相似的多个台标形态，而实际上这些外形相似的台标形态均属于同一种类型的台标。相关技术中，台标检索系统在进行台标检索时，可能出现由于台标的样式复杂多变而导致检索准确度较差的问题。

发明内容

本公开提供数据检索模型的训练方法、数据检索方法和相关设备，以至少解决上述相关技术中，由于台标的样式复杂多变而导致检索准确度较差的问题。

根据本公开实施例的第一方面，提供一种数据检索模型的训练方法，包括：获取数据样本，其中，所述数据样本具有指示所述数据样本的真实数据类型的标签；将所述数据样本输入所述数据检索模型，获得所述数据样本的特征向量和多个权重向量，其中，所述特征向量用于表征所述数据样本的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述数据样本属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；基于所述数据样本的特征向量、所述多个权重向量以及指示所述数据样本的真实数据类型的标签，确定所述数据样本的类型预测概率，其中，所述类型预测概率为将所述数据样本的数据类型预测为所述数据样本的真实数据类型的预测概率；根据所述数据样本的所述类型预测概率，计算损失；通过根据所述损失调整所述数据检索模型的参数，对所述数据检索模型进行训练。

可选地，所述基于所述数据样本的特征向量、所述多个权重向量以及指示所述数据样本的真实数据类型的标签，确定所述数据样本的类型预测概率，包括：计算所述数据样本的真实数据类型下的预定多种视觉形态中的每种视觉形态的权重向量与所述数据样本的特征向量的第一内积；计算所述数据样本的特征向量与所述多个权重向量中每个权重向量的第二内积；基于所述第一内积和所述第二内积，确定所述数据样本的类型预测概率。

可选地，所述获取数据样本，包括：获取原始数据样本；在预定的多种样本增强策略中随机选择至少一种样本增强策略；利用所选择的所述至少一种样本增强策略对所述原始数据样本进行样本增强，获得多种不同视觉形态的增强数据样本；将所述原始数据样本和所述增强数据样本作为所述数据样本。

可选地，所述预定的多种样本增强策略包含以下项：随机擦除原始数据样本的部分内容、按照随机角度旋转原始数据样本、将原始数据样本在指定方向上进行平移、随机调整原始数据样本所包含像素的颜色通道的排列顺序、调整原始数据样本的明暗程度、调整原始数据样本的对比度。

根据本公开实施例的第二方面，提供一种数据检索方法，包括：获取待检测的目标数据；将所述目标数据输入根据本公开的训练方法训练出的数据检索模型，获得所述目标数据的特征向量以及多个权重向量，其中，所述特征向量用于表征所述目标数据的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述目标数据属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；基于所述目标数据的特征向量以及所述多个权重向量，确定所述目标数据的数据类型。

可选地，所述基于所述目标数据的特征向量以及所述多个权重向量，确定所述目标数据的数据类型，包括：分别计算所述目标数据的特征向量与所述多个权重向量中每个权重向量的内积；将内积最大的权重向量所对应的数据类型确定为所述目标数据的数据类型。

根据本公开实施例的第三方面，提供一种数据检索模型的训练装置，包括：数据样本获取模块，被配置为获取数据样本，其中，所述数据样本具有指示所述数据样本的真实数据类型的标签；数据样本输入模块，被配置为将所述数据样本输入所述数据检索模型，获得所述数据样本的特征向量和多个权重向量，其中，所述特征向量用于表征所述数据样本的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述数据样本属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；类型预测概率确定模块，被配置为基于所述数据样本的特征向量、所述多个权重向量以及指示所述数据样本的真实数据类型的标签，确定所述数据样本的类型预测概率，其中，所述类型预测概率为将所述数据样本的数据类型预测为所述数据样本的真实数据类型的预测概率；损失计算模块，被配置为根据所述数据样本的所述类型预测概率，计算损失；训练模块，被配置为通过根据所述损失调整所述数据检索模型的参数，对所述数据检索模型进行训练。

可选地，所述类型预测概率确定模块被配置为：计算所述数据样本的真实数据类型下的预定多种视觉形态中的每种视觉形态的权重向量与所述数据样本的特征向量的第一内积；计算所述数据样本的特征向量与所述多个权重向量中每个权重向量的第二内积；基于所述第一内积和所述第二内积，确定所述数据样本的类型预测概率。

可选地，所述数据样本获取模块被配置为：获取原始数据样本；在预定的多种样本增强策略中随机选择至少一种样本增强策略；利用所选择的所述至少一种样本增强策略对所述原始数据样本进行样本增强，获得多种不同视觉形态的增强数据样本；将所述原始数据样本和所述增强数据样本作为所述数据样本。

根据本公开实施例的第四方面，提供一种数据检索装置，包括：目标数据获取模块，被配置为获取待检测的目标数据；目标数据输入模块，被配置为将所述目标数据输入根据本公开的训练方法训练出的数据检索模型，获得所述目标数据的特征向量以及多个权重向量，其中，所述特征向量用于表征所述目标数据的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述目标数据属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；数据类型确定模块，被配置为基于所述目标数据的特征向量以及所述多个权重向量，确定所述目标数据的数据类型。

可选地，所述数据类型确定模块被配置为：分别计算所述目标数据的特征向量与所述多个权重向量中每个权重向量的内积；将内积最大的权重向量所对应的数据类型确定为所述目标数据的数据类型。

根据本公开实施例的第五方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现根据本公开的数据检索模型的训练方法或者数据检索方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行根据本公开的数据检索模型的训练方法或者数据检索方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据本公开的数据检索模型的训练方法或者数据检索方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过针对同一个数据类型设置多个子中心，即设置多个权重向量的方式，可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的特征中心，即可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的权重向量，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是示出根据本公开的示例性实施例的一种数据检索模型的训练方法的流程图；

图2是示出根据本公开的示例性实施例的一种针对原始数据样本进行数据增强的示意图；

图3是示出根据本公开的示例性实施例的一种现有的Softmax分类与本公开中的多中心分类的对比示意图；

图4是示出根据本公开的示例性实施例的一种数据检索方法的流程图；

图5是示出根据本公开的示例性实施例的一种数据检索模型的训练装置的框图；

图6是示出根据本公开的示例性实施例的一种数据检索装置的框图；

图7是示出根据本公开的示例性实施例的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在此需要说明的是，在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况：(1)包括A；(2)包括B；(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”，即表示如下三种并列的情况：(1)执行步骤一；(2)执行步骤二；(3)执行步骤一和步骤二。

图1是示出根据本公开的示例性实施例的一种数据检索模型的训练方法的流程图。

参照图1，在步骤101中，可以获取数据样本。其中，该数据样本可以具有指示该数据样本的真实数据类型的标签。示例性的，本公开中的“数据样本”可以为“台标样本”，“台标”可以为各种多媒体资源推荐平台的台标，每个台标样本可以为一张台标图片。

根据本公开的示例性实施例，可以获取原始数据样本，还可以在预定的多种样本增强策略中随机选择至少一种样本增强策略。然后，可以利用所选择的至少一种样本增强策略对原始数据样本进行样本增强，获得多种不同视觉形态的增强数据样本。接下来，可以将原始数据样本和增强数据样本作为上述数据样本。

这样，可以根据实际需要随机选择各种样本增强策略的组合对原始数据样本进行样本增强，使训练数据可以覆盖数据的多种形态变化，进而可以保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了数据检索模型的检索精度和准确度。

根据本公开的示例性实施例，预定的多种样本增强策略可以包含以下项：

随机擦除原始数据样本的部分内容，例如，随机删除原始台标图片的部分区域内容；

按照随机角度旋转原始数据样本，例如，可以顺时针或者逆时针旋转原始台标图片一个随机角度；

将原始数据样本在指定方向上进行平移，例如，可以选择在X方向或者在Y方向上将原始台标图片平移一定的距离；

随机调整原始数据样本所包含像素的颜色通道的排列顺序。例如，假设原始台标图片所包含像素的颜色通道的排列顺序为RGB，则可以调整颜色通道的排列顺序为BRG或者GRB等等。

调整原始数据样本的明暗程度，例如，可以调整原始台标图片的明暗程度；

调整原始数据样本的对比度，例如，可以调整原始台标图片的对比度。

需要说明的是，在针对原始数据样本进行数据增强时，可以选择上述一个策略或者多个策略的组合进行样本增强，并且，进行样本增强的策略并不限于上述几种，还可以存在其他策略，前述样本增强策略仅仅为一种示例性说明。

图2是示出根据本公开的示例性实施例的一种针对原始数据样本进行数据增强的示意图。参照图2，假设某个原始数据样本为一个心形图像，并且该心形图像中存在一个字母A，该字母A的原始字体为宋体，该心形图像的原始摆放位置为竖直放置，该心形图像所包含的字母A的原始背景颜色为白色。

在针对该原始数据样本进行样本增强时，可以针对该原始数据样本进行顺时针旋转操作a，此时，即可以获得摆放位置倾斜的心形图像；可以针对该原始数据样本所包含的字母A的字体进行调整操作b，例如，可以将该原始数据样本所包含的字母A的字体由宋体调整为楷体；可以针对该原始数据样本的心形图像所包含的字母A的背景颜色进行调整操作c，例如，可以将该原始数据样本的心形图像所包含的字母A的背景颜色由白色调整为灰色。

这样，通过针对原始数据样本进行样本增强，增加了训练样本的数量，并且使训练样本的类型更加丰富，即使训练数据覆盖了数据的多种形态变化，可以提升数据检索模型的鲁棒性和检索泛化能力，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

需要说明的是，除了样本增强，即数据增强，本公开还可以提出一种“多中心分类”方式来应对数据的多种视觉形态的变化，“多中心分类”的核心思想是：每种类型数据的特征中心可能存在多个而不是一个，即每种数据类型的权重向量可能存在多个而不是一个，期望多个特征中心正好对应同一种数据类型的多种视觉形态。

在步骤102中，可以将数据样本输入数据检索模型，获得数据样本的特征向量和多个权重向量。其中，“特征向量”用于表征数据样本的视觉特征，“多个权重向量”可以包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量可以用于表征数据样本属于每个数据类型下的每种视觉形态的概率，每个数据类型下的每种视觉形态为每个数据类型下的预定多种视觉形态中的每种视觉形态。即多个权重向量可以包括表征数据样本属于预定多个数据类型中的每个数据类型下的预定多种视觉形态中的每种视觉形态的概率的权重向量，也即多个权重向量可以包括表征台标样本属于预定多个台标类型中的每个台标类型下的预定多种视觉形态中的每种视觉形态的概率的权重向量。数据样本的“特征向量”X还可以称为“视觉特征”，“视觉特征”的作用类似于指纹，用于唯一标识相应的数据样本到底为哪个数据样本。

图3是示出根据本公开的示例性实施例的一种现有的Softmax分类与本公开中的多中心分类的对比示意图。参照图3，圆形图像用来展示分类器的决策边界，不同颜色代表不同台标类型的覆盖范围。

左边的圆形图像代表普通的Softmax分类，一共示出了3个台标类型，分别为台标类型1、台标类型2和台标类型3。三个箭头分别代表三个台标类型的特征中心，即权重向量；三个颜色的相邻边界分别是两个台标类型的决策边界：待检测台标的特征向量和哪个特征中心最近，即待检测台标的特征向量和哪个权重向量的夹角最小，该待检测台标的台标类型就为对应最小夹角的特征中心所属于的台标类型。

右边的圆形图像是带多中心优化的特征中心和决策边界，可以看到决策边界没有明显变化，但是每个台标类型的对应颜色区域内可能存在多个特征中心，多个特征中心的好处是某个台标的某个特殊视觉形态的特征向量可以去匹配与其夹角最小的特征中心，即某个台标的某个特殊视觉形态的特征向量可以去匹配与其夹角最小的权重向量。多中心优化方式有利于提升台标检索模型学习的精度，而不像现有的Softmax分类一样把和特征中心夹角较大的某个样本作为噪音样本。例如，图3左侧圆形图像中，台标3的分类区间很大，如果某个样本距离台标3的特征中心夹角很大就很容易被当作噪音样本对待，但是，本公开中的多中心算法则不会。

在步骤103中，可以基于数据样本的特征向量、多个权重向量以及指示数据样本的真实数据类型的标签，确定数据样本的类型预测概率。其中，类型预测概率可以为将数据样本的数据类型预测为数据样本的真实数据类型的预测概率。

根据本公开的示例性实施例，可以计算数据样本的真实数据类型下的预定多种视觉形态中的每种视觉形态的权重向量与数据样本的特征向量的第一内积，还可以计算数据样本的特征向量与上述多个权重向量中每个权重向量的第二内积。接下来，可以基于第一内积和第二内积，确定数据样本的类型预测概率。这样，在训练数据检索模型时，可以针对同一个数据类型设置多个子中心，即可以设置多个权重向量，并且每个权重向量对应一种数据类型下的一种视觉形态，即在训练数据检索模型的过程中已经将数据在实际情况下的各种变形考虑进来，可以保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

示例性的，数据样本的类型预测概率P可以通过以下公式表示：

其中，X可以为数据检索模型所抽取的数据样本的特征向量，P(y＝j/X可以为数据检索模型将X对应的数据样本的数据类型预测为该数据样本的真实数据类型y＝j的类型预测概率；

W_jk可以为前述预定多个数据类型中第j个数据类型下的预定多种视觉形态中的第k个视觉形态的权重向量，即W_jk可以为前述预定多个数据类型中第j个数据类型下的预定多个特征中心中的第k个特征中心，W_mk可以为前述预定多个数据类型中第m个数据类型下的预定多种视觉形态中的第k个视觉形态的权重向量，即W_mk可以为前述预定多个数据类型中第m个数据类型下的预定多个特征中心中的第k个特征中心；

max_kX^TW_jk可以表示取数据样本的特征向量X和第j个数据类型下的预定多种视觉形态中的每个视觉形态的权重向量的内积的最大值；max_kX^TW_mk可以表示取数据样本的特征向量X和第m个数据类型下的预定多种视觉形态中的每个视觉形态的权重向量的内积的最大值；m可以为前述预定多个数据类型的数量。

在步骤104中，可以根据数据样本的类型预测概率，计算损失。

根据本公开的示例性实施例，上述损失可以通过以下公式表示：

其中，J可以为上述损失，X、P(y＝j/X、W_jk、W_mk、max_kX^TW_jk、max_kX^TW_mk、m的含义具体见前文，这里不再赘述。

这样，通过针对同一个数据类型设置多个子中心，即设置多个权重向量的方式，可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的特征中心，即可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的权重向量，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

在步骤105中，可以通过根据损失调整数据检索模型的参数，对数据检索模型进行训练。

需要说明的是，本公开中的数据检索模型可以应用于数据的分类或检索，例如，可以应用于台标的分类或检索，数据除了台标之外，还可以是任何图片形式的标识，本公开对此不做具体限定。

图4是示出根据本公开的示例性实施例的一种数据检索方法的流程图。

参照图4，在步骤401中，可以获取待检测的目标数据。示例性的，本公开中的“数据”可以为“台标”，“台标”可以为各种多媒体资源推荐平台的台标，每个台标可以为一张台标图片。

在步骤402中，可以将目标数据输入根据本公开的训练方法训练出的数据检索模型，获得目标数据的特征向量以及多个权重向量。

其中，“特征向量”用于表征目标数据的视觉特征，“多个权重向量”可以包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量可以用于表征目标数据属于每个数据类型下的每种视觉形态的概率，每个数据类型下的每种视觉形态可以为每个数据类型下的预定多种视觉形态中的每种视觉形态。

即多个权重向量可以包括表征目标数据属于预定多个数据类型中的每个数据类型下的预定多种视觉形态中的每种视觉形态的概率的权重向量，也即多个权重向量可以包括表征台标图片属于预定多个台标类型中的每个台标类型下的预定多种视觉形态中的每种视觉形态的概率的权重向量，并且，每种台标类型的权重向量即为该台标类型的特征中心。目标数据的特征向量还可以称为目标数据的“视觉特征”，“视觉特征”的作用类似于指纹，用于唯一标识目标数据到底为哪个数据。

在步骤403中，可以基于目标数据的特征向量以及上述多个权重向量，确定目标数据的数据类型，即可以基于目标数据的特征向量以及前述预定多个数据类型中的每个数据类型下的预定多个特征中心，确定目标数据的数据类型。

根据本公开的示例性实施例，可以分别计算目标数据的特征向量与上述多个权重向量中每个权重向量的内积，即可以分别计算目标数据的特征向量与前述预定多个数据类型中的每个数据类型下的预定多个特征中心的内积。然后，可以将内积最大的权重向量所对应的数据类型确定为目标数据的数据类型，即可以将内积最大的特征中心所对应的数据类型确定为目标数据的数据类型。

这样，由于内积越大，则目标数据的特征向量与相应的权重向量之间的夹角越小，即目标数据的特征向量与相应的权重向量越接近，也即目标数据的视觉形态与相应的权重向量所对应的视觉形态越相似，因此，可以将内积最大的权重向量所对应的数据类型确定为目标数据的数据类型，可以保证确定目标数据的数据类型的准确性。

示例性的，假设前述预定多个数据类型一共为10个数据类型，即m＝10，且每个数据类型下的预定多种视觉形态一共有3种视觉形态，即k＝3。此时，一共存在m×k＝10×3＝30个权重向量。可以分别计算目标数据的特征向量与上述30个权重向量中每个权重向量的内积，一共可以获得30个内积结果。接下来，可以将30个内积结果中的内积最大的权重向量所对应的数据类型确定为目标数据的数据类型。

需要说明的是，本公开中“多中心分类”的权重参数W的矩阵大小是(m*k，dim)，其中，m为前述预定多个数据类型的数量，k代表每一个数据类型包含k个子中心，即k代表每一个数据类型包含k个权重向量，dim代表特征中心的长度。本公开中的“多中心分类”是通过计算目标数据的特征向量与预定多个数据类型中的每个数据类型下的预定多个特征中心的内积的最大值来找到目标数据的数据类型，完成数据匹配。

图5是示出根据本公开的示例性实施例的一种数据检索模型的训练装置的框图。

参照图5，该装置500可包括数据样本获取模块501、数据样本输入模块502、类型预测概率确定模块503、损失计算模块504和训练模块505。

数据样本获取模块501可以获取数据样本。其中，该数据样本可以具有指示该数据样本的真实数据类型的标签。示例性的，本公开中的“数据样本”可以为“台标样本”，“台标”可以为各种多媒体资源推荐平台的台标，每个台标样本可以为一张台标图片。

根据本公开的示例性实施例，数据样本获取模块501可以获取原始数据样本，还可以在预定的多种样本增强策略中随机选择至少一种样本增强策略。然后，数据样本获取模块501可以利用所选择的至少一种样本增强策略对原始数据样本进行样本增强，获得多种不同视觉形态的增强数据样本。接下来，数据样本获取模块501可以将原始数据样本和增强数据样本作为上述数据样本。

数据样本输入模块502可以将数据样本输入数据检索模型，获得数据样本的特征向量和多个权重向量。其中，“特征向量”用于表征数据样本的视觉特征，“多个权重向量”可以包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量可以用于表征数据样本属于每个数据类型下的每种视觉形态的概率，每个数据类型下的每种视觉形态为每个数据类型下的预定多种视觉形态中的每种视觉形态。

即多个权重向量可以包括表征数据样本属于预定多个数据类型中的每个数据类型下的预定多种视觉形态中的每种视觉形态的概率的权重向量，也即多个权重向量可以包括表征台标样本属于预定多个台标类型中的每个台标类型下的预定多种视觉形态中的每种视觉形态的概率的权重向量。数据样本的“特征向量”X还可以称为“视觉特征”，“视觉特征”的作用类似于指纹，用于唯一标识相应的数据样本到底为哪个数据样本。

类型预测概率确定模块503可以基于数据样本的特征向量、多个权重向量以及指示数据样本的真实数据类型的标签，确定数据样本的类型预测概率。其中，类型预测概率可以为将数据样本的数据类型预测为数据样本的真实数据类型的预测概率。

根据本公开的示例性实施例，类型预测概率确定模块503可以计算数据样本的真实数据类型下的预定多种视觉形态中的每种视觉形态的权重向量与数据样本的特征向量的第一内积，还可以计算数据样本的特征向量与上述多个权重向量中每个权重向量的第二内积。接下来，可以基于第一内积和第二内积，确定数据样本的类型预测概率。这样，在训练数据检索模型时，可以针对同一个数据类型设置多个子中心，即可以设置多个权重向量，并且每个权重向量对应一种数据类型下的一种视觉形态，即在训练数据检索模型的过程中已经将数据在实际情况下的各种变形考虑进来，可以保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

损失计算模块504可以根据数据样本的类型预测概率，计算损失。这样，通过针对同一个数据类型设置多个子中心，即设置多个权重向量的方式，可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的特征中心，即可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的权重向量，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

训练模块505可以通过根据损失调整数据检索模型的参数，对数据检索模型进行训练。

图6是示出根据本公开的示例性实施例的一种数据检索装置的框图。

参照图6，该装置600可包括目标数据获取模块601、目标数据输入模块602和数据类型确定模块603。

目标数据获取模块601可以获取待检测的目标数据。示例性的，本公开中的“数据”可以为“台标”，“台标”可以为各种多媒体资源推荐平台的台标，每个台标可以为一张台标图片。

目标数据输入模块602可以将目标数据输入根据本公开的训练方法训练出的数据检索模型，获得目标数据的特征向量以及多个权重向量。

数据类型确定模块603可以基于目标数据的特征向量以及上述多个权重向量，确定目标数据的数据类型，即可以基于目标数据的特征向量以及前述预定多个数据类型中的每个数据类型下的预定多个特征中心，确定目标数据的数据类型。

根据本公开的示例性实施例，数据类型确定模块603可以分别计算目标数据的特征向量与上述多个权重向量中每个权重向量的内积，即可以分别计算目标数据的特征向量与前述预定多个数据类型中的每个数据类型下的预定多个特征中心的内积。然后，可以将内积最大的权重向量所对应的数据类型确定为目标数据的数据类型，即可以将内积最大的特征中心所对应的数据类型确定为目标数据的数据类型。这样，由于内积越大，则目标数据的特征向量与相应的权重向量之间的夹角越小，即目标数据的特征向量与相应的权重向量越接近，也即目标数据的视觉形态与相应的权重向量所对应的视觉形态越相似，因此，可以将内积最大的权重向量所对应的数据类型确定为目标数据的数据类型，可以保证确定目标数据的数据类型的准确性。

图7是示出根据本公开的示例性实施例的一种电子设备700的框图。

参照图7，电子设备700包括至少一个存储器701和至少一个处理器702，所述至少一个存储器701中存储有指令，当指令被至少一个处理器702执行时，执行根据本公开的示例性实施例的数据检索模型的训练方法或者数据检索方法。

作为示例，电子设备700可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令的装置。这里，电子设备700并非必须是单个的电子设备，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备700还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子设备。

在电子设备700中，处理器702可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

处理器702可运行存储在存储器701中的指令或代码，其中，存储器701还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。

存储器701可与处理器702集成为一体，例如，将RAM或闪存布置在集成电路微处理器等之内。此外，存储器701可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器701和处理器702可在操作上进行耦合，或者可例如通过I/O端口、网络连接等互相通信，使得处理器702能够读取存储在存储器中的文件。

此外，电子设备700还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。电子设备700的所有组件可经由总线和/或网络而彼此连接。

根据本公开的示例性实施例，还可提供一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述数据检索模型的训练方法或者数据检索方法。这里的计算机可读存储介质的示例包括：只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如，多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置，所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，此外，在一个示例中，计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上，使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。

根据本公开的示例性实施例，还可提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据本公开的数据检索模型的训练方法或者数据检索方法。

根据本公开的数据检索模型的训练方法、数据检索方法和相关设备，通过针对同一个数据类型设置多个子中心，即设置多个权重向量的方式，可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的特征中心，即可以使某个数据的某个特殊视觉形态的特征向量去匹配与其夹角最小的权重向量，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

进一步的，可以根据实际需要随机选择各种样本增强策略的组合对原始数据样本进行样本增强，使训练数据可以覆盖数据的多种形态变化，进而可以保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了数据检索模型的检索精度和准确度。

进一步的，通过针对原始数据样本进行样本增强，增加了训练样本的数量，并且使训练样本的类型更加丰富，即使训练数据覆盖了数据的多种形态变化，可以提升数据检索模型的鲁棒性和检索泛化能力，保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

进一步的，在训练数据检索模型时，可以针对同一个数据类型设置多个子中心，即可以设置多个权重向量，并且每个权重向量对应一种数据类型下的一种视觉形态，即在训练数据检索模型的过程中已经将数据在实际情况下的各种变形考虑进来，可以保证训练好的数据检索模型能够应对数据在视觉上的各种复杂变形，提升了检索精度和准确度。

进一步的，由于内积越大，则目标数据的特征向量与相应的权重向量之间的夹角越小，即目标数据的特征向量与相应的权重向量越接近，也即目标数据的视觉形态与相应的权重向量所对应的视觉形态越相似，因此，可以将内积最大的权重向量所对应的数据类型确定为目标数据的数据类型，可以保证确定目标数据的数据类型的准确性。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种数据检索模型的训练方法，其特征在于，包括：

获取数据样本，其中，所述数据样本具有指示所述数据样本的真实数据类型的标签；

将所述数据样本输入所述数据检索模型，获得所述数据样本的特征向量和多个权重向量，其中，所述特征向量用于表征所述数据样本的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述数据样本属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；

基于所述数据样本的特征向量、所述多个权重向量以及指示所述数据样本的真实数据类型的标签，确定所述数据样本的类型预测概率，其中，所述类型预测概率为将所述数据样本的数据类型预测为所述数据样本的真实数据类型的预测概率；

根据所述数据样本的所述类型预测概率，计算损失；

通过根据所述损失调整所述数据检索模型的参数，对所述数据检索模型进行训练。

2.如权利要求1所述的训练方法，其特征在于，所述基于所述数据样本的特征向量、所述多个权重向量以及指示所述数据样本的真实数据类型的标签，确定所述数据样本的类型预测概率，包括：

计算所述数据样本的真实数据类型下的预定多种视觉形态中的每种视觉形态的权重向量与所述数据样本的特征向量的第一内积；

计算所述数据样本的特征向量与所述多个权重向量中每个权重向量的第二内积；

基于所述第一内积和所述第二内积，确定所述数据样本的类型预测概率。

3.如权利要求1所述的训练方法，其特征在于，所述获取数据样本，包括：

获取原始数据样本；

在预定的多种样本增强策略中随机选择至少一种样本增强策略；

利用所选择的所述至少一种样本增强策略对所述原始数据样本进行样本增强，获得多种不同视觉形态的增强数据样本；

将所述原始数据样本和所述增强数据样本作为所述数据样本。

4.如权利要求3所述的训练方法，其特征在于，所述预定的多种样本增强策略包含以下项：

随机擦除原始数据样本的部分内容、按照随机角度旋转原始数据样本、将原始数据样本在指定方向上进行平移、随机调整原始数据样本所包含像素的颜色通道的排列顺序、调整原始数据样本的明暗程度、调整原始数据样本的对比度。

5.一种数据检索方法，其特征在于，包括：

获取待检测的目标数据；

将所述目标数据输入根据权利要求1至4中的任意一项所述的训练方法训练出的数据检索模型，获得所述目标数据的特征向量以及多个权重向量，其中，所述特征向量用于表征所述目标数据的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述目标数据属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；

基于所述目标数据的特征向量以及所述多个权重向量，确定所述目标数据的数据类型。

6.如权利要求5所述的数据检索方法，其特征在于，所述基于所述目标数据的特征向量以及所述多个权重向量，确定所述目标数据的数据类型，包括：

分别计算所述目标数据的特征向量与所述多个权重向量中每个权重向量的内积；

将内积最大的权重向量所对应的数据类型确定为所述目标数据的数据类型。

7.一种数据检索模型的训练装置，其特征在于，包括：

数据样本获取模块，被配置为获取数据样本，其中，所述数据样本具有指示所述数据样本的真实数据类型的标签；

数据样本输入模块，被配置为将所述数据样本输入所述数据检索模型，获得所述数据样本的特征向量和多个权重向量，其中，所述特征向量用于表征所述数据样本的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述数据样本属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；

类型预测概率确定模块，被配置为基于所述数据样本的特征向量、所述多个权重向量以及指示所述数据样本的真实数据类型的标签，确定所述数据样本的类型预测概率，其中，所述类型预测概率为将所述数据样本的数据类型预测为所述数据样本的真实数据类型的预测概率；

损失计算模块，被配置为根据所述数据样本的所述类型预测概率，计算损失；

训练模块，被配置为通过根据所述损失调整所述数据检索模型的参数，对所述数据检索模型进行训练。

8.一种数据检索装置，其特征在于，包括：

目标数据获取模块，被配置为获取待检测的目标数据；

目标数据输入模块，被配置为将所述目标数据输入根据权利要求1至4中的任意一项所述的训练方法训练出的数据检索模型，获得所述目标数据的特征向量以及多个权重向量，其中，所述特征向量用于表征所述目标数据的视觉特征，所述多个权重向量包括与预定多个数据类型各自对应的权重向量，每个数据类型对应的每个权重向量用于表征所述目标数据属于所述每个数据类型下的每种视觉形态的概率，所述每个数据类型下的每种视觉形态为所述每个数据类型下的预定多种视觉形态中的每种视觉形态；

数据类型确定模块，被配置为基于所述目标数据的特征向量以及所述多个权重向量，确定所述目标数据的数据类型。

9.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至4中任一项所述的数据检索模型的训练方法，或者，实现如权利要求5至6中任一项所述的数据检索方法。

10.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至4中任一项所述的数据检索模型的训练方法，或者，执行如权利要求5至6中任一项所述的数据检索方法。