CN109816047B - 提供标签的方法、装置、设备及可读存储介质 - Google Patents

提供标签的方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN109816047B
CN109816047B CN201910122128.8A CN201910122128A CN109816047B CN 109816047 B CN109816047 B CN 109816047B CN 201910122128 A CN201910122128 A CN 201910122128A CN 109816047 B CN109816047 B CN 109816047B
Authority
CN
China
Prior art keywords
label
tag
confusion
word
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910122128.8A
Other languages
English (en)
Other versions
CN109816047A (zh
Inventor
张志伟
夏雨
赵伟阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910122128.8A priority Critical patent/CN109816047B/zh
Publication of CN109816047A publication Critical patent/CN109816047A/zh
Application granted granted Critical
Publication of CN109816047B publication Critical patent/CN109816047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请公开了一种提供标签的方法、装置、设备及可读存储介质,属于深度学习技术领域。方法包括:基于深度学习模型预测目标内容的第一标签;根据第一标签获取与第一标签具有相关性的第二标签;将第一标签和第二标签作为目标内容的标签提供给标注系统进行标注。通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源。

Description

提供标签的方法、装置、设备及可读存储介质
技术领域
本公开涉及深度学习技术领域,尤其涉及一种提供标签的方法、装置、设备及可读存储介质。
背景技术
近年来,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用,在应用深度学习的过程中,需要为目标内容设置标签,将目标内容的标签提供给标注系统,以对该目标内容进行标注得到标注数据,从而基于大量的标注数据生成深度学习模型。
以目标内容为图像为例,相关技术在提供标签时,出于页面篇幅以及标注人员可操作性的考虑,一般系统会随机的给图像提供一个默认的标签,将该默认的标签提供给标注系统,由标注人员对该图像的默认标签进行标注。
然而,由于相关技术仅采用默认的标签来进行标注,该默认的标签有时候不太准确,导致标注系统中标注数据的可用率低。
发明内容
本公开提供一种提供标签的方法、装置、设备及可读存储介质,以克服相关技术中存在的问题。
根据本公开实施例的第一方面,提供一种提供标签的方法,包括:
基于深度学习模型预测目标内容的第一标签;
根据所述第一标签获取与所述第一标签具有相关性的第二标签;
将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。
可选地,所述根据所述第一标签获取与所述第一标签具有相关性的第二标签,包括:
根据所述第一标签获取与所述第一标签具有相关性的语义标签;
根据所述第一标签获取与所述第一标签具有相关性的混淆标签;
将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。
可选地,所述根据所述第一标签获取与所述第一标签具有相关性的语义标签,包括:
获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;
获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签。
可选地,所述根据所述第一标签获取与所述第一标签具有相关性的混淆标签,包括:
根据用于获取所述深度学习模型的数据集构建混淆矩阵;
根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签。
可选地,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签,所述根据用于获取所述深度学习模型的数据集构建混淆矩阵,包括:
将所述第一标签与所述训练集中的参考标签进行统计,得到混淆矩阵,所述混淆矩阵中每个元素的值为所述第一标签与对应的参考标签之间的混淆值。
可选地,所述根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签,包括:
根据所述混淆矩阵中所述第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与所述第一标签具有相关性的混淆标签。
根据本公开实施例的第二方面,提供一种提供标签的装置,包括:
预测模块,被配置为基于深度学习模型预测目标内容的第一标签;
获取模块,被配置为根据所述第一标签获取与所述第一标签具有相关性的第二标签;
提供模块,被配置为将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。
可选地,所述获取模块包括第一获取单元、第二获取单元和设置单元;
所述第一获取单元,被配置为根据所述第一标签获取与所述第一标签具有相关性的语义标签;
所述第二获取单元,被配置为根据所述第一标签获取与所述第一标签具有相关性的混淆标签;
所述设置单元,被配置为将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。
可选地,所述第一获取单元,被配置为获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签。
可选地,所述第二获取单元包括构建子单元和第二获取子单元;
所述构建子单元,被配置为基于获取的所述深度学习模型的数据集构建混淆矩阵;
所述第二获取子单元,被配置为根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签。
可选地,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签;
所述构建子单元,被配置为将所述第一标签与所述训练集中的参考标签进行统计,得到混淆矩阵,所述混淆矩阵中每个元素的值为所述第一标签与对应的参考标签之间的混淆值。
可选地,所述第二获取子单元,被配置为根据所述混淆矩阵中所述第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与所述第一标签具有相关性的混淆标签。
根据本申请实施例的第三方面,提供一种提供标签的设备,所述设备包括处理器和存储器;
所述存储器,被配置为存储处理器可执行的至少一条指令;
所述处理器被配置为执行所述指令以实现如上所述的任一种提供标签的方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器执行以实现如上所述的任一种提供标签的方法。
根据本申请实施例的第五方面,提供一种计算机程序产品,包括一条或多条指令,该一条或多条指令可以由电子设备的处理器执行时,使得电子设备能够执行一种以实现如上述第一方面中任一项提供标签的方法所执行的操作。
本申请的实施例提供的技术方案带来的有益效果至少包括:
通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请实施例提供的实施环境示意图;
图2是本申请实施例提供的一种提供标签的方法流程图;
图3是本申请实施例提供的一种获取第二标签的方法流程图;
图4是本申请实施例提供的一种提供标签的装置的框图;
图5是本申请实施例提供的一种获取模块的结构示意图;
图6是本申请实施例提供的一种提供标签的设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请实施例提供了一种提供标签的方法,该方法可应用于如图1所示的实施环境中。图1中,包括至少一个提供标签的设备11和服务器12,提供标签的设备11可与服务器12进行通信连接,以从服务器12上下载内容。或者,提供标签的设备11为需要进行标注的目标内容提供标签后,将需要标注的目标内容及标签发送给服务器12进行标注。
其中,提供标签的设备11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品。
例如,提供标签的设备11可以是手机、智能手机、PDA(PersonalDigitalAssistant,个人数字助手)、PC(Personal Computer,个人计算机)、可穿戴设备、PPC(PocketPC,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。
服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
本领域技术人员应能理解上述提供标签的设备11和服务器12仅为举例,其他现有的或今后可能出现的提供标签的设备或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
基于上述图1所示的实施环境,本申请实施例提供了一种提供标签的方法,参见图2,该方法可应用于图1所示的提供标签的设备中。如图2所示,该方法包括:
步骤201,基于深度学习模型预测目标内容的第一标签。
深度学习在视频图像、语音识别和自然语言处理等相关领域得到了广泛应用,因此,本申请实施例提供的方法采用深度学习模型来预测目标内容的第一标签,使得预测的第一标签的精度高于默认标签。在预测之前,首先获取深度学习模型。可选地,获取深度学习模型的方法包括但不限于:
获取数据集,数据集中每个样本具有参考标签,该数据集包括训练集和测试集。基于数据集的训练集的参考标签对深度学习模型进行训练,得到训练后的深度学习模型。其中,参考标签可以为人工标注的标签,由于人工标注的标签准确性较高,因而基于参考标签训练后的深度学习模型所预测的标签也更为准确。之后,可以基于数据集的测试集对训练好的深度学习模型进行测试,如果通过测试,将基于该训练后的深度学习模型,预测得到未知的目标内容的第一标签。
可选地,由于卷积神经网络作为深度学习的一个重要分支,其超强的拟合能力以及端到端的全局优化能力,使得在目标检测、分类等计算机视觉任务中应用卷积神经网络之后,预测精度大幅提升。因此,上述深度学习模型可以为卷积神经网络模型(CNN),本申请不对卷积神经网络模型的类型进行限定。例如,本申请实施例可采用卷积神经网络模型来预测目标内容的第一标签。以目标内容为图像,针对图像进行分类任务为例,首先,训练得到一个可以对图像进行分类的卷积神经网络模型Model,对于一个未知的样本i,可以输出相应的第一标签。
步骤202,根据第一标签获取与第一标签具有相关性的第二标签。
可选地,本申请实施例提供的方法在预测得到第一标签的基础上,还包括获取与第一标签具有相关性的第二标签的步骤,以使得提供的标签更为全面,进一步提高标注数据的可用比例。参见图3,该步骤202包括如下步骤2021,步骤2022以及步骤2023。
步骤2021,根据第一标签获取与第一标签具有相关性的语义标签。
可选地,获取词向量模型,根据词向量模型获取第一标签的标签词向量;获取词库,计算标签词向量与词库中每一个词的词向量之间的距离,将词库中与标签词向量的距离满足条件的词作为与第一标签具有相关性的语义标签。
以获取的词向量模型为ChineseWord2Vector(中文词向量模型)为例,获取中文词向量模型后,根据获取到的中文词向量,获取第一标签的标签词向量。获取词库,从语义的维度出发,计算标签词向量与词库中的每一个词的词向量之间的距离。以该距离为余弦值为例,计算词库中每一个词的词向量与标签词向量之间的余弦值distancek,例如:
distancek=cos(word_vectork,label_vectori)
其中,word_vectork代表词库中的词向量,label_vectori代表第一标签的标签词向量。
将余弦值满足条件的词作为与第一标签具有相关性的语义标签。其中,获取的词库既可以是从提供标签的设备直接获取,也可以为从服务器下载获取,本申请实施例对此不加以限定。
需要说明的是,余弦值满足条件的词的确定方法,本申请实施例对此不加以限定。例如,可以是将每一个词的词向量与标签词向量的余弦值按照从小到大的顺序进行排列,将顺序靠前的参考数量的词作为余弦值满足条件的词,即顺序靠前的参考数量的词为与第一标签具有相关性的语义标签。其中,参考数量的值可以为2、4或者6,本申请实施例对此不加以限定,也可以根据经验值进行设定。
例如,以第一标签为“美丽”为例,计算词库中每一个与“美丽”相关的词向量的余弦值,将余弦值按照从小到大的顺序排列,将余弦值顺序靠前的5个词作为与“美丽”相关的语义标签,这五个词分别为:美艳、俊美、俏丽、俊俏和秀美。
需要说明的是,在获取与第一标签具有相关性的语义标签之前,对于每一个第一标签,可以先初始化一个空的语义标签集合,在获取与第一标签具有相关性的语义标签后,将与第一标签具有相关性的语义标签加入到语义标签集合中。
步骤2022,根据第一标签获取与第一标签具有相关性的混淆标签。
可选地,基于获取深度学习模型的数据集构建混淆矩阵;根据混淆矩阵获取与第一标签具有相关性的混淆标签。
进一步地,基于获取深度学习模型的数据集构建混淆矩阵的方式如下:
将第一标签与训练集中的参考标签进行统计,得到混淆矩阵,混淆矩阵中每个元素的值为第一标签与对应的参考标签之间的混淆值。
同样以深度学习模型为卷积神经网络模型为例,在获取卷积神经网络模型之前,需要先获取数据集,数据集包括训练集,训练集中的每个样本具有参考标签,在利用数据集进行卷积神经网络模型的训练时,将数据集中的每一个样本的参考标签与得到的每一个样本的第一标签进行统计,得到混淆矩阵。其中,混淆矩阵中每个元素的值为第一标签与对应的参考标签之间的混淆值。由于参考标签是人工标注的标签,准确性更高,基于深度学习模型预测的目标内容的第一标签有可能会与参考标签存在混淆,在参考标签中选取与第一标签存在相关性的混淆标签,并将混淆标签作为与第一标签存在相关性的第二标签一并提供给标注系统进行标注,会进一步提高标注的准确性。因此,为了提供更为全面且准确性更高的标签,本申请实施例提供的方法采取了通过参考标签与第一标签的混淆值来选取与第一标签存在相关性的混淆标签的方式。
对于混淆矩阵,以第一标签为标签1,与标签1发生混淆的标签分别为标签2、标签3、标签4、标签5和标签6为例,如下表1所示,其中,表格的第一列代表参考标签,表格的第一行代表混淆标签。
标签1 标签2 标签3 标签4 标签5 标签6
标签1 0.5 0.1 0.2 0.1 0.05 0.05
标签2 0.05 0.1 0.2 0.1 0.5 0.05
标签3 0.1 0.1 0.2 0.5 0.05 0.05
标签4 0.4 0.1 0.2 0.1 0.15 0.05
标签5 0.52 0.08 0.2 0.1 0.05 0.05
标签6 0.45 0.1 0.2 0.15 0.05 0.05
表1
如表1所示,标签1被预测为标签1的值为0.5,标签1被混淆为标签2的混淆值为0.1,标签1被混淆为标签3的混淆值为0.2,标签1被混淆为标签4的混淆值为0.1,标签1被混淆为标签5的混淆值为0.05,标签1被混淆为标签6的混淆值为0.05。
可选地,根据混淆矩阵获取与第一标签具有相关性的混淆标签的方式如下:
根据混淆矩阵中第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与第一标签具有相关性的混淆标签。
仍以上述表1中第一标签为标签1,与标签1发生混淆的标签分别为标签2、标签3、标签4、标签5和标签6为例,基于标签1与标签2、标签3、标签4、标签5以及标签6之间的混淆值,将混淆值满足混淆阈值的标签2、标签3、标签4、标签5以及标签6之中的参考标签作为与标签1具有相关性的混淆标签。其中,对于混淆阈值的大小,可以为0.3、0.4或者0.5,本申请实施例对此不加以限定,也可以根据经验值进行设定。以混淆阈值为0.1为例,则标签2、标签3和标签4为与标签1具有相关性的混淆标签。
需要说明的是,与上述获取与第一标签具有相关性的语义标签之前,初始化空的语义标签集合的方法一致,在获取与第一标签具有相关性的混淆标签之前,对于每一个第一标签,先初始化一个空的混淆标签集合,通过混淆矩阵获取与第一标签具有相关性的混淆标签之后,将与第一标签具有相关性的混淆标签加入到混淆标签集合中。
步骤2023,将语义标签和/或混淆标签作为与第一标签具有相关性的第二标签。
可选地,可以将与第一标签具有相关性的语义标签作为与第一标签具有相关性的第二标签,也可以将与第一标签具有相关性的混淆标签作为与第一标签具有相关性的第二标签,还可以将与第一标签具有相关性的语义标签和混淆标签均作为与第一标签具有相关性的第二标签。
步骤203,将第一标签和第二标签作为目标内容的标签提供给标注系统进行标注。
在一种可选的实施方式中,以第二标签为与第一标签具有相关性的语义标签和混淆标签为例,将与第一标签具有相关性的语义标签加入到语义标签集合,将第一标签具有相关性的混淆标签加入到混淆标签集合,将第一标签、语义标签集合中的标签和混淆标签集合的标签均作为目标内容的标签提供给标注系统,用以让标注人员进行标注。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源。
基于与上述方法的相同构思,本申请实施例提供了一种提供标签的装置,参见图4,该装置包括:
预测模块301,被配置为基于深度学习模型预测目标内容的第一标签;
获取模块302,被配置为根据第一标签获取与第一标签具有相关性的第二标签;
提供模块303,被配置为将第一标签和第二标签作为目标内容的标签提供给标注系统进行标注。
在一种可选的实施方式中,参见图5,获取模块302包括第一获取单元3021、第二获取单元3022和设置单元3023;
第一获取单元3021,被配置为根据第一标签获取与第一标签具有相关性的语义标签;
第二获取单元3022,被配置为根据第一标签获取与第一标签具有相关性的混淆标签;
设置单元3023,被配置为将语义标签和/或混淆标签作为与第一标签具有相关性的第二标签。
在一种可选的实施方式中,第一获取单元3021包括第一获取子单元;
第一获取子单元,被配置为获取词向量模型,根据词向量模型获取第一标签的标签词向量;获取词库,计算标签词向量与词库中每一个词的词向量之间的距离,将词库中与标签词向量的距离满足条件的词作为与第一标签具有相关性的语义标签。
在一种可选的实施方式中,第二获取单元3022包括构建子单元和第二获取子单元;
所示构建子单元,被配置为基于获取的深度学习模型的数据集构建混淆矩阵;
第二获取子单元,被配置为根据混淆矩阵获取与第一标签具有相关性的混淆标签。
在一种可选的实施方式中,获取的深度学习模型的数据集包括训练集,训练集中的每个样本具有参考标签;
构建子单元,被配置为将第一标签与训练集中的参考标签进行统计,得到混淆矩阵,混淆矩阵中每个元素的值为第一标签与对应的参考标签之间的混淆值。
在一种可选的实施方式中,第二获取子单元,被配置为根据混淆矩阵中第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与第一标签具有相关性的混淆标签。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将提供标签的设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
参见图6,其示出了本申请实施例提供的一种发表评论的提供标签的设备500的结构示意图。该提供标签的设备500可以是便携式移动提供标签的设备,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP5(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面5)播放器、笔记本电脑或台式电脑。提供标签的设备500还可能被称为用户提供标签的设备、便携式提供标签的设备、膝上型提供标签的设备、台式提供标签的设备等其他名称。
通常,提供标签的设备500包括有:处理器501和存储器502。
处理器501可以包括一个或多个处理核心,比如4个核心处理器、5个核心处理器等。处理器501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器501可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储提供标签的设备、闪存存储提供标签的设备。在一些实施例中,存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的提供标签的方法。
在一些实施例中,提供标签的设备500还可选包括有:外围提供标签的设备接口503和至少一个外围提供标签的设备。处理器501、存储器502和外围提供标签的设备接口503之间可以通过总线或信号线相连。各个外围提供标签的设备可以通过总线、信号线或电路板与外围提供标签的设备接口503相连。具体地,外围提供标签的设备包括:射频电路504、触摸显示屏505、摄像头506、音频电路507、定位组件508和电源509中的至少一种。
外围提供标签的设备接口503可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围提供标签的设备连接到处理器501和存储器502。在一些实施例中,处理器501、存储器502和外围提供标签的设备接口503被集成在同一芯片或电路板上;在一些其他实施例中,处理器501、存储器502和外围提供标签的设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信提供标签的设备进行通信。射频电路504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它提供标签的设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、5G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路504还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏505用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时,显示屏505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏505可以为一个,设置提供标签的设备500的前面板;在另一些实施例中,显示屏505可以为至少两个,分别设置在提供标签的设备500的不同表面或呈折叠设计;在再一些实施例中,显示屏505可以是柔性显示屏,设置在提供标签的设备500的弯曲表面上或折叠面上。甚至,显示屏505还可以设置成非矩形的不规则图形,也即异形屏。显示屏505可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件506用于采集图像或视频。可选地,摄像头组件506包括前置摄像头和后置摄像头。通常,前置摄像头设置在提供标签的设备的前面板,后置摄像头设置在提供标签的设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器501进行处理,或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在提供标签的设备500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路507还可以包括耳机插孔。
定位组件508用于定位提供标签的设备500的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。定位组件508可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源509用于为提供标签的设备500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,提供标签的设备500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于:加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器514、光学传感器515以及接近传感器516。
加速度传感器510可以检测以提供标签的设备500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号,控制触摸显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器512可以检测提供标签的设备500的机体方向及转动角度,陀螺仪传感器512可以与加速度传感器511协同采集用户对提供标签的设备500的3D动作。处理器501根据陀螺仪传感器512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器513可以设置在提供标签的设备500的侧边框和/或触摸显示屏505的下层。当压力传感器513设置在提供标签的设备500的侧边框时,可以检测用户对提供标签的设备500的握持信号,由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在触摸显示屏505的下层时,由处理器501根据用户对触摸显示屏505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器514用于采集用户的指纹,由处理器501根据指纹传感器514采集到的指纹识别用户的身份,或者,由指纹传感器515根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置提供标签的设备500的正面、背面或侧面。当提供标签的设备500上设置有物理按键或厂商Logo时,指纹传感器514可以与物理按键或厂商Logo集成在一起。
光学传感器515用于采集环境光强度。在一个实施例中,处理器501可以根据光学传感器515采集的环境光强度,控制触摸显示屏505的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏505的显示亮度;当环境光强度较低时,调低触摸显示屏505的显示亮度。在另一个实施例中,处理器501还可以根据光学传感器515采集的环境光强度,动态调整摄像头组件506的拍摄参数。
接近传感器516,也称距离传感器,通常设置在提供标签的设备500的前面板。接近传感器516用于采集用户与提供标签的设备500的正面之间的距离。在一个实施例中,当接近传感器516检测到用户与提供标签的设备500的正面之间的距离逐渐变小时,由处理器501控制触摸显示屏505从亮屏状态切换为息屏状态;当接近传感器516检测到用户与提供标签的设备500的正面之间的距离逐渐变大时,由处理器501控制触摸显示屏505从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图6中示出的结构并不构成对提供标签的设备500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条指令。至少一条指令经配置以由一个或者一个以上处理器执行,以实现上述任一种提供标签的方法。
在示例性实施例中,还提供了一种计算机可读存储介质,存储介质中存储有至少一条指令,至少一条指令在被计算机的处理器执行时实现上述任一种提供标签的方法。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
以上仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种提供标签的方法,其特征在于,所述方法包括:
基于深度学习模型预测目标内容的第一标签,所述深度学习模型基于包括各个样本的参考标签的数据集进行训练得到;
获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签;
根据用于获取所述深度学习模型的数据集构建混淆矩阵;根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签,所述混淆矩阵中每个元素的值为所述第一标签与对应的参考标签之间的混淆值;
将所述语义标签和混淆标签作为与所述第一标签具有相关性的第二标签;
将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。
2.根据权利要求1所述的方法,其特征在于,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签,所述根据用于获取所述深度学习模型的数据集构建混淆矩阵,包括:
将所述第一标签与所述训练集中的参考标签进行统计,得到混淆矩阵。
3.根据权利要求2所述的方法,其特征在于,所述根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签,包括:
根据所述混淆矩阵中所述第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与所述第一标签具有相关性的混淆标签。
4.一种提供标签的装置,其特征在于,所述装置包括:
预测模块,被配置为基于深度学习模型预测目标内容的第一标签,所述深度学习模型基于包括各个样本的参考标签的数据集进行训练得到;
获取模块,包括第一获取单元、第二获取单元和设置单元;
所述第一获取单元,被配置为获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签;
所述第二获取单元包括构建子单元和第二获取子单元;所述构建子单元,被配置为根据用于获取所述深度学习模型的数据集构建混淆矩阵;所述第二获取子单元,被配置为根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签,所述混淆矩阵中每个元素的值为所述第一标签与对应的参考标签之间的混淆值;
所述设置单元,被配置为将所述语义标签和混淆标签作为与所述第一标签具有相关性的第二标签;
提供模块,被配置为将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。
5.根据权利要求4所述的装置,其特征在于,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签;
所述构建子单元,被配置为将所述第一标签与所述训练集中的参考标签进行统计,得到混淆矩阵。
6.根据权利要求5所述的装置,其特征在于,所述第二获取子单元,被配置为根据所述混淆矩阵中所述第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与所述第一标签具有相关性的混淆标签。
7.一种提供标签的设备,其特征在于,所述设备包括处理器和存储器;
所述存储器,被配置为存储处理器可执行的至少一条指令;
所述处理器被配置为执行所述指令以实现如权利要求1-3中任一所述的提供标签的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器执行以实现如权利要求1-3中任一所述的提供标签的方法。
CN201910122128.8A 2019-02-19 2019-02-19 提供标签的方法、装置、设备及可读存储介质 Active CN109816047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910122128.8A CN109816047B (zh) 2019-02-19 2019-02-19 提供标签的方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910122128.8A CN109816047B (zh) 2019-02-19 2019-02-19 提供标签的方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN109816047A CN109816047A (zh) 2019-05-28
CN109816047B true CN109816047B (zh) 2022-05-24

Family

ID=66606753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910122128.8A Active CN109816047B (zh) 2019-02-19 2019-02-19 提供标签的方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN109816047B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112329838B (zh) * 2020-11-02 2024-02-02 上海明略人工智能(集团)有限公司 一种目标集合类别标签的确定方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866366A (zh) * 2010-07-15 2010-10-20 哈尔滨工业大学 一种基于内容的图像格式中文文档检索方法
CN102982076A (zh) * 2012-10-30 2013-03-20 新华通讯社 基于语义标签库的多维度内容标注方法
CN103164471A (zh) * 2011-12-15 2013-06-19 盛乐信息技术(上海)有限公司 视频文本标签的推荐方法及系统
CN105404903A (zh) * 2014-09-15 2016-03-16 联想(北京)有限公司 信息处理方法、装置及电子设备
CN107480200A (zh) * 2017-07-17 2017-12-15 深圳先进技术研究院 基于词标签的词语标注方法、装置、服务器及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810274B (zh) * 2014-02-12 2017-03-29 北京联合大学 基于WordNet语义相似度的多特征图像标签排序方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866366A (zh) * 2010-07-15 2010-10-20 哈尔滨工业大学 一种基于内容的图像格式中文文档检索方法
CN103164471A (zh) * 2011-12-15 2013-06-19 盛乐信息技术(上海)有限公司 视频文本标签的推荐方法及系统
CN102982076A (zh) * 2012-10-30 2013-03-20 新华通讯社 基于语义标签库的多维度内容标注方法
CN105404903A (zh) * 2014-09-15 2016-03-16 联想(北京)有限公司 信息处理方法、装置及电子设备
CN107480200A (zh) * 2017-07-17 2017-12-15 深圳先进技术研究院 基于词标签的词语标注方法、装置、服务器及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于词向量的模糊查询扩展方法;陈淑巧;《四川师范大学学报(自然科学版)》;20190131;第42卷(第1期);第92-97页 *

Also Published As

Publication number Publication date
CN109816047A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN110413837B (zh) 视频推荐方法和装置
CN110059686B (zh) 字符识别方法、装置、设备及可读存储介质
CN111127509B (zh) 目标跟踪方法、装置和计算机可读存储介质
CN110163296B (zh) 图像识别的方法、装置、设备及存储介质
CN110543350A (zh) 一种生成页面组件的方法及装置
CN112052354A (zh) 视频推荐方法、视频展示方法、装置及计算机设备
CN110647881A (zh) 确定图像对应的卡片类型的方法、装置、设备及存储介质
CN110991445B (zh) 竖排文字识别方法、装置、设备及介质
CN110232417B (zh) 图像识别方法、装置、计算机设备及计算机可读存储介质
CN109816047B (zh) 提供标签的方法、装置、设备及可读存储介质
CN113343709B (zh) 意图识别模型的训练方法、意图识别方法、装置及设备
CN114925667A (zh) 内容分类方法、装置、设备及计算机可读存储介质
CN114817709A (zh) 排序方法、装置、设备及计算机可读存储介质
CN114283395A (zh) 车道线检测的方法、装置、设备及计算机可读存储介质
CN109388732B (zh) 音乐地图的生成和显示方法、装置及存储介质
CN115221888A (zh) 实体提及的识别方法、装置、设备及存储介质
CN113051485A (zh) 群组搜索方法、装置、终端及存储介质
CN111652432A (zh) 用户属性信息的确定方法、装置、电子设备及存储介质
CN112214115A (zh) 输入方式的识别方法、装置、电子设备及存储介质
CN111984738A (zh) 数据关联方法、装置、设备及存储介质
CN112308104A (zh) 异常识别方法、装置及计算机存储介质
CN112560472B (zh) 一种识别敏感信息的方法及装置
CN110807486B (zh) 类别标签的生成方法、装置、电子设备及存储介质
CN113449948B (zh) 业务处理的方法、装置、电子设备及介质
CN111007969B (zh) 搜索应用的方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant