CN114283300A - 标签确定方法及装置、模型训练方法及装置 - Google Patents
标签确定方法及装置、模型训练方法及装置 Download PDFInfo
- Publication number
- CN114283300A CN114283300A CN202011040485.9A CN202011040485A CN114283300A CN 114283300 A CN114283300 A CN 114283300A CN 202011040485 A CN202011040485 A CN 202011040485A CN 114283300 A CN114283300 A CN 114283300A
- Authority
- CN
- China
- Prior art keywords
- sample
- label
- image
- machine learning
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 208
- 238000000034 method Methods 0.000 title claims abstract description 158
- 238000010801 machine learning Methods 0.000 claims abstract description 309
- 239000011159 matrix material Substances 0.000 claims description 32
- 230000011218 segmentation Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 abstract description 9
- 230000005540 biological transmission Effects 0.000 description 38
- 238000013527 convolutional neural network Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 22
- 239000000047 product Substances 0.000 description 18
- 210000001624 hip Anatomy 0.000 description 8
- 230000007717 exclusion Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000007261 regionalization Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本说明书实施例提供标签确定方法及装置、模型训练方法及装置,其中,所述标签确定方法包括接收待预测图像;将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;基于所述初始标签的目标预测概率确定所述待预测图像的目标标签;具体的,所述标签确定方法将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及标签确定方法。本说明书一个或者多个实施例同时涉及模型训练方法,标签确定装置,模型训练装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
在C2C(英文:Consumer To Consumer,中文:电子商务平台)电商平台中,普通卖家没有经过B2C(英文:Business-to-Consumer,中文:商业零售)平台专业卖家类似的专业训练,卖家在发布商品的时候需要上传商品图片,而图片中包含丰富的商品信息,但是卖家通过人工编辑填入的商品信息有限,还经常会错填或者漏填商品信息,导致商品不能被搜索引擎有效召回。当前,随着人工智能算法的发展日新月异,通过设计标签识别算法可以智能识别商品的描述标签,自动地为商品打上详细、准确的商品信息,简化商品发布的流程,同时通过丰富的结构化信息还能够促进商品被搜索召回。然而现有的标签识别算法覆盖的商品标签数量有限、精度不高,甚至会出现相互矛盾的标签,对最终商品搜索召回的帮助有限。
因此急需提供一种可以基于标签之间的关联关系,提高商标签的识别精度的标签确定方法。
发明内容
有鉴于此,本说明书施例提供了标签确定方法。本说明书一个或者多个实施例同时涉及模型训练方法,标签确定装置,模型训练装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种标签确定方法,包括:
接收待预测图像;
将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
基于所述初始标签的目标预测概率确定所述待预测图像的目标标签,
其中,所述第一机器学习模型适用于为所述待预测图像打标,并输出所述待预测图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
根据本说明书实施例的第二方面,提供了一种模型训练方法,包括:
获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
根据本说明书实施例的第三方面,提供了一种标签确定方法,包括:
基于用户的调用请求为所述用户展示图像输入界面;
接收所述用户基于所述图像输入界面输入的待预测图像;
将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
根据本说明书实施例的第四方面,提供了一种标签确定方法,包括:
接收用户发送的调用请求,其中,所述调用请求中携带待预测图像;
将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
根据本说明书实施例的第五方面,提供了一种模型训练方法,包括:
基于用户的调用请求为所述用户展示图像输入界面;
接收所述用户基于所述图像输入界面输入的样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
根据本说明书实施例的第六方面,提供了一种模型训练方法,包括:
接收用户发送的调用请求,其中,所述调用请求中携带样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
根据本说明书实施例的第七方面,提供了一种商品识别方法,包括:
接收商品图像,并基于上述标签识别方法确定所述商品图像中商品的目标标签;
接收用户针对商品的搜索请求,其中,所述搜索请求中携带有所述商品的描述信息;
将所述商品的描述信息与所述目标标签进行匹配,确定与所述商品的描述信息匹配的目标标签;
将与所述商品的描述信息匹配的目标标签对应的商品确定为目标商品,并将所述目标商品发送至所述用户。
根据本说明书实施例的第八方面,提供了一种标签确定装置,包括:
第一接收模块,被配置为接收待预测图像;
第一概率获得模块,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第二概率获得模块,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第一标签确定模块,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签,
其中,所述第一机器学习模型适用于为所述待预测图像打标,并输出所述待预测图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
根据本说明书实施例的第九方面,提供了一种标签确定装置,包括:
第一界面展示模块,被配置为基于用户的调用请求为所述用户展示图像输入界面;
第二接收模块,被配置为接收所述用户基于所述图像输入界面输入的待预测图像;
第三概率获得模块,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第四概率获得模块,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第二标签确定模块,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
根据本说明书实施例的第十方面,提供了一种标签确定装置,包括:
第三接收模块,被配置为接收用户发送的调用请求,其中,所述调用请求中携带待预测图像;
第五概率获得模块,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第六概率获得模块,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第三标签确定模块,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
根据本说明书实施例的第十一方面,提供了一种模型训练装置,包括:
第一样本获取模块,被配置为获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第七概率获得模块,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第一模型构建模块,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第八概率获得模块,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第一模型训练模块,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
根据本说明书实施例的第十二方面,提供了一种模型训练装置,包括:
第二界面展示模块,被配置为基于用户的调用请求为所述用户展示图像输入界面;
第四接收模块,被配置为接收所述用户基于所述图像输入界面输入的样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第九概率获得模块,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第二模型构建模块,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第十概率获得模块,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第二模型训练模块,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
根据本说明书实施例的第十三方面,提供了一种模型训练装置,包括:
第五接收模块,被配置为接收用户发送的调用请求,其中,所述调用请求中携带样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第十一概率获得模块,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第三模型构建模块,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第十二概率获得模块,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第三模型训练模块,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
根据本说明书实施例的第十四方面,提供了一种商品识别装置,包括:
商品打标模块,被配置为接收商品图像,并基于所述标签识别方法确定所述商品图像中商品的目标标签;
搜索请求接收模块,被配置为接收用户针对商品的搜索请求,其中,所述搜索请求中携带有所述商品的描述信息;
标签匹配模块,被配置为将所述商品的描述信息与所述目标标签进行匹配,确定与所述商品的描述信息匹配的目标标签;
目标商品确定模块,被配置为将与所述商品的描述信息匹配的目标标签对应的商品确定为目标商品,并将所述目标商品发送至所述用户。
根据本说明书实施例的第十五方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该指令被处理器执行时实现所述标签确定方法的步骤、实现所述模型训练方法的步骤或者实现所述商品识别方法的步骤。
根据本说明书实施例的第十六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述标签确定方法的步骤、实现所述模型训练方法的步骤或者实现所述商品识别方法的步骤。
本说明书一个实施例实现了标签确定方法及装置,其中,所述标签确定方法包括接收待预测图像;将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;基于所述初始标签的目标预测概率确定所述待预测图像的目标标签;具体的,所述标签确定方法将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度。
附图说明
图1是本说明书一个实施例提供的一种标签确定方法的具体应用场景的示例图;
图2是本说明书一个实施例提供的第一种模型训练方法的流程图;
图3是本说明书一个实施例提供的一种模型训练方法中样本标签矩阵的示意图;
图4是本说明书一个实施例提供的一种模型训练方法的具体处理过程示意图;
图5是本说明书一个实施例提供的第一种标签确定方法的流程图;
图6是本说明书一个实施例提供的第二种标签确定方法的流程图;
图7是本说明书一个实施例提供的第三种标签确定方法的流程图;
图8是本说明书一个实施例提供的第二种模型训练方法的流程图;
图9是本说明书一个实施例提供的第三种模型训练方法的流程图;
图10是本说明书一个实施例提供的第一种标签确定装置的结构示意图;
图11是本说明书一个实施例提供的第二种标签确定装置的结构示意图;
图12是本说明书一个实施例提供的第三种标签确定装置的结构示意图;
图13是本说明书一个实施例提供的第一种模型训练装置的结构示意图;
图14是本说明书一个实施例提供的第二种模型训练装置的结构示意图;
图15是本说明书一个实施例提供的第三种模型训练装置的结构示意图;
图16是本说明书一个实施例提供的一种商品识别方法的流程图;
图17是本说明书一个实施例提供的一种商品识别装置的结构示意图;
图18是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
C2C电子商务平台:即Consumer To Consumer电子商务平台,通过电子商务网站为买卖用户双方提供一个在线交易平台,使卖方可以在上面发布待出售的物品的信息,而买方可以从中选择进行购买,同时,为便于买卖双方交易,提供交易所需的一系列配套服务。
B2C:(Business-to-Consumer,商业零售),B2C即企业通过互联网为消费者提供一个新型的购物环境——网上商店,消费者可以通过此B2C平台进行网上购物等。
Message Passing Networks:消息传递网络,用于对多变量之间关系进行建模,用于图嵌入学习、多标签识别等任务。
在本说明书中,提供了标签确定方法。本说明书一个或者多个实施例同时涉及模型训练方法,标签确定装置,模型训练装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了本说明书一个实施例提供的一种标签确定方法的具体应用场景的示例图。
图1的应用场景中包括终端和服务器。具体的,用户通过终端将图像a发送给服务器,服务器在接收到图像a后,将图像a输入预先训练的卷积神经网络模型,得到图像a的初始标签以及每个初始标签的初始预测概率(ψ(x)i),然后将图像a的初始标签的初始预测概率输入预先训练的消息传递网络模型,得到对图像a的初始标签的初始预测概率纠正后的预测概率(Q(x)i),最后将纠正后的预测概率进行降序排序,且基于项目要求取预设数量的初始标签作为图像a的目标标签,其中,预设数量可以根据实际的项目要求进行设置,例如设置为20个或30个等。
实际应用中,在标签数量较多的情况下,标签之间的模糊性会越来越严重,甚至会出现标签互斥的情况发生,例如出现标签:老年的时候,出现了标签:高跟鞋,很明显老年人与高跟鞋不是很匹配,这两个标签属于两个相互矛盾的标签。因此,本说明书实施例的所述标签识别方法中引入标签网络对标签关系进行建模,利用构建的消息传递网络模型对标签的初始预测结果进行迭代更新,结合基础标签模型(即卷积神经网络模型)的图像标签的基本区分能力,可以极大的提升标签识别算法的识别精度。
参见图2,图2示出了根据本说明书一个实施例提供的第一种模型训练方法的流程图,具体包括以下步骤。
步骤202:获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率。
其中,样本图像包括但不限于通过智能终端下载的网络图像、拍摄终端拍摄的图像或者对视频分割之后形成的视频帧图像等,其中,预设分割方式可以为按帧分割或者是按时长分割等分割方式;而具体的样本图像中的内容可以包括但不限于物品、风景或者人物等。
具体实施时,样本图像训练集中的每个样本图像均对应至少一个样本标签以及每个样本标签的真实预测概率,例如样本图像1对应样本标签a1、样本标签a2、样本标签a3,其中,样本标签a1的真实预测概率为0.6,样本标签a2的真实预测概率为0.5,样本标签a3的真实预测概率为0.7,由此可以看出,每个样本图像可以对应多个样本标签,每个样本标签对应一个真实预测概率。
步骤204:将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率。
其中,所述第一机器学习模型包括但不限于图像标签识别模型,所述第二机器学习模型包括但不限于消息传递网络模型,
其中,所述第一机器学习模型输入所述样本图像,输出所述样本图像对应的样本标签以及所述样本标签的初始预测概率,
所述第二机器学习模型输入所述样本标签的初始预测概率,输出所述样本标签的目标预测概率。
具体的,在获取样本图像训练集之后,将每个样本图像输入图像标签识别模型中,以获得每个样本图像对应的样本标签以及每个样本标签对应的初始预测概率。
本说明书实施例中,在进行模型训练时,首先利用基础标签模型(即图像标签识别模型)的图像标签的基本区分能力,获得每个样本图像的样本标签的初始预测概率,后续通过第二机器学习模型对该样本标签的初始预测概率的纠正获得该样本标签的目标预测概率,可以基于该目标预测概率对第一机器学习模型和第二机器学习模型进行更精确的训练。
步骤206:基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型。
其中,第二机器学习模型为消息传递网络模型,实际应用中,在获取样本图像训练集之后,会基于所有样本图像的样本标签以及每个样本标签与其他样本标签之间的共现概率构建第二机器学习模型。
具体实施时,所述基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型包括:
基于所述样本标签构建样本标签矩阵,并根据所述样本标签矩阵确定每个样本标签与其他样本标签的共现概率;
将每个样本标签确定为节点,以及将每个样本标签与其他样本标签的共现概率确定为边;
根据所述样本标签确定的节点和边构建第二机器学习模型。
具体的,首先基于样本图像的样本标签构建样本标签矩阵,然后根据样本标签矩阵计算每个样本标签与其他样本标签的共现概率。
参见图3,图3示出了根据本说明书一个实施例提供的一种模型训练方法中样本标签矩阵的示意图。
其中,图3中的标签网络共现概率矩阵即样本标签矩阵。
由图3可知,由样本图像的样本标签形成的训练数据包括:图案:纯色,适用对象:青年,款式:单鞋;风格:现代中式,设计元素:拼接,设计元素:原木;...廓形:X型,图案:大花,腰型:高腰,裙长:长款。
然后基于上述训练数据构建初始的样本标签矩阵,比如训练数据中的“图案:纯色,适用对象:青年,款式:单鞋”,这三个样本标签,每一行代表一个样本标签,例如“纯色”为第一行,“青年”为第二行,“单鞋”为第三行,若该训练数据中存在一万个标签,那么就会有一万行,每个标签都会排在固定的位置,用一个唯一编号代替,对于列的排列也是相同的,基于此种规则构建初始的样本标签矩阵。
在构建初始的样本标签矩阵之后,对该初始的样本标签矩阵中的每个样本标签与其他样本标签的共现概率进行统计,例如训练数据中的“图案:纯色,适用对象:青年,款式:单鞋”,这三个样本标签是共同出现的,那么它们之间的数就会加1,即这三个标签的共现加1,按照此种方式对该初始的样本标签矩阵中的所有样本标签进行统计,比如出现样本标签“纯色”的情况下,样本标签“青年”的出现概率是多少,样本标签“单鞋”的出现概率是多少,当该初始的样本标签矩阵里面的所有样本标签均统计完成之后,统计之后再对每一行或者每一列样本标签做归一化,将共现概率大于等于0.1的样本标签的共现概率进行保留,将共现概率小于0.1的样本标签的共现概率设置为0。
以图3中的第一行第一列的样本标签为“纯色”,第三列的样本标签为“青年”,最后一列的样本标签为“单鞋”为例,可以确定样本标签“纯色”与其自身的共现概率为1.0,与样本标签为“青年”的共现概率为0.2,与样本标签为“单鞋”的共现概率为0.9。
通过上述方式实现最终的样本标签矩阵的构建,通过该样本标签矩阵可以确定每个样本标签与其他样本标签之间的共现概率。
最后基于该样本标签矩阵对所有的训练数据进行统计,将该样本标签矩阵中的每个样本标签设置为标签网络中的节点,节点之间的边表示样本标签之间的共现概率,基于该节点和边实现第二机器学习模型,即消息传递网络模型的构建。
本说明书实施例中,所述模型训练方法引入标签网络对标签关系进行建模,后续可以利用建模获得的消息传递网络模型(即Message Passing)对标签的初始预测结果进行迭代更新,再结合基础标签模型的图像标签的基本区分能力,可以较为明显的提升标签识别算法的识别精度。
步骤208:根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率。
其中,所述第一机器学习模型适用于为所述样本图像打标,并输出所述样本图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
具体的,在构建第二机器学习模型之后,利用该第二机器学习模型中的样本标签之间的共现概率对卷积神经网络模型输出的样本标签的初始预测概率进行迭代更新,其具体的更新过程如下:
for iter in 1:M do
end for
其中,初始化中的Q(x)是ψ(x)的归一化归一化后的向量就是每个样本标签的概率向量,每个概率向量元素取值在0~1,和为1。而for iter in1:M就是对Q(x)进行迭代更新,更新的过程就是for循环里面的每一步骤。具体的,Wi,l就是样本标签矩阵,W是由训练数据统计得到,比如i,l两个样本标签出现在一起(即在一个训练数据中同时出现),那么Wi,l对应的统计值就加1。该样本标签矩阵中的所有样本标签都统计完成之后,将W按照行/列归一化,就是增加条件概率,对这个概率卡阈值进行阶段,保留下来的就是有边的(即两个样本标签如果经常同时出现,就是右边,偶尔或者从来没有同时出现过,就是没有边),通过有边的样本标签构建第二机器学习模型。
实际使用中,利用上述迭代循环公式对所述样本标签的初始预测概率进行迭代更新,最后获得迭代更新后的样本标签的目标预测概率。
步骤210:基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
具体的,在获得样本标签的目标预测概率后,将该目标预测概率与该样本标签在通过第一机器学习模型以及第二机器学习模型预测前的真实预测概率进行比较,以比较获得的结果对第一机器学习模型和第二机器学习模型进行训练,例如样本标签在通过第一机器学习模型以及第二机器学习模型预测前希望的真实预测概率较高,而实际通过第一机器学习模型以及第二机器学习模型预测后的该样本标签的目标预测概率较低,那么则会对第一机器学习模型以及第二机器学习模型里面的训练参数进行调整,以使得训练获得的第一机器学习模型和第二机器学习模型的精度更高,具体实现方式如下所述:
所述基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型包括:
基于所述样本标签的目标预测概率以及真实预测概率计算损失函数,根据所述损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练,获得所述第一机器学习模型和所述第二机器学习模型。
具体实施时,基于样本标签的目标预测概率以及真实预测概率计算损失函数,然后根据该损失函数对第一机器学习模型和第二机器学习模型进行反向传播训练,获得最终的第一机器学习模型和第二机器学习模型。
本说明书实施例的所述模型训练方法,首先利用样本图像和样本标签训练一个初始的深度卷积神经网络模型,以及利用样本图像的样本标签构建一个消息传递网络模型;然后将初始的深度卷积神经网络模型获得的样本图像的样本标签的初始预测概率输入到消息传递网络模型中进行迭代更新,根据迭代更新后的目标预测概率与真实预测概率对初始的深度卷积神经网络模型和消息传递网络模型进行训练,以获得最终的识别精度较高的深度卷积神经网络模型以及消息传递网络模型。
参见图4,图4示出了根据本说明书一个实施例提供的一种模型训练方法的具体处理过程示意图。
首先,获取样本图像和样本标签训练获得卷积神经网络,然后将样本图像(x)输入到卷积神经网络(ψ(x)i),获得该样本图像的样本标签,以及每个样本标签对应的初始预测概率;同时,利用样本图像的样本标签生成训练数据,基于该训练数据生成标签网络共现概率矩阵({Wi,j}),通过该标签网络共现概率矩阵以标签网络的方式构建消息传递网络。
然后利用该消息传递网络中的样本标签的共现概率对卷积神经网络输出的样本标签的初始预测概率进行迭代更新,以获得纠正后的样本标签的预测概率(Q(x)i),将其作为样本标签的最终预测概率。
最后基于该最终预测概率与样本标签的预测前的真实预测概率进行比对,通过反向网络传播实现对卷积神经网络以及消息传递网络的训练。
本说明书实施例中,利用标签关系网络实现对样本标签进行建模,并利用建模获得的消息传递网络模型实现对样本标签的初始预测概率的迭代更新,通过迭代更新的最终预测概率实现对卷积神经网络模型和消息传递网络模型的训练,以获得对标签识别更为精确的卷积神经网络模型和消息传递网络模型。
参见图5,图5示出了根据本说明书一个实施例提供的第一种标签确定方法的流程图,具体包括以下步骤。
步骤502:接收待预测图像。
其中,待预测图像包括但不限于通过智能终端下载的网络图像、拍摄终端拍摄的图像或者按照预设分割方式切分后形成的视频图像等,其中,预设分割方式可以为按帧分割或者是按时长分割等分割方式;而具体的待预测图像中的内容可以包括但不限于物品、风景或者人物等。
具体实施时,在接收待预测图像之前,或者接收待预测图像之后,对待预测图像的标签进行预测之前,需要先训练获得第一机器学习模型和第二机器学习模型,以便通过训练获得的第一机器学习模型和第二机器学习模型获得该待预测图像的目标标签以及该目标标签的目标预测概率,具体实现方式如下:
所述第一机器学习模型以及所述第二机器学习模型的训练过程如下:
获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
其中,样本图像包括但不限于通过智能终端下载的网络图像、拍摄终端拍摄的图像或者对视频分割之后形成的视频帧图像等,其中,预设分割方式可以为按帧分割或者是按时长分割等分割方式;而具体的样本图像中的内容可以包括但不限于物品、风景或者人物等。
具体实施时,样本图像训练集中的每个样本图像均对应至少一个样本标签以及每个样本标签的真实预测概率,例如样本图像1对应样本标签a1、样本标签a2、样本标签a3,其中,样本标签a1的真实预测概率为0.6,样本标签a2的真实预测概率为0.5,样本标签a3的真实预测概率为0.7,由此可以看出,每个样本图像可以对应多个样本标签,每个样本标签对应一个真实预测概率。
具体的,在获取样本图像训练集之后,将每个样本图像输入第一机器学习模型中,以获得每个样本图像对应的样本标签以及每个样本标签对应的初始预测概率。同时,还会基于该样本图像训练集中的样本图像的样本标签以及每个样本标签与其他样本标签之间的共现概率构建第二机器学习模型,根据第二机器学习模型中样本标签之间的共现概率对样本标签的初始预测概率进行调整,以获得样本标签的目标预测概率,最终,基于样本标签的目标预测概率以及真实预测概率训练获得第一机器学习模型和第二机器学习模型。
可选的,所述基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型包括:
基于所述样本标签构建样本标签矩阵,并根据所述样本标签矩阵确定每个样本标签与其他样本标签的共现概率;
将每个样本标签确定为节点,以及将每个样本标签与其他样本标签的共现概率确定为边;
根据所述样本标签确定的节点和边构建第二机器学习模型。
可选的,所述基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型包括:
基于所述样本标签的目标预测概率以及真实预测概率计算损失函数,根据所述损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练,获得所述第一机器学习模型和所述第二机器学习模型。
可选的,所述第一机器学习模型包括图像标签识别模型,所述第二机器学习模型包括消息传递网络模型,
其中,所述第一机器学习模型输入所述样本图像,输出所述样本图像对应的样本标签以及所述样本标签的初始预测概率,
所述第二机器学习模型输入所述样本标签的初始预测概率,输出所述样本标签的目标预测概率。
其中,本说明书实施例中对于图像标签识别模型和消息传递网络模型的具体训练过程可以参见上述模型训练方法的细节描述,在此不做赘述。
本说明书实施例中,通过上述模型训练方法获得图像标签识别模型和消息传递网络模型,使得待预测图像后续可以基于该图像标签识别模型和消息传递网络模型更为准确的图像标签。
步骤504:将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率。
具体的,以第一机器学习模型为图像标签识别模型为例,将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率,可以理解为,将待预测图像输入图像标签识别模型,得到该待预测图像的初始标签以及每个初始标签的初始预测概率,例如待预测图像为包含衣服的图像,通过图像标签识别模型输出的该待预测图像的初始标签为:图案:纯色,适用对象:老年,腰型:低腰,而每个初始标签的初始预测概率为:图案:纯色的初始预测概率为0.6,适用对象:老年的初始预测概率为0.8,腰型:低腰的初始预测概率为0.7。
步骤506:将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率。
具体的,以第二机器学习模型为消息传递网络模型为例,将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率,可以理解为,将初始标签的初始预测概率输入消息传递网络模型,获得每个初始标签的目标预测概率。
仍以待预测图像的初始标签为:图案:纯色,适用对象:老年,腰型:低腰为例,实际应用中,我们可以得知,标签老年与低腰共现的概率并不高,那么在图案:纯色的初始预测概率为0.6,适用对象:老年的初始预测概率为0.8的情况下,低腰的初始预测概率为0.7的概率可能就会存在偏差,因此采用预先训练的消息传递网络模型对所有的初始标签的初始预测概率进行纠正,以消息传递网络模型中每个标签与其他标签之间的共现概率实现与初始标签的初始预测概率的调整,最终获得:图案:纯色的目标预测概率为0.7,适用对象:老年的目标预测概率为0.8,低腰的目标预测概率为0.3。
步骤508:基于所述初始标签的目标预测概率确定所述待预测图像的目标标签。
其中,所述第一机器学习模型适用于为所述待预测图像打标,并输出所述待预测图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
具体的,在获得初始标签的目标预测概率的情况下,可以基于该初始标签的目标预测概率筛选出待预测图像的目标标签。
具体实施时,所述基于所述初始标签的目标预测概率确定所述待预测图像的目标标签包括:
确定所述初始标签的目标预测概率,且将所述目标预测概率大于等于预设概率阈值的初始标签确定为所述待预测图像的目标标签。
其中,预设概率阈值可以根据实际需求进行设置,例如设置为0.5或者0.6等。
沿用上例,若预设概率阈值设置为0.5,那么在图案:纯色的目标预测概率为0.7,适用对象:老年的目标预测概率为0.8,低腰的目标预测概率为0.3的情况下,基于预设概率阈值0.5确定的大于等于该预设概率阈值0.5的待预测图像的目标标签为:图案:纯色,适用对象:老年。
实际应用中,也不仅限于通过预设概率阈值获取待预测图像的目标标签,也可以基于预设标签数量确定待预测图像的目标标签,例如在确定每个初始标签的目标预测概率之后,基于该目标预测概率按照从大到小的顺序对初始标签进行降序排列,然后抽取前面预设标签数量的初始标签作为待预测图像的目标标签,具体对于目标标签的选择可以根据实际需求进行设置,本申请对此不做任何限定。
本说明书实施例中,通过设置预设概率阈值可以选择更为合适的初始标签作为待预测图像的目标标签,以提高待预测图像的识别出的标签的准确性,提升用户体验。
本说明书另一实施例中,所述将所述目标预测概率大于等于预设概率阈值的初始标签确定为所述待预测图像的目标标签之后,还包括:
基于所述目标标签为所述待预测图像生成图像描述信息。
具体实施时,在确定了待预测图像的目标标签后,可以基于目标标签生成待预测图像的描述信息。
仍以上述为例,若待预测图像的目标标签为:纯色、老年,此时根据该目标标签则可以为该待预测图像生成图像描述信息:图案为纯色,适用对象为老年的衣服。
本说明书实施例中,在获取待预测图像的目标标签后,可以基于该待预测图像的精确识别出的目标标签为该待预测图像生成较为准确的图像描述信息,在实际应用中,用户无需再通过目标标签针对待预测对象进行描述信息编辑,节省时间,极大的提升用户体验。
实际应用中,本说明书一个或多个实施例提供的标签确定方法可以应用于对图像进行打标或者描述的任意一种场景中,例如在C2C电商平台中,普通卖家没有经过B2C平台专业卖家类似的专业训练,在发布商品时,编辑填入的商品描述信息有限,经常会错填或者漏填商品描述信息,导致商品不能被搜索引擎有效召回;此种情况下采用本说明书实施例提供的标签确定方法,在输入一张商品图像后,通过本说明书一个或多个实施例提供的标签确定方法实现为该商品图像匹配较为精确且数量较多的目标标签,供用户选择使用,或者更为方便的直接基于该目标标签为用户自动生成可编辑的图像描述信息,增强用户体验。
实际应用中,所述标签确定方法中不仅仅可以对待预测图像进行目标标签的确定,也可以采用该方法对其他多模态数据进行目标标签的获取,其中,多模态数据包括但不限于文字、语音、图像和/或视频等。
而在该标签确定方法的输入为其他多模态数据时,首先对多模态数据对应的标签进行第一机器学习模型和第二机器学习模型进行训练,后续即可基于训练得到的第一机器学习模型和第二机器学习模型实现对多模态数据对应的标签以及标签的预测概率的获取。
在具体实施时,接收到待预测多模态数据后,即可对多模态数据进行解析,以每种模态数据对应的第一机器学习模型,获取每种模态数据对应的初始标签以及初始标签的初始预测概率,然后将该初始标签的初始预测概率输入第二机器学习模型中进行纠正,获得纠正后的初始标签的目标预测概率,最后基于所有模态数据对应的初始标签以及初始标签的目标预测概率确定该待预测多模态数据的目标标签。
举例说明,例如接收的待预测多模态数据为视频,则将视频解析为图像和声音,然后将图像输入预先训练的图像标签识别模型中,得到该图像的初始标签以及所述初始标签的初始预测概率;同时将解析得到的声音输入预先训练的声纹标签提取模型中,得到该声音的初始声纹标签以及该初始声纹标签的初始预测概率;然后将该图像的初始标签的初始预测概率输入通过图像标签预先训练的消息传递网络模型中,获得该图像的初始标签的目标预测概率;以及将该声音的初始声纹标签的初始预测概率输入通过声音标签预先训练的消息传递网络模型中,获得该声音的初始声纹标签的目标预测概率;最后基于该图像的初始标签的目标预测概率以及该声音的初始声纹标签的目标预测概率确定该视频的目标标签,例如将所有的标签按照目标预测概率排序后,取前20个标签作为该视频的目标标签。实际应用中,可以采用声音标签对图像标签进行修订或补充,例如声音标签中存在品牌名,而图像标签中不存在品牌名,此时则可以基于声音标签对图像标签做补充;采用此种方式在丰富多模态数据标签的同时,又可以用过声音标签的修订确保多模态数据标签的准确性。
本说明书实施例中,所述标签确定方法将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度;通过引入Message Passing Networks(消息传递网络)来对标签之间的关系进行建模,充分利用标签之间的共现、互斥关系,结合原有标签模型的识别能力,可以大大的扩大覆盖的标签范围和识别精度。
参见图6,图6示出了根据本说明书一个实施例提供的第二种标签确定方法的流程图,包括如下步骤。
步骤602:基于用户的调用请求为所述用户展示图像输入界面。
具体的,在接收用户的调用请求的情况下,根据该调用请求确定图像输入界面,且将该图像输入界面展示给用户,用户可以通过该图像输入界面进行待预测图像的输入。
实际应用中,用户包括但不限于商户或者个体用户等。
步骤604:接收所述用户基于所述图像输入界面输入的待预测图像。
步骤606:将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率。
步骤608:将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率。
步骤610:基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
需要说明的是,本说明书实施例提供的第二种标签确定方法中与上述第一种标签确定方法的实施例相对应的部分,可以参见上述第一种标签确定方法的实施例中的详细描述,在此不再赘述。
本说明书实施例中,所述标签确定方法将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度;通过引入Message Passing Networks(消息传递网络)来对标签之间的关系进行建模,充分利用标签之间的共现、互斥关系,结合原有标签模型的识别能力,可以大大的扩大覆盖的标签范围和识别精度。
参见图7,图7示出了根据本说明书一个实施例提供的第三种标签确定方法的流程图,包括如下步骤。
步骤702:接收用户发送的调用请求,其中,所述调用请求中携带待预测图像。
步骤704:将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率。
步骤706:将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率。
步骤708:基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
需要说明的是,本说明书实施例提供的第三种标签确定方法中与上述第一种标签确定方法的实施例相对应的部分,可以参见上述第一种标签确定方法的实施例中的详细描述,在此不再赘述。
实际应用中,标签确定方法应用于本地服务端,且为用户提供API接口,在接收到用户发送的API调用请求后,基于用户的调用请求中携带的待预测图像,通过所述标签确定方法快速准确的获得待预测图像的目标标签,且将所述目标标签返回至所述用户,以提升用户体验。
本说明书实施例中,所述标签确定方法将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度;通过引入Message Passing Networks(消息传递网络)来对标签之间的关系进行建模,充分利用标签之间的共现、互斥关系,结合原有标签模型的识别能力,可以大大的扩大覆盖的标签范围和识别精度。
参见图8,图8示出了根据本说明书一个实施例提供的第二种模型训练方法的流程图,包括如下步骤。
步骤802:基于用户的调用请求为所述用户展示图像输入界面。
步骤804:接收所述用户基于所述图像输入界面输入的样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率。
步骤806:将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率。
步骤808:基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型。
步骤810:根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率。
步骤812:基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
需要说明的是,本说明书实施例提供的第二种模型训练方法中与上述第一种模型训练方法的实施例相对应的部分,可以参见上述第一种模型训练方法的实施例中的详细描述,在此不再赘述。
本说明书实施例的所述模型训练方法,首先利用样本图像和样本标签训练一个初始的深度卷积神经网络模型,以及利用样本图像的样本标签构建一个消息传递网络模型;然后将初始的深度卷积神经网络模型获得的样本图像的样本标签的初始预测概率输入到消息传递网络模型中进行迭代更新,根据迭代更新后的目标预测概率与真实预测概率对初始的深度卷积神经网络模型和消息传递网络模型进行训练,以获得最终的识别精度较高的深度卷积神经网络模型以及消息传递网络模型。
参见图9,图9示出了根据本说明书一个实施例提供的第三种模型训练方法的流程图,包括如下步骤。
步骤902:接收用户发送的调用请求,其中,所述调用请求中携带样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率。
步骤904:将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率。
步骤906:基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型。
步骤908:根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率。
步骤910:基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
需要说明的是,本说明书实施例提供的第三种模型训练方法中与上述第一种模型训练方法的实施例相对应的部分,可以参见上述第一种模型训练方法的实施例中的详细描述,在此不再赘述。
本说明书实施例的所述模型训练方法,首先利用样本图像和样本标签训练一个初始的深度卷积神经网络模型,以及利用样本图像的样本标签构建一个消息传递网络模型;然后将初始的深度卷积神经网络模型获得的样本图像的样本标签的初始预测概率输入到消息传递网络模型中进行迭代更新,根据迭代更新后的目标预测概率与真实预测概率对初始的深度卷积神经网络模型和消息传递网络模型进行训练,以获得最终的识别精度较高的深度卷积神经网络模型以及消息传递网络模型。
与上述方法实施例相对应,本说明书还提供了标签确定装置实施例,图10示出了本说明书一个实施例提供的第一种标签确定装置的结构示意图。如图10所示,该装置包括:
第一接收模块1002,被配置为接收待预测图像;
第一概率获得模块1004,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第二概率获得模块1006,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第一标签确定模块1008,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签,
其中,所述第一机器学习模型适用于为所述待预测图像打标,并输出所述待预测图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
可选的,所述第一机器学习模型以及所述第二机器学习模型由训练模块训练获得,其中,所述训练模块,被配置为:
获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
可选的,所述训练模块,进一步被配置为:
基于所述样本标签构建样本标签矩阵,并根据所述样本标签矩阵确定每个样本标签与其他样本标签的共现概率;
将每个样本标签确定为节点,以及将每个样本标签与其他样本标签的共现概率确定为边;
根据所述样本标签确定的节点和边构建第二机器学习模型。
可选的,所述训练模块,进一步被配置为:
基于所述样本标签的目标预测概率以及真实预测概率计算损失函数,根据所述损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练,获得所述第一机器学习模型和所述第二机器学习模型。
可选的,所述第一机器学习模型包括图像标签识别模型,所述第二机器学习模型包括消息传递网络模型,
其中,所述第一机器学习模型输入所述样本图像,输出所述样本图像对应的样本标签以及所述样本标签的初始预测概率,
所述第二机器学习模型输入所述样本标签的初始预测概率,输出所述样本标签的目标预测概率。
可选的,所述第一标签确定模块1008,进一步被配置为:
确定所述初始标签的目标预测概率,且将所述目标预测概率大于等于预设概率阈值的初始标签确定为所述待预测图像的目标标签。
可选的,所述装置,还包括:
信息生成模块,被配置为基于所述目标标签为所述待预测图像生成图像描述信息。
可选的,所述待预测图像包括按照预设分割方式切分后形成的视频图像。
本说明书实施例中,所述标签确定装置将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度;通过引入Message Passing Networks(消息传递网络)来对标签之间的关系进行建模,充分利用标签之间的共现、互斥关系,结合原有标签模型的识别能力,可以大大的扩大覆盖的标签范围和识别精度。
上述为本实施例的第一种标签确定装置的示意性方案。需要说明的是,该标签确定装置的技术方案与上述的第一种标签确定法的技术方案属于同一构思,标签确定装置的技术方案未详细描述的细节内容,均可以参见上述标签确定方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了标签确定装置实施例,图11示出了本说明书一个实施例提供的第二种标签确定装置的结构示意图。如图11所示,该装置包括:
第一界面展示模块1102,被配置为基于用户的调用请求为所述用户展示图像输入界面;
第二接收模块1104,被配置为接收所述用户基于所述图像输入界面输入的待预测图像;
第三概率获得模块1106,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第四概率获得模块1108,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第二标签确定模块1110,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
本说明书实施例中,所述标签确定装置将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度;通过引入Message Passing Networks(消息传递网络)来对标签之间的关系进行建模,充分利用标签之间的共现、互斥关系,结合原有标签模型的识别能力,可以大大的扩大覆盖的标签范围和识别精度。
上述为本实施例的第二种标签确定装置的示意性方案。需要说明的是,该标签确定装置的技术方案与上述的第二种标签确定法的技术方案属于同一构思,标签确定装置的技术方案未详细描述的细节内容,均可以参见上述标签确定方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了标签确定装置实施例,图12示出了本说明书一个实施例提供的第三种标签确定装置的结构示意图。如图12所示,该装置包括:
第三接收模块1202,被配置为接收用户发送的调用请求,其中,所述调用请求中携带待预测图像;
第五概率获得模块1204,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第六概率获得模块1206,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第三标签确定模块1208,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
本说明书实施例中,所述标签确定装置将待预测图像通过第一机器学习模型获得的初始预测结果输入到第二机器学习模型中进行二次纠正,通过第二机器学习模型的对初始预测结果的更新,能够极大的提升了待预测图像对应的图像标签的识别精度;通过引入Message Passing Networks(消息传递网络)来对标签之间的关系进行建模,充分利用标签之间的共现、互斥关系,结合原有标签模型的识别能力,可以大大的扩大覆盖的标签范围和识别精度。
上述为本实施例的第三种标签确定装置的示意性方案。需要说明的是,该标签确定装置的技术方案与上述的第三种标签确定法的技术方案属于同一构思,标签确定装置的技术方案未详细描述的细节内容,均可以参见上述标签确定方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了模型训练装置实施例,图13示出了本说明书一个实施例提供的第一种模型训练装置的结构示意图。如图13所示,该装置包括:
第一样本获取模块1302,被配置为获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第七概率获得模块1304,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第一模型构建模块1306,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第八概率获得模块1308,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第一模型训练模块1310,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
可选的,所述第一模型构建模块1306,进一步被配置为:
基于所述样本标签构建样本标签矩阵,并根据所述样本标签矩阵确定每个样本标签与其他样本标签的共现概率;
将每个样本标签确定为节点,以及将每个样本标签与其他样本标签的共现概率确定为边;
根据所述样本标签确定的节点和边构建第二机器学习模型。
可选的,所述第一模型训练模块1310,进一步被配置为:
基于所述样本标签的目标预测概率以及真实预测概率计算损失函数,根据所述损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练,获得所述第一机器学习模型和所述第二机器学习模型。
可选的,所述第一机器学习模型包括图像标签识别模型,所述第二机器学习模型包括消息传递网络模型,
其中,所述第一机器学习模型输入所述样本图像,输出所述样本图像对应的样本标签以及所述样本标签的初始预测概率,
所述第二机器学习模型输入所述样本标签的初始预测概率,输出所述样本标签的目标预测概率。
本说明书实施例的所述模型训练装置,首先利用样本图像和样本标签训练一个初始的深度卷积神经网络模型,以及利用样本图像的样本标签构建一个消息传递网络模型;然后将初始的深度卷积神经网络模型获得的样本图像的样本标签的初始预测概率输入到消息传递网络模型中进行迭代更新,根据迭代更新后的目标预测概率与真实预测概率对初始的深度卷积神经网络模型和消息传递网络模型进行训练,以获得最终的识别精度较高的深度卷积神经网络模型以及消息传递网络模型。
上述为本实施例的第一种模型训练装置的示意性方案。需要说明的是,该模型训练装置的技术方案与上述的第一种模型训练方法的技术方案属于同一构思,模型训练装置的技术方案未详细描述的细节内容,均可以参见上述模型训练方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了模型训练装置实施例,图14示出了本说明书一个实施例提供的第二种模型训练装置的结构示意图。如图14所示,该装置包括:
第二界面展示模块1402,被配置为基于用户的调用请求为所述用户展示图像输入界面;
第四接收模块1404,被配置为接收所述用户基于所述图像输入界面输入的样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第九概率获得模块1406,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第二模型构建模块1408,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第十概率获得模块1410,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第二模型训练模块1412,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
本说明书实施例的所述模型训练装置,首先利用样本图像和样本标签训练一个初始的深度卷积神经网络模型,以及利用样本图像的样本标签构建一个消息传递网络模型;然后将初始的深度卷积神经网络模型获得的样本图像的样本标签的初始预测概率输入到消息传递网络模型中进行迭代更新,根据迭代更新后的目标预测概率与真实预测概率对初始的深度卷积神经网络模型和消息传递网络模型进行训练,以获得最终的识别精度较高的深度卷积神经网络模型以及消息传递网络模型。
上述为本实施例的第二种模型训练装置的示意性方案。需要说明的是,该模型训练装置的技术方案与上述的第二种模型训练方法的技术方案属于同一构思,模型训练装置的技术方案未详细描述的细节内容,均可以参见上述模型训练方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了模型训练装置实施例,图15示出了本说明书一个实施例提供的第三种模型训练装置的结构示意图。如图15所示,该装置包括:
第五接收模块1502,被配置为接收用户发送的调用请求,其中,所述调用请求中携带样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第十一概率获得模块1504,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第三模型构建模块1506,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第十二概率获得模块1508,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第三模型训练模块1510,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
本说明书实施例的所述模型训练装置,首先利用样本图像和样本标签训练一个初始的深度卷积神经网络模型,以及利用样本图像的样本标签构建一个消息传递网络模型;然后将初始的深度卷积神经网络模型获得的样本图像的样本标签的初始预测概率输入到消息传递网络模型中进行迭代更新,根据迭代更新后的目标预测概率与真实预测概率对初始的深度卷积神经网络模型和消息传递网络模型进行训练,以获得最终的识别精度较高的深度卷积神经网络模型以及消息传递网络模型。
上述为本实施例的第三种模型训练装置的示意性方案。需要说明的是,该模型训练装置的技术方案与上述的第三种模型训练方法的技术方案属于同一构思,模型训练装置的技术方案未详细描述的细节内容,均可以参见上述模型训练方法的技术方案的描述。
参见图16,图16示出了本说明书一个实施例提供的一种商品识别方法的流程图,具体包括以下步骤。
步骤1602:接收商品图像,并基于上述标签识别方法确定所述商品图像中商品的目标标签。
其中,上述标签识别方法即为本说明书实施例中第一种标签识别方法、第二种标签识别方法或第三种标签识别方法。
而商品图像,即为包含任意一种类别的商品的图像,例如食品类商品、服饰类商品等。
具体的,在接收多个商品的商品图像之后,利用上述任意一种标签识别方法对每个商品图像中的商品的目标标签进行识别,例如包含裙子的商品图像,通过上述任意一种标签识别方法对该商品图像进行识别,可以获得该商品图像的目标标签:裙子、红色、长款等。
步骤1604:接收用户针对商品的搜索请求,其中,所述搜索请求中携带有所述商品的描述信息。
其中,商品的描述信息,即为描述某个商品的文字信息,例如商品为裙子,该裙子的描述信息可以为红色裙子、长款裙子等。
具体的,接收用户针对待搜索的某个商品的搜索请求,该搜索请求中携带有该商品的描述信息,通过该描述信息可以有针对性的搜索某个商品。例如接收用户针对裙子的搜索请求,该搜索请求中携带有该裙子的描述信息:红色裙子。
步骤1606:将所述商品的描述信息与所述目标标签进行匹配,确定与所述商品的描述信息匹配的目标标签。
具体的,将商品的描述信息与目标标签进行匹配,即提取商品的描述信息中的关键字或关键词,将这些关键字或关键词与目标标签进行匹配,以确定出与商品的描述信息匹配的目标标签。
沿用上例,商品的描述信息为红色裙子,那么提取的该商品的描述信息的关键词为红色和裙子,那么将红色和裙子与目标标签进行匹配,匹配出所有与红色和裙子对应的目标标签。
步骤1608:将与所述商品的描述信息匹配的目标标签对应的商品确定为目标商品,并将所述目标商品发送至所述用户。
具体的,在匹配出与商品的描述信息对应的目标标签后,基于该目标标签确定对应的商品,将这些商品作为目标商品发送给用户。
仍沿用上例,则可以将与红色、裙子匹配的目标标签对应的所有商品作为目标商品推荐给用户。
本说明书实施例中,所述商品识别方法应用在C2C电商平台中,在C2C电商平台中普通卖家没有经过B2C平台专业卖家类似的专业训练,在发布商品时,编辑填入的商品信息有限,经常会错填或者漏填商品信息,导致商品在被买家搜索时,不能被搜索引擎有效召回。那么具体实施时,C2C电商平台可以采用本说明书实施例提供的标签识别方法首先为所有的C2C电商平台中的商品自动打上详细、准确的商品信息,即商品的目标标签,简化商品发布的流程(即卖家可以直接基于目标标签生成商品描述信息,无需进行人工编辑),同时在执行商品搜索任务时,也可以基于丰富、准确的结构化的商品目标标签,促进商品被搜索召回,在C2C电商场景中使得商品搜索召回效果明显。
参见图17,图17示出了本说明书一个实施例提供的一种商品识别装置的结构示意图,所述装置,包括:
商品打标模块1702,被配置为接收商品图像,并基于所述标签识别方法确定所述商品图像中商品的目标标签;
搜索请求接收模块1704,被配置为接收用户针对商品的搜索请求,其中,所述搜索请求中携带有所述商品的描述信息;
标签匹配模块1706,被配置为将所述商品的描述信息与所述目标标签进行匹配,确定与所述商品的描述信息匹配的目标标签;
目标商品确定模块1708,被配置为将与所述商品的描述信息匹配的目标标签对应的商品确定为目标商品,并将所述目标商品发送至所述用户。
本说明书实施例中,所述商品识别装置应用在C2C电商平台中,在C2C电商平台中普通卖家没有经过B2C平台专业卖家类似的专业训练,在发布商品时,编辑填入的商品信息有限,经常会错填或者漏填商品信息,导致商品在被买家搜索时,不能被搜索引擎有效召回。那么具体实施时,C2C电商平台可以采用本说明书实施例提供的标签识别方法首先为所有的C2C电商平台中的商品自动打上详细、准确的商品信息,即商品的目标标签,简化商品发布的流程(即卖家可以直接基于目标标签生成商品描述信息,无需进行人工编辑),同时在执行商品搜索任务时,也可以基于丰富、准确的结构化的商品目标标签,促进商品被搜索召回,在C2C电商场景中使得商品搜索召回效果明显。
图18示出了根据本说明书一个实施例提供的一种计算设备1800的结构框图。该计算设备1800的部件包括但不限于存储器1810和处理器1820。处理器1820与存储器1810通过总线1830相连接,数据库1850用于保存数据。
计算设备1800还包括接入设备1840,接入设备1840使得计算设备1800能够经由一个或多个网络1860通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备1840可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备1800的上述部件以及图18中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图18所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1800可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备1800还可以是移动式或静止式的服务器。
其中,处理器1820用于执行计算机可执行指令时实现,该指令被处理器1820执行时实现所述标签确定方法的步骤或者实现所述模型训练方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的标签确定方法或者模型训练方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述标签确定方法或者模型训练方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,,该指令被处理器执行时实现所述标签确定方法的步骤或者实现所述模型训练方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的标签确定方法或者模型训练方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述标签确定方法或者模型训练方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (26)
1.一种标签确定方法,包括:
接收待预测图像;
将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
基于所述初始标签的目标预测概率确定所述待预测图像的目标标签,
其中,所述第一机器学习模型适用于为所述待预测图像打标,并输出所述待预测图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
2.根据权利要求1所述的标签确定方法,所述第一机器学习模型以及所述第二机器学习模型的训练过程如下:
获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
3.根据权利要求2所述的标签确定方法,所述基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型包括:
基于所述样本标签构建样本标签矩阵,并根据所述样本标签矩阵确定每个样本标签与其他样本标签的共现概率;
将每个样本标签确定为节点,以及将每个样本标签与其他样本标签的共现概率确定为边;
根据所述样本标签确定的节点和边构建第二机器学习模型。
4.根据权利要求2所述的标签确定方法,所述基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型包括:
基于所述样本标签的目标预测概率以及真实预测概率计算损失函数,根据所述损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练,获得所述第一机器学习模型和所述第二机器学习模型。
5.根据权利要求2所述的标签确定方法,所述第一机器学习模型包括图像标签识别模型,所述第二机器学习模型包括消息传递网络模型,
其中,所述第一机器学习模型输入所述样本图像,输出所述样本图像对应的样本标签以及所述样本标签的初始预测概率,
所述第二机器学习模型输入所述样本标签的初始预测概率,输出所述样本标签的目标预测概率。
6.根据权利要求1所述的标签确定方法,所述基于所述初始标签的目标预测概率确定所述待预测图像的目标标签包括:
确定所述初始标签的目标预测概率,且将所述目标预测概率大于等于预设概率阈值的初始标签确定为所述待预测图像的目标标签。
7.根据权利要求6所述的标签确定方法,所述将所述目标预测概率大于等于预设概率阈值的初始标签确定为所述待预测图像的目标标签之后,还包括:
基于所述目标标签为所述待预测图像生成图像描述信息。
8.根据权利要求1-7任意一项所述的标签确定方法,所述待预测图像包括按照预设分割方式切分后形成的视频图像。
9.一种模型训练方法,包括:
获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
10.根据权利要求9所述的模型训练方法,所述基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型包括:
基于所述样本标签构建样本标签矩阵,并根据所述样本标签矩阵确定每个样本标签与其他样本标签的共现概率;
将每个样本标签确定为节点,以及将每个样本标签与其他样本标签的共现概率确定为边;
根据所述样本标签确定的节点和边构建第二机器学习模型。
11.根据权利要求9所述的模型训练方法,所述基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型包括:
基于所述样本标签的目标预测概率以及真实预测概率计算损失函数,根据所述损失函数对所述第一机器学习模型和所述第二机器学习模型进行训练,获得所述第一机器学习模型和所述第二机器学习模型。
12.根据权利要求9-11任意一项所述的模型训练方法,所述第一机器学习模型包括图像标签识别模型,所述第二机器学习模型包括消息传递网络模型,
其中,所述第一机器学习模型输入所述样本图像,输出所述样本图像对应的样本标签以及所述样本标签的初始预测概率,
所述第二机器学习模型输入所述样本标签的初始预测概率,输出所述样本标签的目标预测概率。
13.一种标签确定方法,包括:
基于用户的调用请求为所述用户展示图像输入界面;
接收所述用户基于所述图像输入界面输入的待预测图像;
将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
14.一种标签确定方法,包括:
接收用户发送的调用请求,其中,所述调用请求中携带待预测图像;
将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
15.一种模型训练方法,包括:
基于用户的调用请求为所述用户展示图像输入界面;
接收所述用户基于所述图像输入界面输入的样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
16.一种模型训练方法,包括:
接收用户发送的调用请求,其中,所述调用请求中携带样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
17.一种商品识别方法,包括:
接收商品图像,并基于权利要求1-8任意一项所述标签识别方法确定所述商品图像中商品的目标标签;
接收用户针对商品的搜索请求,其中,所述搜索请求中携带有所述商品的描述信息;
将所述商品的描述信息与所述目标标签进行匹配,确定与所述商品的描述信息匹配的目标标签;
将与所述商品的描述信息匹配的目标标签对应的商品确定为目标商品,并将所述目标商品发送至所述用户。
18.一种标签确定装置,包括:
第一接收模块,被配置为接收待预测图像;
第一概率获得模块,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第二概率获得模块,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第一标签确定模块,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签,
其中,所述第一机器学习模型适用于为所述待预测图像打标,并输出所述待预测图像的初始标签以及所述初始标签的初始预测概率,
所述第二机器学习模型适用于对所述初始标签的初始预测概率进行调整,并输出调整后的所述初始标签的目标预测概率。
19.一种标签确定装置,包括:
第一界面展示模块,被配置为基于用户的调用请求为所述用户展示图像输入界面;
第二接收模块,被配置为接收所述用户基于所述图像输入界面输入的待预测图像;
第三概率获得模块,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第四概率获得模块,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第二标签确定模块,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
20.一种标签确定装置,包括:
第三接收模块,被配置为接收用户发送的调用请求,其中,所述调用请求中携带待预测图像;
第五概率获得模块,被配置为将所述待预测图像输入第一机器学习模型,得到所述待预测图像的初始标签以及所述初始标签的初始预测概率;
第六概率获得模块,被配置为将所述初始标签的初始预测概率输入第二机器学习模型,得到所述初始标签的目标预测概率;
第三标签确定模块,被配置为基于所述初始标签的目标预测概率确定所述待预测图像的目标标签并返回给所述用户。
21.一种模型训练装置,包括:
第一样本获取模块,被配置为获取样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第七概率获得模块,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第一模型构建模块,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第八概率获得模块,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第一模型训练模块,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型。
22.一种模型训练装置,包括:
第二界面展示模块,被配置为基于用户的调用请求为所述用户展示图像输入界面;
第四接收模块,被配置为接收所述用户基于所述图像输入界面输入的样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第九概率获得模块,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第二模型构建模块,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第十概率获得模块,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第二模型训练模块,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
23.一种模型训练装置,包括:
第五接收模块,被配置为接收用户发送的调用请求,其中,所述调用请求中携带样本图像训练集,其中,所述样本图像训练集中包括样本图像、所述样本图像对应的样本标签以及所述样本标签的真实预测概率;
第十一概率获得模块,被配置为将所述样本图像输入第一机器学习模型,获得所述样本图像的样本标签以及所述样本标签的初始预测概率;
第三模型构建模块,被配置为基于所述样本标签以及所述样本标签之间的共现概率构建第二机器学习模型;
第十二概率获得模块,被配置为根据所述第二机器学习模型中所述样本标签之间的共现概率对所述样本标签的初始预测概率进行调整,以获得所述样本标签的目标预测概率;
第三模型训练模块,被配置为基于所述样本标签的目标预测概率以及真实预测概率训练获得所述第一机器学习模型和所述第二机器学习模型并返回给所述用户。
24.一种商品识别装置,包括:
商品打标模块,被配置为接收商品图像,并基于权利要求1-8任意一项所述标签识别方法确定所述商品图像中商品的目标标签;
搜索请求接收模块,被配置为接收用户针对商品的搜索请求,其中,所述搜索请求中携带有所述商品的描述信息;
标签匹配模块,被配置为将所述商品的描述信息与所述目标标签进行匹配,确定与所述商品的描述信息匹配的目标标签;
目标商品确定模块,被配置为将与所述商品的描述信息匹配的目标标签对应的商品确定为目标商品,并将所述目标商品发送至所述用户。
25.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该指令被处理器执行时实现权利要求1-8、13、14任意一项所述标签确定方法的步骤或者实现权利要求9-12、15、16任意一项所述模型训练方法的步骤或者实现权利要求17所述商品识别方法的步骤。
26.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1-8、13、14任意一项所述标签确定方法的步骤或者实现权利要求9-12、15、16任意一项所述模型训练方法的步骤或者实现权利要求17所述商品识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011040485.9A CN114283300A (zh) | 2020-09-28 | 2020-09-28 | 标签确定方法及装置、模型训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011040485.9A CN114283300A (zh) | 2020-09-28 | 2020-09-28 | 标签确定方法及装置、模型训练方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114283300A true CN114283300A (zh) | 2022-04-05 |
Family
ID=80867972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011040485.9A Pending CN114283300A (zh) | 2020-09-28 | 2020-09-28 | 标签确定方法及装置、模型训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114283300A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI818712B (zh) * | 2022-09-05 | 2023-10-11 | 英業達股份有限公司 | 機器學習模型訓練系統、機器學習模型訓練方法以及非暫態電腦可讀取儲存媒體 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016145379A1 (en) * | 2015-03-12 | 2016-09-15 | William Marsh Rice University | Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification |
CN110147878A (zh) * | 2018-11-28 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及设备 |
CN111428806A (zh) * | 2020-04-03 | 2020-07-17 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置、电子设备及存储介质 |
CN111582409A (zh) * | 2020-06-29 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 图像标签分类网络的训练方法、图像标签分类方法及设备 |
-
2020
- 2020-09-28 CN CN202011040485.9A patent/CN114283300A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016145379A1 (en) * | 2015-03-12 | 2016-09-15 | William Marsh Rice University | Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification |
CN110147878A (zh) * | 2018-11-28 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及设备 |
CN111428806A (zh) * | 2020-04-03 | 2020-07-17 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置、电子设备及存储介质 |
CN111582409A (zh) * | 2020-06-29 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 图像标签分类网络的训练方法、图像标签分类方法及设备 |
Non-Patent Citations (1)
Title |
---|
王娅丹 等: "标签共现的标签聚类算法研究", 《计算机工程与应用》, vol. 51, no. 2, 11 July 2014 (2014-07-11), pages 146 - 150 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI818712B (zh) * | 2022-09-05 | 2023-10-11 | 英業達股份有限公司 | 機器學習模型訓練系統、機器學習模型訓練方法以及非暫態電腦可讀取儲存媒體 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909176B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN110472090B (zh) | 基于语义标签的图像检索方法以及相关装置、存储介质 | |
EP3267362B1 (en) | Machine learning image processing | |
TW201935344A (zh) | 一種獲取多標籤使用者肖像的方法和裝置 | |
WO2020133398A1 (zh) | 应用推荐方法、装置、服务器和计算机可读存储介质 | |
CN110910199A (zh) | 项目信息的排序方法、装置、计算机设备及存储介质 | |
CN109584006B (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN111461164B (zh) | 样本数据集的扩容方法及模型的训练方法 | |
CN110955750A (zh) | 评论区域和情感极性的联合识别方法、装置、电子设备 | |
CN113379449B (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
CN112801425B (zh) | 信息点击率的确定方法、装置、计算机设备和存储介质 | |
CN115982463A (zh) | 资源推荐方法、装置、设备及存储介质 | |
CN116894711A (zh) | 商品推荐理由生成方法及其装置、电子设备 | |
CN108389113B (zh) | 一种协同过滤推荐方法和系统 | |
CN115953590A (zh) | 一种分段式细粒度的商品图像描述生成方法、装置和介质 | |
CN111797622A (zh) | 用于生成属性信息的方法和装置 | |
CN111967946A (zh) | 一种基于面向用户多关系信息网络的商品推荐方法及系统 | |
CN116308556A (zh) | 基于物联网的广告推送方法及系统 | |
CN116611897B (zh) | 基于人工智能的消息提醒方法和系统 | |
CN114283300A (zh) | 标签确定方法及装置、模型训练方法及装置 | |
CN117112915A (zh) | 基于用户特征及大数据训练的智能设计方法和系统 | |
US20220100792A1 (en) | Method, device, and program for retrieving image data by using deep learning algorithm | |
CN111768218A (zh) | 用于处理用户交互信息的方法和装置 | |
CN114997967A (zh) | 一种智能推荐系统及方法 | |
JP7190479B2 (ja) | 学習装置、機械学習モデル及び学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |