CN114863230A - 图像处理方法、假货识别方法及电子设备 - Google Patents

图像处理方法、假货识别方法及电子设备 Download PDF

Info

Publication number
CN114863230A
CN114863230A CN202210359450.4A CN202210359450A CN114863230A CN 114863230 A CN114863230 A CN 114863230A CN 202210359450 A CN202210359450 A CN 202210359450A CN 114863230 A CN114863230 A CN 114863230A
Authority
CN
China
Prior art keywords
features
processed
splicing
processing
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210359450.4A
Other languages
English (en)
Other versions
CN114863230B (zh
Inventor
陈教选
竺晨曦
毛锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210359450.4A priority Critical patent/CN114863230B/zh
Publication of CN114863230A publication Critical patent/CN114863230A/zh
Application granted granted Critical
Publication of CN114863230B publication Critical patent/CN114863230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例公开了一种图像处理方法、假货识别方法及电子设备,所述图像处理方法包括:获取待识别对象的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果。该技术方案可以兼容已有的现有处理特征和未经过处理的原始特征,两种特征均可以为本公开实施例中的输入特征,同样达到了使用多模态特征识别目标对象的目的,在提高了目标对象识别准确率的情况下,降低了成本。

Description

图像处理方法、假货识别方法及电子设备
技术领域
本公开涉及互联网技术领域,具体涉及一种图像处理方法、假货识别方法及电子设备。
背景技术
随着互联网技术、网上支付、物流等技术的发展,电商与网上购物日益为更多的人所接受,涌现出各种电商平台。商家入驻电商平台后,可以在所入驻的电商平台售卖货品。然而,一些不良商家企图通过文字或者图片来绕过电商平台的检测,从而达到售卖假货商品的目的。
已有技术中,为防控假货商品,电商平台使用单一的文本或者图像特征作为识别依据,这是因为针对待识别商品获取完整的多模态特征的数据成本较高。即便使用了多模态特征,也基本上使用联合训练的方式,将多模态特征的信息建模到识别模型中,但是这种方式训练得到的模型比较厚重,训练一次的成本较高。此外,商家的行为特征会随着时间的增加而不断改变,比如新入驻的商家,原入驻商家的侵权信息的滨化等。如果依然使用上述较为厚重的识别模型,则识别准确率会下降。因此,针对上述问题需要提出一种解决方案,用以提高假货识别准确率。
发明内容
本公开实施例提供一种图像处理方法、假货识别方法及电子设备。
第一方面,本公开实施例中提供了一种图像处理方法,其中,包括:
获取待识别对象的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果。
进一步地,所述现有处理特征和/或所述处理后特征包括非连续型向量特征,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征之前,所述方法还包括:
将所述现有处理特征和/或所述处理后特征中的非连续型向量特征转换成连续性型向量特征。
进一步地,基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果,包括:
将所述目标拼接特征进行融合,基于融合后的特征确定所述待识别对象是否为目标对象。
进一步地,将所述目标拼接特征进行融合,包括:
利用融合层模型将所述目标拼接特征进行融合;所述融合层模型包括以线性整流函数作为激活函数的至少一个融合层以及全连接层;其中,所述融合层模型为机器学习模型。
进一步地,所述融合层模型包括多个所述融合层,所述目标拼接特征经过所述多个融合层后得到的输出结果与所述目标拼接特征进行残差计算,残差结果输入至所述全连接层。
进一步地,所述原始特征为多模态特征;在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征,包括:
利用不同模态特征对应的不同预设处理方式对所述原始特征中不同模态的特征进行处理,得到不同模态特征对应的处理后特征。
进一步地,所述现有处理特征包括不同模态特征对应的现有处理特征;将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征,包括:
将所述现有处理特征中不同模态特征对应的现有处理特征进行拼接,得到第一拼接特征;
将所述处理后特征中不同模态特征对应的处理后特征进行拼接,得到第二拼接特征;
将所述第一拼接特征和所述第二拼接特征进行拼接后得到目标拼接特征。
第二方面,本公开实施例中提供了一种假货识别方法,其中,包括:
接收商品的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
基于所述目标拼接特征输出所述商品是否为假货商品的识别结果。
进一步地,所述现有处理特征和/或所述处理后特征包括品牌类别型特征,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征之前,所述方法还包括:
为每一商品品牌设置初始化向量;
将所述品牌类别型特征对应的特征值按照预设区间进行归一化;
将归一化后的值作为权重值,对所述初始化向量进行加权得到所述品牌类别特征对应的预处理特征。
第三方面,本公开实施例中提供了一种对象识别模型的训练方法,其中,包括:
获取样本对象的样本特征以及样本对象是否为目标对象的标签;所述样本特征包括现有处理特征和/或原始特征;
在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
基于所述目标拼接特征以及对象识别模型获得所述样本对象是否为目标对象的预测结果;
基于所述预测结果以及所述标签对所述对象识别模型进行训练。
第四方面,本公开实施例中提供了一种图像处理装置,其中,包括:
第一获取模块,被配置为获取待识别对象的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
第一处理模块,被配置为在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
第一拼接模块,被配置为将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
第二获取模块,被配置为基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果。
第五方面,本公开实施例中提供了一种假货识别装置,其中,包括:
接收模块,被配置为接收商品的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
第二处理模块,被配置为在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
第二拼接模块,被配置为将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
输出模块,被配置为基于所述目标拼接特征输出所述商品是否为假货商品的识别结果。
第六方面,本公开实施例中提供了一种对象识别模型的训练装置,其中,包括:
第三获取模块,被配置为获取样本对象的样本特征以及样本对象是否为目标对象的标签;所述样本特征包括现有处理特征和/或原始特征;
第三处理模块,被配置为在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
第三拼接模块,被配置为将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
第四获取模块,被配置为基于所述目标拼接特征以及对象识别模型获得所述样本对象是否为目标对象的预测结果;
训练模块,被配置为基于所述预测结果以及所述标签对所述对象识别模型进行训练。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,上述装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持上述装置执行上述对应方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。上述装置还可以包括通信接口,用于上述装置与其他设备或通信网络通信。
第七方面,本公开实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现上述任一方面所述的方法。
第八方面,本公开实施例提供了一种计算机可读存储介质,用于存储上述任一装置所用的计算机指令,该计算机指令被处理器执行时用于实现上述任一方面所述的方法。
第九方面,本公开实施例提供了一种计算机程序产品,其包含计算机指令,该计算机指令被处理器执行时用于实现上述任一方面所述的方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本实施例中,在目标对象的识别过程中,可以获取待识别对象的待识别特征,待识别特征可以包括现有处理特征和原始特征。在该待识别特征中包括原始特征时,可以利用预设处理方式对原始特征进行处理,进而将处理后特征与现有处理特征进行拼接,得到的目标拼接特征用于获得该待识别对象是否为目标对象的识别结果。通过上述方式,可以兼容已有的现有处理特征和未经过处理的原始特征,两种特征均可以为本公开实施例中的输入特征,同样达到了使用多模态特征识别目标对象的目的,从而避免了已有技术中使用多模态特征训练模型所要付出的高成本,在提高了目标对象识别准确率的情况下,降低了成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:
图1示出根据本公开一实施方式的图像处理方法的流程图;
图2示出根据本公开一实施方式中融合层模型的模型结构示意图;
图3示出根据本公开一实施方式的假货识别方法的流程图;
图4示出根据本公开一实施方式的对象识别模型的训练方法的流程图;
图5示出根据本公开一实施方式中对象识别过程在假货商品的识别场景下的一种应用示意图;
图6是适于用来实现根据本公开一实施方式的图像处理方法、假货识别方法和/或对象识别模型的训练方法的电子设备的结构示意图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
下面通过具体实施例详细介绍本公开实施例的细节。
图1示出根据本公开一实施方式的图像处理方法的流程图。如图1所示,该图像处理方法包括以下步骤:
在步骤S101中,获取待识别对象的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
在步骤S102中,在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
在步骤S103中,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
在步骤S104中,基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果。
本实施例中,该图像处理方法适于在客户端或者服务器端执行。待识别对象可以是任意对象,比如由相应提供者在线上平台为用户所提供的产品、服务等对象。待识别特征可以是待识别对象的任意特征,比如用于描述该待识别对象的文字特征、图像特征、该待识别对象的提供者的历史行为特征等。
在一些实施例中,为了识别出待识别对象是否为目标对象,需要多渠道收集待识别对象的待识别特征。在一些实施例中,多渠道收集到的待识别特征可以包括但不限于以下两类:一类是经过已有的处理模块处理后的现有处理特征,例如经过已有的模型进行编码处理后得到的现有处理特征,而另一类是未经过处理的原始特征,例如直接从线上平台收集到的关于该待识别对象的文字特征、图像特征以及该待识别对象的提供者的历史行为特征等。
本公开实施例为了能够兼容从各个渠道收集到的待识别特征,在获取待识别对象的待识别特征之后,确定该待识别特征中是否包括原始特征,如果包括原始特征,则针对该原始特征利用预设处理方式对该原始特征进行处理,得到对应的处理后特征。也就是说,为了识别待识别对象是否为目标对象,可以收集多种待识别特征,该多种待识别特征中可以包括但不限于现有处理特征和未经过处理的原始特征。在一些实施例中,该原始特征可以是多模态特征,例如该原始特征可以是对应于文本模态、图像模态、语音模态、行为模态等的特征。而需要说明的是,现有处理特征也可以是利用已有的处理方式对多模态特征处理而得到的特征。
在一些实施例中,该预设处理方式可以基于原始特征的不同而采用不同的处理方式,比如针对文本特征可以采用文本编码器,将文本中的语义表述采用向量进行表示,也即将文本中的语义转换成向量表示,使得在文本中语义相关的字、词的向量表示较为接近。而针对图像特征可以采用图像编码器,将图像转换成向量表示。预设处理方式可以基于实际需要而设定,在此不做具体限制。需要说明的是,上述预设处理方式可以采用已有的模型或者算法等对原始特征进行处理。
本公开实施例,在将待识别特征中的原始特征按照预设处理方式转换成处理后特征之后,由于待识别特征中包括的现有处理特征以及原始特征转换得到的处理后特征均为经过处理的特征,因此可以将现有处理特征和处理后特征进行拼接,得到目标拼接特征。需要说明的是,该现有处理特征和处理后特征可以是能够被机器识别的数字表示特征。例如现有处理特征和处理后特征均可以是连续型向量特征。还需要说明的是,如果现有处理特征或者处理后特征不为能够被机器识别的数字表示特征时,还可以通过设定的转换方式将其转换成数字表示特征,如连续型向量特征。当然,可以理解的是,对于原始特征由于采用的是本公开实施例中公开的预设处理方式,因此可以预先考虑直接采用预设处理方式将原始特征转换成数字表示特征。需要说明的是,现有处理特征和处理后特征不限于上述连续型向量特征,也可以是其他类型的特征,只要是能够被机器所识别的数字型特征,并且进行拼接后可作为整体能够被机器识别即可。
在一些实施例中,现有处理特征和处理后特征进行拼接可以理解为将现有处理特征和处理后特征进行首尾连接,比如现有处理特征为n位向量{x0,x1,……,xn-1},而处理后特征为m位向量{y0,y1,……,ym-1},拼接后得到的目标拼接特征可以为n+m位向量{x0,x1,……,xn-1,y0,y1,……,ym-1}。当然可以理解的是,目标拼接特征中现有处理特征和处理后特征的前后顺序可以互换,并且现有处理特征为多个独立特征,例如多个向量特征,和/或处理后特征为多个独立特征时,也可以按照上述方式进行拼接,并且各个独立特征的拼接顺序可以不限。
在一些实施例中,该目标拼接特征可以被用于识别该待识别对象是否为目标对象。在一些实施例中,可以通过预训练的模型,基于该目标拼接特征进行识别。该预训练的模型可以基于所要识别的目标对象预先训练,并且训练过程中可以收集样本对象的样本特征以及样本对象的标签,并利用样本特征以及标签对该模型进行训练。需要说明的是,样本特征可以是类似于上文中提到的现有处理特征和原始特征,原始特征经过上文中的方式得到处理后特征后,与现有处理特征进行拼接得到目标拼接特征;标签可以是样本对象是否为目标对象的正确结果。
本实施例中,在目标对象的识别过程中,可以获取待识别对象的待识别特征,待识别特征可以包括现有处理特征和原始特征。在该待识别特征中包括原始特征时,可以利用预设处理方式对原始特征进行处理,进而将处理后特征与现有处理特征进行拼接,得到的目标拼接特征用于获得该待识别对象是否为目标对象的识别结果。通过上述方式,可以兼容已有的现有处理特征和未经过处理的原始特征,两种特征均可以为本公开实施例中的输入特征,同样达到了使用多模态特征识别目标对象的目的,从而避免了已有技术中使用多模态特征训练模型所要付出的高成本,在提高了目标对象识别准确率的情况下,降低了成本。
在本实施例的一个可选实现方式中,所述现有处理特征和/或所述处理后特征包括非连续型向量特征,步骤S103,即将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征的步骤之前,所述方法进一步还包括以下步骤:
将所述现有处理特征和/或所述处理后特征中的非连续型向量特征转换成连续性型向量特征。
该可选的实现方式中,例如,可以将现有处理特征和处理后特征统一成连续型向量特征。在一些实施例中,现有处理特征和/或处理后特征可以表现为两种形式:连续型向量特征和类别型特征。连续型向量特征体现为特征本身已经被转化为一个向量的形式,该向量可以被计算机所识别。在需要的情况下,可以对该连续型向量特征进行数值归一化,归一化的目的是为了将所有特征对应的连续型向量限定在一定范围内。而类别型特征则表现为不同类别对应不同的特征,在类别较多时,如果不同类别使用0-1向量表示,则该类别型特征的向量维度会较大,容易引发维度灾难。因此,对于类别型特征可以通过低维向量的方式来表征。
在本实施例的一个可选实现方式中,步骤S104,即基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果的步骤,进一步包括以下步骤:
将所述目标拼接特征进行融合,基于融合后的特征确定所述待识别对象是否为目标对象。
该可选的实现方式中,由于目标拼接特征为多个独立的特征拼接而成,为了提高识别率,可以将多个独立特征进行融合,使得融合后特征中体现各个独立特征之间的相互关联关系。因此,在对该待识别对象识别之前,先将目标拼接特征进行融合,也即将该目标拼接特征中相互独立的现有处理特征和处理后特征进行融合为一个特征的形式,从而基于该融合后特征识别该待识别对象是否为目标对象,能够提高识别准确率。
在本实施例的一个可选实现方式中,将所述目标拼接特征进行融合的步骤,进一步包括以下步骤:
利用融合层模型将所述目标拼接特征进行融合;所述融合层模型包括以线性整流函数作为激活函数的至少一个融合层以及全连接层;其中,所述融合层模型为机器学习模型。
该可选的实现方式中,可以预先训练一融合层模型,该融合层模型可以包括一个或多个融合层以及一个全连接层,每个融合层可以使用线性整流函数ReLu作为激活函数。融合层用于对输入的目标拼接特征进行融合,而经过融合层处理后的结果可以输入至全连接层,全连接层可以用于对融合层处理后的结果进行降维处理。
在本实施例的一个可选实现方式中,所述融合层模型包括多个所述融合层,所述目标拼接特征经过所述多个融合层后得到的输出结果与所述目标拼接特征进行残差计算,残差结果输入至所述全连接层。
该可选的实现方式中,为了提高模型的识别准确率,可以设置多个融合层,多个融合层可以串联设置,前一融合层的输出作为后一融合层的输入,第一融合层的输入为目标拼接特征,而最后一融合层的输出与目标拼接特征进行残差计算后,残差结果送入全连接层,全连接层主要是为了对输入特征进行降维处理,基于全连接层的输出可以通过Softmax等函数计算出该待识别对象为目标对象的概率。本实施例中融合层模型的设计简单高效,能够在现有处理特征与处理后特征之间、多个现有处理特征之间和/或多个处理后特征之间进行有效融合,最终能够提升模型的识别准确率。此外,本实施例中还使用了残差结构,通过融合层和残差结构能够促进各个特征之间的融合。
图2示出根据本公开一实施方式中融合层模型的模型结构示意图。如图2所示,融合层模型包括2个融合层ReLu和一个全连接层,第一融合层接收目标拼接特征,利用线性整流函数对其处理后输出第一融合结果,第一融合结果进入第二融合层之后,第二融合层利用线性整流函数对其做进一步处理后输出第二融合结果,该第二融合结果与目标拼接特征进行残差计算后,残差结果输入至全连接层,得到降维后的输出结果,基于该输出结果可以得到待识别对象是否为目标对象的识别结果。需要说明的是,线性整流函数对输入的向量做如下计算:将小于0的向量元素置为0,而大于0的向量元素被置为该向量元素值的某一函数值。
在本实施例的一个可选实现方式中,所述原始特征为多模态特征;步骤S102,即在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征的步骤,进一步包括以下步骤:
利用不同模态特征对应的不同预设处理方式对所述原始特征中不同模态的特征进行处理,得到不同模态特征对应的处理后特征。
该可选的实现方式中,现有处理特征可以是通过对多模态原始特征进行过处理的特征,也即该现有处理特征对应的原始特征可以为多模态特征,而原始特征也可以是多模态特征,例如可以是文本特征、图像特征、语音特征、行为特征中的一种或多种的组合。
为此,本公开实施例可以针对不同模态的原始特征设置不同的预设处理方式,进而利用不同的预设处理方式对原始特征中不同模态的特征进行处理,最终得到处理后特征。该处理后特征经过特征预处理,比如该处理后特征不是连续型向量特征的情况下,可以将该处理后特征预处理成连续连续型向量特征,进而再与其他特征拼接形成目标拼接特征,目标拼接特征经过融合层模型的融合,进而基于融合结果即可判断该待识别对象是否为目标对象。
在本实施例的一个可选实现方式中,所述现有处理特征包括不同模态特征对应的现有处理特征;步骤S103,即将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征的步骤,进一步包括以下步骤:
将所述现有处理特征中不同模态特征对应的现有处理特征进行拼接,得到第一拼接特征;
将所述处理后特征中不同模态特征对应的处理后特征进行拼接,得到第二拼接特征;
将所述第一拼接特征和所述第二拼接特征进行拼接后得到目标拼接特征。
该可选的实现方式中,已有技术中通常对于不同模态的特征进行单独处理,因此,现有处理特征也可以是通过对不同模态的特征采用已有方式处理得到的独立特征。本公开实施例中,针对这一情况可以将现有处理特征中不同模态特征对应的现有处理特征进行拼接得到第一拼接特征。
原始特征中不同模态的特征可以采用不同的预设处理方式进行处理,不同模态的特征对应的处理后特征也是相互独立的,因此在特征预处理过程中,可以将相互独立的不同模态特征对应的处理后特征进行拼接得到第二拼接特征。
第一拼接特征和第二拼接特征可以进一步进行拼接得到目标拼接特征。该目标拼接特征进一步送入融合层模型进行融合。通过本公开实施例中的上述模型设计,不但可以兼容现有处理特征和未经过处理的原始特征,并且通过对多模态特征中的不同模态特征进行单独的处理,进而再将相互独立的现有处理特征和处理后特征进行拼接,还能够具有较强的扩展性,同时通过依靠多模态特征能够提升模型的识别准确率。
图3示出根据本公开一实施方式的假货识别方法的流程图。如图3所示,该假货识别方法包括以下步骤:
在步骤S301中,接收商品的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
在步骤S302中,在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
在步骤S303中,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
在步骤S304中,基于所述目标拼接特征输出所述商品是否为假货商品的识别结果。
本实施例中,该假货识别方法适于在客户端或者服务器端执行。商品可以是任意商品,比如由商家在线上平台为用户所提供的产品、服务等商品。待识别特征可以是商品的任意特征,比如用于描述该商品的文字特征、图像特征、商家的历史行为特征等。
线上平台在日趋完善的过程中,也会搭建基于图像和文字等识别模块,并且线上平台还会逐步收集商家的行为数据,包括历史处罚的信息、注册信息、登录信息等。在上述数据的基础上,可以通过本公开实施例将各种特征数据组合一起对商品的真伪进行识别。
在一些实施例中,为了识别出商品是否为假货商品,需要多渠道收集商品的待识别特征。在一些实施例中,多渠道收集到的待识别特征可以包括但不限于以下两类:一类是经过已有的处理模块处理后的现有处理特征,例如经过已有的模型进行编码处理后得到的现有处理特征,而另一类是未经过处理的原始特征,例如直接从线上平台收集到的关于该商品的文字特征、图像特征以及发布该商品的商家的历史行为特征等。
本公开实施例为了能够兼容从各个渠道收集到的待识别特征,在获取商品的待识别特征之后,确定该待识别特征中是否包括原始特征,如果包括原始特征,则针对该原始特征利用预设处理方式对该原始特征进行处理,得到对应的处理后特征。也就是说,为了识别商品是否为假货商品,可以收集多种待识别特征,该多种待识别特征中可以包括但不限于现有处理特征和未经过处理的原始特征。在一些实施例中,该原始特征可以是商家提供的最原始的多模态特征,例如该原始特征可以是对应于文本模态、图像模态、语音模态、行为模态等的特征,如该商品详情页面上的文字、图像、直播间的语音及图像、用户的评价信息等。而需要说明的是,现有处理特征也可以是利用已有的处理方式对多模态特征处理而得到的特征,也即现有处理特征是线上平台通过对商家的行为特征、商品的多模态特征进行过处理的特征,收集到的已经是处理过的特征,而非原始特征。
在一些实施例中,该预设处理方式可以基于原始特征的不同而采用不同的处理方式,比如针对文本特征可以采用文本编码器,将文本中的语义表述采用向量进行表示,也即将文本中的语义转换成向量表示,使得在文本中语义相关的字、词的向量表示较为接近。而针对图像特征可以采用图像编码器,将图像转换成向量表示。预设处理方式可以基于实际需要而设定,在此不做具体限制。
本公开实施例,在将待识别特征中的原始特征按照预设处理方式转换成处理后特征之后,由于待识别特征中包括的现有处理特征以及原始特征转换得到的处理后特征均为经过处理的特征,因此可以将现有处理特征和处理后特征进行拼接,得到目标拼接特征。需要说明的是,该现有处理特征和处理后特征可以是能够被机器识别的数字表示特征。例如现有处理特征和处理后特征均可以是连续型向量特征。还需要说明的是,如果现有处理特征或者处理后特征不为能够被机器识别的数字表示特征时,还可以通过设定的转换方式将其转换成数字表示特征,如连续型向量特征。当然,可以理解的是,对于原始特征由于采用的是本公开实施例中公开的预设处理方式,因此可以预先考虑直接采用预设处理方式将原始特征转换成数字表示特征。需要说明的是,现有处理特征和处理后特征不限于上述连续型向量特征,也可以是其他类型的特征,只要是能够被机器所识别的数字型特征,并且进行拼接后可作为整体能够被机器识别即可。
在一些实施例中,现有处理特征和处理后特征进行拼接可以理解为将现有处理特征和处理后特征进行首尾连接,比如现有处理特征为n位向量{x0,x1,……,xn-1},而处理后特征为m位向量{y0,y1,……,ym-1},拼接后得到的目标拼接特征可以为n+m位向量{x0,x1,……,xn-1,y0,y1,……,ym-1}。当然可以理解的是,目标拼接特征中现有处理特征和处理后特征的前后顺序可以互换,并且现有处理特征为多个独立特征,例如多个向量特征,和/或处理后特征为多个独立特征时,也可以按照上述方式进行拼接,并且各个独立特征的拼接顺序可以不限。
在一些实施例中,该目标拼接特征可以被用于识别该商品是否为假货商品。在一些实施例中,可以通过预训练的对象识别模型,基于该目标拼接特征进行识别。该预训练的对象识别模型可以基于所要识别的假货商品预先训练,并且训练过程中可以收集样本商品的待识别特征以及样本商品的标签,并利用待识别特征以及标签对该模型进行训练。需要说明的是,待识别特征可以是类似于上文中提到的现有处理特征和原始特征,原始特征经过上文中的方式得到处理后特征后,与现有处理特征进行拼接得到目标拼接特征;标签可以是样本商品是否为假货商品的正确结果。
本实施例中,在假货商品的识别过程中,可以获取商品的待识别特征,待识别特征可以包括现有处理特征和原始特征。在该待识别特征中包括原始特征时,可以利用预设处理方式对原始特征进行处理,进而将处理后特征与现有处理特征进行拼接,得到的目标拼接特征用于获得该商品是否为假货商品的识别结果。通过上述方式,可以兼容已有的现有处理特征和未经过处理的原始特征,两种特征均可以为本公开实施例中的输入特征,同样达到了使用多模态特征识别假货商品的目的,从而避免了已有技术中使用多模态特征训练模型所要付出的高成本,在保证假货商品识别准确率不降低的情况下,降低了成本。
在本实施例的一个可选实现方式中,所述现有处理特征和/或所述处理后特征包括品牌类别型特征,步骤S303,即将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征的步骤之前,所述方法进一步还包括以下步骤:
为每一商品品牌设置初始化向量;
将所述品牌类别型特征对应的特征值按照预设区间进行归一化;
将归一化后的值作为权重值,对所述初始化向量进行加权得到所述品牌类别特征对应的预处理特征。
该可选的实现方式中,例如,可以将现有处理特征和处理后特征统一成连续型向量特征。在一些实施例中,现有处理特征和/或处理后特征可以表现为两种形式:连续型向量特征和品牌类别型特征。连续型向量特征体现为特征本身已经被转化为一个向量的形式,该向量可以被计算机所识别。在需要的情况下,可以对该连续型向量特征进行数值归一化,归一化的目的是为了减少后续的计算量。而品牌类别型特征则表现为不同商品类别所对应的不同特征,在商品类别较多时,如果不同商品类别使用0-1向量表示,则该品牌类别型特征的向量维度会较大,容易引发维度灾难。因此,对于品牌类别型特征可以通过低维向量的方式来表征。
为此,本公开实施例可以对现有处理特征和处理后特征进行特征预处理。在特征预处理过程中,电商场景的特点,可以针对商品的品牌类别提出一种多品牌向量表征的方式。下面举例说明:
假如某个商品对应商家的历史侵权特征如下:
{
"品牌1":1000,
"品牌2":100,
"品牌3":8,
"品牌4":500
}
上述数据表明该商家在历史上分别侵权品牌1、品牌2、品牌3、品牌3的次数为1000、100、8和500次。假如,本实施例中线上平台防控的品牌除了上述这4个以外,还有196个,总计200个。如果用0-1向量表征该历史侵权特征的话,可以表示成如下向量形式:
[1000,100,8,500,0,0,……,0]
向量前面4维分别表示品牌1、品牌2、品牌3、品牌3的侵权次数。但是这种方式显然无法兼容更多的品牌防控列表,比如防控品牌达到数万级别时,向量的维度将是数万级的。
而本公开实施例中,则为每个防控品牌初始化一个x维的向量,针对所有防控品牌可以得到多品牌的向量矩阵。针对某商家的历史侵权特征,可以先对该品牌的侵权次数做分桶归一化。比如次数小于或等于10的特征归一化为1,大于10而小于或等于100的特征归一化为2,大于100而小于或等于1000的特征归一化为3。则上面的历史侵权特征首先可以转化为如下形式:
{
"品牌1":3,
"品牌2":2,
"品牌3":1,
"品牌4":3
}
接着,根据多品牌向量矩阵和不同品牌的权重,可以得到该商家的历史侵权特征的向量表示了。历史侵权特征的向量表示可以用如下计算公式表示:
Figure BDA0003583224600000131
上述涉及4个品牌侵权的商家的历史侵权特征的向量表示为:
V=3*v1+2*v2+1*v3+3*v4
其中,V表示该历史侵权特征对应的向量表示,n为品牌总数量,wi为第i个品牌的权重,vi为归一化后的侵权次数的向量表示。
在本实施例的一个可选实现方式中,步骤S304,即基于所述目标拼接特征获得所述商品是否为假货商品的识别结果的步骤,进一步包括以下步骤:
将所述目标拼接特征进行融合,基于融合后的特征确定所述商品是否为假货商品。
该可选的实现方式中,由于目标拼接特征为多个独立的特征拼接而成,为了提高识别率,可以将多个独立特征进行融合,使得融合后特征中体现各个独立特征之间的相互关联关系。因此,在对该商品识别之前,先将目标拼接特征进行融合,也即将该目标拼接特征中相互独立的现有处理特征和处理后特征进行融合为一个特征的形式,从而基于该融合后特征识别该商品是否为假货商品,能够提高识别准确率。
在本实施例的一个可选实现方式中,将所述目标拼接特征进行融合的步骤,进一步包括以下步骤:
利用融合层模型将所述目标拼接特征进行融合;所述融合层模型包括以线性整流函数作为激活函数的至少一个融合层以及全连接层;其中,所述融合层模型为机器学习模型。
该可选的实现方式中,可以预先训练一融合层模型,该融合层模型可以包括一个或多个融合层以及一个全连接层,每个融合层可以使用线性整流函数ReLu作为激活函数。融合层用于对输入的目标拼接特征进行融合,而经过融合层处理后的结果可以输入至全连接层,全连接层可以用于对融合层处理后的结果进行降维处理。
在本实施例的一个可选实现方式中,所述融合层模型包括多个所述融合层,所述目标拼接特征经过所述多个融合层后得到的输出结果与所述目标拼接特征进行残差计算,残差结果输入至所述全连接层。
该可选的实现方式中,为了提高模型的识别准确率,可以设置多个融合层,多个融合层可以串联设置,前一融合层的输出作为后一融合层的输入,第一融合层的输入为目标拼接特征,而最后一融合层的输出与目标拼接特征进行残差计算后,残差结果送入全连接层,全连接层主要是为了对输入特征进行降维处理,基于全连接层的输出可以通过Softmax等函数计算出该商品为假货商品的概率。本实施例中融合层模型的设计简单高效,能够在现有处理特征与处理后特征之间、多个现有处理特征之间和/或多个处理后特征之间进行有效融合,最终能够提升模型的识别准确率。此外,本实施例中还使用了残差结构,通过融合层和残差结构能够促进各个特征之间的融合。
在本实施例的一个可选实现方式中,所述原始特征为多模态特征;步骤S102,即在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征的步骤,进一步包括以下步骤:
利用不同模态特征对应的不同预设处理方式对所述原始特征中不同模态的特征进行处理,得到不同模态特征对应的处理后特征。
该可选的实现方式中,现有处理特征可以是通过对多模态原始特征进行过处理的特征,也即该现有处理特征对应的原始特征可以为多模态特征,而原始特征也可以是多模态特征,例如可以是文本特征、图像特征、语音特征、行为特征中的一种或多种的组合。
为此,本公开实施例可以针对不同模态的原始特征设置不同的预设处理方式,进而利用不同的预设处理方式对原始特征中不同模态的特征进行处理,最终得到处理后特征。该处理后特征经过特征预处理,比如该处理后特征不是连续型向量特征的情况下,可以将该处理后特征预处理成连续连续型向量特征,进而再与其他特征拼接形成目标拼接特征,目标拼接特征经过融合层模型的融合,进而基于融合结果即可判断该商品是否为假货商品。
在本实施例的一个可选实现方式中,所述现有处理特征包括不同模态特征对应的现有处理特征;步骤S303,即将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征的步骤,进一步包括以下步骤:
将所述现有处理特征中不同模态特征对应的现有处理特征进行拼接,得到第一拼接特征;
将所述处理后特征中不同模态特征对应的处理后特征进行拼接,得到第二拼接特征;
将所述第一拼接特征和所述第二拼接特征进行拼接后得到目标拼接特征。
该可选的实现方式中,已有技术中通常对于不同模态的特征进行单独处理,因此,现有处理特征也可以是通过对不同模态的特征采用已有方式处理得到的独立特征。本公开实施例中,针对这一情况可以将现有处理特征中不同模态特征对应的现有处理特征进行拼接得到第一拼接特征。
原始特征中不同模态的特征可以采用不同的预设处理方式进行处理,不同模态的特征对应的处理后特征也是相互独立的,因此在特征预处理过程中,可以将相互独立的不同模态特征对应的处理后特征进行拼接得到第二拼接特征。
第一拼接特征和第二拼接特征可以进一步进行拼接得到目标拼接特征。该目标拼接特征进一步送入融合层模型进行融合。通过本公开实施例中的上述模型设计,不但可以兼容现有处理特征和未经过处理的原始特征,并且通过对多模态特征中的不同模态特征进行单独的处理,进而再将相互独立的现有处理特征和处理后特征进行拼接,还能够具有较强的扩展性,同时通过依靠多模态特征能够提升模型的识别准确率。
图4示出根据本公开一实施方式的对象识别模型的训练方法的流程图。如图4所示,该对象识别模型的训练方法包括以下步骤:
在步骤S401中,获取样本对象的样本特征以及样本对象是否为目标对象的标签;所述样本特征包括现有处理特征和/或原始特征;
在步骤S402中,在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
在步骤S403中,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
在步骤S404中,基于所述目标拼接特征以及对象识别模型获得所述样本对象是否为目标对象的预测结果;
在步骤S405中,基于所述预测结果以及所述标签对所述对象识别模型进行训练。
本实施例中,该对象识别模型的训练方法适于在服务器上执行。样本对象可以是任意对象,比如由相应提供者在线上平台为用户所提供的产品、服务等对象。样本特征可以是样本对象的任意特征,比如用于描述该样对象的文字特征、图像特征、该样对象的提供者的历史行为特征等。
在一些实施例中,为了训练处能够识别对象是否为目标对象的对象识别模型,可以针对样本对象收集样本特征以及为该样本对象是否为目标对象进行打标。在一些恶实施例中,可能需要多渠道收集样本对象的样本特征。在一些实施例中,多渠道收集到的样本特征可以包括但不限于以下两类:一类是经过已有的处理模块处理后的现有处理特征,例如经过已有的模型进行编码处理后得到的现有处理特征,而另一类是未经过处理的原始特征,例如直接从线上平台收集到的关于该样本对象的文字特征、图像特征以及该样本对象的提供者的历史行为特征等。
本公开实施例为了能够兼容从各个渠道收集到的样本特征,在获取样本对象的样本特征之后,确定该样本特征中是否包括原始特征,如果包括原始特征,则针对该原始特征利用预设处理方式对该原始特征进行处理,得到对应的处理后特征。也就是说,为了识别样本对象是否为目标对象,可以收集多种样本特征,该多种样本特征中可以包括但不限于现有处理特征和未经过处理的原始特征。在一些实施例中,该原始特征可以是多模态特征,例如该原始特征可以是对应于文本模态、图像模态、语音模态、行为模态等的特征。而需要说明的是,现有处理特征也可以是利用已有的处理方式对多模态特征处理而得到的特征。
在一些实施例中,该预设处理方式可以基于原始特征的不同而采用不同的处理方式,比如针对文本特征可以采用文本编码器,将文本中的语义表述采用向量进行表示,也即将文本中的语义转换成向量表示,使得在文本中语义相关的字、词的向量表示较为接近。而针对图像特征可以采用图像编码器,将图像转换成向量表示。预设处理方式可以基于实际需要而设定,在此不做具体限制。
本公开实施例,在将样本特征中的原始特征按照预设处理方式转换成处理后特征之后,由于样本特征中包括的现有处理特征以及原始特征转换得到的处理后特征均为经过处理的特征,因此可以将现有处理特征和处理后特征进行拼接,得到目标拼接特征。需要说明的是,该现有处理特征和处理后特征可以是能够被机器识别的数字表示特征。例如现有处理特征和处理后特征均可以是连续型向量特征。还需要说明的是,如果现有处理特征或者处理后特征不为能够被机器识别的数字表示特征时,还可以通过设定的转换方式将其转换成数字表示特征,如连续型向量特征。当然,可以理解的是,对于原始特征由于采用的是本公开实施例中公开的预设处理方式,因此可以预先考虑直接采用预设处理方式将原始特征转换成数字表示特征。需要说明的是,现有处理特征和处理后特征不限于上述连续型向量特征,也可以是其他类型的特征,只要是能够被机器所识别的数字型特征,并且进行拼接后可作为整体能够被机器识别即可。
在一些实施例中,现有处理特征和处理后特征进行拼接可以理解为将现有处理特征和处理后特征进行首尾连接,比如现有处理特征为n位向量{x0,x1,……,xn-1},而处理后特征为m位向量{y0,y1,……,ym-1},拼接后得到的目标拼接特征可以为n+m位向量{x0,x1,……,xn-1,y0,y1,……,ym-1}。当然可以理解的是,目标拼接特征中现有处理特征和处理后特征的前后顺序可以互换,并且现有处理特征为多个独立特征,例如多个向量特征,和/或处理后特征为多个独立特征时,也可以按照上述方式进行拼接,并且各个独立特征的拼接顺序可以不限。
在一些实施例中,该目标拼接特征可以被对象识别模型用于预测该样本对象是否为目标对象。在一些实施例中,该对象识别模型可以为机器自学习模型,比如神经网络模型。在训练该对象识别模型时,将样本特征进行上述处理后得到目标拼接特征,该目标拼接特征输入至对象识别模型中,得到该样本对象是否为目标对象的预测结果,该预测结果与该样本对象对应的标签进行比较后,可以基于比较结果反向对该对象识别模型的模型参数进行调整,进而达到训练该对象识别模型的目的。
在一些实施例中,该对象识别模型可以实现为如图2所示的融合层模型。
本实施例涉及的具体细节,还可以参见上文中对图像处理方法以及假货识别方法的描述,在此不再赘述。
在本实施例的一个可选实现方式中,所述现有处理特征和/或所述处理后特征包括非连续型向量特征,步骤S403,即将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征的步骤之前,所述方法进一步还包括以下步骤:
将所述现有处理特征和/或所述处理后特征中的非连续型向量特征转换成连续性型向量特征。
该可选的实现方式中,例如,可以将现有处理特征和处理后特征统一成连续型向量特征。在一些实施例中,现有处理特征和/或处理后特征可以表现为两种形式:连续型向量特征和类别型特征。连续型向量特征体现为特征本身已经被转化为一个向量的形式,该向量可以被计算机所识别。在需要的情况下,可以对该连续型向量特征进行数值归一化,归一化的目的是为了减少后续的计算量。而类别型特征则表现为不同类别对应不同的特征,在类别较多时,如果不同类别使用0-1向量表示,则该类别型特征的向量维度会较大,容易引发维度灾难。因此,对于类别型特征可以通过低维向量的方式来表征。
在一些实施例中,可以通过特征向量化模型对该类别型特征进行向量化表示,该特征向量化模型可以与对象识别模型一同进行训练。该特征向量化模型也可以是机器自学习模型,比如神经网络模型。在与对象识别模型一同训练时,可以基于预测结果与标签的比较结果反向对对象识别模型的模型参数和该特征向量化模型的模型参数进行调整。
在本实施例的一个可选实现方式中,步骤S404,即基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果的步骤,进一步包括以下步骤:
将所述目标拼接特征进行融合,基于融合后的特征确定所述待识别对象是否为目标对象。
在本实施例的一个可选实现方式中,将所述目标拼接特征进行融合,包括:
利用融合层模型将所述目标拼接特征进行融合;所述融合层模型包括以线性整流函数作为激活函数的至少一个融合层以及全连接层;其中,所述融合层模型为机器学习模型。
在本实施例的一个可选实现方式中,所述融合层模型包括多个所述融合层,所述目标拼接特征经过所述多个融合层后得到的输出结果与所述目标拼接特征进行残差计算,残差结果输入至所述全连接层。
在本实施例的一个可选实现方式中,其中,所述原始特征为多模态特征;在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征,包括:
利用不同模态特征对应的不同预设处理方式对所述原始特征中不同模态的特征进行处理,得到不同模态特征对应的处理后特征。
在本实施例的一个可选实现方式中,所述现有处理特征包括不同模态特征对应的现有处理特征;将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征,包括:
将所述现有处理特征中不同模态特征对应的现有处理特征进行拼接,得到第一拼接特征;
将所述处理后特征中不同模态特征对应的处理后特征进行拼接,得到第二拼接特征;
将所述第一拼接特征和所述第二拼接特征进行拼接后得到目标拼接特征。
上述实施例中的技术特征和/或技术术语与上文中图像处理方法以及假货识别方法中的技术特征和/或技术术语的描述一致,具体细节可以参见上文中对图像处理方法以及假货识别方法的描述,在此不再赘述。
图5示出根据本公开一实施方式中对象识别过程在假货商品的识别场景下的一种应用示意图。如图5所示,假货商品识别流程包括四个环节:特征生成环节、特征预处理环节、特征拼接环节以及特征融合环节。特征生产环节中示出了n个模块,每个模块可以输出不同模态的特征,例如文本特征、图像特征、行为特征等。需要说明的是,该多个模块生产出的特征可以是处理过的特征,也可以是未处理过的原始特征,对于处理过的特征可以直接进入下一环节,也即特征预处理环节,而原始特征则可以利用设定的特征编码器进行编码后,得到的编码特征进入下一环节。需要说明的是,该编码特征可以是连续型向量特征。
由于进入特征预处理环节的特征包括直接收集到的现有处理特征,现有处理特征由于是其他已有的特征生成模块给出的,其可能不是连续型向量特征,而是类别型向量特征,比如对应于不同商品品牌类别的特征。此时,可以对该类别型向量特征进行嵌入式向量(Embedding)的转换,将其转换成连续型向量特征。
考虑到已有的连续型向量特征和转换后的连续型向量特征可能分布比较离散,因此可以通过数值归一化的方式将其进行归一化,使得归一化后的向量特征分布较为集中。
归一化后的特征可以进行拼接,也即将多个特征拼接成一个特征。如图5所示,圆形表示一个4维特征向量表示,三角形表示一个6维特征向量表示,五边形表示一个3维特征向量表示,该三个特征向量表示拼接后形成包括圆形、三角形和五边形的13维特征向量表示。
拼接特征进入特征融合环节,由如图2所示的融合层模型进行融合后,基于融合结果识别对象是否为目标对象。
下表一示出使用本公开实施例中的方法和已有技术中使用单一文本模型对商品品牌进行假货识别的对比结果。在使用本公开实施的方法时,除了使用单一文本模型能够使用的文本特征外,还使用了其他已有功能模块产出特征,包括图像特征等。另外,本公开实施例中还把商家的行为特征也加入到输入特征中。最终结果显示,在6个子品牌的准确率、召回率上,本公开实施例的方法相较于现有技术均有明显的提升。
表一
Figure BDA0003583224600000191
下述为本公开装置实施例,可以用于执行本公开方法实施例。
根据本公开一实施方式的图像处理装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该图像处理装置包括:
第一获取模块,被配置为获取待识别对象的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
第一处理模块,被配置为在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
第一拼接模块,被配置为将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
第二获取模块,被配置为基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果。
在本实施例的一个可选实现方式中,所述现有处理特征和/或所述处理后特征包括非连续型向量特征,所述第一拼接模块之前,所述装置还包括:
第一转换子模块,被配置为将所述现有处理特征和/或所述处理后特征中的非连续型向量特征转换成连续性型向量特征。
在本实施例的一个可选实现方式中,所述第二获取模块,包括:
第一融合子模块,被配置为将所述目标拼接特征进行融合,基于融合后的特征确定所述待识别对象是否为目标对象。
在本实施例的一个可选实现方式中,所述第一融合子模块,包括:
第二融合子模块,被配置为利用融合层模型将所述目标拼接特征进行融合;所述融合层模型包括以线性整流函数作为激活函数的至少一个融合层以及全连接层;其中,所述融合层模型为机器学习模型。
在本实施例的一个可选实现方式中,所述融合层模型包括多个所述融合层,所述目标拼接特征经过所述多个融合层后得到的输出结果与所述目标拼接特征进行残差计算,残差结果输入至所述全连接层。
在本实施例的一个可选实现方式中,所述原始特征为多模态特征;所述第一处理模块,包括:
第一处理子模块,被配置为利用不同模态特征对应的不同预设处理方式对所述原始特征中不同模态的特征进行处理,得到不同模态特征对应的处理后特征。
在本实施例的一个可选实现方式中,所述现有处理特征包括不同模态特征对应的现有处理特征;所述第一拼接模块,包括:
第一拼接子模块,被配置为将所述现有处理特征中不同模态特征对应的现有处理特征进行拼接,得到第一拼接特征;
第二拼接子模块,被配置为将所述处理后特征中不同模态特征对应的处理后特征进行拼接,得到第二拼接特征;
第三拼接子模块,被配置为将所述第一拼接特征和所述第二拼接特征进行拼接后得到目标拼接特征。
本实施例中的图像处理装置与上述图像处理方法对应一致,具体细节可以参见上文中对图像处理方法的描述,在此不再赘述。
根据本公开一实施方式的假货识别装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该假货识别装置包括:
接收模块,被配置为接收商品的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
第二处理模块,被配置为在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
第二拼接模块,被配置为将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
输出模块,被配置为基于所述目标拼接特征输出所述商品是否为假货商品的识别结果。
在本实施例的一个可选实现方式中,所述现有处理特征和/或所述处理后特征包括品牌类别型特征,所述第二拼接模块之前,所述装置还包括:
设置子模块,被配置为为每一商品品牌设置初始化向量;
归一化子模块,被配置为将所述品牌类别型特征对应的特征值按照预设区间进行归一化;
加权子模块,被配置为将归一化后的值作为权重值,对所述初始化向量进行加权得到所述品牌类别特征对应的预处理特征。
本实施例中的假货识别装置与上述假货识别方法对应一致,具体细节可以参见上文中对假货识别方法的描述,在此不再赘述。
根据本公开一实施方式的对象识别模型的训练装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该对象识别模型的训练装置包括:
第三获取模块,被配置为获取样本对象的样本特征以及样本对象是否为目标对象的标签;所述样本特征包括现有处理特征和/或原始特征;
第三处理模块,被配置为在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
第三拼接模块,被配置为将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
第四获取模块,被配置为基于所述目标拼接特征以及对象识别模型获得所述样本对象是否为目标对象的预测结果;
训练模块,被配置为基于所述预测结果以及所述标签对所述对象识别模型进行训练。
本实施例中的对象识别模型的训练装置与上述对象识别模型的训练方法对应一致,具体细节可以参见上文中对对象识别模型的训练方法的描述,在此不再赘述。
图6是适于用来实现根据本公开一实施方式的图像处理方法、假货识别方法和/或对象识别模型的训练方法的电子设备的结构示意图。
如图6所示,电子设备600包括处理单元601,其可实现为CPU、GPU、FPGA、NPU等处理单元。处理单元601可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行本公开上述任一方法的实施方式中的各种处理。在RAM603中,还存储有电子设备600操作所需的各种程序和数据。处理单元601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施方式,上文参考本公开实施方式中的任一方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行本公开实施方式中任一方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (11)

1.一种图像处理方法,其中,包括:
获取待识别对象的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果。
2.根据权利要求1所述的方法,其中,所述现有处理特征和/或所述处理后特征包括非连续型向量特征,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征之前,所述方法还包括:
将所述现有处理特征和/或所述处理后特征中的非连续型向量特征转换成连续性型向量特征。
3.根据权利要求1或2所述的方法,其中,基于所述目标拼接特征获得所述待识别对象是否为目标对象的识别结果,包括:
将所述目标拼接特征进行融合,基于融合后的特征确定所述待识别对象是否为目标对象。
4.根据权利要求3所述的方法,其中,将所述目标拼接特征进行融合,包括:
利用融合层模型将所述目标拼接特征进行融合;所述融合层模型包括以线性整流函数作为激活函数的至少一个融合层以及全连接层;其中,所述融合层模型为机器学习模型。
5.根据权利要求4所述的方法,其中,所述融合层模型包括多个所述融合层,所述目标拼接特征经过所述多个融合层后得到的输出结果与所述目标拼接特征进行残差计算,残差结果输入至所述全连接层。
6.根据权利要求1-2、4-5任一项所述的方法,其中,所述原始特征为多模态特征;在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征,包括:
利用不同模态特征对应的不同预设处理方式对所述原始特征中不同模态的特征进行处理,得到不同模态特征对应的处理后特征。
7.根据权利要求6所述的方法,其中,所述现有处理特征包括不同模态特征对应的现有处理特征;将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征,包括:
将所述现有处理特征中不同模态特征对应的现有处理特征进行拼接,得到第一拼接特征;
将所述处理后特征中不同模态特征对应的处理后特征进行拼接,得到第二拼接特征;
将所述第一拼接特征和所述第二拼接特征进行拼接后得到目标拼接特征。
8.一种假货识别方法,其中,包括:
接收商品的待识别特征;所述待识别特征包括现有处理特征和/或原始特征;
在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
基于所述目标拼接特征输出所述商品是否为假货商品的识别结果。
9.根据权利要求8所述的方法,其中,所述现有处理特征和/或所述处理后特征包括品牌类别型特征,将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征之前,所述方法还包括:
为每一商品品牌设置初始化向量;
将所述品牌类别型特征对应的特征值按照预设区间进行归一化;
将归一化后的值作为权重值,对所述初始化向量进行加权得到所述品牌类别特征对应的预处理特征。
10.一种对象识别模型的训练方法,其中,包括:
获取样本对象的样本特征以及样本对象是否为目标对象的标签;所述样本特征包括现有处理特征和/或原始特征;
在所述待识别特征中包括原始特征时,利用预设处理方式对所述原始特征进行处理得到对应的处理后特征;
将所述现有处理特征和所述处理后特征进行拼接得到目标拼接特征;
基于所述目标拼接特征以及对象识别模型获得所述样本对象是否为目标对象的预测结果;
基于所述预测结果以及所述标签对所述对象识别模型进行训练。
11.一种电子设备,其中,包括存储器、处理器以及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现权利要求1-10任一项所述的方法。
CN202210359450.4A 2022-04-06 2022-04-06 图像处理方法、假货识别方法及电子设备 Active CN114863230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210359450.4A CN114863230B (zh) 2022-04-06 2022-04-06 图像处理方法、假货识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210359450.4A CN114863230B (zh) 2022-04-06 2022-04-06 图像处理方法、假货识别方法及电子设备

Publications (2)

Publication Number Publication Date
CN114863230A true CN114863230A (zh) 2022-08-05
CN114863230B CN114863230B (zh) 2024-05-28

Family

ID=82629101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210359450.4A Active CN114863230B (zh) 2022-04-06 2022-04-06 图像处理方法、假货识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN114863230B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018041260A (ja) * 2016-09-07 2018-03-15 東芝テック株式会社 情報処理装置およびプログラム
CN112073551A (zh) * 2020-08-26 2020-12-11 重庆理工大学 基于字符级滑动窗口和深度残差网络的dga域名检测系统
US20210201481A1 (en) * 2019-12-25 2021-07-01 Alibaba Group Holding Limited Data processing method, equipment and storage medium
CN113989476A (zh) * 2021-09-23 2022-01-28 阿里巴巴(中国)有限公司 对象识别方法及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018041260A (ja) * 2016-09-07 2018-03-15 東芝テック株式会社 情報処理装置およびプログラム
US20210201481A1 (en) * 2019-12-25 2021-07-01 Alibaba Group Holding Limited Data processing method, equipment and storage medium
CN112073551A (zh) * 2020-08-26 2020-12-11 重庆理工大学 基于字符级滑动窗口和深度残差网络的dga域名检测系统
CN113989476A (zh) * 2021-09-23 2022-01-28 阿里巴巴(中国)有限公司 对象识别方法及电子设备

Also Published As

Publication number Publication date
CN114863230B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN113256007B (zh) 一种面向多模态的新产品销量预测方法及装置
CN111522916A (zh) 一种语音服务质量检测方法、模型训练方法及装置
CN110414335A (zh) 视频识别方法、装置及计算机可读存储介质
CN113627233A (zh) 基于视觉语义信息的人脸伪造检测方法和装置
CN114429566A (zh) 一种图像语义理解方法、装置、设备及存储介质
CN116861258A (zh) 模型处理方法、装置、设备及存储介质
CN113743522A (zh) 违规行为的检测方法及装置、电子设备
CN117392379A (zh) 目标检测的方法和装置
CN114863230B (zh) 图像处理方法、假货识别方法及电子设备
CN114332993A (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN113807858B (zh) 一种基于决策树模型的数据处理方法及相关设备
CN112668857A (zh) 分阶段质检的数据分类方法、装置、设备及存储介质
CN114529791B (zh) 目标检测方法及相关装置、电子设备、存储介质
CN109145938A (zh) 一种使用分类器进行分类的方法和装置
CN116777014A (zh) 基于标签保护的联邦学习模型训练方法、设备及存储介质
CN116630712A (zh) 基于模态组合的信息分类方法、装置、电子设备及介质
CN118035800A (zh) 模型训练方法、装置、设备及存储介质
CN113065573B (zh) 用户分类方法、用户分类装置及电子设备
CN117034133A (zh) 一种数据处理方法、装置、设备和介质
CN116932878A (zh) 内容推荐方法、装置、电子设备、存储介质和程序产品
CN114219084A (zh) 基于多源异构特征的无监督表示学习方法及装置
CN116071835B (zh) 人脸识别攻击事后筛查的方法、装置和电子设备
CN117370882A (zh) 图像分类模型的训练方法、装置、设备、介质和程序产品
CN117421631A (zh) 基于多模态融合的金融违规检测方法、装置、设备及介质
CN115907781A (zh) 虚假图像判定方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant