CN115936737B

CN115936737B - 一种确定建材真伪的方法和系统

Info

Publication number: CN115936737B
Application number: CN202310229204.1A
Authority: CN
Inventors: 张勇
Original assignee: Yunzhu Information Technology Chengdu Co ltd
Current assignee: Yunzhu Information Technology Chengdu Co ltd
Priority date: 2023-03-10
Filing date: 2023-03-10
Publication date: 2023-06-23
Anticipated expiration: 2043-03-10
Also published as: CN115936737A

Abstract

本发明提供了一种确定建材真伪的方法和系统，包括：上传产品图片；将产品图片输入图文审核模型，模型确定产品图片是否符合要求；基于产品的产品信息，获取产品知识图谱；产品信息为商家给出的有关产品的信息；获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片；将产品知识图谱和产品图片输入真伪识别模型，模型输出产品的真伪；包括：基于产品知识图谱，获取产品的文本特征；基于产品图片，获取产品的图片特征；基于互注意力机制，确定文本特征和图片特征的匹配概率；基于匹配概率，确定产品的真伪，通过采用产品信息和产品微观特征的图像识别方法来鉴别产品真伪，可以防止产品被调包。

Description

一种确定建材真伪的方法和系统

技术领域

本发明涉及真伪识别技术领域，具体而言，涉及一种确定建材真伪的方法和系统。

背景技术

建筑材料使用广泛，市场上充斥着各种各样不同价位，质量的建材。好的厂家生产的建材总是容易遭到一些不法商家的模仿和盗版。同时，产品在运输过程中也容易被调包。不良商家或者个人使用劣质的材料来替换好的材料，这样不仅对生产厂家的名义和经济造成不可挽回的损失，也会直接伤害消费者的利益。为了防止产品被调包或者仿造，研究者们使用WSN（无线传感器网络）、RFID（无线射频识别）等技术来跟踪、检测、识别产品的真伪。但这些技术也会被不良商家拿来应用。另外，由于商家和客户均需要提供产品的图文信息，因此对图文信息的审核也至关重要。图文信息的审核主要是检查图片是否涉黄涉暴、是否是广告图、明星图及水印图等。产品文字审核也是检查文字是否涉及敏感词汇，是否涉黄涉暴。这些海量的图片和文字如果是由人工来进行检查和审核，将是一项非常费时费力的工作。因此，在鉴别真伪之前，我们需要使用一个图文审核模型来过滤不良信息，这样才能进行下一步的鉴别工作。

有鉴于此，本申请提出了一种确定建材真伪的方法和系统，基于产品信息和产品微观特征的图像识别来鉴别产品真伪，防止产品被调包。

发明内容

本发明的目的在于提供一种确定建材真伪的方法，包括：上传产品图片；所述产品图片包括商品图片和产品信息；所述商品图片包括产品的主图、总体展示图和细节展示图；所述产品信息包括产品名称、推广标题、产品属性和使用场景；将所述产品图片输入图文审核模型，模型确定所述产品图片是否符合要求；若是，基于产品的产品信息，获取产品知识图谱；所述产品信息为商家给出的有关产品的信息；获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片；将所述产品知识图谱和所述产品图片输入真伪识别模型，模型输出产品的真伪；包括：基于所述产品知识图谱，获取所述产品的文本特征；基于所述产品图片，获取所述产品的图片特征；基于互注意力机制，确定所述文本特征和所述图片特征的匹配概率；基于所述匹配概率，确定所述产品的真伪。

进一步的，所述基于所述产品知识图谱，获取所述产品的文本特征，包括：基于TransH模型，得到所述产品知识图谱的实体表示矩阵和关系表示矩阵；提取所述产品知识图谱中的三元组，得到多个产品三元组；对于每个所述产品三元组：从所述实体表示矩阵和所述关系表示矩阵中获取该产品三元组的头实体向量、关系向量和尾实体向量；将所述头实体向量、所述关系向量和所述尾实体向量进行拼接，得到产品三元组向量；将多个所述产品三元组向量进行拼接，得到向量序列；将所述向量序列输入LSTM模型，模型输出每个所述产品三元组的文本特征。

进一步的，所述基于TransH模型，得到所述产品知识图谱的实体表示矩阵和关系表示矩阵，包括：将所述知识图谱中三元组的头实体向量和尾实体向量投影到关系所对应的超平面，得到投影后的头实体向量和投影后的尾实体向量；其中，得到所述投影后的头实体向量和所述投影后的尾实体向量的表达式为：

其中，

表示所述投影后的头实体向量，/>

表示头实体向量，/>

表示转置向量，

表示关系/>

所对应的超平面的法向量，/>

表示所述投影后的尾实体向量，/>

表示尾实体向量。

基于评分函数，训练所述TransH模型，得到实体和关系的表示向量；所述评分函数用于表征三元组的头实体和尾实体的相关程度；其中，所述评分函数的表达式为：

其中，

表示评分，/>

表示L2范数。

基于所述知识图谱中多个三元组的实体和关系的表示向量，得到所述实体表示矩阵和所述关系表示矩阵。

进一步的，将所述向量序列输入双向LSTM模型，模型输出每个所述产品三元组的文本特征，包括：获取当前时间步的隐状态，当前时间步的隐状态

分别受到前一时间步和后一时间步的影响，最终表示如下：

其中，

表示该三元组向量在上一时间步的隐状态下的隐状态，/>

表示第/>

个三元组向量，/>

表示上一时间步的隐状态，/>

表示该三元组向量在下一时间步的隐状态下的隐状态，/>

表示下一时间步的隐状态，/>

表示长短时记忆网络；

将所述上一时间步的隐状态和所述下一时间步的隐状态进行组合，得到实体和关系的隐状态；其中，得到所述实体和关系的隐状态的表达式为：

其中，

表示该三元组向量的实体和关系的隐状态；

将多个所述实体和关系的隐状态进行组合，得到所述文本特征；其中，得到所述文本特征的表达式为:

其中，

表示文本特征，/>

表示第一个三元组向量的实体和关系的隐状态，/>

表示第二个三元组向量的实体和关系的隐状态，/>

表示第n个三元组向量的实体和关系的隐状态，n为三元组向量的个数。

进一步的，所述基于所述产品图片，获取图片特征为：将所述产品图片输入卷积神经网络，所述卷积神经网络输出所述图片特征。

进一步的，所述基于互注意力机制，确定所述文本特征和所述图片特征的匹配概率，包括：将所述文本特征和所述图片特征投射到同一向量空间，得到匹配矩阵；基于所述匹配矩阵、所述文本特征和所述图片特征，得到实体及关系信息注意力映射和图片注意力映射；基于所述实体及关系信息注意力映射和所述图片注意力映射，得到所述产品图片的各个区域的注意力概率和实体及关系的注意力概率；基于所述各个区域的注意力概率和所述实体及关系的注意力概率，得到图片注意力向量和文本注意力向量；计算所述图片注意力向量和所述文本注意力向量的匹配值；基于所述匹配值，确定所述匹配概率。

进一步的，所述得到匹配矩阵的表达式为：

其中，

表示匹配矩阵，/>

表示文本特征，/>

表示权重矩阵，/>

表示图片特征，

表示转置向量，/>

表示激活函数；

所述得到所述实体及关系信息注意力映射和所述图片注意力映射的表达式为：

其中，

表示实体及关系信息注意力映射，/>

和/>

表示两个不同的权重矩阵，/>

表示图片注意力映射；

所述得到所述产品图片的各个区域的注意力概率和实体及关系的注意力概率的表达式为：

其中，

表示图片中各个区域的注意力概率，/>

和/>

表示两个不同的权重矩阵，/>

表示实体及关系的注意力概率，/>

表示激活函数；

所述得到图片注意力向量和文本注意力向量的表达式为：

其中，

表示图片注意力向量，/>

表示变量，/>

表示图片中区域的总数，/>

表示图片中第/>

个区域的注意力概率，/>

表示图片中第/>

个区域的注意力向量，/>

表示文本注意力向量，/>

表示变量，/>

表示三元组向量的总数，/>

表示第/>

个三元组向量的实体及关系的注意力概率，/>

表示第/>

个三元组向量的实体和关系的隐状态；

所述计算所述图片注意力向量和所述文本注意力向量的匹配值的表达式为：

其中，

表示匹配值，/>

表示激活函数，/>

表示权重矩阵；

所述确定所述匹配概率的表达式为：

其中，

表示匹配概率，/>

表示/>

函数，/>

表示权重矩阵。

进一步的，所述真伪识别模型的优化函数的表达式为：

其中，

表示损失函数，/>

表示所述产品信息与商品图片的匹配概率，/>

表示对数函数，/>

表示真实的标签。

进一步的，所述基于所述匹配概率，确定所述产品的真伪为：当所述匹配概率大于概率阈值时，确认所述产品为真，否则为假。

本发明的目的在于提供一种确定建材真伪的系统，包括上传模块、审核模块、知识图谱获取模块、产品图片获取模块和真伪鉴别模块；所述上传模块用于上传产品图片；所述产品图片包括商品图片和产品信息；所述商品图片包括产品的主图、总体展示图和细节展示图；所述产品信息包括产品名称、推广标题、产品属性和使用场景；所述审核模块用于将所述产品图片输入图文审核模型，模型确定所述产品图片是否符合要求；所述知识图谱获取模块用于当所述产品图片符合要求时，基于产品的产品信息，获取产品知识图谱；所述产品信息为商家给出的有关产品的信息；所述产品图片获取模块用于获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片所述真伪鉴别模块用于将所述产品知识图谱和所述产品图片输入真伪识别模型，模型输出产品的真伪；所述真伪鉴别模块包括文本特征获取单元、图片特征获取单元、匹配概率确定单元和真伪输出单元；所述文本特征获取单元用于基于所述产品知识图谱，获取所述产品的文本特征；所述图片特征获取单元用于基于所述产品图片，获取所述产品的图片特征；所述匹配概率确定单元用于基于互注意力机制，确定所述文本特征和所述图片特征的匹配概率；所述真伪输出单元用于基于所述匹配概率，确定所述产品的真伪，并将结果输出。

本发明实施例的技术方案至少具有如下优点和有益效果：

本说明书中的一些实施例，采用基于产品信息和产品微观特征的图像识别方法来鉴别产品真伪，可以防止产品被调包。

本说明书中的一些实施例，为了更好地提取文本特征和图片特征，模型采用了知识图谱以及互注意力机制，当生成文本特征时，文本特征注意力机制会引导图片特征的生成，使图片特征的生成更符合文本的描述；当生成图片特征时，图片特征也会引导文本特征的生成，使得文本特征的生成更符合图片特征。通过该机制后再计算文本特征和图片特征的匹配概率，将会大大增加模型的表现力。

附图说明

图1为本发明一些实施例提供的一种确定建材真伪的方法的示例性流程图；

图2为本发明一些实施例提供的一种确定建材真伪的系统的示例性示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

图1为本发明一些实施例提供的一种确定建材真伪的方法的示例性流程图。在一些实施例中，流程100可以由系统200执行。如图1所示，流程100可以包括以下内容：

步骤110，上传产品图片,产品图片商品图片和产品信息；所述商品图片包括产品的主图、总体展示图和细节展示图；产品信息包括产品名称、推广标题、产品属性和使用场景。

在一些实施例中，产品图片和产品信息可以分开上传平台。例如，供应商上新时需要为商品填写图文两种信息图片：包括：商品主图、总体展示图、细节展示图三类，每类图最多上传9张，主图至少三张，总体展示图和细节展示图每类至少一张文字：包括：商品名称、推广标题、产品属性、使用场景。

步骤120，产品图片输入图文审核模型，模型确定产品图片是否符合要求。

产品图片符合要求是指图片与文字说明中未涉及敏感词汇、图片内容符合文字描述且图片中所展示的产品与文字描述中的产品的SSKU信息和品牌相匹配。例如，图片所示产品为板凳，文字描述的产品为桌子，则可以认为产品图片不符合要求。又例如，文字描述中的SSKU信息为品牌A，而图中所示为品牌B，则可以认为产品不符合要求。

在一些实施例中，图文审核模型可以为Resnet50，通过Resnet50审核过滤后的文字和图片才可以进行下一步使用。

假设原始文字和图片信息为

,输入Resnet50中输出为

最后的输出经过sigmoid激活函数，可以得到最终的过滤值

,表示过滤后的规范的文字和图片概率，这里的/>

表示Resnet模型。所述图文审核模型可以通过训练初始图文审核模型得到，初始图文审核模型选用Resent50模型，训练样本包括训练产品图片和标签，标签用于表示训练产品图片中是否包含敏感词汇、图示产品与文字描述的SSKU、规格型号、SKU名称和品牌是否一致等。

步骤130，若是，基于产品的产品信息，获取产品知识图谱；产品信息为商家给出的有关产品的信息。在一些实施例中，步骤130可以由知识图谱获取模块230执行。

产品信息可以包括产品的尺寸、颜色和/或纹路（或花纹）等。在一些实施例中，在产品出厂时，厂家会把产品信息的原始文本信息和产品原始图片编码存储，并设置公开的key以供采购者查询。例如，客户可通过扫描产品上的数字ID标识来获取产品信息。其中，产品原始图片可以包括产品的密度排列、剖面图和/或表面微观图等。

产品知识图谱可以是指通过产品信息构建的知识图谱。建筑材料种类繁多、特点也各不相同。为了便于统计和做相关预测，我们首先把各种材料分类建成一个知识图谱、每一种材料也有各自不同的属性。知识图谱结构式一种1对多的三元组{头实体、关系（属性）、尾实体（属性值）}，比如木地板，这种材料的知识图谱可表示为{木地板、颜色、棕红色}。建成了知识图谱后，我们可以通过知识图谱学习得到图谱中每个实体和属性的稠密实值向量，并使用该向量进行下一步预测。

步骤140，获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片。在一些实施例中，步骤140可以由产品图片获取模块240执行。

在一些实施例中，当用户收到产品时，可以通过各种图像获取设备获取产品的图片。产品的图片可以包括产品的颜色、纹路和/或尺寸等信息。

步骤150，将产品知识图谱和所述产品图片输入真伪识别模型，模型输出产品的真伪。在一些实施例中，步骤150可以由真伪鉴别模块250执行。

真伪识别模型可以将产品知识图谱和产品图片中有关产品的信息进行比对，并基于比对结果确定客户收到的产品的真伪。具体包括以下内容：

步骤150-1，基于产品知识图谱，获取产品的文本特征。

文本特征是指可以表征产品信息的特征。在一些实施例中，获取产品的文本特征，包括：

基于TransH模型，得到产品知识图谱的实体表示矩阵和关系表示矩阵，包括：

将知识图谱中三元组的头实体向量和尾实体向量投影到关系所对应的超平面，得到投影后的头实体向量和投影后的尾实体向量；其中，得到投影后的头实体向量和投影后的尾实体向量的表达式为：

其中，

表示投影后的头实体向量，/>

表示头实体向量，/>

表示转置向量，/>

表示关系/>

所对应的超平面的法向量，/>

表示投影后的尾实体向量，/>

表示尾实体向量。

基于评分函数，训练TransH模型，得到实体和关系的表示向量；评分函数用于表征三元组的头实体和尾实体的相关程度；其中，评分函数的表达式为：

其中，

表示评分，/>

表示L2范数。

基于知识图谱中多个三元组的实体和关系的表示向量，得到实体表示矩阵和关系表示矩阵。

提取产品知识图谱中的三元组，得到多个产品三元组。对于一个商品

，首先获得该实体所涉及的所有三元组的表示向量。例如，木地板A实体的三元组包括：｛木地板A，颜色，棕红色｝｛木地板A，材质，实木｝等。

对于每个产品三元组：从实体表示矩阵和关系表示矩阵中获取该产品三元组的头实体向量、关系向量和尾实体向量；将头实体向量、关系向量和尾实体向量进行拼接，得到产品三元组向量

。

将多个产品三元组向量进行拼接，得到向量序列

。

将向量序列输入LSTM模型，模型输出每个产品三元组的文本特征，包括：

获取当前时间步的隐状态，当前时间步的隐状态

分别受到前一时间步和后一时间步的影响，最终表示如下：

其中，

表示该三元组向量在上一时间步的隐状态下的隐状态，/>

表示第/>

个三元组向量，/>

表示上一时间步的隐状态，/>

表示该三元组向量在下一时间步的隐状态下的隐状态，/>

表示下一时间步的隐状态，/>

表示长短时记忆网络。

将上一时间步的隐状态和下一时间步的隐状态进行组合，得到实体和关系的隐状态；其中，得到实体和关系的隐状态的表达式为：

其中，

表示该三元组向量的实体和关系的隐状态。

将多个实体和关系的隐状态进行组合，得到文本特征；其中，得到文本特征的表达式为:

其中，

表示文本特征，/>

，/>

表示第一个三元组向量的实体和关系的隐状态，/>

表示第二个三元组向量的实体和关系的隐状态，/>

步骤150-2，基于所述产品图片，获取产品的图片特征。

图片特征是指可以表征客户上传的图片的特征。在一些实施例中，可以将产品图片输入卷积神经网络（CNN），卷积神经网络输出图片特征

，/>

中包含/>

个向量记作/>

。

步骤150-3，基于互注意力机制，确定文本特征和图片特征的匹配概率，包括：

将文本特征

和图片特征/>

投射到同一向量空间，得到匹配矩阵/>

。其中，得到匹配矩阵的表达式为：

其中，

表示匹配矩阵，/>

表示文本特征，/>

表示权重矩阵，/>

通过随机初始化得到，/>

表示图片特征，/>

表示转置向量，/>

表示激活函数。

基于匹配矩阵

、文本特征/>

和图片特征/>

，得到实体及关系信息注意力映射/>

和图片注意力映射/>

。其中，得到实体及关系信息注意力映射和图片注意力映射的表达式为：

其中，

表示实体及关系信息注意力映射，/>

和/>

表示两个不同的权重矩阵，/>

通过随机初始化得到，/>

表示图片注意力映射。通过把/>

看作是一个特征向量，通过它来求实体及关系信息注意力映射和图片注意力映射，可以提高模型的性能。

基于实体及关系信息注意力映射

和图片注意力映射/>

，得到产品图片的各个区域的注意力概率/>

和实体及关系的注意力概率/>

。其中，得到产品图片的各个区域的注意力概率和实体及关系的注意力概率的表达式为：

其中，

表示图片中各个区域的注意力概率，/>

，/>

和/>

表示两个不同的权重矩阵，/>

表示实体及关系的注意力概率，/>

，/>

表示激活函数。

基于各个区域的注意力概率

和实体及关系的注意力概率/>

，得到图片注意力向量/>

和文本注意力向量/>

。其中，得到图片注意力向量和文本注意力向量的表达式为：

其中，

表示图片注意力向量，/>

表示变量，/>

表示图片中区域的总数，/>

表示图片中第/>

个区域的注意力概率，/>

表示图片中第/>

个区域的注意力向量，/>

表示文本注意力向量，/>

表示变量，/>

表示三元组向量的总数，/>

表示第/>

个三元组向量的实体及关系的注意力概率，/>

表示第/>

个三元组向量的实体和关系的隐状态。

计算图片注意力向量

和文本注意力向量/>

的匹配值/>

。其中，计算图片注意力向量和文本注意力向量的匹配值的表达式为：

其中，

表示匹配值，/>

表示激活函数，/>

表示权重矩阵，可以通过随机初始化得到。

基于匹配值

，确定匹配概率/>

。其中，确定匹配概率的表达式为：

其中，

表示匹配概率，/>

表示/>

函数，/>

表示权重矩阵。

步骤150-4，基于所述匹配概率，确定所述产品的真伪。

在一些实施例中，当匹配概率大于概率阈值时，确认产品为真，否则为假。概率阈值可以根据经验设置，例如，概率阈值可以为90%。

本说明书中的一些实施例通过引入互注意机制，使得能更好的匹配相关性较强的产品图片和产品信息。图片的特征可以促进实体和关系信息特征的提取,实体和关系信息的特征也会促进图片特征的提取。

真伪识别模型可以通过模型训练得到。可以将匹配看成是一个二分类任务，即产品图片与产品信息是否匹配。在一些实施例中，真伪识别模型可以为二分类模型，所述真伪识别模型的优化函数的表达式为：

其中，

表示损失函数，/>

表示所述产品信息与商品图片的匹配概率，/>

表示对数函数，/>

表示真实的标签。

图2为本发明一些实施例提供的一种确定建材真伪的系统的示例性示意图。如图2所示，系统200可以包括上传模块210、审核模块220、知识图谱获取模块230、产品图片获取模块240和真伪鉴别模块250。

上传模块210用于上传产品图片；产品图片包括商品图片和产品信息；所述商品图片包括产品的主图、总体展示图和细节展示图；产品信息包括产品名称、推广标题、产品属性和使用场景。关于上传模块210的更多内容，参见图1及其相关描述。

审核模块220用于将产品图片输入图文审核模型，模型确定产品图片是否符合要求。关于审核模块220的更多内容，参见图1及其相关描述。

知识图谱获取模块230用于基于产品的产品信息，获取产品知识图谱；产品信息为商家给出的有关产品的信息。关于知识图谱获取模块230的更多内容，参见图1及其相关描述。

产品图片获取模块240用于获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片。关于产品图片获取模块240的更多内容，参见图1及其相关描述。

真伪鉴别模块250用于将产品知识图谱和产品图片输入真伪识别模型，模型输出产品的真伪；真伪鉴别模块包括文本特征获取单元230-1、图片特征获取单元250-2、匹配概率确定单元250-3和真伪输出单元250-4。关于真伪鉴别模块250的更多内容，参见图1及其相关描述。

文本特征获取单元250-1用于基于产品知识图谱，获取产品的文本特征。关于文本特征获取单元250-1的更多内容，参见图1及其相关描述。

图片特征获取单元250-2用于基于产品图片，获取产品的图片特征。关于图片特征获取单元250-2的更多内容，参见图1及其相关描述。

匹配概率确定单元250-3用于基于互注意力机制，确定文本特征和图片特征的匹配概率。关于匹配概率确定单元250-3的更多内容，参见图1及其相关描述。

真伪输出单元250-4用于基于匹配概率，确定产品的真伪，并将结果输出。关于真伪输出单元250-4的更多内容，参见图1及其相关描述。

每个产品都有一个独特的数字ID，这个数字ID记录了产品的各项信息，包括生产厂家、生产日期、地址、产品特征，比如尺寸、重量、密度、硬度、抗酸抗腐蚀强度等物理信息，这个数字ID可通过无线传感器存储、并同时读取相邻产品的信息进行匹配，一旦产品被调包，传感器读取的数据与原匹配信息不符，那么传感器就会发出警告信号。这种方式可供后期用户查询产品的真实源头。当产品达到客户手中，客户可通过扫描产品上的数字ID标识来获取产品信息，并在终端与厂家的信息进行对比查询，确保产品是正品。

同时，还把产品的剖面图，表面微观图记录下来，供后期查询，识别真伪。比如产品的剖面图会有一些材质的纹路、密度排列等明显的、独一无二的特征，根据这些特征收集一个图片数据集，在此数据集基础上，采用计算机视觉技术进行训练，训练完成后的模型可以直接预测产品的真伪。这两种技术的双重使用可以在很大程度上起着防止产品被调包的重要作用。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种确定建材真伪的方法，其特征在于，包括：

上传产品图片；所述产品图片包括商品图片和产品信息；所述商品图片包括产品的主图、总体展示图和细节展示图；所述产品信息包括产品名称、推广标题、产品属性和使用场景；

将所述产品图片输入图文审核模型，模型确定所述产品图片是否符合要求；其中，所述图文审核模型为Resnet50，通过Resnet50审核过滤后的文字和图片；原始文字和图片信息为

,输入Resnet50中输出为：

最后的输出经过sigmoid激活函数，得到最终的过滤值

,表示过滤后的规范的文字和图片概率，这里的/>

表示Resnet模型；所述图文审核模型通过训练初始图文审核模型得到，初始图文审核模型选用Resent50模型，训练样本包括训练产品图片和标签，标签用于表示训练产品图片中是否包含敏感词汇、图示产品与文字描述的SSKU、规格型号、SKU名称和品牌是否一致；

若是，基于所述产品信息，获取产品知识图谱；所述产品信息为商家给出的有关产品的信息；

获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片；

将所述产品知识图谱和所述产品图片输入真伪识别模型，模型输出产品的真伪；包括：

基于所述产品知识图谱，获取所述产品的文本特征；

基于所述产品图片，获取所述产品的图片特征；

基于互注意力机制，确定所述文本特征和所述图片特征的匹配概率；

基于所述匹配概率，确定所述产品的真伪；

其中，所述基于所述产品知识图谱，获取所述产品的文本特征，包括：

基于TransH模型，得到所述产品知识图谱的实体表示矩阵和关系表示矩阵；

提取所述产品知识图谱中的三元组，得到多个产品三元组；

对于每个所述产品三元组：

从所述实体表示矩阵和所述关系表示矩阵中获取该产品三元组的头实体向量、关系向量和尾实体向量；

将所述头实体向量、所述关系向量和所述尾实体向量进行拼接，得到产品三元组向量；

将多个所述产品三元组向量进行拼接，得到向量序列；

将所述向量序列输入LSTM模型，模型输出每个所述产品三元组的文本特征；

其中，所述基于TransH模型，得到所述产品知识图谱的实体表示矩阵和关系表示矩阵，包括：

将所述知识图谱中三元组的头实体向量和尾实体向量投影到关系所对应的超平面，得到投影后的头实体向量和投影后的尾实体向量；其中，得到所述投影后的头实体向量和所述投影后的尾实体向量的表达式为：

其中，

表示所述投影后的头实体向量，/>

表示头实体向量，/>

表示转置向量，/>

表示关系/>

所对应的超平面的法向量，/>

表示所述投影后的尾实体向量，/>

表示尾实体向量；

其中，

表示评分，/>

表示L2范数；

基于所述知识图谱中多个三元组的实体和关系的表示向量，得到所述实体表示矩阵和所述关系表示矩阵；

其中，将所述向量序列输入双向LSTM模型，模型输出每个所述产品三元组的文本特征，包括：

获取当前时间步的隐状态，当前时间步的隐状态

分别受到前一时间步和后一时间步的影响，最终表示如下：

其中，

表示该三元组向量在上一时间步的隐状态下的隐状态，/>

表示第/>

个三元组向量，/>

表示上一时间步的隐状态，/>

表示该三元组向量在下一时间步的隐状态下的隐状态，/>

表示下一时间步的隐状态，/>

表示长短时记忆网络；

其中，

表示该三元组向量的实体和关系的隐状态；

其中，

表示文本特征，/>

表示第一个三元组向量的实体和关系的隐状态，/>

表示第二个三元组向量的实体和关系的隐状态，/>

表示第n个三元组向量的实体和关系的隐状态，n为三元组向量的个数；

其中，所述基于所述产品图片，获取图片特征为：将所述产品图片输入卷积神经网络，所述卷积神经网络输出所述图片特征；

其中，所述基于互注意力机制，确定所述文本特征和所述图片特征的匹配概率，包括：

将所述文本特征和所述图片特征投射到同一向量空间，得到匹配矩阵；

基于所述匹配矩阵、所述文本特征和所述图片特征，得到实体及关系信息注意力映射和图片注意力映射；

基于所述实体及关系信息注意力映射和所述图片注意力映射，得到所述产品图片的各个区域的注意力概率和实体及关系的注意力概率；

基于所述各个区域的注意力概率和所述实体及关系的注意力概率，得到图片注意力向量和文本注意力向量；

计算所述图片注意力向量和所述文本注意力向量的匹配值；

基于所述匹配值，确定所述匹配概率；

其中，所述得到匹配矩阵的表达式为：

其中，

表示匹配矩阵，/>

表示文本特征，/>

表示权重矩阵，/>

表示图片特征，/>

表示转置向量，/>

表示激活函数；

其中，

表示实体及关系信息注意力映射，/>

和/>

表示两个不同的权重矩阵，

表示图片注意力映射；

其中，

表示图片中各个区域的注意力概率，/>

和/>

表示两个不同的权重矩阵，/>

表示实体及关系的注意力概率，/>

表示激活函数；

所述得到图片注意力向量和文本注意力向量的表达式为：

其中，

表示图片注意力向量，/>

表示变量，/>

表示图片中区域的总数，/>

表示图片中第

个区域的注意力概率，/>

表示图片中第/>

个区域的注意力向量，/>

表示文本注意力向量，/>

表示变量，/>

表示三元组向量的总数，/>

表示第/>

个三元组向量的实体及关系的注意力概率，/>

表示第/>

个三元组向量的实体和关系的隐状态；

其中，

表示匹配值，/>

表示激活函数，/>

表示权重矩阵；

所述确定所述匹配概率的表达式为：

其中，

表示匹配概率，/>

表示/>

函数，/>

表示权重矩阵；

其中，所述真伪识别模型的优化函数的表达式为：

其中，

表示损失函数，/>

表示所述产品信息与商品图片的匹配概率，/>

表示对数函数，/>

表示真实的标签。

2.根据权利要求1所述的确定建材真伪的方法，其特征在于，所述基于所述匹配概率，确定所述产品的真伪为：当所述匹配概率大于概率阈值时，确认所述产品为真，否则为假。

3.一种应用于权利要求1所述的确定建材真伪的方法的系统，其特征在于，包括上传模块、审核模块、知识图谱获取模块、产品图片获取模块和真伪鉴别模块；

所述上传模块用于上传产品图片；所述产品图片包括商品图片和产品信息；所述商品图片包括产品的主图、总体展示图和细节展示图；所述产品信息包括产品名称、推广标题、产品属性和使用场景；

所述审核模块用于将所述产品图片输入图文审核模型，模型确定所述产品图片是否符合要求；

所述知识图谱获取模块用于当所述产品图片符合要求时，基于产品的产品信息，获取产品知识图谱；所述产品信息为商家给出的有关产品的信息；

所述产品图片获取模块用于获取产品图片；产品图片是指客户上传的待确定真伪的产品的图片

所述真伪鉴别模块用于将所述产品知识图谱和所述产品图片输入真伪识别模型，模型输出产品的真伪；所述真伪鉴别模块包括文本特征获取单元、图片特征获取单元、匹配概率确定单元和真伪输出单元；

所述文本特征获取单元用于基于所述产品知识图谱，获取所述产品的文本特征；

所述图片特征获取单元用于基于所述产品图片，获取所述产品的图片特征；

所述匹配概率确定单元用于基于互注意力机制，确定所述文本特征和所述图片特征的匹配概率；

所述真伪输出单元用于基于所述匹配概率，确定所述产品的真伪，并将结果输出。