CN114049498A - 一种数据审核模型的更新方法、装置及电子设备 - Google Patents
一种数据审核模型的更新方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114049498A CN114049498A CN202111353439.9A CN202111353439A CN114049498A CN 114049498 A CN114049498 A CN 114049498A CN 202111353439 A CN202111353439 A CN 202111353439A CN 114049498 A CN114049498 A CN 114049498A
- Authority
- CN
- China
- Prior art keywords
- feature map
- updated
- model
- decision
- deep
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种数据审核模型的更新方法、装置及电子设备,其中,该方法包括:获取待更新模型以及预设输入向量,其中,预设输入向量包括用于训练待更新模型的图片数据及其对应的审核标签;将预设输入向量输入至待更新模型,确定预设输入向量对应的浅层次特征图以及深层次特征图;根据浅层次特征图更新深层次特征图,根据更新后的深层次特征图,确定待更新模型对应的决策特征算子;根据决策特征算子,确定待更新模型对应的损失函数,根据损失函数更新待更新模型。本公开实施例通过融合深浅层次特征图并确定描述预设输入向量的决策特征的决策特征算子,进而更新模型的损失函数,可以使更新后的模型具有较高的前向推理准确性。
Description
技术领域
本公开涉及深度学习技术领域,具体而言,涉及一种数据审核模型的更新方法、装置及电子设备。
背景技术
目前,随着深度学习技术的不断发展,利用深度学习模型解决日常生活中的问题成为了一种高效便捷的选择,尤其在阻断互联网有害信息的传播过程中,针对在互联网上流通数据的审核工作,深度学习模型因其高速高效率的数据处理能力,正逐渐替代人工审核工作成为主力审核工具,大大提升了审核效率并节约人力成本。
在现有的深度学习模型的决策过程中,一般统一使用softmax损失函数对模型的输入数据进行推理,但随着神经网络的深度增加,深层次卷积层输出的特征图空间会逐渐偏离浅层次卷积层输出的特征图空间,影响softmax损失函数在前向推理的过程中产生不确定性推理结果,进而导致推理结果准确性较低。
发明内容
本公开实施例至少提供一种数据审核模型的更新方法、装置及电子设备,可以提升深度学习模型的前向推理准确性。
本公开实施例提供了一种数据审核模型的更新方法,所述方法包括:
获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签;
将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图;
根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征;
根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
一种可选的实施方式中,所述根据所述浅层次特征图更新所述深层次特征图,具体包括:
根据所述浅层次特征图以及所述深层次特征图,确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子,其中,所述关联特征算子用于描述所述浅层次特征图以及所述深层次特征图之间的关联性;
根据所述关联特征算子以及所述深层次特征图的乘积,确定更新后的所述深层次特征图。
一种可选的实施方式中,基于以下方法确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子:
确定所述浅层次特征图对应的第一向量维度以及所述深层次特征图对应的第二向量维度;
根据所述第一向量维度、所述第二向量维度、所述浅层次特征图以及所述深层次特征图,确定所述关联特征算子。
一种可选的实施方式中,所述根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,具体包括:
确定更新后的所述深层次特征图对应的通道数、特征图高度以及特征图宽度;
根据所述通道数,将更新后的所述深层次特征图划分为多个子特征图;
针对每一个所述子特征图,根据所述特征图高度、所述特征图宽度以及所述子特征图,确定所述子特征图对应的特征均值;
根据所述子特征图、所述特征图高度、所述特征图宽度以及所述特征均值,确定所述决策特征算子。
一种可选的实施方式中,在所述根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子之后,所述方法还包括:
获取所述待更新模型对应的第一超参数以及第二超参数,根据所述第一超参数以及所述第二超参数,对所述决策特征算子进行归一化处理。
一种可选的实施方式中,基于以下方法确定所述待更新模型对应的损失函数:
获取所述待更新模型对应的第三超参数以及所述审核标签;
根据进行归一化处理后的所述决策特征算子、所述第三超参数、所述审核标签、所述预设输入向量以及所述待更新模型,确定更新后的所述损失函数。
一种可选的实施方式中,在所述根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型之后,所述方法还包括:
获取待审核数据;
将所述待审核数据输入至更新后的所述待更新模型,确定所述待审核数据对应的审核结果。
本公开实施例还提供一种数据审核模型的更新装置,所述装置包括:
获取模块,用于获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签;
第一确定模块,用于将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图;
第二确定模块,用于根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征;
更新模块,用于根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
一种可选的实施方式中,所述第一确定模块还用于:
根据所述浅层次特征图以及所述深层次特征图,确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子,其中,所述关联特征算子用于描述所述浅层次特征图以及所述深层次特征图之间的关联性;
根据所述关联特征算子以及所述深层次特征图的乘积,确定更新后的所述深层次特征图。
一种可选的实施方式中,所述第一确定模块还用于:
确定所述浅层次特征图对应的第一向量维度以及所述深层次特征图对应的第二向量维度;
根据所述第一向量维度、所述第二向量维度、所述浅层次特征图以及所述深层次特征图,确定所述关联特征算子。
一种可选的实施方式中,所述第二确定模块还用于:
确定更新后的所述深层次特征图对应的通道数、特征图高度以及特征图宽度;
根据所述通道数,将更新后的所述深层次特征图划分为多个子特征图;
针对每一个所述子特征图,根据所述特征图高度、所述特征图宽度以及所述子特征图,确定所述子特征图对应的特征均值;
根据所述子特征图、所述特征图高度、所述特征图宽度以及所述特征均值,确定所述决策特征算子。
一种可选的实施方式中,所述装置还包括处理模块,所述处理模块用于:
获取所述待更新模型对应的第一超参数以及第二超参数,根据所述第一超参数以及所述第二超参数,对所述决策特征算子进行归一化处理。
一种可选的实施方式中,所述更新模块还用于:
获取所述待更新模型对应的第三超参数以及所述审核标签;
根据进行归一化处理后的所述决策特征算子、所述第三超参数、所述审核标签、所述预设输入向量以及所述待更新模型,确定更新后的所述损失函数。
一种可选的实施方式中,所述装置还包括审核模块,所述审核模块用于:
获取待审核数据;
将所述待审核数据输入至更新后的所述待更新模型,确定所述待审核数据对应的审核结果。
本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述数据审核模型的更新方法,或上述数据审核模型的更新方法中任一种可能的实施方式中的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述数据审核模型的更新方法,或上述数据审核模型的更新方法中任一种可能的实施方式中的步骤。
本公开实施例提供的一种数据审核模型的更新方法、装置及电子设备,在待更新模型神经网络结构的特征输出层后,将深层次卷积层输出的深层次特征图以及浅层次卷积层输出的浅层次特征图进行关联,更新深层次特征图,使更新后的深层次特征图具有更好的前向决策性特性,并根据更新后的深层次特征图计算用于描述输入数据决策特特征的决策特征算子,根据决策特征算子更新模型的损失函数,这样,模型可以参考经过决策特征算子决策过后的损失,将注意力放在更有价值的数据上,提升模型前向推理的准确性。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种数据审核模型的更新方法的流程图;
图2示出了本公开实施例所提供的另一种数据审核模型的更新方法的流程图;
图3示出了本公开实施例所提供的另一种数据审核模型的更新方法的流程图;
图4示出了本公开实施例所提供的一种数据审核模型的更新装置的示意图之一;
图5示出了本公开实施例所提供的一种数据审核模型的更新装置的示意图之二;
图6示出了本公开实施例所提供的一种数据审核模型的更新装置的示意图之三;
图7示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
经研究发现,在现有的深度学习模型的决策过程中,一般统一使用softmax损失函数对模型的输入数据进行推理,但随着神经网络的深度增加,深层次卷积层输出的特征图空间会逐渐偏离浅层次卷积层输出的特征图空间,影响softmax损失函数在前向推理的过程中产生不确定性推理结果,进而导致推理结果准确性较低。
基于上述研究,本公开提供了一种数据审核模型的更新方法、装置及电子设备,在待更新模型神经网络结构的特征输出层后,将深层次卷积层输出的深层次特征图以及浅层次卷积层输出的浅层次特征图进行关联,更新深层次特征图,使更新后的深层次特征图具有更好的前向决策性特性,并根据更新后的深层次特征图计算用于描述输入数据决策特特征的决策特征算子,根据决策特征算子更新模型的损失函数,这样,模型可以参考经过决策特征算子决策过后的损失,将注意力放在更有价值的数据上,提升模型前向推理的准确性。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种数据审核模型的更新方法进行详细介绍,本公开实施例所提供的数据审核模型的更新方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该数据审核模型的更新方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例所提供的一种数据审核模型的更新方法的流程图,所述方法包括步骤S101~S104,其中:
S101、获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签。
该步骤中,将用于训练待更新模型的图片数据及其对应的审核标签,以向量的形式输入至待更新模型。
这里,待更新模型可以为一种用于审核图像数据的神经网络模型,用于训练的图片数据可以为图片数据。审核标签的内容可以包括“正常数据”以及“违规数据”等。
其中,图片数据对应的审核标签可以在输入至待更新模型之前,由人工进行标注。
S102、将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图。
该步骤中,在将用于训练待更新模型的图片数据及其对应的审核标签以预设输入向量的形式输入至待更新模型之后,在待更新模型中神经网络结构中的特征输出层后,由浅层次卷积层输出预设输入向量对应的浅层次特征图,由浅层次卷积层后的深层次卷积层输出预设输入向量对应的深层次特征图。
这里,由于随着神经网络的深度逐渐增加,由深层次卷积层输出的特征图空间会逐渐偏离的由浅层次卷积层输出的特征图空间,进而导致模型在前向推理的过程中产生不确定的推理结果,降低模型的推理准确性,因此需要考虑将深层次特征图与浅层次特征图进行融合,以增加模型的深浅注意力,进而增加模型前向推理的准确性。
S103、根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征。
该步骤中,通过计算深层次特征图与浅层次特征图之间的关联性,将深层次特征图与浅层次特征图进行融合,得到更具有前向决策性的深层次特征图,并在神经网络结构的最后一层深层次卷积层输出深层此特征图之后,根据更新后的最后一层的深层次特征图计算待更新模型对应的决策特征算子。
这里,决策特征算子可以描述预设输入向量的决策特征,所述决策特征表示待更新模型在针对输入的预设向量进行判断进而给出推理结果时的依据,预设输入向量所携带的决策特征越强,表明该数据在模型进行推理判断的过程中是重要的推理依据,反之,若预设输入向量所携带的决策特征越弱,则表明该数据在模型进行推理判断的过程中,无法对模型的推理结果产生决定性影响,属于次要推理依据。
这样,更新后的模型可以根据输入的不同预设输入向量对应的决策特征算子合理分配运算时的注意力,将大部分注意力更有针对性的放在更具有决策特征的数据上,而不是对所有的输入数据一视同仁进行统一的推理与判断,可以提升模型的推理效率并增加推理准确性。
在一种可能的实施方式中,更新深层次特征图的具体步骤可以为:
(1)根据所述浅层次特征图以及所述深层次特征图,确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子,其中,所述关联特征算子用于描述所述浅层次特征图以及所述深层次特征图之间的关联性。
该步骤中,根据待更新模型的神经网络结构中,深层次卷积层输出的深层次特征图以及浅层次卷积层输出的浅层次特征图,计算浅层次特征图以及深层次特征图之间的关联特征算子。
具体的,基于以下公式计算浅层次特征图以及深层次特征图之间的关联特征算子:
其中,αij为关联特征算子;Si为浅层次特征图;rj为深层次特征图;m表示浅层次特征图的维度;n表示深层次特征图的维度;浅层次特征图属于m维的向量空间;深层次特征图属于n维的向量空间。
这里,首先确定所述浅层次特征图对应的第一向量维度以及所述深层次特征图对应的第二向量维度。第一向量维度对应于上述公式中m项;第二项两维度对应于上述公式中的n项。根据所述第一向量维度m、所述第二向量维度n、所述浅层次特征图Si以及所述深层次特征图rj,确定所述关联特征算子αij。
(2)根据所述关联特征算子以及所述深层次特征图的乘积,确定更新后的所述深层次特征图。
具体的,基于以下公式计算更新后的深层次特征图:
这样,采用深浅注意力机制,将深层次特征图与浅层次特征图进行融合,并针对待更新模型神经网络结构的深层次卷积层输出的深层次特征图进行更新,使更新后的深层次特征图更加具有前向决策性,在模型进行前向推理判断时,可作为重要的决策依据,有利于增加模型前向推理的准确性。
在一种可能的实施方式中,确定待更新模型对应的决策特征算子的具体步骤可以为:
(1)确定更新后的所述深层次特征图对应的通道数、特征图高度以及特征图宽度。
该步骤中,首先获取待更新模型神经网络结构中,最后一层深层次特征图输出层输出的更新后的深层次特征图对应的通道数c、特征图高度h以及特征图宽度w。
其中,更新后的深层次特征图属于c×w×h维的向量空间。
(2)根据所述通道数,将更新后的所述深层次特征图划分为多个子特征图。
(3)针对每一个所述子特征图,根据所述特征图高度、所述特征图宽度以及所述子特征图,确定所述子特征图对应的特征均值。
具体的,基于以下公式计算子特征图对应的特征均值:
(4)根据所述子特征图、所述特征图高度、所述特征图宽度以及所述特征均值,确定所述决策特征算子。
该步骤中,根据子特征图ai、更新后的深层次特征图的高度h以及更新后的深层次特征图的宽度w,计算决策特征算子。
具体的,基于以下公式计算决策特征算子:
其中,Zi为决策特征算子;h为更新后的深层次特征图的高度;w为更新后的深层次特征图的宽度。
S104、根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
该步骤中,根据步骤S103计算得到的决策特征算子,针对该更新模型中的损失函数进行更新,进而完成对待更新模型的更新过程。
本公开实施例提供的一种数据审核模型的更新方法,在待更新模型神经网络结构的特征输出层后,将深层次卷积层输出的深层次特征图以及浅层次卷积层输出的浅层次特征图进行关联,更新深层次特征图,使更新后的深层次特征图具有更好的前向决策性特性,并根据更新后的深层次特征图计算用于描述输入数据决策特征的决策特征算子,根据决策特征算子更新模型的损失函数,这样,模型可以参考经过决策特征算子决策过后的损失,将注意力放在更有价值的数据上,提升模型前向推理的准确性。
参见图2所示,为本公开实施例所提供的另一种数据审核模型的更新方法的流程图,所述方法包括步骤S201~S205,其中:
S201、获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签。
S202、将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图。
S203、根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征。
这里,步骤S201-S203的实施过程与步骤S101-S103的实施过程相同,并且可以达到相同的技术效果,在此不再赘述。
S204、获取所述待更新模型对应的第一超参数以及第二超参数,根据所述第一超参数以及所述第二超参数,对所述决策特征算子进行归一化处理。
该步骤中,在根据决策特征算子更新该更新模型中的损失函数之前,需要将决策特征算子进行归一化处理,并将进行归一化处理完毕的决策特征算子作为最终的决策特征算子值,用于更新待更新模型对应的损失函数。
具体的,基于以下公式对决策特征算子进行归一化处理:
其中,pi为归一化处理后的决策特征算子;α为第一超参数;β为第二超参数;Zi为进行归一化处理前的决策特征算子。
这里,第一超参数以及第二超参数的取值可以根据实际需要进行设置,在此不做具体限制。
S205、根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
在一种可能的实施方式中,基于以下方法更新待更新模型对应的损失函数:
获取所述待更新模型对应的第三超参数以及所述审核标签;根据进行归一化处理后的所述决策特征算子、所述第三超参数、所述审核标签、所述预设输入向量以及所述待更新模型,确定更新后的所述损失函数。
这里,所述审核标签即为针对输入的预设输入向量中的图片数据,由人工标注的正确分类或者判断结果,作为一种可能的实施方式,当待更新模型为一种用于审核图像数据的神经网络模型时,审核标签可以为“正常数据1”以及“违规数据0”等,其具体形式可以根据实际需要进行设置,在此不作具体限制。
其中,第三超参数的取值可以根据实际需要进行设置,在此不做具体限制。
具体的,基于以下公式根据决策特征算子更新待更新模型对应的损失函数。
其中,L为更新后的损失函数;h为更新后的深层次特征图的高度;w为更新后的深层次特征图的宽度;c为更新后的深层次特征图对应的通道数;yi为审核标签,pi为归一化处理后的决策特征算子;fj为待更新模型;xi为预设输入向量;θ为待输入模型对应的第三超参数。
这样,由决策特征算子决策过后的损失,更新后的模型可以参考决策特征算子所描述的数据决策特征,进而进行更有针对性的模型训练,提升模型前向推理的准确性。
参见图3所示,为本公开实施例所提供的另一种数据审核模型的更新方法的流程图,所述方法包括步骤S301~S305,其中:
S301、获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签。
S302、将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图。
S303、根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征。
S304、根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
这里,步骤S301-S304的实施过程与步骤S101-S104的实施过程相同,并且可以达到相同的技术效果,在此不再赘述。
S305、获取待审核数据;将所述待审核数据输入至更新后的所述待更新模型,确定所述待审核数据对应的审核结果。
该步骤中,本申请实施例所提供的模型更新方法应用于数据审核领域,作为一种可能的实施方式,待更新模型可以为一种图像审核模型,用于审核互联网中流通的图片数据是否违规,获取到的待审核数据可以为图片数据,在基于步骤S301-S304的模型更新过程后,将待审核的图片数据输入至更新好的模型中,由更新好的模型对待审核的图片数据进行推理判断,最终给出审核结果:数据正常或者数据违规。
本公开实施例提供的一种数据审核模型的更新方法,在待更新模型神经网络结构的特征输出层后,将深层次卷积层输出的深层次特征图以及浅层次卷积层输出的浅层次特征图进行关联,更新深层次特征图,使更新后的深层次特征图具有更好的前向决策性特性,并根据更新后的深层次特征图计算用于描述输入数据决策特征的决策特征算子,根据决策特征算子更新模型的损失函数,这样,模型可以参考经过决策特征算子决策过后的损失,将注意力放在更有价值的数据上,提升模型前向推理的准确性。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与数据审核模型的更新方法对应的数据审核模型的更新装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述数据审核模型的更新方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图4、图5和图6,图4为本公开实施例所提供的一种数据审核模型的更新装置的示意图之一,图5为本公开实施例提供的一种数据审核模型的更新装置的示意图之二,图6为本公开实施例提供的一种数据审核模型的更新装置的示意图之三。如图4中所示,本公开实施例提供的更新装置400包括:获取模块410;第一确定模块420;第二确定模块430;更新模块440。
获取模块410,用于获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签;
第一确定模块420,用于将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图;
第二确定模块430,用于根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征;
更新模块440,用于根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
可选的,所述第一确定模块420还用于:
根据所述浅层次特征图以及所述深层次特征图,确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子,其中,所述关联特征算子用于描述所述浅层次特征图以及所述深层次特征图之间的关联性;
根据所述关联特征算子以及所述深层次特征图的乘积,确定更新后的所述深层次特征图。
可选的,所述第一确定模块420还用于:
确定所述浅层次特征图对应的第一向量维度以及所述深层次特征图对应的第二向量维度;
根据所述第一向量维度、所述第二向量维度、所述浅层次特征图以及所述深层次特征图,确定所述关联特征算子。
可选的,所述第二确定模块430还用于:
确定更新后的所述深层次特征图对应的通道数、特征图高度以及特征图宽度;
根据所述通道数,将更新后的所述深层次特征图划分为多个子特征图;
针对每一个所述子特征图,根据所述特征图高度、所述特征图宽度以及所述子特征图,确定所述子特征图对应的特征均值;
根据所述子特征图、所述特征图高度、所述特征图宽度以及所述特征均值,确定所述决策特征算子。
可选的,所述更新模块440还用于:
获取所述待更新模型对应的第三超参数以及所述审核标签;
根据进行归一化处理后的所述决策特征算子、所述第三超参数、所述审核标签、所述预设输入向量以及所述待更新模型,确定更新后的所述损失函数。
可选的,如图5中所示,所述更新装置400还包括处理模块450,所述处理模块450用于:
获取所述待更新模型对应的第一超参数以及第二超参数,根据所述第一超参数以及所述第二超参数,对所述决策特征算子进行归一化处理。
可选的,如图6中所示,所述更新装置400还包括审核模块460,所述审核模块460用于:
获取待审核数据;
将所述待审核数据输入至更新后的所述待更新模型,确定所述待审核数据对应的审核结果。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本公开实施例提供的一种数据审核模型的更新装置,在待更新模型神经网络结构的特征输出层后,将深层次卷积层输出的深层次特征图以及浅层次卷积层输出的浅层次特征图进行关联,更新深层次特征图,使更新后的深层次特征图具有更好的前向决策性特性,并根据更新后的深层次特征图计算用于描述输入数据决策特征的决策特征算子,根据决策特征算子更新模型的损失函数,这样,模型可以参考经过决策特征算子决策过后的损失,将注意力放在更有价值的数据上,提升模型前向推理的准确性。
对应于图1中的数据审核模型的更新方法,本公开实施例还提供了一种电子设备700,如图7所示,为本公开实施例提供的电子设备700结构示意图,包括:
处理器71、存储器72、和总线73;存储器72用于存储执行指令,包括内存721和外部存储器722;这里的内存721也称内存储器,用于暂时存放处理器71中的运算数据,以及与硬盘等外部存储器722交换的数据,处理器71通过内存721与外部存储器722进行数据交换,当所述电子设备700运行时,所述处理器71与所述存储器72之间通过总线73通信,使得所述处理器71执行图1至图3中的数据审核模型的更新方法的步骤。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的数据审核模型的更新方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种数据审核模型的更新方法,其特征在于,所述方法包括:
获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签;
将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图;
根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征;
根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述浅层次特征图更新所述深层次特征图,具体包括:
根据所述浅层次特征图以及所述深层次特征图,确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子,其中,所述关联特征算子用于描述所述浅层次特征图以及所述深层次特征图之间的关联性;
根据所述关联特征算子以及所述深层次特征图的乘积,确定更新后的所述深层次特征图。
3.根据权利要求2所述的方法,其特征在于,基于以下方法确定所述浅层次特征图以及所述深层次特征图之间的关联特征算子:
确定所述浅层次特征图对应的第一向量维度以及所述深层次特征图对应的第二向量维度;
根据所述第一向量维度、所述第二向量维度、所述浅层次特征图以及所述深层次特征图,确定所述关联特征算子。
4.根据权利要求1所述的方法,其特征在于,所述根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,具体包括:
确定更新后的所述深层次特征图对应的通道数、特征图高度以及特征图宽度;
根据所述通道数,将更新后的所述深层次特征图划分为多个子特征图;
针对每一个所述子特征图,根据所述特征图高度、所述特征图宽度以及所述子特征图,确定所述子特征图对应的特征均值;
根据所述子特征图、所述特征图高度、所述特征图宽度以及所述特征均值,确定所述决策特征算子。
5.根据权利要求1所述的方法,其特征在于,在所述根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子之后,所述方法还包括:
获取所述待更新模型对应的第一超参数以及第二超参数,根据所述第一超参数以及所述第二超参数,对所述决策特征算子进行归一化处理。
6.根据权利要求1所述的方法,其特征在于,基于以下方法确定所述待更新模型对应的损失函数:
获取所述待更新模型对应的第三超参数以及所述审核标签;
根据进行归一化处理后的所述决策特征算子、所述第三超参数、所述审核标签、所述预设输入向量以及所述待更新模型,确定更新后的所述损失函数。
7.根据权利要求1-6任一所述的方法,其特征在于,在所述根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型之后,所述方法还包括:
获取待审核数据;
将所述待审核数据输入至更新后的所述待更新模型,确定所述待审核数据对应的审核结果。
8.一种数据审核模型的更新装置,其特征在于,所述装置包括:
获取模块,用于获取待更新模型以及预设输入向量,其中,所述预设输入向量包括用于训练所述待更新模型的图片数据及其对应的审核标签;
第一确定模块,用于将所述预设输入向量输入至所述待更新模型,确定所述预设输入向量对应的浅层次特征图以及深层次特征图;
第二确定模块,用于根据所述浅层次特征图更新所述深层次特征图,根据更新后的所述深层次特征图,确定所述待更新模型对应的决策特征算子,其中,所述决策特征算子用于描述所述预设输入向量的决策特征;
更新模块,用于根据所述决策特征算子,确定所述待更新模型对应的损失函数,根据所述损失函数更新所述待更新模型。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的数据审核模型的更新方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7中任一项所述的数据审核模型的更新方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111353439.9A CN114049498A (zh) | 2021-11-16 | 2021-11-16 | 一种数据审核模型的更新方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111353439.9A CN114049498A (zh) | 2021-11-16 | 2021-11-16 | 一种数据审核模型的更新方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049498A true CN114049498A (zh) | 2022-02-15 |
Family
ID=80209144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111353439.9A Pending CN114049498A (zh) | 2021-11-16 | 2021-11-16 | 一种数据审核模型的更新方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049498A (zh) |
-
2021
- 2021-11-16 CN CN202111353439.9A patent/CN114049498A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3690763A1 (en) | Machine learning model training method and device, and electronic device | |
CN111079780B (zh) | 空间图卷积网络的训练方法、电子设备及存储介质 | |
WO2020224106A1 (zh) | 基于神经网络的文本分类方法、系统及计算机设备 | |
CN111506801A (zh) | 一种应用App中子应用的排序方法及装置 | |
CN110009474B (zh) | 一种信用风险评估方法、装置和电子设备 | |
JP5402351B2 (ja) | 多目的最適化設計支援装置、方法、及びプログラム | |
CN112819157A (zh) | 神经网络训练的方法及装置、智能行驶控制的方法及装置 | |
CN110689135A (zh) | 一种反洗钱模型的训练方法、装置及电子设备 | |
CN113807940A (zh) | 信息处理和欺诈行为识别方法、装置、设备及存储介质 | |
CN106649210A (zh) | 一种数据转换方法及装置 | |
CN109325810B (zh) | 充值转化的提高方法、电子设备及计算机存储介质 | |
CN104360934A (zh) | 一种移动终端及其应用程序通知处理方法 | |
CN114049498A (zh) | 一种数据审核模型的更新方法、装置及电子设备 | |
CN116993513A (zh) | 金融风控模型解释方法、装置及计算机设备 | |
CN107305552A (zh) | 辅助阅读方法和装置 | |
CN110781410A (zh) | 一种社群检测方法及装置 | |
CN106021299B (zh) | 文本的降维特征向量确定方法及装置 | |
CN113536111B (zh) | 保险知识内容的推荐方法、装置和终端设备 | |
CN112561569B (zh) | 基于双模型的到店预测方法、系统、电子设备及存储介质 | |
CN114610955A (zh) | 一种智能检索方法、装置、电子设备及存储介质 | |
CN112883375A (zh) | 恶意文件识别方法、装置、设备及存储介质 | |
CN113760407A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN115048436B (zh) | 基于可视图原理的高维金融时间序列的阶段划分方法 | |
CN117453372B (zh) | 一种任务规划方法、装置、电子设备及存储介质 | |
CN117709917B (zh) | 用于招聘平台的数据智能处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |