CN115730208A - 训练方法、训练装置、训练设备及计算机可读存储介质 - Google Patents
训练方法、训练装置、训练设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115730208A CN115730208A CN202110995291.2A CN202110995291A CN115730208A CN 115730208 A CN115730208 A CN 115730208A CN 202110995291 A CN202110995291 A CN 202110995291A CN 115730208 A CN115730208 A CN 115730208A
- Authority
- CN
- China
- Prior art keywords
- training
- task
- value
- data
- tasks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种训练方法、训练装置、训练设备及非易失性计算机可读存储介质。训练方法包括:融合多个数据集,并根据多个任务及多个数据集的属性以分别标记数据集的标记集合,以生成批次数据;在训练模型中训练批次数据和任务,并根据标记集合以输出任务的训练值;计算任务的标准值和训练值的差值,以得到损失值;及根据损失值以调整训练模型,直至训练模型收敛。本申请实施方式的训练方法、训练装置、训练设备及非易失性计算机可读存储介质中,在输出该任务的训练值时,可避免与该任务不相关的数据带来的影响,以保证训练的准确性。且多个数据集的格式、属性均可各不相同,以实现了对多领域的数据集的联合训练。
Description
技术领域
本申请涉及图像识别技术领域,更具体而言,涉及一种训练方法、训练装置、训练设备及非易失性计算机可读存储介质。
背景技术
现有的多任务训练,大多是采用比较相关的多个任务联合训练,同时训练多个辅助的任务可以提升主任务的指标,但是涉及多非相关的跨领域的模型训练则没法起作用,甚至还会出现两个领域的训练不均衡,对其中一个任务负优化的情形。
发明内容
本申请实施方式提供一种训练方法、训练装置、训练设备及非易失性计算机可读存储介质。
本申请实施方式的训练方法包括融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值;计算所述任务的标准值和所述训练值的差值,以得到损失值;及根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
本申请实施方式的训练装置包括生成模块、训练模块、计算模块及调整模块,所述生成模块用于融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;所述训练模块用于在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值;所述计算模块用于计算所述任务的标准值和所述训练值的差值,以得到损失值;及所述调整模块用于根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
本申请实施方式的训练设备包括处理器。所述处理器用于融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值;计算所述任务的标准值和所述训练值的差值,以得到损失值;及根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
本申请实施方式的非易失性计算机可读存储介质包含计算机程序,当所述计算机程序被一个或多个处理器执行时,使得所述处理器执行如下训练方法:融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;在训练模型中训练所述批次数据和所述任务,并根据所述标记集合以输出所述任务的训练值;计算所述任务的标准值和所述训练值的差值,以得到损失值;及根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
本申请实施方式的训练方法、训练装置、训练设备及非易失性计算机可读存储介质通过多个任务和数据集的属性标记并融合多个数据集,以生成批次数据,再通过训练模型训练任务和批次数据,并根据标记集合输出任务的训练值,从而根据任务的训练值和标准值的差值,以得到损失值,并根据损失值调整训练模型以使训练模型收敛。其中,由于处理器以标记了批次数据中各个数据集的标记集合,以代表各个数据集和任务的相关性,由此,在输出该任务的训练值时,可避免与该任务不相关的数据带来的影响,以保证训练的准确性。且多个数据集的格式、属性均可各不相同,以实现了对多领域的数据集的联合训练。
本申请的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实施方式的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本申请某些实施方式的训练方法的流程示意图;
图2是本申请某些实施方式的训练装置的示意图;
图3是本申请某些实施方式的训练设备的示意图;
图4至图8是本申请某些实施方式的训练方法的流程示意图;
图9是本申请某些实施方式的非易失性计算机可读存储介质和处理器的连接状态示意图。
具体实施方式
下面详细描述本申请的实施方式,所述实施方式的示例在附图中示出,其中,相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本申请的实施方式,而不能理解为对本申请的实施方式的限制。
请参阅图1,本申请实施方式提供一种训练方法。该音质处理方法包括步骤:
01:融合多个数据集,并根据多个任务及多个数据集的属性以分别标记数据集的标记集合,以生成批次数据;
03:在训练模型中训练批次数据和任务,并根据标记集合以输出任务的训练值;
05:计算任务的标准值和训练值的差值,以得到损失值;及
07:根据损失值以调整训练模型,直至训练模型收敛。
请参阅图2,本申请实施方式提供一种训练装置10。训练装置10包括生成模块11、训练模块12、计算模块13及调整模块14。本申请实施方式的训练方法可应用于训练装置10。其中,生成模块11用于执行步骤01,训练模块12用于执行步骤03,计算模块13用于执行步骤05,调整模块14用于执行步骤07。即,生成模块11用于融合多个数据集,并根据多个任务及多个数据集的属性以分别标记数据集的标记集合,以生成批次数据。训练模块12用于在训练模型中训练批次数据和任务,并根据标记集合以输出任务的训练值。计算模块13用于计算所述任务的标准值和所述训练值的差值,以得到损失值。调整模块14用于根据损失值以调整训练模型,直至训练模型收敛。
请参阅图3,本申请实施方式还提供一种训练设备100。训练设备100包括处理器20。本申请实施方式的训练方法可应用于训练设备100。处理器20用于执行步骤01、步骤03、步骤05和步骤07。即,处理器20用于融合多个数据集,并根据多个任务及多个数据集的属性以分别标记数据集的标记集合,以生成批次数据;在训练模型中训练批次数据和任务,并根据标记集合以输出任务的训练值;计算所述任务的标准值和所述训练值的差值,以得到损失值;及根据损失值以调整训练模型,直至训练模型收敛。
其中,训练设备100还包括壳体30。训练设备100可以是手机、平板电脑、显示设备、笔记本电脑、智能手表、头显设备、游戏机等。如图3所示,本申请实施方式以训练设备100是手机为例进行说明,可以理解,训练设备100的具体形式并不限于手机。壳体30还可用于安装训练设备100的显示装置、成像装置、供电装置、通信装置等功能模块,以使壳体30为功能模块提供防尘、防摔、防水等保护。
数据集的格式可以是音频、视频和图片等,在融合多个数据集时,可以是融合多个相同格式的数据集,如将多张图片格式的数据集融合成批次数据;还可以是融合多个不同格式的数据集,如将音频格式的数据集、视频格式的数据集融合成批次数据,又如将视频格式的数据集、视频格式的数据集、图片格式的数据集融合成批次数据等。
数据集的属性可体现出数据集的内容,处理器20可根据数据集的属性,以判断与该数据集有关的任务。例如,数据集为人像图片,则处理器20可判断该数据集能够执行的任务可以是人脸识别任务、人脸检测任务或人脸年龄识别任务等。在本申请实施方式的训练方法中,融合多个数据集时,多个数据集的格式可各不相同,如音频、视频、图片等格式,在多个数据集的格式相同时,多个数据集的属性也可以各不相同,如人像图像、车辆图像、房屋图像等。
具体地,处理器20可根据任务及数据集的属性以标记数据集的标记集合,当处理器20通过多个任务标记同一个数据集时,可形成有标记集合。例如,多个任务分别为人脸识别任务、手势识别任务、人脸角度识别任务时,若该数据集的属性为人像图像时,则处理器20标记该人像图像的标记集合为{1,0,1},接着,若下个数据集的属性为手势图像,则处理器20标记该手势图像的标记集合为{0,1,0}。可以理解,当该数据集的属性与任务相关时,则标记集合对应位置的元素标记为1,若不相关,则标记为0。
由此,当处理器20融合多个数据集时,则可如上述方式一样分别标记多个数据集,以形成批次数据。
在生成批次数据后,则可通过训练模型训练批次数据和任务,并输出对该任务的训练值,如在执行人脸识别任务时,批次数据可是通过人像图像、手势图像和车辆图像融合而成的,训练模型将人脸识别任务在该批次数据进行训练后,则可输出训练值0.8(即该批次数据中包含人脸的置信度为百分之80)。
更具体地,在通过训练模型训练批次数据和任务时,训练模型可给出该任务的评估值,此时,为了排除与该任务不相关的评估误差,则需要将评估值与批次数据中的标记集合的元素相乘,以优化训练值。例如在训练人脸识别任务时,批次数据是通过人像图像、手势图像和车辆图像融合而成的,则批次数据中的人像图像对应人脸识别任务的标记集合的元素为1,而手势图像和车联图像对应人脸识别任务的标记集合的元素为0。由此,在训练人脸识别任务时,训练模型会针对批次数据中的所有图像数据给出评估值,如对人像图像、手势图像和车辆图像分别给出0.8、0.2和0.3的评估值,则训练值为0.8*1+0.2*0+0.3*0=0.8,从而消除了其他不相关图像给出的评估误差,优化了训练值。
接下来,由于处理器20通过数据集的属性则可知道批次数据中是否包含有与任务相关的数据,由此,处理器20则可给出任务的标准值。例如在训练人脸识别任务时,批次数据是通过人像图像、手势图像和车辆图像融合而成的,即批次数据包含有人脸数据,则该任务的标准值为1.0(即该批次数据中包含人脸的置信度为百分之100),由此,处理器20通过计算标准值和训练值的差值,即可得到损失值。如损失值为0.2(即该训练模型具有0.2的误差)。其中,当任务包含有多个任务时,则损失值为每个任务的损失值之和。
最后处理器20则可根据损失值的大小,调整训练模型,即在执行多个任务后,损失值的大小不再发生变化后,则代表训练模型收敛,从而保证执行任务的准确性。
在本申请实施方式的训练方法、训练装置10及训练设备100通过多个任务和数据集的属性标记并融合多个数据集,以生成批次数据,再通过训练模型训练任务和批次数据,并根据标记集合输出任务的训练值,从而根据任务的训练值和标准值的差值,以得到损失值,并根据损失值调整训练模型以使训练模型收敛。其中,由于处理器20以标记了批次数据中各个数据集的标记集合,以代表各个数据集和任务的相关性,由此,在输出该任务的训练值时,可避免与该任务不相关的数据带来的影响,以保证训练的准确性。且多个数据集的格式、属性均可各不相同,以实现了对多领域的数据集的联合训练。
请参阅图2至图4,在某些实施方式中,步骤01:根据多个数据集的属性及多个任务分别标记数据集的标记集合,还包括步骤:
011:遍历多个数据集,判断任务与数据集的属性的相关性;
013:在数据集的属性与任务相关时,标记数据集的标记集合中对应任务的元素为第一标记值;及
015:在数据集的属性与任务不相关时,标记数据集的标记集合中对应任务的元素为第二标记值。
在某些实施方式中,生成模块11用于执行步骤011、步骤013和步骤015。即生成模块11用于遍历多个任务,判断任务与数据集的属性的相关性;在数据集的属性与任务相关时,标记数据集的标记集合中对应任务的元素为第一标记值;及在数据集的属性与任务不相关时,标记数据集的标记集合中对应任务的元素为第二标记值。
在某些实施方式中,处理器20用于执行步骤011、步骤013和步骤015。即处理器20用于遍历多个任务,判断任务与数据集的属性的相关性;在数据集的属性与任务相关时,标记数据集的标记集合中对应任务的元素为第一标记值;及在数据集的属性与任务不相关时,标记数据集的标记集合中对应任务的元素为第二标记值。
在标记数据集的标记集合时,标记集合中的元素个数与任务数量一致,每个元素对应一个任务。由此,当遍历多个任务时,处理器20则可对每个数据集的标记集合标记与多个任务对应的标记值。
具体地,处理器20可通过判断任务是否与数据集的属性相关,以对该数据集的标记集合的元素进行赋值,在数据集的属性与任务相关时,则将对应该任务的元素标记为第一标记值,在数据集的属性与任务不相关时,则将对应该任务的元素标记为第二标记值。其中,第一标记值和第二标记值的具体数值可根据训练模型进行调节。在本申请实施方式的训练方法中第一标记值为1,第二标记值为0。
在一个实施方式中,多个任务包括人脸识别任务、车辆识别任务和手势识别任务,数据集包括人像图像、手势图像、车辆图像、房屋图像,则每个数据集的标记集合包含3个元素。通过数据集的属性则可看出人像图像可进行人脸识别任务,即该数据集与人脸识别任务相关;手势图像可进行手势识别任务,即该数据集与手势识别任务相关;车辆图像可进行车辆识别任务,即该数据集与手势识别任务相关。
此时,若任务为人脸识别任务,则人像图像的数据集的标记集合中对应人脸识别任务的元素为第一标记值,手势图像、车辆图像、房屋图像的数据集的标记集合中对应人脸识别任务的元素为第二标记值。以人脸识别任务、车辆识别任务、手势识别任务分别为标记集合中的第一个元素、第二个元素和第三个元素,第一标记值为1,第二标记值为0为例,则人像图像的标记集合为{1,0,0},手势图像的标记集合为{0,0,1},车辆图像的标记集合为{0,1,0},车辆图像的标记集合为{0,0,0}。
由此,处理器20在根据标签集合以输出对应任务的训练值时,则可根据每个数据集的标记集合的元素进行对应任务的计算,从而消除不相关任务带来的训练误差。
请参阅图2、图3和图5,在某些实施方式中,步骤011:遍历多个任务,判断任务与数据集的属性的相关性,还包括步骤:
0111:获取与数据集的属性对应的训练任务;
0112:当训练任务包含任务时,确定数据集的属性与任务相关;及
0113:当训练任务不包含任务时,确定数据集的属性与任务不相关。
在某些实施方式中,生成模块11用于执行步骤0111、步骤0112和步骤0113。即生成模块11用于获取与数据集的属性对应的训练任务;当训练任务包含任务时,确定数据集的属性与任务相关;及当训练任务不包含任务时,确定数据集的属性与任务不相关。
在某些实施方式中,处理器20用于执行步骤0111、步骤0112和步骤0113。即处理器20用于获取与数据集的属性对应的训练任务;当训练任务包含任务时,判断数据集的属性与任务相关;及当训练任务不包含任务时,确定数据集的属性与任务不相关。
具体地,处理器20还可与获取数据集的属性对应的训练任务,并根据判断该数据集的训练任务是否包含任务,以确定数据集的属性与任务是否相关。如当训练任务包含任务时,确定数据集的属性与任务相关;当训练任务不包含任务时,确定数据集的属性与任务不相关。
例如,数据集为人像图像,处理器20则可根据人像图像,以判定该数据集可进行人脸识别任务、人脸年龄识别任务、人脸角度识别任务、微笑识别任务等。由此,若任务为该数据集中的训练任务中的一种,则说明该数据集的属性与任务相关,如人脸识别任务与人像图像相关;若任务为该数据集中的训练任务外的一种,则说明该数据集的属性与任务不相关,如人脸识别任务与手势图像不相关。
由此,处理器20则可根据判断数据集的属性与任务的相关性,从而标记该数据集的标记集合中的每一个元素。
请参阅图2、图3和图6,在某些实施方式中,步骤03:在训练模型中训练批次数据和任务,并根据标记集合以输出任务的训练值,还包括步骤:
031:根据训练模型输出任务的预估值;及
033:计算预估值与标记集合中对应任务的元素的乘积之和,以输出训练值。
在某些实施方式中,训练模块12用于执行步骤031和步骤033。即训练模块12用于根据训练模型输出任务的预估值;及计算预估值与标记集合中对应任务的元素的乘积之和,以输出训练值。
在某些实施方式中,处理器20用于执行步骤031和步骤033。即处理器20用于根据训练模型输出任务的预估值;及计算预估值与标记集合中对应任务的元素的乘积之和,以输出训练值。
具体地,在输出任务的训练值前,在通过训练模型训练批次数据和任务时,训练模型可给出该任务的评估值,此时,为了排除与该任务不相关的评估误差,则需要将评估值与批次数据中的标记集合对应该任务的元素相乘,以优化训练值。
例如,在训练人脸识别任务时,批次数据是通过人像图像、手势图像和车辆图像融合而成的,则批次数据中的人像图像对应人脸识别任务的标记集合的元素为1,而手势图像和车联图像对应人脸识别任务的标记集合的元素为0。由此,在训练人脸识别任务时,训练模型会针对批次数据中的所有图像数据给出评估值,如对人像图像、手势图像和车辆图像分别给出0.8、0.2和0.3的评估值,则训练值为0.8*1+0.2*0+0.3*0=0.8。
由此,则可消除在训练人脸识别任务时,训练集给出的其他不相关数据集的评估值,从而消除了其他不相关图像给出的评估误差,以优化训练值。
请参阅图7,本申请实施方式的训练方法,还包括步骤:
04:根据任务及数据集的属性,以获取任务的标准值。
在某些实施方式中,训练装置10还包括获取模块15,获取模块15用于执行步骤04。即获取模块15用于根据任务及数据集的属性,以获取任务的标准值。
在某些实施方式中,处理器20用于执行步骤04。即处理器20用于根据任务及数据集的属性,以获取任务的标准值。
具体地,在计算损失值前,处理器20需先根据任务及数据集的属性,以获取任务的标准值。例如,任务为人脸识别任务,数据集分别为手势图像、车辆图像和房屋图像时,则说明所有数据集的属性均与人脸识别任务不相关,即经该多个数据集融合的批次数据无法训练人脸识别任务,则处理器20会输出该任务的标准值为0。又例如,任务为人脸识别任务,数据集分别为手势图像、车辆图像和人脸图像时,则说明所有数据集的属性中存在有与人脸识别任务相关的数据集,即经该多个数据集融合的批次数据可以训练人脸识别任务,则处理器20会输出该任务的标准值为1。
由此,处理器20则可根据任务的标准值及输出的训练值,从而计算出损失值,即训练模型的误差值,从而根据损失值的大小,以继续调整训练模型,直至训练模型收敛。
请参阅图2、图3和图8,在某些实施方式中,步骤07:根据损失值以调整训练模型,还包括步骤:
071:在连续N个批次中,任意两个批次对应的损失值的差值大于预定阈值时,继续输入下一批次的任务至训练模型,所述N为正整数;
073:在连续N个批次中,任意两个批次对应的损失值的差值小于预定阈值时,确定训练模型收敛。
在某些实施方式中,调整模块14用于执行步骤071和执行步骤073。即调整模块14用于在连续N个批次中,任意两个批次对应的损失值的差值大于预定阈值时,继续输入下一批次的任务至训练模型,所述N为正整数;在连续N个批次中,任意两个批次对应的损失值的差值小于预定阈值时,确定训练模型收敛。
在某些实施方式中,处理器20用于执行步骤071和步骤073,即处理器20用于在连续N个批次中,任意两个批次对应的损失值的差值大于预定阈值时,继续输入下一批次的任务至训练模型,所述N为正整数;在连续N个批次中,任意两个批次对应的损失值的差值小于预定阈值时,确定训练模型收敛。
具体地,对训练模型的训练有多轮,每轮输入一个批次的、预定个数的任务,来对训练模型进行训练,每个批次的任务训练完成后,均可计算得到损失值。
例如,预定个数可以是3个、4个、5个等。本实施方式以预定个数为3个为例进行说明,如同一批次的3个任务分别为人脸识别任务、手势识别任务和车辆识别任务,批次数据包含有人像图像、手势图像、车辆图像和房屋图像。则处理器20可根据该批次数据中的数据集的属性以分别输出人脸识别任务、手势识别任务和车辆识别任务的训练值。而人脸识别任务、手势识别任务和车辆识别任务的标准值为1。
以人脸识别任务、手势识别任务和车辆识别任务的训练值为0.9、0.85、0.8为例,则人脸识别任务、手势识别任务和车辆识别任务的损失值分别为0.1、0.15和0.2。由此,可得出该批次任务经训练模型训练后的总损失值为0.1+0.15+0.2=0.45,可以看出,损失值较大,即误差较大,由此,需要降低总损失值,以使训练模型收敛,达到准确执行任务的目的。
因此,处理器20可判断连续N个(例如N为2、3、4等,N为正整数)批次中,任意两个批次的任务对应的总损失值的差值是否大于或等于预定阈值,若任意两个批次的任务对应的总损失值的差值大于或等于预定阈值(如预定阈值为0.01、0.02等),则说明损失值还没达到极限值,需要继续进行下一轮训练,处理器20则继续输入下一批次的任务至训练模型模型。若任意两个批次任务对应的损失值的差值小于预定阈值,则说明损失值达到了极限值,此时则可确定训练模型收敛。如上述批次任务的总损失值为0.45,下一批次任务的总损失值为0.3,预定阈值为0.02,则说明训练模型经第二次批次任务训练后,损失值仍未达到极限值,则继续下一轮训练,若第三次批次任务的总损失值为0.15,则说明训练模型经第三次批次任务训练后,损失值仍未达到极限值,则继续下一轮训练,若第四次批次任务的总损失值为0.14,则说明训练模型经第四次批次任务训练后,损失值达到极限值,则说明损失值达到极限值,此时则确定训练模型收敛。即经此时的训练模型进行执行任务,损失值最小,且较为准确。
请参阅图9,本申请实施方式还提供一种包含计算机程序201的非易失性拟计算机可读存储介质200。当计算机程序201被一个或多个处理器20执行时,使得一个或多个处理器20执行上述任一实施方式的训练方法。
例如,计算机程序201被一个或多个处理器20执行时,使得处理器20执行以下训练方法:
01:融合多个数据集,并根据多个任务及多个数据集的属性以分别标记数据集的标记集合,以生成批次数据;
03:在训练模型中训练批次数据和任务,并根据标记集合以输出任务的训练值;
05:计算训练值及任务的标准值的差值,以得到损失值;及
07:根据损失值以调整训练模型,直至训练模型收敛。
又例如,计算机程序201被一个或多个处理器20执行时,使得处理器20执行以下训练方法:
011:遍历多个任务,判断任务与数据集的属性的相关性;
013:在数据集的属性与任务相关时,标记数据集的标记集合中对应任务的元素为第一标记值;及
015:在数据集的属性与任务不相关时,标记数据集的标记集合中对应任务的元素为第二标记值。
又例如,计算机程序201被一个或多个处理器20执行时,使得处理器20执行以下训练方法:
0111:获取与数据集的属性对应的训练任务;
0112:当训练任务包含任务时,确定数据集的属性与任务相关;及
0113:当训练任务不包含任务时,确定数据集的属性与任务不相关。
又例如,计算机程序201被一个或多个处理器20执行时,使得处理器20执行以下训练方法:
031:根据训练模型计算任务的预估值;及
033:计算预估值与标记集合中对应任务的元素的乘积之和,以输出训练值。
再例如,计算机程序201被一个或多个处理器20执行时,使得处理器20执行以下训练方法:
04:根据任务及数据集的属性,以获取任务的标准值。
还例如,计算机程序201被一个或多个处理器20执行时,使得处理器20执行以下训练方法:
071:在连续N个批次中,任意两个批次对应的损失值的差值大于预定阈值时,继续输入下一批次的任务至训练模型,所述N为正整数;
073:在连续N个批次中,任意两个批次对应的损失值的差值小于预定阈值时,确定训练模型收敛。
在本说明书的描述中,参考术语“某些实施方式”、“一个例子中”、“示例地”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
尽管上面已经示出和描述了本申请的实施方式,可以理解的是,上述实施方式是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型。
Claims (10)
1.一种训练方法,其特征在于,包括:
融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;
在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值;
计算所述任务的标准值和所述训练值的差值,以得到损失值;及
根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
2.根据权利要求1所述的训练方法,其特征在于,数据集的类型可以是图片、视频及音频。
3.根据权利要求1所述的训练方法,其特征在于,所述根据多个所述数据集的属性及多个任务分别标记所述数据集的标记集合,包括:
遍历多个所述数据集,判断所述任务与所述数据集的属性的相关性;
在所述数据集的属性与所述任务相关时,标记所述数据集的标记集合中对应所述任务的元素为第一标记值;及
在所述数据集的属性与所述任务不相关时,标记所述数据集的标记集合中对应所述任务的元素为第二标记值。
4.根据权利要求3所述的训练方法,其特征在于,所述遍历多个所述任务,判断所述任务与所述数据集的属性的相关性,包括:
获取与所述数据集的属性对应的训练任务;
当所述训练任务包含所述任务时,确定所述数据集的属性与所述任务相关;及
当所述训练任务不包含所述任务时,确定所述数据集的属性与所述任务不相关。
5.根据权利要求3所述的训练方法,其特征在于,所述在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值,包括:
根据所述训练模型输出所述任务的预估值;及
计算所述预估值与所述标记集合中对应所述任务的元素的乘积之和,以输出所述训练值。
6.根据权利要求1所述的训练方法,其特征在于,所述训练方法还包括:
根据所述任务及所述数据集的属性,以获取所述任务的标准值。
7.根据权利要求1所述的训练方法,其特征在于,多个任务按预定个数分为多个批次,每个批次的预定个数的所述任务可计算得到一个损失值,所述根据所述损失值以调整所述训练模型,包括:
在连续N个批次中,任意两个批次对应的损失值的差值大于预定阈值时,继续输入下一批次的所述任务至所述训练模型,所述N为正整数;及
在连续N个批次中,任意两个批次对应的损失值的差值小于所述预定阈值时,确定所述训练模型收敛。
8.一种训练装置,其特征在于,包括:
生成模块,所述生成模块用于融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;
训练模块,所述训练模块用于在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值;
计算模块,所述计算模块用于计算所述任务的标准值和所述训练值的差值,以得到损失值;及
调整模块,所述调整模块用于根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
9.一种训练设备,其特征在于,所述训练设备包括处理器,所述处理器用于:
融合多个数据集,并根据多个任务及多个所述数据集的属性以分别标记所述数据集的标记集合,以生成批次数据;
在训练模型中训练所述批次数据和所述任务,并根据标记集合以输出所述任务的训练值;
计算所述任务的标准值和所述训练值的差值,以得到损失值;及
根据所述损失值以调整所述训练模型,直至所述训练模型收敛。
10.一种包含计算机程序的非易失性计算机可读存储介质,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-7任意一项所述的一种训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995291.2A CN115730208A (zh) | 2021-08-27 | 2021-08-27 | 训练方法、训练装置、训练设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995291.2A CN115730208A (zh) | 2021-08-27 | 2021-08-27 | 训练方法、训练装置、训练设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115730208A true CN115730208A (zh) | 2023-03-03 |
Family
ID=85290299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110995291.2A Pending CN115730208A (zh) | 2021-08-27 | 2021-08-27 | 训练方法、训练装置、训练设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115730208A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912638A (zh) * | 2023-09-13 | 2023-10-20 | 深圳金三立视频科技股份有限公司 | 一种多数据集的联合训练方法及终端 |
-
2021
- 2021-08-27 CN CN202110995291.2A patent/CN115730208A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912638A (zh) * | 2023-09-13 | 2023-10-20 | 深圳金三立视频科技股份有限公司 | 一种多数据集的联合训练方法及终端 |
CN116912638B (zh) * | 2023-09-13 | 2024-01-12 | 深圳金三立视频科技股份有限公司 | 一种多数据集的联合训练方法及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11551134B2 (en) | Information processing apparatus, information processing method, and storage medium | |
US11538246B2 (en) | Method and apparatus for training feature extraction model, computer device, and computer-readable storage medium | |
CN109522538B (zh) | 表格内容的自动分列方法、装置、设备及存储介质 | |
US11804053B2 (en) | Image recognition method and terminal | |
CN109583391B (zh) | 关键点检测方法、装置、设备及可读介质 | |
CN111368903B (zh) | 模型性能优化方法、装置、设备及存储介质 | |
US20220130146A1 (en) | Method for recognizing video action, and device and storage medium thereof | |
KR20200145827A (ko) | 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체 | |
CN109598272A (zh) | 字符行图像的识别方法、装置、设备及介质 | |
CN111027412B (zh) | 一种人体关键点识别方法、装置及电子设备 | |
CN114723646A (zh) | 带标注的图像数据生成方法、装置、存储介质及电子设备 | |
CN116129452A (zh) | 文档理解模型的生成方法、应用方法、装置、设备及介质 | |
CN114463603B (zh) | 图像检测模型的训练方法、装置、电子设备及存储介质 | |
CN115730208A (zh) | 训练方法、训练装置、训练设备及计算机可读存储介质 | |
CN111881740A (zh) | 人脸识别方法、装置、电子设备及介质 | |
CN116958267B (zh) | 位姿处理方法、装置、电子设备及存储介质 | |
JP6707715B2 (ja) | 学習装置、推定装置、学習方法及びプログラム | |
CN111950517A (zh) | 一种目标检测方法、模型训练方法,电子设备及存储介质 | |
WO2020124454A1 (zh) | 字体切换方法及相关产品 | |
CN116343007A (zh) | 目标检测方法、装置、设备和存储介质 | |
CN115511104A (zh) | 用于训练对比学习模型的方法、装置、设备和介质 | |
CN111339367B (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
US20180307669A1 (en) | Information processing apparatus | |
US12019671B2 (en) | Locally constrained self-attentive sequential recommendation | |
US20220261574A1 (en) | System for correcting user movement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |