CN114330554A - 一种面向智能安防的视觉深度模型知识重组方法 - Google Patents
一种面向智能安防的视觉深度模型知识重组方法 Download PDFInfo
- Publication number
- CN114330554A CN114330554A CN202111639661.5A CN202111639661A CN114330554A CN 114330554 A CN114330554 A CN 114330554A CN 202111639661 A CN202111639661 A CN 202111639661A CN 114330554 A CN114330554 A CN 114330554A
- Authority
- CN
- China
- Prior art keywords
- model
- target
- training
- knowledge
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000000007 visual effect Effects 0.000 title claims abstract description 16
- 238000005215 recombination Methods 0.000 title claims abstract description 8
- 230000006798 recombination Effects 0.000 title claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 84
- 230000008521 reorganization Effects 0.000 claims abstract description 47
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000005259 measurement Methods 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims abstract description 5
- 238000002372 labelling Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 6
- 238000012512 characterization method Methods 0.000 claims description 4
- 238000013136 deep learning model Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims 1
- 238000013507 mapping Methods 0.000 claims 1
- 230000005012 migration Effects 0.000 abstract description 5
- 238000013508 migration Methods 0.000 abstract description 5
- 238000004821 distillation Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
一种面向智能安防的视觉深度模型知识重组方法,首先,收集安防边缘测的视觉数据,明确模型任务,收集数据进行标注,训练目标任务模型。然后,利用归因图计算目标模型和不同预训练模型之间的可迁移分数,将归一化的可迁移分数作为模型选择的概率,可放回地采样形成模型集合;在联邦学习范式的基础上,将目标模型分发到不同的节点,利用表征蒸馏迁移预训练模型的特征提取能力,在目标模型学习和迁移完成后,通过平均的方式在中心节点进行知识重组,重组过后的模型再次分发到选择的模型节点进一步迭代。最后,再利用目标数据集进行微调目标模型,从而学习得到一个在智能安防领域的目标任务上表现良好的视觉深度模型,并且保护了数据隐私和模型隐私。
Description
技术领域
本发明属于智能安防和联邦学习领域,涉及一种面向智能安防的视觉深度模型知识重组方法。
背景技术
智能安防是一种涉及人脸识别,大数据分析以及视频结构化等多种技术的领域。随着深度学习等技术的快速发展,智能安防产品的功能也越发多元化,安防技术在交通、社区等多种场景下成功应用落地。
然而深度学习技术的成功依赖于两大因素,一是大量的标注数据,二是实际深度学习模型复用形式的发展:使用他人预先训练好的、经过公开验证的网络模型,从而大大减少网络训练的工作量。在智能安防领域,大量的标注数据需要大量的人力成本,因而质量优秀的标注数据是稀缺的;而日益发展的模型共享形式也面临着一个问题:良好性能的网络需要耗费巨大的资源,即使训练该网络的研究人员或机构有意向公开该模型,但由于隐私保护、安全或知识产权等问题,他们无法向公众分享他们的模型。现有的模型重用方法,如知识蒸馏、迁移学习和领域自适应,通常需要预训练模型才能进行使用,因此在这种情况下是无法解决该问题的。
发明内容
为了解决上述问题,本发明提供一种面向智能安防的视觉深度模型知识重组方法。其目的是在几个分散的教师模型的帮助下训练一个学生模型。这个学生模型关注于安防领域的具体目标任务,如深度估计,行人重识别。为了确保模型信息在训练的过程中不被泄露,预训练模型的细节(包括预训练的任务和数据)始终保持私有,其他训练参与者不能获得任何有关信息。这样的问题设置给联邦模型重用带来了巨大的挑战,因为很难为目标任务找到有用的教师模型。同时,不同的教师模型的训练领域是不同的,学生模型的训练必须考虑平衡来自不同教师的知识汇总。
为此,本发明提出了一种面向智能安防的视觉深度模型知识重组技术来解决此类问题。该方法通过利用私密的教师模型的预训练知识来定制一个学生模型。本发明不是通过模仿教师模型来训练学生模型,而是通过基于特征的训练模式,从教师模型处过滤和吸收有用的知识。特征分析在网络可解释性的文献中被广泛使用,也被用来揭示网络的可迁移性。基于特征分析,本发明提出了一种自适应训练模式。在不直接访问私有教师模型的情况下选择有用的教师模型。具体而言就是:本发明使用目标任务的标记数据训练学生模型,同时计算学生模型和私密的教师模型之间的表征相似度来进行知识选择。并根据相似度增加选择的概率,所选择的教师模型通过本地节点内部的表征蒸馏将知识迁移给学生模型,并通过平均的方式进行知识重组,然后再根据目标任务数据进行微调。
本发明考虑智能安防领域模型训练的实际场景,有限的标注数据使得直接训练一个泛化性能良好的模型是极其困难的。本发明在预训练模型及其训练数据不可直接获取的条件下,借鉴于现有的联邦学习范式,提出了一种用于面向智能安防的视觉深度模型知识重组方法。本发明的技术方案是:
一种面向安防的视觉深度模型知识重组方法,包含如下步骤:
1.收集与训练智能安防数据;
本发明首先收集安防边缘测(如摄像头)的视觉数据,明确具体的模型任务,如行人重识别,为收集的小部分数据进行标注,这一小部分标注后的数据将作为目标任务数据集DT,其中包含了M个数据样本以及标签。由于安防设备所处的环境以及昂贵的标注成本,安防设备收集的数据通常是不充分的,因而直接利用该部分数据训练学习难以获得一个表现良好的深度模型。为了让安防的深度模型拥有一定的关于目标任务的知识,首先需要利用收集的目标任务数据集训练目标任务模型。
2.选择模型知识;
预训练模型{M1,M2,…,MN}是在不同训练数据和不同的任务上训练的,因而预训练模型包含了不同领域的知识。并且预训练模型以及数据存放在不同的节点上。对于智能安防具体的目标任务模型而言,不同的预训练模型的知识的可迁移性是不同的。可迁移性更好的预训练模型知识对于目标任务更有帮助。为了从若干预训练模型中选择合适的模型,本发明首先计算不同模型在目标数据集上的归因图其中表示第n个模型第k层对于第j个输入的归因图,归因图是计算特定输入的反向传播梯度得到的,归因图反映了模型对于输入的注意力区域。因而,不同模型之间归因图的距离可以作为一种模型知识可迁移性的度量。利用目标数据集计算不同模型之间的可迁移性距离如下:
本发明将可迁移分数归一化为一个离散的概率分布{P1,P2,…,PN},概率值表示选择某一个预训练模型的概率。本发明将根据概率分布{P1,P2,…,PN}有放回地采样k个模型,形成一个模型集合SM。这一模型集合将用于后续的联邦知识重组中。
3.重组联邦知识;
在不直接接触预训练模型和数据集的条件下,为了将模型集合SM的知识重组到目标模型,本发明按照过程是否发生在预训练模型的边缘节点上,将联邦知识重组划分为本地知识重组和中心知识重组两个阶段。两个阶段的划分可以避免对预训练模型的直接接触,进而保护了预训练模型和数据的隐私。
首先,本发明将目标模型Mt的参数复制到预训练模型Mn所在的节点。对于绝大多数深度模型而言,模型可以划分为编码器部分和解码器部分,编码器将原始输入编码到特征空间的向量,特征提取部分是与任务无关的,具有良好的泛化性。而解码器将特征空间的向量解码成与任务相关的输出。在本地重组的过程中,本发明迫使目标模型的特征输出和预训练的特征输出保持一致,目标模型的副本将学习到预训练模型的特征提取能力。由于预训练模型Mn和目标模型Mt的网络结构可能是异构的,目标模型和本地预训练模型的输出特征可能存在输出维度的差异,因而本发明利用3个1×1的卷积操作对齐不同模型的特征输出维度。本地重组过程中损失计算如下:
其中,ηt表示本地重组的学习率。
在中心节点的知识的重组完成以后,将会再次进行知识的选择和本地知识的重组。在迭代的学习过程中,目标模型将会从多个预训练模型中筛选和学习到可迁移的教师的表征提取能力。
4.智能安防任务适应
本发明考虑深度学习模型的拓扑结构特点,在知识重组阶段收敛完成以后,将继续在智能安防的目标任务数据集上进行训练,以获得更多与目标任务相关的知识。具体来说,这一阶段利用目标数据集对目标模型的解码器部分进行训练。在此阶段,目标模型将学习到特征映射到目标标签的能力。进而,可以在智能安防的相关任务上,如行人重识别,获得良好的表现。
本发明的优点是:可以在可以在不直接访问私密模型的情况下实现模型知识的迁移,进而在智能安防领域的目标任务上获得较好的表现;本发明与传统的只关注数据隐私的联邦学习框架不同,本发明不仅考虑到了数据隐私,还考虑到了模型的隐私。这为智能安防领域的模型共享提供了一种灵活和安全的方式。
附图说明
图1是本发明的知识选择和联邦知识重组的流程示意图。
图2是本发明的本地知识重组的示意图。
图3是本发明的联邦知识重组的流程示意图。
具体实施方式
下面结合附图,对本发明的技术方案进行清晰、完整的解释和描述。
一种面向智能安防的视觉深度模型知识重组方法,包含如下步骤:
1.收集与训练智能安防数据;
本发明首先收集安防边缘测(如摄像头)的视觉数据,明确具体的模型任务,如行人重识别,为收集的小部分数据进行标注,这一小部分标注后的数据将作为目标任务数据集DT,其中包含了M个数据样本以及标签。由于安防设备所处的环境以及昂贵的标注成本,安防设备收集的数据通常是不充分的,因而直接利用该部分数据训练学习难以获得一个表现良好的深度模型。为了让安防的深度模型拥有一定的关于目标任务的知识,首先需要利用收集的目标任务数据集训练目标任务模型。
2.选择模型知识;
预训练模型{M1,M2,…,MN}是在不同训练数据和不同的任务上训练的,因而预训练模型包含了不同领域的知识。并且预训练模型以及数据存放在不同的节点上。对于智能安防具体的目标任务模型而言,不同的预训练模型的知识的可迁移性是不同的。可迁移性更好的预训练模型知识对于目标任务更有帮助。为了从若干预训练模型中选择合适的模型,本发明首先计算不同模型在目标数据集上的归因图其中表示第n个模型第k层对于第j个输入的归因图,归因图是计算特定输入的反向传播梯度得到的,归因图反映了模型对于输入的注意力区域。因而,不同模型之间归因图的距离可以作为一种模型知识可迁移性的度量。利用目标数据集计算不同模型之间的可迁移性距离如下:
本发明将可迁移分数归一化为一个离散的概率分布{P1,P2,…,PN},概率值表示选择某一个预训练模型的概率。本发明将根据概率分布{P1,P2,…,PN}有放回地采样k个模型,形成一个模型集合SM。这一模型集合将用于后续的联邦知识重组中。(图1)
3.重组联邦知识;
在不直接接触预训练模型和数据集的条件下,为了将模型集合SM的知识重组到目标模型,本发明按照过程是否发生在预训练模型的边缘节点上,将联邦知识重组划分为本地知识重组和中心知识重组两个阶段。两个阶段的划分可以避免对预训练模型的直接接触,进而保护了预训练模型和数据的隐私。
首先,本发明将目标模型Mt的参数复制到预训练模型Mn所在的节点。对于绝大多数深度模型而言,模型可以划分为编码器部分和解码器部分,编码器将原始输入编码到特征空间的向量,特征提取部分是与任务无关的,具有良好的泛化性。而解码器将特征空间的向量解码成与任务相关的输出。在本地重组的过程中,本发明迫使目标模型的特征输出和预训练的特征输出保持一致,目标模型的副本将学习到预训练模型的特征提取能力。由于预训练模型Mn和目标模型Mt的网络结构可能是异构的,目标模型和本地预训练模型的输出特征可能存在输出维度的差异,因而本发明利用3个1×1的卷积操作对齐不同模型的特征输出维度。本地重组过程中损失计算如下:
其中,ηt表示本地重组的学习率。(图2)
在中心节点的知识的重组完成以后,将会再次进行知识的选择和本地知识的重组。在迭代的学习过程中,目标模型将会从多个预训练模型中筛选和学习到可迁移的教师的表征提取能力。(图3)
4.目标任务适应;
本发明考虑深度学习模型的拓扑结构特点,在知识重组阶段收敛完成以后,将继续在智能安防的目标任务数据集上进行训练,以获得更多与目标任务相关的知识。具体来说,这一阶段利用目标数据集对目标模型的解码器部分进行训练。在此阶段,目标模型将学习到特征映射到目标标签的能力。进而,可以在智能安防的相关任务上,如行人重识别,获得良好的表现。
本发明首先收集安防边缘测(如摄像头)的视觉数据,明确具体的模型任务,如行人重识别,为收集的小部分数据进行标注,利用收集的目标任务数据集训练目标任务模型。然后,利用归因图计算目标模型和不同预训练模型之间的可迁移分数,将归一化的可迁移分数作为模型选择的概率,可放回地采样形成模型集合;在联邦学习范式的基础上,将目标模型分发到不同的节点,利用表征蒸馏迁移预训练模型的特征提取能力,在目标模型学习和迁移完成后,通过平均的方式在中心节点进行知识重组,重组过后的模型再次分发到选择的模型节点进一步迭代。最后,再利用目标数据集进行微调目标模型,从而学习得到一个在智能安防领域的目标任务上表现良好的视觉深度模型,并且保护了数据隐私和模型隐私。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (2)
1.一种面向智能安防的视觉深度模型知识重组方法,包含如下步骤:
步骤1:收集与训练智能安防数据;
首先收集安防边缘测的视觉数据,明确具体的模型任务,为收集的小部分数据进行标注标注后的数据作为目标任务数据集DT,其中包含了M个数据样本以及标签;由于安防设备所处的环境以及昂贵的标注成本,安防设备收集的数据是不充分的,因而直接利用该部分数据训练学习难以获得一个表现良好的深度模型;为了让安防的深度模型拥有足够的关于目标任务的知识,首先需要利用收集的目标任务数据集训练目标任务模型;
步骤2:选择模型知识;
预训练模型{M1,M2,...,MN}是在不同训练数据和不同的任务上训练的,因而预训练模型包含了不同领域的知识;并且预训练模型以及数据存放在不同的节点上;对于智能安防具体的目标任务模型而言,不同的预训练模型的知识的可迁移性是不同的;可迁移性更好的预训练模型知识对于目标任务更有帮助;为了从若干预训练模型中选择合适的模型,首先计算不同模型在目标数据集上的归因图其中表示第n个模型第k层对于第j个输入的归因图,归因图是计算特定输入的反向传播梯度得到的,归因图反映了模型对于输入的注意力区域;因而,不同模型之间归因图的距离能作为一种模型知识可迁移性的度量;利用目标数据集计算不同模型之间的可迁移性距离如下:
将可迁移分数归一化为一个离散的概率分布{P1,P2,...,PN},概率值表示选择某一个预训练模型的概率;将根据概率分布{P1,P2,...,PN}有放回地采样k个模型,形成一个模型集合SM;这一模型集合将用于后续的联邦知识重组中;
步骤3:重组联邦知识;
在不直接接触预训练模型和数据集的条件下,为了将模型集合SM的知识重组到目标模型,按照过程是否发生在预训练模型的边缘节点上,将联邦知识重组划分为本地知识重组和中心知识重组两个阶段;两个阶段的划分可以避免对预训练模型的直接接触,进而保护了预训练模型和数据的隐私;
首先,将目标模型Mt的参数复制到预训练模型Mn所在的节点;深度模型能划分为编码器部分和解码器部分,编码器将原始输入编码到特征空间的向量,特征提取部分是与任务无关的,具有良好的泛化性;而解码器将特征空间的向量解码成与任务相关的输出;在本地重组的过程中,迫使目标模型的特征输出和预训练的特征输出保持一致,目标模型的副本将学习到预训练模型的特征提取能力;由于预训练模型Mn和目标模型Mt的网络结构可能是异构的,目标模型和本地预训练模型的输出特征可能存在输出维度的差异,因而利用3个1×1的卷积操作对齐不同模型的特征输出维度;本地重组过程中损失计算如下:
其中,ηt表示本地重组的学习率;
在中心节点的知识的重组完成以后,将会再次进行知识的选择和本地知识的重组;在迭代的学习过程中,目标模型将会从多个预训练模型中筛选和学习到可迁移的教师的表征提取能力;
步骤4:智能安防任务适应;
考虑深度学习模型的拓扑结构特点,在知识重组阶段收敛完成以后,将继续在智能安防的目标任务数据集上进行训练,以获得更多与目标任务相关的知识;具体来说,利用目标数据集对目标模型的解码器部分进行训练,目标模型将学习到特征映射到目标标签的能力,在智能安防的模型任务上获得良好的表现。
2.如权利要求1所述的面向边缘侧的视觉深度模型知识重组方法,其特征在于:步骤1所述的安防边缘测是摄像头,所述的模型任务是行人重识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111639661.5A CN114330554A (zh) | 2021-12-29 | 2021-12-29 | 一种面向智能安防的视觉深度模型知识重组方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111639661.5A CN114330554A (zh) | 2021-12-29 | 2021-12-29 | 一种面向智能安防的视觉深度模型知识重组方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330554A true CN114330554A (zh) | 2022-04-12 |
Family
ID=81017142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111639661.5A Pending CN114330554A (zh) | 2021-12-29 | 2021-12-29 | 一种面向智能安防的视觉深度模型知识重组方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330554A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600160A (zh) * | 2022-10-20 | 2023-01-13 | 浙江大学(Cn) | 基于积分梯度可解释算法的网络模型窃取行为的检测方法 |
KR102635611B1 (ko) * | 2022-08-12 | 2024-02-08 | 고려대학교 산학협력단 | 영상 신호 처리 장치 및 이의 영상 처리 방법 |
-
2021
- 2021-12-29 CN CN202111639661.5A patent/CN114330554A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102635611B1 (ko) * | 2022-08-12 | 2024-02-08 | 고려대학교 산학협력단 | 영상 신호 처리 장치 및 이의 영상 처리 방법 |
CN115600160A (zh) * | 2022-10-20 | 2023-01-13 | 浙江大学(Cn) | 基于积分梯度可解释算法的网络模型窃取行为的检测方法 |
CN115600160B (zh) * | 2022-10-20 | 2023-07-21 | 浙江大学 | 基于积分梯度可解释算法的网络模型窃取行为的检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114241282B (zh) | 一种基于知识蒸馏的边缘设备场景识别方法及装置 | |
CN110569886B (zh) | 一种双向通道注意力元学习的图像分类方法 | |
CN110135295A (zh) | 一种基于迁移学习的无监督行人重识别方法 | |
CN112837315B (zh) | 一种基于深度学习的输电线路绝缘子缺陷检测方法 | |
CN110135562B (zh) | 基于特征空间变化的蒸馏学习方法、系统、装置 | |
CN114330554A (zh) | 一种面向智能安防的视觉深度模型知识重组方法 | |
CN113936275A (zh) | 一种基于区域特征对齐的无监督域适应语义分割方法 | |
CN116935447B (zh) | 基于自适应师生结构的无监督域行人重识别方法及系统 | |
Xu et al. | Secure and reliable transfer learning framework for 6G-enabled Internet of Vehicles | |
CN112052818A (zh) | 无监督域适应的行人检测方法、系统及存储介质 | |
CN112633071A (zh) | 基于数据风格解耦内容迁移的行人重识别数据域适应方法 | |
CN113076963B (zh) | 一种图像识别方法、装置和计算机可读存储介质 | |
CN113449741B (zh) | 一种基于语义推断和图像理解的遥感影像定位方法及系统 | |
US20230222841A1 (en) | Ensemble Deep Learning Method for Identifying Unsafe Behaviors of Operators in Maritime Working Environment | |
CN110717513A (zh) | 一种基于多分类器的零样本深海生物图片分类方法 | |
CN117116048A (zh) | 基于知识表示模型和图神经网络的知识驱动交通预测方法 | |
CN118230175B (zh) | 基于人工智能的不动产测绘数据处理方法及系统 | |
CN114863091A (zh) | 一种基于伪标签的目标检测训练方法 | |
CN116958735A (zh) | 视觉特征提取模型的训练方法、应用方法、装置及设备 | |
CN115953643A (zh) | 基于知识蒸馏的模型训练方法、装置及电子设备 | |
CN117011714A (zh) | 基于伪标签辅助的高光谱图像分类方法 | |
CN117134978A (zh) | 基于局部和全局行为模式分析的车辆身份验证方法及系统 | |
CN111695531A (zh) | 一种基于异构卷积网络的跨域行人再识别方法 | |
CN114579794A (zh) | 特征一致性建议的多尺度融合地标图像检索方法及系统 | |
CN109784404A (zh) | 一种融合标签信息的多标签分类原型系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |