CN111091068A - 一种密度估计模型训练方法、装置、存储介质及电子设备 - Google Patents

一种密度估计模型训练方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111091068A
CN111091068A CN201911170805.XA CN201911170805A CN111091068A CN 111091068 A CN111091068 A CN 111091068A CN 201911170805 A CN201911170805 A CN 201911170805A CN 111091068 A CN111091068 A CN 111091068A
Authority
CN
China
Prior art keywords
density
estimation model
density estimation
map
density map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911170805.XA
Other languages
English (en)
Other versions
CN111091068B (zh
Inventor
翟波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Unisinsight Technology Co Ltd
Original Assignee
Chongqing Unisinsight Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Unisinsight Technology Co Ltd filed Critical Chongqing Unisinsight Technology Co Ltd
Priority to CN201911170805.XA priority Critical patent/CN111091068B/zh
Publication of CN111091068A publication Critical patent/CN111091068A/zh
Application granted granted Critical
Publication of CN111091068B publication Critical patent/CN111091068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本申请提出一种密度估计模型训练方法、装置、存储介质及电子设备。首先,结合第一类图片和第二类图片以半监督的方式训练密度估计模型,节省标注时间和人工成本;再将真实密度图和预测密度图作为密度图判别模型的输入,以获取判别结果,判别结果体现了密度估计模型的当前性能;最后,将判别结果作为附加信息更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实,在整个训练过程中,减少了对人工标注的密度图的依赖,同时提升了密度估计模型的性能。

Description

一种密度估计模型训练方法、装置、存储介质及电子设备
技术领域
本申请涉及视频智能分析技术领域,具体而言,涉及一种密度估计模型训练方法、装置、存储介质及电子设备。
背景技术
基于机器视觉的物体计数任务,与物体检测、物体识别、物体跟踪等任务一样,是机器视觉在工业界常见且重要的应用之一。目前基于机器视觉的物体计数技术广泛用于人群密度估计和计数中,具体地,人群密度估计模型是人群监控、拥挤监测、兴趣区域检测、人群统计等应用的主要技术手段。
现有技术在训练基于深度学习的人群密度估计模型时,需要准备大量的带标注数据,但是数据标注成本较高且数据积累比较缓慢,这严重制约了模型的开发改进速度和相关产品的推广。模型上线后,当需要提升模型在新场景上的准确率时,往往还需要进行较长时间的数据标注工作,而无法立即对模型的误检、漏检进行修复。
发明内容
本申请的目的在于提供一种密度估计模型训练方法、装置、存储介质及电子设备,以解决上述问题。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供一种密度估计模型训练方法,所述方法包括:将第一类图片和第二类图片作为密度估计模型的输入,以获取预测密度图,其中,所述第一类图片为有对应的真实密度图的图片,所述第二类图片为没有对应的真实密度图的图片,真实密度图为人工标注的密度图;将真实密度图和所述预测密度图作为密度图判别模型的输入,以获取判别结果,其中,所述判别结果表征输入到所述密度图判别模型的每一张密度图是否为真实密度图;将所述判别结果作为附加信息更新所述密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。
第二方面,本申请实施例提供一种密度估计模型训练装置,所述装置包括:密度估计模型单元,用于将第一类图片和第二类图片作为密度估计模型的输入,以获取预测密度图,其中,所述第一类图片为有对应的真实密度图的图片,所述第二类图片为没有对应的真实密度图的图片,真实密度图为人工标注的密度图;密度图判别模型单元,用于将真实密度图和所述预测密度图作为密度图判别模型的输入,以获取判别结果,其中,所述判别结果表征输入到所述密度图判别模型的每一张密度图是否为真实密度图;所述密度估计模型单元还用于将所述判别结果作为附加信息更新所述密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。
第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的方法。
第四方面,本申请实施例提供一种电子设备,所述电子设备包括:处理器和存储器,所述存储器用于存储一个或多个程序;当所述一个或多个程序被所述处理器执行时,实现如上述的方法。
相对于现有技术,本申请实施例所提供的一种密度估计模型训练方法、装置、存储介质及电子设备中:首先,结合第一类图片和第二类图片以半监督的方式训练密度估计模型,节省标注时间和人工成本;再将真实密度图和预测密度图作为密度图判别模型的输入,以获取判别结果,判别结果体现了密度估计模型的当前性能;最后,将判别结果作为附加信息更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实,在整个训练过程中,减少了对人工标注的密度图的依赖,同时提升了密度估计模型的性能。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为本申请实施例提供的电子设备的结构示意图;
图2为本申请实施例提供的密度估计模型训练方法的流程示意图;
图3为本申请实施例提供的S105的子步骤流程示意图;
图4为本申请实施例提供的密度估计模型训练方法的另一种流程示意图;
图5为本申请实施例提供的密度估计模型训练方法的另一种流程示意图;
图6为本申请实施例提供的密度估计模型训练方法的另一种流程示意图;
图7为本申请实施例提供的密度估计模型训练方装置的单元示意图。
图中:10-处理器;11-存储器;12-总线;201-密度估计模型单元;202-密度图判别模型单元。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本申请的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
本申请实施例提供了一种电子设备,可以是电脑、手机或者服务器。请参照图1,电子设备的结构示意图。电子设备包括处理器10、存储器11、总线12。处理器10、存储器11通过总线12连接,处理器10用于执行存储器11中存储的可执行模块,例如计算机程序。
处理器10可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,密度估计模型训练方法的各步骤可以通过处理器10中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器10可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器11可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
总线12可以是ISA(Industry Standard Architecture)总线、PCI(PeripheralComponent Interconnect)总线或EISA(Extended Industry Standard Architecture)总线等。图1中仅用一个双向箭头表示,但并不表示仅有一根总线12或一种类型的总线12。
存储器11用于存储程序,例如密度估计模型训练装置对应的程序。密度估计模型训练装置包括至少一个可以软件或固件(firmware)的形式存储于存储器11中或固化在电子设备的操作系统(operating system,OS)中的软件功能模块。处理器10在接收到执行指令后,执行所述程序以实现密度估计模型训练方法。
应当理解的是,图1所示的结构仅为电子设备的部分的结构示意图,电子设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本发明实施例提供的一种密度估计模型训练方法,可以但不限于应用于图1所示的电子设备,具体的流程,请参考图2:
S101,将第一类图片和第二类图片作为密度估计模型的输入,以获取预测密度图。
具体地,第一类图片为有对应的真实密度图的图片,第二类图片为没有对应的真实密度图的图片,真实密度图为人工标注的密度图。密度估计模型的输入由第一类图片和第二类图片共同组成。对于密度估计模型的输入并不要求对应标注有真实密度图。结合第一类图片和第二类图片以半监督的方式训练密度估计模型,节省标注时间和人工成本。
S102,将真实密度图和预测密度图作为密度图判别模型的输入,以获取判别结果。
具体地,判别结果表征输入到密度图判别模型的每一张密度图是否为真实密度图。在一种可能的实现方式中,密度图判别模型通过输出0或1表征当前输入的密度图为预测密度图或者真实密度图。密度图判别模型用于检测密度估计模型生成的预测密度图是否与人工标注的密度图足够相似,即用于检验预测密度图是否足够真实。
例如,当判别结果表征一定数量或者一定比例的预测密度图为真实密度图时,即表示密度估计模型生成的预测密度图与人工标注的密度图足够相似,即密度估计模型的当前性能较好。
S105,将判别结果作为附加信息更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。
具体地,判别结果体现了密度估计模型的当前性能,将当前性能作为附加信息可以适应性更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。
综上所述,本申请实施例中的密度估计模型训练方法中:首先,结合第一类图片和第二类图片以半监督的方式训练密度估计模型,节省标注时间和人工成本;再将真实密度图和预测密度图作为密度图判别模型的输入,以获取判别结果,判别结果体现了密度估计模型的当前性能;最后,将判别结果作为附加信息更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实,在整个训练过程中,减少了对人工标注的密度图的依赖,同时提升了密度估计模型的性能。
对于上文中的密度估计模型,本申请实施例给出了一种可能的构建方法,以人群密度估计模型为例,构建基于深度学习的人群密度估计模型,该模型的输入为预设尺寸的目标图片(即第一类图片和第二类图片),输出为目标图片对应的人群密度图片(又称为密度图或热力图,携带人群密度信息)。对所获人群密度图片中的密度求和即可得到人群计数(即单张图片的人群计数)。人群密度模型的组成主要包含特征提取卷积网络(用于提取人头特征)、密度图拟合网络(用于生成密度图片),优选的,可在模型中添加全卷积网络提升特征提取能力。
对于上文中的密度图判别模型,本申请实施例给出了一种可能的构建方法,构建基于深度学习的密度图判别模型,该判别模型为一个二分类网络,用于判断输入密度图是否为真实密度图。该模型的输入为预设尺寸的密度图(包含真实密度图和预测密度图),依据密度图携带的纹理信息,得到对应密度图为真实密度图的概率值,从而判断输入到密度图攀比模型中的每一张图片是否为真实密度图。密度图判别模型的组成主要包含特征提取卷积网络、全连接层、softmax层,其中全连接层的输出维数为2。
在图2的基础上,对于S105中的内容,本申请实施例还给出了一种可能的实现方式,请参考图3,S105包括:
S105-1,依据所述判别结果生成第一损失函数。
其中,第一损失函数表征预测密度与真实密度图的差异度。
可能地,第一损失函数的表达式如下:
Figure BDA0002288668850000091
其中,LA表示第一损失函数,unlabeled和labeled表示预测密度图,gD为判别网络的输出。
S105-1,将第一损失函数作为附加信息更新密度估计模型。
具体地,将第一损失函数作为附加信息更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实、与真实密度图之间的差异度更小。
可能地,更新密度估计模型还需要依据该密度估计模型自身的损失函数。
在图3的基础上,对于何时结束密度估计模型的训练,本申请实施例还给出了一种可能的实现方式,请参考图4,密度估计模型训练方法还包括:
S106,判断第一损失函数是否变小。若是,则执行S107;若否,则执行S111。
具体地,第一损失函数表征预测密度与真实密度图的差异度。差异度越小,表明预测密度图与人工标注的密度图越接近,即预测密度图越真实。当第一损失函数未变小时,说明密度估计模型的当前性能最优,此时可以停止继续训练,则执行S111。反之,则需要继续判断是否需要重复训练密度估计模型,则执行S107。
S107,判断变化值是否大于第一阈值。若是,则执行S109;若否,则执行S111。
当变化值较小,例如小于第一阈值时,表示训练对于密度估计模型的性能改善的作用相对较小,此时执行S111。反之,则需要继续判断是否需要重复训练密度估计模型,则执行S109。
S109,判断训练轮次是否小于预设次数。若是,则执行S110;若否,则执行S111。
S110,通过第一类图片训练密度估计模型。
具体地,当需要重新训练密度估计模型时,重新选择一定数量的第一类图片作为密度估计模型的输入,输出对应的预测密度图(此处指第一类图片对应的预测密度图)。在依据预测密度图和第一类图片对应的真实密度图,计算第三损失函数(即密度估计模型自身的损失函数),第三损失函数的表达式如下:
Figure BDA0002288668850000101
其中,LG表征第三损失函数,C为一次训练所输入的图片数量,pG(c)表征密度估计模型输出的第c张图片对应的密度图,pGT(c)表示第c张图片对应的真实密度图,||*||2 2表示L2正则项。
通过第三损失函数计算出预测密度图和真实密度图之间的像素级L2误差。并依据第三损失函数更新训练密度估计模型。
判断依据第三损失函数更新训练密度估计模型的轮次是否大于预设轮数。若否,则重新选择一定数量的第一类图片作为密度估计模型的输入,以再次训练密度估计模型;若是,则执行S101,以对密度估计模型的性能进行检验,并依据检验结果更新密度估计模型。
S111,停止训练密度估计模型。
对于本申请实施例中的判断第一损失函数是否变小以及变化值是否大于第一阈值,还给出了一种可能的实现方式,连续比较多次的第一损失函数,判断连续多次的第一损失函数是否在变小,且判断两两之间的变化最大值是否大于第一阈值。
在图3的基础上,对于何时结束密度估计模型的训练,本申请实施例还给出了一种可能的实现方式,请参考图5,密度估计模型训练方法还包括:
S108,判断第一损失函数是否大于第二阈值。若是,则执行S109;若否,则执行S111。
当第一损失函数小于或等于第二阈值时,表示预测密度图与真实密度图的差异度足够小,此时密度估计模型的性能已经满足需求,此时可以执行S111。反之,则需要继续判断是否需要重复训练密度估计模型,则执行S109。
在图2的基础上,对于密度图判别模型的性能提升,本申请实施例还给出了一种可能的实现方式,请参考图6,密度估计模型训练方法还包括:
S103,依据判别结果生成第二损失函数。
其中,第二损失函数表征所述密度图判别模型识别真实密度图和预测密度图的误差。第二损失函数的表达式如下:
Figure BDA0002288668850000111
其中,LD表征第二损失函数,real表示真实密度图,unlabeled和labeled表示预测密度图,gD为判别网络的输出。
S104,依据第二损失函数更新密度图判别模型,以使判别结果更精确。
当密度图判别模型的性能提升后,其输出的判别结果更精准,更有利于训练密度估计模型,提升密度估计模型的性能。
请参阅图7,图7为本申请实施例提供的一种密度估计模型训练装置,可选的,该密度估计模型训练装置被应用于上文所述的电子设备。
密度估计模型训练装置包括:密度估计模型单元201和密度图判别模型单元202。
密度估计模型单元201,用于将第一类图片和第二类图片作为密度估计模型的输入,以获取预测密度图,其中,第一类图片为有对应的真实密度图的图片,第二类图片为没有对应的真实密度图的图片,真实密度图为人工标注的密度图。具体地,密度估计模型单元201可以执行上述的S101。
密度图判别模型单元202,用于将真实密度图和预测密度图作为密度图判别模型的输入,以获取判别结果,其中,判别结果表征输入到密度图判别模型的每一张密度图是否为真实密度图。具体地,密度图判别模型单元202可以执行上述的S102。
密度估计模型单元201还用于将判别结果作为附加信息更新密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。具体地,密度估计模型单元201可以执行上述的S105。
在一种可能的实现方式中,密度估计模型单元201具体用于依据判别结果生成第一损失函数,其中,第一损失函数表征预测密度与真实密度图的差异度;将第一损失函数作为附加信息更新密度估计模型。具体地,密度估计模型单元201可以执行上述的S105-1和S105-2。
可能地,密度估计模型单元201还用于当第一损失函数大于第二阈值时,判断训练轮次是否小于预设次数;若是,则通过第一类图片训练密度估计模型。具体地,密度估计模型单元201可以执行上述的S108~S111。
需要说明的是,本实施例所提供的密度估计模型训练装置,其可以执行上方法流程实施例所示的方法流程,以实现对应的技术效果。为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。
本发明实施例还提供了一种存储介质,该存储介质存储有计算机指令、程序,该计算机指令、程序在被读取并运行时执行上述实施例的密度估计模型训练方法。该存储介质可以包括内存、闪存、寄存器或者其结合等。
下面提供一种电子设备,可以是如手机电脑一样的智能终端,如图1所示的电子设备,可以实现上述的密度估计模型训练方法;具体的,该电子设备包括:处理器10,存储器11、总线12。处理器10可以是CPU。存储器11用于存储一个或多个程序,当一个或多个程序被处理器10执行时,执行上述实施例的密度估计模型训练方法。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种密度估计模型训练方法,其特征在于,所述方法包括:
将第一类图片和第二类图片作为密度估计模型的输入,以获取预测密度图,其中,所述第一类图片为有对应的真实密度图的图片,所述第二类图片为没有对应的真实密度图的图片,真实密度图为人工标注的密度图;
将真实密度图和所述预测密度图作为密度图判别模型的输入,以获取判别结果,其中,所述判别结果表征输入到所述密度图判别模型的每一张密度图是否为真实密度图;
将所述判别结果作为附加信息更新所述密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。
2.如权利要求1所述的密度估计模型训练方法,其特征在于,所述将所述判别结果作为附加信息更新所述密度估计模型的步骤,包括:
依据所述判别结果生成第一损失函数,其中,所述第一损失函数表征所述预测密度与所述真实密度图的差异度;
将所述第一损失函数作为所述附加信息更新所述密度估计模型。
3.如权利要求2所述的密度估计模型训练方法,其特征在于,在所述将所述第一损失函数作为所述附加信息更新所述密度估计模型之后,所述方法还包括:
当所述第一损失函数变小,且变化值大于第一阈值时,判断训练轮次是否小于预设次数;
若是,则通过第一类图片训练所述密度估计模型。
4.如权利要求2所述的密度估计模型训练方法,其特征在于,在所述将所述第一损失函数作为所述附加信息更新所述密度估计模型之后,所述方法还包括:
当所述第一损失函数大于第二阈值时,判断训练轮次是否小于预设次数;
若是,则通过第一类图片训练所述密度估计模型。
5.如权利要求1所述的密度估计模型训练方法,其特征在于,在将真实密度图和所述预测密度图作为密度图判别模型的输入,以获取判别结果之后,所述方法还包括:
依据所述判别结果生成第二损失函数,其中,所述第二损失函数表征所述密度图判别模型识别所述真实密度图和所述预测密度图的误差;
依据所述第二损失函数更新所述密度图判别模型,以使所述判别结果更精确。
6.一种密度估计模型训练装置,其特征在于,所述装置包括:
密度估计模型单元,用于将第一类图片和第二类图片作为密度估计模型的输入,以获取预测密度图,其中,所述第一类图片为有对应的真实密度图的图片,所述第二类图片为没有对应的真实密度图的图片,真实密度图为人工标注的密度图;
密度图判别模型单元,用于将真实密度图和所述预测密度图作为密度图判别模型的输入,以获取判别结果,其中,所述判别结果表征输入到所述密度图判别模型的每一张密度图是否为真实密度图;
所述密度估计模型单元还用于将所述判别结果作为附加信息更新所述密度估计模型,以使更新后的密度估计模型输出的预测密度图更真实。
7.如权利要求6所述的密度估计模型训练装置,其特征在于,所述密度估计模型单元具体用于依据所述判别结果生成第一损失函数,其中,所述第一损失函数表征所述预测密度与所述真实密度图的差异度;将所述第一损失函数作为所述附加信息更新所述密度估计模型。
8.如权利要求7所述的密度估计模型训练装置,其特征在于,所述密度估计模型单元还用于当所述第一损失函数大于第二阈值时,判断训练轮次是否小于预设次数;若是,则通过第一类图片训练所述密度估计模型。
9.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
10.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储一个或多个程序;当所述一个或多个程序被所述处理器执行时,实现如权利要求1-5中任一项所述的方法。
CN201911170805.XA 2019-11-26 2019-11-26 一种密度估计模型训练方法、装置、存储介质及电子设备 Active CN111091068B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911170805.XA CN111091068B (zh) 2019-11-26 2019-11-26 一种密度估计模型训练方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911170805.XA CN111091068B (zh) 2019-11-26 2019-11-26 一种密度估计模型训练方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111091068A true CN111091068A (zh) 2020-05-01
CN111091068B CN111091068B (zh) 2021-07-20

Family

ID=70394197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911170805.XA Active CN111091068B (zh) 2019-11-26 2019-11-26 一种密度估计模型训练方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111091068B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112001274A (zh) * 2020-08-06 2020-11-27 腾讯科技(深圳)有限公司 人群密度确定方法、装置、存储介质和处理器
CN112464218A (zh) * 2020-12-04 2021-03-09 北京知道未来信息技术有限公司 模型训练方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2704060A2 (en) * 2012-09-03 2014-03-05 Vision Semantics Limited Crowd density estimation
CN105528589A (zh) * 2015-12-31 2016-04-27 上海科技大学 基于多列卷积神经网络的单张图像人群计数算法
CN108764085A (zh) * 2018-05-17 2018-11-06 上海交通大学 基于生成对抗网络的人群计数方法
CN108959522A (zh) * 2018-04-26 2018-12-07 浙江工业大学 基于半监督对抗生成网络的迁移检索方法
CN108985331A (zh) * 2018-06-14 2018-12-11 浙江工业大学 一种基于对抗生成网络的目标计数方法
CN109214337A (zh) * 2018-09-05 2019-01-15 苏州大学 一种人群统计方法、装置、设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2704060A2 (en) * 2012-09-03 2014-03-05 Vision Semantics Limited Crowd density estimation
CN105528589A (zh) * 2015-12-31 2016-04-27 上海科技大学 基于多列卷积神经网络的单张图像人群计数算法
CN108959522A (zh) * 2018-04-26 2018-12-07 浙江工业大学 基于半监督对抗生成网络的迁移检索方法
CN108764085A (zh) * 2018-05-17 2018-11-06 上海交通大学 基于生成对抗网络的人群计数方法
CN108985331A (zh) * 2018-06-14 2018-12-11 浙江工业大学 一种基于对抗生成网络的目标计数方法
CN109214337A (zh) * 2018-09-05 2019-01-15 苏州大学 一种人群统计方法、装置、设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
EASO.WXD: "系统学习机器学习之弱监督学习(二)--半监督学习综述", 《CSDN》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112001274A (zh) * 2020-08-06 2020-11-27 腾讯科技(深圳)有限公司 人群密度确定方法、装置、存储介质和处理器
CN112001274B (zh) * 2020-08-06 2023-11-17 腾讯科技(深圳)有限公司 人群密度确定方法、装置、存储介质和处理器
CN112464218A (zh) * 2020-12-04 2021-03-09 北京知道未来信息技术有限公司 模型训练方法、装置、电子设备及存储介质
CN112464218B (zh) * 2020-12-04 2024-04-05 北京知道未来信息技术有限公司 模型训练方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111091068B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN112560999B (zh) 一种目标检测模型训练方法、装置、电子设备及存储介质
CN112488218A (zh) 图像分类方法、图像分类模型的训练方法和装置
CN111091068B (zh) 一种密度估计模型训练方法、装置、存储介质及电子设备
CN110349138B (zh) 基于实例分割框架的目标物体的检测方法及装置
CN113328994B (zh) 一种恶意域名处理方法、装置、设备及机器可读存储介质
CN110490058B (zh) 行人检测模型的训练方法、装置、系统和计算机可读介质
CN114943307A (zh) 一种模型训练的方法、装置、存储介质以及电子设备
CN115035347A (zh) 图片识别方法、装置及电子设备
CN112990172A (zh) 一种文本识别方法、字符识别方法及装置
CN113919418A (zh) 基于小样本的分类模型训练方法、装置及电子设备
CN114120071A (zh) 一种带有对象标注框图像的检测方法
CN111340139B (zh) 一种图像内容复杂度的判别方法及装置
CN115567371B (zh) 一种异常检测方法、装置、设备及可读存储介质
WO2021051568A1 (zh) 路网拓扑结构的构建方法、装置、计算机设备及存储介质
CN111611388A (zh) 账号分类方法、装置和设备
CN111860623A (zh) 基于改进ssd神经网络的统计树木数量的方法及系统
CN116502700A (zh) 皮肤检测模型训练方法、皮肤检测方法、装置及电子设备
CN112785595A (zh) 目标属性检测、神经网络训练及智能行驶方法、装置
CN114065868B (zh) 文本检测模型的训练方法、文本检测方法及装置
CN115393755A (zh) 视觉目标跟踪方法、装置、设备以及存储介质
CN114330542A (zh) 一种基于目标检测的样本挖掘方法、装置及存储介质
CN114373088A (zh) 一种图像检测模型的训练方法和相关产品
CN113298122A (zh) 目标检测方法、装置和电子设备
CN112784691A (zh) 一种目标检测模型训练方法、目标检测方法和装置
CN114648713A (zh) 视频分类方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant