CN110458114B - 一种人数确定方法、装置及存储介质 - Google Patents

一种人数确定方法、装置及存储介质 Download PDF

Info

Publication number
CN110458114B
CN110458114B CN201910748518.6A CN201910748518A CN110458114B CN 110458114 B CN110458114 B CN 110458114B CN 201910748518 A CN201910748518 A CN 201910748518A CN 110458114 B CN110458114 B CN 110458114B
Authority
CN
China
Prior art keywords
people
predicted
scene image
weighting parameter
analyzed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910748518.6A
Other languages
English (en)
Other versions
CN110458114A (zh
Inventor
杜波
叶泽聪
高志强
袁琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201910748518.6A priority Critical patent/CN110458114B/zh
Publication of CN110458114A publication Critical patent/CN110458114A/zh
Application granted granted Critical
Publication of CN110458114B publication Critical patent/CN110458114B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种人数确定方法、装置及存储介质,该方法包括根据第一神经网络模型对待分析场景图像进行分析,得到待分析场景图像的第一预测人数;判断第一预测人数是否超过第一阈值;若为否,则根据第一预测人数确定待分析场景图像的实际人数;若为是,则根据第二神经网络模型对待分析场景图像进行分析,得到待分析场景图像的第二预测人数;根据第一预测人数和第二预测人数确定待分析场景图像的实际人数。

Description

一种人数确定方法、装置及存储介质
技术领域
本申请涉及图像识别技术领域,具体而言,涉及一种人数确定方法、装置及存储介质。
背景技术
目前,我国城市中各大型公共场所人流量较大、尤其是在节假日期间易造成拥堵,极易出现重大的安全事故,但现在对于公共场所的人流监测主要依靠人力实地目测或抽样统计等方法,存在着耗时耗力,人力成本高的问题。
发明内容
本申请实施例的目的在于提供一种人数确定方法、装置及存储介质,用以解决现在对于公共场所的人流监测主要依靠人力实地目测或抽样统计等方法,存在的耗时耗力,人力成本高的问题。
为了实现上述目的,本申请提供了以下技术方案如下:
第一方面:本申请提供一种人数确定方法,所述方法包括根据第一神经网络模型对待分析场景图像进行分析,得到所述待分析场景图像的第一预测人数;判断所述第一预测人数是否超过第一阈值;若为否,则根据所述第一预测人数确定所述待分析场景图像的实际人数;若为是,则根据第二神经网络模型对所述待分析场景图像进行分析,得到所述待分析场景图像的第二预测人数;根据所述第一预测人数和第二预测人数确定所述待分析场景图像的实际人数。
在上述设计的方案中,在待分析的场景图像人数较少时采用单神经网络模型算法进行快速预测,在待分析场景图像人数超过阈值(人数较多时)采用两种神经网络模型算法的结果来进行结合预测,根据第一预测人数与阈值相比较的设定,使得本方案能够在单模型和双模型两种模式下互相转换,在人数较少时可以有效的节约计算资源,提高预测效率,能够在短时间识别出预测人数;在人数较多时对场景图像中人数的预测更加准确,也对场景图像对应的区域的人流信息掌控得更加准确。
在第一方面的可选实施方式中,所述根据所述第一预测人数和第二预测人数确定所述待分析场景图像的实际人数,包括:根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数。
在上述设计的实施方式中,通过对第一预测人数和第二预测人数进行不同的加权后来获得带分析场景图像的实际人数,使得最终确定的待分析场景图像的实际人数更加准确。
在第一方面的可选实施方式中,在所述根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数之前,所述方法还包括:判断所述第一预测人数和第二预测人数之间相差人数是否超过预设的第二阈值;若是,则执行所述根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数的步骤;若否,则比较所述第一预测人数和第二预测人数的数值,将较小数值的预测人数作为所述待分析场景图像的实际人数。
在上述设计的实施方式中,在对第一预测人数和第二预测人数进行不同的加权之前,判断第一预测人数和第二预测人数相差人数是否超过预设的第二阈值,若超过,则进行加权,若不超过则将较小数值的预测人数作为所述待分析场景图像的实际人数,使得加权场景具有针对性,使得最终确定的待分析场景图像的实际人数更加准确。
在第一方面的可选实施方式中,所述实际人数L为:
L=αN1+(1-α)N2
其中,L为实际人数,N1为第一预测人数,N2为第二预测人数,α为第一加权参数,1-α为第二加权参数。
在第一方面的可选实施方式中,所述方法还包括:根据第一神经网络模型对已标注场景图像进行分析,得到所述已标注场景图像的第一预测人数;根据第二神经网络模型对已标注场景图像进行分析,得到所述已标注场景图像的第二预测人数;获取第一初始加权参数,根据所述已标注场景图像的第一预测人数、第二预测人数和标注人数对所述第一初始加权参数进行更新迭代,得到对应的所述第一加权参数。
在第一方面的可选实施方式中,所述获取第一初始加权参数,根据所述已标注场景图像的第一预测人数、第二预测人数和标注人数对所述第一初始加权参数进行更新迭代,得到对应的所述第一加权参数,包括:获取第一初始加权参数;根据所述已标注场景图像的第一预测人数、第二预测人数和第一初始加权参数,确定所述已标注场景图像的实际人数;判断所述已标注场景图像的实际人数与所述已标注场景图像的标注人数的差值是否在预设的阈值范围内;若为否,则对所述第一初始加权参数进行调节得到调节后的第一初始加权参数,并返回执行所述获取第一初始加权参数的步骤;若为是,则将所述第一初始加权参数作为第一加权参数。
在上述设计的两个实施方式中,加权参数通过更新迭代的方式来获得,使得最终确定的实际人数更加准确。
在第一方面的可选实施方式中,在所述确定所述待分析场景图像的实际人数之后,还包括:获取多张待分析场景图像分别对应的实际人数,所述多张待分析场景图像为同一地点且预设时间段内的连续多张实时场景图像;判断所述多张待分析场景图像分别对应的实际人数之和是否超过预设的第三阈值;若是,则进行安全预警。
在上述设计的实施方式中,通过人流量预警方式能够及时预防危险事件的发生。
第二方面:本申请提供一种人数确定装置,所述装置包括分析模块,用于根据第一神经网络模型对待分析场景图像进行分析,得到所述待分析场景图像的第一预测人数;判断模块,用于判断所述第一预测人数是否超过第一阈值;确定模块,用于在所述第一预测人数不超过第一阈值后,根据所述第一预测人数确定所述待分析场景图像的实际人数;所述分析模块,还用于在所述第一预测人数超过第一阈值后,根据第二神经网络模型对所述待分析场景图像进行分析,得到所述待分析场景图像的第二预测人数;所述确定模块,还用于根据所述第一预测人数和第二预测人数确定所述待分析场景图像的实际人数。
在上述设计的装置中,在待分析的场景图像人数较少时采用单神经网络模型算法进行快速预测,在待分析场景图像人数超过阈值(人数较多时)采用两种神经网络模型算法的结果来进行结合预测,根据第一预测人数与阈值相比较的设定,使得本方案能够在单模型和双模型两种模式下互相转换,在人数较少时可以有效的节约计算资源,提高预测效率,能够在短时间识别出预测人数;在人数较多时对场景图像中人数的预测更加准确,也对场景图像对应的区域的人流信息掌控得更加准确。
在第二方面的可选实施方式中,所述确定模块,具体用于:根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数。
在第二方面的可选实施方式中,所述判断模块还用于判断所述第一预测人数和第二预测人数之间相差人数是否超过预设的第二阈值;执行模块,用于在所述第一预测人数和第二预测人数之间相差人数超过预设的第二阈值后,执行所述根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数的步骤;比较模块,用于在所述第一预测人数和第二预测人数之间相差人数不超过预设的第二阈值后,比较所述第一预测人数和第二预测人数的数值,将较小数值的预测人数作为所述待分析场景图像的实际人数。
在第二方面的可选实施方式中,所述分析模块,还用于根据第一神经网络模型对已标注场景图像进行分析,得到所述已标注场景图像的第一预测人数;根据第二神经网络模型对已标注场景图像进行分析,得到所述已标注场景图像的第二预测人数;获取模块,用于获取第一初始加权参数;更新迭代模块,用于根据所述已标注场景图像的第一预测人数、第二预测人数和标注人数对所述第一初始加权参数进行更新迭代,得到对应的所述第一加权参数。
在第二方面的可选实施方式中,所述更新迭代模块,具体用于:获取第一初始加权参数;根据所述已标注场景图像的第一预测人数、第二预测人数和第一初始加权参数,确定所述已标注场景图像的实际人数;判断所述已标注场景图像的实际人数与所述已标注场景图像的标注人数的差值是否在预设的阈值范围内;若为否,则对所述第一初始加权参数进行调节得到调节后的第一初始加权参数,并返回执行所述获取第一初始加权参数的步骤;若为是,则将所述第一初始加权参数作为第一加权参数。
在第二方面的可选实施方式中,所述获取模块,还用于获取多张待分析场景图像分别对应的实际人数,所述多张待分析场景图像为同一地点且预设时间段内的连续多张实时场景图像;所述判断模块,还用于判断所述多张待分析场景图像分别对应的实际人数之和是否超过预设的第三阈值;安全预警模块,用于在判断所述多张待分析场景图像分别对应的实际人数之和超过预设的第三阈值之后,进行安全预警。
第三方面:本申请还提供了一种电子设备,包括:处理器、与处理器连接的存储器,所述存储器存储有计算机程序,当所述计算设备运行时,处理器执行该计算机程序,以执行时执行第一方面、第一方面的任一可选的实现方式中的所述方法。
第四方面:本申请提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面、第一方面的任一可选的实现方式中的所述方法。
第五方面:本申请提供了一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行第一方面、第一方面的任一可选的实现方式中的所述方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请第一实施例提供的人数确定方法的第一流程图;
图2为本申请第一实施例提供的人数确定方法的第二流程图;
图3为本申请第一实施例提供的人数确定方法的第三流程图;
图4为本申请第一实施例提供的人数确定方法的第四流程图;
图5为本申请第一实施例提供的人数确定方法的第五流程图;
图6为本申请第一实施例提供的人数确定方法的第六流程图;
图7为本申请第二实施例提供的人数确定装置的结构示意图;
图8为本申请第三实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
第一实施例
如图1所示,本申请提供一种人数确定方法,应用于边缘终端或者是云端服务器,该人数确定方法具体包括如下步骤:
步骤S100:根据第一神经网络模型对待分析场景图像进行分析,得到待分析场景图像的第一预测人数。
步骤S102:判断第一预测人数是否超过第一阈值,若不超过,则转到步骤S104;若超过,则转到步骤S106。
步骤S104:根据第一预测人数确定待分析场景图像的实际人数。
步骤S106:根据第二神经网络模型对待分析场景图像进行分析,得到待分析场景图像的第二预测人数,转到步骤S108。
步骤S108:根据第一预测人数和第二预测人数确定待分析场景图像的实际人数。
在步骤S100中,根据第一神经网络模型对待分析场景图像进行分析,其中,待分析场景图像可以为实时图像。该待分析场景图像获得的方式可为通过提取实时的监控视频数据中的图像的方式,其具体可为:使用调用函数调用摄像头,读取摄像头中视频流信息,获得该视频流信息中每一帧的场景图像。
另外,根据第一神经网络模型对待分析场景图像进行分析可以是调用具有图像人数识别的神经网络来进行人数预测。因为要求对实时图像进行人数识别,其利用的第一神经网络模型需要有较强的识别效率,例如,YOLO v3算法,YOLO v3算法识别一帧视频图像所需要的时间约为0.47秒,具体是以肩和头部为主要特征进行针对性识别。进而根据第一神经网络模式识别出的人数获得第一预测人数。
在步骤S100获得待分析场景图像的第一预测人数之后,执行步骤S102,判断该第一预测人数是否超过第一阈值,在判断第一预测人数不超过第一阈值时,则执行步骤S104根据第一预测人数确定待分析场景图像的实际人数,具体是,将第一预测人数进行输出作为该待分析场景图像的实际人数。
其中,第一阈值的数值设定可对第一神经网络模型预测进行多次测试之后来确定第一神经网络模型预测的精度范围。具体可以是将多张不同人数的图像由第一神经网络模型来进行预测,例如,使用图像中有10人、20人、30人、40人的图像输入第一神经网络模型中,观察其输出的预测人数,如果对10人和20人的输出结果都是准确的,而对30人的图像进行预测后得到的人数为27人,那么则说明其预测精度是在20人到30人之间,接着将20~30之间不同人数的图像输入第一神经网络模型,观察其输出情况,多次使用上述方法,可以最终确定第一阈值的数值。
另外,设置步骤S102判断第一预测人数是否超过第一阈值的目的在于,在有些时间段或有些特殊地点,监控视频中的人数会比较多,拍摄得到的待分析场景图像中人们之间的间距过小,个体之间遮挡严重,此时,利用第一神经网络模型预测的第一预测人数可能不够准确。例如,以前述所说第一神经网络模型为YOLO v3算法为例,YOLO v3算法具有识别效率高的特点,但是如果待分析图像中的人数过多,个体之间遮挡严重,YOLO v3算法此时虽然识别效率高,但精度不够,识别出的第一预测人数可能与待分析场景图像中的实际人数相差过大。因此,在第一神经网络模型输出第一预测人数之后,需要判断该第一预测人数是否超过第一阈值,如果超过了这个阈值,则说明该待分析图像中的人数过多,第一神经网络模型得到的第一预测人数可能不够准确,需要执行步骤S106~步骤S108来进一步准确的确定待分析图像中的人数。
在上述的基础上,步骤S106为:根据第二神经网络模型对该待分析场景图像进行分析,输出第二预测人数。其中,第二神经网络模型与第一神经网络模型是不同的。例如,第一神经网络模型为YOLO v3算法,第二神经网络模型为Faster R-CNN算法。
但神经网络模型进行图像人数识别过程时,由于实时图像中的人数过多造成像素不清晰,因而容易发生漏认或者错认的情况,因此,在步骤S106获得第二预测人数之后,执行步骤S108,根据第一预测人数和第二预测人数确定待分析场景图像的实际人数。其中,步骤S108可以这样理解,由于第一预测人数和第二预测人数都可能存在准确度低的问题,那么此时则通过第一神经网络模型输出的第一预测人数和第二神经网络模型输出的第二预测人数两者结合来确定待分析场景图像的实际人数,使得待分析场景图像的实际人数的确定更加准确。
上述设计的方案,首先通过第一神经网络模型对待分析的场景图像进行分析,得到第一预测人数,在获得第一预测人数之后判断其是否超过预设的第一阈值,若没超过,则对第一预测人数进行输出;若超过则利用第二神经网络对该待分析的场景图像进行分析,得到第二预测人数,最终结合第一预测人数和第二预测人数来获得该待分析场景图像的实际人数。在本方案中在待分析的场景图像人数较少时采用单神经网络模型算法进行快速预测,在待分析场景图像人数超过阈值(人数较多时)采用两种神经网络模型算法的结果来进行结合预测,根据第一预测人数与阈值相比较的设定,使得本方案能够在单模型和双模型两种模式下互相转换,在人数较少时可以有效的节约计算资源,提高预测效率,能够在短时间识别出预测人数;在人数较多时对场景图像中人数的预测更加准确,也对场景图像对应的区域的人流信息掌控得更加准确。
在本实施例的可选实施方式中,步骤S108根据第一预测人数和第二预测人数确定待分析场景图像的实际人数,如图2所示,具体可为:步骤S1080:根据第一预测人数及其对应的第一加权参数与第二预测人数及其对应的第二加权参数,得到待分析场景图像的实际人数。
步骤S1080具体可以这样理解:在步骤S1080之前分别根据第一神经网络模型得到第一预测人数和第二神经网络模型得到第二预测人数,此时,可以对第一预测人数和第二预测人数分别加权,根据对第一预测人数和第二预测人数实行不同的加权来得到待分析场景图像的实际人数。
在上述实施方式中,通过对第一预测人数和第二预测人数进行不同的加权后来获得带分析场景图像的实际人数,使得最终确定的待分析场景图像的实际人数更加准确。
在本实施例的可选实施方式中,如图3所示,在步骤S1080之前,该方法还包括:
步骤S1070:判断第一预测人数和第二预测人数的相差人数是否超过预设的第二阈值;若是,则转到步骤S1072;若否,则转到步骤S1074。
步骤S1072:转到步骤S1080。
步骤S1074:比较第一预测人数和第二预测人数的数值,将较小数值的预测人数作为待分析场景图像的实际人数。
由于获取的实时图像人数较多,神经网络模型进行人数识别时会发生漏认或错认的情况,漏认表示为将图像中的人遗漏,造成识别出的人数过少,错认表示为对图像中的一些事物错误的识别为人,造成识别出的人数过多。
此时可能会出现以下几种情况,第一,当第一神经网络模型和第二神经网络模型出现漏认的情况时,例如,通过第一神经网络模型获得该已标注场景图像的第一预测人数为27人,通过第二神经网络模型获得该已标注场景图像的第二预测人数为28人。
第二,当第一神经网络模型出现漏认、第二神经网络模型出现错认的情况时,例如,通过第一神经网络模型获得该已标注场景图像的第一预测人数为27人,通过第二神经网络模型获得该已标注场景图像的第二预测人数为31人。
第三,当第一神经网络模型和第二神经网络模型同时出现错认的情况时,例如,通过第一神经网络模型获得该已标注场景图像的第一预测人数为31人,通过第二神经网络模型获得该已标注场景图像的第二预测人数为32人。
在此基础上,执行步骤S1070,判断第一预测人数和第二预测人数的相差人数是否超过预设的第二阈值,例如,预设的阈值设置为3,表示第一预测人数和第二预测人数相差人数大于3则表示超过预设的第二阈值,那么依照前述的举例,第二种情况时第一预测人数和第二预测人数相差人数为4超过预设的第二阈值,此时,则执行步骤S1072,转到步骤S1080根据第一预测人数机器对应的第一加权参数与第二预测人数及其对应的第二加权参数,得到待分析场景图像的实际人数。
那么,第一和第三两种情况,由于第一预测人数和第二预测人数相差人数为1,没有超过预设的第二阈值,此时则执行步骤S1074比较第一预测人数和第二预测人数的数值,将较小数值的预测人数作为待分析场景图像的实际人数。
在上述设计的实施方式中,在对第一预测人数和第二预测人数进行不同的加权之前,判断第一预测人数和第二预测人数相差人数是否超过预设的第二阈值,若超过,则进行加权,若不超过则将较小数值的预测人数作为所述待分析场景图像的实际人数,使得加权场景具有针对性,使得最终确定的待分析场景图像的实际人数更加准确。
在本实施例的可选实施方式中,由于前述步骤S1070~步骤S1074只是本方案中的一种实施方式,因此,除了前述提到的第二种情况可以执行步骤S1080外,第一种情况和第三种情况同样可以执行步骤S1080来确定待分析场景图像的实际人数。
步骤S1080根据第一预测人数机器对应的第一加权参数与第二预测人数及其对应的第二加权参数,得到待分析场景图像的实际人数,具体可为,设实际人数L为:
L=αN1+(1-α)N2
其中,L为实际人数,N1为第一预测人数,N2为第二预测人数,α为第一加权参数,1-α为第二加权参数;第一加权参数α可根据多次调试后获得。
在本实施例的可选实施方式中,在前述实施方式中已经提到第一加权参数α可根据多次调试后获得,如图4所示,其具体方法可为以下步骤:
步骤S90:根据第一神经网络模型对已标注场景图像进行分析,得到已标注场景图像的第一预测人数。
步骤S92:根据第二神经网络模型对已标注场景图像进行分析,得到已标注场景图像的第二预测人数。
步骤S94:获取第一初始加权参数,根据已标注场景图像的第一预测人数、第二预测人数和标注人数对第一初始加权参数进行更新迭代,得到对应的第一加权参数。
在步骤S90~S94中的第一神经网络模型和第二神经网络模型与步骤S100~108中的第一神经网络模型和第二神经网络模型相对应。另外,已标注场景图像是指已进行标注图像中的人数的场景图像,该已标注场景图像的人数是超过第一阈值的,例如,假设已通过人工数出该已标注场景图像中有30人。将该已标注场景图像分别输入第一神经网络模型和第二神经网络模型之后,可分别获得该已标注场景图像的第一预测人数和第二预测人数。以照前述的举例可知,当第一神经网络模型和第二神经网络模型出现漏认的情况时,例如,通过第一神经网络模型获得该已标注场景图像的第一预测人数为27人,通过第二神经网络模型获得该已标注场景图像的第二预测人数为28人。在此基础上,进而执行步骤S94,获取第一初始加权参数,根据该已标注场景图像的第一预测人数和第二预测人数以及标注人数对该第一初始加权参数进行更新迭代,得到最终的第一加权参数,在前述举例的基础上,这样可以理解为,获取一个初始加权参数,例如0.1,根据第一预测人数27和第二预测人数28以及标注人数30,对其0.1进行更新迭代。
当第一神经网络模型出现漏认、第二神经网络模型出现错认的情况时,例如,通过第一神经网络模型获得该已标注场景图像的第一预测人数为27人,通过第二神经网络模型获得该已标注场景图像的第二预测人数为31人。在此基础上,进而执行步骤S94,获取第一初始加权参数,根据该已标注场景图像的第一预测人数和第二预测人数以及标注人数对该第一初始加权参数进行更新迭代,得到最终的第一加权参数,在前述举例的基础上,这样可以理解为,获取一个初始加权参数,例如0.1,根据第一预测人数27和第二预测人数31以及标注人数30,对其0.1进行更新迭代。
当第一神经网络模型和第二神经网络模型同时出现错认的情况时,例如,通过第一神经网络模型获得该已标注场景图像的第一预测人数为31人,通过第二神经网络模型获得该已标注场景图像的第二预测人数为32人。在此基础上,进而执行步骤S94,获取第一初始加权参数,根据该已标注场景图像的第一预测人数和第二预测人数以及标注人数对该第一初始加权参数进行更新迭代,得到最终的第一加权参数,在前述举例的基础上,这样可以理解为,获取一个初始加权参数,例如0.1,根据第一预测人数31和第二预测人数32以及标注人数30,对其0.1进行更新迭代。
其中,前述步骤S94中根据该已标注场景图像的第一预测人数和第二预测人数以及标注人数对该第一初始加权参数进行更新迭代,如图5所示,具体可为:
步骤S940:获取第一初始加权参数,根据已标注场景图像的第一预测人数、第二预测人数和第一初始加权参数,确定已标注场景图像的实际人数。
步骤S942:判断已标注场景图像的实际人数与已标注场景图像的标注人数的相差人数是否在预设的阈值范围内,若为否,则转到步骤S944;若为是,则转到步骤S946。
步骤S944:对第一初始加权参数进行调节得到调节后的第一初始加权参数,并返回执行获取第一初始加权参数的步骤。
步骤S946:若为是,则将第一初始加权参数作为第一加权参数。
在步骤S940中,根据已标注场景图像的第一预测人数、第二预测人数和第一初始加权参数,确定已标注场景图像的实际人数具体是,将第一预测人数、第二预测人数和第一初始加权参数代入前述所述的实际人数L中,计算得到已标注场景图像的实际人数。以前述第一神经网络模型出现漏认、第二神经网络模型出现错认的情况时为例,将其代入实际人数L中,具体是
L=0.1*27+(1-0.1)*31=30.6
在步骤S940得到该已标注场景图像的实际人数之后,执行步骤S942,判断已标注场景图像的实际人数与已标注场景图像的标注人数的相差人数是否在预设的阈值范围内,以前述举例来说,此时已标注场景图像的实际人数与标注的人数相差的人数为0.6人,设预设的阈值范围为小于2人,那么根据判定,相差人数在预设的阈值范围内,执行步骤S946,将该初始加权参数0.1作为第一加权参数。
如果计算出的实际人数L与标注的人数超过预设的阈值范围,例如为3,那么则调节该第一初始加权参数0.1,例如,在第一初始加权参数0.1的基础上加0.1,然后重新执行S940~S946的步骤,直到计算出的实际人数L与标注的人数在预设的阈值范围内为止。本申请中的举例只是为了方便理解本申请方案,不能限制本申请的保护范围。
在本实施例的可选实施方式中,在步骤S108确定待分析场景图像的实际人数之后,如图6所示,该方法还包括:
步骤S110:获取多张待分析场景图像分别对应的实际人数,该多张待分析场景图像为同一地点且预设时间段内的连续多张实时场景图像。
步骤S112:判断多张待分析场景图像分别对应的实际人数之和是否超过预设的第三阈值,若是,则转到步骤S114。
步骤S114:进行安全预警。
上述步骤S110~步骤S114可以理解为:该多张场景图像为同一地点且预设时间段内的连续多张实时场景图像,可以理解该多张场景图像为一段时间连续的视频,通过前述步骤S100~S108的方法对多张待分析场景图像进行人数识别,得到每张待分析场景图像对应的实际人数,进而根据每张待分析场景图像对应的实际人数获得该时间段该视频的人流量,进而在步骤S112中判断多张待分析场景图像分别对应的实际人数之和是否超过预设的第三阈值,若超过,则表示该时间段的视频中的人流量过大,可能会出现安全事故等,进而进行安全预警。例如,预设的第三阈值为500人,在3分钟时间内统计的人流量为600人,那么则进行安全预警。其中安全预警可为向该地点对应的地区管理人员或安保人员发送提示信息,可通过向其拨打报警电话等方式来进行提示。
当边缘终端为执行主体时,可以自行根据得到的人数总和判断是否超过报警阈值,如果超过,则通过边缘终端联系对应的负责人;也可以将该得到的人数总和发送给云端服务器,云端服务器判断是否超过报警阈值,如果超过,则通过云端服务器联系对应的负责人,其中,边缘终端将人数总和数据发送给云端可通过JSON格式来进行发送;如果是云端服务器为执行主体,则云端服务器直接根据得到的人数总和来判断是否超过报警阈值。另外,边缘终端可包括本地服务器和摄像头。
在上述设计的实施方式中,通过人流量预警方式能够及时预防危险事件的发生。
第二实施例
图7出示了本申请提供的人数确定装置的示意性结构框图,应理解,该装置与上述图1至图6方法实施例对应,能够执行第一实施例中的方法涉及的步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operatingsystem,OS)中的软件功能模块。具体地,该装置包括:分析模块200,用于根据第一神经网络模型对待分析场景图像进行分析,得到待分析场景图像的第一预测人数;判断模块202,用于判断第一预测人数是否超过第一阈值;确定模块204,用于在第一预测人数不超过第一阈值后,根据第一预测人数确定待分析场景图像的实际人数;分析模块200,还用于在第一预测人数超过第一阈值后,根据第二神经网络模型对待分析场景图像进行分析,得到待分析场景图像的第二预测人数;确定模块204,还用于根据第一预测人数和第二预测人数确定待分析场景图像的实际人数。
在上述设计的装置中,在待分析的场景图像人数较少时采用单神经网络模型算法进行快速预测,在待分析场景图像人数超过阈值(人数较多时)采用两种神经网络模型算法的结果来进行结合预测,根据第一预测人数与阈值相比较的设定,使得本方案能够在单模型和双模型两种模式下互相转换,在人数较少时可以有效的节约计算资源,提高预测效率,能够在短时间识别出预测人数;在人数较多时对场景图像中人数的预测更加准确,也对场景图像对应的区域的人流信息掌控得更加准确。
在本实施例的可选实施方式中,确定模块204,具体用于:根据第一预测人数及其对应的第一加权参数与第二预测人数及其对应的第二加权参数,得到待分析场景图像的实际人数。
在本实施例的可选实施方式中,判断模块202还用于判断第一预测人数和第二预测人数之间相差人数是否超过预设的第二阈值;执行模块206,用于在第一预测人数和第二预测人数之间相差人数超过预设的第二阈值后,执行根据所述第一预测人数及其对应的第一加权参数与第二预测人数及其对应的第二加权参数,得到待分析场景图像的实际人数的步骤;比较模块208,用于在第一预测人数和第二预测人数之间相差人数不超过预设的第二阈值后,比较第一预测人数和第二预测人数的数值,将较小数值的预测人数作为待分析场景图像的实际人数。
在本实施例的可选实施方式中,分析模块200,还用于根据第一神经网络模型对已标注场景图像进行分析,得到已标注场景图像的第一预测人数;根据第二神经网络模型对已标注场景图像进行分析,得到已标注场景图像的第二预测人数;获取模块210,用于获取第一初始加权参数;更新迭代模块212,用于根据已标注场景图像的第一预测人数、第二预测人数和标注人数对第一初始加权参数进行更新迭代,得到对应的第一加权参数。
在本实施例的可选实施方式中,更新迭代模块212,具体用于:获取第一初始加权参数;根据已标注场景图像的第一预测人数、第二预测人数和第一初始加权参数,确定已标注场景图像的实际人数;判断已标注场景图像的实际人数与已标注场景图像的标注人数的差值是否在预设的阈值范围内;若为否,则对第一初始加权参数进行调节得到调节后的第一初始加权参数,并返回执行获取第一初始加权参数的步骤;若为是,则将第一初始加权参数作为第一加权参数。
在本实施例的可选实施方式中,获取模块210,还用于获取多张待分析场景图像分别对应的实际人数,多张待分析场景图像为同一地点且预设时间段内的连续多张实时场景图像;判断模块202,还用于判断多张待分析场景图像分别对应的实际人数之和是否超过预设的第三阈值;安全预警模块214,用于在判断多张待分析场景图像分别对应的实际人数之和超过预设的第三阈值之后,进行安全预警。
第三实施例
如图8所示,本申请提供一种电子设备3,包括:处理器301和存储器302,处理器301和存储器302通过通信总线303和/或其他形式的连接机构(未标出)互连并相互通讯,存储器302存储有处理器301可执行的计算机程序,当计算设备运行时,处理器301执行该计算机程序,以执行时执行第一实施例、第一实施例的任一可选的实现方式中的方法。
本申请提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一实施例、第一实施例的任一可选的实现方式中的方法。
其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-OnlyMemory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请提供一种计算机程序产品,该计算机程序产品在计算机上运行时,使得计算机执行第一实施例、第一实施例的任一可选的实现方式中的所述方法。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种人数确定方法,其特征在于,包括:
根据第一神经网络模型对待分析场景图像进行分析,得到所述待分析场景图像的第一预测人数;
判断所述第一预测人数是否超过第一阈值;
若为否,则根据所述第一预测人数确定所述待分析场景图像的实际人数;
若为是,则根据第二神经网络模型对所述待分析场景图像进行分析,得到所述待分析场景图像的第二预测人数;根据所述第一预测人数和第二预测人数确定所述待分析场景图像的实际人数;
其中,所述根据所述第一预测人数和第二预测人数确定所述待分析场景图像的实际人数,包括:
根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数;
所述实际人数L为:
L=αN1+(1-α)N2
其中,L为实际人数,N1为第一预测人数,N2为第二预测人数,α为第一加权参数,1-α为第二加权参数;
在所述根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数之前,所述方法还包括:
判断所述第一预测人数和第二预测人数之间相差人数是否超过预设的第二阈值;
若是,则执行所述根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数的步骤;
若否,则比较所述第一预测人数和第二预测人数的数值,将较小数值的预测人数作为所述待分析场景图像的实际人数。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据第一神经网络模型对已标注场景图像进行分析,得到所述已标注场景图像的第一预测人数;根据第二神经网络模型对已标注场景图像进行分析,得到所述已标注场景图像的第二预测人数;
获取第一初始加权参数,根据所述已标注场景图像的第一预测人数、第二预测人数和标注人数对所述第一初始加权参数进行更新迭代,得到对应的所述第一加权参数。
3.根据权利要求2所述的方法,其特征在于,所述获取第一初始加权参数,根据所述已标注场景图像的第一预测人数、第二预测人数和标注人数对所述第一初始加权参数进行更新迭代,得到对应的所述第一加权参数,包括:
获取第一初始加权参数,根据所述已标注场景图像的第一预测人数、第二预测人数和第一初始加权参数,确定所述已标注场景图像的实际人数;
判断所述已标注场景图像的实际人数与所述已标注场景图像的标注人数的相差人数是否在预设的阈值范围内;
若为否,则对所述第一初始加权参数进行调节得到调节后的第一初始加权参数,并返回执行所述获取第一初始加权参数的步骤;
若为是,则将所述第一初始加权参数作为第一加权参数。
4.根据权利要求1所述的方法,其特征在于,所述确定所述待分析场景图像的实际人数之后,还包括:
获取多张待分析场景图像分别对应的实际人数,所述多张待分析场景图像为同一地点且预设时间段内的连续多张实时场景图像;
判断所述多张待分析场景图像分别对应的实际人数之和是否超过预设的第三阈值
若是,则进行安全预警。
5.一种人数确定装置,其特征在于,所述装置包括:
分析模块,用于根据第一神经网络模型对待分析场景图像进行分析,得到所述待分析场景图像的第一预测人数;
判断模块,用于判断所述第一预测人数是否超过第一阈值;
确定模块,用于在所述第一预测人数不超过第一阈值后,根据所述第一预测人数确定所述待分析场景图像的实际人数;
所述分析模块,还用于在所述第一预测人数超过第一阈值后,根据第二神经网络模型对所述待分析场景图像进行分析,得到所述待分析场景图像的第二预测人数;
所述确定模块,还用于根据所述第一预测人数和第二预测人数确定所述待分析场景图像的实际人数;
所述确定模块,具体用于根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数;
所述实际人数L为:
L=αN1+(1-α)N2
其中,L为实际人数,N1为第一预测人数,N2为第二预测人数,α为第一加权参数,1-α为第二加权参数;
所述判断模块还用于判断所述第一预测人数和第二预测人数之间相差人数是否超过预设的第二阈值;执行模块,用于在所述第一预测人数和第二预测人数之间相差人数超过预设的第二阈值后,执行所述根据所述第一预测人数及其对应的第一加权参数与所述第二预测人数及其对应的第二加权参数,得到所述待分析场景图像的实际人数的步骤;比较模块,用于在所述第一预测人数和第二预测人数之间相差人数不超过预设的第二阈值后,比较所述第一预测人数和第二预测人数的数值,将较小数值的预测人数作为所述待分析场景图像的实际人数。
6.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述方法的步骤。
CN201910748518.6A 2019-08-13 2019-08-13 一种人数确定方法、装置及存储介质 Expired - Fee Related CN110458114B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910748518.6A CN110458114B (zh) 2019-08-13 2019-08-13 一种人数确定方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910748518.6A CN110458114B (zh) 2019-08-13 2019-08-13 一种人数确定方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110458114A CN110458114A (zh) 2019-11-15
CN110458114B true CN110458114B (zh) 2022-02-01

Family

ID=68486564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910748518.6A Expired - Fee Related CN110458114B (zh) 2019-08-13 2019-08-13 一种人数确定方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110458114B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127087B2 (en) * 2000-03-27 2006-10-24 Microsoft Corporation Pose-invariant face recognition system and process
CN102592398A (zh) * 2012-02-20 2012-07-18 华焦宝 陈列室参观人数超限报警方法及系统
CN106407946A (zh) * 2016-09-29 2017-02-15 北京市商汤科技开发有限公司 跨线计数方法和深度神经网络训练方法、装置和电子设备
CN106713659A (zh) * 2017-01-20 2017-05-24 维沃移动通信有限公司 一种全景拍摄方法及移动终端
CN108549835A (zh) * 2018-03-08 2018-09-18 深圳市深网视界科技有限公司 人群计数及其模型构建的方法、终端设备及存储介质
CN108549852A (zh) * 2018-03-28 2018-09-18 中山大学 基于深度网络增强的特定场景下行人检测器自动学习方法
CN109214337A (zh) * 2018-09-05 2019-01-15 苏州大学 一种人群统计方法、装置、设备及计算机可读存储介质
CN109376615A (zh) * 2018-09-29 2019-02-22 苏州科达科技股份有限公司 用于提升深度学习网络预测性能的方法、装置及存储介质
CN109389016A (zh) * 2017-08-10 2019-02-26 株式会社日立制作所 一种人头计数的方法及系统
CN109559008A (zh) * 2018-09-19 2019-04-02 中建科技有限公司深圳分公司 施工监控方法、装置及系统
CN109618193A (zh) * 2018-12-18 2019-04-12 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109829429A (zh) * 2019-01-31 2019-05-31 福州大学 基于YOLOv3的监控场景下的安防敏感物品检测方法
CN110022529A (zh) * 2018-12-05 2019-07-16 阿里巴巴集团控股有限公司 基于两种传感模式的目标区域人数统计的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10387298B2 (en) * 2017-04-04 2019-08-20 Hailo Technologies Ltd Artificial neural network incorporating emphasis and focus techniques
US10956523B2 (en) * 2017-09-12 2021-03-23 Yu Huang Method and system for providing a highly-personalized recommendation engine

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127087B2 (en) * 2000-03-27 2006-10-24 Microsoft Corporation Pose-invariant face recognition system and process
CN102592398A (zh) * 2012-02-20 2012-07-18 华焦宝 陈列室参观人数超限报警方法及系统
CN106407946A (zh) * 2016-09-29 2017-02-15 北京市商汤科技开发有限公司 跨线计数方法和深度神经网络训练方法、装置和电子设备
CN106713659A (zh) * 2017-01-20 2017-05-24 维沃移动通信有限公司 一种全景拍摄方法及移动终端
CN109389016A (zh) * 2017-08-10 2019-02-26 株式会社日立制作所 一种人头计数的方法及系统
CN108549835A (zh) * 2018-03-08 2018-09-18 深圳市深网视界科技有限公司 人群计数及其模型构建的方法、终端设备及存储介质
CN108549852A (zh) * 2018-03-28 2018-09-18 中山大学 基于深度网络增强的特定场景下行人检测器自动学习方法
CN109214337A (zh) * 2018-09-05 2019-01-15 苏州大学 一种人群统计方法、装置、设备及计算机可读存储介质
CN109559008A (zh) * 2018-09-19 2019-04-02 中建科技有限公司深圳分公司 施工监控方法、装置及系统
CN109376615A (zh) * 2018-09-29 2019-02-22 苏州科达科技股份有限公司 用于提升深度学习网络预测性能的方法、装置及存储介质
CN110022529A (zh) * 2018-12-05 2019-07-16 阿里巴巴集团控股有限公司 基于两种传感模式的目标区域人数统计的方法和装置
CN109618193A (zh) * 2018-12-18 2019-04-12 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109829429A (zh) * 2019-01-31 2019-05-31 福州大学 基于YOLOv3的监控场景下的安防敏感物品检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A People counting method based on multiple cameras information fusion;Qinglong Chang等;《2015 IEEE International Conference on Systems, Man, and Cybernetics》;20151231;第2180-2185页 *
基于深度学习的视频人数统计算法研究与实现;李志强;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20190215;第I138-1921页 *

Also Published As

Publication number Publication date
CN110458114A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
CN109166261B (zh) 基于图像识别的图像处理方法、装置、设备及存储介质
CN110414313B (zh) 异常行为告警方法、装置、服务器及存储介质
KR101216271B1 (ko) 카메라 탬퍼링 검출
CN111783744A (zh) 一种操作现场安全防护检测方法及装置
WO2014121340A9 (en) A surveillance system
CN108734684B (zh) 动态照明场景的图像背景减除
CN114782897A (zh) 基于机器视觉及深度学习的危险行为检测方法及系统
CN110838230B (zh) 一种移动视频监控方法、监控中心及系统
CN111027518A (zh) 可疑人群智能报警方法、装置、计算机设备及存储介质
CN111191507A (zh) 智慧社区的安全预警分析方法及系统
CN110602446A (zh) 垃圾回收提醒方法、系统及存储介质
CN111079621A (zh) 检测对象的方法、装置、电子设备和存储介质
CN111275984B (zh) 车辆检测方法、装置及服务器
CN111860187A (zh) 一种高精度的佩戴口罩识别方法及系统
CN110458114B (zh) 一种人数确定方法、装置及存储介质
KR102614856B1 (ko) 군중 난류 위험 예측 시스템 및 방법
CN116863288A (zh) 基于深度学习的目标检测和报警方法、装置及设备
CN117133050A (zh) 轿厢异常行为检测方法、装置、设备及存储介质
CN113837138B (zh) 一种着装监控方法、系统、介质及电子终端
CN115410112A (zh) 电梯异常停留识别方法、装置及存储介质
CN115908816A (zh) 基于人工智能的积水识别方法、装置、设备及存储介质
CN115147752A (zh) 一种视频分析方法、装置及计算机设备
CN115116130A (zh) 一种通话动作识别方法、装置、设备以及存储介质
CN114896653A (zh) 一种基于bim的建筑物数据监测方法及其系统
CN113420631A (zh) 一种基于图像识别的安全报警方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220201