CN112001300A - 基于按位置交叉熵的楼宇监控方法、装置和电子设备 - Google Patents

基于按位置交叉熵的楼宇监控方法、装置和电子设备 Download PDF

Info

Publication number
CN112001300A
CN112001300A CN202010847165.8A CN202010847165A CN112001300A CN 112001300 A CN112001300 A CN 112001300A CN 202010847165 A CN202010847165 A CN 202010847165A CN 112001300 A CN112001300 A CN 112001300A
Authority
CN
China
Prior art keywords
feature map
building
initial feature
entropy
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010847165.8A
Other languages
English (en)
Other versions
CN112001300B (zh
Inventor
吴宝昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHEJIANG ZHIJIAN TECHNOLOGY Co.,Ltd.
Original Assignee
Hangzhou Zhuilie Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhuilie Technology Co ltd filed Critical Hangzhou Zhuilie Technology Co ltd
Priority to CN202010847165.8A priority Critical patent/CN112001300B/zh
Publication of CN112001300A publication Critical patent/CN112001300A/zh
Application granted granted Critical
Publication of CN112001300B publication Critical patent/CN112001300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于按位置交叉熵的楼宇监控方法、装置和电子设备。所述方法,包括:获取所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像;将所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;计算所述第一和所述第二初始特征图之间的第一、第二按位置交叉熵加权矩阵系数;基于所述第一和第二按位置交叉熵加权矩阵系数对所述第一和第二初始特征图进行加权以获得最终特征图;以及,基于所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。这样,基于更高精度的所述楼宇图像的语义分割结果,能够更为精确地对楼宇的照明系统进行远程监控。

Description

基于按位置交叉熵的楼宇监控方法、装置和电子设备
技术领域
本申请涉及人工智能技术领域,且更为具体地,涉及一种基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法、装置和电子设备。
背景技术
智慧城市是把新一代信息技术充分运用在城市中各行各业的城市信息化高级形态。智慧园区是智能城市建设的重要部分,照明系统是园区内楼宇的主要基础设置。
传统的照明系统主要以手控、光控、钟控等控制模式为主,工作人员往往必须到现场才能对照明系统进行操作,不能实现远距监控。因此,在节假日和夜间等无人状态下会造成不同程度的能源浪费。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
深度学习以及神经网络的发展(尤其是图像语义分割技术的发展)为智能园区的楼宇照明系统的监控提供了新的解决思路和方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法、装置和电子设备,其基于按位置交叉熵加权矩阵的卷积神经网络模型对所采集的楼宇图像进行图像特征识别,以减少因拍摄位置和拍摄角度不同导致图像在其源域和目标域之间的像素级别的域漂移的差异,从而提高图像特征识别的精度;进而,对具有更高识别精度的特征图进行图像语义分割,以提高楼宇图像的分割精度和识别精度,从而能够精确地对智能园区内的楼宇的照明系统进行远程监控。
根据本申请的一个方面,提供了一种基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法,其包括:
获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;
将所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;
计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数;
计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数;
基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及
基于所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
在上述智慧园区的楼宇监控方法中,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数包括:
基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 508192DEST_PATH_IMAGE001
其中,
Figure 246341DEST_PATH_IMAGE002
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 625369DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,且
Figure 816179DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值。
在上述智慧园区的楼宇监控方法中,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数包括:
基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 56799DEST_PATH_IMAGE005
其中,
Figure 649454DEST_PATH_IMAGE006
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 199384DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,且
Figure 877490DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值。
在上述智慧园区的楼宇监控方法中,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵包括:
基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 905489DEST_PATH_IMAGE007
其中,
Figure 87072DEST_PATH_IMAGE008
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 73482DEST_PATH_IMAGE009
是第一初始特征图中的相应位置的值,
Figure 238885DEST_PATH_IMAGE010
是第二初始特征图中的相应位置的值,且
Figure 821307DEST_PATH_IMAGE011
表示对第二初始特征图中的相应位置的值进行统计增强。
在上述智慧园区的楼宇监控方法中,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵包括:
基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 122975DEST_PATH_IMAGE012
其中,
Figure 14708DEST_PATH_IMAGE013
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 401827DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,
Figure 771628DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值,且
Figure 193382DEST_PATH_IMAGE014
表示对第一初始特征图中的相应位置的值进行统计增强。
在上述智慧园区的楼宇监控方法中,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图包括:
基于所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图;
基于所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以获得第二加权特征图;以及
将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图。
在上述智慧园区的楼宇监控方法中,将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图包括:
将所述第一加权特征图与预定系数之积和所述第二加权特征图进行点加以获得所述最终特征图。
在上述智慧园区的楼宇监控方法中,所述卷积神经网络由训练用楼宇图像训练而获得,所述预定系数作为超参数,与所述卷积神经网络一起由训练用楼宇图像训练而获得,所述训练用楼宇图像具有楼宇房间的已标注的标签。
根据本申请的另一方面,提供了一种基于按位置交叉熵加权矩阵的智能园区的楼宇监控装置,包括:
图像获取单元,用于获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;
初始特征图生成单元,用于将所述图像获取单元获得的所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;
第一按位置交叉熵加权矩阵系数计算单元,用于计算所述初始特征图生成单元获得的所述第一初始特征图相对于所述初始特征图生成单元获得的所述第二初始特征图的第一按位置交叉熵加权矩阵系数;
第二按位置交叉熵加权矩阵系数计算单元,用于计算所述初始特征图生成单元获得的所述第二初始特征图相对于所述初始特征图生成单元获得的所述第一初始特征图的第二按位置交叉熵加权矩阵系数;
最终特征图生成单元,用于基于所述第一按位置交叉熵加权矩阵系数计算单元获得的所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数计算单元获得的所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及
图像语义分割单元,用于基于所述最终特征图生成单元获得的所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
在上述楼宇监控装置中,所述第一按位置交叉熵加权矩阵系数计算单元,进一步用于:基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 256016DEST_PATH_IMAGE001
其中,
Figure 130431DEST_PATH_IMAGE008
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 303924DEST_PATH_IMAGE015
是第一初始特征图中的相应位置的值,且
Figure 580184DEST_PATH_IMAGE016
是第二初始特征图中的相应位置的值。
在上述楼宇监控装置中,所述第二按位置交叉熵加权矩阵系数计算单元,进一步用于:基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵
Figure 558592DEST_PATH_IMAGE005
其中,
Figure 920304DEST_PATH_IMAGE017
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 631908DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,且
Figure 28254DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值。
在上述楼宇监控装置中,所述第一按位置交叉熵加权矩阵系数计算单元,进一步用于:基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 432691DEST_PATH_IMAGE007
其中,
Figure 281698DEST_PATH_IMAGE018
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 796993DEST_PATH_IMAGE019
是第一初始特征图中的相应位置的值,
Figure 47846DEST_PATH_IMAGE020
是第二初始特征图中的相应位置的值,且
Figure 373916DEST_PATH_IMAGE021
表示对第二初始特征图中的相应位置的值进行统计增强。
在上述楼宇监控装置中,所述第二按位置交叉熵加权矩阵系数计算单元,进一步用于:基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 710219DEST_PATH_IMAGE012
其中,
Figure 29205DEST_PATH_IMAGE022
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 868985DEST_PATH_IMAGE023
是第一初始特征图中的相应位置的值,
Figure 615224DEST_PATH_IMAGE024
是第二初始特征图中的相应位置的值,且
Figure 173245DEST_PATH_IMAGE025
表示对第一初始特征图中的相应位置的值进行统计增强。
在上述楼宇监控装置中,所述最终特征图生成单元,进一步包括:
第一加权特征图生成子单元,用于基于所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图;
第二加权特征图生成子单元,用于基于所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以获得第二加权特征图;以及
点加子单元,用于将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图
在上述楼宇监控装置中,所述点加子单元,进一步用于:将所述第一加权特征图与预定系数之积和所述第二加权特征图进行点加以获得所述最终特征图。
在上述楼宇监控装置中,所述卷积神经网络由训练用楼宇图像训练而获得,所述预定系数作为超参数,与所述卷积神经网络一起由训练用楼宇图像训练而获得,所述训练用楼宇图像具有楼宇房间的已标注的标签。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法。
与现有技术相比,本申请提供的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法、装置和电子设备,其基于按位置交叉熵加权矩阵的卷积神经网络模型对所采集的楼宇图像进行图像特征识别,以减少因拍摄位置和拍摄角度不同导致图像在其源域和目标域之间的像素级别的域漂移的差异,从而提高图像特征识别的精度;进而,对具有更高识别精度的特征图进行图像语义分割,以提高楼宇图像的分割精度和识别精度,从而能够精确地对智能园区内的楼宇的照明系统进行远程监控。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法的应用场景图。
图2图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法的流程图。
图3图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法的系统架构的示意图。
图4图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法中,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图的流程图。
图5图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控装置的框图。
图6图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控装置中的最终特征图生成单元的框图。
图7图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
图1图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法的应用场景图。
如图1所示,在该应用场景中,智能园区内的楼宇B的周围一定距离处设有多个用于采集楼宇图像的摄像头(在该示例中,以包括两个摄像头C1、和C2为示例,当然,本领域技术人员可以理解,也可以包括其它数目的图像采集装置),所述摄像头C1,C2,用于分别从不同位置和不同拍摄角度拍摄所述楼宇的图像。所述楼宇图像被输入至部署有深度神经网络模型的楼宇监控服务器S中进行图像语义分割处理,以获得图像语义分割结果,其中,所述图像语义分割结果表示所述楼宇的监控结果。
具体到该应用场景中,所述楼宇图像的图像语义分割结果(即,所述楼宇的监控结果)为从楼宇图像中获得楼宇内亮灯区域(包括房间和走廊)的分割结果,即,分割图像中具有高于周围亮度的部分。这样,通过所述图像语义分割结果便能够获知所述楼宇内哪些区域仍处于亮灯状态,即,对所述楼宇内的照明系统进行监控,从而能够避免能源浪费。
值得一提的是,在该应用场景中,所述摄像头可被设置为分时段进行工作,例如,其可被设置为仅在夜间时段工作而白天时段处于待机状态,用于从不同拍摄位置和不同拍摄角度拍摄所述楼宇的夜间图像,其原因在于,在实际应用场景中,楼宇照明系统的能源浪费通常发生在夜间环境中。也就是说,所述基于按位置交叉熵加权矩阵的智慧园区的楼宇监控系统为楼宇夜间监控系统,用于监控楼宇的照明系统在夜间的使用情况,以避免不必要的能源浪费。
应可以理解,楼宇的监控质量取决于楼宇图像的图像语义分割结果的精度,而图像语义分割结果的精度在很大程度上取决于所构建的深度神经网络模型的模型架构。也就是,在该应用场景中,如何基于应用场景的特征和技术目的构建适配的用于图像语义分割的深度神经网络模型是技术实施的关键。
图像语义分割技术表示对图像进行分割并识别出相应的内容,例如,有一张图像为一个人骑着摩托车,图像语义分割的任务为将这张图像中的人、摩托车和背景分割开并识别他们相应的类别。现有的图像语义分割任务大多基于传统的卷积神经网络模型来执行。传统的卷积神经网络模型包括卷积层、池化层、全连接层,在执行图像语义分割任务的过程中,通过卷积神经网络处理源图像以获得特征图,并基于特征图进行语义分割(即,识别不同部分的内容)。在具体实践中,本申请发明人发现基于传统卷积神经网络模型的图像语义分割精度难以满足应用要求。
究其原因,本申请发明人发现,在图像语义分割过程中,用于语义分割的图像特征在源图像的源域和通过卷积神经网络获得的特征图的目标域之间存在差异,如果仅基于目标域内的特征图进行图像语义分割,这种差异将降低图像语义分割结果的精确性。
并且,本申请人发明人还发现,图像在其源域和目标域之间的域漂移也会在不同图像之间产生域漂移的差异,且这种域漂移的差异可能由多种因素造成。在本申请的应用场景下,摄像头由于其相对位置不同,拍摄楼宇的角度不同,其所拍摄的同一对象,即目标楼宇在各张楼宇图像中,也会呈现出与拍摄位置和角度对应的不同,这种不同会显著地导致域漂移的差异。当基于多个楼宇图像进行图像语义分割时,这种不同图像之间的域漂移的差异会降低图像语义分割的精确性。
针对上述技术问题,本申请的基本构思是分别从第一楼宇图像和第二楼宇图像获得第一初始特征图和第二初始特征图,并计算两个特征图相对于彼此的按位置交叉熵加权系数矩阵,其中,按位置交叉熵加权矩阵系数可以在像素级上反映出两个初始特征图由于源图像的差异而导致的其在目标域中的特征差异。这里,第一楼宇图像和第二楼宇图像具有不同的拍摄位置和拍摄角度。
进一步地,通过以按位置交叉熵加权系数矩阵对初始特征图进行加权并将加权结果进行点加,所获得的最终特征图中可以彼此抵消初始特征图中的由于摄像头的相对位置和拍摄角度的不同所造成的像素级别的域漂移的差异,从而有效地消除最终特征图中由两个初始特征图各自的域漂移所导致的域漂移的差异,从而提高语义分割精度。相应地,能够有效地提高楼宇的照明系统的监控质量,以避免不必要的能源浪费。
基于此,本申请提出了一种基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法,其包括:获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;将所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数;计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数;基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及,基于所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
相应地,根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法,其基于按位置交叉熵加权矩阵的卷积神经网络模型对所采集的楼宇图像进行图像特征识别,以减少因拍摄位置和拍摄角度不同导致图像在其源域和目标域之间的像素级别的域漂移的差异,从而提高图像特征识别的精度;进而,对具有更高识别精度的特征图进行图像语义分割,以提高楼宇图像的分割精度和识别精度,从而能够精确地对智能园区内的楼宇的照明系统进行远程监控。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图2图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法的流程图。如图2所示,根据本申请实施例的楼宇监控方法,包括:S110,获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;S120,将所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;S130,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数;S140,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数;S150,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及,S160,基于所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
在步骤S110中,获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小。这里,所述智慧园区的楼宇监控系统可以包括更多数量的摄像头,以其包括两个摄像头(所述第一摄像头和所述第二摄像头)仅为示例,为了说明所述楼宇监控系统采集的各张楼宇图像之间具有不同的拍摄位置和拍摄角度。
具体地,在步骤S110中,在获取到所述第一楼宇图像和所述第二楼宇图像后,还包括对所述第一楼宇图像和所述第二楼宇图像进行预处理,例如,对所述第一楼宇图像和所述第二楼宇图像进行畸变校正处理并进行对齐,以降低所述第一楼宇图像和所述第二楼宇图像之间的差异度。
如上所述,为了节约能量,在本申请实施例中,所述摄像头可被设置分时段进行工作,例如,其可被设置为仅在夜间时段工作而白天时段处于待机状态,用于从多个不同拍摄位置和拍摄角度拍摄所述楼宇的夜间图像,其原因在于,在实际应用场景中,楼宇的照明系统的能源浪费通常发生在夜间环境中。值得一提的是,由于基于按位置交叉熵加权矩阵的神经网络模型具有良好的图像语义分割效果,所述摄像头可以为一般的摄像头,而不需要配置有专门的用于夜间拍摄的良好性能的摄像头。
在步骤S120中,将所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图。卷积神经网络的意义在于训练出能够识别图像特征的卷积核,当卷积核在整个图像上滑动之后,输出特征图中的相应位置就被赋予高低不一的数值,特定曲线即周边区域所对应的位置数值高,其他区域数值低,也就是,卷积神经网络能够将图像特征检测出来。在本申请一示例中,所述卷积神经网络包括卷积层、池化层和全连接层(当全连接层的滤波器尺寸与待处理的特征图的尺寸相同时,即为全连接层),其中,所述卷积层,用于对楼宇图像(所述第一楼宇图像或第二楼宇图像)进行卷积处理以获得卷积特征图;所述池化层,用于对卷积特征图进行池化处理以获得池化特征图;所述全连接层,用于对池化特征图进行全连接处理,以生成所述初始特征图(所述第一初始特征图或所述第二初始特征图)。
值得一提的是,在本申请其他示例中,所述卷积网络的模型架构可以做一些调整,例如,全连接层可以调整为其他卷积层;再如,可以在所述卷积网络中加入其他网络,例如,注意力机制网络,以用于在图像处理过程中突出部分特征,对此,并不为本申请所局限。
在步骤S130中,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数。在本申请一个示例中,
基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 295921DEST_PATH_IMAGE001
其中,
Figure 255787DEST_PATH_IMAGE008
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 172927DEST_PATH_IMAGE015
是第一初始特征图中的相应位置的值,且
Figure 234556DEST_PATH_IMAGE016
是第二初始特征图中的相应位置的值。
在步骤S140中,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数。本申请一个示例中,
基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 629765DEST_PATH_IMAGE005
其中,
Figure 444137DEST_PATH_IMAGE006
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 797758DEST_PATH_IMAGE026
是第一初始特征图中的相应位置的值,且
Figure 330370DEST_PATH_IMAGE016
是第二初始特征图中的相应位置的值。
特别地,通过标准交叉熵形式计算获得的第一按位置交叉熵加权矩阵系数和第二全局交叉熵系数,可以以像素级别体现出所述第一初始特征图和所述第二初始特征图的特征之间的交叉性特征,即,所述第二初始特征图相对于所述第一初始特征图的差异,以及,第一初始特征图相对于所述第二初始特征图的差异。而这种像素级别的交叉性差异可以提取出所述第一楼宇图像和所述第二楼宇图像之间由于所述第一摄像头和所述第二摄像头的相对位置和拍摄角度的不同而导致的目标域中两个不同特征域漂移之间的差异性,从而能够对不同的特征域漂移进行补偿。
在本申请另一示例中,在步骤S130中,基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 529271DEST_PATH_IMAGE007
其中,
Figure 198149DEST_PATH_IMAGE027
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 722672DEST_PATH_IMAGE015
是第一初始特征图中的相应位置的值,
Figure 477001DEST_PATH_IMAGE028
是第二初始特征图中的相应位置的值,且
Figure 745171DEST_PATH_IMAGE029
表示对第二初始特征图中的相应位置的值进行统计增强。
并且,在该另一示例中,在步骤S140中,基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 284868DEST_PATH_IMAGE012
其中,
Figure 449133DEST_PATH_IMAGE030
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 956338DEST_PATH_IMAGE009
是第一初始特征图中的相应位置的值,
Figure 762620DEST_PATH_IMAGE010
是第二初始特征图中的相应位置的值,且
Figure 406091DEST_PATH_IMAGE031
表示对第一初始特征图中的相应位置的值进行统计增强。
特别地,通过在标准交叉熵函数形式的第一按位置交叉熵加权系数和第二按位置交叉熵系数的基础上对于对数值部分的所述第二初始特征图和所述第一初始特征图中的相应位置的值进行统计增强,可以使得在以像素级体现出所述第一初始特征图和所述第二初始特征图的特征之间的交叉性差异,即第二初始特征图相对于第一初始特征图的差异,和第一初始特征图相对于第二初始特征图的差异的同时,考虑第一初始特征图和第二初始特征图在全局意义上的统计差异。因此,这种兼顾像素级和全局性统计意义的交叉性差异可以提取出所述第一楼宇图像和所述第二楼宇图像之间由于摄像头的拍摄位置和拍摄角度的不同而导致的目标域中的两个不同特征域漂移之间的像素级和全局性统计意义的差异性,从而能够用于对不同的特征域漂移进行补偿
在步骤S150中,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图。在本申请一示例中,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图的过程,包括:基于所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图;基于所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以获得第二加权特征图;以及,将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图。
图4图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法中,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图的流程图。如图4所示,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图的过程,包括:S210,基于所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图;S220,基于所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以获得第二加权特征图;以及,S230,将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图。
如前所述,因为所述第一按位置交叉熵加权矩阵系数和所述第二全局交叉熵系数可以体现出所述第一初始特征图和所述第二初始特征图的特征之间的在像素级别上的交叉性差异,因此,通过以所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图,和以所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以第二加权特征图,可以在一定程度上使得所述第一初始特征图和所述第二初始特征图的像素级别的不同的特征域漂移在目标域中彼此靠近。进一步地,通过将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图,可以使得最终特征图尽可能地消除由于摄像头的拍摄位置和拍摄角度的不同造成的域漂移的差异,从而提高图像语义分割的精度。
更具体地,在该示例中,将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图包括:将所述第一加权特征图与预定系数之积和所述第二加权特征图进行点加以获得所述最终特征图。
相应地,所述预定系数,可以调整所述第一加权特征图和所述第二加权特征图在进行点加时的加权比例,从而调整所述第一加权特征图和所述第二加权特征图中的域漂移在相加时的比例,从而最大可能地消除由于摄像头的拍摄位置和拍摄角度的不同所造成的域漂移的差异。
综上,基于本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法被阐明,其基于按位置交叉熵加权矩阵的卷积神经网络模型对所采集的楼宇图像进行图像特征识别,以减少不同图像在图像的源域和目标域之间的域漂移的差异,从而提高图像特征识别的精度;进而,对具有更高识别精度的特征图进行图像语义分割,以提高楼宇图像的分割精度和识别精度,从而能够精确地对智能园区内的楼宇的照明系统进行远程监控。
相应地,根据本申请实施例的所述智慧园区的楼宇监控方法可以基于如下方式进行系统架构。图3图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法的系统架构的示意图。如图3所示,在本申请实施例中,所述第一楼宇图像和所述第二楼宇图像分别被输入卷积神经网络(例如,如图3所示的DN),以分别获得第一初始特征图(例如,如图3所示的F1)和第二初始特征图(例如,如图3所示的F2);接着,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数(例如,如图3所示的Hp1),以及,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数(例如,如图3所示的Hp2);然后,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图(例如,如图3所示的Fs)。
值得一提的是,在本申请实施例中,基于按位置交叉熵加权矩阵的卷积神经网络模型由训练用楼宇图像训练而获得,所述训练用楼宇图像具有楼宇房间的已标注的标签。例如,训练数据可来自街景数据集,更优选地,训练数据包含所在园区以标记的楼宇图像。在训练过程中,通过最小化卷积神经网络输出的图像分割结果与已标注的标签之间的差异来通过反向传播更新卷积神经网络的参数。并且,在训练过程中,所述预定系数作为超参数,与所述卷积神经网络一起由训练用楼宇图像训练而获得。
示例性装置
图5图示了根据本申请实施例的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控装置的框图。
如图5所示,根据本申请实施例的楼宇监控装置500,包括:图像获取单元 510,用于获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;初始特征图生成单元 520,用于将所述图像获取单元 510获得的所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;第一按位置交叉熵加权矩阵系数计算单元 530,用于计算所述初始特征图生成单元 520获得的所述第一初始特征图相对于所述初始特征图生成单元 520获得的所述第二初始特征图的第一按位置交叉熵加权矩阵系数;第二按位置交叉熵加权矩阵系数计算单元 540,用于计算所述初始特征图生成单元 520获得的所述第二初始特征图相对于所述初始特征图生成单元 520获得的所述第一初始特征图的第二按位置交叉熵加权矩阵系数;最终特征图生成单元 550,用于基于所述第一按位置交叉熵加权矩阵系数计算单元 530获得的所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数计算单元 540获得的所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及,图像语义分割单元560,用于基于所述最终特征图生成单元 550获得的所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
在一个示例中,在上述楼宇监控装置 500中,所述第一按位置交叉熵加权矩阵系数计算单元 530,进一步用于:基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 6837DEST_PATH_IMAGE001
其中,
Figure 735758DEST_PATH_IMAGE032
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 345731DEST_PATH_IMAGE033
是第一初始特征图中的相应位置的值,且
Figure 109288DEST_PATH_IMAGE028
是第二初始特征图中的相应位置的值。
在一个示例中,在上述楼宇监控装置 500中,所述第二按位置交叉熵加权矩阵系数计算单元 540,进一步用于:基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 615355DEST_PATH_IMAGE005
其中,
Figure 97152DEST_PATH_IMAGE034
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 995969DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,且
Figure 614032DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值。
在一个示例中,在上述楼宇监控装置 500中,所述第一按位置交叉熵加权矩阵系数计算单元 530,进一步用于:基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 556581DEST_PATH_IMAGE007
其中,
Figure 260094DEST_PATH_IMAGE032
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 946291DEST_PATH_IMAGE023
是第一初始特征图中的相应位置的值,
Figure 418860DEST_PATH_IMAGE010
是第二初始特征图中的相应位置的值,且
Figure 797889DEST_PATH_IMAGE035
表示对第二初始特征图中的相应位置的值进行统计增强。
在一个示例中,在上述楼宇监控装置 500中,所述第二按位置交叉熵加权矩阵系数计算单元 540,进一步用于:基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 988699DEST_PATH_IMAGE012
其中,
Figure 213007DEST_PATH_IMAGE036
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 805662DEST_PATH_IMAGE023
是第一初始特征图中的相应位置的值,
Figure 106325DEST_PATH_IMAGE010
是第二初始特征图中的相应位置的值,且
Figure 518852DEST_PATH_IMAGE031
表示对第一初始特征图中的相应位置的值进行统计增强。
在一个示例中,在上述楼宇监控装置 500中,如图6所示,所述最终特征图生成单元 550,进一步包括:第一加权特征图生成子单元 551,用于基于所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图;第二加权特征图生成子单元 552,用于基于所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以获得第二加权特征图;以及,点加子单元 553,用于将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图
在一个示例中,在上述楼宇监控装置 500中,所述点加子单元 553,进一步用于:将所述第一加权特征图与预定系数之积和所述第二加权特征图进行点加以获得所述最终特征图。
在一个示例中,在上述楼宇监控装置 500中,所述卷积神经网络由训练用楼宇图像训练而获得,所述训练用楼宇图像具有楼宇房间的已标注的标签。
在一个示例中,在上述楼宇监控装置 500中,所述预定系数作为超参数,与所述卷积神经网络一起由训练用楼宇图像训练而获得,所述训练用楼宇图像具有楼宇房间的已标注的标签。
这里,本领域技术人员可以理解,上述楼宇监控装置 500中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的基于按位置交叉熵加权矩阵的楼宇监控方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的楼宇监控装置 500可以实现在各种终端设备中,例如用于监控楼宇的服务器等。在一个示例中,根据本申请实施例的楼宇监控装置 500可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该楼宇监控装置 500可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该楼宇监控装置 500同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该楼宇监控装置 500与该终端设备也可以是分立的设备,并且该楼宇监控装置 500可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图7来描述根据本申请实施例的电子设备。
图7图示了根据本申请实施例的电子设备的框图。
如图7所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于按位置交叉熵加权矩阵的楼宇监控方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如楼宇图像、部分深度特征图等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括图像语义分割结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的神经网络的基于按位置交叉熵加权矩阵的楼宇监控方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于按位置交叉熵加权矩阵的楼宇监控方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法,其特征在于,包括:
获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;
将所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;
计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数;
计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数;
基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及
基于所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
2.根据权利要求1所述的智慧园区的楼宇监控方法,其中,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权矩阵系数包括:
基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 34657DEST_PATH_IMAGE001
其中,
Figure 54565DEST_PATH_IMAGE002
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 322736DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,且
Figure 111700DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值。
3.根据权利要求2所述的智慧园区的楼宇监控方法,其中,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权矩阵系数包括:
基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 275965DEST_PATH_IMAGE005
其中,
Figure 783170DEST_PATH_IMAGE006
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 589452DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,且
Figure 232923DEST_PATH_IMAGE004
Figure 849980DEST_PATH_IMAGE007
是第二初始特征图中的相应位置的值。
4.根据权利要求1所述的智慧园区的楼宇监控方法,其中,计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵包括:
基于以下公式计算所述第一初始特征图相对于所述第二初始特征图的第一按位置交叉熵加权系数矩阵:
Figure 578902DEST_PATH_IMAGE008
其中,
Figure 923295DEST_PATH_IMAGE002
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 421273DEST_PATH_IMAGE009
是第一初始特征图中的相应位置的值,
Figure 458499DEST_PATH_IMAGE010
是第二初始特征图中的相应位置的值,且
Figure 674717DEST_PATH_IMAGE011
表示对第二初始特征图中的相应位置的值进行统计增强。
5.根据权利要求4所述的智慧园区的楼宇监控方法,其中,计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵包括:
基于以下公式计算所述第二初始特征图相对于所述第一初始特征图的第二按位置交叉熵加权系数矩阵:
Figure 822801DEST_PATH_IMAGE012
其中,
Figure 175285DEST_PATH_IMAGE006
是第一按位置交叉熵加权系数矩阵中的每个位置的值,
Figure 383412DEST_PATH_IMAGE003
是第一初始特征图中的相应位置的值,
Figure 306500DEST_PATH_IMAGE004
是第二初始特征图中的相应位置的值,且
Figure 540167DEST_PATH_IMAGE013
表示对第一初始特征图中的相应位置的值进行统计增强。
6.根据权利要求1所述的智慧园区的楼宇监控方法,其中,基于所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图包括:
基于所述第二按位置交叉熵加权矩阵系数对所述第一初始特征图进行加权以获得第一加权特征图;
基于所述第一按位置交叉熵加权矩阵系数对所述第二初始特征图进行加权以获得第二加权特征图;以及
将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图。
7.根据权利要求6所述的智慧园区的楼宇监控方法,其中,将所述第一加权特征图和所述第二加权特征图进行点加以获得所述最终特征图包括:
将所述第一加权特征图与预定系数之积和所述第二加权特征图进行点加以获得所述最终特征图。
8.根据权利要求1所述的智慧园区的楼宇监控方法,其中,所述卷积神经网络由训练用楼宇图像训练而获得,所述预定系数作为超参数,与所述卷积神经网络一起由训练用楼宇图像训练而获得,所述训练用楼宇图像具有楼宇房间的已标注的标签。
9.一种基于按位置交叉熵加权矩阵的智能园区的楼宇监控装置,包括:
图像获取单元,用于获取由第一摄像头和第二摄像头所拍摄的所述智慧园区的楼宇的第一楼宇图像和第二楼宇图像,所述第一摄像头和所述第二摄像头具有不同的拍摄位置和拍摄角度,且所述第一楼宇图像和所述第二楼宇图像具有相同大小;
初始特征图生成单元,用于将所述图像获取单元获得的所述第一楼宇图像和第二楼宇图像分别输入卷积神经网络以获得第一初始特征图和第二初始特征图;
第一按位置交叉熵加权矩阵系数计算单元,用于计算所述初始特征图生成单元获得的所述第一初始特征图相对于所述初始特征图生成单元获得的所述第二初始特征图的第一按位置交叉熵加权矩阵系数;
第二按位置交叉熵加权矩阵系数计算单元,用于计算所述初始特征图生成单元获得的所述第二初始特征图相对于所述初始特征图生成单元获得的所述第一初始特征图的第二按位置交叉熵加权矩阵系数;
最终特征图生成单元,用于基于所述第一按位置交叉熵加权矩阵系数计算单元获得的所述第一按位置交叉熵加权矩阵系数和所述第二按位置交叉熵加权矩阵系数计算单元获得的所述第二按位置交叉熵加权矩阵系数对所述第二初始特征图和所述第一初始特征图进行加权以获得最终特征图;以及
图像语义分割单元,用于基于所述最终特征图生成单元获得的所述最终特征图进行图像语义分割以获得图像语义分割结果,所述图像语义分割结果表示所述楼宇的监控结果。
10.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-8中任一项所述的基于按位置交叉熵加权矩阵的智慧园区的楼宇监控方法。
CN202010847165.8A 2020-08-21 2020-08-21 基于按位置交叉熵的楼宇监控方法、装置和电子设备 Active CN112001300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010847165.8A CN112001300B (zh) 2020-08-21 2020-08-21 基于按位置交叉熵的楼宇监控方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010847165.8A CN112001300B (zh) 2020-08-21 2020-08-21 基于按位置交叉熵的楼宇监控方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112001300A true CN112001300A (zh) 2020-11-27
CN112001300B CN112001300B (zh) 2021-07-02

Family

ID=73474140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010847165.8A Active CN112001300B (zh) 2020-08-21 2020-08-21 基于按位置交叉熵的楼宇监控方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112001300B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139520A (zh) * 2021-05-14 2021-07-20 杭州旭颜科技有限公司 用于工业互联网的设备膜片性能监测方法
CN116702156A (zh) * 2023-06-20 2023-09-05 安徽百方云科技有限公司 信息安全风险评价系统及其方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872364A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 图像区域定位方法、装置、存储介质和医学影像处理设备
CN110135296A (zh) * 2019-04-30 2019-08-16 上海交通大学 基于卷积神经网络的机场跑道fod检测方法
CN111126140A (zh) * 2019-11-19 2020-05-08 腾讯科技(深圳)有限公司 文本识别方法、装置、电子设备以及存储介质
CN111259785A (zh) * 2020-01-14 2020-06-09 电子科技大学 基于时间偏移残差网络的唇语识别方法
CN111282281A (zh) * 2020-01-22 2020-06-16 腾讯科技(深圳)有限公司 图像处理方法及装置、电子设备和计算机可读存储介质
CN111339882A (zh) * 2020-02-19 2020-06-26 山东大学 基于实例分割的输电线路隐患检测方法
CN111445462A (zh) * 2020-03-30 2020-07-24 国家计算机网络与信息安全管理中心 一种基于神经网络和热像图的蓄电池漏液检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872364A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 图像区域定位方法、装置、存储介质和医学影像处理设备
CN110135296A (zh) * 2019-04-30 2019-08-16 上海交通大学 基于卷积神经网络的机场跑道fod检测方法
CN111126140A (zh) * 2019-11-19 2020-05-08 腾讯科技(深圳)有限公司 文本识别方法、装置、电子设备以及存储介质
CN111259785A (zh) * 2020-01-14 2020-06-09 电子科技大学 基于时间偏移残差网络的唇语识别方法
CN111282281A (zh) * 2020-01-22 2020-06-16 腾讯科技(深圳)有限公司 图像处理方法及装置、电子设备和计算机可读存储介质
CN111339882A (zh) * 2020-02-19 2020-06-26 山东大学 基于实例分割的输电线路隐患检测方法
CN111445462A (zh) * 2020-03-30 2020-07-24 国家计算机网络与信息安全管理中心 一种基于神经网络和热像图的蓄电池漏液检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIE CAO ETC.: "Softmax Cross Entropy Loss with Unbiased Decision Boundary for Image Classification", 《IEEEXPLORER》 *
余飞: "级联深度卷积神经网络人脸检测应用研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139520A (zh) * 2021-05-14 2021-07-20 杭州旭颜科技有限公司 用于工业互联网的设备膜片性能监测方法
CN113139520B (zh) * 2021-05-14 2022-07-29 江苏中天互联科技有限公司 用于工业互联网的设备膜片性能监测方法
CN116702156A (zh) * 2023-06-20 2023-09-05 安徽百方云科技有限公司 信息安全风险评价系统及其方法
CN116702156B (zh) * 2023-06-20 2024-04-09 任丽娜 信息安全风险评价系统及其方法

Also Published As

Publication number Publication date
CN112001300B (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
US10896323B2 (en) Method and device for image processing, computer readable storage medium, and electronic device
US11037031B2 (en) Image recognition method, electronic apparatus and readable storage medium
CN111460968B (zh) 基于视频的无人机识别与跟踪方法及装置
CN109241888B (zh) 神经网络训练与对象识别方法、装置和系统及存储介质
CN112052837A (zh) 基于人工智能的目标检测方法以及装置
CN112001300B (zh) 基于按位置交叉熵的楼宇监控方法、装置和电子设备
CN113537070B (zh) 一种检测方法、装置、电子设备及存储介质
CN111226226A (zh) 基于运动的对象检测方法及其对象检测装置和电子设备
CN109063790B (zh) 对象识别模型优化方法、装置和电子设备
CN112149476A (zh) 目标检测方法、装置、设备和存储介质
CN113869429A (zh) 模型训练方法及图像处理方法
CN113887615A (zh) 图像处理方法、装置、设备和介质
CN112001301B (zh) 基于全局交叉熵加权的楼宇监控方法、装置和电子设备
CN113936202A (zh) 图像安全处理方法和装置、电子设备和存储介质
CN113239883A (zh) 分类模型的训练方法、装置、电子设备以及存储介质
CN110704650B (zh) Ota图片标签的识别方法、电子设备和介质
CN114550220B (zh) 行人重识别模型的训练方法及行人重识别方法
CN113721240B (zh) 一种目标关联方法、装置、电子设备及存储介质
CN111680674B (zh) 基于自集成注意力机制的门厅人员监控方法
CN114821513A (zh) 一种基于多层网络的图像处理方法及装置、电子设备
Yuan et al. Adaptive weighted multiscale feature fusion for small drone object detection
CN113420790A (zh) 用于目标检测的自动标注方法和装置
Kaur et al. Deep learning: survey of environmental and camera impacts on internet of things images
CN108960014B (zh) 图像处理方法、装置和系统及存储介质
CN112989869A (zh) 人脸质量检测模型的优化方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhang Wenjun

Inventor after: Wu Baoxin

Inventor before: Wu Baoxin

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210617

Address after: Room 801-804, 11 Yinhu Avenue, Yuhuan Economic Development Zone, Taizhou City, Zhejiang Province 317600

Applicant after: ZHEJIANG ZHIJIAN TECHNOLOGY Co.,Ltd.

Address before: Room 408-8, 4 / F, building 2, Haichuang technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant before: HANGZHOU ZHUILIE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Building monitoring method, device and electronic equipment based on location based cross entropy

Effective date of registration: 20220628

Granted publication date: 20210702

Pledgee: Yuhuan Branch of China Construction Bank Co.,Ltd.

Pledgor: ZHEJIANG ZHIJIAN TECHNOLOGY CO.,LTD.

Registration number: Y2022330001119