CN113111825A - 施工监控方法和装置、电子设备和存储介质 - Google Patents
施工监控方法和装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113111825A CN113111825A CN202110438619.0A CN202110438619A CN113111825A CN 113111825 A CN113111825 A CN 113111825A CN 202110438619 A CN202110438619 A CN 202110438619A CN 113111825 A CN113111825 A CN 113111825A
- Authority
- CN
- China
- Prior art keywords
- construction
- video
- decoration
- behavior
- project
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 337
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012544 monitoring process Methods 0.000 title claims abstract description 43
- 238000005034 decoration Methods 0.000 claims abstract description 180
- 238000012549 training Methods 0.000 claims abstract description 41
- 230000009471 action Effects 0.000 claims abstract description 22
- 230000006399 behavior Effects 0.000 claims description 127
- 238000012806 monitoring device Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 17
- 238000002372 labelling Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 230000000875 corresponding effect Effects 0.000 description 83
- 238000010586 diagram Methods 0.000 description 16
- 230000005611 electricity Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000009430 construction management Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 239000011449 brick Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开实施例公开了一种施工监控方法和装置、电子设备和存储介质,其中,方法包括:获取由部署于装修项目所在场所的视频采集装置采集的视频;从所述视频中获取预设长度的视频片段;经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息;其中,所述三维卷积网络预先基于多个样本短视频训练得到,所述样本短视频包括一个行为类别对应的完整动作、且所述样本短视频标注有行为类别标注信息;基于所述行为类别预测信息确定对应的施工作业节点。本公开实施例可以使装修公司可以及时获知各装修项目的真实施工情况,以在一定程度上保证装修项目的施工进度和质量。
Description
技术领域
本公开涉及数据处理技术,尤其是一种施工监控方法和装置、电子设备和存储介质。
背景技术
在建筑工程中,对办公楼、住宅等项目进行装修是必不可少的一个环节。在现有技术中,开发商、用户委托装修公司对一个项目进行装修后,装修公司会人为为该项目分配装修项目经理和水电木瓦油等装修工人,由装修项目经理带领水电木瓦油等装修工人对该装修项目进行装修施工,以一个装修项目经理同时管理多名装修工人的方式对装修项目的施工情况进行管理和品质监控。一个装修项目经理同时负责多个装修项目,通常每天要在多个装修项目之间来回奔波,采集其负责的多个装修项目的施工情况并定期汇总反映给公司。
在实现本公开的过程中,发明人发现,现有的装修管理方法至少存在以下问题:需要由装修项目经理采集装修项目的施工情况来定期汇总反映给公司,由于一个装修项目经理同时负责多个装修项目,通常每天要在多个装修项目之间来回奔波收集施工情况数据,数据采集费时费力、效率低,装修公司无法及时获知各装修项目的施工进度;人为汇报施工情况的方式不够透明且缺乏一定客观性,装修公司无法及时获知各装修项目的真实施工进度和状况,从而无法保证装修项目的施工进度和质量;另外,需要由装修项目经理人为采集装修项目的施工情况并定期汇总,需要占用人力资源,人力成本较高。
发明内容
本公开实施例所要解决的一个技术问题是:提供一种施工监控方法和装置、电子设备和存储介质,以使装修公司可以及时获知各装修项目的真实施工情况,以在一定程度上保证装修项目的施工进度和质量。
本公开实施例提供的一种施工监控方法,包括:
获取由部署于装修项目所在场所的视频采集装置采集的视频;
从所述视频中获取预设长度的视频片段;
经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息;其中,所述三维卷积网络预先基于多个样本短视频训练得到,所述样本短视频包括一个行为类别对应的完整动作、且所述样本短视频标注有行为类别标注信息;
基于所述行为类别预测信息确定对应的施工作业节点。
可选地,在本公开任一实施例所述的施工监控方法中,所述三维卷积网络的训练,包括:
获取分别包括多个预设行为类别中一个行为类别对应的完整动作的多个样本短视频;
分别针对所述多个样本短视频标注对应的行为类别标注信息,得到训练数据集;
利用所述三维卷积网络中的三维卷积,分别提取所述训练数据集中每个样本短视频的空域特征和时域特征、并基于提取的空域特征和时域特征对所述每个样本短视频进行分类,得到所述每个样本短视频的行为类别预测信息;
基于所述多个样本短视频的行为类别预测信息和行为类别标注信息之间的差异,对所述三维卷积网络进行训练,直至满足预设训练完成条件。
可选地,在本公开任一实施例所述的施工监控方法中,按照预设采集周期,执行所述获取由部署于装修项目所在场所的视频采集装置采集的视频的操作。
可选地,在本公开任一实施例所述的施工监控方法中,所述从所述视频中获取预设长度的视频片段,包括:
按照预设长度,将所述视频拆分为多个视频片段,分别获取所述多个视频片段中的每个视频片段、或者依次按照预设间隔片段数从所述多个视频片段中选取视频片段;
所述经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,包括:
分别针对所述每个视频片段,执行所述经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别的操作;或者,
分别针对选取的每个视频片段,执行所述经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别的操作。
可选地,在本公开任一实施例所述的施工监控方法中,所述经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息,包括:
通过所述三维卷积网络中的三维卷积,提取所述视频片段的空域特征和时域特征;
基于提取的空域特征和时域特征对所述视频片段进行分类,得到所述视频片段分别对应于预设多个行为类别中每一个行为类别的得分;
根据所述视频片段对应于所述预设多个行为类别的得分,确定所述视频片段对应的行为类别。
可选地,在本公开任一实施例所述的施工监控方法中,还包括:
在服务器的数据库中记录所述装修项目的施工情况信息,所述施工情况信息包括:所述装修项目的项目标识、所述装修项目的已完成施工作业节点和当前施工作业节点、所述已完成施工作业节点和所述当前施工作业节点中各施工作业节点在每个单位时间内对应的至少一个视频片段、所述各施工作业节点对应的各视频片段的采集时刻、所述各视频片段对应的行为类别预测信息;其中,所述装修项目的项目标识唯一标识一个装修项目。
可选地,在本公开任一实施例所述的施工监控方法中,还包括:
响应于完成一个施工作业节点,基于完成的所述一个施工作业节点对应的各视频片段的采集时刻,确定所述一个施工作业节点使用的施工时长,并在所述施工情况信息中记录所述一个施工作业节点使用的施工时长;
响应于完成所述装修项目的所有施工作业节点,汇总所述装修项目的所有施工作业节点的施工时长,得到所述装修项目的总施工时长,并在所述施工情况信息中记录所述装修项目的总施工时长。
可选地,在本公开任一实施例所述的施工监控方法中,还包括:
根据所述装修项目中各施工作业节点使用的施工时长和计划使用时长,对所述各施工作业节点的施工作业人员进行考核。
可选地,在本公开任一实施例所述的施工监控方法中,还包括:
根据所述装修项目的总施工时长和所述装修项目的施工管理人员管理的其他装修项目的总施工时长,对所述施工管理人员进行考核和装修项目派单。
可选地,在本公开任一实施例所述的施工监控方法中,还包括:
在每个单位时间内,从所述装修项目的施工情况信息选取所述当前施工作业节点在所述每个单位时间内对应的一个视频片段作为所述每个时间单位的施工情况播报视频,并在所述服务器对应的APP上呈现所述装修项目的施工情况播报内容,所述施工情况播报内容包括:所述装修项目的已完成施工作业节点和当前施工作业节点、所述每个时间单位的施工情况播报视频;
响应于所述装修项目的委托方的订阅信息中包括所述当前施工作业节点,通过所述订阅信息中的委托方联系方式对应的通信方式,向所述委托方发送施工进展提醒消息,以提醒所述委托方登录所述APP查阅所述装修项目的施工情况播报内容。
本公开实施例提供的一种施工监控装置,包括:
第一获取模块,用于获取由部署于装修项目所在场所的视频采集装置采集的视频;
第二获取模块,用于从所述视频中获取预设长度的视频片段;
识别模块,用于经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息;其中,所述三维卷积网络预先基于多个样本短视频训练得到,所述样本短视频包括一个行为类别对应的完整动作、且所述样本短视频标注有行为类别标注信息;
第一确定模块,用于基于所述行为类别预测信息确定对应的施工作业节点。
可选地,在本公开任一实施例所述的施工监控装置中,还包括所述三维卷积网络的训练模块,用于:获取分别包括多个预设行为类别中一个行为类别对应的完整动作的多个样本短视频;
分别针对所述多个样本短视频标注对应的行为类别标注信息,得到训练数据集;
利用所述三维卷积网络中的三维卷积,分别提取所述训练数据集中每个样本短视频的空域特征和时域特征、并基于提取的空域特征和时域特征对所述每个样本短视频进行分类,得到所述每个样本短视频的行为类别预测信息;
基于所述多个样本短视频的行为类别预测信息和行为类别标注信息之间的差异,对所述三维卷积网络进行训练,直至满足预设训练完成条件。
可选地,在本公开任一实施例所述的施工监控装置中,所述第一获取模块,具体用于按照预设采集周期,执行所述获取由部署于装修项目所在场所的视频采集装置采集的视频的操作。
可选地,在本公开任一实施例所述的施工监控装置中,所述第二获取模块,具体用于:按照预设长度,将所述视频拆分为多个视频片段,分别获取所述多个视频片段中的每个视频片段、或者依次按照预设间隔片段数从所述多个视频片段中选取视频片段;
所述识别模块,具体用于分别针对所述每个视频片段,经预先训练好的三维卷积网络,识别所述每个视频片段对应的行为类别;或者,分别针对选取的每个视频片段,经预先训练好的三维卷积网络,识别所述每个视频片段对应的行为类别。
可选地,在本公开任一实施例所述的施工监控装置中,所述识别模块,具体用于:
通过所述三维卷积网络中的三维卷积,提取所述视频片段的空域特征和时域特征;
基于提取的空域特征和时域特征对所述视频片段进行分类,得到所述视频片段分别对应于预设多个行为类别中每一个行为类别的得分;
根据所述视频片段对应于所述预设多个行为类别的得分,确定所述视频片段对应的行为类别。
可选地,在本公开任一实施例所述的施工监控装置中,还包括:
记录模块,用于在服务器的数据库中记录所述装修项目的施工情况信息,所述施工情况信息包括:所述装修项目的项目标识、所述装修项目的已完成施工作业节点和当前施工作业节点、所述已完成施工作业节点和所述当前施工作业节点中各施工作业节点在每个单位时间内对应的至少一个视频片段、所述各施工作业节点对应的各视频片段的采集时刻、所述各视频片段对应的行为类别预测信息;其中,所述装修项目的项目标识唯一标识一个装修项目。
可选地,在本公开任一实施例所述的施工监控装置中,还包括:
第二确定模块,用于响应于完成一个施工作业节点,基于完成的所述一个施工作业节点对应的各视频片段的采集时刻,确定所述一个施工作业节点使用的施工时长,并在所述施工情况信息中记录所述一个施工作业节点使用的施工时长;
汇总模块,用于响应于完成所述装修项目的所有施工作业节点,汇总所述装修项目的所有施工作业节点的施工时长,得到所述装修项目的总施工时长,并在所述施工情况信息中记录所述装修项目的总施工时长。
可选地,在本公开任一实施例所述的施工监控装置中,还包括:
第一考核模块,用于根据所述装修项目中各施工作业节点使用的施工时长和计划使用时长,对所述各施工作业节点的施工作业人员进行考核。
可选地,在本公开任一实施例所述的施工监控装置中,还包括:
第二考核模块,用于根据所述装修项目的总施工时长和所述装修项目的施工管理人员管理的其他装修项目的总施工时长,对所述施工管理人员进行考核和装修项目派单。
可选地,在本公开任一实施例所述的施工监控装置中,还包括:
播报模块,用于在每个单位时间内,从所述装修项目的施工情况信息选取所述当前施工作业节点在所述每个单位时间内对应的一个视频片段作为所述每个时间单位的施工情况播报视频,并在所述服务器对应的APP上呈现所述装修项目的施工情况播报内容,所述施工情况播报内容包括:所述装修项目的已完成施工作业节点和当前施工作业节点、所述每个时间单位的施工情况播报视频;
提醒模块,用于响应于所述装修项目的委托方的订阅信息中包括所述当前施工作业节点,通过所述订阅信息中的委托方联系方式对应的通信方式,向所述委托方发送施工进展提醒消息,以提醒所述委托方登录所述APP查阅所述装修项目的施工情况播报内容。
在基于本公开上述装置的另一个实施例中,还包括:
本公开实施例的又一个方面,提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开上述任一实施例所述的方法。
本公开实施例的再一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本公开上述任一实施例所述的方法。
基于本公开上述实施例提供的施工监控方法和装置、电子设备和存储介质,通过部署于装修项目所在场所的视频采集装置采集该装修项目的施工视频,然后从该视频中获取预设长度的视频片段,经预先训练好的三维卷积网络,识别视频片段对应的行为类别,得到行为类别预测信息,进而,基于该行为类别预测信息确定对应的施工作业节点。由此,本公开实施例通过视频采集和分析的方式,能够实时获知各装修项目的施工作业节点和施工情况,以使装修公司可以及时获知各装修项目的真实施工情况,以在一定程度上保证装修项目的施工进度和质量。与现有技术由装修项目经理人工采集装修项目的施工情况来定期汇总反映给公司的方式相比,数据采集所需时间短、效率高,且视频内容客观、真实,使装修公司能够及时获知各装修项目的真实施工进度和状况,从而保证装修项目的施工进度和质量;另外,无需占用人力资源,节省了人力成本。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开施工监控方法一个实施例的流程图。
图2(a)为2D卷积用于单通道图像的一个示意图。
图2(b)为2D卷积用于多通道图像的一个示意图。
图2(c)为3D卷积用于多通道图像的一个示意图。
图3为本公开实施例中一个示例性3D卷积网络的一个网络架构示意图。
图4为本公开施工监控方法另一个实施例的流程图。
图5为本公开施工监控方法又一个实施例的流程图。
图6为本公开施工监控装置一个实施例的结构示意图。
图7为本公开施工监控装置另一个实施例的结构示意图。
图8为本公开电子设备一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
图1为本公开施工监控方法一个实施例的流程图。如图1所示,该实施例的施工监控方法包括:
102,获取由部署于装修项目所在场所的视频采集装置采集的视频。
可选地,在本公开实施例的其中一些实施方式中,可以预先在装修项目所在场所(施工工地)部署好视频采集装置(例如摄像头),视频采集装置的部署应尽量能覆盖到更多的施工作业范围,然后将视频采集装置的标识(ID)与该装修项目的项目标识(ID)、该装修项目的委托方(用户或者企业联系人)的通信方式(例如服务器对应的APP账号、手机号、微信号、QQ号等)绑定,并在服务器的数据库中存储该绑定关系。其中,视频采集装置的ID用于唯一标识一个视频采集装置;装修项目的项目ID唯一标识一个装修项目,此处的装修项目可以是一个视频采集装置监控范围内的一个施工项目,例如可以是桥梁、马路、整套房屋或其中的一个房间、客厅、卧室等。
104,从所述视频中获取预设长度的视频片段。
106,经预先训练好的三维(3D)卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息。
其中,所述三维卷积网络预先基于多个样本短视频训练得到,其中,每个样本短视频包括一个行为类别对应的完整动作、且标注有行为类别标注信息。
108,基于所述行为类别预测信息确定对应的施工作业节点。
基于本实施例,通过部署于装修项目所在场所的视频采集装置采集该装修项目的施工视频,然后从该视频中获取预设长度的视频片段,经预先训练好的三维卷积网络,识别视频片段对应的行为类别,得到行为类别预测信息,进而,基于该行为类别预测信息确定对应的施工作业节点。由此,本公开实施例通过视频采集和分析的方式,能够实时获知各装修项目的施工作业节点和施工情况,以使装修公司可以及时获知各装修项目的真实施工情况,以在一定程度上保证装修项目的施工进度和质量。与现有技术由装修项目经理人工采集装修项目的施工情况来定期汇总反映给公司的方式相比,数据采集所需时间短、效率高,且视频内容客观、真实,使装修公司能够及时获知各装修项目的真实施工进度和状况,从而保证装修项目的施工进度和质量;另外,无需占用人力资源,节省了人力成本。
卷积神经网络(CNN)近年被广泛应用于计算机视觉中,包括分类、检测、分割等任务。这些任务一般都是针对图像进行的,使用的是二维(2D)卷积(即卷积核的维度为二维)。而对于基于视频分析的问题,2D卷积不能很好得捕获时序上的信息。
图2(a)为2D卷积用于单通道图像的一个示意图,图2(b)为2D卷积用于多通道图像的一个示意图,图2(c)为3D卷积用于多通道图像的一个示意图。由图2(a)和图2(b)可知,2D卷积最终生成的是一个二维的特征图,图2(b)中的多通道图像可以指同一张图片的3个颜色通道,也指多张堆叠在一起的图片,即一小段视频,对于一个滤波器,输出为一张二维的特征图,多通道的信息被完全压缩了。由图2(c)可知,3D卷积生成的是一个三维的特征图。其中,L表示图像的通道数量,h、w分别表示图像的高和宽,k表示卷积核的尺寸,d表示卷积核的时间深度。若考虑一个视频段输入,其大小为c*L*h*w,其中c为图像通道(一般为3),l为视频段的长度,h和w分别为视频的宽与高,进行一次卷积核大小为3*3*3、卷积步长为1*1*1、填充为真(padding=True)、滤波器个数为K的3D卷积后,输出的特征大小为K*l*h*w*,池化同理。因此,3D卷积可用于对视频进行空域特征和时域特征(spatiotemporal)提取,从而进行视频的行为识别。
图3为本公开实施例中一个示例性3D卷积网络的一个网络架构示意图。图3所述的3D卷积网络包括:8个卷积层(Conv1a、Conv2a、Conv3a、Conv3b、Conv4a、Conv4b、Conv5a、Conv5b),其中,卷积核的大小为3*3*3,卷积步长为1*1*1;5个池化层(Pool1、Pool2、Pool3、Pool4、Pool5),其中,卷积核的大小为2*2*2,卷积步长为2*2*2;2个全连接层(fc6、fc7),输出维度为4096,最后连接1个分类层(softmax)。其中,8个卷积层、5个池化层用于对图像进行3D卷积和池化,2个全连接层用于对池化输出的特征进行全连接,分类层用于对全连接层输出的特征进行分类。该3D卷积网络可以用于连续视频流中进行活动检测、行为识别。
可选地,在其中一些实施方式中,可以预先利用训练数据集对3D卷积网络进行训练,以便得到训练好的3D卷积网络,用于识别视频片段对应的行为类别。
图4为本公开施工监控方法另一个实施例的流程图。如图4所述,在其中一些实施方式中,可以通过如下方式对3D卷积网络进行训练:
202,获取分别包括多个预设行为类别中一个行为类别对应的完整动作的多个样本短视频。
其中的多个预设行为类别可以根据实际需求预先设定,例如对于装修项目,施工内容可以包括“铺砖”、“刷墙”、“美缝”、“水电布线”、“家具安装”、“拆除”、“清洁”,则可以设置多个预设行为类别包括“铺砖”、“刷墙”、“美缝”、“水电布线”、“家具安装”、“拆除”、“清洁”。
204,分别针对所述多个样本短视频标注对应的行为类别标注信息,得到训练数据集。
206,利用3D卷积网络中的3D卷积,分别提取训练数据集中每个样本短视频的空域特征和时域特征,并基于提取的空域特征和时域特征对每个样本短视频进行分类,得到每个样本短视频的行为类别预测信息。
208,基于训练数据集中多个样本短视频的行为类别预测信息和行为类别标注信息之间的差异,对3D卷积网络进行训练,直至满足预设训练完成条件。
其中,可以通过迭代执行上述202-208或者206-208,对3D卷积网络进行训练,直至满足预设训练完成条件。
可选地,在其中一些实施方式中,上述预设训练完成条件例如可以包括但不限于:对3D卷积网络进行迭代训练的次数达到预设次数,和/或训练数据集中多个样本短视频的行为类别预测信息和行为类别标注信息之间的差异小于预设阈值,本公开实施例对预设训练完成条件不做限制。
可选地,在其中一些实施方式中,可以收集大量的样本视频,然后将样本视频分别拆分成许多长度不一的短视频,作为样本短视频,样本短视频的时长例如在2-10s不等,以包括多个预设行为类别中一个行为类别对应的完整动作为标准。然后对样本短视频中动作对应的行为类别进行标注(即行为类别标注信息),标注的行为类别可根据实际要识别的行为类别自定义,假设想要识别的施工内容包括“铺砖”、“刷墙”、“美缝”、“水电布线”,那么多个预设行为类别相应为“铺砖”、“刷墙”、“美缝”、“水电布线”之一,将样本短视频标注成对应的行为类别即可,然后将标注好行为类别的数据集分成训练数据集、验证数据集、测试数据集,比例可以为7:2:1。其中训练数据集可用于通过上述图4所示实施例训练3D卷积网络;验证数据集可用于在训练3D卷积网络的过程中,根据3D卷积网络针对验证数据集中样本短视频输出的行为类别预测信息和对应行为类别标注信息之间的差异,验证当前得到的3D卷积网络的预测性能;测试数据集可用于在3D卷积网络训练完成后,根据3D卷积网络针对测试数据集中样本短视频输出的行为类别预测信息和对应行为类别标注信息之间的差异,测试训练得到的3D卷积网络的预测性能。
可选地,在其中一些实施方式中,上述实施例的102中,可以按照预设采集周期,例如2小时,获取由部署于装修项目所在场所的视频采集装置采集的视频。这样,可以实现对装修项目所在场所的施工情况的持续监控。
可选地,在其中一些实施方式中,上述实施例的104中,可以按照预设长度(例如2s-10s中的任一时长或者不定时长),将所述视频拆分为多个视频片段,例如将所述视频拆分为不长于10s的多个视频片段,分别获取所述多个视频片段中的每个视频片段,相应地,分别针对所述多个视频片段中的每个视频片段执行106,即,针对视频中的每个视频片段均识别对应的行为类别,本实施例实现了对所有施工视频内容的施工行为类别的识别。
可选地,在另一些实施方式中,上述实施例的104中,也可以按照预设长度(例如2s-10s中的任一时长或者不定时长),将所述视频拆分为多个视频片段,例如将所述视频拆分为不长于10s的多个视频片段,依次按照预设间隔片段数从所述多个视频片段中选取视频片段(例如每隔5个视频片段选取1个视频片段),相应地,分别针对选取的每个视频片段执行106,即仅针对选取的每个视频片段识别对应的行为类别,由于在实际装修项目中,完成每个行为类别对应的施工作业,例如“铺砖”、“刷墙”、“美缝”、“水电布线”,会需要较长时间,从几个小时到几天,通常几秒钟或者几分钟的作业时长对一个行为类别对应的施工作业的影响不大,本实施例采用间隔选取的方式,通过选取施工视频内容中部分视频片段内容的施工行为类别的识别,可以节省识别视频片段对应的行为类别所需的计算资源,减轻服务器的工作压力。
图5为本公开施工监控方法又一个实施例的流程图。如图5所示,在上述实施例的基础上,106包括:
1062,通过3D卷积网络中的3D卷积,提取所述视频片段的空域特征和时域特征。
1064,基于提取的空域特征和时域特征对所述视频片段进行分类,得到所述视频片段分别对应于预设多个行为类别中每一个行为类别的得分。
1066,根据所述视频片段对应于预设多个行为类别的得分,确定所述视频片段对应的行为类别。
可选地,在其中一些实施方式中,可以以所述视频片段对应于预设多个行为类别的得分中得分最高的一个行为类别,作为所述视频片段对应的行为类别。
基于本实施例,可以采用3D卷积网络提取视频片段的空域特征和时域特征,从而实现对视频片段的行为类别识别,进一步可实现对视频流的行为类别识别。
可选地,在其中一些实施方式中,还可以在服务器的数据库中记录装修项目的施工情况信息,该施工情况信息可以包括但不限于:装修项目的项目标识(ID)、装修项目的已完成施工作业节点和当前施工作业节点、已完成施工作业节点和当前施工作业节点中各施工作业节点在每个单位时间内对应的至少一个视频片段、已完成施工作业节点和当前施工作业节点中各施工作业节点对应的各视频片段的采集时刻以及各视频片段对应的行为类别预测信息。其中的装修项目的项目ID唯一标识一个装修项目,此处的装修项目可以是一个视频采集装置监控范围内的一个施工项目,例如可以是桥梁、马路、整套房屋或其中的一个房间、客厅、卧室等。
基于本实施例,可以记录各装修项目的施工情况信息,从而可以方便的获知各装修项目的施工进度和整体施工状况,以便于装修公司和委托人可以实时、全面了解该装修项目的真实施工进度和状况。
可选地,在其中一些实施方式中,还可以包括:
响应于完成一个施工作业节点,基于完成的所述一个施工作业节点对应的各视频片段的采集时刻,确定完成的所述一个施工作业节点使用的施工时长,并在施工情况信息中记录所述一个施工作业节点使用的施工时长。
其中的一个施工作业节点对应于一个行为类别,在当前识别的视频片段对应的行为类别不同于识别的上一视频片段对应的行为类别时,可以认为当前识别的视频片段属于一个新的施工作业节点的开始,识别的上一视频片段属于一个的施工作业节点的结束,从而基于一个施工作业节点的开始和结束视频片段的采集时刻,可以计算得到施工作业节点使用的施工时长。
可选地,在其中一些实施方式中,还可以根据装修项目中各施工作业节点使用的施工时长和计划使用时长,对各施工作业节点的施工作业人员进行考核,从而实现对施工作业人员的自动、客观考核。
可选地,在其中一些实施方式中,还可以包括:
响应于完成一个装修项目的所有施工作业节点,汇总完成的所述一个装修项目的所有施工作业节点的施工时长,得到完成的所述一个装修项目的总施工时长,并在施工情况信息中记录完成的所述一个装修项目的总施工时长。
可选地,在其中一些实施方式中,还可以根据一个装修项目的总施工时长和装修项目的施工管理人员管理的其他装修项目的总施工时长,或者进一步结合装修项目委托方的投诉量等其他指标,对施工管理人员进行考核和装修项目派单,从而实现对施工管理人员的自动、客观考核和派单,以提高考核客观性和派单的合理性,避免主观性的偏袒,从而提高整个装修公司的人力资源效率。
可选地,在其中一些实施方式中,还可以在每个单位时间(例如每天、每三天、每周等)内,从装修项目的施工情况信息选取当前施工作业节点在每个单位时间内对应的一个视频片段作为每个时间单位的施工情况播报视频,并在服务器对应的应用(APP)上呈现装修项目的施工情况播报内容,该施工情况播报内容例如可以包括但不限于:装修项目的已完成施工作业节点和当前施工作业节点、每个时间单位的施工情况播报视频,其中的每个单位时间可以根据实际需求和可能的施工进展情况设置,例如可以是天、周、两周、月等。
基于本实施例,可以自动生成个单位时间的施工情况播报内容,提高播报生成的效率。
进一步地,响应于一个装修项目的委托方的订阅信息中包括当前施工作业节点,通过订阅信息中的委托方联系方式对应的通信方式,向委托方发送施工进展提醒消息,以提醒委托方登录APP查阅该装修项目的施工情况播报内容。
例如,可以每天在APP上呈现装修项目的施工情况播报内容,并且如果服务器识别到委托方订阅了该施工作业节点,可以自动向委托方APP账户发送消息、发送短信或者打电话,提醒其上线APP查阅该装修项目的施工情况播报内容。
基于本实施例,支持委托方订阅施工作业节点,服务器可以对委托方开放自动订阅入口,委托方可以通过该自动订阅入口订阅自己比较关心的施工作业节点并存储在数据库中,委托方能订阅自己比较关心的施工作业节点,当施工工地发生该施工作业节点的作业时能及时主动的通知到委托方,以APP的形式对委托方展示当天的施工工作内容,使委托方时刻掌握施工动态,实时了解工地装修进度,提高了用户体验度。
本公开实施例提供的任一种施工监控方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一种施工监控方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种施工监控方法。下文不再赘述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图6为本公开施工监控装置一个实施例的结构示意图。该实施例的施工监控装置可用于实现本公开上述各施工监控方法实施例。如图6所示,该实施例的施工监控装置包括:第一获取模块,第二获取模块,识别模块和第一确定模块。其中:
第一获取模块,用于获取由部署于装修项目所在场所的视频采集装置采集的视频。
第二获取模块,用于从所述视频中获取预设长度的视频片段。
识别模块,用于经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息;其中,3D卷积网络预先基于多个样本短视频训练得到,所述样本短视频包括一个行为类别对应的完整动作、且所述样本短视频标注有行为类别标注信息;
第一确定模块,用于基于所述行为类别预测信息确定对应的施工作业节点。
基于本实施例,通过视频采集和分析的方式,能够实时获知各装修项目的施工作业节点和施工情况,以使装修公司可以及时获知各装修项目的真实施工情况,以在一定程度上保证装修项目的施工进度和质量。与现有技术由装修项目经理人工采集装修项目的施工情况来定期汇总反映给公司的方式相比,数据采集所需时间短、效率高,且视频内容客观、真实,使装修公司能够及时获知各装修项目的真实施工进度和状况,从而保证装修项目的施工进度和质量;另外,无需占用人力资源,节省了人力成本。
图7为本公开施工监控装置另一个实施例的结构示意图。如图7所示,与图6所述的实施例相比,该实施例的施工监控装置还可以包括3D卷积网络的训练模块,用于:获取分别包括多个预设行为类别中一个行为类别对应的完整动作的多个样本短视频;分别针对所述多个样本短视频标注对应的行为类别标注信息,得到训练数据集;利用3D卷积网络中的三维卷积,分别提取所述训练数据集中每个样本短视频的空域特征和时域特征、并基于提取的空域特征和时域特征对每个样本短视频进行分类,得到每个样本短视频的行为类别预测信息;基于所述多个样本短视频的行为类别预测信息和行为类别标注信息之间的差异,对3D卷积网络进行训练,直至满足预设训练完成条件。
可选地,在其中一些实施方式中,所述第一获取模块,具体用于按照预设采集周期,获取由部署于装修项目所在场所的视频采集装置采集的视频。
可选地,在其中一些实施方式中,所述第二获取模块,具体用于:按照预设长度,将所述视频拆分为多个视频片段,分别获取所述多个视频片段中的每个视频片段、或者依次按照预设间隔片段数从所述多个视频片段中选取视频片段。相应地,该实施例中,所述识别模块,具体用于分别针对所述每个视频片段,经预先训练好的三维卷积网络,识别所述每个视频片段对应的行为类别;或者,分别针对选取的每个视频片段,经预先训练好的三维卷积网络,识别所述每个视频片段对应的行为类别。
可选地,在其中一些实施方式中,所述识别模块,具体用于:通过3D卷积网络中的三维卷积,提取所述视频片段的空域特征和时域特征;基于提取的空域特征和时域特征对所述视频片段进行分类,得到所述视频片段分别对应于预设多个行为类别中每一个行为类别的得分;根据所述视频片段对应于所述预设多个行为类别的得分,确定所述视频片段对应的行为类别。
可选地,再参见图7,在上述实施例的基础上,该实施例的施工监控装置还可以包括:记录模块,用于在服务器的数据库中记录所述装修项目的施工情况信息,所述施工情况信息包括:所述装修项目的项目标识、所述装修项目的已完成施工作业节点和当前施工作业节点、所述已完成施工作业节点和所述当前施工作业节点中各施工作业节点在每个单位时间内对应的至少一个视频片段、所述各施工作业节点对应的各视频片段的采集时刻、所述各视频片段对应的行为类别预测信息;其中,所述装修项目的项目标识唯一标识一个装修项目。
可选地,再参见图7,在上述实施例的基础上,该实施例的施工监控装置还可以包括:第二确定模块和汇总模块。其中:
第二确定模块,用于响应于完成一个施工作业节点,基于完成的所述一个施工作业节点对应的各视频片段的采集时刻,确定所述一个施工作业节点使用的施工时长,并在所述施工情况信息中记录所述一个施工作业节点使用的施工时长;
汇总模块,用于响应于完成所述装修项目的所有施工作业节点,汇总所述装修项目的所有施工作业节点的施工时长,得到所述装修项目的总施工时长,并在所述施工情况信息中记录所述装修项目的总施工时长。
可选地,再参见图7,在上述实施例的基础上,该实施例的施工监控装置还可以包括:第一考核模块,用于根据所述装修项目中各施工作业节点使用的施工时长和计划使用时长,对所述各施工作业节点的施工作业人员进行考核。
可选地,再参见图7,在上述实施例的基础上,该实施例的施工监控装置还可以包括:第二考核模块,用于根据所述装修项目的总施工时长和所述装修项目的施工管理人员管理的其他装修项目的总施工时长,对所述施工管理人员进行考核和装修项目派单。
可选地,再参见图7,在上述实施例的基础上,该实施例的施工监控装置还可以包括:播报模块和/或提醒模块。其中:
播报模块,用于在每个单位时间内,从所述装修项目的施工情况信息选取所述当前施工作业节点在所述每个单位时间内对应的一个视频片段作为所述每个时间单位的施工情况播报视频,并在所述服务器对应的APP上呈现所述装修项目的施工情况播报内容,所述施工情况播报内容包括:所述装修项目的已完成施工作业节点和当前施工作业节点、所述每个时间单位的施工情况播报视频。
提醒模块,用于响应于所述装修项目的委托方的订阅信息中包括所述当前施工作业节点,通过所述订阅信息中的委托方联系方式对应的通信方式,向所述委托方发送施工进展提醒消息,以提醒所述委托方登录所述APP查阅所述装修项目的施工情况播报内容。
另外,本公开实施例还提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开上述任一实施例所述的施工监控方法。
下面,参考图8来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
图8图示了根据本公开实施例的电子设备的框图。如图8所示,电子设备包括一个或多个处理器和存储器。
处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行所述程序指令,以实现上文所述的本公开的各个实施例的施工监控方法以及/或者其他期望的功能。
在一个示例中,电子装置还可以包括:输入装置和输出装置,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
此外,该输入装置还可以包括例如键盘、鼠标等等。
该输出装置可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出装置等等。
当然,为了简化,图8中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的施工监控方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的施工监控方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种施工监控方法,其特征在于,包括:
获取由部署于装修项目所在场所的视频采集装置采集的视频;
从所述视频中获取预设长度的视频片段;
经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息;其中,所述三维卷积网络预先基于多个样本短视频训练得到,所述样本短视频包括一个行为类别对应的完整动作、且所述样本短视频标注有行为类别标注信息;
基于所述行为类别预测信息确定对应的施工作业节点。
2.根据权利要求1所述的方法,其特征在于,所述三维卷积网络的训练,包括:
获取分别包括多个预设行为类别中一个行为类别对应的完整动作的多个样本短视频;
分别针对所述多个样本短视频标注对应的行为类别标注信息,得到训练数据集;
利用所述三维卷积网络中的三维卷积,分别提取所述训练数据集中每个样本短视频的空域特征和时域特征、并基于提取的空域特征和时域特征对所述每个样本短视频进行分类,得到所述每个样本短视频的行为类别预测信息;
基于所述多个样本短视频的行为类别预测信息和行为类别标注信息之间的差异,对所述三维卷积网络进行训练,直至满足预设训练完成条件。
3.根据权利要求1-2任一所述的方法,其特征在于,所述经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息,包括:
通过所述三维卷积网络中的三维卷积,提取所述视频片段的空域特征和时域特征;
基于提取的空域特征和时域特征对所述视频片段进行分类,得到所述视频片段分别对应于预设多个行为类别中每一个行为类别的得分;
根据所述视频片段对应于所述预设多个行为类别的得分,确定所述视频片段对应的行为类别。
4.根据权利要求1-3任一所述的方法,其特征在于,还包括:
在服务器的数据库中记录所述装修项目的施工情况信息,所述施工情况信息包括:所述装修项目的项目标识、所述装修项目的已完成施工作业节点和当前施工作业节点、所述已完成施工作业节点和所述当前施工作业节点中各施工作业节点在每个单位时间内对应的至少一个视频片段、所述各施工作业节点对应的各视频片段的采集时刻、所述各视频片段对应的行为类别预测信息;其中,所述装修项目的项目标识唯一标识一个装修项目。
5.根据权利要求4所述的方法,其特征在于,还包括:
响应于完成一个施工作业节点,基于完成的所述一个施工作业节点对应的各视频片段的采集时刻,确定所述一个施工作业节点使用的施工时长,并在所述施工情况信息中记录所述一个施工作业节点使用的施工时长;
响应于完成所述装修项目的所有施工作业节点,汇总所述装修项目的所有施工作业节点的施工时长,得到所述装修项目的总施工时长,并在所述施工情况信息中记录所述装修项目的总施工时长;
所述方法还包括:
根据所述装修项目中各施工作业节点使用的施工时长和计划使用时长,对所述各施工作业节点的施工作业人员进行考核。
6.根据权利要求5所述的方法,其特征在于,还包括:
根据所述装修项目的总施工时长和所述装修项目的施工管理人员管理的其他装修项目的总施工时长,对所述施工管理人员进行考核和装修项目派单。
7.根据权利要求4-6任一所述的方法,其特征在于,还包括:
在每个单位时间内,从所述装修项目的施工情况信息选取所述当前施工作业节点在所述每个单位时间内对应的一个视频片段作为所述每个时间单位的施工情况播报视频,并在所述服务器对应的APP上呈现所述装修项目的施工情况播报内容,所述施工情况播报内容包括:所述装修项目的已完成施工作业节点和当前施工作业节点、所述每个时间单位的施工情况播报视频;
响应于所述装修项目的委托方的订阅信息中包括所述当前施工作业节点,通过所述订阅信息中的委托方联系方式对应的通信方式,向所述委托方发送施工进展提醒消息,以提醒所述委托方登录所述APP查阅所述装修项目的施工情况播报内容。
8.一种施工监控装置,其特征在于,包括:
第一获取模块,用于获取由部署于装修项目所在场所的视频采集装置采集的视频;
第二获取模块,用于从所述视频中获取预设长度的视频片段;
识别模块,用于经预先训练好的三维卷积网络,识别所述视频片段对应的行为类别,得到行为类别预测信息;其中,所述三维卷积网络预先基于多个样本短视频训练得到,所述样本短视频包括一个行为类别对应的完整动作、且所述样本短视频标注有行为类别标注信息;
第一确定模块,用于基于所述行为类别预测信息确定对应的施工作业节点。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现上述权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现上述权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110438619.0A CN113111825A (zh) | 2021-04-22 | 2021-04-22 | 施工监控方法和装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110438619.0A CN113111825A (zh) | 2021-04-22 | 2021-04-22 | 施工监控方法和装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113111825A true CN113111825A (zh) | 2021-07-13 |
Family
ID=76719675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110438619.0A Pending CN113111825A (zh) | 2021-04-22 | 2021-04-22 | 施工监控方法和装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111825A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116797406A (zh) * | 2023-06-29 | 2023-09-22 | 华腾建信科技有限公司 | 自动生成可视化进度的工程数据处理方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110182469A1 (en) * | 2010-01-28 | 2011-07-28 | Nec Laboratories America, Inc. | 3d convolutional neural networks for automatic human action recognition |
CN108053180A (zh) * | 2017-12-25 | 2018-05-18 | 广州善施电子商务有限公司 | 一种装修项目信息化管控方法及系统 |
CN108153219A (zh) * | 2018-02-12 | 2018-06-12 | 北京新能正源环境科技有限公司 | 施工进度监测系统、服务器及终端设备 |
CN108320075A (zh) * | 2017-12-29 | 2018-07-24 | 安徽博诺思信息科技有限公司 | 一种具备照片管理功能的可视化现场监控系统及方法 |
CN108960668A (zh) * | 2018-07-19 | 2018-12-07 | 上海小蚁科技有限公司 | 工程质量监控的预警提示方法及装置、存储介质、计算设备 |
CN110222918A (zh) * | 2019-04-18 | 2019-09-10 | 重庆恢恢信息技术有限公司 | 基于云平台的智慧工地管理系统、服务器及存储介质 |
CN110674792A (zh) * | 2019-10-17 | 2020-01-10 | 河南四建工程有限公司 | 基于神经网络的施工进度监测装置及方法 |
CN111368806A (zh) * | 2020-04-01 | 2020-07-03 | 大连理工大学 | 一种基于人工智能的工人施工状态监测方法 |
CN112183313A (zh) * | 2020-09-27 | 2021-01-05 | 武汉大学 | 一种基于SlowFast的电力作业现场动作识别方法 |
CN112380982A (zh) * | 2020-11-13 | 2021-02-19 | 福建亿榕信息技术有限公司 | 一种电力行业基建项目进度与质量的一体化监测方法 |
CN112418714A (zh) * | 2020-12-09 | 2021-02-26 | 刘佳钰 | 一种建筑施工数据安全检测方法、装置及服务器 |
CN112464844A (zh) * | 2020-12-07 | 2021-03-09 | 天津科技大学 | 一种基于深度学习与运动目标检测的人体行为动作识别方法 |
CN112508340A (zh) * | 2020-11-10 | 2021-03-16 | 浙江鑫润工程管理有限公司 | 一种工程监理项目进度监管方法、系统、装置和存储介质 |
-
2021
- 2021-04-22 CN CN202110438619.0A patent/CN113111825A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110182469A1 (en) * | 2010-01-28 | 2011-07-28 | Nec Laboratories America, Inc. | 3d convolutional neural networks for automatic human action recognition |
CN108053180A (zh) * | 2017-12-25 | 2018-05-18 | 广州善施电子商务有限公司 | 一种装修项目信息化管控方法及系统 |
CN108320075A (zh) * | 2017-12-29 | 2018-07-24 | 安徽博诺思信息科技有限公司 | 一种具备照片管理功能的可视化现场监控系统及方法 |
CN108153219A (zh) * | 2018-02-12 | 2018-06-12 | 北京新能正源环境科技有限公司 | 施工进度监测系统、服务器及终端设备 |
CN108960668A (zh) * | 2018-07-19 | 2018-12-07 | 上海小蚁科技有限公司 | 工程质量监控的预警提示方法及装置、存储介质、计算设备 |
CN110222918A (zh) * | 2019-04-18 | 2019-09-10 | 重庆恢恢信息技术有限公司 | 基于云平台的智慧工地管理系统、服务器及存储介质 |
CN110674792A (zh) * | 2019-10-17 | 2020-01-10 | 河南四建工程有限公司 | 基于神经网络的施工进度监测装置及方法 |
CN111368806A (zh) * | 2020-04-01 | 2020-07-03 | 大连理工大学 | 一种基于人工智能的工人施工状态监测方法 |
CN112183313A (zh) * | 2020-09-27 | 2021-01-05 | 武汉大学 | 一种基于SlowFast的电力作业现场动作识别方法 |
CN112508340A (zh) * | 2020-11-10 | 2021-03-16 | 浙江鑫润工程管理有限公司 | 一种工程监理项目进度监管方法、系统、装置和存储介质 |
CN112380982A (zh) * | 2020-11-13 | 2021-02-19 | 福建亿榕信息技术有限公司 | 一种电力行业基建项目进度与质量的一体化监测方法 |
CN112464844A (zh) * | 2020-12-07 | 2021-03-09 | 天津科技大学 | 一种基于深度学习与运动目标检测的人体行为动作识别方法 |
CN112418714A (zh) * | 2020-12-09 | 2021-02-26 | 刘佳钰 | 一种建筑施工数据安全检测方法、装置及服务器 |
Non-Patent Citations (3)
Title |
---|
PABLO MARTINEZ等: "A vision-based approach for automatic progress tracking of floor paneling in offsite construction facilities", 《AUTOMATION IN CONSTRUCTION》, pages 1 - 23 * |
PABLO MARTINEZ等: "A vision-based approach for automatic progress tracking of floor paneling in offsite construction facilities", 《AUTOMATION IN CONSTRUCTION》, vol. 125, 17 February 2021 (2021-02-17), pages 1 - 13, XP086558410, DOI: 10.1016/j.autcon.2021.103620 * |
李刚等: "基于三维卷积稠密网络的视频行为识别算法", 《中国科技论文》, vol. 13, no. 14, pages 1634 - 1638 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116797406A (zh) * | 2023-06-29 | 2023-09-22 | 华腾建信科技有限公司 | 自动生成可视化进度的工程数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10812761B2 (en) | Complex hardware-based system for video surveillance tracking | |
CN103274272B (zh) | 一种电梯综合管理系统及电梯综合管理方法 | |
US20090265280A1 (en) | Managing real time meeting room status | |
US9165250B2 (en) | Dynamic incident response | |
CN105637891A (zh) | 遥测数据的动态收集分析和报告 | |
CN111835582A (zh) | 物联网巡检设备的配置方法、装置、计算机设备 | |
CN113132690B (zh) | 施工过程视频的生成方法、装置以及电子设备、存储介质 | |
US11037604B2 (en) | Method for video investigation | |
US20220019595A1 (en) | Integrated intelligent building management system and management method thereof | |
CN109413363A (zh) | 一种会议预约方法和装置、以及存储介质 | |
CN114140999A (zh) | 一种基于物联网通信的工程监理系统 | |
CN103246606A (zh) | Esb平台的性能方法和系统 | |
CN111178778A (zh) | 基于机器学习的安保活动方案生成方法、系统及安保活动管理系统 | |
US10474768B2 (en) | Sensor-based facility energy modeling | |
CN113111825A (zh) | 施工监控方法和装置、电子设备和存储介质 | |
CN104715313A (zh) | 派工管理系统及其方法 | |
CN111835583B (zh) | 物联网产品的属性巡检方法、装置和计算机设备 | |
CN110895663A (zh) | 一种两轮车识别方法、装置、电子设备及监控系统 | |
CN115567563B (zh) | 基于端边云的综合交通枢纽监测预警系统及其控制方法 | |
CN108073854A (zh) | 一种现场巡检的检测方法及装置 | |
CN114663834B (zh) | 一种快递存放现场监控方法 | |
CN115761614A (zh) | 基于多视角深度学习算法的异常行为目标检测系统 | |
CN115146965A (zh) | 值班人员规划方法、装置、存储介质和设备 | |
CN113158842A (zh) | 一种识别方法、系统、设备及介质 | |
CN112950438A (zh) | 数据处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |