CN114140875A - 一种基于计算机视觉识别动作组合效率分析方法 - Google Patents
一种基于计算机视觉识别动作组合效率分析方法 Download PDFInfo
- Publication number
- CN114140875A CN114140875A CN202111388679.2A CN202111388679A CN114140875A CN 114140875 A CN114140875 A CN 114140875A CN 202111388679 A CN202111388679 A CN 202111388679A CN 114140875 A CN114140875 A CN 114140875A
- Authority
- CN
- China
- Prior art keywords
- action
- sequence
- combination
- basic unit
- computer vision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Fuzzy Systems (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于计算机视觉识别动作组合效率分析方法,涉及图像处理技术领域,其技术方案要点是:具体包括以下步骤:1)采用摄像头采集实时的视频数据,并对其进行预处理;2)对步骤1)中预处理后的视频数据中的连续动作分解为多个平移变化帧连续图像;3)将与时间上下文关系的动作化解为图像分类,通过层级递进策略对图像类别进行序列组合,生成动作基本单元Ci的有序排列组合Ai={C1,C2,C3…Ci,Cit1…};4)对有序排列组合Ai={C1,C2,C3…Ci,Ci+1…}采用模型进行训练,得计算机视觉模型;5)对基本单元进行识别。该效率分析方法使用摄象头对工厂流水线上的工人动作效率的评价,以利于快速发现流水线工作效率低下的原因,协助提高生产效率。
Description
技术领域
本发明涉及图像处理技术领域,更具体地说,它涉及一种基于计 算机视觉识别动作组合效率分析方法。
背景技术
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说, 就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机 器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传 送给仪器检测的图像。
在工业生产中,大部分的流水线均需要人工操作,人工操作最大 的弊端是生产效率较低,出现生产效率低的原因有很多,其中一个最 主要的原因是工人在生产制造过程中动作不标准或不熟练,所以对工 人的操作动作进行规范管理成为亟需解决的问题。
发明内容
本发明的目的是提供一种基于计算机视觉识别动作组合效率分 析方法,该效率分析方法使用摄象头对工厂流水线上的工人动作效率 的评价,以利于快速发现流水线工作效率低下的原因,协助提高生产 效率。
本发明的上述技术目的是通过以下技术方案得以实现的:一种基 于计算机视觉识别动作组合效率分析方法,包括以下步骤:
1)采用摄像头采集实时的视频数据,并对其进行预处理;
2)对步骤1)中预处理后的视频数据中的连续动作分解为多个平 移变化帧连续图像;
3)将与时间上下文关系的动作化解为图像分类,通过层级递进 策略对图像类别进行序列组合,生成动作基本单元Ci的有序排列组合 Ai={C1,C2,C3...Ci,Ci+1,...};
4)对有序排列组合Ai={C1,C2,C3...Ci,Ci+1,...}采用模型进行训练, 得计算机视觉模型;
5)对基本单元进行识别,且对基本单元的识别结果序列进行解 释与处理,并将其与标准数据库进行比对,得出序列与数据库的匹配 率,即达到规范动作行为分析。
进一步的,所述步骤3)中生成动作基本单元Ci的有序排列组合 的方式是将每个作业站点下完成一个工作任务的流程视为一个完整 的动作流程Ai,将动作流程Ai分解为数个组成动作流程的动作步骤Si, 再将动作步骤Si分解为多个动作基本单元Ci,多个基本单元Ci组成有 序排列组合Ai={C1,C2,C3…Ci,Ci+1,…}。
进一步的,所述步骤3)中层级递进策略的具体步骤为:
A)检测摄像头是否开启,若摄像头开启进行步骤B),若摄像头 关闭,停止后续操作;
B)不断对摄像头视频数据进行读取,并对基本单元进行识别, 若识别成功,将每一帧输入目标检测模型后输出基本单元识别结果列 表,并将其加入识别序列集detectSet,再进行步骤C);若未识别出 结果,则标记为“错误”基本单元;
C)对序列集detectSet的尺寸与窗口长度L进行比较,若detectSet 的尺寸大于窗口L,调用窗口平滑策略,此时平滑与增加识别序列集 交替进行;若平滑次数达到阈值或当前识别的基本单元结束时,将平 滑后的结果resultSet转化为映射关系baseSet,并进行时间比对判定 是否超时,若超时则添加标记并进行步骤D);若detectSet的尺寸小 于窗口L,直接进行步骤D);
D)将baseSet与数据库里的步骤进行最短匹配,若与数据库里 某条步骤信息匹配正确,则定义为“有效”步骤,将baseSet舍弃, 同时将匹配到的步骤加入stepSet匹配到序列,并进行步骤E);若匹 配失败,将baseSet第一个基本单元标记为“无效”;
E)将“有效”的步骤序列stepSet再与数据库里的动作流程信息 匹配,若与数据库中的某条动作信息里的步骤序列匹配无误,则为“有 效”的动作流程;若stepSet与数据库中的任意一条动作信息里的步 骤序列均匹配有误时,则为“无效”的动作流程。
进一步地,步骤1)中所述的预处理的具体方法包括以下步骤:
(1)从原生视频数据集R获得视频序列集V(V∈Rnx×ny),并保 证每段视频序列只包含有效信息和单个动作的特征;
(2)按照行为体手部动作变化的起始帧和终止帧对每段视频序 列中的动作内容进行剪切操作,依次获得视频序列子集: Vclip(Vclip∈Rkx×ky,0<kx<nx,0<ky<ny),并确保采样的每个Vclip 集合中每个子样本的动作能处于kx×ky的视频帧方盒中;
(3)假设视频序列V的第i个时间Ti的帧视频序列为V(:,:,Ti), 依次采样操作后,得到Δt后动作的结果序列Vresult(:,:,Ti),Vresu lt(:,:,Ti)=|V(:,:,Ti)-V(:,:,Ti+Δt)|;其中,时间序列T=(T1,T2, T3,......Tt),Δt表示两次帧之间的计算距离差值。
综上所述,本发明具有以下有益效果:
1.通过对基本单元进行识别,并将其与标准数据库进行比对,得 出序列与数据库的匹配率,从而达到规范动作行为分析的效果;
2.通过采用层级比对策略,可清晰观察行为体工作出错率与效率, 从而有助于流水线作业管理与规划。
附图说明
图1是本发明实施例中工厂部署的网络拓扑图;
图2是本发明实施例中动作分解策略示意图;
图3是本发明实施例中层级比对策略的工作流程示意图。
具体实施方式
以下结合附图1-3对本发明作进一步详细说明。
实施例:一种基于计算机视觉识别动作组合效率分析方法,如图 1至图3所示,包括以下步骤:
1)采用摄像头采集实时的视频数据,并对其进行预处理;
2)对步骤1)中预处理后的视频数据中的连续动作分解为多个平 移变化帧连续图像;
3)将与时间上下文关系的动作化解为图像分类,通过层级递进 策略对图像类别进行序列组合,生成动作基本单元Ci的有序排列组合 Ai={C1,C2,C3...Ci,Ci+1,...};
4)对有序排列组合Ai={C1,C2,C3…Ci,Ci+1,...}采用模型进行训练, 得计算机视觉模型;该计算机视觉模型即为训练模型:
a、根据步骤1)中的结果数据标签集,放入ResNet模型中;
b、输出结果为对就Ai集合序列的识别模型标识。
5)对基本单元进行识别,且对基本单元的识别结果序列进行解 释与处理,并将其与标准数据库进行比对,得出序列与数据库的匹配 率,即达到规范动作行为分析。
在本实施例中,由于视频检测的需要,提出使用视频逐帧检测与 跳帧检测两种处理方式,逐帧检测即视频流的每一帧都通过模型识别, 跳帧检测为每间隔几帧进行一次检测,详细流程如下:
步骤3)中生成动作基本单元Ci的有序排列组合的方式是将每个 作业站点下完成一个工作任务的流程视为一个完整的动作流程Ai,将 动作流程Ai分解为数个组成动作流程的动作步骤Si,再将动作步骤Si分解为多个动作基本单元Ci,多个基本单元Ci组成有序排列组合Ai= {C1,C2,C3...Ci,Ci+1,...}。
在本实施例中,序列组合有顺序关系,如图2中,连线上的标号 表示组合次序,C1→C3组成了S1,但C3→C1是另外不同于S1的基本 单元组合Si,这代表了基本单元发生的先后,同样的适用于步骤序列 组合,对应作业站点中手部动作事件的顺序。基本单元与步骤序列组 合以真实作业站点为前提,遵守前缀编码的编码规则,规定任何序列 都不是同层级其它编码序列的前缀,一方面以防止在后续的序列匹配 工作中出现多个匹配结果,另一方面保证序列为当前层最短组合,有 利于重组与向上抽取。本文默认用最短匹配的形式进行基本单元向上 抽层的过程。
步骤3)中层级递进策略的具体步骤为:
A)检测摄像头是否开启,若摄像头开启进行步骤B),若摄像头 关闭,停止后续操作;
B)不断对摄像头视频数据进行读取,并对基本单元进行识别, 若识别成功,将每一帧输入目标检测模型后输出基本单元识别结果列 表,并将其加入识别序列集detectSet,再进行步骤C);若未识别出 结果,则标记为“错误”基本单元;
C)对序列集detectSet的尺寸与窗口长度L进行比较,若detectSet 的尺寸大于窗口L,调用窗口平滑策略,此时平滑与增加识别序列集 交替进行;若平滑次数达到阈值或当前识别的基本单元结束时,将平 滑后的结果resultSet转化为映射关系baseSet,并进行时间比对判定 是否超时,若超时则添加标记并进行步骤D);若detectSet的尺寸小 于窗口L,直接进行步骤D);
D)将baseSet与数据库里的步骤进行最短匹配,若与数据库里 某条步骤信息匹配正确,则定义为“有效”步骤,将baseSet舍弃, 同时将匹配到的步骤加入stepSet匹配到序列,并进行步骤E);若匹 配失败,将baseSet第一个基本单元标记为“无效”;
E)将“有效”的步骤序列stepSet再与数据库里的动作流程信息 匹配,若与数据库中的某条动作信息里的步骤序列匹配无误,则为“有 效”的动作流程;若stepSet与数据库中的任意一条动作信息里的步 骤序列均匹配有误时,则为“无效”的动作流程。
在本实施例中,层级比对阶段对基本单元是否超时进行判别,统 计的基本单元序列进行步骤Si与动作流程Ai比对。以图2所示向上抽 取,其层级比对的主要思想伪代码为:
步骤1)中的预处理的具体方法包括以下步骤:
(1)从原生视频数据集R获得视频序列集V(V∈Rnx×ny),并保 证每段视频序列只包含有效信息和单个动作的特征;
(2)按照行为体手部动作变化的起始帧和终止帧对每段视频序 列中的动作内容进行剪切操作,依次获得视频序列子集: Vclip(Vclip∈Rkx×ky,0<kx<nx,0<ky<ny),并确保采样的每个Vclip 集合中每个子样本的动作能处于kx×ky的视频帧方盒中;
(3)假设视频序列V的第i个时间Ti的帧视频序列为V(:,:,Ti),依次 采样操作后,得到Δt后动作的结果序列Vresult(:,:,Ti),Vresult (:,:,Ti)=|V(:,:,Ti)-V(:,:,Ti+Δt)|;其中,时间序列T=(T1,T2, T3,......Tt),Δt表示两次帧之间的计算距离差值。
在本实施例中,同一条生产线下拍摄的视频数据中可能存在相同 重复或者带有无效信息的视频,因此,本方案中会排查和清除一些存 在错误动作或者仅仅包含无效目标的信息,甚至其他过多的干扰项。 如果数据中存在大量的冗余特征信息,本方案中采取剔除的方式进行 处理。最终,经过一系列的排查、合并、剔除等操作处理后,本方案 中得到所有的视频动作数据集。
工作原理:通过对基本单元进行识别,并将其与标准数据库进行 比对,得出序列与数据库的匹配率,从而达到规范动作行为分析的效 果;通过采用层级比对策略,可清晰观察行为体工作出错率与效率, 从而有助于流水线作业管理与规划。
本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制, 本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出 没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专 利法的保护。
Claims (4)
1.一种基于计算机视觉识别动作组合效率分析方法,其特征是:具体包括以下步骤:
1)采用摄像头采集实时的视频数据,并对其进行预处理;
2)对步骤1)中预处理后的视频数据中的连续动作分解为多个平移变化帧连续图像;
3)将与时间上下文关系的动作化解为图像分类,通过层级递进策略对图像类别进行序列组合,生成动作基本单元Ci的有序排列组合Ai={C1,C2,C3...Ci,Ci+1,...};
4)对有序排列组合Ai={C1,C2,C3...Ci,Ci+1,...}采用模型进行训练,得计算机视觉模型;
5)对基本单元进行识别,且对基本单元的识别结果序列进行解释与处理,并将其与标准数据库进行比对,得出序列与数据库的匹配率,即达到规范动作行为分析。
2.根据权利要求1所述的一种基于计算机视觉识别动作组合效率分析方法,其特征是:所述步骤3)中生成动作基本单元Ci的有序排列组合的方式是将每个作业站点下完成一个工作任务的流程视为一个完整的动作流程Ai,将动作流程Ai分解为数个组成动作流程的动作步骤Si,再将动作步骤Si分解为多个动作基本单元Ci,多个基本单元Ci组成有序排列组合Ai={C1,C2,C3...Ci,Ci+1,...}。
3.根据权利要求1所述的一种基于计算机视觉识别动作组合效率分析方法,其特征是:所述步骤3)中层级递进策略的具体步骤为:
A)检测摄像头是否开启,若摄像头开启进行下一步,若摄像头关闭,停止后续操作;
B)不断对摄像头视频数据进行读取,并对基本单元进行识别,若识别成功,将每一帧输入目标检测模型后输出基本单元识别结果列表,并将其加入识别序列集detectSet,再进入下一步;若未识别出结果,则标记为“错误”基本单元;
C)对序列集detectSet的尺寸与窗口长度L进行比较,若detectSet的尺寸大于窗口L,调用窗口平滑策略,此时平滑与增加识别序列集交替进行;若平滑次数达到阈值或当前识别的基本单元结束时,将平滑后的结果resultSet转化为映射关系baseSet,并进行时间比对判定是否超时,若超时则添加标记并进入下一步;若detectSet的尺寸小于窗口L,直接进入下一步;
D)将baseSet与数据库里的步骤进行最短匹配,若与数据库里某条步骤信息匹配正确,则定义为“有效”步骤,将baseSet舍弃,同时将匹配到的步骤加入stepSet匹配到序列,并进行下一步;若匹配失败,将baseSet第一个基本单元标记为“无效”;
E)将“有效”的步骤序列stepSet再与数据库里的动作流程信息匹配,若与数据库中的某条动作信息里的步骤序列匹配无误,则为“有效”的动作流程;若stepSet与数据库中的任意一条动作信息里的步骤序列均匹配有误时,则为“无效”的动作流程。
4.根据权利要求1所述的一种基于计算机视觉识别动作组合效率分析方法,其特征是:步骤1)中所述的预处理的具体方法包括以下步骤:
(1)从原生视频数据集R获得视频序列集V(V∈Rnx×ny),并保证每段视频序列只包含有效信息和单个动作的特征;
(2)按照行为体手部动作变化的起始帧和终止帧对每段视频序列中的动作内容进行剪切操作,依次获得视频序列子集:Vclip(Vcli p∈Rkx×ky,0<kx<nx,0<ky<ny),并确保采样的每个Vclip集合中每个子样本的动作能处于kx×ky的视频帧方盒中;
(3)假设视频序列V的第i个时间Ti的帧视频序列为V(:,:,Ti),依次采样操作后,得到Δt后动作的结果序列Vresult(:,:,Ti),Vresult(:,:,Ti)=|V(:,:,Ti)-y(:,:,Ti+Δt)|;其中,时间序列T=(T1,T2,T3,......Tt),Δt表示两次帧之间的计算距离差值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111388679.2A CN114140875A (zh) | 2021-11-22 | 2021-11-22 | 一种基于计算机视觉识别动作组合效率分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111388679.2A CN114140875A (zh) | 2021-11-22 | 2021-11-22 | 一种基于计算机视觉识别动作组合效率分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114140875A true CN114140875A (zh) | 2022-03-04 |
Family
ID=80390601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111388679.2A Pending CN114140875A (zh) | 2021-11-22 | 2021-11-22 | 一种基于计算机视觉识别动作组合效率分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114140875A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114979302A (zh) * | 2022-04-22 | 2022-08-30 | 长江大学 | 一种自适应的基于熵的快速工人动作图像传输方法及系统 |
-
2021
- 2021-11-22 CN CN202111388679.2A patent/CN114140875A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114979302A (zh) * | 2022-04-22 | 2022-08-30 | 长江大学 | 一种自适应的基于熵的快速工人动作图像传输方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Casado-García et al. | Ensemble methods for object detection | |
CN105975604B (zh) | 一种分布迭代式数据处理程序异常检测与诊断方法 | |
CN111897695B (zh) | 获取kpi异常数据样本的方法、装置和计算机设备 | |
CN108596148B (zh) | 一种基于计算机视觉的建筑工人劳动状态分析系统及方法 | |
TWI570587B (zh) | 半導體機台零件剩餘壽命預測系統與方法 | |
CN109033476B (zh) | 一种基于事件线索网络的智能时空数据事件分析方法 | |
JP2008077424A (ja) | 作業分析システム及び方法 | |
CN114140875A (zh) | 一种基于计算机视觉识别动作组合效率分析方法 | |
CN111553952A (zh) | 基于生存对抗的工业机器人视觉图像识别方法及系统 | |
CN111860196B (zh) | 手部作业动作评分装置、方法及计算机可读存储介质 | |
CN110869942A (zh) | 自馈深度学习方法和系统 | |
CN110717449A (zh) | 车辆年检人员的行为检测方法、装置和计算机设备 | |
CN115331002A (zh) | 一种基于ar眼镜实现热力站故障远程处理方法 | |
CN106529470A (zh) | 一种基于多级深度卷积神经网络的手势识别方法 | |
CN112183419A (zh) | 一种基于光流生成网络和重排序的微表情分类方法 | |
TW202113703A (zh) | 作業要素分析裝置及作業要素分析方法 | |
CN114386931A (zh) | 一种基于ai技术的图像分析系统及方法 | |
CN117315365A (zh) | 一种基于视觉分析的凸轮轴表面损伤检测系统 | |
CN115186935B (zh) | 一种机电设备非线性故障预测方法及系统 | |
CN116386128A (zh) | 一种隧道工人施工状态检测方法、系统、介质及设备 | |
Inoshita et al. | Exploring Cross Modality Feature Fusion for Activity Recognition at OpenPack Challenge 2022 | |
CN109304306B (zh) | 生产线物体分拣方法、系统和物体分拣系统 | |
CN111833307A (zh) | 一种风力机叶片裂纹诊断方法及装置 | |
JP2005250708A (ja) | 道具動作認識装置および道具動作認識方法 | |
Albasri et al. | Surgery task classification using procrustes analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |