WO2019205727A1 - 对象识别方法和对象识别设备 - Google Patents
对象识别方法和对象识别设备 Download PDFInfo
- Publication number
- WO2019205727A1 WO2019205727A1 PCT/CN2019/070027 CN2019070027W WO2019205727A1 WO 2019205727 A1 WO2019205727 A1 WO 2019205727A1 CN 2019070027 W CN2019070027 W CN 2019070027W WO 2019205727 A1 WO2019205727 A1 WO 2019205727A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- frame
- motion
- depth
- pixel
- image
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/248—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/254—Analysis of motion involving subtraction of images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
- G06T7/337—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20224—Image subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
Claims (17)
- 一种对象识别方法,包括:采集对齐的彩色图像和深度图像;对所采集的彩色图像和深度图像进行运动检测以获取运动起始帧和运动结束帧;在彩色图像中将运动结束帧与运动起始帧进行比较以获取运动像素集合;对所获取的运动像素集合进行连通区域分析以得到至少一个连通区域;以及识别所述至少一个连通区域中的对象。
- 根据权利要求1所述的方法,进一步包括基于所述深度图像中运动结束帧的深度信息,将所述至少一个连通区域分割成至少一个对象区域;并且所述识别所述至少一个连通区域中的对象的步骤包括识别所述至少一个对象区域中的对象。
- 根据权利要求2所述的方法,其中所述对所采集的彩色图像和深度图像进行运动检测以获取运动起始帧和运动结束帧的步骤包括:针对所采集的彩色图像,确定第i帧与第i-1帧之间像素值的差大于第一阈值的像素数量是否超过第二阈值,其中i是大于1的正整数;针对所采集的深度图像,确定第i帧与第i-1帧之间像素值的差大于第三阈值的像素数量是否超过第四阈值;响应于以下条件至少之一,将所述第i帧确定为运动帧,否则确定为静止帧:(1)所述彩色图像第i帧与第i-1帧之间像素值的差大于第一阈值的像素数量超过第二阈值;以及(2)所述深度图像的第i帧与第i-1帧之间像素值的差大于第三阈值的像素数量超过第四阈值;根据运动帧和静止帧确定彩色图像和深度图像中运动起始帧和运动结束帧。
- 根据权利要求2所述的方法,其中所述对所采集的彩色图像和深度图像进行运动检测以获取运动起始帧和运动结束帧的步骤包括:针对所采集的彩色图像,确定第i帧与第i-1帧之间像素值的差大 于第一阈值的像素数量X1,其中i是大于1的正整数;针对所采集的深度图像,确定第i帧与第i-1帧之间像素值的差大于第三阈值的像素数量X2;判定X1与X2的和是否大于第五阈值,若是,则确定所述第i帧为运动帧,否则确定为静止帧;根据运动帧和静止帧确定彩色图像和深度图像中运动起始帧和运动结束帧。
- 根据权利要求3或4所述的方法,其中所述根据运动帧和静止帧确定彩色图像和深度图像中运动起始帧和运动结束帧的步骤包括:将所检测的第一个运动帧的前一帧确定为运动起始帧,且将第一个运动帧之后的第N个连续的静止帧确定为运动结束帧,N为预设的正整数。
- 根据权利要求1至4中任一项所述的方法,其中所述在彩色图像中将运动结束帧与运动起始帧进行比较以获取运动像素集合的步骤包括:在彩色图像中将运动结束帧与运动起始帧进行逐像素对比以获取像素差值大于第六阈值的像素集合,将所述像素集合定义为运动像素集合。
- 根据权利要求2至4中任一项所述的方法,其中所述基于所述深度图像中运动结束帧的深度信息将所述至少一个连通区域分割成至少一个对象区域的步骤包括:确定深度图像中运动结束帧中深度值为零的像素点;沿着深度为零的像素点将所述至少一个连通区域分割成至少一个对象区域。
- 根据权利要求2至4中任一项所述的方法,其中所述识别所述至少一个对象区域中的对象的步骤包括:基于深度神经网络识别所述至少一个对象区域中的对象。
- 根据权利要求1至4中任一项所述的方法,其中所述对所获取的像素集合进行连通区域分析以得到至少一个所述连通区域的步骤包括:对所获取的像素集合进行连通区域分析以得到初始连通区域;以及在所述初始连通区域中去除面积不符合预设条件、长宽比不符合预设条件或者位于其他连通区域内部的连通区域以得到所述至少一个连通区域。
- 根据权利要求4所述的方法,其中所述N的值是根据对齐的图像和深度图像的采集频率动态设置的。
- 一种对象识别方法,包括:采集对齐的彩色图像和深度图像;获取所采集的彩色图像和深度图像中的起始帧和结束帧;在彩色图像中将结束帧与起始帧进行比较以获取运动像素集合;对所获取的运动像素集合进行连通区域分析以得到至少一个连通区域;基于所述深度图像中结束帧的深度信息,将所述至少一个连通区域分割成至少一个对象区域;识别所述至少一个对象区域中的对象。
- 根据权利要求11所述的方法,其中所述在彩色图像中将结束帧与起始帧进行比较以获取运动像素集合的步骤包括:在彩色图像中将结束帧与起始帧进行逐像素对比以获取像素差值大于第六阈值的像素集合,将所述像素集合定义为运动像素集合。
- 根据权利要求12所述的方法,其中所述基于所述深度图像中结束帧的深度信息将所述至少一个连通区域分割成至少一个对象区域的步骤包括:确定深度图像中结束帧中深度值为零的像素点;沿着深度为零的像素点将所述至少一个连通区域分割成至少一个对象区域。
- 一种对象识别设备,包括:采集装置,用于采集对齐的彩色图像和深度图像;检测装置,用于对所采集的彩色图像和深度图像进行运动检测以获取运动起始帧和运动结束帧,获取装置,用于在彩色图像中将运动结束帧与运动起始帧进行比较以获取运动像素集合,分析装置,用于对所获取的运动像素集合进行连通区域分析以得 到至少一个连通区域,分割装置,用于基于所述深度图像中运动结束帧的深度信息,将所述至少一个连通区域分割成至少一个对象区域,识别装置,用于识别所述至少一个对象区域中的对象。
- 根据权利要求14所述的对象识别设备,其中所述采集装置包括RGBD摄像头。
- 一种购物车,包括根据权利要求14或15所述的对象识别设备。
- 一种计算机可读存储介质,其上存储计算机可读指令,该计算机可读指令在被执行时执行根据权利要求1-13中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/481,542 US11341740B2 (en) | 2018-04-28 | 2019-01-02 | Object identification method and object identification device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810402446.5A CN108596128B (zh) | 2018-04-28 | 2018-04-28 | 对象识别方法、装置及存储介质 |
CN201810402446.5 | 2018-04-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019205727A1 true WO2019205727A1 (zh) | 2019-10-31 |
Family
ID=63619300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2019/070027 WO2019205727A1 (zh) | 2018-04-28 | 2019-01-02 | 对象识别方法和对象识别设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11341740B2 (zh) |
CN (1) | CN108596128B (zh) |
WO (1) | WO2019205727A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113762253A (zh) * | 2021-08-24 | 2021-12-07 | 北京的卢深视科技有限公司 | 散斑的提取方法、装置、电子设备及存储介质 |
CN115661098A (zh) * | 2022-10-31 | 2023-01-31 | 河海大学 | 一种海底管线二维冲刷剖面图像识别与数据提取方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596128B (zh) | 2018-04-28 | 2020-06-26 | 京东方科技集团股份有限公司 | 对象识别方法、装置及存储介质 |
CN109584297A (zh) * | 2018-10-24 | 2019-04-05 | 北京升哲科技有限公司 | 目标检测方法和装置 |
CN110222557B (zh) * | 2019-04-22 | 2021-09-21 | 北京旷视科技有限公司 | 路况的实时检测方法、装置、系统和存储介质 |
CN110189242B (zh) * | 2019-05-06 | 2023-04-11 | 阿波罗智联(北京)科技有限公司 | 图像处理方法和装置 |
CN110874851A (zh) * | 2019-10-25 | 2020-03-10 | 深圳奥比中光科技有限公司 | 重建人体三维模型的方法、装置、系统和可读存储介质 |
CN111242090B (zh) * | 2020-01-22 | 2023-06-23 | 腾讯科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及介质 |
CN111369317B (zh) * | 2020-02-27 | 2023-08-18 | 创新奇智(上海)科技有限公司 | 订单生成方法、装置、电子设备及存储介质 |
CN112541553B (zh) * | 2020-12-18 | 2024-04-30 | 深圳地平线机器人科技有限公司 | 目标对象的状态检测方法、装置、介质以及电子设备 |
CN115183876B (zh) * | 2022-09-09 | 2022-12-09 | 国网山西省电力公司电力科学研究院 | 电力设备温度测量方法及装置、存储介质、计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831378A (zh) * | 2011-06-14 | 2012-12-19 | 株式会社理光 | 人的检测和跟踪方法与系统 |
US20140355831A1 (en) * | 2013-06-04 | 2014-12-04 | Samsung Electronics Co., Ltd. | Apparatus, method and computer-readable recording medium for detecting moving object using depth map |
CN106778471A (zh) * | 2016-11-17 | 2017-05-31 | 京东方科技集团股份有限公司 | 自动跟踪购物车 |
CN107613237A (zh) * | 2017-09-14 | 2018-01-19 | 国网重庆市电力公司电力科学研究院 | 一种视频动静混合关键帧的抽取方法 |
CN108596128A (zh) * | 2018-04-28 | 2018-09-28 | 京东方科技集团股份有限公司 | 对象识别方法、装置及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9106908B2 (en) * | 2012-07-30 | 2015-08-11 | Intel Corporation | Video communication with three dimensional perception |
US9536321B2 (en) * | 2014-03-21 | 2017-01-03 | Intel Corporation | Apparatus and method for foreground object segmentation |
CN104112275B (zh) * | 2014-07-15 | 2017-07-04 | 青岛海信电器股份有限公司 | 一种生成视点的方法及装置 |
CN104700430A (zh) * | 2014-10-05 | 2015-06-10 | 安徽工程大学 | 机载显示器的运动检测方法 |
CN106504074A (zh) * | 2016-11-14 | 2017-03-15 | 上海卓易科技股份有限公司 | 一种智能购物方法及系统 |
CN107862775B (zh) * | 2017-11-29 | 2020-07-10 | 深圳易伙科技有限责任公司 | 一种基于人工智能的超市商品防盗预警系统及方法 |
-
2018
- 2018-04-28 CN CN201810402446.5A patent/CN108596128B/zh active Active
-
2019
- 2019-01-02 US US16/481,542 patent/US11341740B2/en active Active
- 2019-01-02 WO PCT/CN2019/070027 patent/WO2019205727A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831378A (zh) * | 2011-06-14 | 2012-12-19 | 株式会社理光 | 人的检测和跟踪方法与系统 |
US20140355831A1 (en) * | 2013-06-04 | 2014-12-04 | Samsung Electronics Co., Ltd. | Apparatus, method and computer-readable recording medium for detecting moving object using depth map |
CN106778471A (zh) * | 2016-11-17 | 2017-05-31 | 京东方科技集团股份有限公司 | 自动跟踪购物车 |
CN107613237A (zh) * | 2017-09-14 | 2018-01-19 | 国网重庆市电力公司电力科学研究院 | 一种视频动静混合关键帧的抽取方法 |
CN108596128A (zh) * | 2018-04-28 | 2018-09-28 | 京东方科技集团股份有限公司 | 对象识别方法、装置及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113762253A (zh) * | 2021-08-24 | 2021-12-07 | 北京的卢深视科技有限公司 | 散斑的提取方法、装置、电子设备及存储介质 |
CN115661098A (zh) * | 2022-10-31 | 2023-01-31 | 河海大学 | 一种海底管线二维冲刷剖面图像识别与数据提取方法 |
CN115661098B (zh) * | 2022-10-31 | 2024-02-06 | 河海大学 | 一种海底管线二维冲刷剖面图像识别与数据提取方法 |
Also Published As
Publication number | Publication date |
---|---|
US20210334533A1 (en) | 2021-10-28 |
CN108596128A (zh) | 2018-09-28 |
US11341740B2 (en) | 2022-05-24 |
CN108596128B (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019205727A1 (zh) | 对象识别方法和对象识别设备 | |
US20210191524A1 (en) | Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data | |
US11189044B2 (en) | Method and device for detecting object stacking state and intelligent shelf | |
US9524444B2 (en) | Method, system and apparatus for determining a contour segment for an object in an image captured by a camera | |
Jafari et al. | Real-time RGB-D based people detection and tracking for mobile robots and head-worn cameras | |
US10212324B2 (en) | Position detection device, position detection method, and storage medium | |
Stalder et al. | Cascaded confidence filtering for improved tracking-by-detection | |
Ma et al. | Crossing the line: Crowd counting by integer programming with local features | |
US9471889B2 (en) | Video tracking based method for automatic sequencing of vehicles in drive-thru applications | |
JP6032921B2 (ja) | 物体検出装置及びその方法、プログラム | |
Benedek | 3D people surveillance on range data sequences of a rotating Lidar | |
US10506174B2 (en) | Information processing apparatus and method for identifying objects and instructing a capturing apparatus, and storage medium for performing the processes | |
CN106934817B (zh) | 基于多属性的多目标跟踪方法及装置 | |
US20050084133A1 (en) | Object measuring apparatus, object measuring method, and program product | |
CN109727275B (zh) | 目标检测方法、装置、系统和计算机可读存储介质 | |
US8699786B2 (en) | 3D model generating apparatus, method and CRM by line pattern imaging | |
JP2016095808A (ja) | 物体検出装置、物体検出方法、画像認識装置及びコンピュータプログラム | |
US9990710B2 (en) | Apparatus and method for supporting computer aided diagnosis | |
US20150312529A1 (en) | System and method for video-based determination of queue configuration parameters | |
US9503706B2 (en) | Determining source lane of moving item merging into destination lane | |
US10762372B2 (en) | Image processing apparatus and control method therefor | |
Rosado et al. | Supervised learning for out-of-stock detection in panoramas of retail shelves | |
Varga et al. | Vision-based autonomous load handling for automated guided vehicles | |
US20170053172A1 (en) | Image processing apparatus, and image processing method | |
EP2259221A1 (en) | Computer system and method for tracking objects in video data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19792369 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 19792369 Country of ref document: EP Kind code of ref document: A1 |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 19792369 Country of ref document: EP Kind code of ref document: A1 |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 14/05/2021) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 19792369 Country of ref document: EP Kind code of ref document: A1 |