JP7178499B2 - 画像処理装置、画像処理方法、及び、プログラム - Google Patents
画像処理装置、画像処理方法、及び、プログラム Download PDFInfo
- Publication number
- JP7178499B2 JP7178499B2 JP2021532559A JP2021532559A JP7178499B2 JP 7178499 B2 JP7178499 B2 JP 7178499B2 JP 2021532559 A JP2021532559 A JP 2021532559A JP 2021532559 A JP2021532559 A JP 2021532559A JP 7178499 B2 JP7178499 B2 JP 7178499B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- frame
- labeling
- voxel
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 38
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000002372 labelling Methods 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
- G06V20/647—Three-dimensional objects by matching two-dimensional images to three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19127—Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Description
Claims (6)
- 2次元の入力画像をフレームごとに順次取得する画像取得部と、
フレームごとに取得した前記入力画像の各ピクセルに、該ピクセルにより表されたオブジェクトの種類を表すラベルを付すオブジェクト種類認識実行部と、
順次入力された前記入力画像に基づいて、前記入力画像に表された被写体の3次元位置認識を実行して3次元マップを作成し、前記3次元マップに含まれる各ボクセルに対して、前記ボクセルと対応する前記ピクセルのラベルを付すラベル付与部と、
を含み、
前記ラベル付与部は、複数のフレームにおいて判定されたラベルの種類に基づいて、前記ボクセルにラベルを付す、ことを特徴とする画像処理装置。 - 前記ラベル付与部は、各ボクセルに対して、
前フレームに付されたラベルと、現フレームで判定されたラベルと、が同じである場合にカウントをインクリメントし、
前フレームに付されたラベルと、現フレームで判定されたラベルと、が異なる場合にカウントをデクリメントし、
カウントが0である場合に、現フレームで判定されたラベルを付し、
カウントが0でない場合に、前フレームに付されたラベルを維持する、
ことを特徴とする請求項1に記載の画像処理装置。 - 前記ボクセルごとに、複数のフレームにおいて判定されたラベルを記憶する記憶部を有し、
前記ラベル付与部は、前記複数のフレームにおいて、最も多く判定された種類のラベルを前記ボクセルに付す、
ことを特徴とする請求項1に記載の画像処理装置。 - 前記オブジェクト種類認識実行部と前記ラベル付与部は、取得された前記各入力画像に対して、同一のフレームでセマンティックセグメンテーションとスラムを実行することを特徴とする請求項1から3のいずれかに記載の画像処理装置。
- 2次元の入力画像をフレームごとに順次取得する画像取得ステップと、
フレームごとに取得した前記入力画像の各ピクセルに、該ピクセルにより表されたオブジェクトの種類を表すラベルを付すオブジェクト種類認識実行ステップと、
順次入力された前記入力画像に基づいて、前記入力画像に表された被写体の3次元位置認識を実行し、3次元マップを作成し、前記3次元マップに含まれる各ボクセルに対して、前記ボクセルと対応する前記ピクセルのラベルを付すラベル付与ステップと、
を含み、
前記ラベル付与ステップにおいて、複数のフレームにおいて判定されたラベルの種類に基づいて、前記ボクセルにラベルを付す、ことを特徴とする画像処理方法。 - 2次元の入力画像をフレームごとに順次取得する画像取得手順と、
フレームごとに取得した前記入力画像の各ピクセルに、該ピクセルにより表されたオブジェクトの種類を表すラベルを付すオブジェクト種類認識実行手順と、
順次入力された前記入力画像に基づいて、前記入力画像に表された被写体の3次元位置認識を実行し、3次元マップを作成し、前記3次元マップに含まれる各ボクセルに対して、前記ボクセルと対応する前記ピクセルのラベルを付すラベル付与手順と、
をコンピュータに実行させるプログラムであって、
前記ラベル付与手順において、複数のフレームにおいて判定されたラベルの種類に基づいて、前記ボクセルにラベルを付す、ことを特徴とするプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/027670 WO2021009798A1 (ja) | 2019-07-12 | 2019-07-12 | 画像処理装置、画像処理方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021009798A1 JPWO2021009798A1 (ja) | 2021-01-21 |
JP7178499B2 true JP7178499B2 (ja) | 2022-11-25 |
Family
ID=74210293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021532559A Active JP7178499B2 (ja) | 2019-07-12 | 2019-07-12 | 画像処理装置、画像処理方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220292811A1 (ja) |
JP (1) | JP7178499B2 (ja) |
WO (1) | WO2021009798A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11688144B2 (en) * | 2021-06-16 | 2023-06-27 | International Business Machines Corporation | Self guidance based on dimensional relationship |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190043203A1 (en) | 2018-01-12 | 2019-02-07 | Intel Corporation | Method and system of recurrent semantic segmentation for image processing |
-
2019
- 2019-07-12 US US17/619,615 patent/US20220292811A1/en active Pending
- 2019-07-12 WO PCT/JP2019/027670 patent/WO2021009798A1/ja active Application Filing
- 2019-07-12 JP JP2021532559A patent/JP7178499B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190043203A1 (en) | 2018-01-12 | 2019-02-07 | Intel Corporation | Method and system of recurrent semantic segmentation for image processing |
Non-Patent Citations (1)
Title |
---|
TATENO, Keisuke et al.,CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction,2017 IEEE Conference on Computer Vision and Pattern Recognition,米国,IEEE,2017年,pp.6565-6574 |
Also Published As
Publication number | Publication date |
---|---|
WO2021009798A1 (ja) | 2021-01-21 |
US20220292811A1 (en) | 2022-09-15 |
JPWO2021009798A1 (ja) | 2021-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7181977B2 (ja) | 3次元再構成において構造特徴を検出し、組み合わせるための方法およびシステム | |
US20210279957A1 (en) | Systems and methods for building a virtual representation of a location | |
Park et al. | Pix2pose: Pixel-wise coordinate regression of objects for 6d pose estimation | |
Tjaden et al. | A region-based gauss-newton approach to real-time monocular multiple object tracking | |
US10373380B2 (en) | 3-dimensional scene analysis for augmented reality operations | |
Zollmann et al. | Image-based ghostings for single layer occlusions in augmented reality | |
US6124864A (en) | Adaptive modeling and segmentation of visual image streams | |
US8401225B2 (en) | Moving object segmentation using depth images | |
US9519968B2 (en) | Calibrating visual sensors using homography operators | |
JP7162750B2 (ja) | 画像処理装置、画像処理方法、及び、プログラム | |
Tian et al. | Handling occlusions in augmented reality based on 3D reconstruction method | |
US9129435B2 (en) | Method for creating 3-D models by stitching multiple partial 3-D models | |
CN109479098A (zh) | 多视图场景分割和传播 | |
JP2019003621A (ja) | 建築物のレイアウトの決定 | |
TW201308252A (zh) | 深度測量之品質提升 | |
Mori et al. | Efficient use of textured 3D model for pre-observation-based diminished reality | |
US20210056337A1 (en) | Recognition processing device, recognition processing method, and program | |
KR101865173B1 (ko) | 가상현실 콘텐츠의 영상 분석을 통한 모션 시뮬레이터의 운동 생성 방법 | |
EP4107650A1 (en) | Systems and methods for object detection including pose and size estimation | |
US20240062345A1 (en) | Method, apparatus, and computer-readable medium for foreground object deletion and inpainting | |
Park et al. | Neural object learning for 6d pose estimation using a few cluttered images | |
CN115362478A (zh) | 用于标记图像之间的空间关系的强化学习模型 | |
CN110310325B (zh) | 一种虚拟测量方法、电子设备及计算机可读存储介质 | |
JP7178499B2 (ja) | 画像処理装置、画像処理方法、及び、プログラム | |
Battisti et al. | Seamless bare-hand interaction in mixed reality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211111 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A801 Effective date: 20211111 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20211111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7178499 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |