JPWO2019021456A1 - 学習装置、認識装置、学習方法、認識方法及びプログラム - Google Patents
学習装置、認識装置、学習方法、認識方法及びプログラム Download PDFInfo
- Publication number
- JPWO2019021456A1 JPWO2019021456A1 JP2019532319A JP2019532319A JPWO2019021456A1 JP WO2019021456 A1 JPWO2019021456 A1 JP WO2019021456A1 JP 2019532319 A JP2019532319 A JP 2019532319A JP 2019532319 A JP2019532319 A JP 2019532319A JP WO2019021456 A1 JPWO2019021456 A1 JP WO2019021456A1
- Authority
- JP
- Japan
- Prior art keywords
- learning
- data
- image
- depth information
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (9)
- 深さ情報に関連付けられた画像に表された物体が何であるかを認識する処理に用いられる機械学習モデルの学習を実行する学習装置であって、
物体を表す三次元データを取得する三次元データ取得部と、
前記三次元データに基づいて、それぞれ互いに異なる前記物体の一部を表す学習データを複数生成する学習データ生成部と、
生成される前記学習データを前記物体の学習データとした前記機械学習モデルの学習を実行する学習部と、
を含むことを特徴とする学習装置。 - 前記学習データ生成部は、前記物体が配置される仮想空間内の互いに異なる複数の位置のそれぞれについて、当該位置から可視である当該物体の一部を表す学習データを生成する、
ことを特徴とする請求項1に記載の学習装置。 - 前記学習装置は、認識対象データとして深さ情報に関連付けられた画像に基づいて生成される三次元データが入力される前記機械学習モデルの学習を実行する学習装置であって、
前記学習データ生成部は、三次元データである前記学習データを生成し、
前記学習部は、生成される前記三次元データを前記物体の学習データとした前記機械学習モデルの学習を実行する、
ことを特徴とする請求項1又は2に記載の学習装置。 - 前記学習装置は、認識対象データとして深さ情報に関連付けられた画像が入力される前記機械学習モデルの学習を実行する学習装置であって、
前記学習データ生成部は、深さ情報に関連付けられた画像である前記学習データを生成し、
前記学習部は、生成される前記深さ情報に関連付けられた画像を前記物体の学習データとした前記機械学習モデルの学習を実行する、
ことを特徴とする請求項1又は2に記載の学習装置。 - 深さ情報に関連付けられた画像に表された物体が何であるかを認識する処理を実行する認識装置であって、
物体を表す三次元データに基づいて生成されるそれぞれ互いに異なる前記物体の一部を表す学習データを前記物体の学習データとして学習した学習済モデルと、
前記画像に対応付けられる認識対象データを前記学習済モデルに入力した際の出力に基づいて、前記深さ情報に関連付けられた画像に表された物体が何であるかを認識する認識部と、
を含むことを特徴とする認識装置。 - 深さ情報に関連付けられた画像に表された物体が何であるかを認識する処理に用いられる機械学習モデルの学習を実行する学習方法であって、
物体を表す三次元データを取得するステップと、
前記三次元データに基づいて、それぞれ互いに異なる前記物体の一部を表す学習データを複数生成するステップと、
生成される前記学習データを前記物体の学習データとした前記機械学習モデルの学習を実行するステップと、
を含むことを特徴とする学習方法。 - 深さ情報に関連付けられた画像に表された物体が何であるかを認識する処理を実行する認識方法であって、
物体を表す三次元データに基づいて生成されるそれぞれ互いに異なる前記物体の一部を表す学習データを前記物体の学習データとして学習した学習済モデルに前記画像に対応付けられる認識対象データを入力するステップと、
前記学習済モデルに前記認識対象データを入力した際の出力に基づいて、前記深さ情報に関連付けられた画像に表された物体が何であるかを認識するステップと、
を含むことを特徴とする認識方法。 - 深さ情報に関連付けられた画像に表された物体が何であるかを認識する処理に用いられる機械学習モデルの学習を実行するプログラムであって、
物体を表す三次元データを取得する手順、
前記三次元データに基づいて、それぞれ互いに異なる前記物体の一部を表す学習データを複数生成する手順、
生成される前記学習データを前記物体の学習データとした前記機械学習モデルの学習を実行する手順、
をコンピュータに実行させることを特徴とするプログラム。 - 深さ情報に関連付けられた画像に表された物体が何であるかを認識する処理を実行するプログラムであって、
物体を表す三次元データに基づいて生成されるそれぞれ互いに異なる前記物体の一部を表す学習データを前記物体の学習データとして学習した学習済モデルに前記画像に対応付けられる認識対象データを入力する手順、
前記学習済モデルに前記認識対象データを入力した際の出力に基づいて、前記深さ情報に関連付けられた画像に表された物体が何であるかを認識する手順、
をコンピュータに実行させることを特徴とするプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/027419 WO2019021456A1 (ja) | 2017-07-28 | 2017-07-28 | 学習装置、認識装置、学習方法、認識方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019021456A1 true JPWO2019021456A1 (ja) | 2019-12-12 |
JP6911123B2 JP6911123B2 (ja) | 2021-07-28 |
Family
ID=65040520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019532319A Active JP6911123B2 (ja) | 2017-07-28 | 2017-07-28 | 学習装置、認識装置、学習方法、認識方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11681910B2 (ja) |
JP (1) | JP6911123B2 (ja) |
CN (1) | CN110945537B (ja) |
WO (1) | WO2019021456A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7267068B2 (ja) * | 2019-03-29 | 2023-05-01 | 三井情報株式会社 | 学習済みモデル生成装置、プログラム及び学習済みモデル生成システム |
JP6719168B1 (ja) * | 2019-09-03 | 2020-07-08 | 裕樹 有光 | 教師データとしてのデプス画像にラベルを付与するプログラム、装置及び方法 |
CN112613551B (zh) * | 2020-12-17 | 2024-08-20 | 东风汽车有限公司 | 汽车零部件识别方法、存储介质及系统 |
CN113240637B (zh) * | 2021-05-11 | 2023-03-24 | 杭州钱塘智慧城投资开发有限公司 | 一种基于机器学习的墙面平整度信息化检测方法和系统 |
CN117651971A (zh) * | 2021-07-15 | 2024-03-05 | 京瓷株式会社 | 识别模型生成方法以及识别模型生成装置 |
US20230131418A1 (en) * | 2021-10-22 | 2023-04-27 | Samsung Electronics Co., Ltd. | Two-dimensional (2d) feature database generation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0519052A (ja) * | 1991-05-08 | 1993-01-26 | Nippon Telegr & Teleph Corp <Ntt> | ニユーラルネツトワークによる3次元物体の認識方法 |
JP2003346152A (ja) * | 2002-05-24 | 2003-12-05 | Sony Corp | 物体認識装置及び方法並びにロボット装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5249569B2 (ja) | 1973-05-22 | 1977-12-17 | ||
DE8900142U1 (de) * | 1989-01-07 | 1990-05-10 | Robert Bosch Gmbh, 7000 Stuttgart | Träger für Sensoren |
WO2013031161A1 (ja) * | 2011-08-26 | 2013-03-07 | パナソニック株式会社 | 運転支援装置 |
KR101919831B1 (ko) * | 2012-01-11 | 2018-11-19 | 삼성전자주식회사 | 오브젝트 인식 장치, 분류 트리 학습 장치 및 그 동작 방법 |
US9432720B2 (en) * | 2013-12-09 | 2016-08-30 | Empire Technology Development Llc | Localized audio source extraction from video recordings |
US10289962B2 (en) * | 2014-06-06 | 2019-05-14 | Google Llc | Training distilled machine learning models |
US20160342861A1 (en) * | 2015-05-21 | 2016-11-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for Training Classifiers to Detect Objects Represented in Images of Target Environments |
US10096151B2 (en) * | 2015-07-07 | 2018-10-09 | Varian Medical Systems International Ag | Methods and systems for three-dimensional visualization of deviation of volumetric structures with colored surface structures |
EP3179407B1 (en) * | 2015-12-07 | 2022-07-13 | Dassault Systèmes | Recognition of a 3d modeled object from a 2d image |
CN106228177A (zh) * | 2016-06-30 | 2016-12-14 | 浙江大学 | 基于卷积神经网络的日常生活物体图像识别方法 |
US20180136332A1 (en) * | 2016-11-15 | 2018-05-17 | Wheego Electric Cars, Inc. | Method and system to annotate objects and determine distances to objects in an image |
KR20180057096A (ko) * | 2016-11-21 | 2018-05-30 | 삼성전자주식회사 | 표정 인식과 트레이닝을 수행하는 방법 및 장치 |
US10417781B1 (en) * | 2016-12-30 | 2019-09-17 | X Development Llc | Automated data capture |
US20180189228A1 (en) * | 2017-01-04 | 2018-07-05 | Qualcomm Incorporated | Guided machine-learning training using a third party cloud-based system |
CN117709426A (zh) * | 2017-02-24 | 2024-03-15 | 渊慧科技有限公司 | 训练机器学习模型的方法、系统和计算机存储介质 |
WO2018205274A1 (zh) * | 2017-05-12 | 2018-11-15 | 深圳迈瑞生物医疗电子股份有限公司 | 一种超声设备及其三维超声图像的显示变换方法、系统 |
US10169874B2 (en) * | 2017-05-30 | 2019-01-01 | International Business Machines Corporation | Surface-based object identification |
-
2017
- 2017-07-28 JP JP2019532319A patent/JP6911123B2/ja active Active
- 2017-07-28 US US16/621,796 patent/US11681910B2/en active Active
- 2017-07-28 WO PCT/JP2017/027419 patent/WO2019021456A1/ja active Application Filing
- 2017-07-28 CN CN201780093425.3A patent/CN110945537B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0519052A (ja) * | 1991-05-08 | 1993-01-26 | Nippon Telegr & Teleph Corp <Ntt> | ニユーラルネツトワークによる3次元物体の認識方法 |
JP2003346152A (ja) * | 2002-05-24 | 2003-12-05 | Sony Corp | 物体認識装置及び方法並びにロボット装置 |
Non-Patent Citations (2)
Title |
---|
池谷 健 他: "Deep Convolutional Neural Networkを用いた物体の3軸回転に頑強な3次", VISUAL COMPUTING グラフィクスとCAD合同シンポジウム2016 予稿集, JPN6017039526, 19 June 2016 (2016-06-19), JP, pages 105 - 111, ISSN: 0004379149 * |
金井 廉 他: "立体フィルタを用いた畳み込みニューラルネットワークによる三次元物体認識", 第78回(平成28年)全国大会講演論文集(2) 人工知能と認知科学, JPN6017039527, 10 March 2016 (2016-03-10), JP, pages 2 - 37, ISSN: 0004379150 * |
Also Published As
Publication number | Publication date |
---|---|
US20200193632A1 (en) | 2020-06-18 |
JP6911123B2 (ja) | 2021-07-28 |
US11681910B2 (en) | 2023-06-20 |
WO2019021456A1 (ja) | 2019-01-31 |
CN110945537A (zh) | 2020-03-31 |
CN110945537B (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6911123B2 (ja) | 学習装置、認識装置、学習方法、認識方法及びプログラム | |
US10977496B2 (en) | Virtualization of tangible interface objects | |
JP7403528B2 (ja) | シーンの色及び深度の情報を再構成するための方法及びシステム | |
US9652895B2 (en) | Augmented reality image transformation | |
CN106663334B (zh) | 通过计算装置执行的方法、移动通信装置和存储介质 | |
EP3992919B1 (en) | Three-dimensional facial model generation method and apparatus, device, and medium | |
CN107484428B (zh) | 用于显示对象的方法 | |
JP2018109984A5 (ja) | ||
JP2009080578A (ja) | 多視点データ生成装置、方法及びプログラム | |
JP4851504B2 (ja) | デジタル・イメージ・キャプチャを用いて対話型エンタテインメントのためにアセットを生成する方法 | |
JP5756322B2 (ja) | 情報処理プログラム、情報処理方法、情報処理装置および情報処理システム | |
JP2018045608A5 (ja) | ||
US11989900B2 (en) | Object recognition neural network for amodal center prediction | |
US20210056337A1 (en) | Recognition processing device, recognition processing method, and program | |
KR20140001168A (ko) | Rgb-d 영상 특징점 추출 및 특징 기술자 생성 방법 및 장치 | |
KR20130118105A (ko) | 평면 기반의 3차원 공간 표현 방법 및 장치 | |
WO2018179254A1 (ja) | 画像生成装置、画像生成方法及びプログラム | |
JP2016168828A (ja) | 印刷データ分割装置及びプログラム | |
JP6362401B2 (ja) | 画像処理装置及び画像処理装置の制御方法 | |
JP2023171298A (ja) | 拡張現実及び複合現実のための空間とコンテンツの適合 | |
EP3872768A1 (en) | Method for processing two-dimensional image and device for executing method | |
JP6967150B2 (ja) | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム | |
WO2021009798A1 (ja) | 画像処理装置、画像処理方法、及び、プログラム | |
JP2021039563A (ja) | 教師データとしてのデプス画像にラベルを付与するプログラム、装置及び方法 | |
KR20240058290A (ko) | 3d 입체영상 출력 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6911123 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |