JP2022136544A - 学習処理装置及び学習処理プログラム - Google Patents
学習処理装置及び学習処理プログラム Download PDFInfo
- Publication number
- JP2022136544A JP2022136544A JP2021036211A JP2021036211A JP2022136544A JP 2022136544 A JP2022136544 A JP 2022136544A JP 2021036211 A JP2021036211 A JP 2021036211A JP 2021036211 A JP2021036211 A JP 2021036211A JP 2022136544 A JP2022136544 A JP 2022136544A
- Authority
- JP
- Japan
- Prior art keywords
- input image
- image
- estimation network
- camera
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 65
- 230000006870 function Effects 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Length Measuring Devices By Optical Means (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (3)
- 画像の各画素について、画素が示す対象物の実空間の所定位置を原点とするワールド座標が示されたシーン座標画像を出力する位置推定ネットワークを学習させるための学習処理装置であって、
カメラにより取得された第1入力画像を入力とする前記位置推定ネットワークが出力した前記シーン座標画像に基づいて、前記第1入力画像を取得したときの前記カメラの姿勢である第1推定姿勢を演算し、前記第1入力画像の直後に前記カメラにより取得された第2入力画像を入力とする前記位置推定ネットワークが出力した前記シーン座標画像に基づいて、前記第2入力画像を取得したときの前記カメラの姿勢である第2推定姿勢を演算する姿勢演算部と、
前記第1入力画像に基づいて、前記第1入力画像の各画素について、前記カメラから画素が示す対象物までの実空間における距離である深度が示された深度画像を出力する深度推定ネットワークと、
前記第1入力画像から得られた前記深度画像の各画素の前記深度を前記カメラの位置を原点とするワールド座標に変換してポイントクラウドを取得するポイントクラウド取得部と、
前記第1入力画像及び前記第2入力画像に基づいて、前記第1入力画像を取得したときの前記カメラの姿勢から、前記第2入力画像を取得したときの前記カメラの姿勢までの移動量である姿勢移動量を出力する移動量推定ネットワークと、
前記位置推定ネットワークが前記第1入力画像に基づいて出力した前記シーン座標画像と、前記ポイントクラウドとの間の、原点を合わせる処理を行った上での各画素のワールド座標の誤差に関する第1目的関数、及び、前記第1推定姿勢と前記第2推定姿勢との差分と、前記姿勢移動量との間の誤差に関する第2目的関数を小さくするように、前記位置推定ネットワークを学習させる学習処理部と、
を備えることを特徴とする学習処理装置。 - 前記学習処理部は、前記第1入力画像から得られた前記深度画像を変換した前記ポイントクラウド、及び、前記移動量推定ネットワークにより取得された前記姿勢移動量に基づいて、前記第2入力画像に対応する予測された前記ポイントクラウドを取得し、前記第1入力画像に対応する前記ポイントクラウド、前記第2入力画像に対応する前記ポイントクラウド、及び、前記第2入力画像に基づいて取得された予測第1入力画像と、前記第1入力画像との誤差に関する第3目的関数が小さくなるように、前記深度推定ネットワーク及び前記移動量推定ネットワークを学習させる、
ことを特徴とする請求項1に記載の学習処理装置。 - コンピュータを、
画像の各画素について、画素が示す対象物の実空間の所定位置を原点とするワールド座標が示されたシーン座標画像を出力する位置推定ネットワークを学習させるための学習処理装置として動作させ、
カメラにより取得された第1入力画像を入力とする前記位置推定ネットワークが出力した前記シーン座標画像に基づいて、前記第1入力画像を取得したときの前記カメラの姿勢である第1推定姿勢を演算し、前記第1入力画像の直後に前記カメラにより取得された第2入力画像を入力とする前記位置推定ネットワークが出力した前記シーン座標画像に基づいて、前記第2入力画像を取得したときの前記カメラの姿勢である第2推定姿勢を演算する姿勢演算部と、
前記第1入力画像に基づいて、前記第1入力画像の各画素について、前記カメラから画素が示す対象物までの実空間における距離である深度が示された深度画像を出力する深度推定ネットワークと、
前記第1入力画像から得られた前記深度画像の各画素の前記深度を前記カメラの位置を原点とするワールド座標に変換してポイントクラウドを取得するポイントクラウド取得部と、
前記第1入力画像及び前記第2入力画像に基づいて、前記第1入力画像を取得したときの前記カメラの姿勢から、前記第2入力画像を取得したときの前記カメラの姿勢までの移動量である姿勢移動量を出力する移動量推定ネットワークと、
前記位置推定ネットワークが前記第1入力画像に基づいて出力した前記シーン座標画像と、前記ポイントクラウドとの間の、原点を合わせる処理を行った上での各画素のワールド座標の誤差に関する第1目的関数、及び、前記第1推定姿勢と前記第2推定姿勢との差分と、前記姿勢移動量との間の誤差に関する第2目的関数を小さくするように、前記位置推定ネットワークを学習させる学習処理部と、
として機能させることを特徴とする学習処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021036211A JP7272381B2 (ja) | 2021-03-08 | 2021-03-08 | 学習処理装置及び学習処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021036211A JP7272381B2 (ja) | 2021-03-08 | 2021-03-08 | 学習処理装置及び学習処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022136544A true JP2022136544A (ja) | 2022-09-21 |
JP7272381B2 JP7272381B2 (ja) | 2023-05-12 |
Family
ID=83312011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021036211A Active JP7272381B2 (ja) | 2021-03-08 | 2021-03-08 | 学習処理装置及び学習処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7272381B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021503134A (ja) * | 2017-11-15 | 2021-02-04 | グーグル エルエルシーGoogle LLC | 画像深度とエゴモーション予測ニューラルネットワークの教師なし学習 |
-
2021
- 2021-03-08 JP JP2021036211A patent/JP7272381B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021503134A (ja) * | 2017-11-15 | 2021-02-04 | グーグル エルエルシーGoogle LLC | 画像深度とエゴモーション予測ニューラルネットワークの教師なし学習 |
Non-Patent Citations (2)
Title |
---|
YAO, MINGWEI、他1名: "An End-to-end Network for Monocular Visual Odometry Based on Image Sequence", INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), JPN6023010661, 14 July 2019 (2019-07-14), pages 1 - 6, XP033622002, ISSN: 0005022187, DOI: 10.1109/IJCNN.2019.8852165 * |
ZENG, WEI、他2名: "Inferring Point Clouds from Single Monocular Images by Depth Intermediation", COMPUTER VISION AND PATTERN RECOGNITION, JPN6023010662, 26 October 2020 (2020-10-26), pages 1 - 12, ISSN: 0005022186 * |
Also Published As
Publication number | Publication date |
---|---|
JP7272381B2 (ja) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11481869B2 (en) | Cross-domain image translation | |
CN107330439B (zh) | 一种图像中物体姿态的确定方法、客户端及服务器 | |
US9542773B2 (en) | Systems and methods for generating three-dimensional models using sensed position data | |
JP6902122B2 (ja) | ダブル視野角画像較正および画像処理方法、装置、記憶媒体ならびに電子機器 | |
US10204423B2 (en) | Visual odometry using object priors | |
CN111784776B (zh) | 视觉定位方法及装置、计算机可读介质和电子设备 | |
CN110599421A (zh) | 模型训练方法、视频模糊帧转换方法、设备及存储介质 | |
JP6384856B2 (ja) | 予測カメラ姿勢に基づくarオブジェクトを実時間に合わせて描画する情報装置、プログラム及び方法 | |
JP7118934B2 (ja) | 物体数推定装置、物体数推定方法、および物体数推定プログラム | |
JP7082713B2 (ja) | ローリングシャッター画像/ビデオのsfm/slamに対するアプリケーションで畳み込みニューラルネットワークを用いる画像/ビデオにおけるローリングシャッター補正 | |
CN110956131B (zh) | 单目标追踪方法、装置及系统 | |
EP2960859A1 (en) | Constructing a 3d structure | |
CN115008454A (zh) | 一种基于多帧伪标签数据增强的机器人在线手眼标定方法 | |
KR20230049969A (ko) | 글로벌 측위 장치 및 방법 | |
JP7272381B2 (ja) | 学習処理装置及び学習処理プログラム | |
JP2022105442A (ja) | 情報処理装置、情報処理方法およびプログラム | |
Zhang et al. | End-to-end learning of self-rectification and self-supervised disparity prediction for stereo vision | |
US20230401737A1 (en) | Method for training depth estimation model, training apparatus, and electronic device applying the method | |
JP6842618B2 (ja) | 3dマップの作成 | |
WO2018228021A1 (zh) | 用于判断目标旋转方向的方法及装置、计算机可读介质、电子设备 | |
JP2014149788A (ja) | 物体領域境界推定装置、物体領域境界推定方法及び物体領域境界推定プログラム | |
US11202000B2 (en) | Learning apparatus, image generation apparatus, learning method, image generation method, and program | |
JP6218237B2 (ja) | 撮影画像を平行化する画像変換プログラム、装置及び方法 | |
JP6663838B2 (ja) | 法線推定装置、法線推定方法、及び法線推定プログラム | |
JP6384961B2 (ja) | カメラキャリブレーション装置、カメラキャリブレーション方法、カメラキャリブレーションプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7272381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |