JP7501481B2 - 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム - Google Patents
距離推定装置、距離推定方法、および距離推定用コンピュータプログラム Download PDFInfo
- Publication number
- JP7501481B2 JP7501481B2 JP2021156991A JP2021156991A JP7501481B2 JP 7501481 B2 JP7501481 B2 JP 7501481B2 JP 2021156991 A JP2021156991 A JP 2021156991A JP 2021156991 A JP2021156991 A JP 2021156991A JP 7501481 B2 JP7501481 B2 JP 7501481B2
- Authority
- JP
- Japan
- Prior art keywords
- teacher
- sample points
- image
- feature
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
- G06T7/593—Depth or shape recovery from multiple images from stereo images
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional [3D] objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
- G06T2207/30261—Obstacle
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
3 ECU
331 抽出部
332 生成部
333 設定部
334 補間部
335 算出部
336 推定部
Claims (8)
- 所定のリファレンス位置から対象物を撮影するリファレンス撮像部により生成されたリファレンス画像から前記リファレンス画像に含まれる各画素に対応する特徴量を表すリファレンス特徴マップを抽出するとともに、前記リファレンス位置とは異なる位置から前記対象物を撮影する1以上のソース撮像部のそれぞれにより生成されたソース画像のそれぞれから、当該ソース画像に含まれる各画素の特徴量を表すソース特徴マップを抽出する抽出部と、
前記リファレンス特徴マップにおいて前記リファレンス画像に含まれる各画素に対応する特徴量を、前記リファレンス撮像部の像面を前記リファレンス撮像部の光軸方向に移動させたときの当該像面に対応する画像の各画素に対応するように変換することにより仮説的に配置される複数の仮説平面上に前記ソース特徴マップを射影することで、前記複数の仮説平面上の座標に特徴量が関連づけられたコストボリュームを生成する生成部と、
前記コストボリュームにおいて、前記リファレンス位置から前記リファレンス画像に含まれる複数の画素のうちいずれかの対象画素に相当する方向に向かう直線の上に複数のサンプル点を設定する設定部と、
前記複数のサンプル点のそれぞれに対応する特徴量を、前記コストボリュームにおいて、前記複数の仮説平面のうち当該サンプル点の近傍に配置された仮説平面上の、当該サンプル点の近傍の座標に関連づけられた特徴量を用いて補間する補間部と、
補間された前記複数のサンプル点に対応する各特徴量を、前記複数の仮説平面のうちいずれかの仮説平面上のいずれかの座標に対応する特徴量に応じて当該座標が前記対象物の内部となる確率を表す占有確率を出力するよう学習された識別器に入力することで、当該サンプル点に対応する前記占有確率を算出する算出部と、
前記複数のサンプル点のそれぞれに対応する前記占有確率と当該サンプル点の前記リファレンス位置からの距離との積を加算することで、前記リファレンス位置から前記対象物の表面までの距離を推定する推定部と、
を備える距離推定装置。 - 前記算出部は、複数のサンプル点のそれぞれに対応する占有確率を、当該サンプル点に隣接する一対のサンプル点の間隔が大きいほど重みが大きくなるように重みづけする、請求項1に記載の距離推定装置。
- 前記識別器は、教師対象物が表された教師リファレンス画像、および、前記教師対象物が表され、前記教師リファレンス画像の視点とは異なる視点を有する教師ソース画像を含む教師データを用いて生成された教師コストボリュームにおいて、前記教師リファレンス画像の視点から前記教師リファレンス画像に含まれる複数の画素のうち表された前記教師対象物の深度が関連づけられた教師画素に相当する方向に向かう教師サンプリング直線の上に設定された複数の教師サンプル点について推定される占有確率と、前記教師画素に関連づけられた深度から算出される占有状態との差が小さくなるように学習される、請求項1または2に記載の距離推定装置。
- 前記複数の教師サンプル点は、前記教師画素に関連づけられた深度に近いほど間隔が密となるように設定される、請求項3に記載の距離推定装置。
- 前記識別器は、前記複数の教師サンプル点について推定される前記占有確率と、前記教師画素の前記占有状態との差が小さくなるように学習されるとともに、前記複数の教師サンプル点について推定される占有確率から算出される前記教師対象物の深度と当該教師画素に関連づけられた深度との差が小さくなるように学習される、請求項3または4に記載の距離推定装置。
- 前記識別器は、座標の値が前記教師画素ごとに設定される値を用いて変更された前記複数の教師サンプル点について推定される前記占有確率を用いて学習される、請求項3-5のいずれか一項に記載の距離推定装置。
- 所定のリファレンス位置から対象物を撮影するリファレンス撮像部により生成されたリファレンス画像から前記リファレンス画像に含まれる各画素に対応する特徴量を表すリファレンス特徴マップを抽出するとともに、前記リファレンス位置とは異なる位置から前記対象物を撮影する1以上のソース撮像部のそれぞれにより生成されたソース画像のそれぞれから、当該ソース画像に含まれる各画素の特徴量を表すソース特徴マップを抽出し、
前記リファレンス特徴マップにおいて前記リファレンス画像に含まれる各画素に対応する特徴量を、前記リファレンス撮像部の像面を前記リファレンス撮像部の光軸方向に移動させたときの当該像面に対応する画像の各画素に対応するように変換することにより仮説的に配置される複数の仮説平面上に前記ソース特徴マップを射影することで、前記複数の仮説平面上の座標に特徴量が関連づけられたコストボリュームを生成し、
前記コストボリュームにおいて、前記リファレンス位置から前記リファレンス画像に含まれる複数の画素のうちいずれかの対象画素に相当する方向に向かう直線の上に複数のサンプル点を設定し、
前記複数のサンプル点のそれぞれに対応する特徴量を、前記コストボリュームにおいて、前記複数の仮説平面のうち当該サンプル点の近傍に配置された仮説平面上の、当該サンプル点の近傍の座標に関連づけられた特徴量を用いて補間し、
補間された前記複数のサンプル点に対応する各特徴量を、前記複数の仮説平面のうちいずれかの仮説平面上のいずれかの座標に対応する特徴量に応じて当該座標が前記対象物の内部となる確率を表す占有確率を出力するよう学習された識別器に入力することで、当該サンプル点に対応する前記占有確率を算出し、
前記複数のサンプル点のそれぞれに対応する前記占有確率と当該サンプル点の前記リファレンス位置からの距離との積を加算することで、前記リファレンス位置から前記対象物の表面までの距離を推定する、
ことを含む距離推定方法。 - 所定のリファレンス位置から対象物を撮影するリファレンス撮像部により生成されたリファレンス画像から前記リファレンス画像に含まれる各画素に対応する特徴量を表すリファレンス特徴マップを抽出するとともに、前記リファレンス位置とは異なる位置から前記対象物を撮影する1以上のソース撮像部のそれぞれにより生成されたソース画像のそれぞれから、当該ソース画像に含まれる各画素の特徴量を表すソース特徴マップを抽出し、
前記リファレンス特徴マップにおいて前記リファレンス画像に含まれる各画素に対応する特徴量を、前記リファレンス撮像部の像面を前記リファレンス撮像部の光軸方向に移動させたときの当該像面に対応する画像の各画素に対応するように変換することにより仮説的に配置される複数の仮説平面上に前記ソース特徴マップを射影することで、前記複数の仮説平面上の座標に特徴量が関連づけられたコストボリュームを生成し、
前記コストボリュームにおいて、前記リファレンス位置から前記リファレンス画像に含まれる複数の画素のうちいずれかの対象画素に相当する方向に向かう直線の上に複数のサンプル点を設定し、
前記複数のサンプル点のそれぞれに対応する特徴量を、前記コストボリュームにおいて、前記複数の仮説平面のうち当該サンプル点の近傍に配置された仮説平面上の、当該サンプル点の近傍の座標に関連づけられた特徴量を用いて補間し、
補間された前記複数のサンプル点に対応する各特徴量を、前記複数の仮説平面のうちいずれかの仮説平面上のいずれかの座標に対応する特徴量に応じて当該座標が前記対象物の内部となる確率を表す占有確率を出力するよう学習された識別器に入力することで、当該サンプル点に対応する前記占有確率を算出し、
前記複数のサンプル点のそれぞれに対応する前記占有確率と当該サンプル点の前記リファレンス位置からの距離との積を加算することで、前記リファレンス位置から前記対象物の表面までの距離を推定する、
ことをコンピュータのプロセッサに実行させる距離推定用コンピュータプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021156991A JP7501481B2 (ja) | 2021-09-27 | 2021-09-27 | 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム |
| US17/930,826 US12243262B2 (en) | 2021-09-27 | 2022-09-09 | Apparatus and method for estimating distance and non-transitory computer-readable medium containing computer program for estimating distance |
| CN202211173872.9A CN115880215B (zh) | 2021-09-27 | 2022-09-26 | 距离推定装置、距离推定方法和保存有距离推定用计算机程序的非瞬时性的计算机可读介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021156991A JP7501481B2 (ja) | 2021-09-27 | 2021-09-27 | 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023047846A JP2023047846A (ja) | 2023-04-06 |
| JP7501481B2 true JP7501481B2 (ja) | 2024-06-18 |
Family
ID=85721731
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021156991A Active JP7501481B2 (ja) | 2021-09-27 | 2021-09-27 | 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US12243262B2 (ja) |
| JP (1) | JP7501481B2 (ja) |
| CN (1) | CN115880215B (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7501481B2 (ja) * | 2021-09-27 | 2024-06-18 | トヨタ自動車株式会社 | 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020028114A (ja) | 2018-08-10 | 2020-02-20 | 日本放送協会 | 立体画像生成装置及びそのプログラム |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11195132A (ja) * | 1997-10-31 | 1999-07-21 | Hewlett Packard Co <Hp> | テクスチャマッピング用バッファ、3次元グラフィクス処理装置、3次元グラフィクス処理システム、3次元グラフィクス処理方法および処理プログラムが記憶された記憶媒体 |
| US6856314B2 (en) | 2002-04-18 | 2005-02-15 | Stmicroelectronics, Inc. | Method and system for 3D reconstruction of multiple views with altering search path and occlusion modeling |
| KR100955483B1 (ko) | 2008-08-12 | 2010-04-30 | 삼성전자주식회사 | 3차원 격자 지도 작성 방법 및 이를 이용한 자동 주행 장치의 제어 방법 |
| WO2014050827A1 (ja) * | 2012-09-25 | 2014-04-03 | 日本電信電話株式会社 | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体 |
| JP2019185283A (ja) * | 2018-04-06 | 2019-10-24 | 日本放送協会 | 3次元モデル生成装置及びそのプログラム、並びに、ip立体像表示システム |
| CN110458755B (zh) * | 2018-05-07 | 2023-01-13 | 华为技术有限公司 | 图像处理方法、相关设备及计算机存储介质 |
| JP7195785B2 (ja) | 2018-06-29 | 2022-12-26 | キヤノン株式会社 | 3次元形状データを生成する装置、方法、及びプログラム |
| CN110160502B (zh) * | 2018-10-12 | 2022-04-01 | 腾讯科技(深圳)有限公司 | 地图要素提取方法、装置及服务器 |
| US10949684B2 (en) * | 2019-05-08 | 2021-03-16 | Ford Global Technologies, Llc | Vehicle image verification |
| KR20210025942A (ko) * | 2019-08-28 | 2021-03-10 | 성균관대학교산학협력단 | 종단간 컨볼루셔널 뉴럴 네트워크를 이용한 스테레오 매칭 방법 |
| US11120280B2 (en) * | 2019-11-15 | 2021-09-14 | Argo AI, LLC | Geometry-aware instance segmentation in stereo image capture processes |
| TWI759651B (zh) * | 2019-11-21 | 2022-04-01 | 財團法人工業技術研究院 | 基於機器學習的物件辨識系統及其方法 |
| US11462030B2 (en) * | 2020-05-11 | 2022-10-04 | Caterpillar Inc. | Method and system for detecting a pile |
| CN113096174A (zh) * | 2021-03-24 | 2021-07-09 | 苏州中科广视文化科技有限公司 | 一种基于多平面扫描的端到端网络的多视点场景重建方法 |
| JP7501481B2 (ja) * | 2021-09-27 | 2024-06-18 | トヨタ自動車株式会社 | 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム |
| US12552040B2 (en) * | 2022-06-13 | 2026-02-17 | Toyota Research Institute, Inc. | System and method for unknown object manipulation from pure synthetic stereo data |
-
2021
- 2021-09-27 JP JP2021156991A patent/JP7501481B2/ja active Active
-
2022
- 2022-09-09 US US17/930,826 patent/US12243262B2/en active Active
- 2022-09-26 CN CN202211173872.9A patent/CN115880215B/zh active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020028114A (ja) | 2018-08-10 | 2020-02-20 | 日本放送協会 | 立体画像生成装置及びそのプログラム |
Non-Patent Citations (1)
| Title |
|---|
| Yang Hong et al.,StereoPIFu: Depth Aware Clothed Human Digitization via Stereo Vision,2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),米国,IEEE,2021年06月25日,pp.1-11,https://ieeexplore.ieee.org/document/9577346 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023047846A (ja) | 2023-04-06 |
| US12243262B2 (en) | 2025-03-04 |
| CN115880215A (zh) | 2023-03-31 |
| US20230102186A1 (en) | 2023-03-30 |
| CN115880215B (zh) | 2025-09-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11734918B2 (en) | Object identification apparatus, moving body system, object identification method, object identification model learning method, and object identification model learning apparatus | |
| CN112292711B (zh) | 关联lidar数据和图像数据 | |
| CN111223135B (zh) | 通过使用雷达和运动数据的单目相机来增强距离估计的系统和方法 | |
| EP3510561B1 (en) | Predicting depth from image data using a statistical model | |
| JP7556142B2 (ja) | 点群からの効率的な三次元物体検出 | |
| JP5926228B2 (ja) | 自律車両用の奥行き検知方法及びシステム | |
| CN112889071B (zh) | 用于确定二维图像中深度信息的系统和方法 | |
| JP6574611B2 (ja) | 立体画像に基づいて距離情報を求めるためのセンサシステム | |
| CN107038723B (zh) | 棒状像素估计方法和系统 | |
| US11443151B2 (en) | Driving assistant system, electronic device, and operation method thereof | |
| US20140071240A1 (en) | Free space detection system and method for a vehicle using stereo vision | |
| KR20220014678A (ko) | 영상의 깊이를 추정하는 방법 및 장치 | |
| Giering et al. | Multi-modal sensor registration for vehicle perception via deep neural networks | |
| CN114155414A (zh) | 面向无人驾驶的新型特征层数据融合的方法、系统及目标检测方法 | |
| JP2020122754A (ja) | 3次元位置推定装置及びプログラム | |
| JP7501481B2 (ja) | 距離推定装置、距離推定方法、および距離推定用コンピュータプログラム | |
| CN117576199A (zh) | 一种驾驶场景视觉重建方法、装置、设备及介质 | |
| WO2020018140A1 (en) | Ballistic estimnation of vehicle data | |
| Harisankar et al. | Unsupervised depth estimation from monocular images for autonomous vehicles | |
| CN111192306A (zh) | 用于视差估计的系统及用于系统的视差估计的方法 | |
| JP2021051347A (ja) | 距離画像生成装置及び距離画像生成方法 | |
| CN114919584A (zh) | 机动车定点目标测距方法、装置及计算机可读存储介质 | |
| CN119672479A (zh) | 一种基于深度特征细化的多模态三维目标检测方法、系统及存储介质 | |
| KR20250132262A (ko) | 차량 제어 장치 및 그 방법 | |
| CN119169073A (zh) | 一种锚孔定位方法及系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230721 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240425 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240507 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240520 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7501481 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |

