JP7464154B2 - 3次元チャネルの構築方法、装置及びコンピュータ読み取り可能な記憶媒体 - Google Patents
3次元チャネルの構築方法、装置及びコンピュータ読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP7464154B2 JP7464154B2 JP2023003569A JP2023003569A JP7464154B2 JP 7464154 B2 JP7464154 B2 JP 7464154B2 JP 2023003569 A JP2023003569 A JP 2023003569A JP 2023003569 A JP2023003569 A JP 2023003569A JP 7464154 B2 JP7464154 B2 JP 7464154B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- panoramic image
- dimensional
- image
- depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000010276 construction Methods 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 25
- 238000013135 deep learning Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000015654 memory Effects 0.000 description 25
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
- G06T15/20—Perspective computation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S11/00—Systems for determining distance or velocity not using reflection or reradiation
- G01S11/12—Systems for determining distance or velocity not using reflection or reradiation using electromagnetic waves other than radio waves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/536—Depth or shape recovery from perspective effects, e.g. by using vanishing points
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/698—Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Electromagnetism (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
l2 = (x2/2w- 0.5)*2π
b1 = (0.5 - y1/w)*π
b2 = (0.5 - y2/w)*π
X1 = cos(l1)cos(b1)
X2 = cos(l2)cos(b2)
Y1 = sin(l1)cos(b1)
Y2 = sin(l2)cos(b2)
Z1 = sin(b1)
Z2 = sin(b2)
φi = arccos(X1* Xi + Y1 * Yi + Z1* Zi)
Xi = (X1 sin(φi -θ1) + X2 sin(φi ))/ sin(φi)
Yi = (Y1 sin(φi -θ1) + Y2 sin(φi ))/ sin(φi)
Zi = (Z1 sin(φi -θ1) + Z2 sin(φi ))/ sin(φi)
以上の式において、(l1、b1)、(l2、b2)は、それぞれコーナー点p1及びp2の球面での経緯度座標を示し、(X1、Y1、Z1)、(X2、Y2、Z2)は、それぞれコーナー点(x1、y1)及び(x2、y2)の球座標系での3次元座標を示し、φiは、画素点iとコーナー点(x1、y1)との間の夾角を示し、画素点piは、コーナー点(x1、y1)と(x2、y2)との間の円弧線上の1つの画素点であり、(Xi、Yi、Zi)は、画素点piの球座標系での3次元座標を示す。wは、第1のパノラマ画像の幅を示し、2wは、第1のパノラマ画像の長さを示す。通常、パノラマ画像は、アスペクト比が2:1の矩形画像である。
Claims (13)
- 3次元チャネルの構築装置が実行する3次元チャネルの構築方法であって、
第1のパノラマ画像に対応する深度画像を生成するステップと、
前記第1のパノラマ画像に対してチャネル対象検出を行い、前記第1のパノラマ画像におけるチャネル対象フレームを取得するステップであって、各チャネル対象フレームは順次環状に接続された4つの弧状辺であり、各弧状辺は大円の円弧である、ステップと、
前記第1のパノラマ画像、前記チャネル対象フレーム及び前記深度画像に基づき、前記第1のパノラマ画像におけるチャネル対象の3次元点群を生成するステップと、を含むことを特徴とする、3次元チャネルの構築方法。 - 前記第1のパノラマ画像に対応する深度画像を生成するステップにおいて、
前記第1のパノラマ画像に対して単眼深度推定を行い、前記第1のパノラマ画像の解像度と同一の解像度の深度画像を取得することを特徴とする、請求項1に記載の3次元チャネルの構築方法。 - 前記第1のパノラマ画像に対してチャネル対象検出を行い、前記第1のパノラマ画像におけるチャネル対象フレームを取得するステップにおいて、
予め訓練された深度学習ネットワークモデルを用いて、前記第1のパノラマ画像に対してチャネル対象検出を行い、前記第1のパノラマ画像におけるチャネル対象フレームを取得し、
前記深度学習ネットワークモデルは、訓練サンプルセットを用いて訓練されたものであり、
前記訓練サンプルセットは、複数のサンプルパノラマ画像、及び各サンプルパノラマ画像にラベル付けされたチャネル対象フレームの幾何学的特徴を含み、
前記幾何学的特徴は、各チャネル対象フレームの4つのコーナー点の位置座標、及び隣接する2つのコーナー点の単位球面における夾角を含むことを特徴とする、請求項1に記載の3次元チャネルの構築方法。 - 前記第1のパノラマ画像におけるチャネル対象の3次元点群を生成する前に、さらに
前記第1のパノラマ画像及び前記チャネル対象フレームを用いて、前記深度画像の深度情報を修復するステップを含むことを特徴とする、請求項1に記載の3次元チャネルの構築方法。 - 前記第1のパノラマ画像及びチャネル対象フレームを用いて、前記深度画像の深度情報を修復するステップにおいて、
チャネル対象フレームの4つのコーナー点の位置座標及び隣接する2つのコーナー点の単位球面における夾角に基づき、前記チャネル対象フレームの第1のパノラマ画像における2次元点集合を算出し、
前記チャネル対象フレームの2次元点集合における各2次元点の前記深度画像における3次元空間座標に基づき、前記2次元点集合に対応する3次元点集合を取得し、
前記3次元点集合に基づき、近似により一つの目標平面を取得し、
前記目標平面内の各第1の画素点及び前記深度画像における対応する第2の画素点を決定し、前記第1の画素点の3次元空間座標を用いて、前記第2の画素点の深度を修復することを特徴とする、請求項4に記載の3次元チャネルの構築方法。 - 前記第1のパノラマ画像は、目標空間に対して撮影されたパノラマ画像群における任意のパノラマ画像であり、
前記3次元チャネルの構築方法は、さらに
前記目標空間の各パノラマ画像におけるチャネル対象の3次元点群に基づいて、前記目標空間におけるチャネル対象の3次元点群を生成するステップを含むことを特徴とする、請求項1乃至5のいずれか一項に記載の3次元チャネルの構築方法。 - 第1のパノラマ画像に対応する深度画像を生成する深度画像生成モジュールと、
前記第1のパノラマ画像に対してチャネル対象検出を行い、前記第1のパノラマ画像におけるチャネル対象フレームを取得するチャネル対象検出モジュールであって、各チャネル対象フレームは順次環状に接続された4つの弧状辺であり、各弧状辺は大円の円弧である、チャネル対象検出モジュールと、
前記第1のパノラマ画像、前記チャネル対象フレーム及び前記深度画像に基づき、前記第1のパノラマ画像におけるチャネル対象の3次元点群を生成するチャネル点群生成モジュールと、を含むことを特徴とする、3次元チャネルの構築装置。 - 前記深度画像生成モジュールは、
前記第1のパノラマ画像に対して単眼深度推定を行い、前記第1のパノラマ画像と同一の解像度の深度画像を取得する単眼深度推定モジュールを含むことを特徴とする、請求項7に記載の3次元チャネルの構築装置。 - 前記チャネル対象検出モジュールは、
予め訓練された深度学習ネットワークモデルを用いて、前記第1のパノラマ画像に対してチャネル対象検出を行い、前記第1のパノラマ画像におけるチャネル対象フレームを取得するモデル呼出モジュールを含み、
前記深度学習ネットワークモデルは、訓練サンプルセットを用いて訓練されたものであり、
前記訓練サンプルセットは、複数のサンプルパノラマ画像、及び各サンプルパノラマ画像にラベル付けされたチャネル対象フレームの幾何学的特徴を含み、
前記幾何学的特徴は、各チャネル対象フレームの4つのコーナー点の位置座標、及び隣接する2つのコーナー点の単位球面における夾角を含むことを特徴とする、請求項7に記載の3次元チャネルの構築装置。 - 前記チャネル点群生成モジュールが前記第1のパノラマ画像におけるチャネル対象の3次元点群を生成する前に、前記第1のパノラマ画像及びチャネル対象フレームを用いて、前記深度画像の深度情報を修復する深度情報修復モジュール、をさらに含むことを特徴とする、請求項7に記載の3次元チャネルの構築装置。
- 前記深度情報修復モジュールは、
チャネル対象フレームの4つのコーナー点の位置座標及び隣接する2つのコーナー点の単位球面における夾角に基づき、前記チャネル対象フレームの第1のパノラマ画像における2次元点集合を算出する第1の算出モジュールと、
前記チャネル対象フレームの2次元点集合における各2次元点の前記深度画像における3次元空間座標に基づき、前記2次元点集合に対応する3次元点集合を取得する第1の取得モジュールと、
前記3次元点集合に基づき、近似により1つの目標平面を取得する第1の近似モジュールと、
前記目標平面内の各第1の画素点及び前記深度画像における対応する第2の画素点を決定し、前記第1の画素点の3次元空間座標を用いて、前記第2の画素点の深度を修復する第1の決定モジュールと、を含むことを特徴とする、請求項10に記載の3次元チャネルの構築装置。 - 前記第1のパノラマ画像は、目標空間に対して撮影されたパノラマ画像群における任意のパノラマ画像であり、
前記3次元チャネルの構築装置は、さらに
前記目標空間の各パノラマ画像におけるチャネル対象の3次元点群に基づき、前記目標空間におけるチャネル対象の3次元点群を生成する目標空間チャネル生成モジュールを含むことを特徴とする、請求項7乃至11のいずれか一項に記載の3次元チャネルの構築装置。 - コンピュータプログラムが格納されたコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータプログラムがプロセッサにより実行される際に、請求項1乃至5のいずれか一項に記載の3次元チャネルの構築方法のステップを実行することを特徴とする、コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210048805.8 | 2022-01-17 | ||
CN202210048805.8A CN116485985A (zh) | 2022-01-17 | 2022-01-17 | 三维通道的构造方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023104902A JP2023104902A (ja) | 2023-07-28 |
JP7464154B2 true JP7464154B2 (ja) | 2024-04-09 |
Family
ID=87162198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023003569A Active JP7464154B2 (ja) | 2022-01-17 | 2023-01-13 | 3次元チャネルの構築方法、装置及びコンピュータ読み取り可能な記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230230316A1 (ja) |
JP (1) | JP7464154B2 (ja) |
CN (1) | CN116485985A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040196282A1 (en) | 2003-02-14 | 2004-10-07 | Oh Byong Mok | Modeling and editing image panoramas |
JP2021149972A (ja) | 2020-03-17 | 2021-09-27 | 株式会社リコー | パノラマ画像においてランドマークを識別する方法、装置および記憶媒体 |
-
2022
- 2022-01-17 CN CN202210048805.8A patent/CN116485985A/zh active Pending
-
2023
- 2023-01-13 JP JP2023003569A patent/JP7464154B2/ja active Active
- 2023-01-17 US US18/155,159 patent/US20230230316A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040196282A1 (en) | 2003-02-14 | 2004-10-07 | Oh Byong Mok | Modeling and editing image panoramas |
JP2021149972A (ja) | 2020-03-17 | 2021-09-27 | 株式会社リコー | パノラマ画像においてランドマークを識別する方法、装置および記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2023104902A (ja) | 2023-07-28 |
CN116485985A (zh) | 2023-07-25 |
US20230230316A1 (en) | 2023-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Point-based multi-view stereo network | |
CN109671115B (zh) | 使用深度值估计的图像处理方法和装置 | |
KR102051889B1 (ko) | 스마트 글래스에서 2d 데이터를 기반으로 3d 증강현실을 구현하는 방법 및 시스템 | |
RU2642167C2 (ru) | Устройство, способ и система для реконструкции 3d-модели объекта | |
Marzat et al. | Real-time dense and accurate parallel optical flow using CUDA | |
KR20180026400A (ko) | 3-차원 공간 모델링 | |
US20190122414A1 (en) | Method and apparatus for generating virtual object | |
Ma et al. | An image matching optimization algorithm based on pixel shift clustering RANSAC | |
JP2009536499A (ja) | 2次元画像から3次元オブジェクトを再構成するシステム及び方法 | |
Park et al. | Real-time 3D registration using GPU | |
CN111868738B (zh) | 跨设备监控计算机视觉系统 | |
CN113362446B (zh) | 基于点云数据重建对象的方法及装置 | |
Coleca et al. | Self-organizing maps for hand and full body tracking | |
Fan et al. | Real-time implementation of stereo vision based on optimised normalised cross-correlation and propagated search range on a gpu | |
Manni et al. | Snap2cad: 3D indoor environment reconstruction for AR/VR applications using a smartphone device | |
Collins et al. | Locally affine and planar deformable surface reconstruction from video | |
JP7464154B2 (ja) | 3次元チャネルの構築方法、装置及びコンピュータ読み取り可能な記憶媒体 | |
Vemulapati et al. | Fslam: an efficient and accurate slam accelerator on soc fpgas | |
CN112085842B (zh) | 深度值确定方法及装置、电子设备和存储介质 | |
Guan et al. | Multistage pixel-visibility learning with cost regularization for multiview stereo | |
US20230169755A1 (en) | Apparatus and method with image processing | |
Gomes et al. | Exploring RGB-D cameras for 3D reconstruction of cultural heritage: A new approach applied to Brazilian baroque sculptures | |
US11430150B2 (en) | Method and apparatus for processing sparse points | |
JP2022082455A (ja) | 三次元モデル構築方法、装置及びコンピュータ読み取り可能な記憶媒体 | |
Kim et al. | Real-time stereo matching using extended binary weighted aggregation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7464154 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |