JP7451465B2 - 学習方法、プログラム及び画像処理装置 - Google Patents
学習方法、プログラム及び画像処理装置 Download PDFInfo
- Publication number
- JP7451465B2 JP7451465B2 JP2021124296A JP2021124296A JP7451465B2 JP 7451465 B2 JP7451465 B2 JP 7451465B2 JP 2021124296 A JP2021124296 A JP 2021124296A JP 2021124296 A JP2021124296 A JP 2021124296A JP 7451465 B2 JP7451465 B2 JP 7451465B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- statistical model
- distance
- learning
- blur
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 81
- 238000012545 processing Methods 0.000 title claims description 64
- 238000013179 statistical model Methods 0.000 claims description 212
- 238000003384 imaging method Methods 0.000 claims description 81
- 238000012549 training Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 16
- 230000004075 alteration Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Measurement Of Optical Distance (AREA)
- Studio Devices (AREA)
- Image Processing (AREA)
Description
(第1実施形態)
図1は、第1実施形態における測距システムの構成の一例を示す。図1に示す測距システム1は、画像を撮像し、当該撮像された画像を用いて撮像地点から被写体までの距離を取得(測定)するために使用される。
次に、第2実施形態について説明する。本実施形態における測距システム(撮像装置及び画像処理装置)の構成等については前述した第1実施形態と同様であるため、本実施形態において測距システムの構成について説明する場合には、適宜、図1等を用いる。ここでは、前述した第1実施形態とは異なる点について主に述べる。
次に、第3実施形態について説明する。本実施形態における測距システム(撮像装置及び画像処理装置)の構成等については前述した第1実施形態と同様であるため、本実施形態において測距システムの構成について説明する場合には、適宜、図1等を用いる。ここでは、前述した第1実施形態とは異なる点について主に述べる。
Claims (12)
- 被写体を含む画像を入力として当該被写体までの距離に応じて当該画像に生じるぼけを示すぼけ値を出力するための統計モデルを学習させる学習方法であって、
撮像装置によって第1被写体を多視点から撮像した第1多視点画像を取得することと、
前記第1多視点画像のうちの第1画像を入力として前記統計モデルから出力される第1ぼけ値及び前記第1多視点画像のうちの第2画像を入力として前記統計モデルから出力される第2ぼけ値に基づいて前記統計モデルを学習させることと
を具備し、
前記学習させることは、
前記第1多視点画像から、前記第1画像を撮像した際の前記撮像装置から当該第1画像に含まれる第1被写体までの第1距離及び前記第2画像を撮像した際の前記撮像装置から当該第2画像に含まれる第1被写体までの第2距離を取得することと、
前記第1距離と前記第2距離との大小関係を判別することと、
前記第1ぼけ値と前記第2ぼけ値との大小関係が前記判別された大小関係と等しくなるように前記統計モデルを学習させること
を含む
学習方法。 - 前記統計モデルは、前記第1画像を入力として前記第1ぼけ値及び当該第1ぼけ値の第1不確実度を出力し、前記第2画像を入力として前記第2ぼけ値及び当該第2ぼけ値の第2不確実度を出力し、
前記学習させることは、前記統計モデルから出力される第1ぼけ値及び第2ぼけ値に基づいて計算される順位損失を最小化するように統計モデルを学習させることを含み、
前記順位損失は、前記第1不確実度及び前記第2不確実度とのうちの少なくとも一方に基づいて調整される
請求項1記載の学習方法。 - 前記統計モデルは、前記第1多視点画像のうちの第3画像を入力として前記統計モデルから出力される第3ぼけ値を出力し、
前記学習させることは、前記第1ぼけ値と前記第3ぼけ値との差分が最小化されるように前記統計モデルを学習させることを含み、
前記第1画像を撮像した際の前記撮像装置から当該第1画像に含まれる第1被写体までの第1距離及び前記第3画像を撮像した際の前記撮像装置から当該第3画像に含まれる第1被写体までの第3距離の差分は、予め定められた値以下である
請求項1または2記載の学習方法。 - 前記第1多視点画像は、前記撮像装置のフォーカスが固定された状態で撮像される請求項1~3のいずれか一項に記載の学習方法。
- 前記学習させることは、前記第1及び第2ぼけ値に基づいて前記統計モデルを学習させた後に、前記第1多視点画像のうちの前記第1画像とは異なる視点から撮像した第4画像を入力として前記統計モデルから出力される第4ぼけ値及び前記第1多視点画像のうちの前記第2画像とは異なる視点から撮像した第5画像を入力として前記統計モデルから出力される第5ぼけ値に基づいて前記統計モデルを学習させることを含む請求項1~4のいずれか一項に記載の学習方法。
- 前記撮像装置によって第2被写体を多視点から撮像した第2多視点画像を取得することを更に具備し、
前記学習させることは、前記第2多視点画像のうちの第6画像を入力として前記統計モデルから出力される第6ぼけ値及び前記第2多視点画像に含まれる第7画像を入力として前記統計モデルから出力される第7ぼけ値に基づいて前記統計モデルを学習させることを更に含む
請求項1~5のいずれか一項に記載の学習方法。 - 前記統計モデルは、前記第1または第2ぼけ値及び前記第6または第7ぼけ値に基づいて学習しない請求項6記載の学習方法。
- 前記学習させることは、前記第1多視点画像のうちの少なくとも一部と前記第2多視点画像のうちの少なくとも一部とに前記第1及び第2被写体とは異なる第3被写体が含まれている場合、前記第1ぼけ値及び前記第6ぼけ値に基づいて前記統計モデルを学習させることを含む請求項6または7記載の学習方法。
- 前記第1多視点画像が前記撮像装置によって撮像される場合に、手前から奥までの複数の位置にフォーカスを合わるように通知することを更に具備する請求項1~8のいずれか一項に記載の学習方法。
- 前記第1多視点画像が前記撮像装置によって撮像される場合に、前記第1被写体を含む画像が撮像されるように通知することを更に具備する請求項1~9のいずれか一項に記載の学習方法。
- 画像処理装置のコンピュータによって実行されるプログラムであって、
前記コンピュータに、
被写体を含む画像を入力として当該被写体までの距離に応じて当該画像に生じるぼけを示すぼけ値を出力するための統計モデルを学習させる学習方法であって、
撮像装置によって被写体を多視点から撮像した多視点画像を取得することと、
前記多視点画像のうちの第1画像を入力として前記統計モデルから出力される第1ぼけ値及び前記多視点画像のうちの第2画像を入力として前記統計モデルから出力される第2ぼけ値に基づいて前記統計モデルを学習させることと
を実行させ、
前記学習させることは、
前記多視点画像から、前記第1画像を撮像した際の前記撮像装置から当該第1画像に含まれる被写体までの第1距離及び前記第2画像を撮像した際の前記撮像装置から当該第2画像に含まれる被写体までの第2距離を取得することと、
前記第1距離と前記第2距離との大小関係を判別することと、
前記第1ぼけ値と前記第2ぼけ値との大小関係が前記判別された大小関係と等しくなるように前記統計モデルを学習させること
を含む
プログラム。 - 被写体を含む画像を入力として当該被写体までの距離に応じて当該画像に生じるぼけを示すぼけ値を出力するための統計モデルを学習させる画像処理装置において、
撮像装置によって被写体を多視点から撮像した多視点画像を取得する第1取得手段と、
前記多視点画像のうちの第1画像を入力として前記統計モデルから出力される第1ぼけ値及び前記多視点画像のうちの第2画像を入力として前記統計モデルから出力される第2ぼけ値に基づいて前記統計モデルを学習させる学習手段と
を具備し、
前記学習手段は、
前記多視点画像から、前記第1画像を撮像した際の前記撮像装置から当該第1画像に含まれる被写体までの第1距離及び前記第2画像を撮像した際の前記撮像装置から当該第2画像に含まれる被写体までの第2距離を取得する第2取得手段と、
前記第1距離と前記第2距離との大小関係を判別する判別手段と
を含み、
前記第1ぼけ値と前記第2ぼけ値との大小関係が前記判別された大小関係と等しくなるように前記統計モデルを学習させる
画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021124296A JP7451465B2 (ja) | 2021-07-29 | 2021-07-29 | 学習方法、プログラム及び画像処理装置 |
US17/682,696 US20230032387A1 (en) | 2021-07-29 | 2022-02-28 | Learning method, storage medium, and image processing device |
CN202210185761.3A CN115700611A (zh) | 2021-07-29 | 2022-02-28 | 学习方法、存储介质以及图像处理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021124296A JP7451465B2 (ja) | 2021-07-29 | 2021-07-29 | 学習方法、プログラム及び画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023019521A JP2023019521A (ja) | 2023-02-09 |
JP7451465B2 true JP7451465B2 (ja) | 2024-03-18 |
Family
ID=85039473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021124296A Active JP7451465B2 (ja) | 2021-07-29 | 2021-07-29 | 学習方法、プログラム及び画像処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230032387A1 (ja) |
JP (1) | JP7451465B2 (ja) |
CN (1) | CN115700611A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7446985B2 (ja) * | 2020-12-15 | 2024-03-11 | 株式会社東芝 | 学習方法、プログラム及び画像処理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019220099A (ja) | 2018-06-22 | 2019-12-26 | 凸版印刷株式会社 | ステレオマッチング処理装置、ステレオマッチング処理方法、及びプログラム |
JP2020148483A (ja) | 2019-03-11 | 2020-09-17 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
JP2021501946A (ja) | 2017-11-03 | 2021-01-21 | グーグル エルエルシーGoogle LLC | 単視点深度予測のための絞りの監視 |
JP2021043115A (ja) | 2019-09-12 | 2021-03-18 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2585197B (en) * | 2019-07-01 | 2023-12-20 | Sony Interactive Entertainment Inc | Method and system for obtaining depth data |
JP7123884B2 (ja) * | 2019-09-12 | 2022-08-23 | 株式会社東芝 | 撮像装置、方法及びプログラム |
US11366983B2 (en) * | 2020-09-09 | 2022-06-21 | International Business Machines Corporation | Study-level multi-view processing system |
-
2021
- 2021-07-29 JP JP2021124296A patent/JP7451465B2/ja active Active
-
2022
- 2022-02-28 CN CN202210185761.3A patent/CN115700611A/zh active Pending
- 2022-02-28 US US17/682,696 patent/US20230032387A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021501946A (ja) | 2017-11-03 | 2021-01-21 | グーグル エルエルシーGoogle LLC | 単視点深度予測のための絞りの監視 |
JP2019220099A (ja) | 2018-06-22 | 2019-12-26 | 凸版印刷株式会社 | ステレオマッチング処理装置、ステレオマッチング処理方法、及びプログラム |
JP2020148483A (ja) | 2019-03-11 | 2020-09-17 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
JP2021043115A (ja) | 2019-09-12 | 2021-03-18 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
US20210082146A1 (en) | 2019-09-12 | 2021-03-18 | Kabushiki Kaisha Toshiba | Image processing device, ranging device, and method |
Non-Patent Citations (2)
Title |
---|
Ke Xian,Xian,Monocular Relative Depth Perception with Web Stereo Data Supervision,IEEE/CVF Conference on Computer Vision and Pattern Recognition,米国,IEEE,2018年,p.311-p.320,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8578138 |
三島 直 Nao MISHIMA,単眼カメラで撮影した1枚の画像から精度良く距離計測できるカラー開口撮像技術 Imaging Technology Accomplishing Simultaneous Acquisition of Color Image and High-Precision Depth Map from Single Image Taken by Monocular Camera,東芝レビュー VOL.73 NO.1 [online] TOSHIBA REVIEW,日本,東芝,2018年,第73巻,p.39-p.43 |
Also Published As
Publication number | Publication date |
---|---|
JP2023019521A (ja) | 2023-02-09 |
CN115700611A (zh) | 2023-02-07 |
US20230032387A1 (en) | 2023-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11074714B2 (en) | Eye tracking method and system | |
US8928736B2 (en) | Three-dimensional modeling apparatus, three-dimensional modeling method and computer-readable recording medium storing three-dimensional modeling program | |
JP6585006B2 (ja) | 撮影装置および車両 | |
US9251589B2 (en) | Depth measurement apparatus, image pickup apparatus, and depth measurement program | |
US20130223759A1 (en) | Image processing method and device, and program | |
JP7370922B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
JP2011209815A (ja) | 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム | |
JP7378219B2 (ja) | 撮像装置、画像処理装置、制御方法、及びプログラム | |
JP7379299B2 (ja) | 位置姿勢推定装置、位置姿勢推定方法及びプログラム | |
JP7451465B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
JP7204586B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
JP5591090B2 (ja) | 画像処理装置およびその方法 | |
JP5900017B2 (ja) | 奥行き推定装置、再構成画像生成装置、奥行き推定方法、再構成画像生成方法及びプログラム | |
JP7547297B2 (ja) | 推定装置、方法及びプログラム | |
JP7446985B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
JP2020030569A (ja) | 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、および、記憶媒体 | |
JP2018133064A (ja) | 画像処理装置、撮像装置、画像処理方法および画像処理プログラム | |
JP7009219B2 (ja) | 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体 | |
CN115086628B (zh) | 学习方法及图像处理装置 | |
JP6384961B2 (ja) | カメラキャリブレーション装置、カメラキャリブレーション方法、カメラキャリブレーションプログラム及び記録媒体 | |
JP6608238B2 (ja) | 画像処理装置、撮像装置、画像処理方法、プログラム | |
JP5942428B2 (ja) | 再構成画像生成装置、再構成画像生成方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230313 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240306 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7451465 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |