JP7446985B2 - 学習方法、プログラム及び画像処理装置 - Google Patents
学習方法、プログラム及び画像処理装置 Download PDFInfo
- Publication number
- JP7446985B2 JP7446985B2 JP2020207634A JP2020207634A JP7446985B2 JP 7446985 B2 JP7446985 B2 JP 7446985B2 JP 2020207634 A JP2020207634 A JP 2020207634A JP 2020207634 A JP2020207634 A JP 2020207634A JP 7446985 B2 JP7446985 B2 JP 7446985B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- distance
- statistical model
- learning
- imaging device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 74
- 238000012545 processing Methods 0.000 title claims description 66
- 238000013179 statistical model Methods 0.000 claims description 165
- 238000003384 imaging method Methods 0.000 claims description 76
- 238000012549 training Methods 0.000 claims description 26
- 230000004075 alteration Effects 0.000 claims description 11
- 230000003287 optical effect Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/60—Noise processing, e.g. detecting, correcting, reducing or removing noise
- H04N25/61—Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Signal Processing (AREA)
- Mathematical Analysis (AREA)
- Computational Linguistics (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Algebra (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
(第1実施形態)
まず、第1実施形態について説明する。図1は、本実施形態における測距システムの構成の一例を示す。図1に示す測距システム1は、画像を撮像し、当該撮像された画像を用いて撮像地点から被写体までの距離を取得(測定)するために使用される。なお、本実施形態において説明する距離は、絶対的な距離を表すものであってもよいし、相対的な距離を表すものであってもよい。
次に、第2実施形態について説明する。本実施形態における測距システム(撮像装置及び画像処理装置)の構成等については前述した第1実施形態と同様であるため、本実施形態において測距システムの構成について説明する場合には、適宜、図1等を用いる。ここでは、前述した第1実施形態とは異なる点について主に述べる。
次に、第3実施形態について説明する。本実施形態における測距システム(撮像装置及び画像処理装置)の構成等については前述した第1実施形態と同様であるため、本実施形態において測距システムの構成について説明する場合には、適宜、図1等を用いる。ここでは、前述した第1実施形態とは異なる点について主に述べる。
Claims (15)
- 被写体を含む画像を入力として当該被写体までの距離を出力するための統計モデルを学習させる学習方法であって、
撮像装置によって撮像された被写体を含む第1及び第2画像を取得することと、
前記第1画像の少なくとも一部である第1領域を入力として前記統計モデルから出力される第1距離及び前記第2画像の少なくとも一部である第2領域を入力として前記統計モデルから出力される第2距離に基づいて前記統計モデルを学習させることと
を具備し、
前記第1画像に含まれる被写体までの第3距離の正解値は前記第1画像に付与されておらず、
前記第2画像に含まれる被写体までの第4距離の正解値は前記第2画像に付与されておらず、
前記第3距離と前記第4距離との大小関係は既知であり、
前記学習させることは、前記第3距離の正解値及び前記第4距離の正解値を用いることなく、前記第1距離と前記第2距離との大小関係が前記第3距離と前記第4距離との大小関係と等しくなるように前記統計モデルを学習させることを含む
学習方法。 - 前記統計モデルは、前記第1領域を入力として前記第1距離及び当該第1距離の第1不確実度を出力し、前記第2領域を入力として前記第2距離及び当該第2距離の第2不確実度を出力し、
前記学習させることは、前記統計モデルから出力される第1距離及び第2距離に基づいて計算される順位損失を最小化するように当該統計モデルを学習させることを含み、
前記順位損失は、前記第1不確実度及び前記第2不確実度のうちの少なくとも一方に基づいて調整される
請求項1記載の学習方法。 - 前記統計モデルは、前記第1画像の少なくとも一部であり、前記第1領域とは異なる第3領域を入力として第5距離を出力し、
前記学習させることは、前記第1距離と前記第5距離との差分が最小化されるように前記統計モデルを学習させることを含む
請求項1または2記載の学習方法。 - 前記第1画像及び前記第2画像は、前記被写体から遠ざかる方向に前記撮像装置を移動しながら当該撮像装置によって撮像され、
前記撮像装置によって撮像された順番を表す識別番号が前記第1画像及び前記第2画像に付されており、
前記第3距離と前記第4距離との大小関係は、前記第1画像及び前記第2画像に付されている識別番号に基づいて判別される
請求項1~3のいずれか一項に記載の学習方法。 - 前記第1画像及び前記第2画像は、前記被写体に近づく方向に前記撮像装置を移動しながら当該撮像装置によって撮像され、
前記撮像装置によって撮像された順番を表す識別番号が前記第1画像及び前記第2画像に付されており、
前記前記第3距離と前記第4距離との大小関係は、前記第1画像及び前記第2画像に付されている識別番号に基づいて判別される
請求項1~3のいずれか一項に記載の学習方法。 - 前記第3距離と前記第4距離との大小関係は、前記撮像装置によって前記第1画像及び前記第2画像が撮像された際の当該撮像装置の位置に基づいて判別される請求項1~3のいずれか一項に記載の学習方法。
- 前記撮像装置によって前記第1画像及び前記第2画像が撮像された際の当該撮像装置の位置は、当該撮像装置に搭載されたセンサによって取得される請求項6記載の学習方法。
- 前記撮像装置によって前記第1画像及び前記第2画像が撮像された際の当該撮像装置の位置は、当該撮像装置を移動させる移動機構の位置に基づいて取得される請求項6記載の学習方法。
- 前記被写体の形状は、平面形状である請求項1~8のいずれか一項に記載の学習方法。
- 前記第3距離と前記第4距離との差分は、予め定められた値以上である請求項1~9のいずれか一項に記載の学習方法。
- 前記第1画像が撮像された第1時刻と前記第2画像が撮像された第2時刻との差分は、予め定められた値以上である請求項1~10のいずれか一項に記載の学習方法。
- 前記統計モデルは、光学系の収差の影響を受けた画像に生じる、当該画像に含まれる被写体までの距離に応じて非線形に変化するぼけを学習することによって生成される請求項1~11のいずれか一項に記載の学習方法。
- 前記統計モデルは、フィルタを透過した光に基づいて生成される画像に生じる、当該画像に含まれる被写体までの距離に応じて非線形に変化するぼけを学習することによって生成される請求項1~11のいずれか一項に記載の学習方法。
- 被写体を含む画像を入力として当該被写体までの距離を出力するための統計モデルを学習させるプログラムであって、
コンピュータに、
撮像装置によって撮像された被写体を含む第1及び第2画像を取得することと、
前記第1画像の少なくとも一部である第1領域を入力として前記統計モデルから出力される第1距離及び前記第2画像の少なくとも一部である第2領域を入力として前記統計モデルから出力される第2距離に基づいて前記統計モデルを学習させることと
を実行させ、
前記第1画像に含まれる被写体までの第3距離の正解値は前記第1画像に付与されておらず、
前記第2画像に含まれる被写体までの第4距離の正解値は前記第2画像に付与されておらず、
前記第3距離と前記第4距離との大小関係は既知であり、
前記学習させることは、前記第3距離の正解値及び前記第4距離の正解値を用いることなく、前記第1距離と前記第2距離との大小関係が前記第3距離と前記第4距離との大小関係と等しくなるように前記統計モデルを学習させることを含む
プログラム。 - 被写体を含む画像を入力として当該被写体までの距離を出力するための統計モデルを学習させる画像処理装置であって、
撮像装置によって撮像された被写体を含む第1及び第2画像を取得する取得手段と、
前記第1画像の少なくとも一部である第1領域を入力として前記統計モデルから出力される第1距離及び前記第2画像の少なくとも一部である第2領域を入力として前記統計モデルから出力される第2距離に基づいて前記統計モデルを学習させる学習手段と
を具備し、
前記第1画像に含まれる被写体までの第3距離の正解値は前記第1画像に付与されておらず、
前記第2画像に含まれる被写体までの第4距離の正解値は前記第2画像に付与されておらず、
前記第3距離と前記第4距離との大小関係は既知であり、
前記学習手段は、前記第3距離の正解値及び前記第4距離の正解値を用いることなく、前記第1距離と前記第2距離との大小関係が前記第3距離と前記第4距離との大小関係と等しくなるように前記統計モデルを学習させる
画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020207634A JP7446985B2 (ja) | 2020-12-15 | 2020-12-15 | 学習方法、プログラム及び画像処理装置 |
US17/467,720 US20220188571A1 (en) | 2020-12-15 | 2021-09-07 | Learning method, storage medium, and image processing device |
CN202111042419.XA CN114638354A (zh) | 2020-12-15 | 2021-09-07 | 学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020207634A JP7446985B2 (ja) | 2020-12-15 | 2020-12-15 | 学習方法、プログラム及び画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022094636A JP2022094636A (ja) | 2022-06-27 |
JP7446985B2 true JP7446985B2 (ja) | 2024-03-11 |
Family
ID=81941551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020207634A Active JP7446985B2 (ja) | 2020-12-15 | 2020-12-15 | 学習方法、プログラム及び画像処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220188571A1 (ja) |
JP (1) | JP7446985B2 (ja) |
CN (1) | CN114638354A (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016102733A (ja) | 2014-11-28 | 2016-06-02 | 株式会社東芝 | レンズ及び撮影装置 |
JP2019008460A (ja) | 2017-06-22 | 2019-01-17 | 株式会社東芝 | 物体検出装置、物体検出方法およびプログラム |
WO2019073814A1 (ja) | 2017-10-13 | 2019-04-18 | ソニー株式会社 | 焦点検出装置および方法、並びにプログラム |
JP2019124537A (ja) | 2018-01-15 | 2019-07-25 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム、並びに、車両の運転支援システム |
JP2020026990A (ja) | 2018-08-10 | 2020-02-20 | 株式会社東芝 | 画像処理装置 |
JP2020148483A (ja) | 2019-03-11 | 2020-09-17 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5837463B2 (ja) * | 2012-07-06 | 2015-12-24 | 株式会社東芝 | 画像処理装置および画像処理システム |
JP2021168048A (ja) * | 2020-04-10 | 2021-10-21 | キヤノン株式会社 | 画像処理方法、画像処理装置、画像処理システム、およびプログラム |
JP7467368B2 (ja) * | 2021-02-25 | 2024-04-15 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
JP7451465B2 (ja) * | 2021-07-29 | 2024-03-18 | 株式会社東芝 | 学習方法、プログラム及び画像処理装置 |
-
2020
- 2020-12-15 JP JP2020207634A patent/JP7446985B2/ja active Active
-
2021
- 2021-09-07 US US17/467,720 patent/US20220188571A1/en active Pending
- 2021-09-07 CN CN202111042419.XA patent/CN114638354A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016102733A (ja) | 2014-11-28 | 2016-06-02 | 株式会社東芝 | レンズ及び撮影装置 |
JP2019008460A (ja) | 2017-06-22 | 2019-01-17 | 株式会社東芝 | 物体検出装置、物体検出方法およびプログラム |
WO2019073814A1 (ja) | 2017-10-13 | 2019-04-18 | ソニー株式会社 | 焦点検出装置および方法、並びにプログラム |
JP2019124537A (ja) | 2018-01-15 | 2019-07-25 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム、並びに、車両の運転支援システム |
JP2020026990A (ja) | 2018-08-10 | 2020-02-20 | 株式会社東芝 | 画像処理装置 |
JP2020148483A (ja) | 2019-03-11 | 2020-09-17 | 株式会社東芝 | 画像処理装置、測距装置、方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
今井 拓司,東芝が単眼カメラの収差からステレオ並み距離画像レンズの色収差などから深層学習で形状推定,NIKKEI Robotics,日本,日経BP,2020年02月10日,2020.03,P.10-15 |
Also Published As
Publication number | Publication date |
---|---|
CN114638354A (zh) | 2022-06-17 |
US20220188571A1 (en) | 2022-06-16 |
JP2022094636A (ja) | 2022-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200302640A1 (en) | Eye tracking method and system | |
US20170132785A1 (en) | Method and system for evaluating the quality of a surgical procedure from in-vivo video | |
US9344690B2 (en) | Image demosaicing | |
JP4906034B2 (ja) | 撮影装置および方法並びにプログラム | |
JP7370922B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
KR20210140763A (ko) | 시선 방향 결정 방법, 장치, 전자 장치 및 저장 매체 | |
US11210560B2 (en) | Multi-modal dense correspondence imaging system | |
JP7379299B2 (ja) | 位置姿勢推定装置、位置姿勢推定方法及びプログラム | |
WO2022213552A1 (en) | Systems and methods for helmet detection | |
JP7176616B2 (ja) | 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム | |
JP7451465B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
JP5591090B2 (ja) | 画像処理装置およびその方法 | |
JP2019074777A (ja) | 画像処理方法、画像処理装置、および撮像装置 | |
JP7204586B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
JP7446985B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
US20220165055A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2023035612A (ja) | 推定装置、方法及びプログラム | |
JP7482070B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
US9210386B2 (en) | Filter setup learning for binary sensor | |
JP2019212132A (ja) | 画像処理方法、画像処理装置、撮像装置、プログラム、および、記憶媒体 | |
JP7009219B2 (ja) | 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体 | |
JP7239002B2 (ja) | 物体数推定装置、制御方法、及びプログラム | |
JP4741804B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2019139694A (ja) | 画像処理方法、画像処理装置、撮像装置、画像処理プログラム、および、記憶媒体 | |
JP6292613B2 (ja) | 背景抽出装置、主成分分析装置及び主成分分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240228 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7446985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |