JP2024013652A - 画像処理方法、画像処理装置、プログラム - Google Patents
画像処理方法、画像処理装置、プログラム Download PDFInfo
- Publication number
- JP2024013652A JP2024013652A JP2022115905A JP2022115905A JP2024013652A JP 2024013652 A JP2024013652 A JP 2024013652A JP 2022115905 A JP2022115905 A JP 2022115905A JP 2022115905 A JP2022115905 A JP 2022115905A JP 2024013652 A JP2024013652 A JP 2024013652A
- Authority
- JP
- Japan
- Prior art keywords
- image
- deformation
- amount
- information regarding
- optical system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 84
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 230000009466 transformation Effects 0.000 claims abstract description 96
- 230000003287 optical effect Effects 0.000 claims abstract description 95
- 238000010801 machine learning Methods 0.000 claims abstract description 47
- 238000004519 manufacturing process Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 100
- 238000000034 method Methods 0.000 claims description 90
- 238000003384 imaging method Methods 0.000 claims description 34
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 230000006866 deterioration Effects 0.000 abstract description 16
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000007423 decrease Effects 0.000 description 9
- 230000004075 alteration Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 6
- 239000011295 pitch Substances 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/18—Image warping, e.g. rearranging pixels individually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
Abstract
【課題】機械学習モデルを用いて、幾何変換による画質の低下を高精度に補正することができる画像処理方法、画像処理装置、画像処理システム、プログラム及び記憶媒体並びに学習装置及び学習済みモデルの製造方法を提供する。【解決手段】画像処理方法は、光学系に関する情報21及び第1の画像22に幾何変換を施すことで得られた第2の画像23を取得するステップと、幾何変換における第1の画像の変形量に関する情報24を取得するステップと、第2の画像23と変形量に関する情報24とを機械学習モデルに入力し、第3の画像25を生成するステップと、を有する。【選択図】図1
Description
本発明は、画像に幾何変換を施すことによる画質の低下を補正する技術に関する。
魚眼レンズを用いて被写体を撮影することで、広範囲で鮮明な画像を取得することができる。しかし、魚眼レンズを用いて取得された画像は端になるほど大きく歪曲する。そのため、魚眼レンズを用いて取得された画像は、幾何変換によって歪曲を補正する必要がある。幾何変換における画像の変形量(補正量)が多い領域ほど、幾何変換を施された画像の画質は大きく低下する。
非特許文献1には、機械学習モデルを用いて、画像に幾何変換を施すことによる画質の低下を補正する方法が開示されている。
Y.Zhang et al.,Toward Real-world Panoramic Image Enhancement,2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops(CVPRW),2020,pp.2675-2684.
しかしながら、非特許文献1に開示された方法では、画像に施された幾何変換に関わらず、画素ごとに一定の変形量にて画質の低下を補正する。したがって、画像に施された幾何変換によっては、補正不足や過剰補正に陥るおそれがある。
そこで本発明は、機械学習モデルを用いて、画像に幾何変換を施すことによる画質の低下を高精度に補正することを目的とする。
本発明の一側面としての画像処理方法は、第1の画像に幾何変換を施された第2の画像を取得するステップと、幾何変換における第1の画像の変形量に関する情報を取得するステップとを有する。さらに、第2の画像と変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成するステップと有する。
本発明によれば、機械学習モデルを用いて、幾何変換による画質の低下を高精度に補正するこができる。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。各図において、同一の部材については同一の参照符号を付し、重複する説明は省略する。
まず、実施例の具体的な説明を行う前に、本実施形態の要旨を説明する。本実施形態では、原画像(第1の画像)に幾何変換を施すことで生成された画像(第2の画像)と幾何変換における第1の画像の変形量に関する情報とを機械学習モデルに入力し、推定画像(第3の画像)を生成する。
本実施形態に係る幾何変換は、例えば第1の画像を取得する際に用いた撮像装置における光学系の特性によって生じる歪曲収差や色収差を低減するために行われる。さらに、幾何変換は中心射影方式とは異なる射影方式を採用し、被写体を歪ませて広い範囲を結像する光学系(例えば魚眼レンズ)を用いて取得した画像を表示する際に、原画像と互いに異なる射影方式若しくは表示方法にて表される画像にするために行われてもよい。幾何変換によって得られる画像の射影方式は、等距離射影方式、等立体角射影方式、正射影方式、立体射影方式、中心射影方式などを含む。幾何変換によって得られる画像の表示方法は方位図法、円筒図法、円錐図法などを含む。
本実施形態における幾何変換による画質の低下は、解像度の低下又は折り返し雑音の発生によるものである。解像度の低下は、ナイキスト周波数に対して周波数成分の相対的な低周波側へのシフトによって起こる。一方で、折り返し雑音は、ナイキスト周波数に対して相対的に高い周波数成分が低周波側に折り返されること(エイリアシング)によって、元々の被写体にはない偽構造が画像に生じることである。画像における周波数成分は、幾何変換における画像の変形量によって変化するため、折り返し雑音は変形量に基づいて理論値(計算値)を求めることができる。
本実施形態において画像の変形量に関する情報は、幾何変換前後の画像の対応する形状(線分又は面積)の比率(拡大率又は縮小率)で表される。ただし、変形量に関する情報はこれに限定されない。例えば、第1の画像内の一点から第1の画像の一点に対応する第2の画像の一点までの移動量で表されてもよい。画像の変形量は、幾何変換の方法によって画像内における位置によってそれぞれ異なる場合がある。このとき、幾何変換による画質の低下も画像内における位置によってそれぞれ異なる。なお、画像における画素とは、画像を取得する際に用いた撮像装置における撮像素子の1画素に対応する画像の領域のことである。さらに、変形量に関する情報は、第1の画像において異なる複数の領域又は画素ごとの変形量を有していてもよい。
第1の画像に施された幾何変換における第1の画像の変形量に関する情報と第2の画像とを機械学習モデルに入力することによって、機械学習モデルに第2の画像の画素ごとの画質の低下に応じた補正処理を行わせることができる。したがって、幾何変換による補正不足や過剰補正を低減することができるため、第2の画像における幾何変換による画質の低下を高精度に補正することが可能となる。
本実施形態において機械学習モデルは、ニューラルネットワークを用いた学習を行うことで生成される。機械学習モデルは、遺伝的プログラミング、ベイジアンネットワークなどで学習されてもよい。なお、ニューラルネットワークとして、CNN(Convolutional Neural Network)、GAN(Generative Adversarial Network)、RNN(Recurrent Neural Network)などを採用できる。ニューラルネットワークでは、画像に対して畳み込むフィルタ及び足し合わせるバイアス、非線形変換を行う活性化関数を用いる。フィルタ及びバイアスは、ウエイトと呼ばれ訓練画像及び正解画像を用いて更新(学習)される。本実施形態ではこの工程を学習フェーズと呼ぶ。また、本実施形態における画像処理方法は、幾何変換により生成された画像と上述した変形量に関する情報とを機械学習モデルに入力し、画像に幾何変換を施すことによる画質の低下(解像感の劣化)を補正した推定画像を出力する処理を行う。本実施形態ではこの工程を推定フェーズと呼ぶ。なお、上記の画像処理方法は一例であり、本発明はこれに限定されるものではない。その他の画像処理方法などの詳細は以下の実施例に述べる。
[実施例1]
図2及び図3を参照して、実施例1に係る画像処理システム100に関して説明する。本実施例では、機械学習モデルに幾何変換による画質の低下を補正する処理を学習、実行させる。図2は、本実施例における画像処理システム100のブロック図である。図3は、画像処理システム100の外観図である。画像処理システム100は、学習装置101、撮像装置102を有し、学習装置101と撮像装置102は、互いに有線又は無線のネットワーク103で接続されている。
図2及び図3を参照して、実施例1に係る画像処理システム100に関して説明する。本実施例では、機械学習モデルに幾何変換による画質の低下を補正する処理を学習、実行させる。図2は、本実施例における画像処理システム100のブロック図である。図3は、画像処理システム100の外観図である。画像処理システム100は、学習装置101、撮像装置102を有し、学習装置101と撮像装置102は、互いに有線又は無線のネットワーク103で接続されている。
学習装置101は、記憶部111、取得部112、生成部113、及び更新部114を有し、機械学習モデルのウエイトを決定する。
撮像装置102は、光学系121、撮像素子122、画像推定部123、記憶部124、記録媒体125、表示部126及びシステムコントローラ127を有する。光学系121は、被写体空間から入射した光を集光し、被写体像を生成する。光学系121は、必要に応じて、ズーム、絞り調節及びオートフォーカスなどの機能を有する。本実施例において、光学系121は歪曲収差を有することを前提とする。撮像素子122は、光学系121により生成された被写体像を電気信号に変換し、原画像を生成する。撮像素子122は、例えば、CCD(Charge Coupled Device)センサや、CMOS(Complementary Metal-Oxide Semiconductor)センサなどである。
画像推定部123は、取得部123a、演算部123b、推定部123cを有する。画像推定部123は、原画像を取得し、幾何変換により入力画像を生成する。さらに、機械学習モデルを用いて推定画像を生成する。幾何変換による画質の低下は、多層のニューラルネットワークを用いて補正される。多層のニューラルネットワークにおけるウエイトの情報は学習装置101で生成されたものであり、撮像装置102は、事前にネットワーク103を介して記憶部111からウエイトの情報を読み出し、記憶部124に保存している。保存されるウエイトの情報は、ウエイトの数値そのものでもよいし、符号化された形式でもよい。ウエイトの更新及びウエイトを用いた推定画像の生成に関する詳細は、後述する。画像推定部123は、必要に応じて現像処理やその他の画像処理を行うことで、出力画像を生成する機能を有する。なお、推定画像を出力画像としてもよい。画像推定部123として撮像装置102内のプロセッサ、外部の装置若しくは別の記憶媒体を用いることができる。
記録媒体125は、出力画像を記録する。表示部126は、ユーザから出力画像の出力に関する指示がなされた場合、出力画像を表示する。以上の動作は、システムコントローラ127にて制御される。
次に、図4及び図5を参照して、本実施例における学習装置101により実行されるウエイト(ウエイトの情報)の更新方法(学習済みモデルの製造方法)に関して説明する。図4は、学習フェーズの流れを示す図である。図5は、ウエイトの更新に関するフローチャートである。図5の各ステップは、主に、取得部112、生成部113、及び更新部114にて実施される。
まず、ステップS101において、正解パッチ、訓練パッチ及び変形量パッチ変形量パッチを取得する。正解パッチ、訓練パッチ及び変形量パッチは、生成部113によって生成される。パッチとは既定の画素数(例えば、64×64画素など)を有する画像を指す。なお、正解パッチ、訓練パッチ及び変形量パッチの生成に関しては後述する。
続いて、ステップS102において、生成部113は訓練パッチと変形量パッチを多層のニューラルネットワークへ入力し、推定パッチを生成する。推定パッチは、訓練パッチから機械学習モデルによって得られた画像であり、理想的には正解パッチと一致する。畳み込み層CN及び逆畳み込み層DCは、入力とフィルタの畳み込み、及びバイアスとの和が算出され、その結果を活性化関数によって処理を行う。フィルタの各成分とバイアスの初期値は任意であり、本実施例では乱数によって決定する。活性化関数は、例えばReLU(Rectified Linear Unit)やシグモイド関数などを使うことができる。最終層を除く各層の出力は、特徴マップと呼ばれる。スキップコネクション32、33は、連続していない層から出力された特徴マップを合成する。特徴マップの合成は要素ごとの和をとってもよいし、チャンネル方向に連結(concatenation)してもよい。本実施例では要素ごとの和を採用する。スキップコネクション31は、訓練パッチと正解パッチとの推定された残差と、訓練パッチとの和を取り、推定パッチを生成する。なお、本実施例では図4に示されるニューラルネットワークの構成を使用するが、本発明はこれに限定されるものではない。
続いて、ステップS103において、更新部114は推定パッチと正解パッチの誤差に基づいて、ニューラルネットワークのウエイトを更新する。本実施例では、ウエイトは、各層のフィルタの成分とバイアスを含む。ウエイトの更新には誤差逆伝搬法(Backpropagation)を使用するが、本発明はこれに限定されるものではない。ミニバッチ学習の場合、複数の正解パッチとそれらに対応する複数の推定パッチのそれぞれの誤差を求め、ウエイトを更新する。誤差関数(Loss function)には、例えばL2ノルムやL1ノルムなどを用いればよい。ただし本発明は、これに限定されるものではなく、オンライン学習又はバッチ学習を用いてもよい。
続いて、ステップS104において、更新部114はウエイトの更新が完了したか否かを判定する。更新の完了は、ウエイトの更新の反復回数が所定の回数に達したかや、更新時のウエイトの変化量が所定値より小さいかなどで判定することができる。ウエイトの更新が完了していないと判定された場合、ステップS101へ戻り、取得部112は、1組以上の新たな正解パッチ、訓練パッチ及び変形量パッチを取得する。一方、ウエイトの更新が完了したと判定された場合、更新部114は学習を終了し、ウエイトの情報を記憶部111に記憶する。
次に、学習データの生成方法に関して説明する。学習データは、正解パッチ、訓練パッチ及び変形量パッチであり、主に生成部113によって生成される。
まず、生成部113は記憶部111から正解画像10と、第1の訓練画像12と、第1の訓練画像12に対応する光学系に関する情報11とを取得する。
正解画像10は複数の画像であり、撮像装置102によって取得された画像でもよいし、CG(Computer Graphics)画像でもよい。なお、正解画像10はグレースケールで表現されていても、複数のチャンネル成分を有してもよい。また、正解画像10を様々な被写体を撮像して得られた画像とすることで、多様な被写体に対して機械学習モデルのロバスト性を向上させることができる。例えば、様々な強度と方向を有するエッジ、テクスチャ、グラデーション、平坦部などを有する画像とするとよい。なお、必要に応じて正解画像10に対応する光学系に関する情報を記憶部111に記憶していてもよい。
本実施例において光学系に関する情報11は、第1の訓練画像12を取得するために用いた光学系が有する歪曲収差についての情報であり、光学系の理想像高と実像高の関係を表すルックアップテーブルとして、記憶部124に記憶されている。理想像高とは無収差の場合に結像する像高、実像高とは歪曲収差を加味した場合に実際に結像する像高である。また、ルックアップテーブルは、撮像条件ごとに生成されている。撮像条件は、例えば焦点距離、F値、及び被写体距離などである。歪曲収差D[%]は、理想像高rと実像高r’を用いて以下の式(1)で表される。
D=(r’-r)/r・100…(1)
ただし、光学系に関する情報11は、光学系の理想像高と実像高の関係を表すルックアップテーブルに限定されず、光学系の歪曲収差量として記憶されていてもよい。例えば、理想像高と歪曲収差量の関係又は実像高と歪曲収差量の関係を表すルックアップテーブルでもよい。
D=(r’-r)/r・100…(1)
ただし、光学系に関する情報11は、光学系の理想像高と実像高の関係を表すルックアップテーブルに限定されず、光学系の歪曲収差量として記憶されていてもよい。例えば、理想像高と歪曲収差量の関係又は実像高と歪曲収差量の関係を表すルックアップテーブルでもよい。
本実施例において第1の訓練画像12は、正解画像10と同一の被写体を撮像して得られた画像であり、光学系に由来する歪曲収差を有している。なお、第1の訓練画像12は、正解画像10と正解画像10に対応する光学系に関する情報に基づいて幾何変換を施すことで、生成された画像を用いてもよい。
また、正解画像10に幾何変換を施す前に、第1の訓練画像12に発生する折り返し雑音を低減するための処理を行ってもよい(アンチエイリアス)。正解画像10に変形量に応じたアンチエイリアスを行うことで、第1の訓練画像12に発生する折り返し雑音を所望の水準に低減できる。
続いて、第2の訓練画像13及び幾何変換における第1の訓練画像12の変形量(第1の変形量)に関する情報14を生成する。第2の訓練画像13及び変形量に関する情報14は、光学系に関する情報11及び第1の訓練画像12から算出される。
第2の訓練画像13は、光学系に関する情報11に基づいて、第1の訓練画像12に幾何変換を施すことで得られる画像である。また、第2の訓練画像13は、必要に応じて補間処理をされていてもよい。なお、補間の方法は、nearest neighbor補間、bilinear補間、bicubic補間など公知の補間方法を用いることができる。さらに、光軸が変換前後の各画像中心と一致しない場合は、光軸から各画像中心へのシフト量を考慮する必要がある。また、第2の訓練画像13は、未現像のRAW画像であってもよい。第2の訓練画像13及び正解画像10にそれぞれRAW画像及び現像画像を用いて学習を行った場合、生成された機械学習モデルは、幾何変換による画質の低下の補正に加え、現像処理をすることができる。なお、現像処理は、RAW画像をJPEG(Joint Photographic Experts Group)やTIFF(Tag Image File Format)などの画像ファイルに変換する処理である。
変形量に関する情報14は、スカラー値や二次元マップ(特徴マップ)で表される情報であり、第1の訓練画像12及び第2の訓練画像13内の対応する形状の変形量を示している。なお、第1の訓練画像12及び第2の訓練画像13内の対応する形状の変形量は、位置ごとに複数取得されてもよい。形状は、例えば第1の訓練画像12及び第2の訓練画像13の対応する二点の間(線分)の距離や対応する領域の面積である。また、変形量を比率で表す場合、例えば拡大されるほど値が大きく縮小されるほど値が小さくなる拡大率や、拡大されるほど値が小さく縮小されるほど値が大きくなる縮小率で表すことができる。また、画像の変形量は、幾何変換前後の画像の対応する形状の差(変化量)を用いて表されてもよい。さらに、画像の変形量は、第1の画像22の一点から第1の画像22の一点に対応する第2の画像の一点までの移動量を用いて表されてもよい。
本実施例において変形量に関する情報14は、それぞれ異なる方向における変形量を示す2種類以上の二次元マップである。本実施例における変形量に関する情報14は、それぞれ画素の配列方向である水平方向及び垂直方向に対応する2種類の二次元マップで表される。水平方向の変形量は、第2の訓練画像13内における水平方向の任意の二点の間の距離と、第2の訓練画像13内における水平方向の任意の二点の間の距離に対応する第1の訓練画像12内における二点の間の距離とを用いて算出される値である。水平方向の二次元マップは、第1の訓練画像12及び第2の訓練画像13の異なる任意の二点の間の距離に基づいて複数の変形量を求めることで生成される。また、垂直方向の二次元マップについても、同様にして生成することができる。第1の訓練画像12及び第2の訓練画像13の異なる位置における変形量を多く含む二次元マップとすることで、画質の低下を高精度に補正可能なニューラルネットワークを生成することができる。
なお、水平方向及び垂直方向における変形量を示す2種類の二次元マップの例を示したが、互いに異なる複数の方向における変形量であればよい。例えば水平方向から45度及び135度傾けた方向の二方向や、同心円方向と放射方向の二方向であってもよい。なお、変形量に関する情報14は、画像の一部の領域について変形量を算出したものや、その一部の領域の変形量から補間などによって第2の訓練画像13の対応する全ての画素の変形量を算出したものを用いてもよい。また、変形量に関する情報14は正規化処理を施されてもよい。
また、第1の訓練画像12及び光学系に関する情報11から複数組の第2の訓練画像13及び変形量に関する情報14が抽出されてもよい。変形量に関する情報14が示す変形量に応じて、抽出するパッチの枚数に偏りがあってもよい。例えば、変形量が大きい領域からより多くのパッチを抽出することで、画質の低下の補正効果が高いウエイトを更新することができる。
なお、第2の訓練画像13及び正解画像10の関係について、第2の訓練画像13及び正解画像10は同一の被写体を含む領域であれば、第2の訓練画像13のサンプリングピッチと正解画像10のサンプリングピッチはそれぞれ異なっていてもよい。例えば正解画像10と、正解画像10に対してサンプリングピッチが小さい第2の訓練画像13とを組み合わせて学習データに用いることで、幾何変換における画質の低下の補正に加え、アップスケール処理を実施可能な機械学習モデルを生成することができる。なお、アップスケール処理は、推定フェーズにおいて出力画像のサンプリングピッチを入力画像のサンプリングピッチより小さくする処理である。
最後に、正解パッチ、訓練パッチ及び変形量パッチを生成する。正解パッチ、訓練パッチ及び変形量パッチは、それぞれ正解画像10、第2の訓練画像13及び変形量に関する情報14から同じ被写体を示す領域から既定の画素数の画像を抽出することで生成される。なお、正解画像10、第2の訓練画像13及び変形量に関する情報14をそれぞれ正解パッチ、訓練パッチ及び変形量パッチとしてもよい。また、本実施例における変形量パッチはパッチ内の位置により異なる画素値を有するが、パッチ内での画素値は同じであってもよい。例えば、本実施例における変形量パッチ内での画素値の平均値や中心位置での画素値を全画素で持つパッチを用いてもよい。また、変形量パッチの代わりに、パッチ内での画素値の平均値や中心位置での画素値をスカラー値として用いて学習を行ってもよい。
さらに、学習データの生成には、撮像装置102よって取得された画像を使用してもよい。このとき、取得された画像を第1の訓練画像12として用いることで、第2の訓練画像13を生成することができる。このとき正解画像10は、光学系121に比べ歪曲収差が少ない光学系を用いて、第1の訓練画像12と同一の被写体を撮像することで得られる。
次に、図1と図6を参照して、学習済みの機械学習モデルを用いた画像処理方法(推定フェーズ)に関して詳細に述べる。図1は、推定フェーズの流れを示す図。図6は、本実施例における推定フェーズに関するフローチャートである。図6の各ステップは、画像推定部123における取得部123a、演算部123b、もしくは、推定部123cにて実施される。
まず、ステップS201において、取得部123aは光学系に関する情報21、第1の画像22、及びウエイトの情報を取得する。光学系に関する情報21は、記憶部124にあらかじめ記憶されており、取得部123aは撮像条件に対応する光学系に関する情報21を取得する。なお、ウエイトの情報はあらかじめ記憶部111から読み出され、記憶部124に記憶されている。光学系に関する情報21は、学習フェーズにおける光学系に関する情報11に相当する。また、第1の画像22は、学習フェーズにおける第1の訓練画像12に相当する。
続いて、ステップS202において、演算部123bは光学系に関する情報21及び第1の画像22から第2の画像23を生成する。本実施例おいて第2の画像23は、光学系121によって第1の画像22に生じた歪曲収差を低減するために、第1の画像22に幾何変換を施すことによって生成された画像である。
第2の画像23は、学習フェーズにおける第2の訓練画像に相当し、光学系に関する情報21に基づいて第1の画像22に幾何変換を施すことで得られる画像である。また、第2の画像23は必要に応じて補間処理をされていてもよい。
続いて、ステップS203において、演算部123bは光学系に関する情報21及び第1の画像22を用いて、幾何変換における第1の画像22の変形量(第2の変形量)に関する情報24を生成する。変形量に関する情報24は、ステップS202において第2の画像23を生成する際の変形量を表す。本実施例における変形量に関する情報24は、2種類の二次元マップであり、それぞれ水平方向又は垂直方向の変形量を示す。ここで図7を参照して本実施例における変形量に関する情報24について説明する。図7(A)は第1の画像22の例、図7(B)は第2の画像23の例である。図7(C)は、第1の画像22から第2の画像23を生成した際の水平方向の変形量を示す二次元マップである。図7(D)は、第1の画像22から第2の画像23を生成した際の垂直方向の変形量を示す二次元マップである。本実施例において、図7(C)及び図7(D)に示す2種類の二次元マップが変形量に関する情報24である。変形量に関する情報24の生成方法は、変形量に関する情報14と同様である。なお、本実施例におけるステップS202及びステップS203は、同時に処理されてもよい。
なお、変形量に関する情報24は、ステップS202において複数の第1の画像22と、複数の第1の画像22に対応する複数の光学系に関する情報21とを用いて、複数の第2の画像23を生成する場合、複数の変形量に関する情報24を取得することができる。このとき複数の第1の画像22は、それぞれ幾何変換によって歪曲収差の補正をされる。
また、画像推定部123は、撮像装置102とは異なる画像処理装置に含まれていてもよい。その場合、取得部123aが取得する画像は第1の画像22ではなく第2の画像23に相当する画像でもよい。つまり、あらかじめ画像推定部123とは異なる画像処理装置でステップS202を実施し、光学系に関する情報21及び第1の画像22から第2の画像23を生成してもよい。
続いて、ステップS204において、推定部123cは第2の画像23と変形量に関する情報24を機械学習モデルに入力することで、推定画像(第3の画像)25を生成する。第3の画像25は、第2の画像23から幾何変換による画質の低下が補正された画像である。
以上のように、本実施例によれば、幾何変換によって歪曲収差が低減された第2の画像23における幾何変換による画質の低下を、機械学習モデルを用いて高精度に補正することが可能な画像処理システムを提供することができる。
[実施例2]
次に、図8及び図9を参照して、実施例2に係る画像処理システム200に関して説明する。本実施例では、機械学習モデルに幾何変換による画質の低下を補正する処理を学習、実行させる。本実施例の画像処理システム200は、撮像装置202から原画像を取得し、画像推定装置203が画像処理する点で、実施例1と異なる。図8は、本実施例における画像処理システム200のブロック図である。図9は、画像処理システム200の外観図である。画像処理システム200は、学習装置201、撮像装置202、画像推定装置203、表示装置204、記憶媒体205、出力装置206及びネットワーク207を有する。
次に、図8及び図9を参照して、実施例2に係る画像処理システム200に関して説明する。本実施例では、機械学習モデルに幾何変換による画質の低下を補正する処理を学習、実行させる。本実施例の画像処理システム200は、撮像装置202から原画像を取得し、画像推定装置203が画像処理する点で、実施例1と異なる。図8は、本実施例における画像処理システム200のブロック図である。図9は、画像処理システム200の外観図である。画像処理システム200は、学習装置201、撮像装置202、画像推定装置203、表示装置204、記憶媒体205、出力装置206及びネットワーク207を有する。
学習装置201は、記憶部201a、取得部201b、生成部201c及び更新部201dを有し、機械学習モデルのウエイトを決定する。
撮像装置202は、光学系202aと撮像素子202bを有し、第1の画像22を取得する。光学系202aは、被写体空間から入射した光を集光し、被写体像を生成する。撮像素子202bは、光学系202aにより生成された被写体像を電気信号に変換し、第1の画像22を生成する。なお、本実施例における光学系202aは、等立体角射影方式を採用する魚眼レンズを有し、第1の画像22の被写体は等立体角射影方式に応じた歪曲を有している。なお、光学系202aはこれに限定されず任意の射影方式を採用した光学系を用いてもよい。
画像推定装置203は、記憶部203a、取得部203b、生成部203c及び推定部203dを有する。画像推定装置203は、機械学習モデルを用いて推定画像を生成する。以下、本実施例における幾何変換は、等立体角射影方式(第1の射影方式)で表される第1の画像22から中心射影方式(第2の射影方式)で表される第2の画像23への変換である。なお、本実施例はこれに限定されず、任意の射影方式又は表現方法で表される画像を用いてもよい。幾何変換による画質の低下を補正は、機械学習モデルを用いて行われ、機械学習モデルのウエイトの情報は、学習装置201で生成されたものである。画像推定装置203は、ネットワーク207を介して記憶部201aからウエイトの情報を読み出し、記憶部203aに保存している。なお、学習装置201が行うウエイトの更新は、実施例1の学習装置101と同様のため、説明を省略する。また、学習データの生成方法及びウエイトを用いた画像処理に関しての詳細は、後述する。なお、画像推定装置203は、必要に応じて現像処理やその他の画像処理を行うことで、出力画像を生成する機能を有していてもよい。
画像推定装置203にて生成された出力画像は、表示装置204、記憶媒体205又は出力装置206の少なくとも1つに出力される。表示装置204は、例えば液晶ディスプレイやプロジェクタなどである。表示装置204を介して、ユーザが処理途中の画像を確認しながら編集作業などを行えるようにしてもよい。記憶媒体205は、例えば半導体メモリ、ハードディスク、ネットワーク上のサーバなどであり、出力画像を保存する。出力装置206は、例えばプリンタなどである。
記録媒体125は、出力画像を記録する。表示部126は、ユーザから出力画像の出力に関する指示がなされた場合、出力画像を表示する。以上の動作は、システムコントローラ127にて制御される。
次に、学習データの生成方法に関して説明する。学習データは、正解パッチ、訓練パッチ及び変形量パッチであり、主に生成部201cによって生成される。
まず、取得部201bは記憶部201aから正解画像10及び正解画像10に対応する光学系に関する情報11を取得する。本実施例において正解画像10は中心射影方式を採用する光学系にて取得された画像である。
本実施例において光学系に関する情報11は、各画像を取得するために用いた光学系が採用している射影方式についての情報を有する。射影方式は、それぞれ焦点距離fの光学系が光軸からの角度θに存在する被写体を二次元平面上に表現する方法を、光学系の像高rを用いて表される。
等立体角射影方式は、被写体の立体角と二次元平面上の面積が比例することを特徴とする射影方式である。等立体角射影方式を採用する光学系は、以下の式(2)に従い被写体を二次元平面上に表現する。
r=2・f・sin(θ/2)…(2)
r=2・f・sin(θ/2)…(2)
また、中心射影方式を採用する光学系は、以下の式(3)に従い被写体を二次元平面上に表現する。
r=f・tanθ…(3)
r=f・tanθ…(3)
なお、光学系に関する情報11は、被写体の光軸からの角度と光学系の像高の関係に限らず、被写体の位置とその被写体が表現される二次元平面上の位置を対応づけられるものであればよい。
続いて、第1の訓練画像12を生成する。本実施例において第1の訓練画像12は、正解画像10と同一の被写体を撮像して得られた画像であり、等立体角射影方式を採用する光学系にて取得された画像である。なお、第1の訓練画像12の射影方式はこれに限定されない。
続いて、第2の訓練画像13及び変形量に関する情報14を生成する。第2の訓練画像13及び変形量に関する情報14は、光学系に関する情報11及び第1の訓練画像12から算出される。第2の訓練画像13は、等立体角射影方式で表現された第1の訓練画像12に幾何変換を施すことで生成される画像であり、中心射影方式で表されている。また、第2の訓練画像13は必要に応じて補間処理をされていてもよい。なお、第2の訓練画像13はこれに限定されず、少なくとも正解画像10と同様の射影方式で表されていればよい。
変形量に関する情報14は、実施例1と同様の方法で生成される。また、正解パッチ、訓練パッチ、及び変形量パッチは、実施例1と同様の方法で生成される。
次に、図1と図10を参照して、学習済みの機械学習モデルを用いた画像処理方法に関して詳細に述べる。図10は、本実施例における推定フェーズに関するフローチャートである。図10の各ステップは、取得部203b、生成部203c及び推定部203dによって実施される。
まず、ステップS301において、取得部203bは光学系に関する情報21、第1の画像22、及びウエイトの情報を取得する。本実施例において光学系に関する情報21は、第1の画像22を取得するために用いた光学系が採用している射影方式についての情報を有する。ウエイトの情報はあらかじめ記憶部201aから読み出され、記憶部203aに記憶されている。
続いて、ステップS302において、生成部203cは光学系に関する情報21及び第1の画像22を用いて、第2の画像23を生成(算出)する。第2の画像23は、等立体角射影方式で表現された第1の画像22に幾何変換を施すことで生成される画像であり、中心射影方式で表されている。また、第2の画像23は必要に応じて補間処理をされていてもよい。
続いて、ステップS303において、生成部203cは光学系に関する情報21及び第1の画像22を用いて、変形量に関する情報24を生成する。本実施例における変形量に関する情報24は、等立体角射影方式から中心射影方式への変換(幾何変換)に伴う水平方向及び垂直方向の変形量を示す2種類の二次元マップである。ここで図11を参照して変形量に関する情報24について説明する。図11(A)は、等立体角射影方式で表現された第1の画像22の例である。図11(B)は、中心射影方式で表現された第2の画像23の例である。図11(C)は、第1の画像22から第2の画像23を生成した際の水平方向の変形量を示す二次元マップである。図11(D)は、第1の画像22から第2の画像23を生成した際の垂直方向の変形量を示す二次元マップである。本実施例において、図11(C)及び図11(D)に示す2種類の二次元マップが変形量に関する情報24である。変形量に関する情報24の生成方法は、変形量に関する情報14と同様である。なお、本実施例におけるステップS302及びステップS303は、同時に処理されてもよい。
続いて、ステップS304において、推定部203dは第2の画像23と変形量に関する情報24とを機械学習モデルに入力することで、第3の画像25を生成する。第3の画像25は、第2の画像23における幾何変換による画質の低下が補正された画像である。
以上のように、本実施例によれば、幾何変換によって射影方式を変換された第2の画像23における幾何変換による画質の低下を、機械学習モデルを用いて高精度に補正することが可能な画像処理システムを提供することができる。
[実施例3]
次に、図12及び図13を参照して、実施例3に係る画像処理システム300に関して説明する。本実施例では、機械学習モデルに幾何変換による画質の低下を補正する処理を学習、実行させる。
次に、図12及び図13を参照して、実施例3に係る画像処理システム300に関して説明する。本実施例では、機械学習モデルに幾何変換による画質の低下を補正する処理を学習、実行させる。
本実施例の画像処理システム300は、撮像装置302から光学系に関する情報21及び第1の画像22を取得し、画像推定装置(画像処理装置)303に第1の画像22に対する画像処理に関する要求を行う制御装置304を有する点で実施例1と異なる。
図12は、本実施例における画像処理システム300のブロック図である。画像処理システム300は、学習装置301、撮像装置302、画像推定装置303、制御装置304を有する。本実施例において学習装置301及び画像推定装置303はサーバでもよい。制御装置304は、例えばパーソナルコンピュータ若しくはスマートフォンのようなユーザ端末である。制御装置304はネットワーク305を介して画像推定装置303に接続されている。画像推定装置303はネットワーク306を介して学習装置301に接続されている。つまり、制御装置304及び画像推定装置303並びに画像推定装置303及び学習装置301は互いに通信可能に構成されている。
画像処理システム300における学習装置301及び撮像装置302は、それぞれ学習装置201及び撮像装置202と同様の構成のため説明を省略する。
画像推定装置303は、記憶部303a、取得部(取得手段)303b、生成部(生成手段)303c、推定部(推定手段)303d、通信部(受信手段)303eを有する。画像推定装置303における記憶部303a、取得部303b、生成部303c、推定部303dは、それぞれ記憶部203a、取得部203b、生成部203c、推定部203dと同様である。
制御装置304は、通信部(送信手段)304a、表示部(表示手段)304b、入力部(入力手段)304c、処理部(処理手段)304d、記録部304eを有する。通信部304aは、第1の画像22に対する処理を画像推定装置303に実行させるための要求を画像推定装置303に送信することができる。また、画像推定装置303によって処理された出力画像を受信することができる。なお、通信部304aは、撮像装置302と通信を行ってもよい。表示部304bは、種々の情報を表示する。表示部304bによって表示される種々の情報は、例えば第1の画像22、第2の画像23、若しくは画像推定装置303から受信した出力画像を含む。入力部304cは、ユーザから画像処理を開始する指示などを入力できる。処理部304dは、画像推定装置303から受信した出力画像に対して任意の画像処理を施すことができる。記録部304eは、撮像装置302から取得した光学系に関する情報21及び第1の画像22、画像推定装置303から受信した出力画像を保存する。
なお、処理対象である第1の画像22を画像推定装置303に送信する方法は問わず、例えば第1の画像22はS401と同時に画像推定装置303にアップロードされてもよいし、S401以前に画像推定装置303にアップロードされていてもよい。また、第1の画像22は画像推定装置303とは異なるサーバ上に保存された画像でもよい。
次に、本実施例における出力画像(推定画像)の生成に関して説明する。図13は、本実施例における推定フェーズに関するフローチャートである。
制御装置304の動作について説明する。本実施例における画像処理は、制御装置304を介してユーザにより画像処理開始の指示によって処理が開始される。
まず、ステップS401(第1の送信ステップ)において、通信部304aは第1の画像22に対する処理の要求を画像推定装置303へ送信する。なお、ステップS401において、制御装置304は第1の画像22に対する処理の要求と共に、ユーザを認証するIDや、第1の画像22に対応する撮影条件などを送信してもよい。
続いて、ステップS402(第1の受信ステップ)において、通信部304aは推定装置303によって生成された第3の画像25を受信する。
次に、画像推定装置303の動作について説明する。まずステップS501(第2の受信ステップ)において、通信部303eは通信部304aから送信された第1の画像22に対する処理の要求を受信する。画像推定装置303は、第1の画像22に対する処理が指示を受けることによって、ステップS502以降の処理を実行する。
続いてステップS502において、取得部303bは、光学系に関する情報21及び第1の画像22を取得する。本実施例において、光学系に関する情報21及び第1の画像22は、制御装置304から送信されたものである。なお、ステップS501及びステップS502の処理は同時に行われてもよい。また、ステップS503乃至S505は、ステップS202乃至S204と同様であるため、説明を省略する。
続いてステップS506(第2の送信ステップ)において、画像推定装置303は第3の画像25を制御装置304へ送信する。
以上のように、本実施例によれば、第2の画像23における幾何変換による画質の低下を、機械学習モデルを用いて高精度に補正することが可能な画像処理システムを提供することができる。なお、本実施例において制御装置304は特定の画像に対する処理を要求するのみである。実際の画像処理は画像推定装置303によって行われる。したがって、制御装置304をユーザ端末とすれば、ユーザ端末による処理負荷を低減することが可能となる。したがって、ユーザ側は低い処理負荷で出力画像を得ることが可能となる。
(その他の実施形態)
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。本発明における画像処理装置は本発明の画像処理機能を有する装置であればよく、撮像装置やPCの形態で実現され得る。
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。本発明における画像処理装置は本発明の画像処理機能を有する装置であればよく、撮像装置やPCの形態で実現され得る。
各実施例によれば、幾何変換を施された画像における幾何変換による画質の低下を、機械学習モデルを用いて高精度に補正することが可能な画像処理方法、画像処理システム、及びプログラムを提供することができる。
以上、本発明の好ましい実施例について説明したが、本発明はこれらの実施例に限定されず、その要旨の範囲内で様々な変形及び変更が可能である。
[方法1]
第1の画像に幾何変換を施すことで得られた第2の画像を取得するステップと、
前記幾何変換における前記第1の画像の変形量に関する情報を取得するステップと、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成するステップとを有することを特徴とする画像処理方法。
第1の画像に幾何変換を施すことで得られた第2の画像を取得するステップと、
前記幾何変換における前記第1の画像の変形量に関する情報を取得するステップと、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成するステップとを有することを特徴とする画像処理方法。
[方法2]
前記変形量に関する情報は、前記第1の画像内の二点の間の距離と前記第2の画像の前記二点に対応する二点の間の距離との比率を含む特徴とする方法1に記載の画像処理方法。
前記変形量に関する情報は、前記第1の画像内の二点の間の距離と前記第2の画像の前記二点に対応する二点の間の距離との比率を含む特徴とする方法1に記載の画像処理方法。
[方法3]
前記変形量に関する情報は、前記第1の画像内の領域の面積と前記第2の画像の前記領域に対応する領域の面積との比率を含む特徴とする方法1又は2の何れか一項に記載の画像処理方法。
前記変形量に関する情報は、前記第1の画像内の領域の面積と前記第2の画像の前記領域に対応する領域の面積との比率を含む特徴とする方法1又は2の何れか一項に記載の画像処理方法。
[方法4]
前記変形量に関する情報は、前記第1の画像の一点から前記第2の画像の前記一点に対応する一点までの移動量を含むことを特徴とする方法1乃至3の何れか一項に記載の画像処理方法。
前記変形量に関する情報は、前記第1の画像の一点から前記第2の画像の前記一点に対応する一点までの移動量を含むことを特徴とする方法1乃至3の何れか一項に記載の画像処理方法。
[方法5]
前記変形量に関する情報は、前記第1の画像における画素の位置ごとの前記変形量の値を含むことを特徴とする方法1乃至4の何れか一項に記載の画像処理方法。
前記変形量に関する情報は、前記第1の画像における画素の位置ごとの前記変形量の値を含むことを特徴とする方法1乃至4の何れか一項に記載の画像処理方法。
[方法6]
前記幾何変換は、前記第1の画像における画素の位置ごとに前記変形量が異なる変換であることを特徴とする方法1乃至5の何れか一項に記載の画像処理方法。
前記幾何変換は、前記第1の画像における画素の位置ごとに前記変形量が異なる変換であることを特徴とする方法1乃至5の何れか一項に記載の画像処理方法。
[方法7]
前記幾何変換は、前記第1の画像の第1の射影方式から前記第2の画像の第2の射影方式への変換であることを特徴とする方法1乃至6の何れか一項に記載の画像処理方法。
前記幾何変換は、前記第1の画像の第1の射影方式から前記第2の画像の第2の射影方式への変換であることを特徴とする方法1乃至6の何れか一項に記載の画像処理方法。
[プログラム8]
方法1乃至7の何れか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
方法1乃至7の何れか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
[構成9]
プログラム8に記載のプログラムを記憶していることを特徴とする記憶媒体。
プログラム8に記載のプログラムを記憶していることを特徴とする記憶媒体。
[構成10]
第1の画像に幾何変換を施すことで得られた第2の画像を取得する手段と、
前記幾何変換における前記第1の画像の変形量に関する情報を取得する手段と、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを有することを特徴とする画像処理装置。
第1の画像に幾何変換を施すことで得られた第2の画像を取得する手段と、
前記幾何変換における前記第1の画像の変形量に関する情報を取得する手段と、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを有することを特徴とする画像処理装置。
[構成11]
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成する手段と、
前記幾何変換における前記第1の訓練画像の変形量に関する情報を取得する手段と、
前記第2の訓練画像と前記変形量に関する情報とを機械学習モデルに入力し、推定画像を生成する手段と、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有することを特徴とする学習装置。
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成する手段と、
前記幾何変換における前記第1の訓練画像の変形量に関する情報を取得する手段と、
前記第2の訓練画像と前記変形量に関する情報とを機械学習モデルに入力し、推定画像を生成する手段と、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有することを特徴とする学習装置。
[方法12]
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得するステップと、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成するステップと、
前記幾何変換における前記第1の訓練画像の変形量に関する情報を取得するステップと、
前記第2の訓練画像と前記変形量に関する情報とを機械学習モデルに入力し、推定画像を生成するステップと、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有することを特徴とする学習済みモデルの製造方法。
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得するステップと、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成するステップと、
前記幾何変換における前記第1の訓練画像の変形量に関する情報を取得するステップと、
前記第2の訓練画像と前記変形量に関する情報とを機械学習モデルに入力し、推定画像を生成するステップと、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有することを特徴とする学習済みモデルの製造方法。
[プログラム13]
方法12に記載の学習済みモデルの製造方法をコンピュータに実行させることを特徴とするプログラム。
方法12に記載の学習済みモデルの製造方法をコンピュータに実行させることを特徴とするプログラム。
[構成14]
撮像装置及び前記撮像装置と互いに通信可能な学習装置を含む画像処理システムであって、
前記学習装置は、
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成する手段と、
前記第1の訓練画像の幾何変換における前記第1の訓練画像の第1の変形量に関する情報を取得する手段と、
前記第2の訓練画像と前記第1の変形量に関する情報とを機械学習モデルに入力し、推定画像を生成する手段と、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有し、
前記撮像装置は、光学系、撮像素子、画像推定部を有し、
画像推定部は、
前記撮像装置を用いて取得された第1の画像と前記撮像装置の光学系に関する情報とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の画像に幾何変換を施すことで、第2の画像を生成する手段と、
前記第1の画像の幾何変換における前記第1の画像の第2の変形量に関する情報を取得する手段と、
前記第2の画像と前記第2の変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを備えることを特徴とする画像処理システム。
撮像装置及び前記撮像装置と互いに通信可能な学習装置を含む画像処理システムであって、
前記学習装置は、
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成する手段と、
前記第1の訓練画像の幾何変換における前記第1の訓練画像の第1の変形量に関する情報を取得する手段と、
前記第2の訓練画像と前記第1の変形量に関する情報とを機械学習モデルに入力し、推定画像を生成する手段と、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有し、
前記撮像装置は、光学系、撮像素子、画像推定部を有し、
画像推定部は、
前記撮像装置を用いて取得された第1の画像と前記撮像装置の光学系に関する情報とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の画像に幾何変換を施すことで、第2の画像を生成する手段と、
前記第1の画像の幾何変換における前記第1の画像の第2の変形量に関する情報を取得する手段と、
前記第2の画像と前記第2の変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを備えることを特徴とする画像処理システム。
[構成15]
制御装置及び前記制御装置と互いに通信可能な画像処理装置を含む画像処理システムであって、
前記制御装置は、光学系及び撮像素子を用いた撮影により取得された第1の画像に対する処理を前記画像処理装置に実行させるための要求を送信する手段を有し、
前記画像処理装置は、
前記要求を受信する手段と、
前記第1の画像と前記光学系の情報とを取得する取得手段と、
前記光学系の情報に基づいて前記第1の画像に幾何変換を施された第2の画像を取得する手段と、
前記幾何変換における前記第1の画像の変形量に関する情報を取得する手段と、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを有することを特徴とする画像処理システム。
制御装置及び前記制御装置と互いに通信可能な画像処理装置を含む画像処理システムであって、
前記制御装置は、光学系及び撮像素子を用いた撮影により取得された第1の画像に対する処理を前記画像処理装置に実行させるための要求を送信する手段を有し、
前記画像処理装置は、
前記要求を受信する手段と、
前記第1の画像と前記光学系の情報とを取得する取得手段と、
前記光学系の情報に基づいて前記第1の画像に幾何変換を施された第2の画像を取得する手段と、
前記幾何変換における前記第1の画像の変形量に関する情報を取得する手段と、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを有することを特徴とする画像処理システム。
22 第1の画像
23 第2の画像
24 変形量に関する情報
23 第2の画像
24 変形量に関する情報
Claims (15)
- 第1の画像に幾何変換を施すことで得られた第2の画像を取得するステップと、
前記幾何変換における前記第1の画像の変形量に関する情報を取得するステップと、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成するステップとを有することを特徴とする画像処理方法。 - 前記変形量に関する情報は、前記第1の画像内の二点の間の距離と前記第2の画像の前記二点に対応する二点の間の距離との比率を含む特徴とする請求項1に記載の画像処理方法。
- 前記変形量に関する情報は、前記第1の画像内の領域の面積と前記第2の画像の前記領域に対応する領域の面積との比率を含む特徴とする請求項1に記載の画像処理方法。
- 前記変形量に関する情報は、前記第1の画像の一点から前記第2の画像の前記一点に対応する一点までの移動量を含むことを特徴とする請求項1に記載の画像処理方法。
- 前記変形量に関する情報は、前記第1の画像における画素の位置ごとの前記変形量の値を含むことを特徴とする請求項1に記載の画像処理方法。
- 前記幾何変換は、前記第1の画像における画素の位置ごとに前記変形量が異なる変換であることを特徴とする請求項1に記載の画像処理方法。
- 前記幾何変換は、前記第1の画像の第1の射影方式から前記第2の画像の第2の射影方式への変換であることを特徴とする請求項1に記載の画像処理方法。
- 請求項1乃至7の何れか一項に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
- 請求項8に記載のプログラムを記憶していることを特徴とする記憶媒体。
- 第1の画像に幾何変換を施すことで得られた第2の画像を取得する手段と、
前記幾何変換における前記第1の画像の変形量に関する情報を取得する手段と、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを有することを特徴とする画像処理装置。 - 光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成する手段と、
前記幾何変換における前記第1の訓練画像の変形量に関する情報を取得する手段と、
前記第2の訓練画像と前記変形量に関する情報とを機械学習モデルに入力し、推定画像を生成する手段と、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有することを特徴とする学習装置。 - 光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得するステップと、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成するステップと、
前記幾何変換における前記第1の訓練画像の変形量に関する情報を取得するステップと、
前記第2の訓練画像と前記変形量に関する情報とを機械学習モデルに入力し、推定画像を生成するステップと、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有することを特徴とする学習済みモデルの製造方法。 - 請求項12に記載の学習済みモデルの製造方法をコンピュータに実行させることを特徴とするプログラム。
- 撮像装置及び前記撮像装置と互いに通信可能な学習装置を含む画像処理システムであって、
前記学習装置は、
光学系及び撮像素子を用いた撮影により取得された第1の訓練画像と、前記光学系に関する情報と、正解画像とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の訓練画像に幾何変換を施すことで、第2の訓練画像を生成する手段と、
前記第1の訓練画像の幾何変換における前記第1の訓練画像の第1の変形量に関する情報を取得する手段と、
前記第2の訓練画像と前記第1の変形量に関する情報とを機械学習モデルに入力し、推定画像を生成する手段と、
前記正解画像及び前記推定画像に基づいてニューラルネットワークのウエイトを更新する手段とを有し、
前記撮像装置は、光学系、撮像素子、画像推定部を有し、
画像推定部は、
前記撮像装置を用いて取得された第1の画像と前記撮像装置の光学系に関する情報とを取得する手段と、
前記光学系に関する情報に基づいて前記第1の画像に幾何変換を施すことで、第2の画像を生成する手段と、
前記第1の画像の幾何変換における前記第1の画像の第2の変形量に関する情報を取得する手段と、
前記第2の画像と前記第2の変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを備えることを特徴とする画像処理システム。 - 制御装置及び前記制御装置と互いに通信可能な画像処理装置を含む画像処理システムであって、
前記制御装置は、光学系及び撮像素子を用いた撮影により取得された第1の画像に対する処理を前記画像処理装置に実行させるための要求を送信する手段を有し、
前記画像処理装置は、
前記要求を受信する手段と、
前記第1の画像と前記光学系の情報とを取得する取得手段と、
前記光学系の情報に基づいて前記第1の画像に幾何変換を施された第2の画像を取得する手段と、
前記幾何変換における前記第1の画像の変形量に関する情報を取得する手段と、
前記第2の画像と前記変形量に関する情報とを機械学習モデルに入力し、第3の画像を生成する手段とを有することを特徴とする画像処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022115905A JP2024013652A (ja) | 2022-07-20 | 2022-07-20 | 画像処理方法、画像処理装置、プログラム |
US18/352,639 US20240029321A1 (en) | 2022-07-20 | 2023-07-14 | Image processing method, image processing apparatus, storage medium, image processing system, method of generating machine learning model, and learning apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022115905A JP2024013652A (ja) | 2022-07-20 | 2022-07-20 | 画像処理方法、画像処理装置、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024013652A true JP2024013652A (ja) | 2024-02-01 |
Family
ID=89576829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022115905A Pending JP2024013652A (ja) | 2022-07-20 | 2022-07-20 | 画像処理方法、画像処理装置、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240029321A1 (ja) |
JP (1) | JP2024013652A (ja) |
-
2022
- 2022-07-20 JP JP2022115905A patent/JP2024013652A/ja active Pending
-
2023
- 2023-07-14 US US18/352,639 patent/US20240029321A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240029321A1 (en) | 2024-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7439145B2 (ja) | 画像処理方法、画像処理装置、画像処理システム、学習済みウエイトの生成方法、および、プログラム | |
JP7258604B2 (ja) | 画像処理方法、画像処理装置、プログラム、および学習済みモデルの製造方法 | |
CN110858871B (zh) | 图像处理方法、图像处理装置、成像装置、镜头装置、存储介质、以及图像处理系统 | |
JP5535053B2 (ja) | 画像処理装置、及び画像処理方法 | |
JP7297470B2 (ja) | 画像処理方法、画像処理装置、プログラム、画像処理システム、および、学習済みモデルの製造方法 | |
JP2011139367A (ja) | 画像処理装置および画像処理方法 | |
KR20090078463A (ko) | 왜곡 영상 보정 장치 및 방법 | |
JP5555101B2 (ja) | 画像補正装置、補正画像生成方法および補正画像生成プログラム | |
JP2020036310A (ja) | 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、記憶媒体、および、画像処理システム | |
US8553097B2 (en) | Reducing blur based on a kernel estimation of an imaging device | |
JP2015115733A (ja) | 画像処理方法、画像処理装置、撮像装置および画像処理プログラム | |
JP2022046219A (ja) | 画像処理方法、画像処理装置、画像処理プログラム、学習方法、学習装置、学習プログラム | |
JP6274744B2 (ja) | 画像処理装置および画像処理方法 | |
JP2024013652A (ja) | 画像処理方法、画像処理装置、プログラム | |
JP2017011653A (ja) | 画像処理装置、撮像装置、画像処理方法およびプログラム | |
JP7414745B2 (ja) | 学習データの製造方法、学習方法、学習データ製造装置、学習装置、およびプログラム | |
JP2017022597A (ja) | 画像処理装置、その制御方法、および制御プログラム | |
JP7414430B2 (ja) | 画像処理方法、画像処理装置、撮像装置、画像処理システム、プログラム、および、記憶媒体 | |
JP7309520B2 (ja) | 画像処理方法、画像処理装置、撮像装置、プログラム、記憶媒体、画像処理システム、および、学習済みモデルの製造方法 | |
JP6218520B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5344647B2 (ja) | 画像処理方法、画像処理装置および画像処理プログラム | |
WO2022249934A1 (ja) | 画像処理方法、画像処理装置、プログラム、訓練済み機械学習モデルの製造方法、処理装置、画像処理システム | |
EP4303806A1 (en) | Image processing method, image processing apparatus, learning apparatus, manufacturing method of learned model, program, and storage medium | |
JP2021086272A (ja) | 画像処理方法、プログラム、学習済みモデルの製造方法、画像処理装置、および、画像処理システム | |
JP2023116364A (ja) | 画像処理方法、画像処理装置、画像処理システム、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |