WO2020230891A1

WO2020230891A1 - 画像処理装置

Info

Publication number: WO2020230891A1
Application number: PCT/JP2020/019459
Authority: WO
Inventors: 亮篠原; 直人的場
Original assignee: 株式会社Ｎｔｔドコモ
Priority date: 2019-05-15
Filing date: 2020-05-15
Publication date: 2020-11-19
Also published as: US20220180491A1; JPWO2020230891A1; JP7165820B2

Abstract

画像処理装置は、複数の入力画像を第１補正データに応じて補正することによって複数の補正画像を生成し、複数の補正画像を相互に繋ぎ合わせることによって合成画像を生成する画像合成部と、複数の画像の繋ぎ合わせが適切であるか否かを学習した第１学習済みモデルを用いて、合成画像における複数の補正画像の繋ぎ合わせが適切であるか否かを判定する判定部と、相互に適切に繋ぎ合わされる複数の補正画像を生成するための複数の元画像の補正に使用される補正データと、複数の元画像と、の関係を学習した第２学習済みモデルに、複数の入力画像を入力することによって第２補正データを生成する第２補正データ生成部と、判定部の判定結果が肯定である場合、合成画像を出力し、判定部の判定結果が否定である場合、第２補正データに基づいて画像合成部に合成画像を更新させることによって更新合成画像を生成させ、更新合成画像を出力する画像更新部と、を備える。

Description

画像処理装置

　本発明は、複数の入力画像を相互に繋ぎ合わせることによって合成画像を生成する画像処理装置に関する。

　３６０度の画像を生成するためには、まず、魚眼レンズを備えた複数のカメラによって複数の画像が生成される。続いて、複数の画像が、複数の正距円筒図法形式の画像（以下「複数の変換画像」と称する）に変換される。続いて、複数の変換画像を相互に張り合わせるスティッチング処理が実行される。特許文献１は、スティッチング処理を実行する装置を開示する。この装置は、学習済みモデルを用いて、スティッチング処理用のパラメータを生成する。続いて、この装置は、当該パラメータを用いてスティッチング処理を実行する。

特開２０１７－１０８３８７号公報

　従来の装置は、スイッチング処理後の画像の良否を判定していない。このため、従来の装置によって生成された画像を人が不自然に感じることがあるといった問題があった。

　以上の課題を解決するために、本発明の好適な態様に係る画像処理装置は、複数の入力画像を第１補正データに応じて補正することによって複数の補正画像を生成し、前記複数の補正画像を相互に繋ぎ合わせることによって合成画像を生成する画像合成部と、複数の画像が相互に繋ぎ合わされた画像における前記複数の画像の繋ぎ合わせが適切であるか否かを学習した第１学習済みモデルを用いて、前記合成画像における前記複数の補正画像の繋ぎ合わせが適切であるか否かを判定する判定部と、相互に適切に繋ぎ合わされる複数の補正画像を生成するための複数の元画像の補正に使用される補正データと、前記複数の元画像と、の関係を学習した第２学習済みモデルに、前記複数の入力画像を入力することによって、第２補正データを生成する第２補正データ生成部と、前記判定部の判定結果が肯定である場合、前記合成画像を出力し、前記判定部の判定結果が否定である場合、前記第２補正データに基づいて前記画像合成部に前記合成画像を更新させることによって更新合成画像を生成させ、前記更新合成画像を出力する画像更新部と、を備える。

　本発明によれば、複数の入力画像が相互に繋ぎ合わされる場合に、自然な合成画像が生成される。

本発明の第１実施形態に係る画像処理システムの全体構成を示すブロック図である。第１撮像装置Ｃ１、第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、及び第５撮像装置Ｃ５の配置を示す斜視図である。画像処理装置１Ａの構成例を示すブロック図である。スティッチング処理の一例を示す説明図である。補正データに含まれるパラメータセットの例を示す説明図である。画像処理装置１Ａの動作の一例を示すフローチャートである。画像処理装置１Ｂの構成例を示すブロック図である。第３学習済みモデルの構成例を示す模式図である。更新処理の内容を示すフローチャートである。画像処理装置１Ｃの構成例を示すブロック図である。画像処理装置１Ｄの構成例を示すブロック図である。

[１．第１実施形態]
　図１は、第１実施形態に係る画像処理システムの全体構成を示すブロック図である。画像処理システムは、複数の画像が相互に繋ぎ合わされた合成画像を生成するために用いられる。合成画像は、例えば、ＶＲ（Virtual Reality）などで使用される３６０度の画像、あるいは、パノラマ画像である。

　画像処理システムは、第１撮像装置Ｃ１、第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、第５撮像装置Ｃ５、及び画像処理装置１Ａを備える。図２は、第１撮像装置Ｃ１、第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、及び第５撮像装置Ｃ５の配置を示す斜視図である。第１撮像装置Ｃ１、第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、及び第５撮像装置Ｃ５の撮像方向において、隣り合う撮像方向は、７２度の角度を形成する。隣り合う撮像方向は、７２度とは異なる角度を形成してもよい。第１撮像装置Ｃ１、第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、及び第５撮像装置Ｃ５は、複数の撮像装置の一例である。

　第１撮像装置Ｃ１は、カメラ、例えば、縦の画素数が２１６０、横の画素数が３８４０の解像度を有するいわゆる４Ｋのテレビジョンカメラである。なお、第１撮像装置Ｃ１は、４Ｋのテレビジョンカメラに限らない。第１撮像装置Ｃ１は、第１レンズＬ１を備える。第１レンズＬ１は、魚眼レンズ（円周魚眼レンズ）である。第１撮像装置Ｃ１は、第１レンズＬ１を介して被写体を撮像することによって、第１画像データＳＤ１を生成する。第１画像データＳＤ１は、例えば、４Ｋの解像度を有する。第１画像データＳＤ１は、第１入力画像を示す。第１レンズＬ１が魚眼レンズであるため、第１入力画像は略円の形状となる。

　第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、及び第５撮像装置Ｃ５は、４Ｋのテレビジョンカメラ等のカメラである。なお、第２撮像装置Ｃ２、第３撮像装置Ｃ３、第４撮像装置Ｃ４、及び第５撮像装置Ｃ５は、４Ｋのテレビジョンカメラに限らない。
　第２撮像装置Ｃ２は、第２レンズＬ２を備える。第２レンズＬ２は、魚眼レンズ（円周魚眼レンズ）である。第２撮像装置Ｃ２は、第２レンズＬ２を介して被写体を撮像することによって、第２画像データＳＤ２を生成する。第２画像データＳＤ２は、例えば、４Ｋの解像度を有する。第２画像データＳＤ２は、第２入力画像を示す。第２レンズＬ２が魚眼レンズであるため、第２入力画像は略円の形状となる。
　第３撮像装置Ｃ３は、第３レンズＬ３を備える。第３レンズＬ３は、魚眼レンズ（円周魚眼レンズ）である。第３撮像装置Ｃ３は、第３レンズＬ３を介して被写体を撮像することによって、第３画像データＳＤ３を生成する。第３画像データＳＤ３は、例えば、４Ｋの解像度を有する。第３画像データＳＤ３は、第３入力画像を示す。第３レンズＬ３が魚眼レンズであるため、第３入力画像は略円の形状となる。
　第４撮像装置Ｃ４は、第４レンズＬ４を備える。第４レンズＬ４は、魚眼レンズ（円周魚眼レンズ）である。第４撮像装置Ｃ４は、第４レンズＬ４を介して被写体を撮像することによって、第４画像データＳＤ４を生成する。第４画像データＳＤ４は、例えば、４Ｋの解像度を有する。第４画像データＳＤ４は、第４入力画像を示す。第４レンズＬ４が魚眼レンズであるため、第４入力画像は略円の形状となる。
　第５撮像装置Ｃ５は、第５レンズＬ５を備える。第５レンズＬ５は、魚眼レンズ（円周魚眼レンズ）である。第５撮像装置Ｃ５は、第５レンズＬ５を介して被写体を撮像することによって、第５画像データＳＤ５を生成する。第５画像データＳＤ５は、例えば、４Ｋの解像度を有する。第５画像データＳＤ５は、第５入力画像を示す。第５レンズＬ５が魚眼レンズであるため、第５入力画像は略円の形状となる。
　第１入力画像、第２入力画像、第３入力画像、第４入力画像、及び第５入力画像は、複数の入力画像の一例である。
　画像処理装置１Ａは、第１画像データＳＤ１～第５画像データＳＤ５に基づいて、出力画像データＤｏｕｔを生成する。例えば、画像処理装置１Ａは、第１画像データＳＤ１～第５画像データＳＤ５を補正することによって、後述する第１補正画像ＣＧ１～第５補正画像ＣＧ５を生成する。画像処理装置１Ａは、第１補正画像ＣＧ１～第５補正画像ＣＧ５を相互に繋ぎ合わせた合成画像を示す出力画像データＤｏｕｔを生成する。

[１-１．画像処理装置１Ａの構成]
　画像処理装置１Ａは、コンピュータである。画像処理装置１Ａは、例えば、ワークステーションによって構成される。図３は、画像処理装置１Ａの構成例を示すブロック図である。画像処理装置１Ａは、スティッチング装置（image stitching apparatus）１０、処理装置２０、入力インターフェース３０、出力インターフェース４０、及び記憶装置５０を備える。入力インターフェース３０は、外部装置からデータを受信する。出力インターフェース４０は、外部装置へデータを送信する。

　画像処理装置１Ａの各要素は、情報を通信するための１又は２以上のバスを介して相互に接続される。本明細書における「装置」という用語は、回路、デバイス又はユニット等の他の用語に読み替えられてもよい。画像処理装置１Ａの各要素は、１又は２以上の機器によって構成される。画像処理装置１Ａの一部の要素は、省略されてもよい。

　スティッチング装置１０は、例えば、FPGA（field-programmable gate array）によって構成される。処理装置２０の制御の下、スティッチング装置１０は、入力インターフェース３０を介して第１画像データＳＤ１～第５画像データＳＤ５を受信する。スティッチング装置１０は、第１画像データＳＤ１～第５画像データＳＤ５にスティッチング処理を施すことによって、出力画像データＤｏｕｔを生成する。出力画像データＤｏｕｔは、合成画像を示す。出力インターフェース４０は、処理装置２０の制御の下、出力画像データＤｏｕｔを外部装置に出力する。この例では、一つの出力画像データＤｏｕｔが示されているが、スティッチング装置１０は、複数の出力画像データＤｏｕｔを生成してもよい。例えば、横長又は環状の投射面に向けて複数のプロジェクタが光を投射することによって１つの画像を表示する場合、スティッチング装置１０は、複数のプロジェクタと１対１に対応する複数の出力画像データＤｏｕｔを出力する。

　スティッチング処理は、補正処理と、連結処理と、を含む。補正処理では、スティッチング装置１０は、複数の入力画像を、処理装置２０から供給される補正データに基づいて補正することによって、複数の補正画像を生成する。連結処理では、スティッチング装置１０は、複数の補正画像を相互に繋ぎ合わせることによって合成画像を生成する。スティッチング処理は、２回実行される。以下の説明では、１回目のスティッチング処理に用いられる補正データを「第１補正データ」と称し、２回目のスティッチング処理に用いられる補正データを「第２補正データ」と称する。第１補正データと第２補正データを相互に区別する必要がない場合は、第１補正データと第２補正データを単に「補正データ」と称する。なお、スティッチング処理は、１回のみ実行されてもよいし、２回よりも多く実行されてもよい。スティッチング装置１０は、画像合成部の一例である。

　補正処理は、クロップ処理、エクイレクタングラー処理、及び調整処理を含む。連結処理は、ブレンディング処理を含む。図４は、補正処理と連結処理とを含むスティッチング処理の一例を示す説明図である。スティッチング装置１０は、第１入力画像～第５入力画像の各々に、クロップ処理、エクイレクタングラー処理、及び調整処理を施すことによって、第１入力画像～第５入力画像と１対１に対応する第１補正画像ＣＧ１～第５補正画像ＣＧ５を生成する。補正データは、クロップ処理、エクイレクタングラー処理、及び調整処理に用いられるパラメータセットを含む。

　図５は、補正データに含まれるパラメータセットを示す。パラメータセットは、パラメータＰ１１～Ｐ１６、パラメータＰ２１～Ｐ２６、パラメータＰ３１～Ｐ３６、パラメータＰ４１～Ｐ４６、及びパラメータＰ５１～Ｐ５６を含む。パラメータＰ１１～Ｐ１６は、第１撮像装置Ｃ１に関する。パラメータＰ２１～Ｐ２６は、第２撮像装置Ｃ２に関する。パラメータＰ３１～Ｐ３６は、第３撮像装置Ｃ３に関する。パラメータＰ４１～Ｐ４６は、第４撮像装置Ｃ４に関する。パラメータＰ５１～Ｐ５６は、第５撮像装置Ｃ５に関する。

　パラメータＰ１１、Ｐ２１、Ｐ３１、Ｐ４１、及びＰ５１は、撮像装置における撮像素子の実際の位置に起因する中心座標ずれを示す。中心座標ずれは、撮像装置における撮像素子の設計上の中心位置と、撮像装置における撮像素子の実際の中心位置と、の差を示す。パラメータＰ１２、Ｐ２２、Ｐ３２、Ｐ４２、及びＰ５２は、実際のレンズに起因する半径ずれを示す。半径ずれは、設計上のレンズの半径と、実際のレンズの半径と、の差を示す。パラメータＰ１３、Ｐ２３、Ｐ３３、Ｐ４３、及びＰ５３は、Ｘ軸方向における画像のずれを示す。Ｘ軸方向における画像のずれは、Ｘ軸方向における設計上の画像の位置と、Ｘ軸方向における実際の画像の位置と、の差を示す。パラメータＰ１４、Ｐ２４、Ｐ３４、Ｐ４４、及びＰ５４は、Ｙ軸方向における画像のずれを示す。Ｙ軸方向における画像のずれは、Ｙ軸方向における設計上の画像の位置と、Ｙ軸方向における実際の画像の位置と、の差を示す。パラメータＰ１５、Ｐ２５、Ｐ３５、Ｐ４５、及びＰ５５は、Ｚ軸周りの回転方向における画像のずれを示す。Ｚ軸周りの回転方向における画像のずれは、Ｚ軸周りの回転方向における設計上の画像の位置と、Ｚ軸周りの回転方向における実際の画像の位置と、の差を示す。パラメータＰ１６、Ｐ２６、Ｐ３６、Ｐ４６、及びＰ５６は、画像の大きさのずれを示す。画像の大きさのずれは、設計上の画像の大きさと、実際の画像の大きさと、の差を示す。

　上述したように第１入力画像～第５入力画像は、円形の形状である。図４に示すクロップ処理では、スティッチング装置１０は、まず、第１入力画像～第５入力画像の各々から円形の画像を切り出すために使用される円の半径と中心を決定する。続いて、スティッチング装置１０は、半径と中心が決定された円を用いて、第１入力画像～第５入力画像の各々から円形の画像を切り出す。クロップ処理では、スティッチング装置１０は、中心座標ずれに関するパラメータＰ１１、Ｐ２１、Ｐ３１、Ｐ４１、及びＰ５１と、半径ずれに関するパラメータＰ１２、Ｐ２２、Ｐ３２、Ｐ４２、及びＰ５２とを用いる。

　エクイレクタングラー処理では、スティッチング装置１０は、クロップ処理によって生成された５つの円形の画像を、正距円筒図法を用いて、５つの矩形の画像に変換する。エクイレクタングラー処理では、スティッチング装置１０は、上述したパラメータの他に第１レンズＬ１～第５レンズＬ５の歪に関するパラメータを用いてもよい。

　調整処理では、スティッチング装置１０は、エクイレクタングラー処理によって生成された５つの矩形の画像を微調整することによって、第１補正画像ＣＧ１～第５補正画像ＣＧ５を生成する。調整処理は、第１処理、第２処理、第３処理、及び第４処理を含む。第１処理では、スティッチング装置１０は、Ｘ軸に沿った画像のずれに関するパラメータＰ１３、Ｐ２３、Ｐ３３、Ｐ４３、及びＰ５３を用いて、５つの矩形の画像をＸ軸に沿う方向にシフトする。第２処理では、スティッチング装置１０は、Ｙ軸に沿った画像のずれに関するパラメータＰ１４、Ｐ２４、Ｐ３４、Ｐ４４、及びＰ５４を用いて、５つの矩形の画像をＹ軸に沿う方向にシフトする。第３処理では、スティッチング装置１０は、Ｚ軸周りの回転方向における画像のずれを示すパラメータＰ１５、Ｐ２５、Ｐ３５、Ｐ４５、及びＰ５５を用いて、Ｚ軸を中心に５つの矩形の画像を回転する。第４処理では、スティッチング装置１０は、画像の大きさに関するパラメータＰ１６、Ｐ２６、Ｐ３６、Ｐ４６、及びＰ５６を用いて、５つの矩形の画像を拡大又は縮小する。スティッチング装置１０は、第１処理～第４処理を実行することによって、第１補正画像ＣＧ１～第５補正画像ＣＧ５を生成する。

　ブレンディング処理では、スティッチング装置１０は、第１補正画像ＣＧ１～第５補正画像ＣＧ５を相互に繋ぎ合わせることによって合成画像ＳＧを生成する。

　説明を図３に戻す。処理装置２０は、画像処理装置１Ａを制御するプロセッサである。処理装置２０は、例えば、１又は２以上のチップによって構成される。処理装置２０は、例えば、周辺装置とのインターフェース、及び中央処理装置（ＣＰＵ：Central Processing Unit）によって構成される。中央処理装置は、演算装置及びレジスタ等を含む。処理装置２０が有する機能の一部又は全部は、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）、ＦＰＧＡ（Field Programmable Gate Array）等のハードウェアによって実現されてもよい。処理装置２０は、各種の処理を並列的又は逐次的に実行する。

　記憶装置５０は、処理装置２０が読取可能な記録媒体である。記憶装置５０は、複数のプログラム及び各種のデータを記憶する。複数のプログラムは、処理装置２０が実行する制御プログラムＰＲ１を含む。各種のデータは、第１学習済みモデル群Ｍ１を定める複数の係数Ｋ１１、第２学習済みモデル群Ｍ２を定める複数の係数Ｋ１２、及びカテゴリ学習済みモデルＭＣを定める複数の係数Ｋ１Ｃを含む。各種のデータは、処理装置２０等によって使用される。

　本実施形態では、処理装置２０は、カテゴリ学習済みモデルＭＣを用いることによって、画像の内容の種別に関する複数のカテゴリの中から、合成画像ＳＧの内容の種別に応じたカテゴリを特定する。複数のカテゴリは、例えば、スポーツ、風景、及び人物などを含む。
　カテゴリ学習済みモデルＭＣは、複数の画像と複数のカテゴリとの関係を、カテゴリ教師データＴＣを用いた機械学習によって学習済みである。カテゴリ学習済みモデルＭＣの学習結果は、カテゴリ学習済みモデルＭＣを定める複数の係数Ｋ１Ｃに反映され、複数の係数Ｋ１Ｃが記憶装置５０に記憶される。カテゴリ教師データＴＣは、カテゴリ入力データＴＣａとカテゴリラベルデータＴＣｂとの組を含む。カテゴリ入力データＴＣａは、画像データである。カテゴリラベルデータＴＣｂは、カテゴリ入力データＴＣａである画像データが示す画像のカテゴリを示す。カテゴリ学習済みモデルＭＣは、互いに異なる複数のカテゴリ教師データＴＣ、すなわち、カテゴリ教師データセットを学習済みである。カテゴリ学習済みモデルＭＣは、第４学習済みモデルの一例である。カテゴリ学習済みモデルＭＣは、画像処理装置１Ａが運用される運用フェーズにおいて、合成画像ＳＧの内容の種別に対応するカテゴリを判別するために使用される。カテゴリ学習済みモデルＭＣに画像データが入力されると、カテゴリ学習済みモデルＭＣは、画像データが示す画像のカテゴリを示すカテゴリデータを出力する。

　第１学習済みモデル群Ｍ１は、複数のカテゴリと１対１に対応する複数の第１学習済みモデルによって構成される。複数の第１学習済みモデルの各々は、対応するカテゴリに属する画像を構成する複数の画像の繋ぎ合わせが適切であるか否かを、第１教師データＴ１を用いた機械学習によって学習済みである。複数の第１学習済みモデルの各々が機械学習によって設定した複数の係数の集合が「第１学習済みモデル群Ｍ１を定める複数の係数Ｋ１１」に相当する。第１教師データＴ１は、第１入力データＴ１ａと第１ラベルデータＴ１ｂとの組を含む。第１入力データＴ１ａは、複数の画像が相互に繋ぎ合わされている複合画像を示す複合画像データである。第１ラベルデータＴ１ｂは、第１入力データＴ１ａが示す複合画像において複数の画像の繋ぎ合わせが適切であるかを示す。第１教師データＴ１は、第１入力データＴ１ａが示す複合画像の内容の種別に基づいて、複数のカテゴリのいずれかに分類される。複数の第１学習済みモデルの各々は、対応するカテゴリに属する互いに異なる複数の第１教師データＴ１、すなわち、第１教師データセットを、学習フェーズにおいて学習済みである。運用フェーズにおいては、第１学習済みモデルに複合画像データが入力されると、第１学習済みモデルは、複合画像データが示す複合画像において複数の画像の繋ぎ合わせが適切であるか否かを示すデータを出力する。

　第１教師データＴ１のカテゴリを特定する処理は、カテゴリ学習済みモデルＭＣを用いて実行されることが好ましい。第１教師データＴ１のカテゴリを特定するためにカテゴリ学習済みモデルＭＣが用いられる場合、処理装置２０は、学習フェーズにおけるカテゴリの特定手法を、運用フェーズにおけるカテゴリの特定手法と一致させることができる。例えば、複数のカテゴリがスポーツと風景を含み、複数の画像が相互に繋ぎ合わされた連結画像の内容がボートレースである場合を想定する。この場合、連結画像の内容は、ボートレースに加えて風景を含む可能性がある。よって、ボートレースを示す連結画像は、スポーツのカテゴリと風景のカテゴリとのいずれにも該当する可能性がある。第１教師データＴ１のカテゴリを特定するために、カテゴリ学習済みモデルＭＣが用いられると、運用フェーズにおいてボートレースを示す合成画像ＳＧに応じて選択される第１学習済みモデルが、ボートレースを示す複合画像を表す第１教師データＴ１を学習できる。この結果、運用フェーズにおいて、複数の画像の繋ぎ合わせが適切であるか否かを判定する判定処理の精度が向上する。

　第２学習済みモデル群Ｍ２は、複数のカテゴリと１対１に対応する複数の第２学習済みモデルによって構成される。複数の第２学習済みモデルの各々は、対応するカテゴリに属する画像を生成するために使用される第1画像補正データを、第２教師データＴ２を用いた機械学習によって学習済みである。第１画像補正データは、相互に繋ぎ合わせられる複数の補正画像の元になる複数の画像（元画像）を、繋ぎ合わせに適した複数の補正画像に補正するための補正処理において使用される。複数の第２学習済みモデルの各々が機械学習によって設定した複数の係数の集合が「第２学習済みモデル群Ｍ２を定める複数の係数Ｋ１２」に相当する。第２教師データＴ２は、第２入力データＴ２ａと第２ラベルデータＴ２ｂとの組を含む。第２入力データＴ２ａは、複数の画像データである。当該複数の画像データは、複数の元画像を示す。第２ラベルデータＴ２ｂは、第１画像補正データ（補正データ）である。第２学習済みモデルに複数の画像データが入力されると、第２学習済みモデルは、第１画像補正データ（例えば、第２補正データ）を出力する。第２教師データＴ２は、第1画像補正データを用いたスティッチング処理によって生成される画像の内容の種別に基づいて、複数のカテゴリのいずれかに分類される。複数の第２学習済みモデルの各々は、対応するカテゴリに属する互いに異なる複数の第２教師データＴ２、すなわち、第２教師データセットを、学習フェーズにおいて学習済みである。第２教師データＴ２のカテゴリを特定する処理は、カテゴリ学習済みモデルＭＣを用いて実行されることが好ましい。

　複数の第１学習済みモデルの各々、複数の第２学習済みモデルの各々、及びカテゴリ学習済みモデルＭＣは、例えば、ＳＶＭ（support vector machine）によって構成される。

　記憶装置５０は、例えば、ＲＯＭ（Read　Only　Memory）、ＥＰＲＯＭ（Erasable　Programmable　ＲＯＭ）、ＥＥＰＲＯＭ（Electrically　Erasable　Programmable　ＲＯＭ）、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ等の少なくとも１つによって構成される。記憶装置５０は、レジスタ、キャッシュ、メインメモリ（主記憶装置）等と呼ばれてもよい。

　処理装置２０は、記憶装置５０から制御プログラムＰＲ１を読み出す。処理装置２０は、制御プログラムＰＲ１を実行することによって、特定部２１、判定部２２、第２補正データ生成部２３、及び画像更新部２４として機能する。制御プログラムＰＲ１は、ネットワークを介して他の装置から画像処理装置１Ａに送信されてもよい。この場合、画像処理装置１Ａは、ネットワークを介して外部装置と通信可能な通信装置を備える。

　特定部２１は、画像の内容の種別に関する複数のカテゴリの中から、合成画像ＳＧの内容の種別に応じたカテゴリを特定する。特定部２１は、カテゴリ学習済みモデルＭＣを含む。特定部２１は、複数の係数Ｋ１Ｃを適用したカテゴリ学習済みモデルＭＣを用いて、複数のカテゴリの中から合成画像ＳＧの種別に応じたカテゴリを特定する。特定部２１は、特定したカテゴリを示すカテゴリデータを生成する。特定部２１は、カテゴリ学習済みモデルＭＣを用いることによって、合成画像ＳＧのカテゴリを自動的に推定できる。

　判定部２２は、第１学習済みモデル群Ｍ１を含む。判定部２２は、第１学習済みモデル群Ｍ１の中から、特定部２１が特定したカテゴリに対応する一の第１学習済みモデルを選択する。判定部２２は、複数の係数Ｋ１１のうち当該一の第１学習済みモデルに対応する係数Ｋ１１を適用した第１学習済みモデルを用いて、合成画像ＳＧにおける複数の補正画像の相互の繋ぎ合わせが適切であるか否かを判定する。例えば、判定部２２は、カテゴリデータに基づいて、第１学習済みモデル群Ｍ１の中から合成画像ＳＧのカテゴリに応じた第１学習済みモデル（以下「対応第１学習済みモデル」と称する）を選択する。判定部２２は、対応第１学習済みモデルに、合成画像ＳＧを示す合成画像データを入力する。判定部２２は、合成画像データが入力された対応第１学習済みモデルから、繋ぎ合わせが適切であるか否かを示すデータを取得する。

　第２補正データ生成部２３は、第２学習済みモデル群Ｍ２を含む。第２補正データ生成部２３は、第２学習済みモデル群Ｍ２の中から、特定部２１の特定したカテゴリに応じた一の第２学習済みモデルを選択する。第２補正データ生成部２３は、複数の係数Ｋ１２のうち当該一の第２学習済みモデルに対応する係数Ｋ１２を適用した第２学習済みモデルを用いて、複数の入力画像に応じた第２補正データを生成する。例えば、第２補正データ生成部２３は、カテゴリデータに基づいて第２学習済みモデル群Ｍ２の中から合成画像ＳＧのカテゴリに応じた第２学習済みモデル（以下「対応第２学習済みモデル」と称する）を選択する。第２補正データ生成部２３は、対応第２学習済みモデルに第１画像データＳＤ１～第５画像データＳＤ５を入力する。第２補正データ生成部２３は、第１画像データＳＤ１～第５画像データＳＤ５が入力された対応第２学習済みモデルから、第２補正データを取得する。

　画像更新部２４は、第１補正データをスティッチング装置１０に供給する。画像更新部２４は、第１撮像装置Ｃ１～第５撮像装置Ｃ５の各々から取得した撮像に関するデータに基づいて第１補正データを生成してもよい。撮像に関するデータは、例えば、撮像装置の性能を示すデータ又はレンズの性能を示すデータである。画像更新部２４は、第１撮像装置Ｃ１～第５撮像装置Ｃ５を用いてキャリブレーションに用いる画像を撮像することによって得た第１画像データＳＤ１～第５画像データＳＤ５に基づいて、第１補正データを生成してもよい。

　判定部２２の判定結果が肯定である場合、画像更新部２４は、スティッチング装置１０によって生成された合成画像ＳＧを示す合成画像データを出力画像データＤｏｕｔとして出力インターフェース４０を介して外部に出力する。
　一方、判定部２２の判定結果が否定である場合、画像更新部２４は、第２補正データ生成部２３によって生成された第２補正データをスティッチング装置１０に供給することによって、第２補正データに基づいてスティッチング装置１０に合成画像ＳＧを更新させる。画像更新部２４は、更新された合成画像ＳＧ（更新合成画像）を示す合成画像データを出力画像データＤｏｕｔとして出力インターフェース４０を介して外部に出力する。

[１-２．画像処理装置１Ａの動作]
　次に、画像処理装置１Ａの動作を説明する。図６は、画像処理装置１Ａの動作の一例を示すフローチャートである。
　ステップＳ１において、処理装置２０は、画像更新部２４として機能することによって、第１補正データをスティッチング装置１０に出力する。第１補正データは、第１回目のスティッチング処理に用いられる。従って、第１補正データは初期値である。この結果、スティッチング装置１０は、第１補正データを用いて第１入力画像～第５入力画像を補正することによって、第１補正画像～第５補正画像を生成する。スティッチング装置１０は、第１補正画像～第５補正画像を相互に繋ぎ合わせた合成画像ＳＧを生成する。

　ステップＳ２において、処理装置２０は、特定部２１として機能することによって、複数のカテゴリの中から、合成画像データの示す合成画像ＳＧの内容の種別に応じたカテゴリを特定する。ステップＳ２において、特定部２１は、第１補正データを用いて生成された合成画像データをカテゴリ学習済みモデルＭＣに入力する。続いて、特定部２１は、カテゴリ学習済みモデルＭＣが出力するデータに基づいて、合成画像ＳＧのカテゴリを特定する。続いて、特定部２１は、特定結果を示すカテゴリデータを生成する。

　ステップＳ３において、処理装置２０は、判定部２２として機能する。判定部２２は、カテゴリデータを基に、第１学習済みモデル群Ｍ１の中から特定部２１によって特定されたカテゴリに対応する第１学習済みモデル（対応第１学習済みモデル）を選択する。ステップＳ４において、処理装置２０は、判定部２２として機能することによって、選択された第１学習済みモデル（対応第１学習済みモデル）を用いて、合成画像ＳＧにおける複数の補正画像の繋ぎ合わせが適切か否かを判定する。

　ステップＳ４の判定結果が否定である場合、処理装置２０は、第２補正データ生成部２３として機能する。第２補正データ生成部２３は、カテゴリデータを基に、第２学習済みモデル群Ｍ２の中から、特定部２１によって特定されたカテゴリに対応する第２学習済みモデル（対応第２学習済みモデル）を選択する（ステップＳ５）。

　ステップＳ６において、処理装置２０は、第２補正データ生成部２３として機能することによって、選択された第２学習済みモデル（対応第２学習済みモデル）を用いて、複数の入力画像に応じた第２補正データを生成する。

　ステップＳ７において、処理装置２０は、画像更新部２４として機能することによって、第２補正データをスティッチング装置１０に出力する。スティッチング装置１０は、第２補正データを基に合成画像ＳＧを更新する。スティッチング装置１０は、更新された合成画像ＳＧを示す合成画像データを生成する。

　ステップＳ８において、処理装置２０は、画像更新部２４として機能することによって、更新された合成画像ＳＧを示す合成画像データを出力画像データＤｏｕｔとして出力する。

　ステップＳ４の判定結果が肯定である場合、処理装置２０は、画像更新部２４として機能することによって、第１補正データを基にスティッチング装置１０によって生成された合成画像データを出力画像データＤｏｕｔとして出力する。

　以上説明したように本実施形態によれば、画像処理装置１Ａは、スティッチング装置１０と、特定部２１と、判定部２２と、第２補正データ生成部２３と、画像更新部２４とを備える。
　スティッチング装置１０は、複数の入力画像を第１補正データに応じて補正することによって複数の補正画像を生成し、複数の補正画像を相互に繋ぎ合わせることによって合成画像ＳＧを生成する。
　特定部２１は、画像の内容の種別に関する複数のカテゴリの中から、合成画像ＳＧの内容の種別に応じたカテゴリを特定する。
　判定部２２は、複数のカテゴリと１対１に対応する複数の第１学習済みモデルであって画像における複数の画像の繋ぎ合わせが適切であるか否かを学習した複数の第１学習済みモデルの中から、特定部２１の特定したカテゴリに応じた一の第１学習済みモデルを選択する。判定部２２は、当該一の第１学習済みモデルを用いて、合成画像ＳＧにおける複数の補正画像の繋ぎ合わせが適切であるか否かを判定する。
　第２補正データ生成部２３は、複数のカテゴリと１対１に対応する複数の第２学習済みモデルであって複数の元画僧と補正データとの関係を学習した複数の第２学習済みモデルの中から、特定部２１が特定したカテゴリに応じた一の第２学習済みモデルを選択する。第２補正データ生成部２３は、当該一の第２学習済みモデルに複数の入力画像を入力することによって、第２補正データを生成する。
　画像更新部２４は、判定部２２の判定結果が肯定である場合、合成画像ＳＧを出力し、判定部２２の判定結果が否定である場合、第２補正データに基づいてスティッチング装置１０に合成画像ＳＧを更新させることによって更新合成画像を生成させ、更新合成画像を出力する。

　例えば、スポーツのカテゴリの合成画像ＳＧ１を生成するために用いられるスティッチング処理が、風景のカテゴリの合成画像ＳＧ２の生成するために用いられるスティッチング処理と共通であるとする。この場合、スポーツのカテゴリの合成画像ＳＧ１における複数の画像の継ぎ目の目立ち方は、風景のカテゴリの合成画像ＳＧ２における複数の画像の継ぎ目の目立ち方と異なる。画像処理装置１Ａは、複数のカテゴリと１対１に対応する複数の第１学習済みモデルの中から、合成画像ＳＧのカテゴリに対応する第１学習済みモデルを選択する。従って、画像処理装置１Ａは、カテゴリごとに、合成画像ＳＧにおける複数の補正画像の繋ぎ合わせが適切であるかを判断できる。

　画像処理装置１Ａは、複数のカテゴリと１対１に対応する複数の第２学習済みモデルの中から、合成画像ＳＧのカテゴリに対応する第２の学習済みモデルを選択する。従って、画像処理装置１Ａは、カテゴリごとに、第２補正データを生成できる。この結果、第１回目のスティッチング処理によって生成される合成画像ＳＧにおいて複数の補正画像の繋ぎ合わせが適切でなかった場合に、画像処理装置１Ａは、合成画像ＳＧのカテゴリに基づいて合成画像ＳＧを更新できる。よって、出力画像データＤｏｕｔの品質が向上する。

[２．第２実施形態]
　第２実施形態に係る画像処理システムは、画像処理装置１Ａの替わりに画像処理装置１Ｂを備える。

[２-１．画像処理装置１Ｂの構成]
　図７は、画像処理装置１Ｂの構成例を示すブロック図である。画像処理装置１Ｂは、制御プログラムＰＲ１の替わりに制御プログラムＰＲ２が記憶装置５０に記憶される点、及び第３学習済みモデル群Ｍ３を定める複数の係数Ｋ１３が記憶装置５０に記憶される点において、画像処理装置１Ａと相違する。加えて、画像処理装置１Ｂは、処理装置２０が制御プログラムＰＲ２を記憶装置５０から読み出して実行する点において、画像処理装置１Ａと相違する。さらに、画像処理装置１Ｂは、処理装置２０が画像更新部２４の替わりに画像更新部２４ｘとして機能する点、処理装置２０が第３補正データ生成部２５として機能する点、及び処理装置２０が選択部２６として機能する点において、画像処理装置１Ａと相違する。

　以下、相違点を中心に、画像処理装置１Ｂの構成について説明する。第３学習済みモデル群Ｍ３は、複数のカテゴリと１対１に対応する複数の第３学習済みモデルによって構成される。複数の第３学習済みモデルの各々は、第２画像補正データと、第２画像補正データを用いる補正処理によって生成される複数の画像の相互の繋ぎ合わせの適切度を示す評価値と、の関係を、第３教師データＴ３を用いた機械学習によって学習済みである。複数の第３学習済みモデルの各々が機械学習によって設定した複数の係数の集合が「第３学習済みモデル群Ｍ３を定める複数の係数Ｋ１３」に相当する。第３教師データＴ３は、第３入力データＴ３ａと第３ラベルデータＴ３ｂとの組を含む。第３入力データＴ３ａは、相互に繋ぎ合わせられる複数の補正画像の元になる複数の画像（元画像）と、第２画像補正データ（補正データ）と、の組である。第２画像補正データは、複数の元画像を繋ぎ合わせに適した複数の補正画像に補正するための補正処理において使用される。第３ラベルデータＴ３ｂは、第２画像補正データに対する評価値を示す。この評価値は、複数の補正画像の繋ぎ合わせの適切度を示す。第３学習済みモデルに、複数の元画像（例えば、複数の入力画像）と第２画像補正データ（例えば、後述の第３補正データ）が入力されると、第３学習済みモデルは、評価値を出力する。第３教師データＴ３は、第２画像補正データを用いたスティッチング処理によって生成される画像の内容の種別に基づいて、複数のカテゴリのいずれかに分類される。複数の第３学習済みモデルの各々は、対応するカテゴリに属する互いに異なる複数の第３教師データＴ３、すなわち、第３教師データセットを、学習フェーズにおいて学習済みである。第３教師データＴ３のカテゴリを特定する処理は、カテゴリ学習済みモデルＭＣを用いて実行されることが好ましい。

　複数の第３学習済みモデルの各々は、例えば、人工ニューラルネットワークによって構成される。複数の第３学習済みモデルの各々は、例えば、ＳＶＭによって構成されてもよい。図８は、第３学習済みモデルの構成例を示す模式図である。第３学習済みモデル１００は、入力層１１０、中間層１２０、及び出力層１３０を備える。この例では、図４に示されるように合成画像ＳＧは、５個の繋ぎ目Ｘ１２、Ｘ２３、Ｘ３４、Ｘ４５及びＸ５１を有する。なお、継ぎ目の数は５に限らない。繋ぎ目Ｘ１２は、第１補正画像ＣＧ１と第２補正画像ＣＧ２との境界である。繋ぎ目Ｘ２３は、第２補正画像ＣＧ２と第３補正画像ＣＧ３との境界である。繋ぎ目Ｘ３４は、第３補正画像ＣＧ３と第４補正画像ＣＧ４との境界である。繋ぎ目Ｘ４５は、第４補正画像ＣＧ４と第５補正画像ＣＧ５との境界である。繋ぎ目Ｘ５１は、第５補正画像ＣＧ５と第１補正画像ＣＧ１との境界である。

　出力層１３０は、５個の繋ぎ目Ｘ１２、Ｘ２３、Ｘ３４、Ｘ４５及びＸ５１と1対１に対応する５個の出力ノードＮ１、Ｎ２、Ｎ３、Ｎ４、及びＮ５を含む。出力ノードＮ１は、繋ぎ目Ｘ１２の適切度を示す個別評価値ｈ１を出力する。出力ノードＮ２は、繋ぎ目Ｘ２３の適切度を示す個別評価値ｈ２を出力する。出力ノードＮ３は、繋ぎ目Ｘ３４の適切度を示す個別評価値ｈ３を出力する。出力ノードＮ４は、繋ぎ目Ｘ４５の適切度を示す個別評価値ｈ４を出力する。出力ノードＮ５は、繋ぎ目Ｘ５１の適切度を示す個別評価値ｈ５を出力する。出力層１３０は、５個の繋ぎ目Ｘ１２、Ｘ２３、Ｘ３４、Ｘ４５及びＸ５１と１対１に対応する５つの係数ｋ１～ｋ５を保持する。出力層１３０は、個別評価値ｈ１～ｈ５に係数ｋ１～ｋ５をそれぞれ乗算する。例えば、出力層１３０は、複数の継ぎ目の各々について当該継ぎ目に対応する個別評価値を当該継ぎ目に対応する係数と乗算することによって、複数の乗算結果を生成する。出力層１３０は、複数の乗算結果の合計を示す評価値Ｈを生成する。

　第３補正データ生成部２５は、第２補正データに基づいて、複数の第３補正データを生成する。例えば、第３補正データ生成部２５は、相互に異なる複数の乱数値の各々に、第２補正データを加算することによって、複数の第３補正データを生成する。上述したように第２補正データは、複数のパラメータを含む。複数の乱数値の各々に、第２補正データを加算するとは、複数の乱数値の各々に、第２補正データが有する複数のパラメータの各々に加算することを意味する。乱数値は負の値をとり得る。

　第３補正データ生成部２５は、相互に異なる複数の所定値の各々に、第２補正データを加算することによって、複数の第３補正データを生成してもよい。

　第３補正データ生成部２５は、複数の乱数値の最小値から複数の乱数値の最大値までの範囲を、第１撮像装置Ｃ１から第５撮像装置Ｃ５までの種別、及び、第１レンズＬ１から第５レンズＬ５までの種別のうち、少なくとも一方に基づいて定めてもよい。第３補正データ生成部２５は、複数の所定値の最小値から複数の所定値の最大値までの範囲を、第１撮像装置Ｃ１から第５撮像装置Ｃ５までの種別、及び、第１レンズＬ１から第５レンズＬ５までの種別のうち、少なくとも一方に基づいて定めてもよい。これらの場合、第３補正データ生成部２５は、複数の第３補正データを、第１撮像装置Ｃ１から第５撮像装置Ｃ５までの種別、及び、第１レンズＬ１から第５レンズＬ５までの種別のうち、少なくとも一方に基づいて生成する。第２補正データは、合成画像ＳＧにおいて複数の補正画像の相互の繋ぎ合わせを適切にするためのパラメータセットである。従って、第３補正データが第２補正データから大きくずれると、スティッチング処理が失敗となる可能性が高くなる。複数の第３補正データが第２補正データから所定の範囲内に収まる場合、合成画像ＳＧの品質が低下することを抑制できる。

　選択部２６は、第３学習済みモデル群Ｍ３を含む。選択部２６は、第３学習済みモデル群Ｍ３の中から、特定部２１が特定したカテゴリに対応する一の第３学習済みモデルを選択する。選択部２６は、複数の係数Ｋ１３のうち当該一の第３学習済みモデルに対応する係数Ｋ１３を適用した第３学習済みモデルを用いて、複数の第３補正データと１対１に対応する複数の評価値を取得する。例えば、選択部２６は、当該一の第３学習済みモデルに、複数の第３補正データの各々を、複数の入力画像（第１入力画像～第５入力画像）とともに入力することによって、複数の第３補正データと１対１に対応する複数の評価値を取得する。選択部２６は、複数の第３補正データの中から、複数の評価値のうち最大の評価値に対応する一の第３補正データを選択する。

　画像更新部２４ｘは、判定部２２の判定結果が否定である場合、選択部２６によって選択された一の第３補正データに基づいて、スティッチング装置１０に合成画像ＳＧを更新させる。画像更新部２４ｘは、更新された合成画像ＳＧを示す合成画像データを出力画像データＤｏｕｔとして出力する。

[２-２．画像処理装置１Ｂの動作]
　次に、画像処理装置１Ｂの動作を説明する。画像処理装置１Ｂの動作は、ステップ７の替わりに、処理装置２０が更新処理を実行する点を除いて、図６に示される画像処理装置１Ａのフローチャートと同じである。

　図９は、更新処理の内容を示すフローチャートである。ステップＳ７１において、処理装置２０は、第３補正データ生成部２５として機能する。第３補正データ生成部２５は、第２補正データに基づいて、複数の第３補正データを生成する。例えば、第２補正データがパラメータＰ１１を含み、３個の第３補正データを生成する場合を想定する。第３補正データ生成部２５は、乱数値ＲＤＮ１、ＲＤＮ２、及びＲＤＮ３を生成する。第３補正データ生成部２５は、乱数値ＲＤＮ１にパラメータＰ１１を加算することによってパラメータＰ１１１を生成する。第３補正データ生成部２５は、乱数値ＲＤＮ２にパラメータＰ１１を加算することによってパラメータＰ１１２を生成する。第３補正データ生成部２５は、乱数値ＲＤＮ３にパラメータＰ１１を加算することによってパラメータＰ１１３を生成する。第３補正データ生成部２５は、パラメータＰ１１１を含む第３補正データ、パラメータＰ１１２を含む第３補正データ、及びパラメータＰ１１３を含む第３補正データを生成する。

　ステップＳ７２からステップＳ７７では、処理装置２０は、選択部２６として機能する。まず、選択部２６は、第３学習済みモデル群Ｍ３の中からステップＳ２において特定されたカテゴリに対応する第３学習済みモデル（以下「対応第３学習済みモデル」と称する）を選択する（ステップＳ７２）。

　次に、選択部２６は、複数の第３補正データの中から未選択の第３補正データを特定する（ステップＳ７３）。続いて、選択部２６は、対応第３学習済みモデルを用いて、特定された第３補正データに対応する評価値を取得する。例えば、選択部２６は、まず、複数の入力画像と第３補正データとを対応第３学習済みモデルに入力する。続いて、選択部２６は、複数の入力画像と第３補正データとが入力された対応第３学習済みモデルが出力するデータに基づいて評価値を生成する。

　次に、選択部２６は、未選択の第３補正データが有るかを判定する（ステップＳ７５）。ステップＳ７５における判定結果が肯定である場合、選択部２６は、処理をステップＳ７３に戻す。一方、ステップＳ７５における判定結果が否定である場合、複数の第３補正データと１対１に対応する複数の評価値が生成されている。このため、選択部２６は、複数の評価値の中から最大の評価値を特定する（ステップＳ７６）。

　次に、選択部２６は、複数の第３補正データの中から、最大の評価値に対応する第３補正データ（以下「対応第３補正データ」と称する）を特定する（ステップＳ７７）。

　ステップＳ７８において、処理装置２０は、画像更新部２４Ｘとして機能する。画像更新部２４Ｘは、ステップＳ７７において特定された第３補正データ（対応第３補正データ）をスティッチング装置１０に出力する。この結果、処理装置２０は、スティッチング装置１０に、最大の評価値を得た第３補正データに基づいて、合成画像ＳＧを更新させることができる。

　以上説明したように、画像処理装置１Ｂは、第３補正データ生成部２５と、選択部２６と、画像更新部２４ｘと、を含む。第３補正データ生成部２５は、第２補正データに基づいて、複数の第３補正データを生成する。選択部２６は、複数のカテゴリと１対１に対応する複数の第３学習済みモデルであって、複数の元画像と補正データとの組と、当該組内の補正データを用いる当該組内の複数の元画像に対する補正によって生成される複数の補正画像の相互の繋ぎ合わせの適切度を示す評価値と、の関係を学習した複数の第３学習済みモデルの中から、特定部２１が特定したカテゴリに応じた一の第３学習済みモデルを選択する。選択部２６は、当該一の第３学習済みモデルに、複数の第３補正データの各々を、複数の入力画像とともに入力することによって、複数の第３補正データと１対１に対応する複数の評価値を取得する。選択部２６は、複数の第３補正データの中から、複数の評価値のうち最大の評価値に対応する一の第３補正データを選択する。画像更新部２４ｘは、判定部２２の判定結果が否定である場合、一の第３補正データに基づいてスティッチング装置１０に合成画像ＳＧを更新させ、更新された合成画像ＳＧを示す合成画像データを出力画像データＤｏｕｔとして出力する。
　即ち、画像処理装置１Ｂは、一つの第２補正データを基に複数の第３補正データを生成する。画像処理装置１Ｂは、複数の第３補正データの中から、合成画像ＳＧにおける複数の補正画像の繋ぎ合わせについての適切度を示す評価値が最大である第３補正データ（対応第３補正データ）を特定する。画像処理装置１Ｂは、特定された第３補正データ（対応第３補正データ）を用いてスティッチング処理を実行することによって、合成画像ＳＧを更新できる。この結果、評価値が最大である第３補正データを用いてスティッチング処理を実行しない構成と比較して、画像処理装置１Ｂは、複数の補正画像が相互に適切に繋ぎ合わされた合成画像ＳＧを生成できる。

　また、第３補正データ生成部２５は、互いに異なる複数の乱数値の各々に第２補正データを加算することによって、複数の第３補正データを生成する。このため、第２補正データを基に生成された相互に異なる複数の第３補正データの各々について、画像処理装置１Ｂは、第３補正データを用いて生成される複数の補正画像の繋ぎ合わせの適切度を評価できる。この結果、スティッチング処理の精度が向上する。

[３．変形例]
　本発明は、以上に例示した実施形態に限定されない。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された２以上の態様を併合してもよい。

[第１変形例]
　上述した第２実施形態において、図８を参照して説明したように、複数の第３学習済みモデルの各々は、入力層１１０、中間層１２０、及び出力層１３０を有する人工ニューラルネットワークである。出力層１３０は、複数の補正画像の繋ぎ目と1対1に対応する複数の出力ノードＮ１～Ｎ５を有する。複数の出力ノードＮ１～Ｎ５は、それぞれ、対応する繋ぎ目の適切度を示す個別評価値ｈ１～ｈ５を出力する。出力層１３０は、複数の個別評価値ｈ１～ｈ５に1対１に対応する複数の係数ｋ１～ｋ５を有する。出力層１３０は、複数の個別評価値ｈ１～ｈ５の各々に、複数の係数ｋ１～ｋ５のうち対応する係数を乗算する。出力層１３０は、複数の乗算結果を合計することによって評価値Ｈを出力する。

　処理装置２０は、複数の係数ｋ１～ｋ５を、ユーザが指定する複数の繋ぎ目の重要度に応じて調整してもよい。例えば、図４に示す合成画像ＳＧにおいて繋ぎ目Ｘ３４の重要度が、繋ぎ目Ｘ５１の重要度よりも高い場合、繋ぎ目Ｘ３４に対応する係数ｋ３を大きくし、繋ぎ目Ｘ５１に対応する係数ｋ５を小さくしてもよい。３６０度の合成画像ＳＧであっても、利用者が着目すると予測される領域の重要度は、他の領域の重要度よりも高い。このように合成画像ＳＧの中に重要度が高い領域と重要度が低い領域がある場合、重要度が高い領域では補正画像の繋ぎ合わせに高い精度が要求される一方、重要度が低い領域では補正画像の繋ぎ合わせに高い精度は要求されない。そこで、処理装置２０は、ユーザが指定する複数の繋ぎ目の重要度に応じて複数の係数ｋ１～ｋ５を調整する。この場合、処理装置２０は、重要度の低い領域における繋ぎ合わせの精度よりも、重要度の高い領域における繋ぎ合わせの精度を高くできる。

[第２変形例]
　上述した各実施形態において、第１学習済みモデル群Ｍ１を定める複数の係数Ｋ１１、第２学習済みモデル群Ｍ２を定める複数の係数Ｋ１２、第３学習済みモデル群Ｍ３を定める複数の係数Ｋ１３、及びカテゴリ学習済みモデルＭＣを定める複数の係数Ｋ１Ｃは、記憶装置５０に記憶される。しかしながら、これらが外部装置に記憶されてもよい。この場合、画像処理装置１Ａ又は１Ｂは、通信網を介して外部装置と通信可能な通信装置を備える。画像処理装置１Ａ又は１Ｂは、通信装置を介して外部装置から、第１学習済みモデル群Ｍ１を定める複数の係数Ｋ１１、第２学習済みモデル群Ｍ２を定める複数の係数Ｋ１２、第３学習済みモデル群Ｍ３を定める複数の係数Ｋ１３、及びカテゴリ学習済みモデルＭＣを定める複数の係数Ｋ１Ｃを取得する。

[第３変形例]
　上述した第１実施形態において、画像処理装置１Ａは、合成画像ＳＧの内容の種別に応じたカテゴリを特定する特定部２１を備えたが、本開示はこれに限定されない。図１０は第３変形例に係る画像処理装置１Ｃの構成を示すブロック図である。
　画像処理装置１Ｃは、以下の点において、図３に示す第１実施形態の画像処理装置１Ａと相違する。特定部２１及びカテゴリ学習済みモデルＭＣが備えられない点。制御プログラムＰＲ１の替わりに制御プログラムＰＲ３が用いられる点。第１学習済みモデル群Ｍ１の替わりに第１学習済みモデルｍ１が用いられる点。第１学習済みモデル群Ｍ１を定める複数の係数Ｋ１１の替わりに第１学習済みモデルｍ１を定める複数の係数Ｋ１１ａが記憶装置５０に記憶される点。第２学習済みモデル群Ｍ２の替わりに第２学習済みモデルｍ２が用いられる点。第２学習済みモデル群Ｍ２を定める複数の係数Ｋ１２の替わりに第２学習済みモデルｍ２を定める複数の係数Ｋ１２ａが記憶装置５０に記憶される点。判定部２２の替わりに判定部２２ｘが用いられる点。第２補正データ生成部２３の替わりに第２補正データ生成部２３ｘが用いられる点。

　第１学習済みモデルｍ１は、画像において複数の画像の繋ぎ合わせが適切であるか否かを、第４教師データＴ４を用いた機械学習によって学習済みである。第１学習済みモデルｍ１の学習結果は、第１学習済みモデルｍ１を定める複数の係数Ｋ１１ａに反映される。第４教師データＴ４は、第４入力データＴ４ａと第４ラベルデータＴ４ｂとの組を含む。第４入力データＴ４ａは、複数の画像が繋ぎ合わされている複合画像を示す複合画像データである。第４ラベルデータＴ４ｂは、第４入力データＴ４ａが示す複合画像において複数の画像の繋ぎ合わせが適切であるかを示す。第１学習済みモデルｍ１は、互いに異なる複数の第４教師データＴ４、すなわち、第４教師データセットを、学習フェーズにおいて学習済みである。第４教師データＴ４のカテゴリは問わない。従って、第１学習済みモデルｍ１は全てのカテゴリに対応する。このため、第４教師データＴ４の数は、上述した第１学習済みモデル群Ｍ１内の１つの第１学習済みモデルに必要な第１教師データＴ１の数よりも多い。

　第２学習済みモデルｍ２は、第３画像補正データを、第５教師データＴ５を用いた機械学習によって学習済みである。第３画像補正データは、相互に繋ぎ合わせられる複数の補正画像の元になる複数の画像（元画像）を、繋ぎ合わせに適した複数の補正画像に補正するための補正処理において使用される。第２学習済みモデルｍ２の学習結果は、第２学習済みモデルｍ２を定める複数の係数Ｋ１２ａに反映される。第５教師データＴ５は、第５入力データＴ５ａと第５ラベルデータＴ５ｂとの組を含む。第５入力データＴ５ａは、複数の画像データである。当該複数の画像データは、複数の元画像を示す。第５ラベルデータＴ５ｂは、第３画像補正データ（補正データ）である。第２学習済みモデルｍ２に複数の画像データが入力されると、第２学習済みモデルｍ２は、第３画像補正データ（例えば、第２補正データ）を出力する。第２学習済みモデルｍ２は、互いに異なる複数の第５教師データＴ５、すなわち、第５教師データセットを、学習フェーズにおいて学習済みである。第５教師データＴ５のカテゴリは問わない。従って、第２学習済みモデルｍ２は全てのカテゴリに対応する。このため、第５教師データＴ５の数は、上述した第２学習済みモデル群Ｍ２内の１つの第２学習済みモデルに必要な第２教師データＴ２の数よりも多い。

　処理装置２０は、記憶装置５０から、制御プログラムＰＲ３を読み出す。処理装置２０は、制御プログラムＰＲ２を実行することによって、判定部２２ｘ、第２補正データ生成部２３ｘ、及び画像更新部２４として機能する。
　判定部２２ｘは、複数の係数Ｋ１１ａを適用した第１学習済みモデルｍ１を含む。判定部２２ｘは、第１学習済みモデルｍ１を用いて、合成画像ＳＧにおける複数の補正画像の繋ぎ合わせが適切であるか否かを判定する。判定部２２ｘは、この判定手法を用いる点において、第１学習済みモデル群Ｍ１のうち合成画像ＳＧのカテゴリに対応する第１学習済みモデルを用いて、合成画像ＳＧにおける複数の補正画像の繋ぎ合わせが適切であるか否かを判定する判定部２２と相違する。

　第２補正データ生成部２３ｘは、複数の係数Ｋ１２ａを適用した第２学習済みモデルｍ２を含む。第２補正データ生成部２３ｘは、第２学習済みモデルｍ２を用いて、複数の画像データＳＤ１～ＳＤ５に応じた第２補正データを生成する。第２補正データ生成部２３ｘは、この生成手法を用いる点において、第２学習済みモデル群Ｍ２のうち合成画像ＳＧのカテゴリに対応する第２学習済みモデルを用いて複数の画像データＳＤ１～ＳＤ５に応じた第２補正データを生成する第２補正データ生成部２３と相違する。

　画像処理装置１Ｃによれば、特定部２１を不要にできる。画像処理装置１Ｃは、１個の第１学習済みモデルｍ１及び１個の第２学習済みモデルｍ２を用いて、スティッチング処理を実行できるので、構成を簡素化しつつ、自然な合成画像ＳＧを生成できる。

[第４変形例]
　上述した第２実施形態において、画像処理装置１Ｂは、合成画像ＳＧの内容の種別に応じたカテゴリを特定する特定部２１を備えたが、本開示はこれに限定されない。図１１は第４変形例に係る画像処理装置１Ｄの構成を示すブロック図である。
　画像処理装置１Ｄは、以下の点において、図７に示す第２実施形態の画像処理装置１Ｂと相違する。特定部２１、選択部２６及びカテゴリ学習済みモデルＭＣが備えられない点。制御プログラムＰＲ３の替わりに制御プログラムＰＲ４が用いられる点。第１学習済みモデル群Ｍ１の替わりに第１学習済みモデルｍ１が用いられる点。第１学習済みモデル群Ｍ１を定める複数の係数Ｋ１１の替わりに第１学習済みモデルｍ１を定める複数の係数Ｋ１１ａが記憶装置５０に記憶される点。第２学習済みモデル群Ｍ２の替わりに第２学習済みモデルｍ２が用いられる点。第２学習済みモデル群Ｍ２を定める複数の係数Ｋ１２の替わりに第２学習済みモデルｍ２を定める複数の係数Ｋ１２ａが記憶装置５０に記憶される点。第３学習済みモデル群Ｍ３の替わりに第３学習済みモデルｍ３が用いられる点。第３学習済みモデル群Ｍ３を定める複数の係数Ｋ１３の替わりに第３学習済みモデルｍ３を定める複数の係数Ｋ１３ａが記憶装置５０に記憶される点。判定部２２の替わりに判定部２２ｘが用いられる点。第２補正データ生成部２３の替わりに第２補正データ生成部２３ｘが用いられる点。選択部２６の替わりに選択部２６ｘが用いられる点。

　第１学習済みモデルｍ１、第２学習済みモデルｍ２、判定部２２ｘ、及び第２補正データ生成部２３ｘは、上述した第３変形例において説明されている。
　第３学習済みモデルｍ３は、第４画像補正データと、第４画像補正データを用いる補正処理によって生成される複数の画像の相互の繋ぎ合わせの適切度を示す評価値と、の関係を、第６教師データＴ６を用いた機械学習によって学習済みである。例えば、第３学習済みモデルｍ３は、複数の元画像と第４画像補正データとの組と、第４画像補正データを用いる複数の元画像に対する補正によって生成される複数の補正画像の相互の繋ぎ合わせの適切度を示す評価値と、の関係を学習済みである。第３学習済みモデルｍ３の学習結果は、第３学習済みモデルｍ３を定める複数の係数Ｋ１３ａに反映される。第６教師データＴ６は、第６入力データＴ６ａと第６ラベルデータＴ６ｂとの組を含む。第６入力データＴ６ａは、相互に繋ぎ合わせられる複数の補正画像の元になる複数の画像（元画像）と、第４画像補正データ（補正データ）と、の組である。第４画像補正データは、複数の元画像を繋ぎ合わせに適した複数の補正画像に補正するための補正処理において使用される。第６ラベルデータＴ６ｂは、第４画像補正データに対する評価値を示す。この評価値は、複数の補正画像の繋ぎ合わせの適切度を示す。第３学習済みモデルｍ３に、複数の元画像（例えば、複数の入力画像）と第４画像補正データが入力されると、第３学習済みモデルｍ３は、評価値を出力する。第３学習済みモデルｍ３は、互いに異なる複数の第６教師データＴ６、すなわち、第６教師データセットを、学習フェーズにおいて学習済みである。第６教師データＴ６のカテゴリは問わない。従って、第３学習済みモデルｍ３は全てのカテゴリに対応する。このため、第６教師データＴ６の数は、上述した第３学習済みモデル群Ｍ３内の１つの第３学習済みモデルに必要な第３教師データＴ３の数よりも多い。

　処理装置２０は、記憶装置５０から制御プログラムＰＲ４を読み出す。処理装置２０は、制御プログラムＰＲ４を実行することによって、判定部２２ｘ、第２補正データ生成部２３ｘ、画像更新部２４ｘ、第３補正データ生成部２５、及び選択部２６ｘとして機能する。
　選択部２６ｘは、複数の係数Ｋ１３ａを適用した第３学習済みモデルｍ３を含む。選択部２６ｘは、第３学習済みモデルｍ３を用いて、複数の第３補正データと１対１に対応する複数の評価値を取得する。選択部２６ｘは、この取得手法を用いる点において、第３学習済みモデル群Ｍ３のうち合成画像ＳＧのカテゴリに対応する第３学習済みモデルを用いて複数の第３補正データと１対１に対応する複数の評価値を取得する選択部２６と相違する。

　第３補正データ生成部２５は、第２補正データに基づいて、複数の第３補正データを生成する。選択部２６ｘは、複数の元画像と補正データとの組と、評価値と、の関係を学習した第３学習済みモデルｍ３に、複数の第３補正データの各々を、複数の入力画像とともに入力することによって、複数の第３補正データと１対１に対応する複数の評価値を取得する。選択部２６ｘは、複数の第３補正データの中から、取得された複数の評価値のうち最大の評価値に対応する一の第３補正データを選択する。画像更新部２４ｘは、判定部２２ｘの判定結果が否定である場合、第２補正データの替わりに一の第３補正データに基づいてスティッチング装置１０に合成画像ＳＧを更新させる。画像更新部２４ｘは、更新された合成画像ＳＧを示す合成画像データを出力画像データＤｏｕｔとして出力する。

　画像処理装置１Ｄによれば、特定部２１を省略できる。画像処理装置１Ｄは、１個の第１学習済みモデルｍ１、１個の第２学習済みモデルｍ２、及び１個の第３学習済みモデルｍ３を用いて、スティッチング処理を実行できるので、構成を簡素化しつつ、自然な合成画像ＳＧを生成できる。

[４．その他]
（１）上述した実施形態において、記憶装置５０は、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク)、スマートカード、フラッシュメモリデバイス(例えば、カード、スティック、キードライブ)、ＣＤ－ＲＯＭ（Compact　Disc－ＲＯＭ）、レジスタ、リムーバブルディスク、ハードディスク、フロッピー（登録商標）ディスク、磁気ストリップ、データベース、サーバその他の適切な記憶媒体を含んでもよい。また、プログラムは、電気通信回線を介してネットワークから送信されてもよい。

（２）上述した実施形態において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

（３）上述した実施形態において、入出力された情報等は特定の場所（例えば、メモリ）に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

（４）上述した実施形態において、判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：true又はfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

（５）上述した実施形態において例示した処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。

（６）図３及び図７に例示された各機能は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した１つの装置を用いて実現されてもよいし、物理的又は論理的に分離した２つ以上の装置を直接的又は間接的に（例えば、有線、無線などを用いて）接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記１つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。

（７）上述した実施形態で例示したプログラムは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

　また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術（同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ：Digital　Subscriber　Line）など）及び無線技術（赤外線、マイクロ波など）の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有接続線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。

（８）上述した実施形態において、「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、２又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された２つの要素間に１又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、２つの要素は、１又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光（可視及び不可視の両方）領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。

（９）上述した実施形態において、「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

（１０）上述した実施形態において、「含む（include）」、「含んでいる（including）」及びそれらの変形が使用されている場合、これらの用語は、用語「備える（comprising）」と同様に、包括的であることが意図される。更に、本開示において使用されている用語「又は（or）」は、排他的論理和ではないことが意図される。

（１１）本開示において、例えば、英語でのa,　an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。

（１２）本開示において、「ＡとＢが異なる」という用語は、「ＡとＢが互いに異なる」ことを意味してもよい。なお、当該用語は、「ＡとＢがそれぞれＣと異なる」ことを意味してもよい。「離れる」、「結合される」等の用語も、「異なる」と同様に解釈されてもよい。

（１３）本開示において説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

　以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されないことは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。従って、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

　１Ａ，１Ｂ…画像処理装置、１０…スティッチング装置、２０…処理装置、２１…特定部、２２…判定部、２３…第２補正データ生成部、２４，２４ｘ…画像更新部、２５…第３補正データ生成部、２６…選択部、１００…第３学習済みモデル、１１０…入力層、１２０…中間層、１３０…出力層、Ｍ１…第１学習済みモデル群、Ｍ２…第２学習済みモデル群、Ｍ３…第３学習済みモデル群、ＭＣ…カテゴリ学習済みモデル、ｍ１…第１学習済みモデル、ｍ２…第２学習済みモデル、ｍ３…第３学習済みモデル。

Claims

　複数の入力画像を第１補正データに応じて補正することによって複数の補正画像を生成し、前記複数の補正画像を相互に繋ぎ合わせることによって合成画像を生成する画像合成部と、
　複数の画像が相互に繋ぎ合わされた画像における前記複数の画像の繋ぎ合わせが適切であるか否かを学習した第１学習済みモデルを用いて、前記合成画像における前記複数の補正画像の繋ぎ合わせが適切であるか否かを判定する判定部と、
　相互に適切に繋ぎ合わされる複数の補正画像を生成するための複数の元画像の補正に使用される補正データと、前記複数の元画像と、の関係を学習した第２学習済みモデルに、前記複数の入力画像を入力することによって、第２補正データを生成する第２補正データ生成部と、
　前記判定部の判定結果が肯定である場合、前記合成画像を出力し、前記判定部の判定結果が否定である場合、前記第２補正データに基づいて前記画像合成部に前記合成画像を更新させることによって更新合成画像を生成させ、前記更新合成画像を出力する画像更新部と、
　を備える画像処理装置。
　前記第２補正データに基づいて、複数の第３補正データを生成する第３補正データ生成部と、
　複数の元画像と補正データとの組と、前記組内の補正データを用いる前記組内の複数の元画像に対する補正によって生成される複数の補正画像の相互の繋ぎ合わせの適切度を示す評価値と、の関係を学習した第３学習済みモデルに、前記複数の第３補正データの各々を、前記複数の入力画像とともに入力することによって、前記複数の第３補正データと１対１に対応する複数の評価値を取得し、前記複数の第３補正データの中から、前記複数の評価値のうち最大の評価値に対応する一の第３補正データを選択する選択部とを備え、
　前記画像更新部は、前記判定部の判定結果が否定である場合、前記一の第３補正データに基づいて前記画像合成部に前記更新合成画像を生成させ、前記更新合成画像を出力する、
　請求項１に記載の画像処理装置。
　画像の内容の種別に関する複数のカテゴリの中から、前記合成画像の内容の種別に応じたカテゴリを特定する特定部を備え、
　前記判定部は、前記複数のカテゴリと１対１に対応する複数の第１学習済みモデルであって画像における複数の画像の繋ぎ合わせが適切であるか否かを学習した複数の第１学習済みモデルの中から、前記特定部が特定したカテゴリに応じた一の第１学習済みモデルを選択し、前記一の第１学習済みモデルを用いて、前記合成画像における前記複数の補正画像の繋ぎ合わせが適切であるか否かを判定し、
　前記第２補正データ生成部は、前記複数のカテゴリと１対１に対応する複数の第２学習済みモデルであって前記複数の元画像と前記補正データとの関係を学習した複数の第２学習済みモデルの中から、前記特定部が特定したカテゴリに応じた一の第２学習済みモデルを選択し、前記一の第２学習済みモデルに前記複数の入力画像を入力することによって、前記第２補正データを生成する、
　請求項１に記載の画像処理装置。
　前記第２補正データに基づいて、複数の第３補正データを生成する第３補正データ生成部と、
　前記複数のカテゴリと１対１に対応する複数の第３学習済みモデルであって、複数の元画像と補正データとの組と、前記組内の補正データを用いる前記組内の複数の元画像に対する補正によって生成される複数の補正画像の相互の繋ぎ合わせの適切度を示す評価値と、の関係を学習した複数の第３学習済みモデルの中から、前記特定部が特定したカテゴリに応じた一の第３学習済みモデルを選択し、前記一の第３学習済みモデルに、前記複数の第３補正データの各々を、前記複数の入力画像とともに入力することによって、前記複数の第３補正データと１対１に対応する複数の評価値を取得し、前記複数の第３補正データの中から、前記複数の評価値のうち最大の評価値に対応する一の第３補正データを選択する選択部とを備え、
　前記画像更新部は、前記判定部の判定結果が否定である場合、前記一の第３補正データに基づいて前記画像合成部に前記更新合成画像を生成させ、前記更新合成画像を出力する、
請求項３に記載の画像処理装置。
　前記第３補正データ生成部は、互いに異なる複数の乱数値に前記第２補正データを加算することによって、前記複数の第３補正データを生成する請求項２又は４に記載の画像処理装置。
　前記複数の入力画像は互いに異なる複数の撮像装置によって生成され、
　前記画像更新部は、前記複数の撮像装置から取得した撮像に関するデータに基づいて前記第１補正データを生成する、
　請求項１から５までのうちいずれか１項に記載の画像処理装置。
　前記複数の入力画像は互いに異なる複数の撮像装置によって生成され、
　前記第３補正データ生成部は、前記複数の撮像装置の種別、及び前記複数の撮像装置の各々で用いられるレンズの種別のうち、少なくとも一方に基づいて、前記複数の第３補正データを生成する、
　請求項２、４又は５に記載の画像処理装置。
　前記第３学習済みモデルは、入力層、中間層、及び出力層を有する人工ニューラルネットワークであり、
　前記補正によって生成される複数の補正画像を繋ぎ合わせることによって生成される画像は、複数の繋ぎ目を有し、
　前記出力層は、前記複数の繋ぎ目と１対１に対応する複数の出力ノードを有し、
　前記複数の出力ノードは、前記複数の繋ぎ目と１対１に対応する複数の個別評価値を出力し、
　前記複数の個別評価値の各々は、対応する継ぎ目の適切度を示し、
　前記出力層は、
　前記複数の繋ぎ目と１対１に対応する複数の係数を保持し、
　前記複数の継ぎ目の各々について当該継ぎ目に対応する個別評価値を当該継ぎ目に対応する係数と乗算することによって、複数の乗算結果を生成し、
　前記複数の乗算結果を合計することによって前記評価値を出力し、
　前記複数の係数は、ユーザが指定する前記複数の繋ぎ目の重要度に応じて調整される、
　請求項２、４、５、又は７に記載の画像処理装置。
　前記特定部は、複数の画像と前記複数のカテゴリとの関係を学習した第４学習済みモデルを用いて、前記複数のカテゴリの中から前記合成画像の種別に応じたカテゴリを特定する、
　請求項３、４又は８に記載の画像処理装置。