WO2024111246A1

WO2024111246A1 - 画像処理装置及びその制御方法、撮像装置、プログラム

Info

Publication number: WO2024111246A1
Application number: PCT/JP2023/035350
Authority: WO
Inventors: 保彦岩本
Original assignee: キヤノン株式会社
Priority date: 2022-11-25
Filing date: 2023-09-28
Publication date: 2024-05-30
Also published as: JP2024076885A

Abstract

画像処理装置は、機械学習により得られた辞書と、当該辞書の機械学習に用いられた複数の学習画像とを取得し、取得された複数の学習画像から、当該辞書の特性を表す情報として用いられる１つ以上の学習画像を選択し、選択された１つ以上の学習画像と当該辞書とを紐づける紐づけ情報を生成する。

Description

画像処理装置及びその制御方法、撮像装置、プログラム

　本発明は、画像処理装置及びその制御方法、撮像装置、プログラムに関する。

　メーカーが事前に機械学習を行った辞書（以下ＭＬ辞書）が搭載されたカメラが販売されている。この種のカメラでは、ＭＬ辞書を用いることにより、撮影された画像から、例えば人、犬、馬などの様々な被写体を検出することができる。また、機械学習の技術が広く普及したことにより、カメラに複数のＭＬ辞書を搭載することが提案されている。複数のＭＬ辞書を用いた構成として、特許文献１では、連続画像に対して過去にＭＬ辞書を用いて検出した結果に基づいて複数のＭＬ辞書を切り替えることが開示されている。また、特許文献２では、複数のＭＬ辞書の辞書毎の検出結果を解析し、各々の精度に応じて各々のＭＬ辞書を用いて検出を行う解析時間を変更することが開示されている。

特開２０２１－１３２３６９号公報特開２０２２－０３９６６７号公報

S. Haykin, "Neural Networks A Comprehensive Foundation 2nd Edition", Prentice Hall, pp.156-255, July 1998　（実施形態で参照される）

　しかしながら、カメラに搭載された複数のＭＬ辞書から、ユーザが用途に応じて好みのＭＬ辞書を選択して用いることは想定されていない。複数のＭＬ辞書から好みの辞書をユーザが選択する場合、選択されるＭＬ辞書の特性を事前にユーザが把握できることが望ましい。例えば、馬を検出することが可能なＭＬ辞書であっても、特殊な姿勢の検出に適したＭＬ辞書、シマウマなどの類似種の検出に適したＭＬ辞書などの様に、複数のＭＬ辞書において特性に差があることが考えられるためである。従来、ＭＬ辞書の性能を表現する方法については提案されておらず、ユーザは複数のＭＬ辞書から１つを選択して利用しようとする際に、予めＭＬ辞書の特性を把握することが困難な場合がある。

　本発明の一態様では、機械学習により得られた辞書の特性をユーザに把握させるための情報を生成することが可能な構成を提供する。

　本発明の一態様による画像処理装置は以下の構成を備える。すなわち、
　機械学習により得られた辞書と、前記辞書の前記機械学習に用いられた複数の学習画像とを取得する取得手段と、
　前記複数の学習画像から、前記辞書の特性を表す情報として用いられる１つ以上の学習画像を選択する選択手段と、
　前記選択手段により選択された前記１つ以上の学習画像と前記辞書とを紐づける紐づけ情報を生成する生成手段と、を備える。

　本発明の一態様によれば、機械学習により得られた辞書の特性をユーザに把握させるための情報を生成することができる。

　本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。

　添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
第１実施形態における撮像装置のブロック図である。撮像装置における辞書切替部の機能構成例を示すブロック図である。第１実施形態の被写体検出部における、ＣＮＮの構成例を示す模式図である。第１実施形態におけるＣＮＮの部分構成の例を示す模式図である。第１実施形態の被写体分類部における、ＣＮＮの構成例を示す模式図である。第１実施形態によるＭＬ辞書の切り替え処理を示すフローチャートである。第１実施形態による紐づけ情報生成処理を示すフローチャートである。第１実施形態による対象画像選択処理を示すフローチャートである。第１実施形態による対象画像選択処理を示すフローチャートである。第１実施形態における辞書特性表現の表示例を示す模式図である。第１実施形態における辞書特性表現の表示例を示す模式図である。第２実施形態による対象画像選択処理を示すフローチャートである。第３実施形態による紐づけ情報生成処理を示すフローチャートである。第３実施形態による被写体分類結果の例を示す図である。第３実施形態による対象画像選択処理を示すフローチャートである。第３実施形態による辞書特性表現の表示例を示す模式図である。第３実施形態による辞書特性表現の表示例を示す模式図である。第４実施形態による画像処理システムの構成例を示すブロック図である。第４実施形態によるクラウドシステムの構成例を示すブロック図である。第４実施形態による処理を示すフローチャートである。第４実施形態による処理を示すフローチャートである。第４実施形態による処理を示すフローチャートである。

　以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

　＜第１実施形態＞
　（撮像装置の構成）
　図１Ａは、第１実施形態による撮像装置１００の構成例を示すブロック図である。撮像装置１００は、被写体を撮影して、動画や静止画のデータをテープ、固体メモリ、光ディスク、磁気ディスクなどの各種メディアに記録する。撮像装置１００の例としては、デジタルスチルカメラやビデオカメラなどがあげられるが、これらに限定されるものではない。撮像装置１００内の各部はバス１６０を介して接続されている。また各部は、ＣＰＵ１５１（中央演算処理装置）により制御される。撮像装置１００には、画像処理部１５２、画像圧縮解凍部１５３、被写体検出部１６２、被写体分類部１６３、辞書切替部１６４などで構成される画像処理装置が組み込まれている。

　レンズユニット１０１は、固定１群レンズ１０２、ズームレンズ１１１、絞り１０３、固定３群レンズ１２１、および、フォーカスレンズ１３１を備えて構成される。絞り制御部１０５は、ＣＰＵ１５１の指令に従い、絞りモータ１０４（ＡＭ）を介して絞り１０３を駆動することにより、絞り１０３の開口径を調整して撮影時の光量調節を行う。絞り制御部１０５により、特定の被写体領域の輝度値を用いた露出制御が行われる。ズーム制御部１１３は、ズームモータ１１２（ＺＭ）を介してズームレンズ１１１を駆動することにより、焦点距離を変更する。フォーカス制御部１３３は、レンズユニット１０１のピント方向のずれ量に基づいてフォーカスモータ１３２（ＦＭ）を駆動する駆動量を決定する。フォーカス制御部１３３は、フォーカスモータ１３２（ＦＭ）を介してフォーカスレンズ１３１を駆動することにより、焦点調節状態を制御する。フォーカス制御部１３３およびフォーカスモータ１３２によるフォーカスレンズ１３１の移動制御により、例えば特定の被写体領域に対するＡＦ制御が実現される。フォーカスレンズ１３１は、焦点調節用レンズであり、図１Ａには単レンズで簡略的に示されているが、通常複数のレンズで構成される。

　撮像素子１４１は、被写体の光学像を電気信号へ変換する光電変換を行う光電変換素子である。撮像素子１４１には、横方向にｍ画素、縦方向にｎ画素の受光素子が配置されている。レンズユニット１０１を介して撮像素子１４１上に結像する被写体像は、撮像素子１４１により電気信号に変換される。撮像素子１４１上に結像されて光電変換された画像は、撮像信号処理部１４２により画像信号（画像データ）として整えられ、撮像面の画像として取得される。撮像信号処理部１４２から出力される画像データは、撮像制御部１４３に送られ、一時的にＲＡＭ１５４（ランダムアクセスメモリ）に蓄積される。ＲＡＭ１５４に蓄積された画像データは、画像圧縮解凍部１５３にて圧縮された後、記録媒体１５７に記録される。これと並行して、ＲＡＭ１５４に蓄積された画像データは、画像処理部１５２に送られる。

　撮像制御部１４３は、撮像素子１４１の蓄積時間、撮像素子１４１から撮像信号処理部１４２へ出力を行う際のゲインの設定値の指示をＣＰＵ１５１から受け取り、撮像素子１４１を制御する。ＣＰＵ１５１は、蓄積時間およびゲインの設定値を、操作スイッチ１５６から入力された操作者からの指示、あるいは、一時的にＲＡＭ１５４に蓄積された画像データの画素信号の大きさに基づいて設定する。

　画像処理部１５２は、画像信号を処理し、画像データに対して最適なサイズへの縮小・拡大処理や画像データ同士の類似度算出等を行う。最適なサイズに処理された画像データが適宜ディスプレイ１５０に送られ、表示されることでプレビュー画像表示やスルー画像表示が行われる。また、ディスプレイ１５０の画像表示において、被写体検出部１６２の被写体検出結果を重畳表示することもできる。例えば、ディスプレイ１５０では、被写体検出結果が矩形などで表示され得る。またＲＡＭ１５４をリングバッファとして用いることで、所定期間内に撮像された複数の画像データと、画像データ毎に対応した被写体検出部１６２の検出結果をバッファリングできる。また同様に、被写体検出部１６２の学習に用いた画像データと画像データに対応した被写体検出結果をバッファリングできる。また、画像処理部１５２は、被写体領域に基づいたガンマ補正、ホワイトバランス処理などを行う。

　操作スイッチ１５６はタッチパネルやボタンなどを含む入力インターフェイスである。操作スイッチ１５６を用いてディスプレイ１５０に表示される種々の機能アイコンを選択することなどにより、様々な操作が行える。例えば、ユーザは、ディスプレイ１５０に表示された撮影画像を見ながら、機械学習に用いる画像の選定や、機械学習に必要な操作（例えば、画像に対応した２次元的な正解領域の指定など）が行える。また、ユーザは、通信部１６１を介して取得され、ディスプレイ１５０に表示されたクラウドシステムのＧＵＩを見ながら、ダウンロードするＭＬ辞書の選定やダウンロードの指示を行うことができる。

　記録媒体１５７は、ＳＤカードなどの記録メディアであり、撮像信号処理部１４２から出力される画像データ、被写体検出部１６２や、被写体分類部１６３に適用可能な複数のＭＬ辞書、などが記録される。被写体検出部１６２に適用されるＭＬ辞書には、各々の機械学習に用いた学習画像や、後述の紐づけ情報も併せて記録される。被写体分類部１６３に適用されるＭＬ辞書には、被写体分類結果の各分類、各クラスに対応したアイコン画像も記録される。通信部１６１は、イーサネットや無線によりクラウドシステム等と接続し、ＭＬ辞書や学習画像などのＭＬ辞書に関連する情報を通信する。

　被写体検出部１６２は、記録媒体１５７に記録された複数のＭＬ辞書から選択されたＭＬ辞書を適用し、画像信号を用いて馬などの被写体が存在する領域を決定する。被写体検出部１６２における写体検出処理は、ＤＮＮ（Deep Neural Networks）による特徴抽出処理により実現される。被写体検出部１６２の構成については、詳細に後述する。

　被写体分類部１６３は、記録媒体１５７に記録されたＭＬ辞書を適用し、画像信号を用いて被写体が予め定めた何れのクラスに属するかを分類する。被写体分類部１６３における分類処理は、ＤＮＮ（Deep Neural Networks）による特徴抽出処理により実現する。被写体分類部１６３では、適宜適用するＭＬ辞書を切り替えることで、被写体の種の分類、姿勢の分類、装飾品の有無の分類、毛色の分類等の種々の多クラス分類が可能である。被写体分類部１６３の構成については、詳細に後述する。

　辞書切替部１６４は、操作スイッチ１５６への所定のユーザ操作に応じて、被写体検出部１６２が用いるＭＬ辞書を、複数のＭＬ辞書から選択されたＭＬ辞書に切り替える。図１Ｂは、辞書切替部１６４の機能構成例を示すブロック図である。切替制御部２０１は、操作スイッチ１５６からのユーザ操作を受け付けて辞書切替部１６４の各機能部を制御するとともに、辞書切替操作時のディスプレイ１５０への表示制御を行う。特性取得部２０２は、記録媒体１５７に記録されている紐づけ情報に基づいてＭＬ辞書の特性表現を切替制御部２０１に提供する。紐づけ情報生成部２０３は、ＭＬ辞書の機械学習に用いられた複数の学習画像から、特性表現に用いられる学習画像を選択し、ＭＬ辞書と選択された学習画像とを紐づける紐づけ情報を生成し、記録媒体１５７に記録する。辞書切替部１６４の詳細については、後述する。

　図１Ａに戻り、バッテリ１５９は、電源管理部１５８により管理され、撮像装置１００の全体に安定した電源供給を行う。フラッシュメモリ１５５には、撮像装置１００の動作に必要な制御プログラムや、各部の動作に用いるパラメータ等が記録されている。ユーザの操作により撮像装置１００が起動すると（電源ＯＦＦ状態から電源ＯＮ状態へ移行すると）、フラッシュメモリ１５５に格納された制御プログラム及びパラメータがＲＡＭ１５４の一部に読み込まれる。ＣＰＵ１５１は、ＲＡＭ１５４にロードされた制御プログラム及びパラメータに従って撮像装置１００の動作を制御する。

　（被写体検出部１６２の構成）
　本実施形態では、被写体検出部１６２をＣＮＮ（Convolutional Neural Networks）で構成するが、それに制約されるものではなく、機械学習技術を用いたＤＮＮであれば本開示の実施形態となる。ＣＮＮの基本的な構成について、図２および図３を用いて説明する。図２は、入力された２次元画像データから被写体を検出するＣＮＮの基本的な構成を示す。図２において、左端が入力であり、右方向に処理が進んでいく。ＣＮＮは、特徴検出層（Ｓ層）と特徴統合層（Ｃ層）と呼ばれる２つの層を一つのセットとし、それが階層的に構成されている。

　ＣＮＮでは、まずＳ層において前段階層で検出された特徴をもとに次の特徴を検出する。またＳ層において検出した特徴をＣ層で統合し、その階層における検出結果として次の階層に送る構成になっている。Ｓ層は特徴検出細胞面からなり、特徴検出細胞面ごとに異なる特徴を検出する。また、Ｃ層は、特徴統合細胞面からなり、前段の特徴検出細胞面での検出結果をプーリングする。以下では、特に区別する必要がない場合、特徴検出細胞面および特徴統合細胞面を総称して特徴面と呼ぶ。本実施形態では、最終段階層である出力層ではＣ層は用いずＳ層のみで構成している。

　特徴検出細胞面での特徴検出処理、および特徴統合細胞面での特徴統合処理の詳細について、図３を用いて説明する。特徴検出細胞面は、複数の特徴検出ニューロンにより構成され、特徴検出ニューロンは前段階層のＣ層に所定の構造で結合している。また特徴統合細胞面は、複数の特徴統合ニューロンにより構成され、特徴統合ニューロンは同階層のＳ層に所定の構造で結合している。図３に示した、Ｌ階層目Ｓ層のＭ番目細胞面内において、位置(ξ,ζ)の特徴検出ニューロンの出力値をy^LS _M(ξ,ζ)、Ｌ階層目Ｃ層のＭ番目細胞面内において、位置(ξ,ζ)の特徴統合ニューロンの出力値をy^LC _M(ξ,ζ)と表記する。その時、それぞれのニューロンの結合係数をw^LS _M(n,u,v)、w^LC _M(u,v)とすると、各出力値は以下の［数1］、［数２］のように表すことができる。

　［数１］のfは活性化関数であり、ロジスティック関数や双曲正接関数などのシグモイド関数であれば何でも良く、例えばtanh関数で実現して良い。u^LS _M(ξ,ζ)は、Ｌ階層目Ｓ層のＭ番目細胞面における、位置(ξ,ζ)の特徴検出ニューロンの内部状態である。数式２は活性化関数を用いず単純な線形和をとっている。［数２］のように活性化関数を用いない場合は、ニューロンの内部状態u^LC _M(ξ,ζ)と出力値y^LC _M(ξ,ζ)は等しい。また、［数１］のy^L-1C _n(ξ+u,ζ+v)、［数２］のy^LS _M(ξ+u,ζ+v)をそれぞれ特徴検出ニューロン、特徴統合ニューロンの結合先出力値と呼ぶ。

　［数１］及び［数２］中のξ,ζ,u,v,nについて説明する。位置(ξ,ζ)は入力画像における位置座標に対応しており、例えばy^LS _M(ξ,ζ)が高い出力値である場合は、入力画像の画素位置(ξ,ζ)に、Ｌ階層目Ｓ層Ｍ番目細胞面において検出する特徴が存在する可能性が高いことを意味する。またｎは［数２］において、Ｌ－１階層目Ｃ層ｎ番目細胞面を意味しており、統合先特徴番号と呼ぶ。基本的にＬ－１階層目Ｃ層に存在する全ての細胞面についての積和演算を行う。(u,v)は、結合係数の相対位置座標であり、検出する特徴のサイズに応じて有限の範囲(u,v)において積和演算を行う。このような有限な(u,v)の範囲を受容野と呼ぶ。また受容野の大きさを、以下では受容野サイズと呼び、結合している範囲の横画素数×縦画素数で表す。

　また［数１］において、Ｌ＝１つまり一番初めのＳ層では、y^L-1C _n(ξ+u,ζ+v)は、入力画像y^in_image(ξ+u,ζ+v)または、入力位置マップy^in_posi_map(ξ+u,ζ+v)となる。ちなみにニューロンや画素の分布は離散的であり、結合先特徴番号も離散的なので、ξ,ζ,u,v,nは連続な変数ではなく、離散的な値をとる。ここでは、ξ,ζは非負整数、nは自然数、u,vは整数とし、何れも有限な範囲となる。

　［数１］中のw^LS _M(n,u,v)は、所定の特徴を検出するための結合係数分布であり、これを適切な値に調整することによって、所定の特徴を検出することが可能になる。この結合係数分布の調整が学習であり、ＣＮＮの構築においては、さまざまなテストパターンを提示して、y^LS _M(ξ,ζ)が適切な出力値になるように、結合係数を繰り返し徐々に修正していくことで結合係数の調整を行う。

　次に、［数２］中のw^LC _M(u,v)は、２次元のガウシアン関数を用いており、以下の［数３］のように表すことができる。

　ここでも、(u,v)は有限の範囲としてあるので、特徴検出ニューロンの説明と同様に、有限の範囲を受容野といい、範囲の大きさを受容野サイズと呼ぶ。この受容野サイズは、ここではＬ階層目Ｓ層のＭ番目特徴のサイズに応じて適当な値に設定すれば良い。［数３］中の、σは特徴サイズ因子であり、受容野サイズに応じて適当な定数に設定しておけば良い。具体的には、受容野の一番外側の値がほぼ０とみなせるような値になるように設定するのが良い。

　上述のような演算を各階層で行うことで、被写体検出部１６２の最終階層のＳ層において被写体検出を行うのが、本実施形態における被写体検出部１６２の構成である。

　（被写体検出部１６２の学習方法）
　具体的な被写体検出部１６２の学習方法について説明する。本実施形態では教師ありの学習により、結合係数の調整を行う。教師ありの学習では、テストパターンを与えて実際にニューロンの出力値を求め、その出力値と教師信号（そのニューロンが出力すべき望ましい出力値）の関係から結合係数w^LS _M(n,u,v)の修正を行えば良い。本実施形態の学習においては、最終層の特徴検出層は最小二乗法を用い、中間層の特徴検出層は誤差逆伝搬法を用いて結合係数の修正を行う。なお、最小二乗法や、誤差逆伝搬法等の、結合係数の修正手法の詳細は、非特許文献１を参照されたい。

　被写体検出部１６２では、学習用のテストパターンとして、検出すべき特定パターンと、検出すべきでないパターンを多数用意する。各テストパターンは、画像および教師信号を１セットとする。活性化関数にtanh関数を用いる場合は、検出すべき特定パターンを提示した時は、最終層の特徴検出細胞面の、特定パターンが存在する領域のニューロンに対し、出力が１となるように教師信号を与える。逆に、検出すべきでないパターンを提示した時は、そのパターンの領域のニューロンに対し、出力が－１となるように教師信号を与える。実際の検出においては、学習により構築した結合係数w^LS _M(n,u,v)を用いて演算をおこない、最終層の特徴検出細胞面上のニューロン出力が、所定値以上であれば、そこに被写体が存在すると判定する。以上により、被写体検出部１６２は、２次元画像から被写体検出できるように構築される。

　（被写体分類部１６３の構成）
　本実施形態では、被写体分類部１６３をＣＮＮで構成するが、それに制約されるものではなく、機械学習技術を用いたＤＮＮであれば本開示の実施形態となる。ＣＮＮの基本的な構成について、図４を用いて説明する。被写体分類部１６３のＣＮＮでは、ｎ層の出力数ｋが分類したいクラスの個数になるように構成する。また、活性化関数にはソフトマックス関数を用いる。その他の部分については被写体検出部１６２における構成と同様のため割愛する。上述のような演算を各階層で行うことで、被写体分類部１６３の最終階層のＳ層において被写体分類を行うのが、本実施形態における被写体分類部１６３のＣＮＮ構成である。

　（被写体分類部１６３の学習方法）
　具体的な被写体分類部１６３の学習方法について説明する。被写体分類部１６３では、多クラスの各々に分類すべき特定パターンを多数用意する。各テストパターンは画像及び教師信号を１セットとする。活性化関数にソフトマックス関数を用いる場合は、正解クラスの出力が１、正解クラス以外の出力が０となるように教師信号を与える。また実際の分類においては、学習により構築した結合係数w^LS _M(n,u,v)を用いて演算をおこない、最終層の特徴検出細胞面上のニューロン出力が、所定値以上であるクラスに被写体は属していると判定する。

　上述のような学習を、複数の多クラス分類の各々に対して行った複数のＭＬ辞書を、予め用意しておき記録媒体１５７に記録しておく。その他の部分は、被写体検出部１６２における方法と同様のため割愛する。以上により、被写体分類部１６３は、２次元画像から被写体を多クラス分類できるように構築される。

　（辞書切替部１６４の全体処理の流れ）
　図５は本実施形態における辞書切替部１６４の全体処理を示すフローチャートである。なお、図１Ｂに示される辞書切替部１６４の各機能部は、ＣＰＵ１５１が所定のソフトウエアを実行することにより実現されてもよいし、専用のハードウエアにより実現されてもよいし、ソフトウエアとハードウエアの協働により実現されてもよい。

　Ｓ５００において、切替制御部２０１は、操作スイッチ１５６を用いた所定のユーザ操作（ＭＬ辞書の切り替え操作）に応じて、ディスプレイ１５０にＭＬ辞書の切替画面を表示する。切替画面の具体例については、図８Ａ、８Ｂを用いて後述する。Ｓ５０１において、切替制御部２０１は、ユーザから操作スイッチ１５６を介して、切替画面に表示されるＭＬ辞書を切り替える操作が行われたか判定する。ＭＬ辞書を切り替える操作が行われたと切替制御部２０１が判定した場合（Ｓ５０１でＹＥＳ）、処理はＳ５０２に進み、行われていないと切替制御部２０１が判定した場合（Ｓ５０１でＮＯ）、処理はＳ５０５に進む。

　Ｓ５０２において、特性取得部２０２は、Ｓ５０１で切り替えられた新たな表示対象のＭＬ辞書に関する紐づけ情報が記録媒体１５７に記録されているか判定する。表示対象のＭＬ辞書に関する紐づけ情報が記録媒体１５７に記録されていないと特性取得部２０２が判定した場合（Ｓ５０２でＮＯ）、処理はＳ５０３に進む。他方、表示対象のＭＬ辞書に関する紐づけ情報が記録媒体１５７に記録されていると特性取得部２０２が判定した場合（Ｓ５０２でＹＥＳ）、処理はＳ５０４に進む。

　Ｓ５０３において、紐づけ情報生成部（以下、生成部）２０３は、Ｓ５０１の表示切り替え操作後の表示対象のＭＬ辞書と、この表示対象のＭＬ辞書の学習に用いられた複数の学習画像とを記録媒体１５７から読み出し、当該ＭＬ辞書の紐づけ情報を生成する。生成部２０３は、得られた紐づけ情報を記録媒体１５７に記録する。ここで、紐づけ情報とは、ＭＬ辞書と、そのＭＬ辞書の特性を表すために選択された対象画像との組を表す情報であり、対象画像そのものを含む。Ｓ５０３の紐づけ情報の生成処理についての詳細は、図６、図７Ａ、図７Ｂにより後述する。

　次に、Ｓ５０４において、特性取得部２０２は、Ｓ５０１で切り替え操作が行われた後の表示対象のＭＬ辞書に関連する紐づけ情報を記録媒体１５７から読み出し、読み出した紐づけ情報により紐づけされている学習画像を取得する。切替制御部２０１は、表示対象のＭＬ辞書と、特性取得部２０２が取得した複数の学習画像とをディスプレイ１５０に表示することにより、切り替え後の表示対象のＭＬ辞書の特性を表現する。ディスプレイ１５０への表示、ＭＬ辞書の特性を表現する方法の詳細については、図８Ａ、８Ｂにより後述する。

　Ｓ５０５において、切替制御部２０１は、切替画面に表示中のＭＬ辞書に対して、ユーザから操作スイッチ１５６を介して、被写体検出部１６２に適用するＭＬ辞書を切り替える操作が行われたか判定する。ＭＬ辞書を切り替える操作が行われたと切替制御部２０１が判定した場合（Ｓ５０５でＹＥＳ）、処理はＳ５０６に進む。一方、ＭＬ辞書を切り替える操作が行われていないと切替制御部２０１が判定した場合（Ｓ５０５でＮＯ）、処理はＳ５０７に進む。Ｓ５０６において、切替制御部２０１は、ユーザからの切り替え操作に従って、被写体検出部１６２に適用されるＭＬ辞書を、現在の切替画面において表示対象となっているＭＬ辞書へ切り替える。以降、撮像装置１００におけるスルー画像や撮像画像に対して、Ｓ５０６で切り替えられたＭＬ辞書による被写体検出処理が可能になる。Ｓ５０７において、切替制御部２０１は、ユーザから操作スイッチ１５６を介して終了操作が行われたか判定する。終了操作が行われたと切替制御部２０１が判定した場合（Ｓ５０７でＹＥＳ）、本処理は終了する。終了操作が行われていないと切替制御部２０１が判定した場合（Ｓ５０７でＮＯ）、処理はＳ５０１に戻り、上述の処理が繰り返される。

　（紐づけ情報生成処理の流れ）
　図６は第１実施形態のＳ５０３において実行される、紐づけ情報を生成する処理のフローチャートである。

　Ｓ６００において、生成部２０３は、Ｓ５００による切り替え後の表示対象のＭＬ辞書の機械学習に用いられた複数の学習画像（以下、該当像群）の各々について、特徴ベクトルを算出する。これら該当画像群は、ＭＬ辞書に対応して記録媒体１５７に記録されている。なお、該当画像群は、ＭＬ辞書の機械学習に用いられた全ての学習画像を含むことが望ましいが、本開示の効果が損なわれない範囲で、機械学習に用いられた全ての学習画像から無作為抽出された学習画像で構成されてもよい。なお、Ｓ６００における特徴ベクトルの算出には、画像から特徴ベクトルを算出するための公知の手法を用いることができる。或いは、被写体検出部１６２に各々の学習画像を入力し、被写体検出部１６２により得られる中間データである、特徴統合層ｎ－１の出力を特徴ベクトルとして用いるようにしても良い。或いは、記録媒体１５７に記録されたいずれかのＭＬ辞書が適用された被写体分類部１６３に各々の学習画像を入力し、被写体分類部１６３により得られる中間データである、特徴統合層ｎ－１の出力を特徴ベクトルとして用いるようにしても良い。

　Ｓ６０１において、生成部２０３は、Ｓ６００において算出された特徴ベクトルを用いて、平均ベクトルを算出する。Ｓ６０２において、生成部２０３は、１枚目の対象画像が選択済みとなっているか判定する。１枚目の対象画像が選択済みでないと生成部２０３が判定した場合（Ｓ６０２でＮＯ）、処理はＳ６０３に進み、１枚目の対象画像が選択済みであると生成部２０３が判定した場合（Ｓ６０２でＹＥＳ）、処理はＳ６０４に進む。

　Ｓ６０３において、生成部２０３は、該当画像群の中から１枚目の対象画像を選択する。１枚目の対象画像の選択処理の詳細は、図７Ａのフローチャートの参照により後述する。また、Ｓ６０４では、生成部２０３は、該当画像群の中から２枚目以降の対象画像を選択する。２枚目の対象画像の選択処理の詳細は、図７Ｂのフローチャートの参照により後述する。次に、Ｓ６０５において、生成部２０３は、終了条件が満たされているか判定する。終了条件が満たされていると生成部２０３が判定した場合（Ｓ６０５でＹＥＳ）、処理はＳ６０６に進む。他方、終了条件が満たされていないと生成部２０３が判定した場合（Ｓ６０５でＮＯ）、処理はＳ６０２に戻り、上述の処理が繰り返される。ここで、Ｓ６０５で用いられる終了条件として、本実施形態では対象画像の選択数が用いられる。対象画像の選択数は、ＭＬ辞書の特性を表現する表示（Ｓ５０４）においてディスプレイ１５０に学習画像が表示される際に、ユーザが視認可能なサイズを考慮して設定される。本実施形態では、例えば４枚（１枚目の対象画像が１枚と、２枚目以降の対象画像が３枚）とする。Ｓ６０６において、生成部２０３は、Ｓ６０３とＳ６０４で選択された学習画像を特定する情報を表示対象のＭＬ辞書に関する紐づけ情報として記録媒体１５７に記録する。

　（対象画像選択処理）
　図７Ａは、１枚目の対象画像を選択する処理（Ｓ６０３）を示すフローチャートである。生成部２０３は、該当画像群（複数の学習画像）から得られる複数の特徴ベクトルのうち、それら複数の特徴ベクトルの平均ベクトルとの距離が最も小さい特徴ベクトルの学習画像を、１枚目の対象画像として選択する。

　Ｓ７００において、生成部２０３は、該当画像群の中から、着目学習画像を選択する。Ｓ７０１において、生成部２０３は、Ｓ７００で選択された着目学習画像が対象画像に選択済みか判定する。着目学習画像が対象画像に選択済みであると生成部２０３が判定した場合（Ｓ７０１でＹＥＳ）、処理はＳ７００に戻り、次の着目学習画像を選択する。他方、着目学習画像が対象画像に選択済みでないと生成部２０３が判定した場合（Ｓ７０１でＮＯ）、処理はＳ７０１に進む。対象画像の選択は、図６に示すフローチャートにおいて繰り返し実行されるため、本ステップにおける判定は重複して対象画像を選択させない意図を持つ。なお、図６に示されるように、Ｓ６０３の処理を用いて選択される対象画像が１枚の場合、Ｓ７０１は省略可能である。但し、平均ベクトルとの距離が近い順に複数枚の対象画像を選択する処理とした場合（例えば、Ｓ６０３の処理により複数の対象画像を選択する場合）には、Ｓ７０１が必要となる。

　Ｓ７０２において、生成部２０３は、Ｓ７００で選択された着目学習画像が紐づけ処理の対象となる条件を満たしているか判定する。着目学習画像が紐づけ処理の対象となる条件を満たしていると生成部２０３が判定した場合（Ｓ７０２でＹＥＳ）、処理はＳ７０３に進む。他方、着目学習画像が紐づけ処理の対象となる条件を満たしていない生成部２０３が判定した場合（Ｓ７０２でＮＯ）、処理はＳ７００に戻る。機械学習においては学習画像に含まれていてもＭＬ辞書の性能に十分な影響を及ぼさないことがある。そのため、紐づけ処理の対象となる条件（対象画像として選択されるための条件）の一つとして、ＭＬ辞書の特性に与える影響が小さい学習画像が対象画像として選択されないようにするための条件が設定されている。より具体的には、紐づけ処理の対象となる条件として、着目学習画像を被写体検出部１６２に投入した場合に被写体の検出が可能であること、があげられる。なお、このとき、被写体検出部１６２には、表示対象となっているＭＬ辞書が一時的に設定される。または、Ｓ６００で算出された特徴ベクトルの内、着目学習画像から算出された特徴ベクトルと距離が十分小さい特徴ベクトル（距離が所定の閾値以下となる特徴ベクトル）の割合が所定割合以上であることであってもよい。更に、ここでの距離とは、特徴ベクトルの類似度を表現する数値であれば何でもよく、例えばベクトル間のユークリッド距離やコサイン類似度であってよい。

　Ｓ７０３において、生成部２０３は、Ｓ６００で算出された特徴ベクトルの内、着目学習画像から算出した特徴ベクトルと、Ｓ６０１で算出された平均ベクトルとの距離を算出する。なお、ベクトル間の距離に関しては、Ｓ７０２で説明した距離と同様である。Ｓ７０４において、生成部２０３は、後述するＳ７０５において候補画像が選択済みとなっているか判定する。候補画像が選択済みとなっていないと生成部２０３が判定した場合（Ｓ７０４でＮＯ）、処理はＳ７０５に進み、候補画像が選択済みとなっていると生成部２０３が判定した場合（Ｓ７０４でＹＥＳ）、処理はＳ７０６に進む。

　Ｓ７０５において、生成部２０３は、着目学習画像を候補画像として選択する。一方、Ｓ７０６において、生成部２０３は、Ｓ７０５またはＳ７０７で選択済みとなっている候補画像の特徴ベクトルと平均ベクトルとの距離よりも、着目学習画像の特徴ベクトルと平均ベクトルとの距離が小さいか判定する。着目学習画像の特徴ベクトルと平均ベクトルとの距離が、候補画像の特徴ベクトルと平均ベクトルとの距離よりも小さいと生成部２０３が判定した場合（Ｓ７０６でＹＥＳ）、処理はＳ７０７に進む。他方、着目学習画像の特徴ベクトルと平均ベクトルとの距離が、候補画像の特徴ベクトルと平均ベクトルとの距離よりも小さくないと生成部２０３が判定した場合（Ｓ７０６でＮＯ）、処理はＳ７０８に進む。Ｓ７０６における判定は、より平均ベクトルと距離が小さい特徴ベクトルが得られる学習画像を候補画像に選択する意図を持つ。Ｓ７０７において、生成部２０３は、候補画像を現在の着目学習画像に変更する。

　Ｓ７０８において、生成部２０３は、該当画像群において、着目学習画像に選択されていない学習画像が存在するか判定する。着目学習画像に選択されていない学習画像が存在すると生成部２０３が判定した場合（Ｓ７０８でＹＥＳ）、処理はＳ７００に戻り、上述の処理が繰り返される。他方、着目学習画像に選択されていない学習画像が存在しないと生成部２０３が判定した場合（Ｓ７０８でＮＯ）、処理はＳ７０９に進む。Ｓ７０９において、生成部２０３は、候補画像となっている着目学習画像を対象画像に選択する。

　以上のような図７Ａの処理によれば、該当画像群の中から、最も平均ベクトルと距離が小さい特徴ベクトルが得られる学習画像が対象画像に選択される。即ちＳ５０１で切り替え指示があった対象のＭＬ辞書の性能を表す、代表的な学習画像が選択される。

　図７Ｂは第１実施形態のＳ６０４において実行される、２枚目以降の対象画像を選択する処理を示すフローチャートである。本処理において、生成部２０３は、該当画像群から得られる複数の特徴ベクトルから、それら複数の特徴ベクトルの平均ベクトルとの距離が大きい順に所定数の特徴ベクトルを選択する。したがって、Ｓ６０４が所定回数繰り返されることにより、特徴ベクトルと平均ベクトルとの距離が大きい順に所定数の学習画像が選択される。図７Ｂにおいて、Ｓ７１６を除くＳ７１０からＳ７１９の処理は、図７ＡにおけるＳ７０６を除くＳ７００からＳ７０９の処理と同じである。Ｓ７１６において、生成部２０３は、Ｓ７１５またはＳ７１７で選択済みとなっている候補画像の特徴ベクトルと平均ベクトルとの距離よりも、着目学習画像の特徴ベクトルと平均ベクトルとの距離が大きいか判定する。着目学習画像の特徴ベクトルと平均ベクトルとの距離が、候補画像の特徴ベクトルと平均ベクトルとの距離よりも大きいと生成部２０３が判定した場合（Ｓ７１６でＹＥＳ）、処理はＳ７１７に進む。他方、着目学習画像の特徴ベクトルと平均ベクトルとの距離が、候補画像の特徴ベクトルと平均ベクトルとの距離よりも大きくないと生成部２０３が判定した場合（Ｓ７１６でＮＯ）、処理はＳ７１８に進む。Ｓ７１６における判定は、より平均ベクトルとの距離が大きい特徴ベクトルが算出される学習画像を候補画像に選択する意図を持つ。

　以上のような図７Ｂの処理によれば、該当画像群の中から、最も平均ベクトルと距離が大きい特徴ベクトルを得られる学習画像が対象画像に選択される。即ちＳ５０１で切り替え指示があったＭＬ辞書の性能を表す、特殊な学習画像が選択される。

　（辞書特性の表示例）
　図８Ａ、８Ｂは、Ｓ５００およびＳ５０４の処理により、切替制御部２０１がディスプレイ１５０に表示する切替画面の例を示す図である。辞書切替モードが指定されると、切替制御部２０１は、例えば、図８Ａに示される切替画面８ａを表示する。アイテム８００及び８０１は、操作スイッチ１５６の操作により表示対象のＭＬ辞書を切り替えるためのＧＵＩである。アイテム８００または８０１が操作されると、Ｓ５０１において切替制御部２０１は表示対象のＭＬ辞書を切り替える操作があったと判定する。アイテム８０２ａは表示対象のＭＬ辞書であり、記録媒体１５７に記録されている当該ＭＬ辞書のファイル名である「００１」と併記されている。

　エリア８０３ａは、ＭＬ辞書の特性を表現するためのエリアであり、Ｓ５０４の処理により表示される。図８Ａの例では、ＭＬ辞書「００１」の特性を表現するために選択された対象画像である、学習画像８０４ａから８０７ａが表示される。学習画像８０４ａはＳ６０３において１枚目の対象画像として選択された学習画像である。Ｓ６０３においては、代表的な学習画像が選択されやすく、学習画像８０４ａの例では、馬一匹が４足立ちしている学習画像である。学習画像８０５ａ、８０６ａ及び８０７ａは、Ｓ６０４において、２枚目以降の対象画像として選択された学習画像である。Ｓ６０４においては、特殊な学習画像が選択されやすく、学習画像８０５ａから８０７ａの例では、騎乗者あり、装飾具あり、複数被写体ありといった学習画像である。切替ボタン８０８は、被写体検出部１６２に適用するＭＬ辞書を切り替えるためのユーザ操作を受け付けるＧＵＩである。切替ボタン８０８が操作されると、Ｓ５０５において適用されるＭＬ辞書の切り替えが指示されたと判定される。

　以上のように、切替制御部２０１は、紐づけ情報に基づいて、辞書と１つ以上の学習画像とを関連付けて表示するための表示情報を生成し、これをディスプレイ１５０へ表示する表示情報生成部として機能する。そして、このような表示情報によれば、各辞書の辞書特性がユーザに提示される。ユーザは、例えば図８Ａの表示から、ＭＬ辞書「００１」が、例えば競馬場などでの撮影に向いたＭＬ辞書であることを、予め把握することができる。

　次に図８Ｂについて説明する。アイテム８００及び８０１、切替ボタン８０８は、図８Ａと同様である。アイテム８０２ｂは、アイテム８００または８０１の操作により表示対象となったＭＬ辞書を示し、記録媒体１５７に記録されている当該ＭＬ辞書のファイル名である「００２」と併記されている。エリア８０３ｂには、ＭＬ辞書「００２」の特性を表現するために選択された対象画像である、学習画像８０４ｂから８０７ｂが表示される。学習画像８０４ａは、Ｓ６０３において１枚目の対象画像として選択された学習画像の例である。学習画像８０５ｂ、８０６ｂ及び８０７ｂは、Ｓ６０４において２枚目以降の対象画像として選択された学習画像の例である。Ｓ６０４においては、特殊な学習画像が選択されやすく、学習画像８０５ｂから８０７ｂの例では、頭を下げる、伏せなどの姿勢やシマウマなどの類似種といった特徴的な学習画像である。

　以上の図８Ｂのような辞書特性の表示によれば、ユーザは例えば動物園などでの撮影に向いたＭＬ辞書であることを、予め把握することができる。

　以上、第１実施形態によれば、ＭＬ辞書に関して代表的な特徴や、特殊な特徴を備えた学習画像が表示される。このため、ユーザはそれらを確認することで、予め総合的な辞書特性を把握した上で、適用するＭＬ辞書を選択することができる。なお、上記実施形態では、選択される対象画像の総数を４、Ｓ６０３（図７Ａ）の処理により選択される対象画像（代表的な学習画像）の枚数を１、Ｓ６０４（図７Ｂ）の処理により選択される対象画像（特殊な学習画像）の枚数を３とした。しかし、本開示はこれに限られるものではなく、対象画像の総数、代表的な学習画像の枚数、特殊な学習画像の枚数は、任意に設定され得る。但し、特殊な学習画像を用いた方がＭＬ辞書の特性を広範囲に表すことができるので、総合的な特性を把握するという観点からすれば、特殊な学習画像の枚数が代表的な学習画像の枚数よりも多いことが望ましい。

　＜第２実施形態＞
　第１実施形態では、着目学習画像を２枚目以降の対象画像として選択するか否かを判定するために、着目学習画像の特徴ベクトルと平均ベクトルとの距離が用いられた。第２実施形態では、着目学習画像を２枚目以降の対象画像として選択するか否かを判定するために、１枚目の対象画像（代表的な学習画像）の特徴ベクトルとの距離が用いられる。第２実施形態の撮像装置１００の構成、機能、処理は、２枚目以降の対象画像を選択する処理を除いて、第１実施形態と同じである。以下、第２実施形態による２枚目以降の対象画像を選択する処理（図６のＳ６０４の処理）について、図９を参照して説明する。

　（紐づけ対象画像の選択処理）
　図９は第２実施形態のＳ６０４において実行される、２枚目以降の対象画像を選択する処理を示すフローチャートである。Ｓ９０３及びＳ９０６を除くＳ９００からＳ９０９の処理は、第１実施形態（図７Ｂ）のＳ７１３及びＳ７１６を除くＳ７１０からＳ７１９の処理と同じである。

　Ｓ９０３において、生成部２０３は、着目学習画像から算出された特徴ベクトルと、Ｓ６０３で選択された１枚目の対象画像から算出された特徴ベクトルとの距離を算出する。なお、これらの特徴ベクトルはＳ６００で算出される。Ｓ９０６において、生成部２０３は、Ｓ９０５またはＳ９０７で選択済みの候補画像の特徴ベクトルと１枚目の対象画像の特徴ベクトルとの距離よりも、着目学習画像の特徴ベクトルと１枚目の対象画像の特徴ベクトルとの距離が大きいか判定する。着目学習画像の特徴ベクトルと１枚目の対象画像の特徴ベクトルとの距離が選択済みの候補画像の特徴ベクトルと１枚目の対象画像の特徴ベクトルとの距離よりも大きいと生成部２０３が判定した場合（Ｓ９０６でＹＥＳ）、処理はＳ９０７に進む。着目学習画像の特徴ベクトルと１枚目の対象画像の特徴ベクトルとの距離が選択済みの候補画像の特徴ベクトルと１枚目の対象画像の特徴ベクトルとの距離よりも大きくないと生成部２０３が判定した場合（Ｓ９０６でＮＯ）、処理はＳ９０８に進む。Ｓ９０６における判定は、１枚目の選択画像の特徴ベクトルとの距離が大きい特徴ベクトルが算出される学習画像を候補画像に選択する意図を持つ。

　以上、第２実施形態により、代表的な特徴や、特殊な特徴を備えた学習画像が表示され、ユーザはそれらを確認することで、予めおおまかな辞書特性を把握した上で、適用するＭＬ辞書を選択することができる。

　＜第３実施形態＞
　第１、第２実施形態では、学習画像の特徴ベクトルに基づいて、被写体検出部１６２に適用されるＭＬ辞書の特性を表現するために用いる学習画像（すなわち、ＭＬ辞書に紐づける学習画像）を選択した。第３実施形態では、ＭＬ辞書の機械学習に用いられた複数の学習画像を被写体分類部１６３により複数のクラスへ分類した結果に基づいて、被写体検出部１６２に適用されるＭＬ辞書の特性を表現するために用いる学習画像を選択する。第３実施形態における辞書切替部１６４の全体処理は、Ｓ５０３における紐づけ情報生成処理と、Ｓ５０４における辞書特性表示方法を除いて、第１実施形態および第２実施形態（図５）と同様である。

　（紐づけ情報の生成処理（Ｓ５０３））
　図１０は第３実施形態による、紐づけ情報の生成処理を示すフローチャートである。まず、Ｓ１０００において、生成部２０３は、記録媒体１５７に記録された被写体分類部１６３に適用される複数のＭＬ辞書（以下、該当ＭＬ辞書群）の中から着目ＭＬ辞書を選択し、被写体分類部１６３に適用する。なお、被写体検出部１６２に適用されるＭＬ辞書（Ｓ５０１で切り替え指示があったＭＬ辞書）が対応している被写体に応じて、該当ＭＬ辞書群を選択するようにしてもよい。例えば、被写体検出部１６２に適用されるＭＬ辞書が「馬」を検出するための辞書である場合に、「馬」の分類に関わるＭＬ辞書により該当ＭＬ辞書群が構成されるようにしてもよい。次に、Ｓ１００１において、生成部２０３は、Ｓ５０１で切り替え指示があったＭＬ辞書（被写体検出部１６２に適用されるＭＬ辞書）に対応して、記録媒体１５７に記録されている複数の学習画像（以下、該当画像群）の中から、着目学習画像を選択する。ここでの該当画像群は、当該ＭＬ辞書の機械学習に用いられた全ての学習画像を含むことが望ましいが、本開示の効果が損なわれない範囲で、無作為抽出された学習画像が用いられても良い。Ｓ１００２において、生成部２０３は、被写体分類部１６３に着目学習画像を処理させ、着目ＭＬ辞書を適用した被写体分類を行わせる。Ｓ１００３において、生成部２０３は、該当画像群の内、Ｓ１００１で着目学習画像に選択されていない学習画像が存在するか判定する。該当画像群に着目学習画像に選択されていない学習画像が存在すると生成部２０３が判定した場合（Ｓ１００３でＹＥＳ）、処理はＳ１００１に戻り、上述の処理が繰り返される。他方、該当画像群に着目学習画像に選択されていない学習画像が存在しないと生成部２０３が判定した場合（Ｓ１００３でＮＯ）、処理はＳ１００４に進む。

　Ｓ１００４において、生成部２０３は、該当ＭＬ辞書群の内、Ｓ１０００で着目ＭＬ辞書に選択されていないＭＬ辞書が存在するか判定する。該当ＭＬ辞書群に着目ＭＬ辞書に選択されていないＭＬ辞書が存在すると生成部２０３が判定した場合（Ｓ１００４でＹＥＳ）、処理はＳ１０００に戻り、上述の処理が繰り返される。他方、該当ＭＬ辞書群に着目ＭＬ辞書に選択されていないＭＬ辞書が存在しないと生成部２０３が判定した場合（Ｓ１００４でＮＯ）、処理はＳ１００５に進む。Ｓ１００５において、生成部２０３は、Ｓ１０００からＳ１００４で得られた被写体分類結果に基づいて、記録媒体１５７に記録された学習画像及びアイコン画像の中から、ＭＬ辞書の特性を表現するための対象画像を選択する。対象画像の選択に関しては、図１２のフローチャートの参照により後述する。Ｓ１００６において、生成部２０３は、Ｓ１００５で選択された対象画像を特定する情報を、表示対象となっているＭＬ辞書の紐づけ情報として記録媒体１５７に記録する。ここで、紐づけ情報とは、Ｓ５０１で切り替え操作が行われた表示対象のＭＬ辞書に対応してＳ１００５で選択された対象画像の組み合わせの情報及び対象画像そのものである。

　（被写体分類結果の例）
　図１１は、本実施形態のＳ１０００からＳ１００４の処理で得られる被写体分類結果の例である。図１１の例では、「種」、「毛色」、「姿勢」、「マスク」及び「鞍」に関する５つの被写体分類が実行され、学習画像群を分類したクラス毎の意味と学習画像数が記載されている。「種」のクラスは例えば、「馬」、「シマウマ」、「ロバ」、「他」などである。「毛色」のクラスは、「鹿毛」、「青毛」、「栗毛」、「他」などである。「姿勢」のクラスは、「４足立ち」、「２足立ち」、「伏せ」、「寝」などである。「マスク」、「鞍」のクラスは「有」と「無」である。

　（対象画像選択処理）
　図１２は、第３実施形態における、対象画像を選択する処理を示すフローチャートである。

　Ｓ１２００において、生成部２０３は、Ｓ１０００からＳ１００４で得られる被写体分類結果の中から着目分類を選択する。ここでの分類とは、Ｓ１０００で選択された着目ＭＬ辞書により得られた分類であり、図１１の例では「種」、「毛色」、「姿勢」、「マスク」及び「鞍」の何れかである。Ｓ１２０１において、生成部２０３は、着目分類に含まれるクラスの中から着目クラスを選択する。例えば、図１１の例で、着目分類を「種」とした場合、着目クラスは「馬」、「シマウマ」、「ロバ」、「他」の何れかから決定される。

　Ｓ１２０２において、生成部２０３は、着目クラスが紐づけ処理対象の条件を満たすか判定する。ここでの条件とは、学習画像全体に占める着目クラスに属する学習画像の割合が所定値以上であることとする。例えば所定値を５％とした場合、図１１の例では、「種」の分類における「シマウマ」、「ロバ」、「他」のクラスは条件を満たさないと判定される。ＣＮＮの学習においては、学習画像に含まれていてもＣＮＮの性能に十分な影響を及ぼさないことがある。よって、Ｓ１２０２における判定は、影響の小さいクラスに関する学習画像を対象画像に選択させない意図を持つ。着目クラスが紐づけ処理対象の条件を満たすと生成部２０３が判定した場合（Ｓ１２０２でＹＥＳ）、処理はＳ１２０３へ進む。他方、着目クラスが紐づけ処理対象の条件を満たさないと生成部２０３が判定した場合（Ｓ１２０２でＮＯ）、処理はＳ１２０５へ進む。

　Ｓ１２０３において、生成部２０３は、該当画像群の内、着目クラスに分類された学習画像を対象画像として決定する。対象画像は着目クラスに分類された学習画像であれば何でもよい。例えば、図１１において、着目分類が「種」、着目クラスが「馬」の場合であれば、当該クラスに分類された４９０００枚の学習画像の中の何れであっても良い。Ｓ１２０４において、生成部２０３は、記録媒体１５７に記録されたアイコン画像の中から、Ｓ１２０１で選択した着目クラスに対応するアイコン画像を、更なる対象画像として追加で選択する。また、着目分類に関して複数のクラスに対応するアイコン画像が対象画像として選択されている場合、それら複数のクラスを包含するアイコン画像が選択されても良い。例えば、図１１の例では、着目分類が「毛色」の場合、「鹿毛」、「青毛」、「栗毛」及び「他色毛」の全てのクラスが紐づけ処理対象の条件を満たす。従って、これらの個別のクラスに対応するアイコン画像に替えて全色毛のクラスを表すアイコン画像が選択されても良い。

　Ｓ１２０５において、生成部２０３は、Ｓ１２００で着目分類に決定した分類に関して着目クラスに選択していないクラスが存在するか判定する。着目クラスに選択していないクラスが存在すると生成部２０３が判定した場合（Ｓ１２０５でＹＥＳ）、処理はＳ１２０１に戻り、上述の処理が繰り返される。他方、着目クラスに選択していないクラスが存在しないと生成部２０３が判定した場合（Ｓ１２０５でＮＯ）、処理はＳ１２０６に進む。Ｓ１２０６において、生成部２０３は、Ｓ１０００からＳ１００４で得られる被写体分類の結果の中から着目分類に選択されていない分類が存在するか判定する。着目分類に選択されていない分類が存在すると生成部２０３が判定した場合（Ｓ１２０６でＹＥＳ）、処理はＳ１２００に戻り、上述の処理が繰り返される。他方、着目分類に選択されていない分類が存在しないと生成部２０３が判定した場合（Ｓ１２０６でＮＯ）、本処理は終了する。

　以上のように、第３実施形態によれば、紐づけ処理対象の条件を満たす全ての分類及び全てのクラスに対応する学習画像及びアイコン画像が対象画像として選択される。アイコン画像はディスプレイ１５０の狭い表示範囲で多くの辞書特性を表現できるため、紐づけ処理対象の条件を満たすすべてのアイコン画像が対象画像として選択されることが望ましい。しかし、表示範囲が限られる場合には、Ｓ１２０６における判定を、第１、第２実施形態のＳ６０５における判定のように、終了条件を満たすか否かを判定する方法に変更しても良い。この場合、対象画像の選定は、所定の基準を満たす分類及びクラスから優先して決定することが望ましい。例えば１枚目の対象画像を選択する処理では、Ｓ１２０２における条件を満たすクラスが多い分類を優先し、更にその分類に属するクラスのうち分類された学習画像が多いクラスを優先することが望ましい。また、２枚目以降の対象画像を選択する処理では、Ｓ１２０２における処理対象の条件を満たすクラスが少ない分類を優先し、更にその分類に属するクラスのうち分類された学習画像が少ないクラスを優先することが望ましい。このような基準によれば、１枚目の対象画像の選択では、代表的な画像（学習画像およびアイコン画像）が選択されやすく、２枚目以降の対象画像の選択では、特殊な画像（学習画像およびアイコン画像）が選択されやすくなる。

　（辞書特性の表示例）
　上述のＳ１２０３において対象画像として決定された学習画像を用いて辞書特性を表示することができる。この場合の表示例は、第１実施形態（図８Ａ、８Ｂ）と同様である。一方、第３実施形態では、Ｓ１２０４で対象画像に決定されたアイコン画像を用いて辞書特性を表示することもできる。図１３Ａ、１３Ｂは、第３実施形態におけるＳ５０４において、切替制御部２０１がディスプレイ１５０に表示する切替画面の表示例を示す図である。図１３Ａ、１３Ｂには、第３実施形態による、アイコン画像を用いて辞書特性を表現した表示例が示されている。なお、図８Ａ、８Ｂのように学習画像を用いて辞書特性を表現する表示と、図１３Ａ、１３Ｂのようにアイコン画像を用いて辞書特性を表現する表示とは、ユーザが任意に切り替えて表示させるようにしてもよい。

　まず、図１３Ａについて説明する。切替画面１３ａにおいて、アイテム８００、８０１、及び切替ボタン８０８は、第１実施形態（図８Ａ、８Ｂ）と同様である。アイテム１００２ａは表示対象のＭＬ辞書であり、記録媒体１５７に記録されている当該ＭＬ辞書のファイル名である「００１」と併記されている。エリア１００３ａは、辞書特性を表現するエリアであり、アイコン画像１００４ａに代表される、辞書特性を表現する複数のアイコン画像が表示される。アイコン画像１００４ａはＳ１２０４において対象画像として選択されたアイコン画像の例である。第３実施形態における対象画像選択処理では、画像数に制約を設けることなく、全ての分類、全てのクラスに対応するアイコン画像の判定を行うため、辞書の特性をより総合的に表現することができる。図１３Ｂは、切替画面１３ａとは別のＭＬ辞書について、第３実施形態による辞書特性の表示を行った切替画面１３ｂの例である。エリア１００３ａにおける「全姿勢」のアイコン画像１００４ｂは、図１１の「４足立ち」「２足立ち」「伏せ」「寝」の全てのクラスを一括して表すアイコン画像である。なお、アイコン画像は、図１３Ａ、１３Ｂに示されるような、クラスを表す文字列表記の他、クラスを表す図形や写真など、ユーザがクラスを把握できるような画像であればよい。

　以上、第３実施形態により、複数のアイコン画像が表示され、ユーザはそれらを確認することで、予め総合的な辞書特性を把握した上で、適用するＭＬ辞書を選択することができる。

　＜第４実施形態＞
　（全体構成）
　第１実施形態～第３実施形態では、撮像装置１００内の画像処理装置（被写体検出部１６２、被写体分類部１６３、辞書切替部１６４など）により、ＭＬ辞書の特性表現を取得する構成を説明した。第４実施形態では、外部の画像処理装置（例えば、クラウドシステム）によりＭＬ辞書の特性表現を取得し、これを撮像装置へ提供する構成を説明する。図１４は、第４実施形態による画像処理システム１４００の全体構成例を示す図である。画像処理システム１４００は、撮像装置１４０１、撮像装置１４０２、クラウドシステム１４０３、ネットワーク１４０４を備える。撮像装置１４０１、撮像装置１４０２及びクラウドシステム１４０３はネットワーク１４０４を介してそれぞれ通信可能に接続されている。撮像装置１４０１及び撮像装置１４０２の詳細構成は、第１実施形態における撮像装置１００と同じである。但し、辞書切替部１６４は、ＭＬ辞書の特性を表現するための対象画像を取得する機能を有していなくてよい。クラウドシステム１４０３は、撮像装置１４０１、撮像装置１４０２と通信可能な画像処理装置の一例である。また、撮像装置の外部装置としての画像処理装置は、クラウドシステム１４０３に限られるものではなく、例えば、ＬＡＮ上のサーバ装置により実現されてもよい。

　撮像装置１４０１は、撮像装置１００と同様に構成され、ユーザが学習用画像の撮影を行うと共に、被写体検出部１６２に適用可能なＭＬ辞書の機械学習を行う。また機械学習によって得られたＭＬ辞書及び機械学習に用いた複数の学習画像（以下、該当画像群）を、ネットワーク１４０４を介してクラウドシステム１４０３にアップロードする。ここでの該当画像群は、機械学習に用いた全ての学習画像を含むことが望ましいが、本開示の実施形態により得られる効果が損なわれない範囲で、無作為抽出された学習画像が用いられても良い。撮像装置１４０２は、撮像装置１００と同様の構成を有し、クラウドシステム１４０３から提供された環境を利用することができる。例えば、撮像装置１４０２は、クラウドシステム１４０３からＭＬ辞書をダウンロードし、被写体検出部１６２に適用して、撮像画像に対して被写体検出機能を利用する。クラウドシステム１４０３はユーザからアップロードされた複数のＭＬ辞書、及び各々のＭＬ辞書に対する複数の学習画像を記録する。またＭＬ辞書の性能を表現し、複数のＭＬ辞書をユーザがダウンロード可能な環境を提供する。なお、図１４においては、便宜上１つずつのアップロードを行う撮像装置１４０１、ダウンロードを行う撮像装置１４０２が示されているがこれに限られるものではない。例えば、複数の撮像装置から複数のＭＬ辞書がクライアントシステム１４０３にアップロードされてもよい。

　（クラウドシステムの構成）
　図１５は第４実施形態によるクラウドシステム１４０３の構成例を示すブロック図である。クラウドシステム１４０３の各機能部は、バス１５００を介して接続されている。制御部１５０１は、各機能部を制御する。記録部１５０２は、ＨＤＤなどの大容量記録媒体であり、撮像装置１４０１からアップロードされた複数のＭＬ辞書や、被写体分類部１５０６に適用可能な複数のＭＬ辞書が記録される。なお、撮像装置１４０１からアップロードされた複数のＭＬ辞書には、各々の機械学習に用いた学習画像や、紐づけ情報も併せて記録される。また、被写体分類部１５０６に適用されるＭＬ辞書には、被写体分類結果の各分類、各クラスに対応したアイコン画像も併せて記録される。通信部１５０３は、イーサネットや無線により撮像装置１４０１や撮像装置１４０２と接続を行い、ＭＬ辞書や学習画像などのＭＬ辞書に関連する情報を通信する。

　表示画像生成部１５０４は、表示画像を生成し、通信部１５０３を介して撮像装置１４０１及び撮像装置１４０１のユーザに、ＭＬ辞書のアップロードやダウンロードに用いるＧＵＩを提供する。被写体検出部１５０５は、記録部１５０２に記録されたＭＬ辞書を適用し、画像に対して馬などの被写体が存在する領域を決定する。被写体検出部１５０５は、撮像装置１４０１及び撮像装置１４０２における被写体検出部１６２と同一のＣＮＮによって構成されているものとする。被写体分類部１５０６は、記録部１５０２に記録されたＭＬ辞書を適用し、画像内の被写体が予め定めた何れのクラスに属するかを分類する。被写体分類部１５０６は、撮像装置１４０１及び撮像装置１４０２における被写体分類部１６３と同一のＣＮＮによって構成されているものとする。

　（全体処理の流れ）
　図１６Ａ～図１６Ｃは、第４実施形態によるクラウドシステム１４０３の全体処理を示すフローチャートである。撮像装置１４０１、クラウドシステム１４０３、撮像装置１４０２の各々の処理について図１６Ａ、図１６Ｂ及び図１６Ｃを用いて説明する。

　図１６Ａは第４実施形態による撮像装置１４０１の全体処理を示すフローチャートである。Ｓ１６００において、切替制御部２０１は、ユーザから操作スイッチ１５６を介してＭＬ辞書のアップロード操作が行われたか判定する。アップロード操作が行われていると切替制御部２０１が判定した場合（Ｓ１６００でＹＥＳ）、処理はＳ１６０１に進み、アップロード操作が行われていないと切替制御部２０１が判定した場合（Ｓ１６００でＮＯ）、処理はＳ１６０３に進む。

　Ｓ１６０１において、切替制御部２０１は、通信部１６１を介して、外部の装置であるクラウドシステム１４０３に対してアップロード要求を行う。次に、Ｓ１６０２において、切替制御部２０１は、記録媒体１５７に記録されたＭＬ辞書及び当該ＭＬ辞書の学習に用いられた複数の学習画像を、通信部１６１を介してクラウドシステム１４０３に送信する。Ｓ１６０３において、切替制御部２０１は、ユーザから操作スイッチ１５６を介して終了指示があるか判定する。終了指示がないと切替制御部２０１が判定した場合（Ｓ１６０３でＮＯ）、処理はＳ１６００に戻り、上述した処理が繰り返される。他方、終了指示があると切替制御部２０１が判定した場合（Ｓ１６０３でＹＥＳ）、本処理は終了する。

　図１６Ｂは第４実施形態によるクラウドシステム１４０３の全体処理を示すフローチャートである。まず、Ｓ１６１０において、制御部１５０１は、通信部１５０３を介して、外部の装置（本例では撮像装置１４０１）からＭＬ辞書のアップロード要求があるか判定する。アップロード要求があると制御部１５０１が判定した場合（Ｓ１６１０でＹＥＳ）、処理はＳ１６１１に進む。アップロード要求がないと制御部１５０１が判定した場合（Ｓ１６１０でＮＯ）、処理はＳ１６１３に進む。

　Ｓ１６１１において、制御部１５０１は、通信部１５０３を介して、アップロード要求元の撮像装置１４０１からＭＬ辞書及びＭＬ辞書の学習に用いた複数の学習画像を受信し、記録部１５０２に記録する。Ｓ１６１２において、制御部１５０１は、Ｓ１６１１で記録部１５０２に記録したＭＬ辞書及びＭＬ辞書の学習に用いた複数の学習画像を読み出して紐づけ情報を生成する。Ｓ１６１２における紐づけ情報の生成処理の詳細は、クラウドシステム１４０３の各部により実行される点を除いて、第１実施形態または第２実施形態（Ｓ５０３）と同様である。

　Ｓ１６１３において、制御部１５０１は、通信部１５０３を介して、外部の装置（本例では、撮像装置１４０２）からＭＬ辞書特性の表示要求があるか判定する。表示要求があると制御部１５０１が判定した場合（Ｓ１６１３でＹＥＳ）、処理はＳ１６１４に進み、表示要求が無いと制御部１５０１が判定した場合（Ｓ１６１３でＮＯ）、処理はＳ１６１０に戻る。Ｓ１６１４において、表示画像生成部１５０４は、Ｓ１６１２で生成した紐づけ情報と、ＭＬ辞書と、ＭＬ辞書に対応した複数の学習画像とに基づいて、ＭＬ辞書の特性を表現する特性表現画像を生成する。そして、表示画像生成部１５０４は、通信部１５０３を介して、生成した特性表現画像を、表示要求元の撮像装置１４０２に送信する。なお、Ｓ１６１４における処理の詳細は、クラウドシステム１４０３の各部により実行される点を除いて、第１実施形態または第２実施形態（Ｓ５０４）と同様である。

　Ｓ１６１５において、制御部１５０１は、通信部１６１を介して、外部の装置（本例では、撮像装置１４０２）からＭＬ辞書のダウンロード要求が受信されたか判定する。ダウンロード要求が受信されたと制御部１５０１が判定した場合（Ｓ１６１５でＹＥＳ）、処理はＳ１６１６に進み、ダウンロード要求が受信されていないと制御部１５０１が判定した場合（Ｓ１６１５でＮＯ）、処理はＳ１６１０に戻る。Ｓ１６１６において、制御部１５０１は、記録部１５０２に記録された複数のＭＬ辞書のうち、Ｓ１６１４で辞書特性を表現したＭＬ辞書と、同ＭＬ辞書に対してＳ１６１２で生成した紐づけ情報とを、通信部１５０３を介して、ダウンロード要求元の撮像装置１４０２に送信する。

　図１６Ｃは第４実施形態における撮像装置１４０２の全体処理を示すフローチャートである。Ｓ１６２０において、ユーザから操作スイッチ１５６を介して、辞書特性の表示操作があるか判定する。表示操作があると切替制御部２０１が判定した場合（Ｓ１６２０でＹＥＳ）、処理はＳ１６２１に進み、表示操作がないと切替制御部２０１が判定した場合（Ｓ１６２０でＮＯ）、処理はＳ１６２３に進む。

　Ｓ１６２１において、切替制御部２０１は、通信部１６１を介して、外部の装置であるクラウドシステム１４０３にＭＬ辞書特性の表示要求を送信する。Ｓ１６２２において、切替制御部２０１は、通信部１６１を介して、クラウドシステム１４０３からＭＬ辞書の特性表現画像を受信し、ディスプレイ１５０に表示する。特性表現画像は、例えば、第１実施形態（図８Ａ、８Ｂ）で示した切替画面の表示例と同様である。

　Ｓ１６２３において、切替制御部２０１は、操作スイッチ１５６を介してユーザから特性表現画像において特性を表現されたＭＬ辞書に対し、ダウンロード操作があるか判定する。ダウンロード操作があると切替制御部２０１が判定した場合（Ｓ１６２３でＹＥＳ）、処理はＳ１６２４に進み、ダウンロード操作がないと切替制御部２０１が判定した場合（Ｓ１６２３ＮＯ）、処理はＳ１６２６に進む。Ｓ１６２４において、切替制御部２０１は、通信部１６１を介して、外部の装置であるクラウドシステム１４０３にＭＬ辞書のダウンロード要求を送信する。Ｓ１６２５において、切替制御部２０１は、通信部１６１を介して、クラウドシステム１４０３からＭＬ辞書と、当該ＭＬ辞書に対して生成された紐づけ情報（例えば、対象画像）を受信し、記録媒体１５７に記録する。

　Ｓ１６２６において、切替制御部２０１は、ユーザから操作スイッチ１５６を介して、Ｓ１６２５で記録媒体１５７に記録したＭＬ辞書を被写体検出部１６２に適用するように切り替える操作が行われたか判定する。切り替え操作が行われたと切替制御部２０１が判定した場合（Ｓ１６２６でＹＥＳ）、処理はＳ１６２７に進み、切り替え操作が行われていないと切替制御部２０１が判定した場合（Ｓ１６２６でＮＯ）、処理はＳ１６２８に進む。Ｓ１６２７において、切替制御部２０１は、ユーザからの切り替え操作に基づき、被写体検出部１６２に適用するＭＬ辞書を切り替える。以降、撮像装置１４０２におけるスルー画像や撮像画像に対して、Ｓ１６２７で切り替えられたＭＬ辞書による被写体検出処理が可能になる。Ｓ１６２８において、切替制御部２０１は、操作スイッチ１５６を介してユーザからの終了指示がなされたかを判定する。終了指示がなされていると切替制御部２０１が判定した場合（Ｓ１６２８でＹＥＳ）、本処理は終了する。終了指示がなされていないと切替制御部２０１が判定した場合（Ｓ１６２８でＮＯ）、処理はＳ１６２０に戻り、上述した処理が繰り返される。

　以上のように、第４実施形態によれば、撮像装置は、クラウドシステムから、表示対象のＭＬ辞書に関して、その特性を表現する情報として代表的な特徴や、特殊な特徴を備えた学習画像を取得し、表示することができる。従って、撮像装置のユーザはそれらを確認することで、撮像装置に負荷をかけることなく予めおおまかな辞書特性を把握した上で、ＭＬ辞書をダウンロード及び適用することができる。

　なお、上記ではＳ１６１２の紐づけ情報生成処理、Ｓ１６１４（Ｓ１６２２）の特性表現画像を取得するための構成として、第１実施形態または第２実施形態の構成を採用したがこれに限られるものではない。Ｓ１６１２の紐づけ情報生成処理、Ｓ１６１４（Ｓ１６２２）の特性表現画像を取得するための構成として、第３実施形態の構成が採用されてもよい。この場合、Ｓ１６１２による紐づけ情報の生成処理は、クラウドシステム１４０３の各部により実行される点を除いて、第３実施形態（図１０、図１２）と同様となる。また、Ｓ１６１４においてクラウドシステム１４０３で生成され、Ｓ１６２２において撮像装置１４０２の通信部１６１を介して受信され、表示されるＭＬ辞書の特性表現画像は、第３実施形態において図１３Ａ、１３Ｂに示した例と同様である。

　以上のような第４実施形態によれば、クラウドシステムによりアイコン画像が表示され、ユーザはそれらを確認することで、撮像装置に負荷をかけることなく予め総合的な辞書特性を把握した上で、ＭＬ辞書をダウンロード及び適用することができる。

　（その他の実施形態）
　本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

　発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。

　本願は、２０２２年１１月２５日提出の日本国特許出願特願２０２２－１８８６９８を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

Claims

　機械学習により得られた辞書と、前記辞書の前記機械学習に用いられた複数の学習画像とを取得する取得手段と、
　前記複数の学習画像から、前記辞書の特性を表す情報として用いられる１つ以上の学習画像を選択する選択手段と、
　前記選択手段により選択された前記１つ以上の学習画像と前記辞書とを紐づける紐づけ情報を生成する生成手段と、を備えることを特徴とする画像処理装置。
　前記選択手段は、前記複数の学習画像から得られる複数の特徴ベクトルに基づいて前記１つ以上の学習画像を選択すること、を特徴とする請求項１に記載の画像処理装置。
　機械学習により得られた複数の辞書の１つを用いて画像から被写体を検出する検出手段をさらに備え、
　前記選択手段は、前記複数の学習画像を前記検出手段に投入することにより前記検出手段から得られる中間データを前記複数の特徴ベクトルとして取得すること、を特徴とする請求項２に記載の画像処理装置。
　前記選択手段は、前記複数の特徴ベクトルのうちの、前記複数の特徴ベクトルの平均ベクトルとの距離が最も小さい特徴ベクトルの学習画像を選択すること、を特徴とする請求項２または３に記載の画像処理装置。
　前記選択手段は、前記複数の特徴ベクトルから、前記複数の特徴ベクトルの平均ベクトルとの距離が大きい順に所定数の特徴ベクトルを選択し、前記所定数の特徴ベクトルに対応する所定数の学習画像を選択すること、を特徴とする請求項２乃至４のいずれか１項に記載の画像処理装置。
　前記選択手段は、前記複数の特徴ベクトルから、前記平均ベクトルとの距離が最も小さい特徴ベクトルとの差が大きい順に所定数の特徴ベクトルを選択し、前記所定数の特徴ベクトルに対応する所定数の学習画像を選択すること、を特徴とする請求項４に記載の画像処理装置。
　前記選択手段は、前記検出手段が前記辞書を用いて学習画像から被写体を検出することができるという条件を満たす学習画像の中から、前記１つ以上の学習画像を選択すること、を特徴とする請求項３に記載の画像処理装置。
　前記選択手段は、取得される特徴ベクトルとの距離が所定値より小さい特徴ベクトルを有する他の学習画像が前記複数の学習画像に所定の割合を越えて存在するという条件を満たす学習画像の中から、前記１つ以上の学習画像を選択すること、を特徴とする請求項２乃至７のいずれか１項に記載の画像処理装置。
　前記紐づけ情報に基づいて、前記辞書と前記１つ以上の学習画像とを関連付けて表示するための表示情報を生成する表示情報生成手段をさらに備えること、を特徴とする請求項１乃至８のいずれか１項に記載の画像処理装置。
　前記複数の学習画像を複数のクラスに分類する分類手段を更に備え、
　前記選択手段は、前記分類手段に前記複数の学習画像を投入して得られる分類結果に基づいて学習画像を選択すること、を特徴とする請求項１に記載の画像処理装置。
　前記選択手段は、前記複数のクラスのうち前記分類結果において最も多くの学習画像が分類されたクラスに属する学習画像を選択すること、を特徴とする請求項１０に記載の画像処理装置。
　前記選択手段は、前記複数のクラスのうち、前記分類結果において分類された学習画像の数が少ない順に選択された所定数のクラスから所定数の学習画像を選択すること、を特徴とする請求項１０に記載の画像処理装置。
　前記選択手段は、分類された学習画像の数の前記複数の学習画像の数に対する割合が所定値以上であるクラスに属する学習画像から、前記１つ以上の学習画像を選択すること、を特徴とする請求項１０乃至１２のいずれか１項に記載の画像処理装置。
　前記選択手段は、前記複数のクラスに対応する複数のアイコン画像から、前記１つ以上の学習画像のそれぞれが属するクラスに対応する１つ以上のアイコン画像を更に選択し、
　前記生成手段は、前記辞書と前記１つ以上のアイコン画像とを紐づける情報を前記紐づけ情報に含ませること、を特徴とする請求項１０乃至１３のいずれか１項に記載の画像処理装置。
　前記紐づけ情報に基づいて、前記辞書と、前記１つ以上の学習画像または前記１つ以上のアイコン画像とを関連付けて表示するための表示情報を生成する表示情報生成手段を更に備えること、を特徴とする請求項１４に記載の画像処理装置。
　機械学習により得られた辞書と、前記辞書の前記機械学習に用いられた複数の学習画像とを取得する取得手段と、
　前記複数の学習画像を複数のクラスに分類する分類手段と、
　前記複数のクラスに対応する複数のアイコン画像から、前記分類手段による前記複数の学習画像の分類結果に基づいて、前記辞書の特性を表す情報として用いられる１つ以上のアイコン画像を選択する選択手段と、
　前記選択手段により選択された前記１つ以上のアイコン画像と前記辞書とを紐づける紐づけ情報を生成する生成手段と、を備えることを特徴とする画像処理装置。
　前記辞書と前記複数の学習画像とを外部装置から受信する受信手段と、
　前記辞書と前記紐づけ情報とを外部装置に送信する送信手段とを更に備えること、を特徴とする請求項１乃至１６のいずれか１項に記載の画像処理装置。
　撮像手段と、
　請求項１乃至１６のいずれか１項に記載された画像処理装置と、
　前記撮像手段により撮像された画像から被写体を検出する検出手段に適用される辞書を、ユーザ操作に応じて切り替える切替手段と、
　前記紐づけ情報に基づいて、前記切替手段により切り替えられる辞書の特性を表示する表示手段と、を備える、ことを特徴とする撮像装置。
　撮像手段と、
　請求項１７に記載された画像処理装置と通信する通信手段と、
　前記撮像手段により撮像された画像から被写体を検出する検出手段に適用される辞書を、ユーザ操作に応じて切り替える切替手段と、
　前記通信手段により前記画像処理装置から受信された前記紐づけ情報に基づいて、前記切替手段により切り替えられる辞書の特性を表示する表示手段と、を備える、ことを特徴とする撮像装置。
　機械学習により得られた辞書と、前記辞書の前記機械学習に用いられた複数の学習画像とを取得する取得工程と、
　前記複数の学習画像から、前記辞書の特性を表す情報として用いられる１つ以上の学習画像を選択する選択工程と、
　前記選択工程により選択された前記１つ以上の学習画像と前記辞書とを紐づける紐づけ情報を生成する生成工程と、を備えることを特徴とする画像処理装置の制御方法。
　機械学習により得られた辞書と、前記辞書の前記機械学習に用いられた複数の学習画像とを取得する取得工程と、
　前記複数の学習画像を複数のクラスに分類する分類工程と、
　前記複数のクラスに対応する複数のアイコン画像から、前記分類工程による前記複数の学習画像の分類結果に基づいて、前記辞書の特性を表す情報として用いられる１つ以上のアイコン画像を選択する選択工程と、
　前記選択工程により選択された前記１つ以上のアイコン画像と前記辞書とを紐づける紐づけ情報を生成する生成工程と、を備えることを特徴とする画像処理装置の制御方法。
　画像処理装置を、請求項１乃至１７のいずれか１項に記載された画像処理装置の各手段として機能させるためのプログラム。