WO2023007956A1

WO2023007956A1 - データ作成装置、記憶装置、データ処理システム、データ作成方法、プログラム、及び撮像装置

Info

Publication number: WO2023007956A1
Application number: PCT/JP2022/023213
Authority: WO
Inventors: 俊輝小林; 祐也西尾; 奨騎笠原; 健吉林
Original assignee: 富士フイルム株式会社
Priority date: 2021-07-30
Filing date: 2022-06-09
Publication date: 2023-02-02
Also published as: JPWO2023007956A1; CN117651945A

Abstract

複数の被写体が写った画像がそれぞれに記録された複数の画像データから、教師データ作成に用いる画像データを適切に選別する。　本発明の一つの実施形態は、複数の被写体が写った画像に付帯情報が記録された画像データから、機械学習に用いる教師データを作成するデータ作成装置であって、複数の被写体に対応付けて付与された複数の識別情報と、複数の被写体に対応付けて付与された複数の画質情報と、を含む付帯情報が記録された複数の画像データに対して、識別情報及び画質情報に関する任意の設定条件を設定する設定処理と、設定条件を満たす識別情報及び画質情報が記録された選別画像データに基づいて教師データを作成する作成処理と、を実行するように構成されたデータ作成装置である。

Description

データ作成装置、記憶装置、データ処理システム、データ作成方法、プログラム、及び撮像装置

　本発明の一つの実施形態は、機械学習用の教師データを作成するデータ作成装置、データ作成方法及びプログラムに関する。また、本発明の一つの実施形態は、教師データ作成用の画像データを記憶する記憶装置、教師データを用いた学習処理を実行するデータ処理システム、及び、画像データを生成する撮像装置に関する。

　画像データを教師データとして用いた機械学習を行う場合、教師データとする画像データを適切に選別（アノテーション）することが重要となる。しかし、膨大な画像データの中から教師データとする画像データを選別する際には、相当の手間及び処理時間を要するため、教師データの作成コストが嵩む。そのため、近年、複数の画像データの中から、教師データを作成するために用いられる画像データを所定の選別基準に従って選別する技術が開発されている（例えば、特許文献１参照）。

　教師データの作成に用いられる画像データを選別する方法としては、例えば、画像データに記録された画像の特徴量を求め、その特徴量に基づき、教師データとして利用できるか否かを判定する方法が考えられる。

特開２０１４－１３７２８４号公報

　ところで、画像に複数の被写体が写っている場合があり、その場合には、それぞれの被写体が写っている箇所に基づいて、教師データとして利用可能な画像データであるか否かを適切に判定する必要がある。

　本発明の一つの実施形態は、複数の被写体が写った画像がそれぞれに記録された複数の画像データから、教師データ作成に用いる画像データを適切に選別することを目的とする。

　上記の目的を達成するために、本発明の一つの実施形態は、複数の被写体が写った画像に付帯情報が記録された画像データから、機械学習に用いる教師データを作成するデータ作成装置であって、複数の被写体に対応付けて付与された複数の識別情報と、複数の被写体に対応付けて付与された複数の画質情報と、を含む付帯情報が記録された複数の画像データに対して、識別情報及び画質情報に関する任意の設定条件を設定する設定処理と、設定条件を満たす識別情報及び画質情報が記録された選別画像データに基づいて教師データを作成する作成処理と、を実行するように構成されたデータ作成装置である。

　また、画質情報は、画像データが示す画像中の被写体の解像感、被写体の明るさ、及び被写体の位置に現れるノイズのいずれかに関する情報であってもよい。
　また、画質情報は、解像感に関する解像感情報であり、解像感情報は、画像データが示す画像中の被写体のボケ及びブレ度合いに応じて決まる情報であってもよい。
　また、画質情報は、解像感に関する解像感情報であり、解像感情報は、画像データが示す画像中の被写体の解像度に関する解像度情報であってもよい。この場合、設定条件は、被写体の解像度の上限及び下限を含む条件であってもよい。

　また、画質情報は、被写体の明るさに関する情報、又は被写体の位置に現れるノイズに関する情報であってもよい。ここで、明るさに関する情報は、被写体に対応する輝度値であってもよい。また、ノイズに関する情報は、被写体に対応するＳ／Ｎ値であってもよい。この場合、設定条件は、被写体に対応する輝度値の上限及び下限、又はＳ／Ｎ値の上限及び下限を含む条件であってもよい。

　また、付帯情報は、複数の被写体と対応付けて付与された複数の位置情報をさらに含んでもよい。位置情報は、画像データが示す画像における被写体の位置を示す情報であってもよい。

　また、作成処理の実行前に、選別画像データが示す画像、又は、設定条件を満たす画質を有するサンプル画像を表示する表示処理をさらに実行するように構成されてもよい。
　上記の構成において、複数の画像データから、２以上の選別画像データを選別し、表示処理では、２以上の選別画像データのうち、一部の選別画像データが示す画像を表示すると、好適である。
　また、表示処理では、それぞれの選別画像データに対して定められた優先度に基づいて選択された選別画像データの画像を表示すると、より好適である。

　また、ユーザからの指定に応じて機械学習の用途を決定する決定処理をさらに実行するように構成され、設定処理では、用途と対応した設定条件を設定してもよい。

　また、ユーザからの指定に応じて機械学習の用途を決定する決定処理をさらに実行するように構成され、設定処理では、設定条件の設定前において、用途と対応した設定条件を、ユーザに対して提案してもよい。

　また、設定条件とは異なる追加条件を、ユーザに対して提案する提案処理をさらに実行するように構成されてもよい。この場合、追加条件は、付帯情報に対して設定された条件であり、追加条件により、識別情報及び画質情報が設定条件を満たさない非選別画像データの中から、追加画像データが選別されてもよい。そして、追加画像データが選別された場合、作成処理では、選別画像データ及び追加画像データに基づいて教師データを作成するとよい。

　また、本発明の一つの実施形態に係る記憶装置は、上記のデータ作成装置が教師データを作成する際に用いられる複数の画像データを記憶する記憶装置である。

　また、本発明の一つの実施形態に係るデータ処理システムは、複数の被写体が写った画像に付帯情報が記録された画像データから、教師データを作成するデータ作成装置と、教師データを用いた機械学習を実施する学習装置と、を備えるデータ処理システムであって、複数の被写体と対応付けて付与された複数の識別情報と、複数の被写体と対応付けて付与された複数の画質情報と、を含む付帯情報が記録された複数の画像データに対して、識別情報及び画質情報に関する任意の設定条件を設定する設定処理と、設定条件を満たす識別情報及び画質情報が記録された選別画像データに基づいて教師データを作成する作成処理と、教師データを用いて機械学習を実施する学習処理と、を実行するように構成されたデータ処理システムである。

　また、本発明の一つの実施形態に係るデータ作成方法は、複数の被写体が写った画像に付帯情報が記録された画像データから、機械学習に用いる教師データを作成するデータ作成方法であって、複数の被写体と対応付けて付与された複数の識別情報と、複数の被写体と対応付けて付与された複数の画質情報と、を含む付帯情報が記録された複数の画像データについて、識別情報及び画質情報に関する任意の設定条件を設定する設定工程と、設定条件を満たす識別情報及び画質情報が記録された選別画像データに基づいて教師データを作成する作成工程と、を含むデータ作成方法である。

　また、本発明の一つの実施形態に係るプログラムは、コンピュータを本発明のデータ作成装置として機能させ、コンピュータに、設定処理及び作成処理のそれぞれを実行させるためのプログラムである。

　また、本発明の一つの実施形態に係る撮像装置は、複数の被写体が写る画像を撮像する撮像処理と、画像に付帯情報を記録して画像データを生成する生成処理と、を実行し、付帯情報は、複数の被写体に対応付けて付与された複数の識別情報と、複数の被写体に対応付けて付与された複数の画質情報と、を含む撮像装置である。
　また、上記の撮像装置において、付帯情報は、機械学習用の教師データの作成に用いられる選別画像データを選別するための情報であってもよい。

本発明の一つの実施形態に係るデータ作成装置を含むデータ処理システムの構成図である。本発明の一つの実施形態に係るデータ処理システムの基本動作を示すフロー図である。画像データに記憶された付帯情報についての説明図であり、画像データの記憶領域を示す図である。付帯情報のデータファイルが画像データと関連づけて記憶されているケースを示す図である。付帯情報に含まれる各情報についての説明図である。画質情報についての説明図である。特性情報についての説明図である。本発明の第一の実施形態に係るデータ作成フローを示す図である。画像データ検索用の入力画面の一例を示す図である。追加条件の一例を示す図である。追加条件の表示画面の一例を示す図である。本発明の第二の実施形態に係るデータ作成フローを示す図である。画像データ検索用の入力画面の別例を示す図である。選別画像データに記録された画像の表示画面の一例を示す図である。

　本発明の一つの好適な実施形態（以下、本実施形態）について、添付の図面を参照しながら詳細に説明する。ただし、以下に説明する実施形態は、本発明の理解を容易にするために挙げた一例に過ぎず、本発明を限定するものではない。すなわち、本発明は、その趣旨を逸脱しない限りにおいて、以下に説明する実施形態から変更又は改良され得る。また、本発明には、その等価物が含まれる。

　また、本明細書において、「装置」という概念には、特定の機能を発揮する単一の装置が含まれることは勿論のこと、分散して互いに独立して存在するものの特定の機能を発揮するために協働する複数の装置も含まれることとする。

　また、本明細書において、「者」は、特定の行為を行う主体を意味し、その概念には、個人、グループ、企業等の法人、及び団体が含まれ、さらには人工知能（ＡＩ：Artificial Intelligence）を構成するコンピュータ及びデバイスも含まれ得る。人工知能は、推論、予測及び判断等の知的な機能をハードウェア資源及びソフトウェア資源を使って実現されるものである。人工知能のアルゴリズムは任意であり、例えば、エキスパートシステム、事例ベース推論（ＣＢＲ：Case-Based Reasoning）、ベイジアンネットワーク又は包摂アーキテクチャ等である。

　＜＜本実施形態に係るデータ作成装置について＞＞
　本実施形態に係るデータ作成装置（以下、データ作成装置１０）は、画像データから機械学習に用いられる教師データを作成する装置である。詳しく説明すると、データ作成装置１０は、多数の画像データの中から教師データ作成用の画像データを選別する機能を有するアノテーション支援用の装置である。

　データ作成装置１０は、図１に示すように、撮像装置１２、ユーザ側機器１４及び学習装置１６とともにデータ処理システムＳを構成する。データ処理システムＳは、ユーザの要求に従って機械学習を実施し、学習結果として得られる推論モデルをユーザに提供する。ユーザは、推論モデルを利用することで、ユーザが取得した画像の被写体の種別及び状態等を識別し、又は予測することができる。

　撮像装置１２は、公知のデジタルカメラ、又はカメラ内蔵の通信端末等によって構成される。撮像装置１２は、その所有者によって操作され、所有者の操作又は撮像装置１２の機能により設定された撮影条件の下で、被写体が写る画像を撮像する。つまり、撮像装置１２のプロセッサ（撮像装置側プロセッサ）は、所有者の撮像操作を受け付けて撮像処理を実行し、画像を撮像する。

　また、撮像装置側プロセッサは、撮像された画像に付帯情報を記録して画像データを生成する生成処理を実行する。付帯情報は、画像及び画像の利用等に関するタグ情報であり、いわゆるＥｘｉｆ（Exchangeable Image File Format）形式のタグ情報等を含む。付帯情報については後の項で詳しく説明する。

　データ作成装置１０は、付帯情報が記録された画像データを用いて、機械学習に用いられる教師データを作成する。すなわち、データ作成装置１０は、機械学習用の教師データを作成するための一連のデータ処理を実行するように構成されている。なお、教師データは、画像データそのものであってもよいし、画像データが示す画像中の特定の被写体を切り出す（トリミングする）等、画像データに対して所定の加工処理を施したものであってもよい。

　ちなみに、画像データは、撮像装置１２が通信機能を備える場合には、撮像装置１２からネットワークＮ経由でデータ作成装置１０に向けて送信される。ただし、これに限定されず、画像データを撮像装置１２からＰＣ（Personal Computer）等の機器に取り込み、当該機器からデータ作成装置１０に向けて画像データを送信してもよい。

　ユーザ側機器１４は、例えば、ユーザが所有するＰＣ又は通信端末等によって構成される。ユーザ側機器１４は、ユーザの操作を受け付け、その操作に応じたデータをデータ作成装置１０又は学習装置１６等に向けて送信する。なお、ユーザが所有する撮像装置１２が通信機能を備え、且つ、受信したデータに基づく情報を表示可能な機能を備える場合、その撮像装置１２をユーザ側機器１４として利用してもよい。

　また、ユーザ側機器１４は、不図示のディスプレイを備え、データ作成装置１０又は学習装置１６から受信したデータに応じた情報をディスプレイに表示する。例えば、学習装置１６が機械学習を実施して得られる推論モデルをユーザが利用した場合、ユーザ側機器１４は、推論モデルから得られる推論結果等をディスプレイに表示する。

　学習装置１６は、ユーザから機械学習の実施要求を受けると、データ作成装置１０によって作成された教師データを用いて機械学習を実施する。機械学習は、データから規則性及び判断基準を学習し、それに基づき未知の事象を予測し判断する技術及び人工知能に関わる分析技術等である。機械学習によって構築される推論モデルは、任意の数理モデルであり、例えば、ニューラルネットワーク、畳み込みニューラルネットワーク、リカレントニューラルネットワーク、アテンション、トランスフォーマー、敵対的生成ネットワーク、ディープラーニングニューラルネットワーク、ボルツマンマシン、マトリクス・ファクトーリゼーション、ファクトーリゼーション・マシーン、エムウエイ・ファクトーリゼーション・マシーン、フィールド認識型ファクトーリゼーション・マシーン、フィールド認識型ニューラル・ファクトーリゼーション・マシーン、サポートベクタマシン、ベイジアンネットワーク、決定木、又はランダムフォレスト等が利用可能である。

　データ作成装置１０及び学習装置１６は、互いに通信可能に接続されており、装置間でデータの授受を行う。なお、データ作成装置１０及び学習装置１６は、別機器として互いに独立したものでもよいし、単一の装置として一体化されたものでもよい。

　データ作成装置１０及び学習装置１６は、プロセッサと、プロセッサが実行可能なプログラムによって実現され、例えば汎用的なコンピュータ、具体的にはサーバコンピュータによって構成される。データ作成装置１０を構成するコンピュータ、及び、学習装置１６を構成するコンピュータは、それぞれ、図１に示すように、プロセッサ１０Ａ，１６Ａ、メモリ１０Ｂ，１６Ｂ及び通信用インタフェース１０Ｃ，１６Ｃ等を備える。

　プロセッサ１０Ａ，１６Ａは、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）、又はＴＰＵ（Tensor Processing Unit）等によって構成される。メモリ１０Ｂ，１６Ｂは、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）等の半導体メモリによって構成される。

　データ作成装置１０を構成するコンピュータには、教師データ作成用のプログラム（以下、教師データ作成プログラム）がインストールされている。プロセッサ１０Ａが教師データ作成プログラムを読み出して実行することで、プロセッサ１０Ａを備えるコンピュータがデータ作成装置１０として機能する。つまり、教師データ作成プログラムは、コンピュータに教師データ作成用の各処理（詳しくは、後述するデータ作成フロー中の各処理等）を実行させるためのプログラムである。

　他方、学習装置１６を構成するコンピュータには、学習実施用のプログラム（以下、学習実施プログラム）がインストールされている。プロセッサ１６Ａが学習実施プログラムを読み出して実行することで、プロセッサ１６Ａを備えるコンピュータが学習装置１６として機能する。つまり、学習実施プログラムは、コンピュータに機械学習に関する処理（詳しくは、後述の学習処理）を実行させるためのプログラムである。

　なお、教師データ作成プログラム及び学習実施プログラムの各々は、コンピュータが読み取り可能な記録媒体から読み込むことで取得してもよい。あるいは、上記２つのプログラムのそれぞれを、インターネット又はイントラネット等を通じて受信（ダウンロード）することで取得してもよい。

　データ処理システムＳには、教師データ作成に用いられる複数の画像データを記憶する記憶装置１８が設けられている。記憶装置１８には、撮像装置１２等から送られてきた画像データを含む複数の画像データが、データベースとして蓄積されている。記憶装置１８に蓄積される画像データには、印刷（現像）されたアナログ写真をスキャナ等によって読み取ってデジタル化することで取得された画像データを含めてもよい。

　なお、記憶装置１８は、データ作成装置１０又は学習装置１６に搭載された装置でもよく、あるいは、データ作成装置１０又は学習装置１６と通信可能な第三のコンピュータ（例えば、外部サーバ）側に設けられてもよい。

　［システムの基本動作について］
　次に、上述のデータ処理システムＳの基本動作について、図２を参照しながら説明する。データ処理システムＳによるデータ処理フロー（以下、基本フロー）では、取得ステップＳ００１、決定ステップＳ００２、作成ステップＳ００３、学習ステップＳ００４、及び検証ステップＳ００５がこの順で実施される。

　取得ステップＳ００１は、例えば、教師データ作成の前段階に実施され、本ステップでは、データ作成装置１０のプロセッサ１０Ａによって取得処理が実行される。取得処理では、プロセッサ１０Ａが、付帯情報が記録された複数の画像データを取得し、具体的には、撮像装置１２又はユーザ側機器１４等から複数の画像データを入手（受信）する。取得された画像データは、記憶装置１８に記憶されてデータベースとして蓄積される。
　なお、画像データの取得元は特に限定されず、撮像装置１２及びユーザ側機器１４以外の装置、例えば、ネットワークＮに接続された外部サーバ（不図示）であってもよい。

　決定ステップＳ００２は、データ作成装置１０のプロセッサ１０Ａがユーザから機械学習の実施要求を受け付けることを契機として開始される。本ステップでは、プロセッサ１０Ａによって決定処理が実行される。決定処理の実行に際して、機械学習の実施を要求したユーザは、学習用途を指定し、具体的には、学習用途を表す文字情報を入力し、あるいは、予め用意された学習用途の候補の中から希望の候補を選択する。プロセッサ１０Ａは、ユーザから受け付けた用途の指定に応じて学習用途を決定する。

　ここで、「学習用途」とは、学習のテーマ又は主題であり、例えば、「画像中の被写体の種別又は状態を識別又は推定すること」等が該当する。なお、以下では、決定ステップＳ００２にて決定された学習用途を、便宜的に「決定用途」と呼ぶこととする。

　作成ステップＳ００３では、プロセッサ１０Ａが、記憶装置１８に記憶された複数の画像データから、教師データ作成用の画像データを選別し、選別された画像データを用いて教師データを作成する。具体的に説明すると、機械学習の実施を要求したユーザが、教師データ作成用の画像データを検索（抽出）するために必要な情報を入力する。このときの入力情報には、決定用途に応じた情報が含まれ、例えば、機械学習により識別可能とする被写体の種別又は状態等が含まれる。

　プロセッサ１０Ａは、ユーザの入力情報に基づいて条件（以下、設定条件）を設定し、記憶装置１８に記憶された複数の画像データから、設定条件を満たす画像データを選別画像データとして選別する。そして、プロセッサ１０Ａは、選別画像データを用いて教師データを作成する。

　教師データは、一般に、正解データと不正解データとに分かれる。正解データは、決定用途に合致した被写体（以下、正解の被写体）が写る画像を示す教師データであり、不正解データは、正解の被写体とは異なる被写体が写る画像を示す教師データである。具体例を挙げて説明すると、決定用途が「画像中の被写体が果物のオレンジであるか否かを判定すること」である場合、果物のオレンジが写った画像を示す教師データは、正解データとして用いられる。他方、果物のカキ、又はオレンジ色のボールが写った画像を示す教師データは、不正解データとして用いられる。

　なお、本実施形態において、不正解データに該当する教師データは、後述する追加画像データに基づいて作成され、例えば、正解の被写体と類似する被写体が写る画像の画像データに基づいて作成される。

　学習ステップＳ００４では、学習装置１６のプロセッサ１６Ａによって学習処理が実行される。学習処理では、プロセッサ１６Ａが、作成ステップＳ００３で作成された教師データを用いて、決定用途に従って機械学習を実施する。機械学習には、主として、正解データの教師データを用いられるが、機械学習の精度を向上させる目的から、正解データとともに、不正解データが用いられる場合がある。

　検証ステップＳ００５では、機械学習の結果として得られた推論モデルの妥当性（精度）を評価するために、プロセッサ１６Ａが、推論モデルに関する検証テストを、教師データの一部を用いて実施する。

　以上までに説明してきた基本フローのうち、決定ステップＳ００２、作成ステップＳ００３、学習ステップＳ００４及び検証ステップＳ００５は、ユーザから機械学習の実施要求を新たに受け付ける度に、繰り返し実施される。

　［付帯情報について］
　記憶装置１８に蓄積された複数の画像データのそれぞれには、付帯情報、すなわちタグが記憶されている。付帯情報について、図３～図５Ｃを参照しながら説明する。なお、図３は、記憶装置１８が有する記憶領域のうち、一つの画像データが記憶された領域を示している。

　本実施形態では、付帯情報の記録には、直接的な記録と、間接的な記録とが含まれる。直接的な記録とは、付帯情報が画像データに直接的に記録されることである。間接的な記録とは、付帯情報が画像データと関連付けて記憶されることである。具体的には、図４に示すように、付帯情報が画像データとは別のデータファイルＴに記録されることがある。この場合、ある設定条件の下で選別された画像データ群Ｇの各々のＩＤ情報と、データファイルＴとが紐付けられており、各画像データのＩＤ情報をキーとして上記のデータファイルＴを読み出すことが可能である。

　付帯情報は、記憶装置１８に蓄積された複数の画像データの中から選別画像データを選別するための情報であり、選別処理の実行時にデータ作成装置１０によって参照される。付帯情報には、図３に示すように、特性情報、画質情報及び学習情報が含まれる。画像データに記憶される付帯情報は、必ずしも特性情報、画質情報及び学習情報のすべてを含んでいるとは限らず、少なくとも特性情報又は画質情報の一方を含み、且つ、学習情報を含んでいればよい。

　（学習情報）
　学習情報は、機械学習を実施する際に必要となる情報であり、具体的には、図５Ａに示すように、画像中の被写体の識別情報、位置情報、及び、サイズ情報等を含む。識別情報は、画像中の被写体の種別、状態及び特徴を示すラベルである。位置情報は、画像における被写体の位置を示し、具体的には、図５Ｂに示すように、被写体を矩形型のバウンディングボックスにて囲んだ際の矩形領域の所定位置を示す。矩形領域の所定位置は、例えば、矩形領域の対角線上に存在する二つの頂角の座標位置（詳しくはＸＹ座標）であり、図５Ｂに示す例では、座標（Ａ１，Ａ２）、（Ｂ１，Ｂ２）及び（Ｃ１，Ｃ２）である。サイズ情報は、画像において被写体が占める領域のサイズを示し、例えば、上記の矩形領域のサイズ（詳しくはＸＹ方向の長さ）を示す。

　一つの画像データが示す画像内に複数の被写体が写っている場合があり得るが、その場合には、複数の被写体と対応付けて複数の学習情報が付与される。すなわち、複数の被写体が写った画像データに対しては、被写体毎に識別情報、位置情報及びサイズ情報等が作成される（図５Ｂ参照）。

　なお、学習情報は、画像を撮影した撮像装置１２によって自動的に付与されてもよく、ユーザがユーザ側機器１４を通じて入力することで付与されてもよく、あるいは、人工知能（ＡＩ）の機能によって作成されてもよい。また、学習情報の付与にあたり、画像中の被写体を検出する際には、公知の被写体検出機能を利用すればよい。

　（画質情報）
　画質情報は、画像データに記録された画像中の被写体の画質に関するタグであり、被写体に対応付けて付与される。他方、画像中の被写体には、前述したように、学習情報の識別情報が付与される。つまり、画像中の被写体に対して画質情報が付与される場合には、識別情報が併せて付与される。

　また、一つの画像データが示す画像内に複数の被写体が写っている場合があり、その場合には、複数の被写体に対応付けて複数の画質情報が付与される。つまり、複数の被写体が写った画像データには、複数の被写体に対応付けて付与された複数の識別情報及び複数の画質情報を含む付帯情報が記録される。

　本実施形態における画質情報は、画像データが示す画像中の被写体の解像感、被写体の明るさ、及び被写体の位置に現れるノイズのうち、いずれかの画質に関する情報である。具体的には、図５Ａに示す解像感情報、輝度値情報及びノイズ情報のいずれか一つが画質情報に含まれる。これらの情報は、機械学習において教師データから導出される画像の特徴量に反映され、さらには、学習の精度に影響を及ぼし得る。

　解像感情報は、被写体の解像感に関する情報であり、画像データが示す画像中の被写体のボケ及びブレ度合いに応じて決まる。解像感情報は、公知の手法にて検出される被写体のボケ量及びブレ量を画素数で表したものでもよいし、図５Ｂに示すような１～５のランク又は等級等のように段階評価したものでもよいし、スコアにて評価したものでもよい。また、解像感情報は、被写体のボケ及びブレ度合いをヒトの感性に基づく尺度にて段階評価したもの、すなわち、官能評価の結果を示すものでもよい。

　なお、解像感情報は、被写体のボケ及びブレ度合いに応じた情報に限定されず、例えば、画像データが示す画像中の被写体の解像度に関する解像度情報であってもよい。解像度情報は、例えば、被写体を含む画像の画素数（ピクセル数）を示す情報である。

　明るさ情報は、被写体の明るさに関する情報であり、具体的には、被写体に対応する輝度値を示す。輝度値は、画像中の画素におけるＲＧＢ（Red Green Blue）各色の輝度を示す値であり、被写体に対応する輝度値は、画像中、被写体を囲う矩形領域内に存在する画素の輝度値の平均値、又は代表値（最大値、最小値若しくは中央値）である。なお、被写体の明るさに関する情報は、輝度値に限定されず、被写体の明るさをスコアにて評価したものでもよいし、図５Ｂに示すような等級又はランク等のように段階評価したものでもよいし、あるいは官能評価の結果であってもよい。

　ノイズ情報は、被写体の位置に現れるノイズに関する情報であり、撮像装置１２が有する撮像センサに起因するノイズの度合い、具体的には、被写体に対応するＳ／Ｎ値（信号雑音比）を示す。被写体に対応するＳ／Ｎ値は、画像中、被写体を囲う矩形領域内でのＳ／Ｎ値である。なお、ノイズに関する情報には、Ｓ／Ｎ値の他に、被写体を囲う矩形領域内にホワイトノイズが存在するか否かを示す情報が追加されてもよい。また、被写体の位置に現れるノイズの多さをスコアにて評価したものでもよいし、ランク又は等級等のように段階評価したものでもよいし、あるいは官能評価の結果であってもよい。

　本実施形態において、画質情報は、撮像装置１２が画像を撮影すると、撮像装置側プロセッサによって自動的に画像中の被写体に対して付与される。ただし、これに限定されず、画質情報は、撮影者が撮像装置１２の入力部を通じて入力することで付与されてもよく、あるいは人工知能（ＡＩ）の機能によって付与されてもよい。

　（特性情報）
　特性情報は、画像データに記録された画像に関する画質以外の情報を示すタグであり、図５Ａに示すように、第１情報又は第２情報を含み、撮影条件情報をさらに含み得る。

　第１情報は、機械学習に関する情報であり、具体的には、図５Ｃに示すように許諾情報、用途情報、又は履歴情報を含む。画像データに第１情報が記録される場合には、許諾情報、用途情報及び履歴情報のうちの少なくとも一つが記憶されればよい。これらの情報に関しては、暗号化又はハッシュ化する等して、無断の改竄を回避してセキュリティ性を担保することが望ましい。

　許諾情報は、機械学習における教師データの作成に画像データを使用することについての許諾に関する情報である。許諾情報は、図５Ｃに示すように、画像データの許諾に関連する者、例えば、画像データの使用可能者に関する情報であってもよい。この場合の許諾情報の例としては、「Ａさんに限り使用可能」又は「Ｂ社に限り使用可能」等のように特定の者に使用を制限する情報、及び、「誰でも使用可能」のように使用者制限がない旨の情報等が該当する。

　また、許諾情報は、図５Ｃに示すように、画像データの使用目的に関する情報であってもよい。この場合の許諾情報の例としては、「商用利用を制限する」等のように特定の使用目的を制限する情報、及び、「あらゆる目的で使用可能」のように目的制限がない旨の情報等が該当する。

　さらに、許諾情報には、使用可能者又は使用目的に関する情報に加え、画像データの使用可能期間に関する情報が含まれてもよい。具体的には、使用時期の制限に関する情報、例えば、画像データの有効期限、あるいは無料又は有料で画像データが使用できる期間等が許諾情報に含まれてもよい。

　用途情報は、機械学習の用途（学習用途）に関する情報であり、詳しくは、画像データから作成される教師データがどのような用途の機械学習に利用されたかを示す。また、画像データに記録された用途情報を参照すれば、その画像データに基づいて作成された教師データが、どのような学習用途の下で実施された機械学習に用いられたのかを特定することができる。

　履歴情報は、過去の機械学習における教師データとしての使用履歴、すなわち、画像データが教師データの作成に使用された履歴に関する情報である。履歴情報としては、図５Ｃに示すように、例えば、回数情報、利用者情報、正解タグ情報、不正解タグ情報、採用情報、及び精度情報が該当する。

　回数情報は、その画像データに基づいて作成された教師データを用いて機械学習が実施された回数を示す情報である。
　利用者情報は、その画像データに基づいて作成された教師データを用いて実施された過去の機械学習について、当該機械学習の実施を要求した者（利用者）を示す情報である。

　正解タグ情報及び不正解タグ情報は、その画像データに基づいて作成された教師データを用いて実施された過去の機械学習について、当該教師データが正解データとして用いられたかどうかに関する情報である。
　具体的に説明すると、過去の機械学習における教師データが正解データとして用いられた場合、その教師データの作成に用いられた画像データに対しては、正解タグ情報が付与される。より詳しく説明すると、画像データに記録された画像中の被写体が、過去の機械学習の用途に合致した被写体、つまり正解の被写体である場合には、その画像データに対して正解タグ情報が付与される。

　他方、過去の機械学習における教師データが不正解データとして用いられた場合、その教師データの作成に用いられた画像データに対しては、不正解タグ情報が付与される。より詳しく説明すると、画像データに記録された画像中の被写体が、正解の被写体とは異なる被写体である場合には、その画像データに対して不正解タグ情報が付与される。
　なお、正解タグ情報及び不正解タグ情報は、用途情報と紐付けられて付与される。

　採用情報は、不正解データに該当する教師データの採用の有無に関する情報であり、詳しくは、不正解タグが付与された画像データから作成された教師データを用いて機械学習が実施されたかどうかを示す情報である。
　精度情報は、不正解データを用いて機械学習を実施して得られた推論モデルの予測精度に関する情報であり、詳しくは、不正解データを利用しなかった場合の精度との比較結果、すなわち差分を示す。

　履歴情報は、設定条件及び後述の追加条件と紐付けられて記憶され、換言すると、設定条件を満たす選別画像データ、及び、追加条件を満たす追加画像データに対して付与される。ここで、設定条件及び追加条件と、履歴情報が付与された複数の画像データ（画像データ群Ｇ）との対応関係は、各画像データとは別のデータファイルＴに記憶されてもよい（図４参照）。

　なお、第１情報のうち、許諾情報は、撮像装置１２が画像を撮影すると、それに伴って撮像装置側プロセッサにより自動的に作成される。ただし、これに限定されず、許諾情報は、撮影者が撮像装置１２の入力部を通じて入力することで作成されてもよく、あるいは人工知能（ＡＩ）の機能によって作成されてもよい。
　また、第１情報のうち、用途情報及び履歴情報は、教師データが作成された時点又は機械学習が実施された時点で、データ作成装置１０又は学習装置１６の機能によって自動的に作成される。ただし、これに限定されず、用途情報及び履歴情報は、ユーザがユーザ側機器１４を通じて入力することで作成されてもよく、あるいは人工知能（ＡＩ）の機能によって作成されてもよい。

　第２情報は、図５Ａに示す作成者情報及び保有者情報であり、厳密には、これらの情報のうちの少なくとも一つを含む。

　作成者情報は、図５Ｃに示すように、画像データの作成者、又は付帯情報の作成者に関する情報であり、例えば、各作成者の名前又はＩＤ情報である。なお、作成者情報は、画像データ又は付帯情報を作成する際に用いた機器（具体的には、撮像装置１２又はユーザ側機器１４）のデバイスＩＤであってもよい。

　画像データの作成者は、画像データが示す画像の撮影者、すなわち、その画像の撮影に用いられた撮像装置１２の所有者である。付帯情報の作成者は、画像データに記録された付帯情報の作成者であり、通常の場合には、画像データの作成者と一致する。ただし、付帯情報の作成者が画像データの作成者と異なってもよい。また、付帯情報の作成者は、前述した学習情報の作成者であってもよい。その場合、第２情報は、付帯情報の作成者に関する作成者情報として、学習情報の作成者に関する作成者情報を含んでもよい。

　保有者情報は、画像データの権利者に関する情報であり、詳しくは、図５Ｃに示すように、画像データの著作権の保有者に関する情報である。通常の場合には、画像データの著作権の保有者は、その画像データの作成者、すなわち撮影者と一致する。ただし、著作権の保有者が画像データの作成者と異なってもよい。保有者情報の例としては、「著作権者がＡさん」等のように画像データの著作権の保有者を示す情報、及び、「著作権フリー」のように権利者が存在しない旨を示す情報等が該当する。

　撮影条件情報は、画像の撮影条件に関する情報であり、図５Ｃに示すように、画像を撮影した機器（つまり、撮像装置１２）、当該機器が画像に対して実施する画像処理、及び画像の撮影環境の少なくとも一つに関する情報を含む。
　撮像装置１２に関する情報としては、撮像装置１２の製造メーカ、撮像装置１２の機種名、及び、撮像装置１２が有する光源の種類等が該当する。
　画像処理に関する情報としては、画像処理の名称、画像処理の特徴、画像処理を実施可能な機器の機種、及び、画像において処理が実施された領域等が該当する。
　撮影環境に関する情報としては、撮影の日時、季節、撮影時の天候、撮影場所の地名、及び、撮影場所での照度（日射量）等が該当する。
　また、撮影条件情報には、上記の情報以外の情報、例えば、撮影時の露光条件（具体的にはｆ値、ＩＳＯ感度、及びシャッタスピード）等がさらに含まれてもよい。

　＜＜本実施形態に係る教師データの作成手順について＞＞
　本実施形態に係るデータ処理方法では、機械学習の実施を要求するユーザの意向を反映した設定条件を設定し、設定条件を満たす画像データを選別画像データとして選別し、選別画像データに基づいて教師データを作成する。以下、本実施形態に係る教師データの作成手順、すなわちデータ作成フローについて説明する。
　なお、以下に説明するデータ作成フローは、あくまでも一例であり、本発明の趣旨を逸脱しない範囲において不要なステップを削除したり、新たなステップを追加したり、ステップの実施順序を入れ替えてもよい。

　本実施形態では、複数の画像データの各々に記録された付帯情報を参照して選別画像データを選別する。ここで、本実施形態のデータ作成フローは、付帯情報のうち、特性情報を参照して選別するフロー（以下、第１フロー）と、画質情報を参照して選別するフロー（以下、第２フロー）とに大別される。以下、第１フロー及び第２フローのそれぞれについて説明する。

　（第１フロー）
　第１フローは、図６に示す流れに従って進行し、第１フロー中の各工程では、データ作成装置１０のプロセッサ１０Ａが、各工程と対応するデータ処理を実行する。

　また、図６には図示していないが、プロセッサ１０Ａは、フローの開始前又は途中で、複数の画像データを取得する取得処理を実行する。取得処理では、付帯情報が記録された画像データを取得し、第１フローの場合には、特性情報を含む付帯情報が記録された画像データを取得する。取得処理にて取得される画像データの付帯情報には、特性情報として第１情報又は第２情報が少なくとも含まれ、撮影条件情報がさらに含まれてもよい。また、付帯情報には学習情報がさらに含まれる。

　第１フローでは、先ず、プロセッサ１０Ａが受付処理を実行する（Ｓ０１１）。受付処理では、機械学習の実施を要求したユーザが、ユーザ側機器１４を通じて、教師データ作成用の画像データを検索（抽出）するための入力操作を行う。プロセッサ１０Ａは、ユーザ側機器１４との通信により上記の入力操作を受け付ける。

　ユーザによる入力操作は、例えば、ユーザ側機器１４のディスプレイに表示される図７の入力画面を通じて行われる。ユーザによって入力される情報には、ユーザが指定した学習用途（すなわち、決定用途）に応じた情報が含まれ、例えば、決定用途に合致した被写体、つまり、正解の被写体を示す情報が含まれる。例えば、決定用途が「被写体が果物のオレンジであるか否かを判定すること」である場合には、ユーザは、正解の被写体として「オレンジ」を入力する。

　また、ユーザは、上記の入力画面を通じて、教師データ作成用の画像データを絞り込むための情報を入力する。図７に示す例では、「商用利用の有無」及び「使用者制限の有無」が、画像データを絞り込むための情報として入力される。なお、画像データを絞り込むための情報は、上記の情報に限定されず、学習情報及び上記以外の特性情報（例えば、撮影条件情報等）を含んでもよい。

　次に、プロセッサ１０Ａは、設定処理を実行する（Ｓ０１２）。このステップＳ０１２は、設定工程に相当し、設定処理では、プロセッサ１０Ａが、受付処理にて受け付けた入力操作に基づき、記憶装置１８に蓄積された複数の画像データに対して任意の設定条件を設定する。

　ここで、設定条件の設定とは、設定条件の項目及び内容のそれぞれを設定することである。項目とは、教師データ作成に用いる画像データを絞り込む際の観点（視点）であり、内容とは、項目に関して画像データが該当する具体的概念である。図７に示す例の場合、「正解の被写体」、「商用利用の有無」及び「使用者制限の有無」が設定条件の項目に該当し、それぞれの項目の内容は、「オレンジ」、「商用利用あり」、「使用者制限なし」である。

　第１フローの設定処理では、プロセッサ１０Ａが、特性情報を含む付帯情報が記録された画像データに対して、特性情報に関する設定条件を設定し、詳しくは、第１情報又は第２情報に関する任意の設定条件を設定する。図７に示す例の場合、『被写体の種別が「オレンジ」であり、「商用利用可能」で、「使用者制限なし」の画像データ』という設定条件が設定される。
　なお、第１情報又は第２情報に関する設定条件は、第１設定条件に該当する。

　設定条件（第１設定条件）について詳しく説明すると、図７に示す例のように、許諾情報が示す使用可能者及び使用目的を設定条件の項目とすることができる。これらの項目に対してユーザが入力した内容に応じて設定条件が設定される。このケース（以下、第１Ａケース）では、画像データの使用制限、つまり、データ使用の可否の観点から、教師データ作成用の画像データを絞り込むことができる。特に、使用可能者の観点から絞り込めば、ユーザが正当に使用することが可能な画像データに絞り込むことができる。

　なお、第１Ａケースにおいて、使用可能者及び使用目的の各々に関する条件を個々に設定し、これらの条件の和集合を設定条件としてもよいし、あるいは、上記の条件の積集合を設定条件としてもよい。また、使用可能者又は使用目的のいずれか一方、又は、使用可能者及び使用目的の両方に対して、使用可能期間をさらに追加した形で設定条件を設定してもよい。

　また、用途情報が示す学習用途、つまり、画像データに基づいて作成された教師データを用いて実施された過去の機械学習の用途を設定条件の項目とすることができ、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。このケース（以下、第１Ｂケース）では、学習用途という観点から画像データを絞り込むことができ、詳しくは、ユーザによって指定された用途に合致した画像データに絞り込むことができる。

　また、履歴情報が示す過去の使用履歴、すなわち、決定用途と同一の用途にて実施された過去の機械学習における教師データとしての使用履歴を、設定条件の項目とすることができる。詳しくは、過去の機械学習で正解データの作成に用いられたかどうかを、設定条件の項目とすることができる。そして、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。このケース（以下、第１Ｃケース）では、過去の機械学習における教師データとしての使用履歴、詳しくは、正解データの作成に用いられたかどうかという観点で、教師データ作成用の画像データを絞り込むことができる。

　また、作成者情報が示す画像データの作成者、又は付帯情報の作成者を、設定条件の項目とすることができ、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。このケース（以下、第１Ｄケース）では、画像データの作成者又は付帯情報の作成者が誰であるかという観点で、教師データ作成用の画像データを絞り込むことができる。

　また、保有者情報が示す画像データの著作権保有者を、設定条件の項目とすることができ、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。このケース（以下、第１Ｅケース）では、画像データの著作権保有者が誰であるかという観点から、教師データ作成用の画像データを絞り込むことができる。

　第１フローの設定処理では、上述した５つのケース（第１Ａ～第１Ｅケース）での観点のそれぞれで条件を設定し、各観点の条件の和集合を設定条件としてもよい。あるいは、２以上の観点のそれぞれで設定された条件の積集合を設定条件としてもよい。また、同一の観点（項目）で内容を変えて複数の条件を設定し、当該複数の条件についての和集合を設定条件としてもよい。

　また、第１フローの設定処理では、上述の観点で設定条件（第１設定条件）を設定することに加え、撮影条件情報に関する任意の設定条件（以下、第２設定条件）を設定してもよい。つまり、撮影条件を設定条件の項目に加え、撮影条件に関してユーザが入力した内容に応じて第２設定条件を設定してもよい。これにより、撮影条件を加味して、教師データ作成用の画像データを絞り込むことができ、例えば、機械学習に適した撮影条件の下で撮影された画像データに絞り込むことができる。

　さらに、第１フローの設定処理では、学習情報、より詳しくは被写体の位置情報又はサイズ情報に関する任意の設定条件（以下、第３設定条件）をさらに設定してもよい。つまり、画像における被写体の位置又はサイズ等を設定条件の項目に加え、これらの項目についてユーザが入力した内容に応じて第３設定条件を設定してもよい。これにより、画像における被写体の位置又はサイズに基づいて、教師データ作成用の画像データを絞り込むことができる。

　上記の要領にて設定条件が設定された後、プロセッサ１０Ａは、選別処理を実行する（Ｓ０１３）。選別処理では、記憶装置１８に記憶された複数の画像データの中から、選別画像データが選別される。第１フローにおいて、選別画像データは、設定処理にて設定された設定条件を満たす第１情報又は第２情報を含む特性情報が記録された画像データである。選別処理では、通常、２以上の選別画像データが選別される。この際、後に実施される機械学習に必要な量の選別画像データが選別されるとよい。

　また、設定処理にて第１設定条件及び第２設定条件が設定された場合、選別処理では、第１設定条件を満たす第１情報又は第２情報と、第２設定条件を満たす撮影条件情報とが記録された画像データが選別画像データとして選別される。また、設定処理にて第１設定条件及び第３設定条件が設定された場合、選別処理では、第１設定条件を満たす第１情報又は第２情報と、第３設定条件を満たす学習情報とが記録された画像データが選別画像データとして選別される。

　第１フローにおいて、プロセッサ１０Ａは、選別処理の実行後に提案処理を実行する（Ｓ０１４）。提案処理は、設定処理にて設定された設定条件とは異なる追加条件を、ユーザに対して提案する処理である。

　追加条件は、選別処理において選別されなかった画像データ（以下、非選別画像データ）の中から追加画像データを選別するために設定される条件である。非選別画像データは、記憶装置１８に記憶された画像データのうち、第１情報又は第２情報が設定条件を満たさない画像データである。

　また、追加条件は、画像データに記録された付帯情報、すなわち特性情報、画質情報及び学習情報の少なくとも一つに関する条件である。第１フローの提案処理にて提案される追加条件は、特性情報に関する条件であることが好ましく、特に、第１情報又は第２情報に関する条件であることがより好ましい。

　追加条件は、第１追加条件及び第２追加条件を含み、それぞれの追加条件は、設定条件と対応付けて設定される。第１追加条件は、設定条件に基づいて選別された選別画像データを補填する理由から、設定条件を緩和又は変更した条件として設定される。第２追加条件は、機械学習の精度を向上させるために、不正解データ、厳密には正解の被写体と類似する被写体が写った画像を示す不正解データが追加画像データとして選別されるように設定される。

　第１追加条件及び第２追加条件のそれぞれは、設定条件と項目が同一で且つ内容が異なる条件であってもよく、設定条件とは項目及び内容が異なる条件であってもよい。

　具体例として、「被写体が果物のオレンジであるか否かを判定すること」を決定用途とし、『被写体の種別が「オレンジ」であり、「商用利用可能」で、「使用者がＡさんに制限された」画像データ』という設定条件が設定された場面を想定する。この場合、設定条件と項目が同一で且つ内容が異なる第１追加条件としては、例えば、図８に示すように「使用制限がない画像データであること」、又は、「許諾情報が未記録の画像データであること」が該当する。また、設定条件とは項目及び内容が異なる第１追加条件としては、例えば、図８に示すように「著作権フリーである画像データであること」が該当する。
　他方、設定条件と項目が同一で且つ内容が異なる第２追加条件としては、例えば、図８に示すように「被写体が果物のカキである画像データであること」が該当する。また、設定条件とは項目及び内容が異なる第２追加条件としては、例えば、図８に示すように、「オレンジ色の楕円形状の物体の画像データであること」が挙げられる。

　また、様々な撮影条件の下で撮影された被写体を正しく識別できるようにする理由から、撮影条件に関して設定された設定条件（第２設定条件）とは異なる撮影条件となるように追加条件を設定してもよい。

　追加条件は、設定条件に基づいてプロセッサ１０Ａ側で設定される。例えば、設定条件と追加条件との対応関係を規定したテーブルデータが予め用意されており、プロセッサ１０Ａが、設定処理にて設定された設定条件と対応する追加条件を、上記のテーブルデータに基づいて設定してもよい。また、設定処理にて設定された設定条件と同じ設定条件で過去に機械学習を実施させたことがある者（以下、既学習者）が存在する場合に、既学習者が採用した追加条件を、提案処理にて提案する追加条件としてもよい。

　また、設定条件を満たす画像データに記録された画像の特徴、詳しくは画像中の被写体の特徴（例えば、輪郭の形状、色及び模様等）に基づいて追加条件を設定してもよい。また、設定条件をより抽象化（上位概念化）することで追加条件を設定してもよい。

　提案処理では、上記の要領で設定された追加条件が、図９に示すように、追加条件の提案理由ともに、ユーザ側機器１４のディスプレイに表示される。これにより、ユーザは、追加条件が提案される理由を把握することができる。なお、提案理由としては、「教師データの数を増やす」、「学習の精度を向上させる」、「既学習者が採用した条件である」、及び「不正解データを加えた方がよい」等が挙げられる。

　提案処理において、ユーザは、提案された追加条件の採否を選択する（Ｓ０１５）。そして、ユーザが追加条件の採用を選択した場合、プロセッサ１０Ａは、再選別処理を実行する（Ｓ０１６）。再選別処理では、採用された追加条件により、複数の非選別画像データの中から追加画像データが選別される。追加画像データは、非選別画像データのうち、付帯情報が追加条件を満たす画像データである。

　選別処理及び再選別処理の実行後、プロセッサ１０Ａは、作成処理を実行する（Ｓ０１７）。このステップＳ０１７は、作成工程に相当し、作成処理では、選別された画像データから教師データが作成される。ここで、提案処理にて提案された追加条件をユーザが採用しなかった場合、作成処理では、選別処理で選別された選別画像データに基づいて教師データが作成される。他方、提案された追加条件が採用されて再選別処理で追加画像データが追加的に選別された場合、作成処理では、選別画像データ及び追加画像データのそれぞれに基づいて教師データが作成される。

　以上のように再選別処理を実行する場合には、追加画像データが増える分、教師データの数を増やすことができる。この結果、教師データを用いて実施される機械学習の精度が向上する。特に、不正解データに該当する教師データが増えた場合には、学習精度を効果的に向上させることができる。

　また、既学習者が採用した追加条件によって選別された追加学習データを用いれば、既学習者が実施させた機械学習における教師データを得ることができる。これにより、例えば同業者が過去に実施させた機械学習を再現し、又は、それよりも高度な機械学習を実施することができる。

　以上までの処理が終了した時点で、第１フローが終了する。第１フローの終了後には、決定用途に基づく機械学習が、第１フローにおいて作成された教師データを用いて実施される。また、教師データ作成に用いられた画像データについては、付帯情報が更新され、具体的には用途情報及び履歴情報等が更新される。これにより、以後のデータ作成フローでは、更新後の付帯情報に基づいて、教師データ作成用の画像データを選別することができる。つまり、教師データ作成に用いられた実績、その教師データを用いて実施された機械学習の実施回数、及び機械学習の精度等を踏まえて、適当な画像データを選別し、その画像データに基づいて教師データを作成することができる。

　なお、図６に示すフローでは、提案処理が選別処理の後で実行されることとしたが、これに限定されず、設定処理と選別処理との間に提案処理が実行されてもよい。その場合、提案処理にて提案された追加条件をユーザが採用した際には、その後の選別処理において、選別画像データ及び追加画像データの双方を同じタイミングで選別してもよい。

　また、提案処理は、必ずしも実行される必要はなく、例えば、選別処理において十分な数の選別画像データが選別された場合、すなわち教師データの数が十分に確保できる場合には、提案処理の実行を省略してもよい。

　（第２フロー）
　第２フローは、図１０に示す流れに従って進行し、第２フロー中の各工程では、データ作成装置１０のプロセッサ１０Ａが、各工程と対応するデータ処理を実行する。

　また、図１０には図示していないが、プロセッサ１０Ａは、フローの開始前又は途中で、複数の画像データを取得する取得処理を実行する。取得処理では、複数の被写体が写った画像に付帯情報が記録された画像データを取得する。具体的には、画像中の複数の被写体に対応づけて付与された識別情報及び画質情報を含む付帯情報が記録された画像データを取得する。取得される画像データの付帯情報には学習情報が含まれ、また、特性情報がさらに含まれてもよい。この場合、学習情報（すなわち識別情報、位置情報及びサイズ情報）は、被写体毎に付与され、複数の被写体に対応付けて付与される。

　第２フローは、図１０に示すように、第１フローとおおむね共通する。すなわち、第２フローにおいても、受付処理、設定処理及び選別処理がこの順に実行され（Ｓ０２１～Ｓ０２３）、その後に提案処理が実行される（Ｓ０２４）。提案された追加条件がユーザによって採用された場合には（Ｓ０２５）、追加条件に基づく再選別処理が実行される（Ｓ０２６）。

　第２フローでは、選別処理又は再選別処理の実行後に、後述する表示処理が実行され（Ｓ０２７）、その後に作成処理が実行される（Ｓ０２８）。再選別処理が実行されなかった場合の作成処理では、選別画像データに基づいて教師データが作成され、再選別処理が実行された場合の作成処理では、選別画像データ及び追加画像データのそれぞれに基づいて教師データが作成される。

　なお、第２フローにおいて、設定処理を実行するステップＳ０２２が設定工程に該当し、作成処理を実行するステップＳ０２８が作成工程に該当する。また、図１０に示すフローでは、提案処理が選別処理の後で実行されるが、これに限定されず、設定処理と選別処理との間に提案処理が実行されてもよい。その場合、提案処理にて提案された追加条件をユーザが採用した際には、その後の選別処理において、選別画像データ及び追加画像データの双方を同じタイミングで選別してもよい。

　設定処理では、第１フローと同様、受付処理にて受け付けたユーザの入力操作に基づき、記憶装置１８に蓄積された複数の画像データに対して任意の設定条件を設定する。第２フローの設定処理では、画像中の複数の被写体に対応付けて付与された複数の識別情報及び複数の画質情報に関する設定条件を設定する。例えば、図１１に示すようにユーザが入力操作を行った場合、『被写体の種別が「オレンジ」であり、「ボケ度合いが２以下」で、「ブレ度合いが２以下」である画像データ』という設定条件が設定される。

　第２フローにおける設定条件について詳しく説明すると、図１１に示す例のように、画質情報に含まれる解像感情報が示す被写体の解像感、具体的にはボケ及びブレ度合いに応じた情報を、設定条件の項目とすることができる。そして、これらの項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。具体的には、ボケ及びブレ度合いに応じたスコア又はランクの数値範囲（図１１に示す例では、「ボケ度合い２以下」、及び「ブレ度合い２以下」）を設定条件としてもよい。このケース（以下、第２Ａケース）では、被写体の解像感、詳しくは被写体のボケ及びブレ度合いの観点から、教師データ作成用の画像データを適切に絞り込むことができる。

　また、解像感情報に被写体の解像度情報が含まれる場合には、解像度情報が示す解像度（画素数）を、設定条件の項目とすることができ、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。具体的には、解像度の上限及び下限、すなわち解像度の数値範囲に関する条件を含む設定条件を設定してもよい。このケース（以下、第２Ｂケース）では、被写体の解像度の観点から、教師データ作成用の画像データを適切に絞り込むことができる。

　第２Ａケース及び第２Ｂケースでは、被写体の解像度の観点から、教師データ作成用の画像データを絞り込むことで、画質が良好な画像データから教師データを作成することができる。この結果、機械学習での学習精度が向上する。

　また、第２Ｂケースにおいて、被写体の解像度が高くなるほど、その被写体が写る画像の画像データを用いて作成される教師データの容量が大きくなり、その教師データを用いた機械学習での学習量が増える。その点を踏まえると、第２Ｂケースのように、被写体の解像度に関する上限及び下限を含む条件を設定条件として設定するのが好ましい。

　被写体の明るさに関する画質情報、具体的には明るさ情報が示す被写体に対応する輝度値を、設定条件の項目とすることができる。そして、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。具体的には、輝度値の上限及び下限、すなわち輝度値の数値範囲に関する条件を含む設定条件を設定してもよい。このケース（以下、第２Ｃケース）では、被写体に対応する輝度値の観点から、教師データ作成用の画像データを適切に絞り込むことができ、例えば、輝度値が好適な範囲にある画像データに絞り込むことができる。この結果、機械学習での学習精度が向上する。

　また、被写体の位置に現れるノイズに関する画質情報、具体的にはノイズ情報が示す被写体に対応するＳ／Ｎ値を、設定条件の項目とすることができる。そして、その項目に対してユーザが入力した内容に応じて設定条件を設定してもよい。具体的には、Ｓ／Ｎ値の上限及び下限、すなわちＳ／Ｎ値の数値範囲に関する条件を含む設定条件を設定してもよい。このケース（以下、第２Ｄケース）では、被写体に対応するＳ／Ｎ値の観点から、教師データ作成用の画像データを適切に絞り込むことができ、例えば、Ｓ／Ｎ値が好適な範囲にある画像データに絞り込むことができる。この結果、機械学習での学習精度が向上する。

　第２フローの設定処理では、上述した４つのケース（第２Ａ～第２Ｄケース）での観点それぞれで条件を設定し、各観点の条件の和集合を設定条件としてもよい。あるいは、２以上の観点のそれぞれで設定された条件の積集合を設定条件としてもよい。

　また、第２フローの設定処理では、学習情報、より詳しくは被写体の位置情報又はサイズ情報に関する任意の設定条件をさらに設定してもよい。つまり、画像における被写体の位置又はサイズ等を設定条件の項目に加え、これらの項目についてユーザが入力した内容に応じて設定条件を設定してもよい。これにより、画像における被写体の位置又はサイズに基づいて、教師データ作成用の画像データを絞り込むことができる。

　第２フローにおいて、設定処理の実行後には選別処理が実行され、選別処理では、プロセッサ１０Ａが、設定条件を満たす識別情報及び画質情報が記録された選別画像データを選別する。より詳しく説明すると、第２フローの選別処理では、各画像データに記録された画像に写る複数の被写体のうち、少なくとも一部の被写体に対応付けられた識別情報及び画質情報が設定条件を満たす画像データを、選別画像データとして選別する。

　第２フローの提案処理にて提案される追加条件は、画像データの付帯情報、つまり特性情報、画質情報及び学習情報の少なくとも一つに対して設定され、且つ、ユーザによって指定された学習用途（決定用途）と対応する条件である。なお、第２フローの提案処理にて提案される追加条件は、画質情報に対して設定される条件であることが好ましい。

　第２フローにおける追加条件としては、例えば、正解の被写体の画質を意図的に低下させた教師データを作成する目的から設定された条件が挙げられる。この場合の追加条件は、解像感を設定条件よりも下げた条件、あるいはノイズに対する許容度（Ｓ／Ｎ値の上限）を設定条件よりも上げた条件となる。

　第２フローにおける追加条件の設定要領は、第１フローの場合と同様であり、プロセッサ１０Ａは、追加条件に含まれる第１追加条件又は第２追加条件を、設定条件と対応付けて設定する。第１追加条件及び第２追加条件の各々は、設定条件と項目が同同一で且つ内容が異なる条件であってもよいし、設定条件とは項目及び内容が異なる条件であってもよい。

　また、第２フローの提案処理においても、第１フローの場合と同様、追加条件が、追加条件の提案理由とともに、ユーザ側機器１４のディスプレイに表示される。

　第２フローにおいて、ユーザが追加条件の採用を選択した場合には、再選別処理が実行され、再選別処理では、採用された追加条件により、複数の非選別画像データの中から追加画像データが選別される。第２フローにおける非選別画像データは、記憶装置１８に蓄積された複数の画像データのうち、識別情報及び画質情報が設定条件を満たさない画像データである。詳しくは、画像データの画像に写る複数の被写体のすべてについて、識別情報及び画質情報が設定条件を満たさない画像データが非選別画像データに該当する。

　第２フローでは、選別処理又は再選別処理の実行後に表示処理を実行し、表示処理では、図１２に示すように、プロセッサ１０Ａが、選別画像データに記録された画像をユーザ側機器１４のディスプレイに表示させる。機械学習の実施を要求したユーザは、表示された画像を見て、選別画像データ、すなわち教師データ作成用の画像データの画質を確認することができる。

　なお、ユーザは、表示された画像を見て、選別画像データの画質が好ましくないと判断した場合には、選別処理のやり直しを要求することができる。その場合、プロセッサ１０Ａは、設定条件を設定し直し、再設定された設定条件に基づいて選別処理を改めて実行する。

　第２フローにおける選別処理では、通常、２以上の選別画像データが選別され、設定条件次第では、多数の選別データが選別される場合があり得る。その場合、表示処理において、選別されたすべての選別画像データの画像を表示することも可能であるが、ユーザの確認負担が大きくなる。この点を踏まえて、表示処理では、２以上の選別画像データのうち、一部の選別画像データを選択し、選択された選別画像データに記録された画像を表示するのがよい。

　上記の場合、表示処理にて画像が表示される一部の選別画像データは、２以上の選別画像データのそれぞれに対して定められた優先順位に基づいて選択されるとよい。例えば、優先順位が上位ｍ番目（ｍは自然数）までの選別画像データについて、そのデータに記録された画像を表示処理にて表示するとよい。なお、画像の表示数（すなわち、選別画像データの選択数ｍ）は、任意に決めることができ、少なくとも１以上であればよい。

　各選別画像データに対する優先順位は、画像中、決定用途に合致した被写体、すなわち正解の被写体のサイズ（詳しくは、正解の被写体を囲む矩形領域のサイズ）に応じて決めてもよい。あるいは、過去の機械学習における教師データとして利用された実績回数等に応じて優先順位を決めてもよい。

　また、表示処理では、選別画像データに記録された画像の代わりに、選別画像データに記録された画像に相当するサンプル画像を表示してもよい。サンプル画像は、データ作成装置１０に予め記録され、画質を変えて複数用意されている。プロセッサ１０Ａは、複数のサンプル画像のうち、設定処理にて設定された設定条件を満たすサンプル画像を選定し、選定されたサンプル画像を表示する表示処理を実行してもよい。

　表示処理の終了後、プロセッサ１０Ａは、作成処理を実行し、選別画像データに基づいて、あるいは選別画像データ及び追加画像データのそれぞれに基づいて教師データを作成する。

　以上までの処理が終了した時点で、第２フローが終了する。第２フローの終了後には、決定用途に基づく機械学習が、第２フローにおいて作成された教師データを用いて実施される。また、教師データ作成に用いられた画像データについては、付帯情報が更新され、具体的には用途情報及び履歴情報等が更新される。これにより、以後のデータ作成フローでは、更新後の付帯情報に基づいて、教師データ作成用の画像データを選別することができる。
　なお、第２フローにおいても、提案処理は、必ずしも実行される必要はなく、例えば、選別処理において十分な数の選別画像データが選別された場合には、提案処理の実行を省略してもよい。

　＜＜その他の実施形態＞＞
　以上までに説明してきた実施形態は、本発明のデータ作成装置、データ作成方法、プログラム、データ処理システム、記憶装置及び撮像装置について分かり易く説明するために挙げた具体例であり、あくまでも一例に過ぎず、その他の実施形態も考えられる。

　また、上述の実施形態では、画像データに記録される付帯情報には学習情報が含まれ、特性情報及び画質情報の少なくとも一方が含まれることとしたが、付帯情報には、上述した情報以外の情報（タグ情報）がさらに含まれてもよい。

　また、上述の実施形態では、データ作成装置１０のプロセッサ１０Ａが設定処理においてユーザの入力操作に基づいて設定条件を設定することとした。ただし、これに限定されるものではなく、ユーザの入力操作に因らずにプロセッサ１０Ａ側で自動的に設定条件を設定してもよい。例えば、プロセッサ１０Ａは、ユーザによって指定された学習用途（すなわち、決定用途）と対応する設定条件を設定してもよい。具体的に説明すると、学習用途と対応する設定条件が学習用途毎に予め設定されてテーブルデータとして記憶されており、プロセッサ１０Ａは、そのテーブルデータを読み出して、決定用途と対応する設定条件を設定してもよい。
　また、過去に実施された機械学習の用途と、その機械学習における教師データを作成するための設定条件との対応関係を、機械学習によって特定し、その対応関係に基づいて、決定用途と対応する設定条件を設定してもよい。その場合、機械学習を実施させた者、すなわちユーザの情報を対応関係の中に組み込んでもよい。これにより、設定条件を新たに設定する際には、ユーザがこれまでに採用してきた設定条件を踏まえて設定することができる。

　また、決定用途と同じ学習用途にて過去に機械学習を実施させたことがある者（既学習者）が存在する場合に、プロセッサ１０Ａは、設定処理において、既学習者が採用した設定条件と同じ条件を、設定条件として設定してもよい。

　さらに、プロセッサ１０Ａは、設定処理において、決定用途と対応する設定条件を仮設定した後に、仮の設定条件を、ユーザ側機器１４のディスプレイに表示する等して、ユーザに対して提案してもよい。その場合、提案された仮の設定条件をユーザが採用した際に、プロセッサ１０Ａは、仮の設定条件を正式な設定条件として設定するとよい。

　また、上述の実施形態において、複数の画像データを取得した後に、取得した複数の画像データの中から、設定条件を満たす選別画像データを選別することとした。ただし、これに限定されず、設定条件が設定された後の段階で、設定条件を満たす画像データ、すなわち選別画像データを外部の画像データベースから一括してダウンロードして取得してもよい。

　また、データ作成装置１０及び学習装置１６の各々が備えるプロセッサには、ＣＰＵ以外の各種のプロセッサが含まれてもよい。ＣＰＵ以外の各種のプロセッサには、上述した例えば、ＦＰＧＡ（Field Programmable Gate Array）等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）が含まれる。また、ＡＳＩＣ（Application Specific Integrated Circuit）等の特定の処理をさせるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
　また、データ作成装置１０が有する一つの機能を、上述したプロセッサ中、いずれか一つのプロセッサによって構成してもよい。あるいは、同種又は異種の二つ以上のプロセッサの組み合わせ、例えば、複数のＦＰＧＡの組み合わせ、若しくはＦＰＧＡ及びＣＰＵの組み合わせ等によって一つの機能を構成してもよい。また、データ作成装置１０が有する複数の機能の各々を、上述したプロセッサ中、対応する一つのプロセッサによって構成してもよい。あるいは、複数の機能のうち、二つ以上の機能を一つのプロセッサによって構成してもよい。また、一つ以上のＣＰＵとソフトウェアの組み合わせを一つのプロセッサとし、このプロセッサにより、複数の機能を実現させる形態でもよい。
　また、例えば、システムオンチップ（System on Chip：ＳｏＣ）等に代表されるように、データ作成装置１０が備える複数の機能すべてを一つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態でもよい。また、上述した各種のプロセッサのハードウェア的な構成は、半導体素子等の回路素子を組み合わせた電気回路（Circuitry）でもよい。

　１０　データ作成装置
　１０Ａ　プロセッサ
　１０Ｂ　メモリ
　１０Ｃ　通信用インタフェース
　１２　撮像装置
　１４　ユーザ側機器
　１６　学習装置
　１６Ａ　プロセッサ
　１６Ｂ　メモリ
　１６Ｃ　通信用インタフェース
　１８　記憶装置
　Ｇ　画像データ群
　Ｎ　ネットワーク
　Ｓ　データ処理システム
　Ｔ　データファイル

Claims

　複数の被写体が写った画像に付帯情報が記録された画像データから、機械学習に用いる教師データを作成するデータ作成装置であって、
　前記複数の被写体に対応付けて付与された複数の識別情報と、前記複数の被写体に対応付けて付与された複数の画質情報と、を含む前記付帯情報が記録された複数の画像データに対して、前記識別情報及び前記画質情報に関する任意の設定条件を設定する設定処理と、
　前記設定条件を満たす前記識別情報及び前記画質情報が記録された選別画像データに基づいて前記教師データを作成する作成処理と、
　を実行するように構成されたデータ作成装置。
　前記画質情報は、画像データが示す画像中の前記被写体の解像感、前記被写体の明るさ、及び前記被写体の位置に現れるノイズのいずれかに関する情報である、請求項１に記載のデータ作成装置。
　前記画質情報は、前記解像感に関する解像感情報であり、
　前記解像感情報は、画像データが示す画像中の前記被写体のボケ及びブレ度合いに応じて決まる情報である、請求項２に記載のデータ作成装置。
　前記画質情報は、前記解像感に関する解像感情報であり、
　前記解像感情報は、画像データが示す画像中の前記被写体の解像度に関する解像度情報である、請求項２に記載のデータ作成装置。
　前記設定条件は、前記被写体の解像度の上限及び下限を含む条件である、請求項４に記載のデータ作成装置。
　前記画質情報は、前記被写体の明るさに関する情報、又は前記被写体の位置に現れるノイズに関する情報であり、
　前記明るさに関する情報は、前記被写体に対応する輝度値であり、
　前記ノイズに関する情報は、前記被写体に対応するＳ／Ｎ値である、請求項２に記載のデータ作成装置。
　前記設定条件は、前記被写体に対応する前記輝度値の上限及び下限、又は前記Ｓ／Ｎ値の上限及び下限を含む条件である、請求項６に記載のデータ作成装置。
　前記付帯情報は、前記複数の被写体と対応付けて付与された複数の位置情報をさらに含み、
　前記位置情報は、画像データが示す画像における前記被写体の位置を示す情報である、請求項１に記載のデータ作成装置。
　前記作成処理の実行前に、前記選別画像データが示す画像、又は、前記設定条件を満たす画質を有するサンプル画像を表示する表示処理をさらに実行するように構成された、請求項１に記載のデータ作成装置。
　前記複数の画像データから、２以上の前記選別画像データを選別し、
　前記表示処理では、２以上の前記選別画像データのうち、一部の前記選別画像データが示す画像を表示する、請求項９に記載のデータ作成装置。
　前記表示処理では、それぞれの前記選別画像データに対して定められた優先度に基づいて選択された前記選別画像データの画像を表示する、請求項１０に記載のデータ作成装置。
　ユーザからの指定に応じて前記機械学習の用途を決定する決定処理をさらに実行するように構成され、
　前記設定処理では、前記用途と対応した前記設定条件を設定する、請求項１に記載のデータ作成装置。
　ユーザからの指定に応じて前記機械学習の用途を決定する決定処理をさらに実行するように構成され、
　前記設定処理では、前記設定条件の設定前において、前記用途と対応した前記設定条件を、ユーザに対して提案する、請求項１に記載のデータ作成装置。
　前記設定条件とは異なる追加条件を、ユーザに対して提案する提案処理をさらに実行するように構成され、
　前記追加条件は、前記付帯情報に対して設定された条件であり、
　前記追加条件により、前記識別情報及び前記画質情報が前記設定条件を満たさない非選別画像データの中から、追加画像データが選別され、
　前記追加画像データが選別された場合、前記作成処理では、前記選別画像データ及び前記追加画像データに基づいて前記教師データを作成する、請求項１に記載のデータ作成装置。
　請求項１に記載のデータ作成装置が前記教師データを作成する際に用いられる前記複数の画像データを記憶する、記憶装置。
　複数の被写体が写った画像に付帯情報が記録された画像データから、教師データを作成するデータ作成装置と、前記教師データを用いた機械学習を実施する学習装置と、を備えるデータ処理システムであって、
　前記複数の被写体と対応付けて付与された複数の識別情報と、前記複数の被写体と対応付けて付与された複数の画質情報と、を含む前記付帯情報が記録された複数の画像データに対して、前記識別情報及び前記画質情報に関する任意の設定条件を設定する設定処理と、
　前記設定条件を満たす前記識別情報及び前記画質情報が記録された選別画像データに基づいて前記教師データを作成する作成処理と、
　前記教師データを用いて前記機械学習を実施する学習処理と、
　を実行するように構成されたデータ処理システム。
　複数の被写体が写った画像に付帯情報が記録された画像データから、機械学習に用いる教師データを作成するデータ作成方法であって、
　前記複数の被写体と対応付けて付与された複数の識別情報と、前記複数の被写体と対応付けて付与された複数の画質情報と、を含む前記付帯情報が記録された複数の画像データについて、前記識別情報及び前記画質情報に関する任意の設定条件を設定する設定工程と、
　前記設定条件を満たす前記識別情報及び前記画質情報が記録された選別画像データに基づいて前記教師データを作成する作成工程と、
　を含むデータ作成方法。
　コンピュータを請求項１に記載のデータ作成装置として機能させ、コンピュータに、前記設定処理及び前記作成処理のそれぞれを実行させるためのプログラム。
　複数の被写体が写る画像を撮像する撮像処理と、
　前記画像に付帯情報を記録して画像データを生成する生成処理と、を実行し、
　前記付帯情報は、前記複数の被写体に対応付けて付与された複数の識別情報と、前記複数の被写体に対応付けて付与された複数の画質情報と、を含む撮像装置。
　前記付帯情報は、機械学習用の教師データの作成に用いられる選別画像データを選別するための情報である、請求項１９に記載の撮像装置。