WO2022158106A1

WO2022158106A1 - 画像処置装置及び方法、及び撮像装置

Info

Publication number: WO2022158106A1
Application number: PCT/JP2021/042884
Authority: WO
Inventors: 聡青山; 昇大森; 佑樹筑比地; 雄太薄井; 洋平藤谷
Original assignee: キヤノン株式会社
Priority date: 2021-01-22
Filing date: 2021-11-24
Publication date: 2022-07-28
Also published as: JP2022112908A; US20230360368A1

Abstract

画像から、被写体を検出する検出手段と、前記検出された被写体に対して、推論モデルを用いて推論処理を行う推論手段と、前記画像の画像データと、前記被写体の情報と、前記推論処理の推論結果と、前記推論モデルの情報とをまとめて、画像ファイルを生成する生成手段と、を有し、前記生成手段は、前記推論モデルを前記画像ファイルの非公開の領域に記録する。

Description

画像処置装置及び方法、及び撮像装置

　本発明は、デジタルカメラなどで撮像された画像を処理する画像処置装置及び方法、及び撮像装置に関する。

　近年、深層学習などといった人工知能（Artificial Intelligence：ＡＩ）技術が様々な技術分野で活用されつつある。例えば、従来、デジタルスチルカメラなどにおいて、撮影された画像から人の顔を検出する機能が搭載されていたが、特許文献１には、検出対象を人に限らず、犬や猫といった動物などを精度よく検出し、認識する技術が開示されている。

　一方、被写体検出技術が進化し、検出できる情報の重要性が増えるにつれ、検出対象として入力画像と検出された結果は、その後のワークフローで様々に利活用できる重要な情報となっている。例えば、画像からＡＩ技術などを用いて推定される多様な情報は、ロボットの自動化、自動車の自動運転など、様々な分野で非常に重要な入力データとなっている。

特開２０１５－９９５５９号公報

　しかしながら、入力画像から検出できた情報の管理方法については、触れられていない。

　本発明は上記問題点を鑑みてなされたものであり、画像における被写体の推定結果を適切に管理することを目的とする。

　上記目的を達成するために、本発明の画像処理装置は、画像から、被写体を検出する検出手段と、前記検出された被写体に対して、推論モデルを用いて推論処理を行う推論手段と、前記画像の画像データと、前記被写体の情報と、前記推論処理の推論結果と、前記推論モデルの情報とをまとめて、画像ファイルを生成する生成手段と、を有し、前記生成手段は、前記推論モデルを前記画像ファイルの非公開の領域に記録する。

　本発明によれば、画像における被写体の推定結果を適切に管理することができる。

　本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。

　添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態におけるデジタルカメラの概略構成を示すブロック図。本実施形態におけるデジタルカメラの撮影処理を示すフローチャート。本実施形態におけるデジタルカメラの再生処理を示すフローチャート。本実施形態におけるデジタルカメラの再生処理を示すフローチャート。本実施形態におけるデジタルカメラの再推論処理を示すフローチャート。本実施形態におけるデジタルカメラで記録される画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラで記録される画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラで記録される画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラで記録される画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの送信処理を示すフローチャート。本実施形態におけるデジタルカメラの送信処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの送信処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの送信処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの送信処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの送信処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの送信処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの編集処理を示すフローチャート。本実施形態におけるデジタルカメラの編集処理を示すフローチャート。本実施形態におけるデジタルカメラの編集処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの編集処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの編集処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの編集処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの編集処理時の画像ファイルの記録内容の概要を表す図。本実施形態におけるデジタルカメラの編集処理時の画像ファイルの記録内容の概要を表す図。

　以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

　また、以下の説明では、推論モデルを使用し、被写体分類を行う画像出力装置として、デジタルカメラを例示するが、本発明の画像出力装置がデジタルカメラに限られないことは言うまでもない。本発明の画像出力装置は、記録装置に記録されている画像を読み出して表示装置に表示する画像出力装置であればいかなる機器であってもよく、例えば、スマートフォン、タブレットＰＣなどであってもよい。

　図１は、本発明の実施形態にかかるデジタルカメラ１００の構成例を示すブロック図である。
　バリア１０は、デジタルカメラ１００の撮影レンズ１１を含む撮像部を覆う事により、撮像部の汚れや破損を防止する保護部材であり、バリア制御部４３により動作が制御される。撮影レンズ１１は、光学像を撮像素子１３の撮像面に結像させる。シャッター１２は、絞り機能を備える。撮像素子１３は、例えば、ＣＣＤやＣＭＯＳセンサ等で構成され、シャッター１２を介して撮影レンズ１１により撮像面上に結像された光学像を電気信号に変換する。

　Ａ／Ｄ変換器１５は、撮像素子１３から出力されたアナログの画像信号をデジタルの画像信号に変換する。Ａ／Ｄ変換器１５で変換されたデジタルの画像信号は、所謂ＲＡＷ画像データとして、メモリ２５に書き込まれる。併せて、撮影時の情報を基に各ＲＡＷ画像データに対応する現像パラメータが生成され、メモリ２５に書き込まれる。現像パラメータは、露光設定、ホワイトバランス、色空間、コントラストなど、ＪＰＥＧ方式などを記録するための画像処理で使用する各種パラメータから構成される。

　タイミング発生器１４は、メモリ制御部２２及びシステム制御部５０Ａにより制御され、撮像素子１３、Ａ／Ｄ変換器１５、Ｄ／Ａ変換器２１にクロック信号や制御信号を供給する。

　画像処理部２０は、Ａ／Ｄ変換器１５からのデータ或いはメモリ制御部２２からのデータに対して所定の画素補間処理、色変換処理、補正処理、リサイズ処理などの各種画像処理を行う。また、画像処理部２０は、撮像して得られた画像データを用いて所定の画像処理や演算処理を行い、得られた演算結果をシステム制御部５０Ａに提供する。システム制御部５０Ａは、提供された演算結果に基づいて露光制御部４０および焦点制御部４１を制御することにより、ＡＦ（オートフォーカス）処理、ＡＥ（自動露出）処理、ＥＦ（フラッシュプリ発光）処理を実現する。

　また、画像処理部２０は、撮像して得られた画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてＡＷＢ（オートホワイトバランス）処理も行う。さらに、画像処理部２０は、メモリ２５に格納された画像データを読み込んでＪＰＥＧ方式やＭＰＥＧ－４　ＡＶＣまたはＨＥＶＣ（High　Efficiency　Video　Coding）、非圧縮のＲＡＷデータに対する可逆圧縮など、圧縮処理或いは伸長処理を行う。そして、画像処理部２０は、処理を終えた画像データをメモリ２５に書き込む。

　また、画像処理部２０は、撮像して得られた画像データを用いて所定の演算処理を行い、各種画像データの編集処理を行う。具体的には、画像データの周囲にある不要な部分を非表示にすることで画像の表示範囲やサイズを調整するトリミング処理、画像データや画面の表示要素などを拡大や縮小して大きさを変更するリサイズ処理を行うことができる。更に、非圧縮のＲＡＷデータに対する可逆圧縮など、圧縮処理或いは伸長処理を行ったデータに対して色変換などの画像処理を加え、ＪＰＥＧ方式に変換して画像データを作成するＲＡＷ現像を行うことができる。また、ＭＰＥＧ－４などの動画フォーマットの指定フレームを切り出してＪＰＥＧ方式に変換して保存する動画切り出し処理を行うことができる。

　また、画像処理部２０は、表示用の画像データと共に、表示部２３に表示するメニューや任意の文字等のＯＳＤ（On-Screen Display）を重畳させる処理等も行う。
　さらに、画像処理部２０では、入力された画像データや撮影時の撮像素子１３などから得られる被写体との距離情報などを利用して、画像データ内に存在する被写体を検出して、その被写体領域を検出する被写体検出処理を行う。検出できる情報として、画像内における位置、大きさといった領域や傾き、確からしさなどの検出情報を得ることができる。

　メモリ制御部２２は、Ａ／Ｄ変換器１５、タイミング発生器１４、画像処理部２０、画像表示メモリ２４、Ｄ／Ａ変換器２１、メモリ２５を制御する。Ａ／Ｄ変換器１５により生成されたＲＡＷ画像データは、画像処理部２０、メモリ制御部２２を介して、或いは、直接メモリ制御部２２を介して、画像表示メモリ２４或いはメモリ２５に書き込まれる。

　画像表示メモリ２４に書き込まれた表示用の画像データは、Ｄ／Ａ変換器２１を介してＴＦＴ　ＬＣＤなどにより構成される表示部２３に表示される。表示部２３を用いて撮像して得られた画像データを逐次表示すれば、ライブ画像を表示する電子ファインダ機能を実現することが可能である。
　メモリ２５は、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶量を備え、撮影した静止画像や動画像を格納する。また、メモリ２５はシステム制御部５０Ａの作業領域としても使用することが可能である。

　露光制御部４０は、絞り機能を備えるシャッター１２を制御する。また、露光制御部４０は、フラッシュ４４と連動することによりフラッシュ調光機能も有する。焦点制御部４１は、システム制御部５０Ａからの指示に基づいて撮影レンズ１１に含まれる不図示のフォーカスレンズを駆動することで、焦点調節を行う。ズーム制御部４２は、撮影レンズ１１に含まれる不図示のズームレンズを駆動することで、ズーミングを制御する。フラッシュ４４は、ＡＦ補助光の投光機能、フラッシュ調光機能を有する。

　システム制御部５０Ａは、デジタルカメラ１００全体を制御する。不揮発性メモリ５１は、電気的に消去・記録可能な不揮発性メモリであり、例えばＥＥＰＲＯＭ等が用いられる。なお、不揮発性メモリ５１には、プログラムだけでなく、地図情報等も記録されている。

　シャッタースイッチ６１（ＳＷ１）は、シャッターボタン６０の操作途中でＯＮとなり、ＡＦ処理、ＡＥ処理、ＡＷＢ処理、ＥＦ処理などの動作開始を指示する。シャッタースイッチ６２（ＳＷ２）は、シャッターボタン６０の操作完了でＯＮとなり、露光処理、現像処理、記録処理を含む一連の撮影動作の開始を指示する。露光処理では、撮像素子１３から読み出された信号を、Ａ／Ｄ変換器１５、メモリ制御部２２を介して、ＲＡＷ画像データとしてメモリ２５に書き込む。現像処理では、画像処理部２０やメモリ制御部２２での演算を用いて、メモリ２５に書き込まれたＲＡＷ画像データを現像し、画像データとしてメモリ２５に書き込む。記録処理では、メモリ２５から画像データを読み出し、画像処理部２０により圧縮を行い、圧縮した画像データをメモリ２５に格納した後にカードコントローラ９０を介して外部記録媒体９１に書き込む。

　操作部６３は、各種ボタンやタッチパネルなどの操作部材を備える。例えば、電源ボタン、メニューボタン、撮影モード／再生モード／その他特殊撮影モードの切替えを行うモード切替えスイッチ、十字キー、セットボタン、マクロボタン、マルチ画面再生改ページボタンを含む。また、例えば、フラッシュ設定ボタン、単写／連写／セルフタイマー切り替えボタン、メニュー移動＋（プラス）ボタン、メニュー移動－（マイナス）ボタン、撮影画質選択ボタン、露出補正ボタン、日付／時間設定ボタンなどを含む。

　メタデータ生成・解析部７０は、外部記録媒体９１に画像データを記録する際に、撮影時の情報を基に、画像データに添付するＥｘｉｆ(Exchangeable image file format)規格などの様々なメタデータを生成する。また、メタデータ生成・解析部７０は、外部記録媒体９１に記録されている画像データを読み込んだ際に、画像データに付与されているメタデータの解析を行う。メタデータとしては、例えば、撮影時の撮影時設定情報、画像データに関する画像データ情報、画像データに含まれる被写体の特徴情報などが挙げられる。また、動画像データを記録する際には、メタデータ生成・解析部７０は、各フレームについてメタデータを生成し、付与することもできる。

　電源８０は、アルカリ電池やリチウム電池等の一次電池、ＮｉＣｄ電池、ＮｉＭＨ電池、Ｌｉ電池等の二次電池、ＡＣアダプター等からなる。電源制御部８１は、電源８０から供給される電力をデジタルカメラ１００の各部に供給する。
　カードコントローラ９０は、メモリカード等の外部記録媒体９１とデータの送受信を行う。外部記録媒体９１は、例えばメモリカードで構成され、デジタルカメラ１００が撮影した画像（静止画、動画）を記録する。

　推論エンジン７３Ａは、推論モデル記録部７２Ａに記録された推論モデルを用いて、システム制御部５０Ａを介して入力された画像データに対して推論を行う。推論モデルには、外部装置１０１などの外部から通信部７１Ａを通じて入力し、推論モデル記録部７２Ａに記録されたものや、学習部７４Ａによって再学習を行って得られた推論モデルを使用することができる。なお、推論モデルは、外部からの更新や学習部７４Ａによって再学習を行って更新された場合に、それぞれの推論モデルが識別できるように、推論モデル記録部７２Ａなどで管理バージョンを保持していることとする。また、推論エンジン７３Ａは、ニューラルネットワーク・デザイン７３ａを有する。

　ニューラルネットワーク・デザイン７３ａは、入力層と出力層の間に中間層（ニューロン）が配置されている。入力層にはシステム制御部５０Ａから画像データが入力される。中間層としては、何層かのニューロンが配置されている。ニューロンの層の数は設計上適宜決められ、また各層におけるニューロンの数も設計上適宜決められる。中間層は、推論モデル記録部７２Ａに記録された推論モデルに基づいて、重み付けがなされる。出力層には、入力層に入力された画像データに応じたアノテーション情報が出力される。

　本実施形態では、画像に含まれる被写体がどのようなものであるかの分類を推論する推論モデルを想定する。様々な被写体の画像データと、その分類（例えば、犬、猫などの動物の分類や、人、動物、植物、建物など被写体分類など）結果を教師データとして、深層学習により生成された推論モデルを外部装置１０１などで生成したものを利用する。ただし、推論エンジン７３Ａは外部装置１０１などから更新可能なため、その他の様々な推論モデルを扱っても構わない。

　学習部７４Ａは、システム制御部５０Ａ等から依頼を受けて、推論モデルの再学習を行う。学習部７４Ａは、教師データ記録部７４ａを有し、教師データ記録部７４ａは、推論エンジン７３Ａへの教師データに関する情報を記録する。学習部７４Ａは教師データ記録部７４ａに記録されている教師データを用いて、推論エンジン７３Ａを再学習させ、推論モデル記録部７２Ａを用いて、推論エンジン７３Ａを更新することができる。

　通信部７１Ａは、送信および受信を行うための通信回路を有する。通信回路は、具体的にはＷｉ－ＦｉやＢｌｕｅｔｏｏｔｈ（登録商標）などの無線通信でも良いし、イーサネットやＵＳＢなどの有線通信でも良い。通信部７１Ａは、外部装置１０１の通信部７１Ｂと通信を行うことができる。通信部７１Ａは、推論エンジン７３Ａにおいて作成されたアノテーション情報が付与された画像ファイルだけでなく、推論モデルや教師データなどの様々な情報をシステム制御部５０Ａ、システム制御部５０Ｂに送受信する通信部として機能する。また、外部装置１０１がカメラと関連しているかどうかにより、送信する情報に制限をかけることができる。

　外部装置１０１は、学習部７４Ｂ、推論エンジン７３Ｂ、推論モデル記録部７２Ｂ、システム制御部５０Ｂ、通信部７１Ｂを有する。または、これらの構成を持たない装置であってもよい。学習部７４Ｂは、推論エンジン７３Ｂ、システム制御部５０Ｂなど、外部からの依頼を受けて推論モデルを作成する。推論モデル記録部７２Ｂは、デジタルカメラ１００から送信された推論モデルや学習部７４Ｂで作成された推論モデルを記録する。

　次に、図２を用いて、本実施形態におけるデジタルカメラ１００の撮影処理について説明する。
　操作部６３に含まれるモード切替スイッチにより撮影モードが指示されると処理が開始される。Ｓ２０１において、ユーザがシャッターボタン６０の押下により、シャッタースイッチ６１（ＳＷ１）及び６２（ＳＷ２）がＯＮとなって静止画撮影が指示されたかを確認し、静止画撮影が指示された場合、Ｓ２０２に進む。

　Ｓ２０２では、撮影処理を行う。撮影処理では、焦点制御部４１や露光制御部４０を用いて、ＡＦ（オートフォーカス）処理、ＡＥ（自動露出）処理を行ったうえで、撮像素子１３からＡ／Ｄ変換器１５を介して出力される画像信号をメモリ２５に保存する。更に、メモリ２５に保存した画像信号に対して、ユーザの設定に合わせて、画像処理部２０に含まれる圧縮処理でＪＰＥＧ形式やＭＰＥＧ－４ＨＥＶＣ形式で圧縮した画像データを作成する。

　Ｓ２０３において、メモリ２５に保存された画像信号に対して、画像処理部２０により被写体検出処理を行い、画像に含まれる被写体の検出情報を取得する。

　Ｓ２０４において、Ｓ２０２で作成された画像データとＳ２０３で取得した被写体検出情報を画像ファイルとして外部記録媒体９１に記録する。ここで記録される画像ファイルは、図５Ａに示すような形式で記録される。本実施形態で記録される画像ファイル４００は、少なくともＥｘｉｆ規格に従ったメタデータを記憶する領域と、圧縮された画像データ４０６を記録する画像データ領域とから構成されている。画像ファイル４００は、例えば、ユーザからＪＰＥＧ形式での記録が指示されていれば、ＪＰＥＧ形式で記録され、Ｅｘｉｆデータ４０１はＡＰＰ１マーカーなどに記録されている。また、ユーザからＨＥＩＦ（High Efficiency Image File Format）形式での記録が指示された場合、ＨＥＩＦファイル形式で記録され、Ｅｘｉｆデータ４０１は、ＭｅｔａデータＢｏｘなどに記録される。また、ＲＡＷ形式での記録が指示された場合も同様に、Ｅｘｉｆデータ４０１は、ＭｅｔａデータＢｏｘなどの所定の領域に記録される。

　Ｓ２０３で取得した被写体検出情報は、メタデータ生成・解析部７０を用いて、Ｅｘｉｆデータ４０１に含まれる製造メーカー固有のメタデータが原則非公開の形式で記載できるＭａｋｅｒＮｏｔｅ４０４内に記憶される。更に、被写体検出情報は、アノテーションリンク情報格納タグ４０２に含まれるアノテーション情報オフセットで指し示す位置に記録されているアノテーション情報４０３ａに記録される。アノテーション情報４０３ａに記録された被写体検出情報は、後述する推論処理において推論エンジン７３Ａへの入力データとなるアノテーション情報として用いられる。図５Ａに示す例では、アノテーション情報４０３ａには被写体の画面内の座標領域だけが記録されているが、それ以外の情報が含まれていても構わない。

　Ｓ２０５において、推論エンジン７３Ａを用いた推論処理が実施可能か確認する。例えば、推論エンジン７３Ａが他の画像に対する処理を実行中であったり、シャッターボタン６０の操作によりシャッタースイッチ６２（ＳＷ２）が引き続きＯＮであって、連写撮影が指示されて撮影処理を優先すべき場合などは、推論処理を実行できない。推論処理が実行できない場合は、Ｓ２０８に進み、推論処理が実行可能であれば、Ｓ２０６に進む。

　Ｓ２０６において、画像ファイル４００に対して、推論エンジン７３Ａを用いた推論処理を行う。本実施形態では、推論エンジン７３Ａへの入力として、画像ファイル４００を入力する。画像ファイル４００内の画像データ４０６とアノテーション情報４０３ａから画像データ内に含まれる被写体領域を特定し、被写体領域ごとに推論エンジン７３Ａを用いて推論した結果として、被写体領域に含まれる被写体の分類結果を出力する。推論時に、推論結果以外に推論途中の動作上のデバッグ情報、ログなど推論処理に関連する情報を出力しても構わない。

　Ｓ２０７において、Ｓ２０６で取得した推論結果である被写体の分類結果と、推論モデル記録部７２Ａで保持している現在の推論モデルの管理バージョンやデバッグ情報などがあればそれらを推論モデル管理情報として画像ファイルに記録する。図５Ｂは、図５Ａの画像ファイル４００に、推論結果と推論モデル管理情報を記録した後の画像ファイル４２０を示す。画像ファイル４２０では、メタデータ生成・解析部７０を用いて、推論結果をアノテーション情報４０３ｂに被写体の位置座標ごとに記録し、推論モデル管理情報４０７ａをＭａｋｅｒＮｏｔｅ４０４内に追記する。

　本実施形態では、アノテーション情報を、位置座標と推論結果の組み合わせとした例を示しているが、アノテーション情報４０３ｂには推論モデルの推論結果として出力されたものを記録できれば良い。例えば、出力結果をそのまま記録してもいいし、テキスト形式、バイナリ型式などその記録フォーマットや形式は問わない。このように画像データ４０６と推論結果を同一ファイル内に記録することで、以後、画像データ４０６と推論結果を各々管理することなく、効率的に対応づけて容易に管理することができる。また、推論モデル管理情報４０７ａは、推論モデルを管理する製造メーカが利用する特有のデータのため、広く一般に公開せず、非公開のＭａｋｅｒＮｏｔｅ４０４に記録することで、推論結果とともに対応付けて安全に管理することができる。

　Ｓ２０８において、ユーザから操作部６３に含まれるモード切り替えスイッチや電源ボタンで電源ＯＦＦなどにより撮影完了が指示されると、撮影処理を終了する。

　次に、図３Ａ及び図３Ｂを用いて、本実施形態におけるデジタルカメラ１００の再生処理について説明する。
　デジタルカメラ１００では、操作部６３に含まれるモード切替スイッチで再生モードが指示されると、外部記録媒体９１に記録されている画像データを閲覧する再生処理が開始される。再生処理が開始されると、Ｓ３０１において、再生すべき１つの画像ファイルを特定し、カードコントローラ９０を介して外部記録媒体９１からメモリ２５に読み込む。

　Ｓ３０２において、画像処理部２０により、メモリ２５に読み出した画像ファイルに対して、記録方式に応じて伸長処理やリサイズ処理などを行い、表示用画像データに変換して画像表示メモリ２４に記録し、表示部２３で再生する。

　Ｓ３０３において、メタデータ生成・解析部７０を用いて、現在再生中の画像ファイルに推論結果が記録済みか確認する。記録済みであれば、Ｓ３０４に進み、記録済みでなければＳ３０９に進む。
　Ｓ３０４において、ユーザから操作部６３に含まれる操作部材を用いて、画像ファイルに記録済みの推論結果を表示するよう指示があれば、Ｓ３０５に進み、指示が無ければＳ３０９に進む。

　Ｓ３０５において、メタデータ生成・解析部７０を用いて、アノテーション情報４０３ｂから推論結果に関する情報を抽出し、画像処理部２０を用いて抽出した情報を再生中の画像データに重畳し、表示する。例えば、アノテーション情報４０３ｂに記載されている被写体毎の座標領域を示す枠とともに、その座標領域内の被写体を分類した推論結果を文字列で併せて表示することで、画像データに関連づけられた推論結果をユーザが目視できるように表示する。

　Ｓ３０６において、ユーザがＳ３０５において表示された推論結果を参照した結果、誤りに気付くなどして、操作部６３に含まれる操作部材を用いて推論結果の訂正指示があったか確認する。訂正指示があれば、Ｓ３０７に進み、訂正指示が無ければＳ３０９に進む。

　Ｓ３０７では、推論結果の訂正指示を取得し、推論モデルの教師データとして、図５Ｃに示す画像ファイル４３０を作成し、教師データ記録部７４ａに記録する。なお、外部記録媒体９１にも画像ファイル４２０とは別ファイルとして記録しておいても構わない。画像ファイル４３０は、画像ファイル４２０を基にして作成され、メタデータ生成・解析部７０を用いて、アノテーションリンク情報格納タグ４０２に含まれるアノテーション情報オフセットで指し示す位置に記録されているアノテーション情報４０３ｃに被写体の画面内の座標領域ごとにユーザから訂正を指示されたデータを正解データとして記録する。画像ファイル４２０のアノテーション情報４０３ｂは、旧アノテーションリンク情報格納タグ４０８に含まれる旧アノテーション情報オフセットが指し示す位置に、旧アノテーション情報４０９として記録される。

　次に、Ｓ３０８において、学習部７４Ａを用いて、Ｓ３０７で作成された画像ファイル４３０を教師データとして、推論エンジン７３Ａを再学習させ、推論エンジン７３Ａを更新する。更新に伴い、推論モデル記録部７２Ａで推論エンジン７３Ａの管理バージョンなどの更新も併せて行う。

　Ｓ３０９において、ユーザから操作部６３に含まれる操作部材を用いて再生中の画像ファイルへの推論が指示されたか確認を行う。例えば、撮影時に推論処理を行うことができなかった画像ファイルに対する推論処理を行いたい場合や、外部から推論モデルが更新され、記録済みの画像ファイルに対して再度推論処理を行いたい場合など、推論が指示された場合、Ｓ３１０に進む。

　Ｓ３１０において、推論が指示された画像ファイルに推論結果が記録済みか確認し、記録されていなければ、Ｓ３１２、Ｓ３１３において、Ｓ２０６、Ｓ２０７と同様の処理を行って、画像ファイルに推論結果、推論モデル管理情報の記録を行う。すでに推論結果が記録済みの場合は、Ｓ３１１に進み、再推論処理を行う。

　ここで、Ｓ３１１で行われる再推論処理について、図４を用いて説明する。
　再推論処理では、Ｓ４０１において、メタデータ生成・解析部７０を用いて、推論が指示された画像ファイルに記録されている推論モデル管理情報を抽出する。そして、推論モデル管理情報に含まれる管理バージョンと、推論モデル記録部７２Ａで管理している推論エンジン７３Ａの管理バージョンの新旧を比較し、推論エンジン７３Ａの管理バージョンが更新されているか確認する。推論エンジン７３Ａの管理バージョンが、画像ファイルに記録されている管理バージョンより古いか同じであれば、何も処理を行わず、そのまま終了する。更新されていれば、Ｓ４０２に進む。

　Ｓ４０２では、Ｓ２０６と同様の処理を行う。例えば、画像ファイル４２０に対して再推論処理を行う場合、画像ファイル４２０内の画像データ４０６とアノテーション情報４０３ｂから、画像データ４０６内に含まれる被写体領域を特定する。そして、被写体領域ごとに推論エンジン７３Ａを用いて推論を行い、Ｓ４０３において、被写体領域ごとに推論結果を取得する。

　Ｓ４０４において、Ｓ４０３で取得した推論結果が画像ファイル４２０に記録されているアノテーション情報４０３ｂの推論結果と異なる出力形式かどうかを判断する。異なる出力形式となる場合としては、例えば、推論エンジン７３Ａが更新され、より詳細な分類が可能となり、分類結果に新たに細目などの項目が追加して出力されているような場合が考えられる。出力形式が異なる場合、Ｓ４０６に進む。

　一方、同じ出力形式の場合、Ｓ４０５において、推論モデル記録部７２Ａで管理している推論エンジン７３Ａの管理バージョンについて、外部から推論モデルの更新の有無が管理されており、外部からの更新があったことを示しているかどうかを判断する。外部からの更新があった場合にはＳ４０６に進む。

　Ｓ４０６では、メタデータ生成・解析部７０を用いて、図５Ｄに示す画像ファイル４４０のような形式にして、外部記録媒体９１に記録する。画像ファイル４４０には、元の画像ファイル４２０に対して、アノテーションリンク情報格納タグ４０２に含まれるアノテーション情報オフセットで指し示す位置に記録されているアノテーション情報４０３ｄに、再推論した結果を記録する。

　一方、画像ファイル４２０にすでに記録されていたアノテーション情報４０３ｂは、旧アノテーションリンク情報格納タグ４０８に含まれる旧アノテーション情報オフセットが指し示す位置に、旧アノテーション情報４０９として記録される。これにより、古い推論結果と新しい推論結果を共に画像データに関連付けて記録することができ、画像データに対する推論結果の推移を容易に管理することができる。

　また、本実施形態では被写体の分類を推論する推論モデルを想定していたが、推論モデルとしては分類に限らず様々な推論モデルが存在している。異なる推論モデルを用いて推論処理を行う場合にも、本実施形態を利用することで、１つの画像データに対して異なる複数の推論モデルの推論結果を１つのファイル内で効率的に対応付けて容易に管理することもできる。

　Ｓ４０５において、推論モデルが外部から更新されていない場合、Ｓ４０７において、メタデータ生成・解析部７０を用いて、画像ファイル４２０のアノテーション情報４０３ｂの推論結果の部分だけを更新し、Ｓ４０８に進む。

　Ｓ４０８では、画像ファイル４４０のＭａｋｅｒＮｏｔｅ４０４内の推論モデル管理情報４０７ａを、メタデータ生成・解析部７０を用いて、現在の推論エンジン７３Ａの情報である推論モデル管理情報４０７ｂに更新する。

　図３Ｂに戻り、Ｓ３１４において、操作部６３に含まれる操作部材を用いて、他の画像の再生指示がされた場合は、Ｓ３０１に戻って、指示された再生画像について上述した処理を繰り返す。一方、他の画像の再生指示がされなかった場合は、Ｓ３１５において再生処理の終了が指示されたかどうかを判断し、再生処理の終了が指示されなければＳ３０３に戻って上述した処理を繰り返し、再生処理の終了が指示されると再生処理を終了する。

　次に、図６を用いて、本実施形態におけるデジタルカメラ１００の送信処理について説明する。
　操作部６３に含まれる操作部材を用いて送信が指示されると、図６のフローチャートに示す送信処理が開始される。送信の指示は、一つまたは複数の画像ファイルを対象として選択して送信を開始しても良いし、予め撮影時に自動送信する設定を行っておき、画像ファイルが生成されたことをトリガーに送信を開始しても良い。ここでは、送信前の画像ファイルとして、上述した図５Ｄの画像ファイル４４０のような形式で記録されている場合を例にとって説明する。

　Ｓ６０１において、デジタルカメラ１００の通信部７１Ａを通じて外部装置１０１にシステム情報を要求し、外部装置１０１はシステム制御部５０Ｂから通信部７１Ｂを通じてデジタルカメラ１００にシステム情報を送信する。これによりデジタルカメラ１００は送信先のシステム情報を取得し、Ｓ６０２に進む。

　次に、Ｓ６０２において、デジタルカメラ１００の通信部７１Ａを通じて外部装置１０１に推論モデル管理情報を要求し、外部装置１０１はシステム制御部５０Ｂから通信部７１Ｂを通じてデジタルカメラ１００に推論モデル管理情報を送信する。これによりデジタルカメラ１００は送信先の推論モデル管理情報を取得し、Ｓ６０３に進む。

　Ｓ６０３において、送信方法を決定する。送信方法の具体的な例としては、Ｗｉ－ＦｉやＢｌｕｅＴｏｏｔｈ（登録商標）などの無線送信、イーサネットケーブルやＵＳＢケーブルによる有線送信、ＳＤカードなどのリムーバブルメディアによる送信などがある。送信方法の決定方法としては、複数の送信方法を利用可能である場合は、操作部６３に含まれる操作部材によりユーザーが設定したものを送信方法としても良いし、外部装置１０１とデジタルカメラ１００との接続状態から判断しても良い。単独の送信方法のみを利用可能である場合は、その送信方法を決定しても良い。送信方法を決定すると、Ｓ６０４に進む。

　Ｓ６０４において、Ｓ６０１で取得した送信先のシステム情報と、自身のシステム情報とを比較し、同一の場合はＳ６０５に進む。異なる場合や、送信先のシステム情報が取得できなかった場合は、Ｓ６０８に進む。

　Ｓ６０５では、Ｓ６０２で取得した送信先の推論モデルの管理バージョンと、推論モデル記録部７２Ａで保持しているデジタルカメラ１００自身の推論モデルの管理バージョンとを比較する。送信先の管理バージョンと自身の管理バージョンとが一致している場合は、Ｓ６０６に進み、送信先の管理バージョンと自身の管理バージョンが一致していない場合や、送信先の管理バージョンが取得できないなどの理由で判断できない場合は、Ｓ６０７に進む。

　Ｓ６０６では、一致した管理バージョン以外のアノテーション情報を削除する。例えば、最新以外の管理バージョンで一致した場合、図５Ｄに示す画像ファイル４４０から、アノテーションリンク情報格納タグ４０２とアノテーション情報４０３ｄを削除して、図７Ａに示すような画像ファイル７００を生成する。一致した管理バージョン以外のアノテーション情報を削除することで、送信先のシステムで使用するアノテーション情報を残しつつ、使用する可能性の低いアノテーション情報を削除して、データ量削減やデータ効率の向上、拡張性の確保を見込むことができる。その後、Ｓ６１０に進む。

　一方、管理バージョンが一致していない場合、Ｓ６０７において、最新の管理バージョン以外のアノテーション情報を削除する。例えば、図５Ｄに示す画像ファイル４４０から、旧アノテーションリンク情報格納タグ４０８と旧アノテーション情報４０９を削除して、図７Ｂに示すような画像ファイル７１０を生成する。最新の管理バージョン以外のアノテーション情報を削除することで、送信先のシステムで使用するアノテーション情報を残しつつ、使用する可能性の低いアノテーション情報を削除してデータ量削減やデータ効率の向上、拡張性の確保を見込むことができる。その後、Ｓ６１０に進む。

　また、システム情報が一致しない場合、Ｓ６０８において、Ｓ６０７における処理と同様に、最新の管理バージョン以外のアノテーション情報を削除する。例えば、図５Ｄに示す画像ファイル４４０から、図７Ｂに示すような画像ファイル７１０を生成する。最新の管理バージョン以外のアノテーション情報を削除することで、使用する可能性の低いアノテーション情報を削除してデータ量削減やデータ効率の向上、拡張性の確保を見込むことができる。その後、Ｓ６０９に進む。

　Ｓ６０９では、最新の推論結果を削除する。例えば、図７Ｂに示す画像ファイル７１０から、アノテーション情報７０５に含まれる推論結果を削除し、図７Ｃに示すようなアノテーション情報７０５ｂとＭａｋｅｒＮｏｔｅ７０６を含む画像ファイル７２０を生成する。最新の推論結果を削除することで、使用する可能性の低い推論結果を削除してデータ量削減やデータ効率の向上、拡張性の確保を見込むことができる。その後、Ｓ６１０に進む。

　Ｓ６１０において、Ｓ６０３で決定した送信方法の信頼性が十分に高いかどうかを判断し、十分に高いと判断した場合はＳ６１２に進む。信頼性が十分に高い送信方法とはいえないと判断した場合はＳ６１１に進む。具体的には、送信方法が有線やＳＤカード持ち出しの場合は信頼性が高いと判断し、無線の場合は信頼性が低いと判断しても良い。もしくは、無線でも社内ＬＡＮの場合は信頼性が高いと判断し、公衆無線の場合は信頼性が低いと判断しても良い。

　Ｓ６１１では、アノテーションリンク情報格納タグを削除する。例えば、Ｓ６０６で図７Ａに示す画像ファイル７００が生成されている場合は、旧アノテーションリンク情報格納タグ４０８を削除し、図７Ｄに示すような画像ファイル７３０を生成する。また、Ｓ６０７で図７Ｂに示す画像ファイル７１０が生成されている場合は、アノテーションリンク情報格納タグ４０２を削除し、図７Ｅに示すような画像ファイル７４０を生成する。また、Ｓ６０９で図７Ｃに示す画像ファイル７２０が生成されている場合は、アノテーションリンク情報格納タグ４０２を削除し、図７Ｆに示すような画像ファイル７４０を生成する。

　このように、アノテーションリンク情報格納タグを削除することで、万が一送信時に画像ファイルを傍受されても、推論結果には容易にアクセスできないため、ノウハウや資産（コストをかけて作成したデータ）の流出を防ぐことができる。その後、Ｓ６１２に進む。

　Ｓ６１２において、Ｓ６０３で決定された送信方法により、対象の画像ファイルの送信処理を行い、処理を終了する。

　なお上記説明では、画像ファイルごとに推論結果の削除を行い、その後送信処理を行うものとしたが、複数の画像ファイルについてまとめて推論結果の削除処理を行い、その後削除処理した複数の画像ファイルをまとめて送信するようにしても良い。

　次に、図８Ａ及び図８Ｂを用いて、本実施形態におけるデジタルカメラ１００の編集処理について説明する。
　操作部６３に含まれる操作部材を用いて編集が指示されると、図８Ａ及び図８Ｂのフローチャートに示す編集処理が開始される。編集の指示は、一つまたは複数の画像ファイルを対象として選択して編集内容を指示しても良いし、撮影時に表示部にクイックレビュー表示された画像に対して編集内容を指示しても良い。

　Ｓ８０１において、システム制御部５０Ａは、外部記録媒体９１に保存されている画像ファイルから、画像データ、Ｅｘｉｆデータ４０１などを取得し、表示部２３を通じて表示要求を行い、Ｓ８０２に進む。
　Ｓ８０２では、指示された編集内容に従って、取得した画像データに対して編集を行い、編集後の画像データを保存する。例えば、編集前の画像ファイルが、上述した図５Ｄの画像ファイル４４０のような形式で記録されている場合、取得した画像データ４０６に対して編集を行い、編集後の画像データ９１２を保存する。また、画像データ４０６のＭａｋｅｒＮｏｔｅ４０４に検出された被写体の情報４０５がある場合には、編集内容に応じて被写体の情報を変換して記録する。例えば、編集により画像のサイズが変わった場合には、ＭａｋｅｒＮｏｔｅ４０４内の各被写体の座標を編集後の画像サイズに合わせて変換し、変換した座標情報９１１を記録して、図９Ａに示す画像ファイル９１０を生成する。

　次に、Ｓ８０３において、システム制御部５０Ａにより、Ｓ８０１で取得した編集対象の画像データの画像ファイルに、アノテーション情報が格納されているか否かを判定する。アノテーション情報が格納されている場合はＳ８０４へ進み、アノテーション情報が格納されていない場合はＳ８２０へ進み、編集後の画像ファイルを記録して、編集処理を終了する。

　Ｓ８０４では、Ｓ８０２で編集した画像データに対して、推論エンジン７３Ａを用いた推論処理を行う。例えば、推論エンジン７３Ａへの入力として、図９Ａに示す画像ファイル９１０を入力した場合、まず、画像ファイル９１０内の画像データ９１２とアノテーション情報４０３ｄから、画像データ９１２内に含まれる被写体領域を特定する。そして、被写体領域ごとに推論エンジン７３Ａを用いて推論した結果として、被写体領域に含まれる被写体の分類結果を出力する。なお、外部装置１０１の推論エンジン７３Ｂを用いることも可能である。また、推論時に、推論結果以外に推論途中の動作上のデバッグ情報、ログなど推論処理に関連する情報が出力される場合があっても構わない。推論処理を終えると、Ｓ８０５に進む。

　Ｓ８０５では、推論モデル記録部７２Ａで保持している現在の推論モデルの管理バージョンやデバッグ情報などがあれば、推論モデル管理情報から最新のものを取得する。そして、取得した情報をＭａｋｅｒＮｏｔｅに記録すると共に、Ｓ８０４の推論結果をアノテーション情報として記録し、既存のアノテーション情報を旧アノテーション情報として記録する。例えば、図９Ａに示す画像ファイル９１０に対して、アノテーションリンク情報格納タグ４０２に含まれるアノテーション情報オフセットで指し示す位置に記録されているアノテーション情報４０３ｅに、Ｓ８０４で推論した結果を記録する。一方、画像ファイル９１０にすでに記録されていたアノテーション情報４０３ｂは、旧アノテーションリンク情報Ａ格納タグ４０８に含まれる旧アノテーション情報オフセットが指し示す位置に、旧アノテーション情報Ａ４０９ａとして記録される。また、旧アノテーション情報４０９は、旧アノテーションリンク情報Ｂ格納タグ９０８に含まれる旧アノテーション情報オフセットが指し示す位置に、旧アノテーション情報Ｂ４０９ｂとして記録される。更に、現在の推論モデルの管理バージョンやデバッグ情報を、ＭａｋｅｒＮｏｔｅ４０４の推論モデル管理情報９２７として記録する。これにより、図９Ｂに示す画像ファイル９２０を生成する。

　次に、Ｓ８０６において、編集処理が、画像データや画面の表示要素などを拡大や縮小して大きさを変更するリサイズ処理であったかどうかを判定する。リサイズ処理の場合はＳ８１４に進み、リサイズ処理でない場合はＳ８０７へ進む。

　Ｓ８１４では、Ｓ８０５で生成した画像ファイルの画像データに対して、メタデータ生成・解析部７０を用いて、Ｓ８０４の推論処理で得られたアノテーション情報を削除し、それ以外のアノテーション情報を保持する。これは、リサイズ処理の場合、サイズ変換に伴い編集後の画素が粗くなるため、編集後の画像から推論するよりも、元の画像の推論結果の方が精度が高いことに因る。例えば、図９Ｂに示す画像ファイル９２０であった場合、アノテーションリンク情報格納タグ４０２とアノテーション情報４０３ｅを削除する。一方、旧アノテーションリンク情報Ａ格納タグ４０８と、旧アノテーションリンク情報Ｂ格納タグ９０８と、旧アノテーション情報Ａ４０９ａと、旧アノテーション情報Ｂ４０９ｂを保持する。これにより、図９Ｃに示すような画像ファイル９３０を生成する。その後、Ｓ８１７に進む。

　Ｓ８０７において、編集処理が、画像データの周囲にある不要な部分をカットすることで画像の表示範囲やサイズを調整するトリミング処理であったかどうかを判定する。トリミング処理の場合はＳ８０８に進み、トリミング処理でない場合はＳ８１１へ進む。

　Ｓ８０８では、旧アノテーション情報のうち、新しい方の旧アノテーション情報に示される被写体について、その座標情報から、すべての被写体領域がトリミング処理によりカットされた領域にあるかどうかを判断する。すべての被写体領域がカットされた領域にある場合はＳ８０９に進み、そうでない場合はＳ８１０に進む。

　Ｓ８０９では、旧アノテーション情報のうち、古い方の旧アノテーション情報に示される被写体について、その座標情報から、すべての被写体領域がトリミング処理によりカットされた領域にあるかどうかを判断する。すべての被写体領域がカットされた領域にある場合はＳ８１５に進み、そうでない場合はＳ８１６に進む。

　Ｓ８１５では、Ｓ８０５で生成した画像ファイルの画像データに対して、メタデータ生成・解析部７０を用いて、旧アノテーション情報をすべて削除し、最新のアノテーション情報を保持する。これは、トリミングにより、すべての旧アノテーション情報に示される被写体の領域が、カットされたためである。例えば、図９Ｂに示す画像ファイル９２０であった場合、旧アノテーションリンク情報Ａ格納タグ４０８と、旧アノテーションリンク情報Ｂ格納タグ９０８と、旧アノテーション情報Ａ４０９ａと、旧アノテーション情報Ｂ４０９ｂを削除する。これにより、図９Ｄに示すような画像ファイル９４０を生成する。その後、Ｓ８１７に進む。

　Ｓ８１６では、Ｓ８０５で生成した画像ファイルの画像データに対して、メタデータ生成・解析部７０を用いて、新しい方の旧アノテーション情報を削除し、最新のアノテーション情報と、古い方の旧アノテーション情報を保持する。これは、トリミングにより、新しい方の旧アノテーション情報に示される被写体の領域が、カットされたためである。例えば、図９Ｂに示す画像ファイル９２０であった場合、旧アノテーションリンク情報Ａ格納タグ４０８と、旧アノテーション情報Ａ４０９ａを削除する。これにより、図９Ｅに示すような画像ファイル９５０を生成する。その後、Ｓ８１７に進む。

　Ｓ８１０では、画像ファイルの古い方の旧アノテーション情報に示される被写体について、その座標情報から、すべての被写体領域がトリミング処理によりカットされた領域にあるかどうかを判断する。すべての被写体領域がカットされた領域にある場合はＳ８１７に進み、そうでない場合はＳ８１８に進む。

　Ｓ８１７では、Ｓ８０５で生成した画像ファイルの画像データに対して、メタデータ生成・解析部７０を用いて、古い方の旧アノテーション情報を削除し、最新のアノテーション情報と、新しい方の旧アノテーション情報を保持する。これは、トリミングにより、古い方の旧アノテーション情報に示される被写体の領域が、カットされたためである。例えば、図９（ｂ）に示す画像ファイル９２０であった場合、旧アノテーションリンク情報Ｂ格納タグ９０８と、旧アノテーション情報Ｂ４０９ｂを削除する。これにより、図９Ｆに示すような画像ファイル９６０を生成する。その後、Ｓ８１７に進む。

　Ｓ８１１では、編集処理が、ＭＰＥＧ－４などの動画フォーマットの指定フレームを切り出してＪＰＥＧ方式に変換して保存する動画切り出し処理であったかどうかを判定する。動画切り出し処理の場合はＳ８１８に進み、動画切り出し処理でない場合はＳ８１２へ進む。

　Ｓ８１２では、編集処理が、ＲＡＷ現像処理であったかどうかを判定する。ＲＡＷ現像処理では、画像処理部２０により、非圧縮のＲＡＷデータに対する可逆圧縮などの圧縮処理、或いは伸長処理を行った画像データに対して色変換など画像処理を加え、ＪＰＥＧ方式に変換して画像データを作成する。ＲＡＷ現像処理の場合はＳ８１３に進み、ＲＡＷ現像処理でない場合はＳ８１８へ進む。

　Ｓ８１３では、Ｓ８１２でＲＡＷ現像処理を行った際に、画像データの色味が変化したか否かの判定を行う。画像データの色味が変化した場合はＳ８１４に進んで、上述した処理を行う。一方、画像データの色味が変化しなかった場合はＳ８１８に進む。

　Ｓ８１８では、Ｓ８０５で生成した画像ファイルの画像データをすべて保持する。例えば、図９Ｂに示す画像ファイル９２０であった場合、画像ファイル９２０を変更せずにそのまま残す。その後、Ｓ８１７に進む。

　Ｓ８１７において、Ｓ８１４からＳ８１８で生成された画像ファイルを外部記録媒体９１に記録し、編集処理を終了する。

　なお、上述した編集処理では、推論処理を行った後に、アノテーション情報の削除を行っているが、最新アノテーション情報を削除する編集内容（図８Ａ及び図８Ｂの例では、リサイズ処理）の場合は、推論処理を行わないようにしてもよい。

　また、上述した例では、リサイズ処理、トリミング処理、動画切り出し処理、ＲＯＷ現像処理を編集処理の例として挙げて説明したが、これら以外の処理であってもよい。その場合にも、Ｓ８１４～Ｓ８１８のように、必要なアノテーション情報を残して、不要なアノテーション情報を削除すればよい。

　また、図９Ａ～図９Ｆに示す例では、古いアノテーション情報が２つである場合を示しているが、本発明はこれに限られるものでない。その場合、Ｓ８０８～Ｓ８１０の処理をアノテーション情報の数に応じて変更すればよい。

　更に、メモリ２５にはファイル形式で記憶せずに、各データを個別に記憶しておき、Ｓ８１７での記録時に図９Ｃ～図９Ｆのような画像ファイルとなるようにしてもよい。

　また、画像ファイルの編集処理を行い、その後に推論処理を行うよう説明してきたが、複数の画像ファイルについてまとめて編集処理を行い、その後複数画像ファイルについてまとめて推論処理を行うように処理順序を変更しても良い。

　上記のように、編集内容に応じて必要なアノテーション情報を残しつつ、不要なアノテーション情報を削除することで、データ量を削減しながら、アノテーション情報を管理することができる。

＜他の実施形態＞
　なお、本発明は、複数の機器（例えばホストコンピュータ、インターフェイス機器、スキャナ、ビデオカメラなど）から構成されるシステムに適用しても、一つの機器からなる装置（例えば、複写機、ファクシミリ装置など）に適用してもよい。

　また、本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

　本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。

　本願は、２０２１年１月２２日提出の日本国特許出願特願２０２１－００８９３８を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

Claims

　画像から、被写体を検出する検出手段と、
　前記検出された被写体に対して、推論モデルを用いて推論処理を行う推論手段と、
　前記画像の画像データと、前記被写体の情報と、前記推論処理の推論結果と、前記推論モデルの情報とをまとめて、画像ファイルを生成する生成手段と、を有し、
　前記生成手段は、前記推論モデルを前記画像ファイルの非公開の領域に記録することを特徴とする画像処理装置。
　前記推論結果を訂正するための操作手段と、
　前記推論モデルを更新する学習手段と
　を更に有し、
　前記操作手段により前記推論結果が訂正された場合に、前記生成手段は、前記画像ファイルの推論結果を訂正された内容に変更し、前記学習手段は、前記訂正された推論結果を用いて、前記推論モデルを更新することを特徴とする請求項１に記載の画像処理装置。
　前記推論結果を、対応する被写体に関連付けて表示手段に表示させる制御手段を更に有し、
　前記操作手段は、前記表示された推論結果を訂正することを特徴とする請求項２に記載の画像処理装置。
　前記推論手段は、更に、画像ファイルに保持された画像に対して前記推論処理を行うことが可能であって、前記画像ファイルに前記推論モデルの情報が保持されている場合に、前記画像ファイルの推論モデルと、前記推論手段の推論モデルとの新旧を判定し、前記推論手段の推論モデルの方が新しい場合に、前記推論処理を行うことを特徴とする請求項１乃至３のいずれか１項に記載の画像処理装置。
　前記画像ファイルの推論結果の出力形式と、前記推論手段による推論結果の出力形式が異なる場合に、前記推論手段による推論結果を前記画像ファイルに追記することを特徴とする請求項４に記載の画像処理装置。
　前記推論モデルは、外部から更新可能であって、
　前記画像ファイルの推論結果の出力形式と、前記推論手段による推論結果の出力形式が同じであって、かつ、前記推論モデルが外部から更新されている場合に、前記推論手段による推論結果を前記画像ファイルに追記することを特徴とする請求項４または５に記載の画像処理装置。
　前記画像ファイルの推論結果の出力形式と、前記推論手段による推論結果の出力形式が同じであって、かつ、前記推論モデルが外部から更新されていない場合に、前記画像ファイルに記録された推論結果を、前記推論手段による推論結果により更新することを特徴とする請求項６に記載の画像処理装置。
　前記画像ファイルを送信する通信手段と、
　前記画像ファイルの送信先の推論手段に関する情報を取得する取得手段と、
　前記送信先の推論手段に応じて、前記画像ファイルに含まれる前記推論結果の内、少なくとも一部の推論結果を削除する削除手段と、を更に有し、
　前記通信手段は、前記削除手段により少なくとも一部の推論結果を削除した前記画像ファイルを送信することを特徴とする請求項１乃至７のいずれか１項に記載の画像処理装置。
　前記削除手段は、前記推論手段と、前記送信先の推論手段が一致しない推論結果を削除することを特徴とする請求項８に記載の画像処理装置。
　前記生成手段は、更に、前記推論結果へのリンク情報を更に前記画像ファイルに記録し、
　前記通信手段の信頼性が予め決められた信頼性よりも低い場合に、前記削除手段は、前記リンク情報を削除することを特徴とする請求項８または９に記載の画像処理装置。
　前記削除手段は、無線通信により前記画像ファイルを送信する場合に、前記リンク情報を削除することを特徴とする請求項１０に記載の画像処理装置。
　前記画像ファイルに保持された画像に対して、編集処理を行う画像処理手段を更に有し、
　前記推論手段は、前記編集処理された画像に対して前記推論処理を行い、
　前記生成手段は、前記編集処理の内容に応じて、前記編集処理された画像の推論結果および前記画像ファイルに含まれる推論結果の内、少なくとも一部の推論結果を、編集処理後の画像ファイルに保持しないことを特徴とする請求項１乃至１１のいずれか１項に記載の画像処理装置。
　前記編集処理された画像の推論結果を編集処理後の画像ファイルとして保持しない編集処理の内容の場合、前記推論手段は、前記編集処理された画像に対して前記推論処理を行わないことを特徴とする請求項１２に記載の画像処理装置。
　前記生成手段は、前記編集処理がリサイズ処理の場合に、前記編集処理された画像の推論結果を、前記編集処理後の画像ファイルに保持しないことを特徴とする請求項１２または１３に記載の画像処理装置。
　前記生成手段は、前記編集処理がトリミング処理の場合に、トリミング処理により削除される画像の領域にある被写体の推論結果を、前記編集処理後の画像ファイルに保持しないことを特徴とする請求項１２乃至１４のいずれか１項に記載の画像処理装置。
　前記生成手段は、前記編集処理が動画切り出し処理の場合に、前記編集処理された画像の推論結果および前記画像ファイルに含まれる推論結果を、前記編集処理後の画像ファイルに保持することを特徴とする請求項１２乃至１５のいずれか１項に記載の画像処理装置。
　前記生成手段は、前記編集処理がＲＡＷ現像処理であって、現像の結果、画像の色味が変化しない場合に、前記編集処理された画像の推論結果および前記画像ファイルに含まれる推論結果を前記編集処理後の画像ファイルに保持し、色味が変化する場合に、画像ファイルに含まれる画像の推論結果を前記編集処理後の画像ファイルに保持しないことを特徴とする請求項１２乃至１６のいずれか１項に記載の画像処理装置。
　前記画像を撮像する撮像手段と、
　請求項１乃至１７のいずれか１項に記載の画像処理装置と
　を有することを特徴とする撮像装置。
　検出手段が、画像から、被写体を検出する検出工程と、
　推論手段が、前記検出された被写体に対して、推論モデルを用いて推論処理を行う推論工程と、
　生成手段が、前記画像の画像データと、前記被写体の情報と、前記推論処理の推論結果と、前記推論モデルの情報とをまとめて、画像ファイルを生成する生成工程と、を有し、
　前記生成工程では、前記推論モデルを前記画像ファイルの非公開の領域に記録することを特徴とする画像処理方法。
　コンピュータを、請求項１乃至１７のいずれか１項に記載の画像処理装置の各手段として機能させるためのプログラム。
　請求項２０に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。