JP7111309B2

JP7111309B2 - 情報処理装置、学習装置、認識装置、静止画の生産方法、およびプログラム

Info

Publication number: JP7111309B2
Application number: JP2019097718A
Authority: JP
Inventors: 平佳小松; 啓介豊田; 充弘金田; 尚史柳原
Original assignee: 株式会社Ridge-i; 株式会社gluon
Priority date: 2019-05-24
Filing date: 2019-05-24
Publication date: 2022-08-02
Anticipated expiration: 2039-05-24
Also published as: JP2020194210A

Description

本発明は、オブジェクトを認識するための画像を取得する情報処理装置等に関するものである。

従来技術において、機械学習装置によりパラメータが更新されたニューラルネットワークを用いて、認識対象画像と類似している登録画像を検索することができる画像認識装置があった（特許文献１参照）。

かかる装置は、学習対象の画像である登録画像が与えられると、前記登録画像の特徴量を出力し、認識対象の学習画像である認識対象画像が与えられると、前記認識対象画像の特徴量を出力するニューラルネットワークを有する特徴量検出部と、前記ニューラルネットワークから出力された登録画像の特徴量を記憶する特徴量記憶部と、前記特徴量記憶部により記憶されている１つ以上の登録画像の特徴量と、前記ニューラルネットワークから出力された認識対象画像の特徴量とを比較して、前記１つ以上の登録画像の中から、前記認識対象画像と類似している登録画像を検索する画像検索部とを備え、前記特徴量検出部が有しているニューラルネットワークのパラメータが機械学習装置によって更新され、前記機械学習装置は、学習対象の画像である学習画像を二値画像に変換する二値画像変換部と、外乱の影響を受けている学習画像を入力して、前記外乱の影響を受けている学習画像の特徴量を出力する第１のニューラルネットワークを有する特徴量抽出部と、前記第１のニューラルネットワークから出力された特徴量を入力して、前記外乱の影響を受けている学習画像を二値画像として再構築した画像である再構築画像を出力する第２のニューラルネットワークを有する画像再構築部と、前記第２のニューラルネットワークから出力された再構築画像と、前記二値画像変換部により変換された二値画像との差分に従って前記第１のニューラルネットワークのパラメータ及び前記第２のニューラルネットワークのパラメータのそれぞれを更新するパラメータ更新部とを備えており、前記特徴量検出部が有しているニューラルネットワークは、前記パラメータ更新部によりパラメータが更新された前記第１及び第２のニューラルネットワークであることを特徴とする画像認識装置である。

特許第６３２０６４９号公報

しかしながら、従来技術においては、オブジェクトと背景とを含む多数の画像を自動的に取得できなかった。また、従来技術においては、自動的に取得した画像を学習することにより、オブジェクトを認識できなかった。

本第一の発明の情報処理装置は、オブジェクトの三次元データが格納される三次元データ格納部と、背景の静止画である１以上の背景画が格納される背景画格納部と、三次元データを用いてオブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得部と、１以上の各オブジェクト静止画と１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成部と、１以上のオブジェクト含静止画を蓄積する静止画蓄積部とを具備する情報処理装置である。

かかる構成により、オブジェクトと背景とを含む多数の画像を自動的に取得できる。

また、本第二の発明の情報処理装置は、第一の発明に対して、静止画蓄積部は、オブジェクト含静止画を、オブジェクト含静止画を作成する元になったオブジェクト静止画に対応付けて蓄積する情報処理装置である。

かかる構成により、オブジェクトと背景とを含む多数の画像を、オブジェクトの画像に対応付けて、自動的に取得できる。

また、本第三の発明の情報処理装置は、第二の発明に対して、オブジェクト含静止画は、オブジェクト含静止画から背景を除いた静止画である情報処理装置である。

また、本第四の発明の情報処理装置は、第一から第三いずれか１つの発明に対して、オブジェクト静止画取得部は、三次元データを２以上の異なる各視点から見た場合の２以上のオブジェクト静止画を取得する情報処理装置である。

また、本第五の発明の情報処理装置は、第一から第四いずれか１つの発明に対して、オブジェクト静止画取得部は、三次元データを用いてオブジェクトの静止画であるオブジェクト静止画を取得する取得手段と、取得手段が取得したオブジェクト静止画の１以上の属性値を変更して、１以上のオブジェクト静止画を生成する変更手段とを具備する情報処理装置である。

また、本第六の発明の情報処理装置は、第一から第五いずれか１つの発明に対して、背景画格納部には、同一のオブジェクトを含み、外部環境が異なる２以上の背景画が格納される情報処理装置である。

かかる構成により、外部環境が異なる２以上の背景を用いて、オブジェクトと背景とを含む多数の画像を自動的に取得できる。

また、本第七の発明の情報処理装置は、第六の発明に対して、外部環境は、天気、時刻、季節、太陽（光源）の色、カメラレンズに雨滴が付着しているか否かに関する情報、カメラレンズの解像度に関する情報、カメラレンズのピントが合っているか否かに関する情報、カメラレンズの画角に関する情報、カメラの焦点距離に関する情報のうちの１以上の情報である情報処理装置である。

かかる構成により、天気等の外部環境が異なる２以上の背景を用いて、オブジェクトと背景とを含む多数の画像を自動的に取得できる。

また、本第八の発明の学習装置は、第一から第七いずれか１つの発明に対して、情報処理装置が蓄積した２以上のオブジェクト含静止画が格納されるオブジェクト含静止画格納部と、２以上のオブジェクト含静止画を機械学習のアルゴリズムにより学習し、オブジェクトを識別するための学習器を取得する学習部と、学習器を蓄積する学習器蓄積部とを具備する学習装置である。

かかる構成により、オブジェクトを認識するための学習器を生成できる。

また、本第九の発明の認識装置は、第八の発明に対して、学習装置が蓄積した学習器が格納される学習器格納部と、静止画を受け付ける静止画受付部と、静止画を学習器に適用し、機械学習のアルゴリズムにより、オブジェクトを識別するオブジェクト識別子を取得する認識部と、認識部が取得したオブジェクト識別子を出力する出力部とを具備する認識装置である。

かかる構成により、静止画の中のオブジェクトを認識できる。

本発明による情報処理装置によれば、オブジェクトと背景とを含む多数の画像を自動的に取得できる。ことができる。

実施の形態１における情報処理装置Ａのブロック図同情報処理装置Ａの動作例について説明するフローチャート同オブジェクト含静止画取得処理の例について説明するフローチャート実施の形態２における情報処理装置Ｂのブロック図実施の形態３における学習装置Ｃのブロック図実施の形態４における認識装置Ｄのブロック図実施の形態５における三次元データから生成された静止画の例を示す図同生成されたオブジェクト含静止画の例を示す図同オブジェクト認識対象の静止画の例を示す図上記実施の形態におけるコンピュータシステムの概観図同コンピュータシステムのブロック図

以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

（実施の形態１）
本実施の形態において、オブジェクトの三次元データを用いて取得した１以上のオブジェクト静止画と１以上の各背景画とを組み合わせて、２以上のオブジェクト含静止画を生成する生成機能を有する情報処理装置について説明する。

また、本実施の形態において、生成した２以上のオブジェクト含静止画を学習し、学習器を生成する学習機能を有する情報処理装置について説明する。

また、本実施の形態において、学習器を用いて、画像の中のオブジェクトを認識する認識機能を有する情報処理装置について説明する。

図１は、本実施の形態における情報処理装置Ａのブロック図である。情報処理装置Ａは、格納部１Ａ、受付部２Ａ、処理部３Ａ、および出力部４Ａを備える。

格納部１Ａは、三次元データ格納部１１、背景画格納部１２、オブジェクト含静止画格納部１３、および学習器格納部１４を備える。受付部２Ａは、指示受付部２１、および静止画受付部２２を備える。処理部３Ａは、オブジェクト静止画取得部３１、画像合成部３２、学習部３３、および認識部３４を備える。オブジェクト静止画取得部３１は、取得手段３１１、および変更手段３１２を備える。出力部４Ａは、静止画蓄積部４１、学習器蓄積部４２、および認識結果出力部４３を備える。

格納部１Ａには、各種の情報が格納される。各種の情報とは、例えば、後述する三次元データ、後述する背景画、後述するオブジェクト含静止画、後述するオブジェクト含静止画、後述する学習器、後述する視点候補情報、後述する属性値集合である。

三次元データ格納部１１には、１または２以上のオブジェクトの三次元データが格納される。三次元データは、例えば、三次元のＣＧデータ、三次元のボクセルデータである。ただし、三次元データのデータ構造は問わない。

オブジェクトは、対象である。オブジェクトは、通常、有体物である。オブジェクトは、例えば、認識の対象である。オブジェクトは、例えば、自動車、電車、カバン、山、ビル、橋、家等である。ただし、オブジェクトは問わないことは言うまでもない。

背景画格納部１２には、１以上の背景画が格納される。背景画は、背景の静止画である。背景画は、オブジェクトの背景となり得る画像である。

背景画格納部１２には、外部環境が異なる２以上の背景画が格納されることは好適である。

背景画格納部１２には、同一のオブジェクトを含み、外部環境が異なる２以上の背景画が格納されることは好適である。なお、背景画は、オブジェクトを含んでなくても良い。また、外部環境は、外部の環境である。外部環境は、例えば、自然環境、またはカメラに関する情報である。自然環境は、例えば、天気、時刻、季節、太陽（光源）の色等である。カメラに関する情報は、例えば、カメラレンズに雨滴が付着しているか否かに関する情報、カメラレンズの解像度に関する情報、カメラレンズのピントが合っているか否かに関する情報、カメラレンズの画角に関する情報、カメラの焦点距離に関する情報等である。カメラレンズに雨滴が付着しているか否かに関する情報は、例えば、「カメラレンズに雨滴が付着している」または「カメラレンズに雨滴が付着していない」、または「カメラレンズに付着している雨滴の量を特定する情報（例えば、１から５の５段階のレベルのうちのいずれかの数値、「多い」「普通」または「少ない」等）である。カメラレンズの解像度に関する情報は、カメラレンズの解像度そのもの、カメラレンズの解像度のランクを示す情報（例えば、１から５の５段階のレベルのうちのいずれかの数値、「高解像度」または「低解像度」等）である。カメラレンズのピントが合っているか否かに関する情報は、例えば、「カメラレンズのピントが合っている」または「カメラレンズのピントが合っていない」、または「カメラレンズのピントが合っている度合を特定する情報（例えば、１から５の５段階のレベルのうちのいずれかの数値、「合っている」「普通」または「合っていない」等）である。カメラレンズの画角に関する情報は、例えば、画角そのもの、画角のランクを示す情報（例えば、１から５の５段階のレベルのうちのいずれかの数値、「広角」または「狭角」等）である。カメラの焦点距離に関する情報は、例えば、焦点距離そのもの、焦点距離のランクを示す情報（例えば、１から５の５段階のレベルのうちのいずれかの数値、「遠い」または「近い」等）である。

外部環境が異なる２以上の背景画における外部環境は、例えば、天気、時刻、季節、太陽（光源）の色、カメラレンズに雨滴が付着しているか否かに関する情報、カメラレンズの解像度に関する情報、カメラレンズのピントが合っているか否かに関する情報、カメラレンズの画角に関する情報、カメラの焦点距離に関する情報のうちの１以上の情報である。

オブジェクト含静止画格納部１３には、２以上のオブジェクト含静止画が格納される。オブジェクト含静止画とは、オブジェクトを含む静止画である。オブジェクト含静止画は、通常、オブジェクトと背景とを含む。オブジェクト含静止画は、例えば、情報処理装置Ａが蓄積した画像である。

オブジェクト含静止画格納部１３には、情報処理装置Ａが蓄積した２以上のオブジェクト含静止画が格納されることは好適である。

学習器格納部１４には、学習器が格納される。学習器は、機械学習のアルゴリズムによりオブジェクトを認識する際に使用される情報である。学習器は、例えば、学習部３３が、機械学習のアルゴリズムにより取得した情報である。機械学習のアルゴリズムは、例えば、ＳＶＭ、深層学習、決定木、ランダムフォレスト等であるが、他の機械学習のアルゴリズムでも良い。学習器のデータ構造は問わない。なお、学習器は、分類器等と言っても良い。学習部３３の詳細については、後述する。

受付部２Ａは、指示や情報を受け付ける。指示や情報とは、例えば、後述する静止画取得指示、後述する学習指示、後述する認識開始指示、認識対象のオブジェクトを含む静止画、認識対象のオブジェクトを含む複数の静止画を有する動画等である。

ここで、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。

指示や情報等の入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。受付部２Ａは、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

指示受付部２１は、指示を受け付ける。指示は、例えば、静止画取得指示、学習指示、認識開始指示である。

静止画取得指示とは、三次元データを用いて、１または２以上のオブジェクト含静止画を取得する指示である。静止画取得指示は、通常、三次元データを特定する三次元データ特定情報を含む。三次元データ特定情報は、三次元データのファイルのファイル識別子（例えば、ファイル名、ファイルＩＤなど）、三次元データが格納されている装置の装置識別子と格納場所を識別する格納場所識別子（例えば、装置のＩＰアドレスとフォルダ名等）、三次元データが格納されている場所を特定するＵＲＬ等である。ただし、三次元データ特定情報は、三次元データを特定できれば良く、そのデータ構造等は問わない。

学習指示とは、学習の開始時の指示である。学習指示は、通常、１または２以上のオブジェクト含静止画を特定する情報を含む。学習指示は、通常、１以上のオブジェクト含静止画に対応付いたオブジェクト識別子を特定する情報を含むことは好適である。学習指示は、通常、１以上のオブジェクト含静止画の格納場所を特定する情報（例えば、フォルダ名、ＵＲＬ等）を含む。ただし、オブジェクト含静止画を特定する情報は、オブジェクト含静止画を特定できれば良く、そのデータ構造等は問わない。

認識開始指示とは、認識処理の開始の指示である。認識開始指示は、通常、認識対象の静止画を特定する静止画特定情報を含む。認識開始指示は、例えば、学習器を特定する学習器特定情報を含む。静止画特定情報は、例えば、ファイル名、ＵＲＬ等である。学習器特定情報は、例えば、ファイル名、フォルダ名等である。ただし、静止画特定情報、学習器特定情報は、各々の情報を特定できれば良く、そのデータ構造等は問わない。

静止画受付部２２は、静止画を受け付ける。この静止画は、認識対象の静止画である。静止画受付部２２における静止画の受け付けとは、指示受付部２１が受け付けた認識開始指示に含まれる静止画特定情報を用いて、静止画を取得する処理でも良い。

処理部３Ａは、各種の処理を行う。各種の処理とは、例えば、オブジェクト静止画取得部３１、画像合成部３２、学習部３３、認識部３４が行う処理である。

オブジェクト静止画取得部３１は、三次元データを用いて１または２以上のオブジェクト静止画を取得する。オブジェクト静止画取得部３１は、オブジェクトの三次元データを用いて１または２以上のオブジェクト静止画を取得する。オブジェクト静止画とは、オブジェクトの静止画である。オブジェクト静止画は、オブジェクトを含む静止画であると言っても良い。

オブジェクトの三次元データを用いてオブジェクト静止画を取得する技術は、公知技術であるので、詳細な説明を省略する。なお、例えば、レンダリングの技術により、オブジェクトの三次元データを用いてオブジェクト静止画を取得できる。かかる技術は、Unity（インターネットＵＲＬ：https://unity.com/ja 参照）、Unreal Engine 4（インターネットＵＲＬ：https://www.unrealengine.com/ja/ 参照）等のソフトウェアにより実現可能である。

オブジェクト静止画取得部３１は、三次元データを２以上の異なる各視点から見た場合の２以上のオブジェクト静止画を取得することは好適である。

オブジェクト静止画取得部３１は、例えば、格納部１Ａに格納されている１または２以上の各視点候補情報が示す視点から三次元データを見た場合の静止画を視点候補情報ごとに取得する。

オブジェクト静止画取得部３１は、例えば、取得手段３１１と変更手段３１２との処理により、１または２以上のオブジェクト静止画を取得する。

オブジェクト静止画取得部３１を構成する取得手段３１１は、三次元データを用いてオブジェクトの静止画であるオブジェクト静止画を取得する。

取得手段３１１は、例えば、格納部１Ａに格納されている１または２以上の各視点候補情報が示す視点から三次元データを見た場合の静止画を視点候補情報ごとに取得する。

変更手段３１２は、取得手段３１１が取得した１以上の各オブジェクト静止画の１以上の属性値を変更して、１以上のオブジェクト静止画を生成する。１以上の属性値とは、例えば、色、サイズ、線種、線の色等である。また、変更手段３１２は、格納部１Ａの１または２以上の各属性値集合が示す属性値となるように、オブジェクト静止画の属性値を変更し、新たなオブジェクト静止画を取得する。なお、属性値集合は、例えば、「色：赤，サイズ：（ｗ１，ｈ１）」「色：青，サイズ：（ｗ１，ｈ１）」「色：赤，サイズ：（ｗ２，ｈ２）」等である。また、（ｗ１，ｈ１）（ｗ２，ｈ２）は、幅と高さの情報である。

画像合成部３２は、１以上の各オブジェクト静止画と１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する。

画像合成部３２は、例えば、オブジェクト含静止画を生成する際に使用するオブジェクト静止画と背景画とを取得し、当該オブジェクト静止画が有するオブジェクトの重心の位置が、背景画の中の中心の位置になるように、オブジェクトの画像を背景画の中に配置して、オブジェクト静止画と背景画とを合成して、オブジェクト含静止画を取得する。

画像合成部３２は、例えば、オブジェクト含静止画を生成する際に使用するオブジェクト静止画と背景画とを取得し、当該オブジェクト静止画が有するオブジェクトの画像を切り出し、当該オブジェクトの画像の重心の位置が、背景画の中の中心の位置になるように、オブジェクトの画像を背景画の中に配置して、オブジェクト静止画と背景画とを合成して、オブジェクト含静止画を取得する。

画像合成部３２は、例えば、オブジェクト含静止画を生成する際に使用するオブジェクト静止画と背景画とを取得し、当該オブジェクト静止画が有するオブジェクトのサイズが背景画全体のサイズと比較して一定割合のサイズになるように、オブジェクトを拡大または縮小し、当該拡大または縮小したオブジェクトの画像の重心の位置が、背景画の中の中心の位置になるように、拡大または縮小したオブジェクトの画像を背景画の中に配置して、拡大または縮小したオブジェクト静止画と背景画とを合成して、オブジェクト含静止画を取得する。

その他、画像合成部３２がオブジェクト静止画と背景画とを合成し、オブジェクト含静止画を取得するアルゴリズムは問わない。

学習部３３は、１または２以上のオブジェクト含静止画を機械学習のアルゴリズムにより学習し、オブジェクトを識別するための学習器を取得する。

学習部３３は、一のオブジェクト識別子に対応付いた１または２以上のオブジェクト含静止画を機械学習のアルゴリズムにより学習し、オブジェクトを識別するための学習器を取得することは好適である。オブジェクトを識別するための学習器は、例えば、オブジェクト識別子を出力するための学習器である。

また、学習部３３は、一のオブジェクト識別子に対応付いた１または２以上のオブジェクト含静止画を正例とし、他のオブジェクト識別子に対応付いた１または２以上のオブジェクト含静止画を負例として、機械学習のアルゴリズムにより学習し、一のオブジェクト識別子で識別されるオブジェクトを認識するための学習器を取得することは好適である。

学習部３３は、２以上の各オブジェクト識別子ごとに、学習器を取得することは好適である。ただし、学習部３３は、複数のオブジェクト識別子のうちのいずれのオブジェクト識別子に対応する静止画であるか否かを判断するための一の学習器を取得しても良い。

学習部３３は、例えば、一のオブジェクト識別子に対応付け得る１または２以上のオブジェクト含静止画の正例と、オブジェクト識別子とを有する学習元情報を引数として、機械学習の関数に与え、当該関数を実行し、学習器を取得する。なお、機械学習の関数は、例えば、tiny_svm、TensorFlowの関数、各種のrandomForest関数等であり、問わないことは言うまでもない。また、ここでの機械学習の関数は、機械学習の学習機能を実現するモジュールでも良いことは言うまでもない。

学習部３３は、例えば、一のオブジェクト識別子に対応付け得る１または２以上のオブジェクト含静止画である正例と、他のオブジェクト識別子に対応付け得る１または２以上のオブジェクト含静止画である負例と、オブジェクト識別子とを有する学習元情報を引数として、機械学習の関数に与え、当該関数を実行し、学習器を取得する。

学習部３３は、例えば、オブジェクト識別子に対応付いた１または２以上のオブジェクト含静止画を有する学習元情報を引数として、機械学習の関数に与え、当該関数を実行し、学習器を取得する。

認識部３４は、静止画を学習器に適用し、機械学習のアルゴリズムにより、オブジェクトを識別するオブジェクト識別子を取得する。認識部３４は、通常、受付部２Ａが受け付けた静止画を学習器に適用し、機械学習のアルゴリズムにより、オブジェクトを識別するオブジェクト識別子を取得する。静止画を学習器に適用することは、機械学習の関数またはモジュール等に、静止画と学習器とを与え、当該関数またはモジュール等を実行することである。

認識部３４は、例えば、受付部２Ａが受け付けた静止画と、分類に使用する学習器を引数として、機械学習の関数に与え、当該関数を実行し、オブジェクト識別子を取得する。なお、上述したように、関数はモジュール等でも良いことは言うまでもない。

出力部４Ａは、認識部３４が取得したオブジェクト識別子を出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。

静止画蓄積部４１は、画像合成部３２が取得した１以上のオブジェクト含静止画を蓄積する。静止画蓄積部４１は、画像合成部３２が取得した１以上の各オブジェクト含静止画を、各オブジェクト含静止画を作成する元になったオブジェクト静止画に対応付けて蓄積することは好適である。また、静止画蓄積部４１は、画像合成部３２が取得した１以上の各オブジェクト含静止画を、オブジェクト識別子に対応付けて蓄積することは好適である。

なお、オブジェクト含静止画の蓄積先は、例えば、オブジェクト含静止画格納部１３であるが、情報処理装置Ａ以外の他の装置や他のサーバ等でも良い。

学習器蓄積部４２は、学習部３３が取得した学習器を蓄積する。学習器の蓄積先は、例えば、学習器格納部１４であるが、情報処理装置Ａ以外の他の装置や他のサーバ等でも良い。

認識結果出力部４３は、認識部３４が取得したオブジェクト識別子を出力する。オブジェクト識別子の出力態様は問わない。

格納部１Ａ、三次元データ格納部１１、背景画格納部１２、オブジェクト含静止画格納部１３、学習器格納部１４、後述する格納部１Ｂ、後述する格納部１Ｃ、および後述する格納部１Ｄは、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

格納部１Ａ等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部１Ａ等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部１Ａ等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部１Ａ等で記憶されるようになってもよい。

処理部３Ａ、オブジェクト静止画取得部３１、画像合成部３２、学習部３３、認識部３４、取得手段３１１、変更手段３１２、静止画蓄積部４１、学習器蓄積部４２、後述する処理部３Ｂ、後述する処理部３Ｃ、後述する処理部３Ｄ、後述する出力部４Ｂ、および後述する出力部４Ｃは、通常、ＭＰＵやメモリ等から実現され得る。処理部３Ａ等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。

出力部４Ａ、認識結果出力部４３、および後述する出力部４Ｄは、例えば、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部４Ａ等は、例えば、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

次に、情報処理装置Ａの動作例について、図２のフローチャートを用いて説明する。

（ステップＳ２０１）指示受付部２１は、静止画取得指示を受け付けたか否かを判断する。静止画取得指示を受け付けた場合はステップＳ２０２に行き、静止画取得指示を受け付けなかった場合はステップＳ２０３に行く。

（ステップＳ２０２）処理部３Ａは、三次元データを用いて、１または２以上のオブジェクト含静止画を取得する。ステップＳ２０１に戻る。かかるオブジェクト含静止画取得処理の例について、図３のフローチャートを用いて説明する。

（ステップＳ２０３）指示受付部２１は、学習指示を受け付けたか否かを判断する。学習指示を受け付けた場合はステップＳ２０４に行き、学習指示を受け付けなかった場合はステップＳ２０７に行く。

（ステップＳ２０４）学習部３３は、ステップＳ２０３で受け付けられた学習指示が有する１以上のオブジェクト含静止画を特定する情報を取得する。次に、学習部３３は、かかる特定する情報を用いて、１以上のオブジェクト含静止画を含む学習元情報を取得する。なお、学習元情報は、例えば、オブジェクト識別子を含む。また、オブジェクト識別子は、通常、１以上のオブジェクト含静止画に対応付いて管理されている。

（ステップＳ２０５）学習部３３は、ステップＳ２０４で取得した学習元情報に対して学習処理を実行し、学習器を取得する。

（ステップＳ２０６）学習器蓄積部４２は、ステップＳ２０５で取得された学習器を蓄積する。

（ステップＳ２０７）指示受付部２１は、認識開始指示を受け付けたか否かを判断する。認識開始指示を受け付けた場合はステップＳ２０８に行き、認識開始指示を受け付けなかった場合はステップＳ２０１に戻る。

（ステップＳ２０８）認識部３４は、認識開始指示が有する静止画特定情報を取得する。次に、認識部３４は、当該静止画特定情報により特定される静止画を取得する。

（ステップＳ２０９）認識部３４は、認識開始指示が有する学習器特定情報を取得する。次に、認識部３４は、当該学習器特定情報により特定される学習器を取得する。

（ステップＳ２１０）認識部３４は、ステップＳ２０８で取得した静止画を、ステップＳ２０９で取得した学習器に適用し、機械学習のアルゴリズムにより、分類処理を行い、オブジェクト識別子を取得する。

（ステップＳ２１１）認識結果出力部４３は、ステップＳ２１０で取得したブジェクト識別子を出力する。ステップＳ２０１に戻る。

なお、図２のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

次に、ステップＳ２０２のオブジェクト含静止画取得処理の例について、図３のフローチャートを用いて説明する。

（ステップＳ３０１）オブジェクト静止画取得部３１は、ステップＳ２０１で受け付けられた静止画取得指示が有する三次元データ特定情報を取得する。次に、オブジェクト静止画取得部３１は、当該三次元データ特定情報により特定される三次元データを取得する。オブジェクト静止画取得部３１は、例えば、三次元データ格納部１１から三次元データを取得する。

（ステップＳ３０２）オブジェクト静止画取得部３１は、ステップＳ３０１で取得した三次元データと対になるオブジェクト識別子を取得する。なお、オブジェクト識別子は、三次元データと対に格納されている、とする。

（ステップＳ３０３）オブジェクト静止画取得部３１は、カウンタｉに１を代入する。

（ステップＳ３０４）オブジェクト静止画取得部３１は、オブジェクト静止画を取得するための、ｉ番目の視点が存在するか否かを判断する。ｉ番目の視点が存在する場合はステップＳ３０５に行き、ｉ番目の視点が存在しない場合はステップＳ３１３に行く。なお、オブジェクト静止画取得部３１は、例えば、ｉ番目の視点候補情報（例えば、三次元空間上での座標値（ｘ，ｙ，ｚ）、または三次元データに対する相対的な位置を示す情報等）が格納部１Ａに格納されているか否かにより、ｉ番目の視点が存在するか否かを判断する。

（ステップＳ３０５）オブジェクト静止画取得部３１は、三次元データを、ｉ番目の視点から見た場合の静止画であるオブジェクト静止画を取得する。なお、オブジェクト静止画取得部３１は、例えば、ｉ番目の視点候補情報（例えば、三次元空間上での座標値）を用いて、三次元データからオブジェクト静止画を取得する。

（ステップＳ３０６）オブジェクト静止画取得部３１は、ステップＳ３０２で取得したオブジェクト識別子に対応付けて、ステップＳ３０５で取得したオブジェクト静止画を蓄積する。

（ステップＳ３０７）オブジェクト静止画取得部３１は、カウンタｊに１を代入する。

（ステップＳ３０８）オブジェクト静止画を変更するための、ｊ番目の属性値の集合である属性値集合が存在するか否かを判断する。ｊ番目の属性値集合が存在する場合はステップＳ３０９に行き、存在しない場合はステップＳ３１２に行く。なお、例えば、オブジェクト静止画を変更するための属性値の集合に関する情報が格納部１Ａに格納されており、オブジェクト静止画取得部３１は、かかる格納部１Ａの情報に基づいて、ｊ番目の属性値の集合が存在するか否かを判断する。

（ステップＳ３０９）オブジェクト静止画取得部３１は、ｊ番目の属性値集合の情報を取得する。そして、オブジェクト静止画取得部３１は、ｊ番目の属性値集合の情報を用いて、ｊ番目の属性値集合により特定される属性値となるように、オブジェクト静止画の属性値を変更し、属性値が変更されたオブジェクト静止画を取得する。

（ステップＳ３１０）オブジェクト静止画取得部３１は、ステップＳ３０２で取得したオブジェクト識別子に対応付けて、ステップＳ３０９で取得したオブジェクト静止画を蓄積する。

（ステップＳ３１１）オブジェクト静止画取得部３１は、カウンタｊを１、インクリメントする。ステップＳ３０８に戻る。

（ステップＳ３１２）オブジェクト静止画取得部３１は、カウンタｉを１、インクリメントする。ステップＳ３０４に戻る。

（ステップＳ３１３）画像合成部３２は、カウンタｉに１を代入する。

（ステップＳ３１４）画像合成部３２は、ステップＳ３０６またはステップＳ３１０で
蓄積されたオブジェクト静止画の中で、ｉ番目のオブジェクト静止画が存在するか否かを判断する。ｉ番目のオブジェクト静止画が存在する場合はステップＳ３１５に行き、存在しない場合は上位処理にリターンする。

（ステップＳ３１５）画像合成部３２は、ｉ番目のオブジェクト静止画を取得する。

（ステップＳ３１６）画像合成部３２は、カウンタｊに１を代入する。

（ステップＳ３１７）画像合成部３２は、背景画格納部１２にｊ番目の背景画が存在するか否かを判断する。ｊ番目の背景画が存在する場合はステップＳ３１８に行き、存在しない場合はステップＳ３２４に行く。

（ステップＳ３１８）画像合成部３２は、ｊ番目の背景画を背景画格納部１２から取得する。

（ステップＳ３１９）画像合成部３２は、ｉ番目のオブジェクト静止画が変更条件に合致するか否かを判断する。変更条件に合致する場合はステップＳ３２０に行き、変更条件に合致しない場合はステップＳ３２１に行く。なお、変更条件は、例えば、オブジェクト静止画のオブジェクトのサイズに関する条件である。また、変更条件は、例えば、オブジェクト静止画のオブジェクトのサイズの範囲を特定する条件である。

（ステップＳ３２０）画像合成部３２は、ｉ番目のオブジェクト静止画を変更する。例えば、画像合成部３２は、ｉ番目のオブジェクト静止画の中のオブジェクトのサイズを、予め決められたサイズにする。

（ステップＳ３２１）画像合成部３２は、ｉ番目のオブジェクト静止画とｊ番目の背景画とを合成し、オブジェクト含静止画を取得する。

（ステップＳ３２２）画像合成部３２は、ステップＳ３０２で取得したオブジェクト識別子に対応付けて、ステップＳ３２１で取得したオブジェクト含静止画を蓄積する。

（ステップＳ３２３）画像合成部３２は、カウンタｊを１、インクリメントする。ステップＳ３１７に戻る。

（ステップＳ３２４）画像合成部３２は、カウンタｉを１、インクリメントする。ステップＳ３１４に戻る。

以上、本実施の形態によれば、オブジェクトと背景とを含む多数の画像を自動的に取得できる。

また、本実施の形態によれば、オブジェクトを認識するための学習器を生成できる。

さらに、本実施の形態によれば、静止画の中のオブジェクトを認識できる。

なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置Ａの生成機能を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、オブジェクトの三次元データが格納される三次元データ格納部と、背景の静止画である１以上の背景画が格納される背景画格納部とにアクセス可能なコンピュータを、前記三次元データを用いて前記オブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得部と、前記１以上の各オブジェクト静止画と前記１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成部と、前記１以上のオブジェクト含静止画を蓄積する静止画蓄積部として機能させるためのプログラムである。

また、本実施の形態における情報処理装置Ａの学習機能を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、生成機能により蓄積された２以上のオブジェクト含静止画が格納されるオブジェクト含静止画格納部にアクセス可能なコンピュータを、前記２以上のオブジェクト含静止画を機械学習のアルゴリズムにより学習し、当該オブジェクトを識別するための学習器を取得する学習部と、前記学習器を蓄積する学習器蓄積部として機能させるためのプログラムである。

また、本実施の形態における情報処理装置Ａの認識機能を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、学習機能により蓄積された学習器が格納される学習器格納部にアクセス可能なコンピュータを、静止画を受け付ける静止画受付部と、前記静止画を前記学習器に適用し、機械学習のアルゴリズムにより、オブジェクトを識別するオブジェクト識別子を取得する認識部と、前記認識部が取得したオブジェクト識別子を出力する出力部として機能させるためのプログラムである。

（実施の形態２）
本実施の形態において、オブジェクト含静止画の生成機能を有する情報処理装置について説明する。なお、生成機能とは、オブジェクトの三次元データを用いて取得した１以上のオブジェクト静止画と１以上の各背景画とを組み合わせて、１または２以上のオブジェクト含静止画を生成する機能である。

本実施の形態における情報処理装置は、実施の形態１で説明した情報処理装置Ａに対して、学習機能と認識機能とを有さず、生成機能のみを有する。

図４は、本実施の形態における情報処理装置Ｂのブロック図である。情報処理装置Ｂは、格納部１Ｂ、受付部２Ｂ、処理部３Ｂ、および出力部４Ｂを備える。

格納部１Ｂは、三次元データ格納部１１、背景画格納部１２、およびオブジェクト含静止画格納部１３を備える。受付部２Ｂは、指示受付部２１を備える。処理部３Ｂは、オブジェクト静止画取得部３１、および画像合成部３２を備える。出力部４Ｂは、静止画蓄積部４１を備える。

なお、情報処理装置Ｂを構成する各構成要素について、実施の形態１で説明したので、再度の説明は省略する。また、情報処理装置Ｂの生成機能について、情報処理装置Ａの生成機能と同じであるので、再度の説明は省略する。

なお、生成機能において、情報処理装置Ａまたは情報処理装置Ｂは、以下の生産方法を実現する。

つまり、オブジェクトの三次元データが格納される三次元データ格納部と、背景の静止画である１以上の背景画が格納される背景画格納部と、オブジェクト静止画取得部と、画像合成部と、静止画蓄積部とにより実現されるオブジェクト含静止画を生産する静止画の生産方法であって、前記オブジェクト静止画取得部が、前記三次元データを用いて前記オブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得ステップと、前記画像合成部が、前記１以上の各オブジェクト静止画と前記１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成ステップと、前記静止画蓄積部が、前記１以上のオブジェクト含静止画を蓄積する静止画蓄積ステップとを具備する静止画の生産方法、である。

なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置Ｂを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、オブジェクトの三次元データが格納される三次元データ格納部と、背景の静止画である１以上の背景画が格納される背景画格納部とにアクセス可能なコンピュータを、前記三次元データを用いて前記オブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得部と、前記１以上の各オブジェクト静止画と前記１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成部と、前記１以上のオブジェクト含静止画を蓄積する静止画蓄積部として機能させるためのプログラムである。

（実施の形態３）
本実施の形態において、１または２以上のオブジェクト含静止画を用いて学習器を生成する学習機能を実現する学習装置について説明する。なお、学習器を生成する場合、２以上のより多数のオブジェクト含静止画が存在することは好適である。

本実施の形態における学習装置は、実施の形態１で説明した情報処理装置に対して、生成機能と認識機能とを有さず、学習機能のみを有する。

図５は、本実施の形態における学習装置Ｃのブロック図である。学習装置Ｃは、格納部１Ｃ、受付部２Ｃ、処理部３Ｃ、および出力部４Ｃを備える。

格納部１Ｃは、オブジェクト含静止画格納部１３、および学習器格納部１４を備える。受付部２Ｃは、指示受付部２１を備える。処理部３Ｃは、学習部３３を備える。出力部４Ｃは、学習器蓄積部４２を備える。

なお、学習装置Ｃを構成する各構成要素について、実施の形態１で説明したので、再度の説明は省略する。また、学習装置Ｃの学習機能について、情報処理装置Ａの学習機能と同じであるので、再度の説明は省略する。

以上、本実施の形態によれば、オブジェクトを認識するための学習器を生成できる。

なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における学習装置Ｃを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、情報処理装置Ａまたは情報処理装置Ｂが蓄積した２以上のオブジェクト含静止画が格納されるオブジェクト含静止画格納部にアクセス可能なコンピュータを、前記２以上のオブジェクト含静止画を機械学習のアルゴリズムにより学習し、当該オブジェクトを識別するための学習器を取得する学習部と、前記学習器を蓄積する学習器蓄積部として機能させるためのプログラムである。

（実施の形態４）
本実施の形態において、学習器を用いて、オブジェクトを認識する認識装置について説明する。

本実施の形態における認識装置は、実施の形態１で説明した情報処理装置に対して、生成機能と学習機能とを有さず、認識機能のみを有する。

図６は、本実施の形態における認識装置Ｄのブロック図である。認識装置Ｄは、格納部１Ｄ、受付部２Ｄ、処理部３Ｄ、および出力部４Ｄを備える。

格納部１Ｄは、学習器格納部１４を備える。受付部２Ｄは、静止画受付部２２を備える。

処理部３Ｄは、認識部３４を備える。出力部４Ｄは、認識結果出力部４３を備える。

なお、認識装置Ｄを構成する各構成要素について、実施の形態１で説明したので、再度の説明は省略する。また、認識装置Ｄの認識機能について、情報処理装置Ａの認識機能と同じであるので、再度の説明は省略する。

以上、本実施の形態によれば、静止画の中のオブジェクトを認識できる。

なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における認識装置Ｄを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、学習装置Ｃが蓄積した学習器が格納される学習器格納部にアクセス可能なコンピュータを、静止画を受け付ける静止画受付部と、前記静止画を前記学習器に適用し、機械学習のアルゴリズムにより、オブジェクトを識別するオブジェクト識別子を取得する認識部と、前記認識部が取得したオブジェクト識別子を出力する出力部として機能させるためのプログラムである。

（実施の形態５）
以下、上記の実施の形態における情報処理装置Ａ等の具体的な動作について説明する。

今、三次元データ格納部１１には、ビル等の建設のために使用されるクレーンの三次元データがオブジェクト識別子「クレーン」と対に格納されている、とする。また、三次元データ格納部１１には、クレーン以外の１以上の各三次元データ（例えば、ブルトーザ、トラック等の三次元データ）も格納されている、とする。

また、背景画格納部１２には、ビル群を有する都市の背景の背景画、草原の背景画、マラソンランナーが都市を快走する背景画等の多数の背景画が格納されている、とする。

かかる状況において、ユーザは、静止画取得指示を情報処理装置Ａに入力した、とする。すると、情報処理装置Ａの指示受付部２１は、静止画取得指示を受け付ける。なお、静止画取得指示は、三次元データ格納部１１のクレーンの三次元データの三次元データ特定情報を含む、とする。

次に、オブジェクト静止画取得部３１は、指示受付部２１により受け付けられた静止画取得指示が有する三次元データ特定情報を取得する。次に、オブジェクト静止画取得部３１は、当該三次元データ特定情報により特定される三次元データである、クレーンの三次元データを三次元データ格納部１１から読み出す。

次に、オブジェクト静止画取得部３１は、取得した三次元データと対になるオブジェクト識別子「クレーン」を三次元データ格納部１１から取得する。

次に、オブジェクト静止画取得部３１は、取得したクレーンの三次元データを予め決められた２以上の各視点から見た場合の２以上のオブジェクト静止画を、クレーンの三次元データを用いて取得する。なお、三次元データを用いて、２以上の各視点から見た場合の２以上のオブジェクト静止画を取得する技術は公知技術である。そして、オブジェクト静止画取得部３１は、図７の（ａ）から（ｅ）のオブジェクト静止画を含む、多数のオブジェクト静止画を取得した、とする。

次に、オブジェクト静止画取得部３１は、取得したオブジェクト識別子「クレーン」に対応付けて、取得した２以上のオブジェクト静止画を格納部１に一時蓄積する。

次に、画像合成部３２は、背景画格納部１２に格納されている多数の各背景画に、格納部１に一時蓄積した２以上の各オブジェクト静止画を配置し（各背景画と各オブジェクト静止画とを合成し）、多数のオブジェクト含静止画を取得する。

次に、画像合成部３２は、取得したオブジェクト識別子「クレーン」に対応付けて、取得した多数のオブジェクト含静止画をオブジェクト含静止画格納部１３に蓄積する。なお、かかる蓄積したオブジェクト含静止画は、図８の（ａ）から（ｅ）を含む。

上記と同様の処理により、画像合成部３２は、三次元データ格納部１１に格納されているクレーン以外の１以上の各三次元データと、背景画格納部１２に格納されている多数の各背景画とを合成し、多数のオブジェクト含静止画を取得する。そして、画像合成部３２は、三次元データと対になるオブジェクト識別子に対応付けて、多数のオブジェクト含静止画をオブジェクト含静止画格納部１３に蓄積する。

以上の処理により、オブジェクトと背景とを含む多数のオブジェクト含静止画が、オブジェクト識別子に対応付けられて自動的に蓄積された。

次に、ユーザは、学習指示を情報処理装置Ａに入力した、とする。すると、学習部３３は、オブジェクト含静止画格納部１３から、多数のオブジェクト含静止画とオブジェクト識別子との組の情報である学習元情報を取得する。

次に、学習部３３は、取得した学習元情報に対して、機械学習のアルゴリズムにより、学習処理を実行し、学習器を取得する。

なお、学習部３３は、オブジェクト識別子ごとに学習器を取得しても良い。つまり、学習部３３は、オブジェクト識別子ごとに、当該オブジェクト識別子と対になるオブジェクト含静止画を正例とし、当該オブジェクト識別子ではないオブジェクト識別子と対になるオブジェクト含静止画を負例として、機械学習のアルゴリズムにより、学習処理を実行し、オブジェクト識別子ごとの学習器を取得する。かかる場合、例えば、二値分類（二クラス分類）が行える機械学習のアルゴリズム（例えば、ＳＶＭ、決定木、ランダムフォレスト等）が利用可能である。

また、学習部３３は、一つの学習器を取得しても良い。つまり、学習部３３は、オブジェクト含静止画格納部１３の多数のオブジェクト含静止画とオブジェクト識別子との組の情報である学習元情報に対して、機械学習のアルゴリズムにより、学習処理を実行し、一の学習器を取得する。かかる場合、例えば、多値分類（多クラス分類）が行える機械学習のアルゴリズム（例えば、深層学習、ランダムフォレスト等）が利用可能である。

次に、学習器蓄積部４２は、取得された１または２以上の学習器を学習器格納部１４に蓄積する。

次に、ユーザは、図９の静止画を特定する静止画特定情報を有する認識開始指示を情報処理装置Ａに入力した、とする。すると、認識部３４は、認識開始指示が有する静止画特定情報を取得する。なお、図９の静止画は、格納部１に格納されている、とする。

次に、認識部３４は、当該静止画特定情報により特定される静止画を格納部１から取得する。次に、認識部３４は、取得した図９の静止画を、学習器格納部１４の学習器に適用し、機械学習のアルゴリズムにより、分類処理を行い、オブジェクト識別子「クレーン」を取得する。

次に、認識結果出力部４３は、取得したオブジェクト識別子「クレーン」を出力する。なお、認識結果出力部４３におけるオブジェクト識別子「クレーン」の出力態様は問わない。

以上、本実施の形態によれば、オブジェクトと背景とを含む多数のオブジェクト含静止画を自動的に取得できる。

また、本実施の形態によれば、自動的に取得した多数のオブジェクト含静止画を用いて、オブジェクトを認識するための学習器を生成できる。なお、多数のオブジェクト含静止画を使用して学習器を生成するため、オブジェクト認識の精度の高い学習器が生成できる。

さらに、本実施の形態によれば、生成した学習器を用いて、静止画の中のオブジェクトを容易に認識できる。

また、図１０は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置Ａ等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図１０は、このコンピュータシステム３００の概観図であり、図１１は、システム３００のブロック図である。

図１０において、コンピュータシステム３００は、ＣＤ－ＲＯＭドライブを含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４とを含む。

図１１において、コンピュータ３０１は、ＣＤ－ＲＯＭドライブ３０１２に加えて、ＭＰＵ３０１３と、ＣＤ－ＲＯＭドライブ３０１２等に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ３０１５と、ＭＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ３０１６と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。

コンピュータシステム３００に、上述した実施の形態の情報処理装置Ａ等の機能を実行させるプログラムは、ＣＤ－ＲＯＭ３１０１に記憶されて、ＣＤ－ＲＯＭドライブ３０１２に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ－ＲＯＭ３１０１またはネットワークから直接、ロードされても良い。

プログラムは、コンピュータ３０１に、上述した実施の形態の情報処理装置Ａ等の機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。

また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。

また、上記各実施の形態において、一の装置に存在する２以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。

また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。

本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

以上のように、本発明にかかる情報処理装置は、オブジェクトと背景とを含む多数の画像を自動的に取得できるという効果を有し、情報処理装置等として有用である。

Ａ，Ｂ情報処理装置
Ｃ学習装置
Ｄ認識装置
１Ａ，１Ｂ，１Ｃ，１Ｄ格納部
２Ａ，２Ｂ，２Ｃ，２Ｄ受付部
３Ａ，３Ｂ，３Ｃ，３Ｄ処理部
４Ａ，４Ｂ，４Ｃ，４Ｄ出力部
１１三次元データ格納部
１２背景画格納部
１３オブジェクト含静止画格納部
１４学習器格納部
２１指示受付部
２２静止画受付部
３１オブジェクト静止画取得部
３２画像合成部
３３学習部
３４認識部
４１静止画蓄積部
４２学習器蓄積部
４３認識結果出力部
３１１取得手段
３１２変更手段

Claims

オブジェクトの三次元データが格納される三次元データ格納部と、
背景の静止画である１以上の背景画が格納される背景画格納部と、
前記三次元データを用いて前記オブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得部と、
前記１以上の各オブジェクト静止画と前記１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成部と、
前記１以上のオブジェクト含静止画を蓄積する静止画蓄積部とを具備し、
前記静止画蓄積部は、
前記オブジェクト含静止画を、当該オブジェクト含静止画を作成する元になったオブジェクト静止画に対応付けて蓄積する
情報処理装置。
前記オブジェクト静止画取得部は、
前記三次元データを２以上の異なる各視点から見た場合の２以上のオブジェクト静止画を取得する請求項１に記載の情報処理装置。
前記オブジェクト静止画取得部は、
前記三次元データを用いて前記オブジェクトの静止画であるオブジェクト静止画を取得する取得手段と、
前記取得手段が取得したオブジェクト静止画の１以上の属性値を変更して、１以上のオブジェクト静止画を生成する変更手段とを具備する請求項１または２に記載の情報処理装置。
前記背景画格納部には、
同一のオブジェクトを含み、外部環境が異なる２以上の背景画が格納される請求項１から請求項３のいずれか一項に記載の情報処理装置。
前記外部環境は、天気、時刻、季節、太陽（光源）の色、カメラレンズに雨滴が付着しているか否かに関する情報、カメラレンズの解像度に関する情報、カメラレンズのピントが合っているか否かに関する情報、カメラレンズの画角に関する情報、カメラの焦点距離に関する情報のうちの１以上である請求項４記載の情報処理装置。
請求項１から請求項５のいずれか一項に記載の情報処理装置が蓄積した２以上のオブジェクト含静止画が格納されるオブジェクト含静止画格納部と、
前記２以上のオブジェクト含静止画を機械学習のアルゴリズムにより学習し、オブジェクトを識別するための学習器を取得する学習部と、
前記学習器を蓄積する学習器蓄積部とを具備する学習装置。
請求項６記載の学習装置が蓄積した学習器が格納される学習器格納部と、
静止画を受け付ける静止画受付部と、
前記静止画を前記学習器に適用し、機械学習のアルゴリズムにより、オブジェクトを識別するオブジェクト識別子を取得する認識部と、
前記認識部が取得したオブジェクト識別子を出力する出力部とを具備する認識装置。
オブジェクトの三次元データが格納される三次元データ格納部と、背景の静止画である１以上の背景画が格納される背景画格納部と、オブジェクト静止画取得部と、画像合成部と、静止画蓄積部とにより実現されるオブジェクト含静止画を生産する生産方法であって、
前記オブジェクト静止画取得部が、前記三次元データを用いて前記オブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得ステップと、
前記画像合成部が、前記１以上の各オブジェクト静止画と前記１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成ステップと、
前記静止画蓄積部が、前記１以上のオブジェクト含静止画を蓄積する静止画蓄積ステップとを具備し、
静止画蓄積ステップは、前記静止画蓄積部が、前記オブジェクト含静止画を、当該オブジェクト含静止画を作成する元になったオブジェクト静止画に対応付けて蓄積するステップを含む
静止画の生産方法。
オブジェクトの三次元データが格納される三次元データ格納部と、背景の静止画である１以上の背景画が格納される背景画格納部とにアクセス可能なコンピュータを、
前記三次元データを用いて前記オブジェクトの静止画である１以上のオブジェクト静止画を取得するオブジェクト静止画取得部と、
前記１以上の各オブジェクト静止画と前記１以上の各背景画とを合成し、１以上のオブジェクト含静止画を取得する画像合成部と、
前記１以上のオブジェクト含静止画を蓄積する静止画蓄積部として機能させるためのプログラムであって、
前記静止画蓄積部は、前記オブジェクト含静止画を、当該オブジェクト含静止画を作成する元になったオブジェクト静止画に対応付けて蓄積する
プログラム。