WO2023135726A1

WO2023135726A1 - 情報処理装置、情報処理方法、及びコンピュータ可読媒体

Info

Publication number: WO2023135726A1
Application number: PCT/JP2022/001040
Authority: WO
Inventors: 智希北堀
Original assignee: 日本電気株式会社
Priority date: 2022-01-14
Filing date: 2022-01-14
Publication date: 2023-07-20
Also published as: JPWO2023135726A1

Abstract

学習用画像の撮像俯角と異なる俯角で撮影された人を画像認識することを可能にする。情報処理装置（１）は、人を第１の俯角で撮影した第１画像から、第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成する生成部（１１）を備える。生成部（１１）は、人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う。情報処理装置（１）は、疑似画像を用いて、第２の俯角で撮影された人の認識辞書を作成する作成部（１２）を備える。

Description

情報処理装置、情報処理方法、及びコンピュータ可読媒体

　本開示は、情報処理装置、情報処理方法、およびコンピュータ可読媒体に関し、特に人画像を変換する技術に関する。

　物体の画像特徴を学習し、画像認識を行う技術が知られている。特許文献１は、学習に用いられた画像の撮影条件に近づけるように、車載カメラによる撮影画像を変換する情報処理装置を開示している。特許文献１に記載された技術によると、画像認識の精度を向上させることができる。

　なお、特許文献２は、車載カメラの撮影画像の各領域に最適な映像変換処理を行い、違和感のない合成映像を表示する技術を提案している。また、非特許文献１は、単眼カメラ画像から、障害物の高さを推定する技術を開示している。

特開２０１９―１２５１１６号公報特開２００５―２２３５６８号公報

中島慶子、田中志歩、大川剛直、伊東敏夫、"射影変換を用いた単眼カメラ画像からの障害物の高さ情報推定"，画像の認識・理解シンポジウム(MIRU2011)論文集．

　ところで、互いに異なる俯角で人画像を撮影した場合、人画像の特徴は互いに異なる。人画像という用語は、人を撮影した画像を表している。例えば、人の上側部分（例えば、肩）の画像領域の大きさと、下側部分（例えば、足元）の画像領域の大きさの比が、俯角に応じて変化してしまう。したがって、学習用画像の撮影俯角と異なる俯角で撮影された人を画像認識することは困難である。

　本開示は、上記事情に鑑み、学習用画像の撮影俯角と異なる俯角で撮影された人を画像認識することを可能にする情報処理装置、情報処理方法、及びコンピュータ可読媒体を提供することを目的とする。

　上記目的を達成するため、本開示は、
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成する生成手段であって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、生成手段と、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成する作成手段と、
　を備える情報処理装置を提供する。

　本開示は、
　人を第２の俯角で撮影した第２画像により生成した認識辞書を記憶する記憶手段と、
　人を前記第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成する生成手段であって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、生成手段と、
　前記認識辞書を用いて、前記疑似画像に写る人の特徴を認識する認識手段と、
　を備える情報処理装置を提供する。

　本開示は、コンピュータが、
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成することと、
　を含む情報処理方法を提供する。

　本開示は、コンピュータが、
　人を、第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　人を第２の俯角で撮影した第２画像により生成した認識辞書を用いて、前記疑似画像に写る人の特徴を認識することと、
　を含む情報処理方法を提供する。

　本開示は、
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで互いに異なる変換を行う、ことと、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成することと、
　を含む情報処理方法をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体を提供する。

　本開示は、
　人を第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　人を第２の俯角で撮影した第２画像により生成した前記認識辞書を用いて、前記疑似画像に写る人の特徴を認識することと、
　を含む情報処理方法をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体を提供する。

　本開示に係る情報処理装置、情報処理方法、及びコンピュータ可読媒体は、学習用画像の撮影俯角と異なる俯角で撮影された人を画像認識することを可能にする。

実施形態１に係る情報処理装置を示すブロック図。実施形態２に係る情報処理装置を示すブロック図。実施形態３に係る情報処理装置を含むシステムの概略図。乗用車に搭載された撮影装置を示す模式図。トラックに搭載された撮影装置を示す模式図。２ｍの高さから撮影された人の撮影画像を例示する模式図。３ｍの高さから撮影された人の撮影画像を例示する模式図。頭部の画像領域と胴体部の画像領域とで異なる変換を行う理由を説明するための図。生成された疑似画像を示す図。

　以下では、本開示の実施形態について、図面を参照しながら詳細に説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。

（実施形態１）
　図１は、実施形態１にかかる情報処理装置１の全体構成を示すブロック図である。情報処理装置１は、人を第１の俯角で撮影した第１画像から、第２の俯角で撮影された人の認識辞書を作成する装置である。第１の俯角と第２の俯角は互いに異なる。第２の俯角は、第１の俯角よりも大きくてもよく、第１の俯角よりも小さくてもよい。

　情報処理装置１は、ネットワーク（不図示）を介して、第１の俯角で人を撮影する第１の撮影装置（不図示）や、第２の俯角で人を撮影する第２の撮影装置（不図示）と接続されていてもよい。

　情報処理装置１は、生成部１１および作成部１２を備えている。生成部１１は、人を第１の俯角で撮影した第１画像から、第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成する。生成部１１は、人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う。

　生成部１１は、胴体部の形状を示す四角形が別の四角形に変形されるように、胴体部の画像領域を射影変換してもよい。射影変換は、台形変換とも呼ばれる。胴体部の形状を示す四角形が台形である場合、俯角が小さいほど、上底と下底の比が１に近い場合がある。また、胴体部の形状を示す四角形が台形である場合、俯角が大きいほど、高さが小さくなる場合がある。このように、胴体部の形状を示す四角形の形状は、俯角に応じて変化する。射影変換により、胴体部の画像領域から、異なる俯角で撮影した画像に相当する疑似画像領域を生成できる。

　生成部１１は、頭部を撮影する視点を変えるように、頭部の画像領域を変換してもよい。撮影俯角を大きくした場合、頭頂部の画像領域が大きくなり、顔の画像領域が小さくなる場合がある。このように、頭部の画像領域は、俯角に応じて変化する。視点を変換することにより、頭部の画像領域を、第２の俯角で撮影した画像に相当する疑似画像領域に変換できる。視点とは、例えば、撮影装置の位置や姿勢であってもよい。視点を変換する技術として、非特許文献１に記載された技術が知られている。非特許文献１には、撮影画像を上面視画像に変換することが記載されている。

　作成部１２は、疑似画像を用いて、第２の俯角で撮影された人の認識辞書を作成する。作成部１２は、機械学習を行うことにより、認識辞書を作成してもよい。

　情報処理装置１は、第２の俯角で撮影した画像に相当する疑似画像を生成し、当該疑似画像を用いて認識辞書を作成する。当該認識辞書を用いることで、第２の俯角から撮影した人を画像認識できる。

　なお、情報処理装置１は、図示しない構成としてプロセッサ、メモリ及び記憶装置を備えるものである。また、当該記憶装置には、本実施形態にかかる情報処理方法の処理が実装されたコンピュータプログラムが記憶されている。そして、当該プロセッサは、記憶装置からコンピュータプログラムを前記メモリへ読み込ませ、当該コンピュータプログラムを実行する。これにより、前記プロセッサは、生成部１１および作成部１２の機能を実現する。

　または、生成部１１および作成部１２は、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路（circuitry）、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。また、プロセッサとして、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（field-programmable gate array）、量子プロセッサ（量子コンピュータ制御チップ）等を用いることができる。

　また、情報処理装置１の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。また、情報処理装置１の機能がＳａａＳ（Software as a Service）形式で提供されてもよい。

（実施形態２）
　図２は、実施形態２にかかる情報処理装置１ａの全体構成を示すブロック図である。情報処理装置１ａは、人を第１の俯角で撮影した第１画像から、第２の俯角で撮影した画像に相当する疑似画像を生成して、画像認識を行う装置である。

　情報処理装置１ａは、生成部１１、記憶部１３、および認識部１４を備えている。生成部１１の機能は、実施形態１と同様であるため、説明を省略する。なお、生成部１１は、第１画像の上端から所定の割合（例えば、上側の１／３の領域）を頭部の画像領域とし、第１画像のうち頭部の画像領域以外を胴体部の画像領域としてもよい。

　記憶部１３は、人を第２の俯角で撮影した第２画像により生成した認識辞書を予め記憶する。認識部１４は、認識辞書を用いて、疑似画像に写る人の特徴を認識する。認識部１４は、疑似画像に写る人を検出することができる。なお、認識部１４は、認識辞書を用いて個人を特定したり、人の属性を判定したりしてもよい。

　情報処理装置１ａは、第２の俯角からの撮影に対応した疑似画像を生成し、第２の俯角からの撮影に対応した認識辞書を用いて画像認識を行う。情報処理装置１ａは、撮影俯角ごとに認識辞書を用意しなくてもよいという利点を有する。

（実施形態３）
　実施形態３は、上述した実施形態１および実施形態２の具体例である。図３は、実施形態３にかかる情報処理装置２００を含むシステムの構成を示す構成図である。図３に示すシステムは、撮影装置１１０、撮影装置１２０、および情報処理装置２００を備えている。

　撮影装置１１０は第１の撮影装置とも呼ばれ、撮影装置１２０は第２の撮影装置とも呼ばれる。撮影装置１１０による撮影画像は第１画像と称され、撮影装置１２０による撮影画像は第２画像と称される。後述する情報処理装置２００は、第１画像から第２画像に相当する疑似画像を生成する装置である。

　撮影装置１１０の高さと撮影装置１２０の高さは互いに異なる。例えば、撮影装置１１０は乗用車に取り付けられており、撮影装置１２０はトラックやバスなどの大型車両に取り付けられていてもよい。なお、撮影装置１００は、町中のビルやポールなどに取り付けられていてもよい。以下では、撮影装置１１０と撮影装置１２０とを互いに区別しない場合には、単に撮影装置１００と称する場合がある。

　図４は、撮影装置１００が、乗用車２１に取り付けられるケースを示す模式図である。撮影装置１００は、乗用車２１の後方に取り付けられている。撮影装置１００の高さは、例えば１ｍである。撮影装置１００は、乗用車２１の後方に位置する人３０を撮影する。

　図５は、撮影装置１００が、トラック２２に取り付けられるケースを示す模式図である。撮影装置１００は、広い範囲を撮影できる魚眼カメラや超広角カメラであってもよい。これにより、より多くの人を撮影し、効率的に認識辞書を作成することができる。

　撮影装置１００は、トラック２２の後方に取り付けられている。撮影装置１００は斜め下方を向くように取り付けられている。撮影装置１００の高さは、例えば３ｍである。撮影装置１００は、トラック２２の後方に位置する人３０を撮影する。撮影俯角は、撮影装置１００の高さと、撮影装置１００と人３０との間の水平距離によって定められてもよい。

　撮影装置１００が高い位置に設置されている場合、人３０は、より大きい俯角で撮影される。図６は、撮影装置１００が２ｍの高さに取り付けられている場合の撮影画像を例示する模式図である。撮影画像は、頭部の画像領域４１および胴体部の画像領域４２を含んでいる。図７は、撮影装置１００が３ｍの高さに取り付けられている場合の撮影画像を例示する模式図である。撮影画像は、頭部の画像領域４１および胴体部の画像領域４２を含んでいる。

　図６は、人を正面から撮影した画像に近く、人を画像認識することが比較的容易であると考えられる。一方で、図７は、人を正面から撮影した画像とは大きく異なっており、人を画像認識することが困難であると考えられる。

　図６と図７とを比較すると、人の胴体を示す四角形の形状が異なっている。なお、四角形の頂点は、例えば、人の右肩の位置、左肩の位置、右足の位置、左足の位置であってもよい。図６内の人の胴体部を示す四角形の形状は矩形に近く、図７内の人の胴体部を示す四角形の形状は台形に近い。また、図６と図７とを比較すると、図６では顔がより大きく写っており、図７では頭頂部がより大きく写っている。後述する情報処理装置２００は、図６から、図７に相当する疑似画像を生成して、高所から撮影した場合の認識辞書を作成してもよい。また、情報処理装置２００は、図７から、図６に相当する疑似画像を生成し、認識辞書を用いて人を検出してもよい。この場合、認識辞書は、水平方向から撮影した撮影画像から人を検出するための辞書であってもよい。

　図３に戻り情報処理装置２００について説明する。情報処理装置２００は、上述した情報処理装置１および１ａの具体例である。情報処理装置２００は、生成部２１０、作成部２２０、記憶部２３０、および認識部２４０を備えている。情報処理装置２００が情報処理装置１の具体例である場合、情報処理装置２００は、記憶部２３０および認識部２４０を備えていなくてもよい。また、情報処理装置２００が情報処理装置１ａの具体例である場合、情報処理装置２００は、作成部２２０を備えていなくてもよい。

　生成部２１０は、上述した生成部１１の具体例である。生成部２１０は、第１画像から、第２の俯角で撮影した画像に相当する疑似画像を生成する。生成部２１０は、画像領域４１と画像領域４２とで異なる変換を行う。生成部２１０は、疑似画像を、作成部２２０または認識部２４０に出力する。

　生成部２１０は、例えば、上方から撮影した人画像から、水平方向から撮影した人画像に相当する疑似画像を生成してもよい。情報処理装置２００は、上方から撮影した画像から、通常の認識辞書を用いて人を検出できる。また、生成部２１０は、水平方向から撮影した人画像から、上方から撮影した人画像に相当する疑似画像を生成してもよい。情報処理装置２００は、上方から撮影した画像に写る人を認識するための認識辞書を作成できる。

　次に、生成部２１０が、画像領域４１と画像領域４２とで異なる変換を行う理由について説明する。図８は、図６に示す画像全体に対して射影変換を行い、図７に示す画像に相当する疑似画像を生成した結果を示している。換言すると、図８は、生成部２１０が画像領域４２に対して行う処理を、画像領域４１および画像領域４２の両方に施した結果を示している。図８の画像領域４２は、図７の画像領域４２に近い。一方、図８の画像領域４１は、図７の画像領域４１と大きく異なっている。射影変換では体の向きが変化しないため、適切な画像を生成できていないと考えられる。

　図８と図７とは大きく異なっている。したがって、図８に示す画像を用いて認識辞書を生成した場合、認識精度が低下してしまうと考えられる。そこで、生成部２１０は、第１画像を、画像領域４１と画像領域４２とに分割して、画像領域４１と画像領域４２とで異なる変換を行っている。

　生成部２１０は、例えば、第１画像の上端から所定の割合（例えば、１／３）を画像領域４１とし、それ以外の部分を画像領域４２としてもよい。第１画像が魚眼カメラや超広角カメラによる撮影画像である場合、画像が歪んでいるために体の部位（例えば、顔）を検出できない可能性があるが、この方法により分割可能である。

　また、生成部２１０は、第１画像から頭部（例えば、顔）を検出することにより、第１画像を、画像領域４１と画像領域４２に分割してもよい。これにより、生成部２１０は、第１画像をより正確に分割できる。

　そして、生成部２１０は、画像領域４２に対して、第２の俯角からの撮影に対応した射影変換を行う。射影変換は、任意の形状の四角形を、別の四角形の形状に変換できる。変換に用いられる変換パラメータは、俯角に応じて定められてもよい。撮影装置１１０が魚眼カメラ等である場合、生成部２１０は、画像領域４１の歪みを補正してもよい。また、撮影装置１２０が魚眼カメラ等である場合、生成部２１０は、画像領域４１に歪みを加えてもよい。

　また、生成部２１０は、画像領域４１に対して、第２の俯角からの撮影に対応した視点変換を行う。生成部２１０は、画像領域４１を分割して各領域（例えば、頭頂部の領域、顔の領域）に対して異なる処理を行ってもよい。生成部２１０は、視点変換を行う際にデータの補完を行ってもよい。撮影装置１１０が魚眼カメラ等である場合、生成部２１０は、画像領域４１の歪みを補正してもよい。撮影装置１２０が魚眼カメラ等である場合、生成部２１０は、画像領域４１に歪みを加えてもよい。視点変換は、非特許文献１に従って行われてもよい。生成部２１０は、射影変換した画像領域４１と視点変換した画像領域４２とを組み合わせて疑似画像を生成する。

　撮影装置１１０が高所に設置されている場合、生成部２１０は、撮影装置１１０の高さに応じた変換パラメータを用いて、画像領域４１および画像領域４２を変換してもよい。撮影装置１１０の高さにより、第１の俯角も変換するためである。撮影装置１１０は、撮影装置１１０の高さごとの変換パラメータをテーブルとして記憶していてもよい。同様に、撮影装置１２０が高所に設置されている場合、生成部２１０は、撮影装置１２０の高さに応じた変換パラメータを用いて、画像領域４１および画像領域４２を変換してもよい。

　図９は、図６に示す画像から生成された疑似画像を示している。画像領域４１と画像領域４２とで異なる変換を行っており、図９と図７は大きく異ならない。画像領域４１と画像領域４２に対して同一の変換を行った図８を用いた場合、上述の通り認識精度が低下してしまうが、図９を用いることにより、認識精度の低下を抑制できる。

　作成部２２０は、上述した作成部１２の具体例である。作成部２２０は、疑似画像を用いて、第２の俯角で撮影された人の認識辞書を作成する。作成部２２０は、撮影装置１２０と人との間の水平距離ごとに認識辞書を作成してもよい。水平距離が大きくなるほど俯角は小さくなるため、人の画像の特徴も変化すると考えられるためである。水平距離が大きいほど人を正面から撮影した画像に近く、水平距離が小さいほど人を真上から撮影した画像に近くなる。

　記憶部２３０は、上述した記憶部１３の具体例である。記憶部２３０は、作成部２２０が作成した認識辞書を記憶していてもよい。記憶部２３０は、撮影装置１１０の高さと変換パラメータとを対応付けた表をさらに記憶していてもよい。

　認識部２４０は、上述した認識部１４の具体例である。認識部２４０は、認識辞書を用いて、第２画像に写る人の特徴を認識して人を検出する。認識部２４０は、第２画像内に写る人と撮影装置１２０との間の水平距離に対応する認識辞書を用いて、人の特徴の認識を行ってもよい。水平距離が大きくなるほど俯角は小さくなるため、人の画像の特徴も変化すると考えられるためである。水平距離は、第２画像に写る人のサイズに応じて判定されてもよい。

　最後に、情報処理装置２００が奏する効果について説明する。関連技術によると、撮影装置１２０の高さごとに、人の認識辞書を作成する必要があった。情報処理装置２００は、撮影装置１２０の高さごとの認識辞書を用意する必要はないという利点を有する。

　以上、本開示の実施形態を詳細に説明したが、本開示は、上記した実施形態に限定されるものではなく、本開示の趣旨を逸脱しない範囲で上記実施形態に対して変更や修正を加えたものも、本開示に含まれる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
　（付記１）
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成する生成手段であって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、生成手段と、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成する作成手段と、
　を備えた情報処理装置。
　（付記２）
　前記生成手段は、
　前記胴体部の形状を示す四角形が別の四角形に変形されるように、前記胴体部の画像領域を射影変換し、
　前記頭部を撮影する視点を変えるように、前記頭部の画像領域を変換する、
　付記１に記載の情報処理装置。
　（付記３）
　前記第１画像は魚眼カメラまたは超広角カメラによって撮影される、
　付記１または２のいずれかに記載の情報処理装置。
　（付記４）
　前記生成手段は、前記第１画像の上端から所定の割合を前記頭部の画像領域とし、前記第１画像のうち前記頭部の画像領域以外を前記胴体部の画像領域とする、
　付記３に記載の情報処理装置。
　（付記５）
　前記認識辞書を用いて、前記第２の俯角で撮影した第２画像に写る人の特徴を認識する認識手段をさらに備える、
　付記１から４のいずれか１項に記載の情報処理装置。
　（付記６）
　前記第１画像を撮影する第１の撮影装置の高さと、前記第２画像を撮影する第２の撮影装置の高さとが互いに異なる、
　付記５に記載の情報処理装置。
　（付記７）
　前記作成手段は、前記第２の撮影装置と前記人との間の水平距離ごとの前記認識辞書を作成する、
　付記６に記載の情報処理装置。
　（付記８）
　人を第２の俯角で撮影した第２画像により生成した認識辞書を記憶する記憶手段と、
　人を前記第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成する生成手段であって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、生成手段と、
　前記認識辞書を用いて、前記疑似画像に写る人の特徴を認識する認識手段と、
　を備える情報処理装置。
　（付記９）
　前記生成手段は、
　前記胴体部の形状を示す四角形が別の四角形に変形されるように、前記胴体部の画像領域を射影変換し、
　前記頭部を撮影する視点を変えるように、前記頭部の画像領域を変換する、
　付記８に記載の情報処理装置。
　（付記１０）
　コンピュータが、
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで互いに異なる変換を行う、ことと、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成することと、
　を含む情報処理方法。
　（付記１１）
　コンピュータが、
　人を第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　人を第２の俯角で撮影した第２画像により生成した認識辞書を用いて、前記疑似画像に写る人の特徴を認識することと、
　を含む情報処理方法。
　（付記１２）
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成することと、
　を含む情報処理方法をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体。
　（付記１３）
　人を第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　人を第２の俯角で撮影した第２画像により生成した認識辞書を用いて、前記疑似画像に写る人の特徴を認識することと、
　を含む情報処理方法をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体。

１、１ａ：情報処理装置
１１：生成部
１２：作成部
１３：記憶部
１４：認識部
１００、１１０、１２０：撮影装置
２００：情報処理装置
２１０：生成部
２２０：作成部
２３０：記憶部
２４０：認識部
２１：乗用車
２２：トラック
３０：人
４１、４２：画像領域

Claims

　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成する生成手段であって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、生成手段と、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成する作成手段と、
　を備えた情報処理装置。
　前記生成手段は、
　前記胴体部の形状を示す四角形が別の四角形に変形されるように、前記胴体部の画像領域を射影変換し、
　前記頭部を撮影する視点を変えるように、前記頭部の画像領域を変換する、
　請求項１に記載の情報処理装置。
　前記第１画像は魚眼カメラまたは超広角カメラによって撮影される、
　請求項１または２のいずれかに記載の情報処理装置。
　前記生成手段は、前記第１画像の上端から所定の割合を前記頭部の画像領域とし、前記第１画像のうち前記頭部の画像領域以外を前記胴体部の画像領域とする、
　請求項３に記載の情報処理装置。
　前記認識辞書を用いて、前記第２の俯角で撮影した第２画像に写る人の特徴を認識する認識手段をさらに備える、
　請求項１から４のいずれか１項に記載の情報処理装置。
　前記第１画像を撮影する第１の撮影装置の高さと、前記第２画像を撮影する第２の撮影装置の高さとが互いに異なる、
　請求項５に記載の情報処理装置。
　前記作成手段は、前記第２の撮影装置と前記人との間の水平距離ごとの前記認識辞書を作成する、
　請求項６に記載の情報処理装置。
　人を第２の俯角で撮影した第２画像により生成した認識辞書を記憶する記憶手段と、
　人を前記第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成する生成手段であって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、生成手段と、
　前記認識辞書を用いて、前記疑似画像に写る人の特徴を認識する認識手段と、
　を備える情報処理装置。
　前記生成手段は、
　前記胴体部の形状を示す四角形が別の四角形に変形されるように、前記胴体部の画像領域を射影変換し、
　前記頭部を撮影する視点を変えるように、前記頭部の画像領域を変換する、
　請求項８に記載の情報処理装置。
　コンピュータが、
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで互いに異なる変換を行う、ことと、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成することと、
　を含む情報処理方法。
　コンピュータが、
　人を第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　人を第２の俯角で撮影した第２画像により生成した認識辞書を用いて、前記疑似画像に写る人の特徴を認識することと、
　を含む情報処理方法。
　人を第１の俯角で撮影した第１画像から、前記第１の俯角と異なる第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　前記疑似画像を用いて、前記第２の俯角で撮影された人の認識辞書を作成することと、
　を含む情報処理方法をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体。
　人を第２の俯角と異なる第１の俯角で撮影した第１画像から、前記第２の俯角で撮影した画像に相当する疑似画像を生成することであって、前記人の頭部の画像領域と胴体部の画像領域とで異なる変換を行う、ことと、
　人を第２の俯角で撮影した第２画像により生成した認識辞書を用いて、前記疑似画像に写る人の特徴を認識することと、
　を含む情報処理方法をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体。