WO2020208976A1

WO2020208976A1 - 画像処理装置、および画像処理方法、並びにプログラム

Info

Publication number: WO2020208976A1
Application number: PCT/JP2020/009154
Authority: WO
Inventors: 宏基水野
Original assignee: ソニー株式会社
Priority date: 2019-04-08
Filing date: 2020-03-04
Publication date: 2020-10-15
Also published as: US20220180545A1; US11816854B2

Abstract

デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する。デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有する。画像処理部は、デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成する。さらに、デプスマップベースＴＳＤＦ空間と、可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、統合ＴＳＤＦ空間を利用して、被写体の三次元形状解析処理を実行する。

Description

画像処理装置、および画像処理方法、並びにプログラム

　本開示は、画像処理装置、および画像処理方法、並びにプログラムに関する。さらに詳細には、三次元（３Ｄ）形状解析処理を実行する画像処理装置、画像処理システム、並びにプログラムに関する。

　近年、コンピュータ・グラフィクス（ＣＧ：Ｃｏｍｐｕｔｅｒ　Ｇｒａｐｈｉｃｓ）技術を用いた三次元画像生成技術が、映画やゲームなど様々な分野で利用されている。

　例えば、特許文献１（特許第５９０６２５８号公報）には、カメラからの距離（デプス）を計測可能なデプスカメラ（深度カメラ）による撮影画像から生成されるデプスマップ（深度マップ）を利用することで、被写体の高精度な三次元形状を再構成する技術を開示している。このデプスマップを利用した三次元形状の再構成処理は、Ｋｉｎｅｃｔ　Ｆｕｓｉｏｎと呼ばれる。

　Ｋｉｎｅｃｔ　Ｆｕｓｉｏｎは、三次元形状再構成の対象を静止シーンとし、自己位置推定と環境マップを同時に生成するＳＬＡＭ（Ｓｉｍｕｌｔａｎｅｏｕｓ　Ｌｏｃａｌｉｚａｔｉｏｎ　ａｎｄ　Ｍａｐｐｉｎｇ）と同様の処理を実行して、マップ生成とトラッキングによる自己位置推定を同時に行う。これにより、高精度で高品質な被写体の三次元形状の再構成を実現している。

　Ｋｉｎｅｃｔ　Ｆｕｓｉｏｎでは、シーン（被写体）の構造を表現するマップとしてシーンを立体空間であるボリューム（Ｖｏｌｕｍｅ）として表現し、さらにボリューム（Ｖｏｌｕｍｅ）構成要素である立方体のボクセル各々にデプスカメラが取得したデプス値からの距離を符号付で格納したマップを利用する。このマップは、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ＝Ｖｏｌｕｍｅｔｒｉｃ　Ｔｒｕｎｃａｔｅｄ　Ｓｉｇｎｅｄ　Ｄｉｓｔａｎｃｅ　Ｆｕｎｃｔｉｏｎ）と呼ばれる。

　カメラの位置・姿勢が既知である場合、複数の視点から取得されるデプス情報に基づいて生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成する各ボクセルの重み付き平均をとることで、より正確な三次元構造の復元が可能となる。
　Ｋｉｎｅｃｔ　Ｆｕｓｉｏｎ発表以降、これを応用した技術がいくつか発表されている。例えば、三次元形状解析装置のメモリ容量を超える大規模な空間を処理対象とする方法や、動的な被写体に対する拡張を施した方法などが発表され、高い品質で三次元形状を再構築できることが示されている。

　一方、これらすべてのアプローチはデプスカメラから得られるデプスマップのみから形状の復元を行っているため、デプスの取得が難しい素材等については再構成を行うことができないという課題が存在する。

　なお、現在、比較的安価に入手可能なデプスカメラの多くは、赤外光（ＩＲ光）を利用したアクティブセンシング（Ａｃｔｉｖｅ　Ｓｅｎｓｉｎｇ）と呼ばれる方式を用いたカメラである。しかし、この赤外光（ＩＲ光）源を利用したデプスカメラは、赤外光に対する反射が弱い素材に対しては、高精度なデプス計測が困難になる、あるいはデプスが計測できなくなるという問題がある。

　赤外光（ＩＲ光）を吸収する素材の例として黒いもの、特に東洋人の黒髪などが顕著な例として挙げられる。従って、例えば黒髪の領域についてはデプス測定精度が低下してしまい、三次元形状が算出できなくなってしまう。
　このように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を用いた三次元形状の再構成処理においてはデプスマップを入力としているためデプスが正確に取得できない領域については正しい三次元形状の推定できないという問題がある。

特許第５９０６２５８号公報

　本開示は、例えば上述の問題点に鑑みてなされたものであり、デプスカメラによって正確なデプスが取得し難い領域についても高精度な三次元形状を解析可能とした画像処理装置、および画像処理方法、並びにプログラムを提供するものである。

　本開示の第１の側面は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記画像処理部は、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成し、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する画像処理装置にある。

　さらに、本開示の第２の側面は、
　画像処理装置において実行する画像処理方法であり、
　前記画像処理装置は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記画像処理部が、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成し、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する画像処理方法にある。

　さらに、本開示の第３の側面は、
　画像処理装置において画像処理を実行させるプログラムであり、
　前記画像処理装置は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記プログラムは、前記画像処理部に、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する処理と、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成する処理と、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成する処理と、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する処理を実行させるプログラムにある。

　なお、本開示のプログラムは、例えば、様々なプログラム・コードを実行可能な画像処理装置やコンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なプログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、画像処理装置やコンピュータ・システム上でプログラムに応じた処理が実現される。

　本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　本開示の一実施例の構成によれば、デプスカメラと、可視光カメラの撮影画像を入力して、被写体の高精度な三次元形状を解析、復元する構成が実現される。
　具体的には、例えば、デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有する。画像処理部は、デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成する。さらに、デプスマップベースＴＳＤＦ空間と、可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、統合ＴＳＤＦ空間を利用して、被写体の三次元形状解析処理を実行する。
　本構成により、デプスカメラと、可視光カメラの撮影画像を入力して、被写体の高精度な三次元形状を解析、復元する構成が実現される。
　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

本開示の画像処理装置において実行する被写体（シーン）の三次元形状解析処理に適用可能なシステム構成例を説明する図である。ＲＧＢ画像と、デプスマップの例について説明する図である。ＲＧＢ画像と、デプスマップの例について説明する図である。多数のカメラを配置したシステム構成例を説明する図である。画像処理部の具体的構成例について説明する図である。各カメラから画像処理部に対して入力されるデータの具体例について説明する図である。ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部が実行する処理シーケンスについて説明するフローチャートを示す図である。ボクセルの具体例について説明する図である。ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）とボクセルについて説明する図である。ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）とボクセルについて説明する図である。視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）について説明する図である。各カメラの撮影画像から取得されるシルエットの例について説明する図である。本開示の画像処理装置が実行する処理シーケンスについて説明するフローチャートを示す図である。本開示の画像処理装置が実行する処理に従って生成されるデータの具体例を説明する図である。複数のカメラを用いず、１台のカメラのみを利用する構成例について説明する図である。複数のカメラを用いず、１台のカメラのみを利用する構成例について説明する図である。ユーザが重み係数を入力、変更可能な構成とした実施例の画像処理装置の構成例について説明する図である。重み係数（α）の変更に伴って表示部に表示される三次元構造データの具体例について説明する図である。画像処理装置のハードウェア構成例について説明する図である。

　以下、図面を参照しながら本開示の画像処理装置、および画像処理方法、並びにプログラムの詳細について説明する。なお、説明は以下の項目に従って行なう。
　１．本開示の画像処理装置の実行する処理の概要について
　２．画像処理部の構成と処理について
　２－１．ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部の実行する処理の詳細について
　２－２．視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部の実行する処理について
　２－３．ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部の実行する処理について
　２－４．ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部の実行する処理について
　２－５．三次元形状生成部の実行する処理について
　３．本開示の画像処理装置が実行する処理シーケンスについて
　４．本開示の処理を適用して得られる被写体の三次元構造データの具体例について
　５．その他の実施例について
　６．画像処理装置のハードウェア構成例について
　７．本開示の構成のまとめ

　　［１．本開示の画像処理装置の構成と実行する処理について］
　図１以下を参照して、本開示の画像処理装置の構成と実行する処理について説明する。

　本開示の画像処理装置は、三次元形状の解析対象となる被写体（シーン）を撮影するデプスカメラ（深度カメラ）と、ＲＧＢカメラの撮影画像を利用して、デプスカメラによるデプスが取得できない領域についても高精度な三次元形状を解析可能とした装置である。

　具体的には、以下の処理を実行する。
　（処理１）デプスカメラ（深度カメラ）によって取得される被写体（シーン）のデプスマップ（深度マップ）からＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ＝Ｖｏｌｕｍｅｔｒｉｃ　Ｔｒｕｎｃａｔｅｄ　Ｓｉｇｎｅｄ　Ｄｉｓｔａｎｃｅ　Ｆｕｎｃｔｉｏｎ）＝「丸め付き符号付き距離関数空間」を生成する。
　（処理２）同じ被写体（シーン）を複数の異なる視点からＲＧＢカメラによって撮影し、複数の異なる視点からの被写体（シーン）のシルエット（ＲＧＢ画像）を取得する。
　なお、処理１と処理２は同時に実行可能である。

　（処理３）複数のＲＧＢカメラによって撮影された複数の異なる視点からの被写体（シーン）のシルエットの交差領域（Ａｎｄ領域）を検出して実行する視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）により、被写体三次元形状（ポリゴンメッシュ）を生成する。
　なお、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）の詳細については後述する。

　（処理４）上記（処理３）で視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）によって生成した被写体三次元形状（ポリゴンメッシュ）に基づいてＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。
　（処理５）上記（処理４）で生成した視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）によって生成した被写体三次元形状（ポリゴンメッシュ）に基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、上記（処理１）においてデプスマップから取得したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を統合して、被写体（シーン）全体の三次元形状を再構成する。

　これらの処理によって、（処理１）においてデプスマップから取得したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）から取得できない、あるいは低精度の被写体領域の三次元構造を、（処理４）で算出したＲＧＢ画像に基づく視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）によって生成した被写体三次元形状（ポリゴンメッシュ）から生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）によって補完することが可能となり、被写体（シーン）全体の高精度な三次元形状の再構成が可能となる。

　図１以下を参照して本開示の画像処理装置の具体的な構成と処理について説明する。
　図１は、本開示の画像処理装置１００において実行する被写体（シーン）の三次元形状解析処理に適用可能なシステム構成例を説明する図である。

　図１において、三次元形状解析処理対象は被写体１である。被写体１の周囲には、異なる視点位置から被写体を撮影するＲＧＢ－Ｄカメラ１０が複数、配置されている。
　ＲＧＢ－Ｄカメラ１０は、デプス（深度）マップ（デプス画像（＝距離画像））と、ＲＧＢ画像を同時に撮影することが可能なカメラである。

　例えば、図２に示すように以下の２つの画像データを同時に撮影することができる。
　（１）ＲＧＢ画像
　（２）デプスマップ（デプス画像（＝距離画像））

　ＲＧＢ画像は、通常のカメラによって撮影可能なカラー画像である。
　デプスマップは、カメラからの距離に応じた濃淡値が各画素に設定された画像である。
　なお、デプスカメラの多くは、赤外光（ＩＲ光）を用いて被写体からの反射光を検出して距離計測を行う。例えばＴｏＦ　（Ｔｉｍｅ　ｏｆ　Ｆｌｉｇｈｔ）　方式のデプスカメラは赤外光がカメラと被写体間を往復する時間を利用し、Ｓｔｒｕｃｔｕｒｅｄ　Ｌｉｇｈｔ方式のデプスカメラは照射した赤外光のパターンをカメラで観測することで距離を計測する。

　しかし、前述したように、赤外光（ＩＲ光）を吸収する素材、すなわち赤外光に対する反射が弱い素材については、高精度なデプス計測が困難になる、あるいはデプスが計測できなくなるという問題がある。
　赤外光（ＩＲ光）を吸収する素材の例として黒いもの、特に東洋人の黒髪などがある。すなわち、例えば黒髪の領域についてはデプスカメラによるデプス測定精度が低下する。

　このため、図１に示すＲＧＢ－Ｄカメラ１０によって実際に撮影されるデプスマップは、図３（２）に示すように、人の黒髪等の一部領域の深度（距離）に対応する画素値が不正確な値、すなわち低精度な深度情報に設定されてしまう。このような低精度の深度情報を用いても精度の高い三次元形状は復元できない。

　本開示の画像処理装置は、このような領域についてＲＧＢカメラによって撮影された画像を用いて三次元形状を復元する。

　なお、図１に示す例では、被写体１を撮影するカメラとして、デプスマップとＲＧＢ画像を同時に撮影することが可能なカメラを利用した例を示しているが、デプスカメラとＲＧＢカメラを個別に用意して、各カメラを被写体の周囲に配置する構成としてもよい。

　なお、本実施例では、ＲＧＢカメラを用いて被写体の可視光カラー画像を撮影する例を説明するが、ＲＧＢカメラでなくモノクロカメラを利用してもよい。通常の可視光での画像撮影を行う様々な可視光カメラが利用可能である。

　また、図１に示すカメラ配置は、一例であり、さらにカメラ数を増やしてもよい。
　例えば、図４に示すように多数のカメラを配置する構成としてもよい。
　さらに、被写体１に対する上からの画像や下からの画像を撮影するようにカメラを配置してもよい。

　図１に示すように、画像処理装置２０は、入力部５０、画像処理部１００を有する。
　入力部５０は、ＲＧＢ－Ｄカメラ１０各々から、撮影画像であるＲＧＢ画像、デプスマップ（デプス画像（＝距離画像））、さらにカメラの内部パラメータ、外部パラメータを入力する。

　内部パラメータとは、例えば、カメラの焦点距離、光学中心等のデータであり、外部パラメータとは、カメラの位置、撮影方向等のパラメータである。
　具体的には、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成処理や、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）に基づく被写体三次元形状の算出処理に必要となるパラメータである。
　これらのパラメータは、各カメラの撮影画像の属性情報として設定され、画像とともに、画像処理装置２０に入力される。

　画像処理装置２０の入力部５０は、各ＲＧＢ－Ｄカメラ１０各々から入力したＲＧＢ画像、デプスマップ、内部パラメータ、外部パラメータを画像処理部１００に出力する。

　画像処理部１００は、これらの入力データを用いて被写体の三次元形状を解析する。
　以下、図５を参照して、画像処理部１００の具体的構成と実行する処理について説明する。

　　［２．画像処理部の構成と処理について］
　図５は、画像処理部１００の具体的構成例を示す図である。
　図５に示すように、画像処理部１００は、複数のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎ、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１、三次元形状生成部１３２を有する。

　図５に示すように、画像処理部１００には、入力部５０を介して被写体周囲に配置された各カメラからの入力データが入力される。
　図５に示すデプスカメラデータ１～Ｎ，５０－１～Ｎと、ＲＧＢカメラデータ１～Ｎ，６０－１～Ｎである。

　これらの入力データは、被写体周囲に配置された各カメラからの入力データである。
　この入力データの具体例について、図６を参照して説明する。
　図６に示すように、デプスカメラデータ５０には、
　（ａ）デプスマップ、
　（ｂ）カメラ内部パラメータ、
　（ｃ）カメラ外部パラメータ、
　これらのデータが含まれる。

　（ａ）デプスマップは、先に図２を参照して説明したデプスマップであり、カメラからの距離に応じた濃淡値が各画素に設定された画像である。
　（ｂ）カメラ内部パラメータは、デプスマップに基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成処理に必要となるパラメータであり、例えばカメラの焦点距離、光学中心等のカメラ内部パラメータである。
　（ｃ）カメラ外部パラメータも、デプスマップに基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成処理に必要となるパラメータであり、例えばカメラの位置情報、撮影方向情報等のカメラ外部パラメータである。
　なお、各カメラの位置、姿勢等のパラメータは事前のキャリブレーションにより取得することができる。

　また、図６に示すように、ＲＧＢ画像カメラデータ６０には、
　（ａ）ＲＧＢ画像、
　（ｂ）カメラ内部パラメータ、
　（ｃ）カメラ外部パラメータ、
　これらのデータが含まれる。

　（ａ）ＲＧＢ画像は、先に図２を参照して説明したＲＧＢ画像であり、通常のカメラからのによって撮影可能なＲＧＢカラー画像である。
　（ｂ）カメラ内部パラメータは、ＲＧＢ画像に基づく視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）に基づく被写体三次元形状の算出処理に必要となるパラメータであり、例えばカメラの焦点距離、光学中心等のカメラ内部パラメータである。
　（ｃ）カメラ外部パラメータも、ＲＧＢ画像に基づく視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）に基づく被写体三次元形状の算出処理に必要となるパラメータであり、例えばカメラの位置情報、撮影方向情報等のカメラ外部パラメータである。

　これらのデプスカメラデータと、ＲＧＢカメラデータが、被写体周囲の各カメラから入力される。

　　（２－１．ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部の実行する処理の詳細について）
　次に、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの実行する処理の詳細について説明する。

　図１に示すＲＧＢ－Ｄカメラ１０各々のデプスカメラデータ１～Ｎ，５０－１～Ｎは、図５に示すように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの各々に入力される。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの各々は、１つのＲＧＢ－Ｄカメラ１０のデプスカメラデータを入力して、１つのデプスカメラの取得したデプスマップに基づく１つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）＝「丸め付き符号付き距離関数空間」を生成する。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎ各々が実行する処理シーケンスについて、図７に示すフローチャートを参照して説明する。
　なお、図７に示すフローに従った処理は、例えば、画像処理装置２０の記憶部に格納されたプログラムに従って、プログラム実行機能を持つＣＰＵ等の制御の下に実行可能である。

　図７に示すフローの各ステップの処理について、順次、説明する。
　なお、図７に示すフローのステップＳ１０１以下の処理は、１つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１が、１つのデプスカメラから、先に図６を参照して説明したデプスカメラデータを入力して開始される。
　すなわち、
　（ａ）デプスマップ、
　（ｂ）カメラ内部パラメータ、
　（ｃ）カメラ外部パラメータ、
　これらのデプスカメラデータを入力した後に実行される。

　　（ステップＳ１０１）
　まず、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１は、ステップＳ１０１において、ボクセル識別子：ｉの初期値を設定する。
　具体的には、
　ｉ＝０
　とするボクセル識別子初期値設定を行う。

　図８を参照してボクセルの具体例について説明する。
　ボクセルとは、三次元空間の構成要素としての立方体に相当する領域である。図８に示すように、三次元空間の中の位置領域として定義されるＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を細分割した１つの立方体がボクセルである。

　図７に示すフローに従って実行される処理の具体例について図９を参照して説明する。
　図９には三次元構造の解析対象となる被写体１を含む三次元空間をＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）とし、このＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内の１つのボクセル２０１を示している。

　ボクセル２０１は、デプスマップを撮影したデプスカメラ２２０と被写体１の間に存在する。デプスカメラ２２０の前方の光軸方向をＺ軸（奥行）、垂直上方向をｙ軸とする。なお、この座標軸はカメラ座標である。

　図７に示すフローに従って実行するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成処理においては、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成する各ボクセルに符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を格納する処理を実行する。

　符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）は図９に示すように、ボクセル２０１と被写体との距離をプラスマイナスの符号付で格納する。プラスマイナスの符号はボクセルが被写体の外側か内側かで決定される。
　デプスカメラから見てボクセル２０１のＺの値が被写体表面のＺの値よりも小さい場合、ボクセル２０１はカメラから見て被写体よりも手前であり、被写体の外側であるため、プラスの符号が与えられる。反対にボクセル２０１のＺの値が被写体表面のＺの値よりも大きい場合はマイナスの符号が与えられる。

　このように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成するボクセルの各々には、被写体とボクセルとの距離が符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）として格納される。
　なお、プラスマイナスの符号と被写体内外の関係はシステム全体で統一されていればよく、被写体の外側をマイナス、被写体の内側をプラスとして表現してもよい。
なお、ボクセルには、さらに、この符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に併せて、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）の信頼度を示す値（信頼度値）も対応付けて格納される。

　信頼度は、例えば、デプスカメラによる各画素単位の赤外光（ＩＲ光）の受光強度に応じた値が設定される。赤外光（ＩＲ光）の受光強度が大きい場合は高信頼度であり、赤外光（ＩＲ光）の受光強度が小さい場合は低信頼度となる。
　例えば、信頼度値の値は、最高信頼度＝１．０、最低信頼度＝０として、１．０～０．０の範囲で設定する。

　上述したように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成するボクセルの各々には、ボクセルと被写体との符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）とその信頼度値（例えば０～１）が格納される。

　図７に示すフローに戻り、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１の実行する処理についての説明を続ける。
　ステップＳ１０１において、ボクセル識別子：ｉの初期値設定、すなわち、
　ｉ＝０
　とするボクセル識別子初期値設定が完了すると、ステップＳ１０２に進む。

　　（ステップＳ１０２）
　ステップＳ１０２では、ｉ番目のボクセルの座標を取得する。
　ここでは、ボクセル座標軸を用いて、ボクセル座標軸上におけるｉ番目のボクセルの座標を取得する。

　ボクセル座標軸は、例えば、図８に示すＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の座標軸ｘ，ｙ，ｚによって構成される座標軸である。
　ステップＳ１０２では、このボクセル座標軸における選択ボクセル（ボクセル識別子＝ｉ）の座標（ｘ，ｙ，ｚ）を取得する。

　　（ステップＳ１０３）
　次に、ステップＳ１０３において、ステップＳ１０２で取得した選択ボクセル（ボクセル識別子＝ｉ）のボクセル座標軸に従った座標（ｘ，ｙ，ｚ）を世界座標に変換する。

　世界座標は、被写体やカメラの存在する実領域に対応する座標軸を持つ座標である。
　この変換処理によって得られる世界座標に従ったボクセル位置（Ｘ，Ｙ，Ｚ）から、同じ世界座標上の被写体とカメラの各位置に対する相対的な位置も算出可能である。

　　（ステップＳ１０４）
　次に、ステップＳ１０３において算出した世界座標に従ったボクセル位置（Ｘ，Ｙ，Ｚ）をカメラ座標に変換する。
　カメラ座標は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１が処理対象としているデプスマップを撮影したデプスカメラの位置を原点とした座標軸に従った座標である。
　例えば図９に示すデプスカメラ２２０上に示す座標軸（ｘ，ｙ，ｚ）に従った座標である。

　先に図９を参照して説明したボクセルに格納する符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）の算出処理は、このカメラ座標を用いて実行することになる。

　　（ステップＳ１０５）
　次に、ステップＳ１０５において、ステップＳ１０２で選択したボクセル（識別子＝ｉ）のカメラ座標におけるボクセル位置と、デプスマップから得られるデプス値（深度（距離））に基づいて、符号付距離値：Ｆ（ｖ）を計算する。
　この処理は、先に図９を参照して説明した処理である。

　先に図９を参照して説明したように、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）は、ボクセルと被写体との距離を符号付で格納した値である。
　ステップＳ１０５では、ステップＳ１０２で選択したボクセル（識別子＝ｉ）に対応する符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を算出する。

　　（ステップＳ１０６）
　次に、ステップＳ１０６において、ステップＳ１０５で算出したボクセル（識別子＝ｉ）に対応する符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に含まれる距離の絶対値を予め規定した閾値と比較し、距離絶対値がしきい値より大きいか否かを判定する。
　距離絶対値がしきい値より大きいと判定した場合は、ステップＳ１０７の処理を行わず、ステップＳ１０８に進む。
　距離絶対値がしきい値より大きくないと判定した場合は、ステップＳ１０７の処理を実行する。

　すなわち、距離絶対値がしきい値より大きいと判定した場合は、ステップＳ１０５で算出した符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を無効値と判断し、ステップＳ１０７でのＦ（ｖ）のボクセルに対する格納処理を行わない。

　この処理は、例えば被写体１の三次元形状の復元に不要な値をボクセルに格納しないための処理である。この一つの具体例は、例えば図１０に示すような場合である。図１０に示すボクセル２０２に対して算出される符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）は、図１０に示すように、被写体１背面の壁とボクセル２０２との距離に対応した距離値を持つことになる。この距離値は、被写体１の三次元形状の復元に不要な値である。図１０に示すような場合、大きな距離値を持つ符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）は無効値と判断し、ボクセルに対する格納を行わない。ただし、図１０に示す例は一例であり、この他、様々な条件の下でＦ（ｖ）のボクセル格納処理要否判定を行うことが可能である。
　なお、閾値は、被写体位置とボクセルの配置されたＴＳＤＦ空間の位置に基づいて、予め規定しておく。

　　（ステップＳ１０７）
　ステップＳ１０６において、ボクセル（識別子＝ｉ）に対応する符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に含まれる距離の絶対値がしきい値より大きくないと判定した場合は、ステップＳ１０７の処理を実行する。

　ステップＳ１０７では、ステップＳ１０５で算出したボクセル（識別子＝ｉ）に対応する符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）をボクセル（識別子＝ｉ）に格納する。

　なお、前述したように、ボクセルには、さらに、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）には併せて信頼度を示す値（信頼度値）も対応付けて格納する。
　信頼度は、例えばデプスカメラによる各画素単位の赤外光（ＩＲ光）の受光強度に応じた値が設定される。赤外光（ＩＲ光）の受光強度が大きい場合は高信頼度であり、赤外光（ＩＲ光）の受光強度が小さい場合は低信頼度となる。
　例えば、信頼度値の値は、最高信頼度＝１．０、最低信頼度＝０として、１．０～０．０の範囲で設定する。

　ステップＳ１０７では、ボクセル（識別子＝ｉ）に符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）とその信頼度値（例えば０～１）を格納する。

　　（ステップＳ１０８～Ｓ１０９）
　ステップＳ１０８は、未処理ボクセルの有無を判定するステップである。ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成するボクセルの全てに対する処理が完了したか否かを判定する。
　未処理ボクセルがある場合は、ステップＳ１０９で、ボクセル識別子：ｉの値を更新し、更新したボクセル識別子を持つボクセルについて、ステップＳ１０２以下の処理を実行する。

　ステップＳ１０８において、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成するボクセルの全てに対する処理が完了したと判定した場合は処理を終了する。

　この図７に示すフローを実行することで、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成するボクセルの各々には、被写体とボクセル間の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）と、その信頼度を示す値（信頼度値）が格納される。

　図５に示す画像処理部１００内のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの各々は、１つのＲＧＢ－Ｄカメラ１０のデプスカメラデータを入力して、図７に示すフローに従った処理を実行する。

　なお、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの各々が使用するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、世界座標上の同じ位置に構成される１つの共通空間である。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの各々は、この１つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に構成された多数のボクセルに、異なる位置のカメラの撮影画像（デプスマップ）に基づいて算出された符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）と、その信頼度を示す値（信頼度値）を格納する。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１に入力される。

　　（２－２．視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部の実行する処理について）
　次に、図５に示す視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１の実行する処理について説明する。

　視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１は、図１に示す複数の異なる位置から被写体１を撮影するＲＧＢ－Ｄカメラ１０が撮影したＲＧＢ画像を含むＲＧＢカメラデータ６０－１～Ｎを入力する。

　なお、ＲＧＢカメラデータ６０－１～Ｎの各々は、それざれ、先に図６を参照して説明したように、
　（ａ）ＲＧＢ画像、
　（ｂ）カメラ内部パラメータ、
　（ｃ）カメラ外部パラメータ、
　これらのデータが含まれる。

　これらのデータを含むＲＧＢカメラデータが、被写体周囲の各カメラから、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１に入力される。

　視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１は、これらの入力データに基づいて視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を実行して、被写体三次元形状（ポリゴンメッシュ）を生成する。

　図１１以下を参照して、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）について説明する。

　図１１には、被写体１の周囲に４台のＲＧＢカメラを示している。各カメラは異なる方向から、被写体１を撮影する。撮影画像は本例では、ＲＧＢカラー画像とするが、白黒画像でも構わない。

　各カメラは、被写体１を特定の方向から撮影することになり、この撮影画像から、特定方向から被写体１を観察したシルエットを取得することができる。

　各カメラの撮影画像から取得されるシルエットの例を図１２に示す。図１２には被写体１をそれぞれ異なる方向から撮影するカメラの撮影画像に基づくシルエットを示している。図１２に示すシルエット１～４である。視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）は被写体を撮影する各ＲＧＢカメラにおける被写体のシルエットのＡＮＤ領域を抽出して保存することで被写体の三次元形状を取得する手法である。

　具体的には、例えば、以下の処理を実行する。
　（処理１）ＲＧＢカメラによって撮影される被写体を含む対象となる空間（Ｖｏｌｕｍｅ）を規定し、空間（Ｖｏｌｕｍｅ）内の各ボクセルの座標を各カメラに投影し、そのボクセルが被写体シルエットの内部か外部かを判定する。
　（処理２）すべてのカメラにおいて被写体内部と判定されたボクセルは被写体形状の内部領域にあると判定し、それ以外は外部と判定し、判定結果に応じたラベルを各ボクセルに設定する。
　（処理３）ラベル付けられた複数のボクセルを有する空間（Ｖｏｌｕｍｅ）に対してマーチングキューブ法を適用して被写体の三次元形状を取得する。
　なお、マーチングキューブ法は、複数のボクセルによって構成されるデータを三次元形状に変換するアルゴリズムである。

　このように、図５に示す画像処理部１００内の視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１は、被写体１を異なる方向から撮影したＲＧＢ画像を適用して視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を実行して、被写体１の被写体三次元形状（ポリゴンメッシュ）を生成する。

　視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１が生成した被写体１の被写体三次元形状（ポリゴンメッシュ）は、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２に入力される。

　　（２－３．ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部の実行する処理について）
　次に、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２が実行する処理について説明する。

　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２は、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１が生成した被写体１の被写体三次元形状（ポリゴンメッシュ）を、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に変換する。

　先に説明したように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、空間内部の多数のボクセルに、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）が格納されたデータ構造である。
　このデータ構造は、被写体の三次元構造（ポリゴンメッシュ）から生成可能である。

　先に図９等を参照して説明したように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内の各ボクセルには、被写体とボクセル間の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）が格納される。

　被写体形状が既知であり、さらに、その被写体を含むＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内の各ボクセルの位置も既知であれば、各ボクセルについての、被写体との距離と、それが被写体の内側か外側かは解析可能である。すなわち符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を算出することができる。

　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２は、このようにして、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１が生成した被写体１の被写体三次元形状（ポリゴンメッシュ）を、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に変換する。

　なお、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の位置（世界座標上の位置）は、先に説明したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成するＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の位置と同じ位置に設定する。すなわち、共通のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を利用する。

　これにより、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内のボクセルの位置は全て、１つの共通ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内の同じ位置になる。

　なお、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の各ボクセルには、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に併せて、あらかじめ規定された信頼度値、例えば信頼度＝０～１．０の設定である場合、中間的な値である信頼度値＝０．５を格納する。

　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１に入力される。

　　（２－４．ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部の実行する処理について）
　次に、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１の実行する処理について説明する。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、以下のデータを入力する。
　（Ａ）　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）
　（Ｂ）　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）

　上記（Ａ）は、Ｎ個のＲＧＢ－Ｄカメラ１０が異なるＮ個の位置から被写体を撮影して得られたＮ個のデプスマップに基づいて生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）である。
　また、（Ｂ）は、Ｎ個のＲＧＢ－Ｄカメラ１０が異なるＮ個の位置から被写体を撮影して得られたＮ個のＲＧＢ画像を適用した視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）で生成した被写体三次元形状（ポリゴンメッシュ）に基づいて生成した１つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）である。

　すなわち、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、Ｎ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を入力する。

　なお、前述したように、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は世界座標上で同一位置にあり、これらＮ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内のボクセルの位置も全て同じ位置にある。

　Ｎ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内のボクセルには、それぞれ異なる符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）とその信頼度値（０～１）が格納されている。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、Ｎ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の同一位置のボクセルに複数の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）が検出された場合、その複数の符号付距離値Ｆ（ｖ）に基づいて、最終的な１つの符号付距離値Ｆ'（ｖ）を算出する。
　例えば各符号付距離値Ｆ（ｖ）に対応付けて記録された信頼度値を適用した重み付け加算を実行して、最終的な１つの符号付距離値Ｆ'（ｖ）を算出する。

　最終的な１つの符号付距離値Ｆ'（ｖ）の具体的な算出式は、例えば以下の（式１）である。

　なお、上記（式１）において、
　ｉは、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の識別子、
　Ｆｉ（ｖ）は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）ｉのボクセルｖにおける符号付距離値、
　ｗｉ（ｖ）は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）ｉのボクセルｖにおける重み値、
　である。

　重み値は、ボクセル毎のＴＳＤＦ値の信頼度（０～１）を適用可能である。
　なお、信頼度は、例えば先に説明した各画素における赤外光（ＩＲ光）の輝度値が利用可能である。また、その他、
　（ａ）被写体表面の法線方向とカメラ位置とのアングル、
　（ｂ）カメラから被写体表面までの距離、
　これらのカメラ配置情報を用いて信頼度を算出し、上記（式１）の重み値として利用してもよい。

　このように、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、Ｎ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の対応ボクセルに格納された符号付距離値Ｆ（ｖ）を用いて、最終的に各ボクセルに１つの符号付距離値Ｆ（ｖ）が格納された１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。
　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１が生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、三次元形状生成部１３２に出力される。

　　（２－５．三次元形状生成部の実行する処理について）
　次に、三次元形状生成部１３２の実行する処理について説明する。

　三次元形状生成部１３２は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１から、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１が生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を入力する。

　三次元形状生成部１３２は、この１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を利用して、被写体の三次元形状を復元する。
　１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルには１つの符号付距離値Ｆ（ｖ）が格納され、この値に基づいて、被写体の三次元構造を復元することができる。

　例えば、ｚｅｒｏ－ｃｒｏｓｓの位置をマーチングキューブ法により抽出することで高精度な被写体の表面形状であるメッシュを取得し、メッシュから構成される被写体の三次元構造を生成することができる。

　なお、先に説明したように、デプスマップでは、黒髪等の領域の深度情報の精度が低く、デプスマップに基づいて生成されるＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルには信頼度の低い符号付距離値Ｆ（ｖ）が格納されてしまい、この値を利用して被写体の三次元形状を復元しようとしても高精度な三次元形状は復元できない。

　本開示の手法では、このような領域についてはＲＧＢ画像に基づいて生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルに格納された符号付距離値Ｆ（ｖ）を適用した三次元形状復元を行うことが可能となり、被写体全体の高精度な三次元形状復元が実現される。

　　［３．本開示の画像処理装置が実行する処理シーケンスについて］
　次に、本開示の画像処理装置２０が実行する処理シーケンスについて説明する。

　図１３に示すフローチャートは、本開示の画像処理装置２０が実行する処理シーケンスについて説明するフローチャートである。
　なお、図１３に示すフローに従った処理は、例えば、画像処理装置２０の記憶部に格納されたプログラムに従って、プログラム実行機能を持つＣＰＵ等の制御の下に実行可能である。

　図１３に示すフローの各ステップの処理について、順次、説明する。
　なお、図１３に示すフローのステップＳ２１１～Ｓ２１３の処理は、図５に示すＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１において実行する処理であり、
　ステップＳ２２１～Ｓ２２３の処理は、図５に示す視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１と、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２において実行する処理である。
　これらステップＳ２１１～Ｓ２１３の処理と、ステップＳ２２１～Ｓ２２３の処理は並列に実行可能な処理である。

　まず、ステップＳ２１１～Ｓ２１３の処理について説明する。
　　（ステップＳ２１１）
　ステップＳ２１１～Ｓ２１３の処理は、図５に示すＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１において実行する処理である。

　まず、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１はステップＳ２１１において、図１に示すＲＧＢ－Ｄカメラ１０各々から、デプスカメラデータを入力する。

　デプスカメラデータには、先に図６を参照して説明した以下のデータが含まれる。
　（ａ）デプスマップ、
　（ｂ）カメラ内部パラメータ、
　（ｃ）カメラ外部パラメータ、

　（ａ）デプスマップは、先に図２を参照して説明したデプスマップであり、カメラからの距離に応じた濃淡値が各画素に設定された画像である。
　（ｂ）カメラ内部パラメータは、デプスマップに基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成処理に必要となるパラメータであり、例えばカメラの焦点距離、光学中心等のカメラ内部パラメータである。
　（ｃ）カメラ外部パラメータも、デプスマップに基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成処理に必要となるパラメータであり、例えばカメラの位置情報、撮影方向情報等のカメラ外部パラメータである。

　　（ステップＳ２１２）
　次に、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１はステップＳ２１２において、デプスカメラデータを入力して、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。

　この処理は、先に図７に示すフローや図８、図９を参照して説明した処理に相当する。具体的には、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を構成する各ボクセルに符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を格納する処理を実行する。
　符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）は、図９に示すように、ボクセル２０１と被写体との距離と、被写体の内側か外側かを示すプラスマイナスの符号を含む値である。

　なお、ボクセルには、さらに、この符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）には併せて信頼度を示す値（信頼度値）も対応付けて格納される。

　　（ステップＳ２１３）
　次のステップＳ２１３は、全てのデプスカメラの取得したデプスマップに基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の生成が完了したか否かの判定処理である。

　未処理のデプスマップがある場合は、未処理のデプスマップについて、ステップＳ２１１～Ｓ２１２の処理を実行する。

　全てのデプスカメラの取得したデプスマップに基づくＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の生成が完了したと判定した場合はステップＳ２３１に進む。
　なお、この時点で、例えばＮ個のテプスカメラがある場合、Ｎ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）が生成されていることになる。

　これらＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルには、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）とその信頼度値が格納されている。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１が、ステップＳ２１１～Ｓ２１３の処理により生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１に入力される。

　　（ステップＳ２２１）
　次に、図５に示す視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１と、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２において実行するステップＳ２２１～Ｓ２２３の処理について説明する。

　まず、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１は、ステップＳ２２１において、図１に示す複数の異なる位置から被写体１を撮影するＲＧＢ－Ｄカメラ１０が撮影したＲＧＢ画像を含むＲＧＢカメラデータ６０－１～Ｎを入力する。

　ＲＧＢカメラデータ６０－１～Ｎの各々は、それざれ、先に図６を参照して説明したように、
　（ａ）ＲＧＢ画像、
　（ｂ）カメラ内部パラメータ、
　（ｃ）カメラ外部パラメータ、
　これらのデータが含まれる。

　　（ステップＳ２２２）
　次に、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１は、ステップＳ２２２において、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を実行して、被写体三次元形状（ポリゴンメッシュ）を生成する。

　この処理は、先に図１１、図１２を参照して説明した処理である。
　具体的には、例えば、以下の処理を実行する。
　（処理１）ＲＧＢカメラによって撮影される被写体を含む対象となる空間（Ｖｏｌｕｍｅ）を規定し、空間（Ｖｏｌｕｍｅ）内の各ボクセルの座標を各カメラに投影し、そのボクセルが被写体シルエットの内部か外部かを判定する。
　（処理２）すべてのカメラにおいて被写体内部と判定されたボクセルは被写体形状の内部領域にあると判定し、それ以外は外部と判定し、判定結果に応じたラベルを各ボクセルに設定する。
　（処理３）ラベル付けられた複数のボクセルを有する空間（Ｖｏｌｕｍｅ）に対してマーチングキューブ法を適用して被写体の三次元形状を取得する。

　　（ステップＳ２２３）
　次に、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２は、ステップＳ２２３において、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２は、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１が生成した被写体１の被写体三次元形状（ポリゴンメッシュ）を、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に変換する。

　なお、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成するＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の各ボクセルには、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に併せて、あらかじめ規定した信頼度値、例えば信頼度＝０～１．０の設定である場合、中間的な値である信頼度値＝０．５を格納する。
　なお、この信頼度値の値は、様々な設定が可能である。

　　（ステップＳ２３１）
　ステップＳ２３１の処理は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１の実行する処理である。

　上記（Ａ），（Ｂ）併せてＮ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）内のボクセルには、それぞれ異なる符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）とその信頼度値（０～１）が格納されたボクセルが存在する。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、Ｎ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の同一位置のボクセルに複数の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）が検出された場合、その複数の符号付距離値Ｆ（ｖ）に基づいて、先に説明した（式１）に従って、最終的な１つの符号付距離値Ｆ'（ｖ）を算出する。

　　（ステップＳ２３２）
　最後のステップＳ２３２の処理は、図５に示す画像処理部１００の三次元形状生成部１３２の実行する処理である。

　三次元形状生成部１３２は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１から、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１が生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を入力する。
　統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルには１つの符号付距離値Ｆ（ｖ）が格納されている。

　三次元形状生成部１３２は、このボクセル格納値に基づいて、全てのボクセルの符号付距離値Ｆ（ｖ）の解析により、被写体の三次元構造を復元することができる。
　例えば、ｚｅｒｏ－ｃｒｏｓｓの位置をマーチングキューブ法により抽出することで高精度な被写体の表面形状であるメッシュを取得し、メッシュから構成される被写体の三次元構造を生成することができる。

　このように、本開示の画像処理装置は、デプスマップに基づいて生成されるＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、ＲＧＢ画像ベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）とを統合した統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、この統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に基づいて被写体の三次元形状を解析して、高精度な被写体の三次元構造データを生成する。

　デプスマップは、黒髪等の領域の深度情報の精度が低く、デプスマップに基づいて生成されるＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルには信頼度の低い符号付距離値Ｆ（ｖ）が格納されてしまい、この値を利用して被写体の三次元形状を復元しようとしても高精度な形状は復元できない。

　しかし、本開示の手法では、このような領域についてはＲＧＢ画像に基づいて生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルに格納された符号付距離値Ｆ（ｖ）を適用した三次元形状復元が可能となり、被写体全体の高精度な三次元形状復元が実現される。

　　［４．本開示の処理を適用して得られる被写体の三次元構造データの具体例について］
　次に、本開示の処理を適用して得られる被写体の三次元構造データの具体例について説明する。

　図１４は、本開示の画像処理装置が実行する処理に従って生成されるデータの具体例を説明する図である。
　まず、被写体を様々な方向から撮影するＲＧＢ－Ｄカメラから、図１４に示すデプスマップ２７０と、ＲＧＢ画像２８０が取得される。
　なお、図１４に示すデプスマップ２７０と、ＲＧＢ画像２８０は被写体を様々な方向から撮影したＮ枚のデプスマップとＮ枚のＲＧＢ画像である。

　Ｎ枚のデプスマップ２７０は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１に入力され、各デプスマップ対応のＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２７１を生成する。

　このＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２１１に基づいて生成される被写体三次元構造の例が図１４に示す三次元構造データ２７２である。
　この三次元構造データ２７２は、デプスマップのみを用いて生成されているため、低精度なデプス値が設定された領域、例えば黒髪領域は三次元構造が復元できない不完全な三次元構造データとなってしまう。
　この図１４に示す三次元構造データ２７２は、本開示の処理を適用しない場合のデータ例である。

　次に、本開示の処理を適用した場合の処理について説明する。
　ＲＧＢ画像２８１は、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部１２１に入力され、まず、図１４に示すシルエット２８１が生成される。
　これは、先に図１１、図１２を参照して説明した処理である。

　さらに、このシルエット２８１に基づいて視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）により被写体三次元形状（ポリゴンメッシュ）２８２が生成される。

　さらに、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２が、被写体三次元形状（ポリゴンメッシュ）２８２に基づいて、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２８３を生成する。

　次に、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１が、以下のデータを入力する。
　（Ａ）　各デプスマップ対応のＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２７１
　（Ｂ）　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２８３、

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、これらの複数のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を合成して、１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２９１を生成する。

　最後に、三次元形状生成部１３２が、１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）２９１に基づいて、被写体の三次元構造データ２９２を生成する。

　図１４に示す被写体の三次元構造データ２９２は、デプスマップに基づいて生成されるＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、ＲＧＢ画像ベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）とを統合した統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に基づいて生成される三次元構造データである。

　デプスマップに基づいて生成されるＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルには精度の低い符号付距離値Ｆ（ｖ）が格納されているボクセルが存在するが、本開示の処理を適用することで、このようなボクセルについては、ＲＧＢ画像ベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の符号付距離値Ｆ（ｖ）を利用することが可能となる。
　結果として被写体の高精度な三次元構造データを生成することができる。

　　［５．その他の実施例について］
　次に、本開示の画像処理装置のその他の実施例（変形例）について説明する。

　　（５－１．変形例１）
　上述した実施例では、先に図１を参照して説明したように、被写体の周囲に複数のカメラを配置して、複数のカメラによって撮影された画像を利用して処理を行う構成としていた。

　このように複数のカメラを用いず、１台のカメラのみを利用する構成としてもよい。例えば図１５に示すように、１台のＲＧＢ－Ｄカメラ１０を、被写体１の周囲を移動しながら画像（ＲＧＢ画像、デプスマップ）を順次、撮影する構成としてもよい。

　ただし、この方法の場合、各時刻の撮影フレームに対応するカメラの位置や姿勢を取得する必要がある。この各時点におけるカメラの位置、姿勢取得処理には、既存の手法、例えば、ＫｉｎｅｃｔＦｕｓｉｏｎやＶｉｓｕａｌ　ＳＬＡＭ等の方法、あるいはＳｔｒｕｃｔｕｒｅ　Ｆｒｏｍ　Ｍｏｔｉｏｎなどの方法を用いることが可能である。

　　（５－２．変形例２）
　さらに、図１６に示すように、１台の固定されたＲＧＢ－Ｄカメラ１０の前で被写体１を回転移動させながら被写体を連続撮影することで、異なる位置からの被写体画像（ＲＧＢ画像、デプスマップ）を順次、撮影する構成としてもよい。

　例えば、被写体１をターンテーブル上で回転運動させる。この場合、カメラの位置、姿勢取得処理には、上記の変形例１と同様、Ｖｉｓｕａｌ　ＳＬＡＭ等に代表される方法を利用することが可能である。

　被写体１の運動が非剛体運動である場合にも、既存の手法、例えば「ＤｙｎａｍｉｃＦｕｓｉｏｎ」等の方法を適用して、各映像フレームにおける非剛体運動をパラメトリックに表現するＷａｒｐ－Ｆｉｅｌｄの推定を組み合わせることで、カメラの位置、姿勢を推定することが可能である。

　　（５－３．変形例３）
　さらに、本開示の画像処理装置の変形例として、先に説明した視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の生成処理の計算量を削減する構成が可能である。

　すなわち、先に説明した視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）については、全てのボクセルの符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を算出せず、デプスマップから取得されるデプス値の信頼度が低い領域に対応するボクセルのみを選択して、符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を算出する構成としてもよい。

　デプスマップのデプス値の信頼度は、先に説明したように赤外光（ＩＲ光）の輝度値の高低によって判定可能である。赤外光（ＩＲ光）の輝度値の低いピクセルのデプス値は信頼度が低いと判定する。

　このようなデプス値の信頼度が低い領域に対応するボクセルのみを、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）から選択し、これらの選択ボクセルのみに符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を算出する構成としてもよい。

　　（５－４．変形例４）
　また、予め、デプスマップのデプス値の信頼度が低い被写体領域が推定できる場合には、その被写体領域に対応するボクセルのみを、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）算出対象のボクセルとしてもよい。

　例えば、三次元形状復元対象が人間である場合、頭部（髪の毛）の領域がデプスマップのデプス値の信頼度が低い領域と推定できる。この場合には、この被写体の髪の毛の領域に対応するボクセルのみを、視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）算出対象のボクセルとする。

　　（５－５．変形例５）
　先に説明した実施例では、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１は、以下の処理を実行していた。

　すなわち、
　（Ａ）　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）
　（Ｂ）　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）
　これら、Ｎ＋１個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の同一位置のボクセルに複数の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）が検出された場合、その複数の符号付距離値Ｆ（ｖ）に基づいて、最終的な１つの符号付距離値Ｆ'（ｖ）を、前述の（式１）に従って算出していた。

　さらに、この符号付距離値Ｆ'（ｖ）を持つ１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成して、この１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に基づいて三次元形状を復元する処理を行う構成であった。

　しかし、
　（Ａ）　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）
　（Ｂ）　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）
　これら（Ａ），（Ｂ）の最適な合成比率は、被写体に応じて異なることが予想される。

　以下に説明する変形例は、ユーザが重み係数を入力、変更可能な構成とし、ユーザの設定値に応じて生成される三次元構造データを表示部に表示する構成を有する。

　ユーザは、表示部に表示される様々な合成比率に応じた三次元構造データを観察して、最適な三次元構造データを選択して、その表示データが表示された時点の合成比率を最適値と判定し、例えばその三次元構造データを合成比率の値とともに記憶部に格納するといった処理を行うことが可能となる。

　本実施例の画像処理装置の構成例を図１７に示す。
　図１７は、先に図５を参照して説明した画像処理部１００の内部構成を一部変更し、さらに、重み係数入力部４０１と表示部４５０を追加した構成である。

　画像処理部１００の内部構成の変更点は、以下の通りである。
　（１）デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１の追加。
　（２）ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２を、
　デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１の生成した１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、
　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を入力する構成への変更。

　（３）ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２に、重み係数入力部４０１からユーザが入力する重み係数α４２１を入力可能とした点。
　（４）三次元形状生成部１３２の生成した被写体の三次元構造データを表示部４５０に出力する構成とした点。

　まず、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の統合処理を実行して、１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。

　この１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の生成処理は、先の図５に示す構成を持つ実施例で説明したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部１３１において実行した統合処理と同様の処理で実行可能である。
　すなわち、各対応ボクセルの符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）の信頼度値に基づく重み付け加算で各ボクセルに１つの符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を設定した１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。
　ただし、ここで統合処理対象となるのは、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のみであるる

　このように、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１１１－１～Ｎの生成したＮ個のＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の統合処理を実行して、１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。
　生成した１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２に入力される。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２は、
　（Ａ）デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１の生成した１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）、
　（Ｂ）ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）、
　これら２つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を入力し、これら２つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を合成する。

　この２つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の合成比率に相当する重み係数（α）は、重み係数入力部４０１を介してユーザが入力し、随時、変更可能である。
　図１７に示すように、ユーザは、重み係数入力部４０１を介して、重み係数（α）４２１を、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２に入力することができる。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２は、ユーザが入力した重み係数（α）４２１に従って、
　（Ａ）デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１の生成した１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）、
　（Ｂ）ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）、
　これら２つのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の合成処理を実行して、１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する。

　具体的には、例えば、以下に示す（式２）に従って、統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の各ボクセルに格納する符号付距離値Ｆ'（ｖ）を算出する。

　なお、上記（式２）において、
　Ｆ_{ｖｉｓｕａｌＨｕｌｌ}（ｖ）は、ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部１２２の生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルに格納された符号付距離値、
　Ｆ_{Ｄｅｐｔｈ}（ｖ）は、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１１の生成した１つのデプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のボクセルに格納された符号付距離値、
　αは、重み係数αであり、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２の生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に含まれる、ポリゴンメッシュベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の比率に相当する。

　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２の生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）は三次元形状生成部１３２に入力される。
　三次元形状生成部１３２は、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２の生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に基づいて、被写体の三次元構造データを生成し、生成した被写体の三次元構造データを表示部４５０に出力して表示する。

　ユーザは、表示部４５０に表示された被写体の三次元構造データを観察しながら、重み係数（α）を変更することが可能であり、高品質な三次元構造データが表示された時点で、重み係数（α）の変更を停止し、その三次元構造データを重み係数（α）とともに記憶部に格納することができる。

　図１８に、重み係数（α）の変更に伴って表示部４５０に表示される三次元構造データの具体例を示す。
　図１８には、
　（Ａ）重み係数α＝０．０の設定の三次元構造データ
　（Ｂ）重み係数α＝０．５の設定の三次元構造データ
　（Ｃ）重み係数α＝１．０の設定の三次元構造データ
　これら３種類の表示データの例を示している。

　なお、重み係数αは、ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部３１２の生成した１つの統合ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）に含まれる、ポリゴンメッシュベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の比率に相当する。

　（Ａ）重み係数α＝０．０の設定の三次元構造データは、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のみに基づいて生成された三次元構造データである。
　（Ｃ）重み係数α＝１．０の設定の三次元構造データは、ＲＧＢ画像に基づくポリゴンメッシュベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のみに基づいて生成された三次元構造データである。

　（Ｂ）重み係数α＝０．５の設定の三次元構造データは、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）と、ＲＧＢ画像に基づくポリゴンメッシュベースのＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）の合成比率を１：１として生成したＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）のみに基づいて生成された三次元構造データである。

　このように、ユーザは、表示部４５０に表示される様々な重み係数αの値に応じた三次元構造データを観察して、最適な三次元構造データを選択して、その表示データが表示された時点の重み係数αを最適値と判定し、例えばその三次元構造データを、重み係数（α）の値とともに記憶部に格納するといった処理を行うことができる。

　　［６．画像処理装置のハードウェア構成例について］
　次に、図１９を参照して本開示の画像処理装置のハードウェア構成例について説明する。
　本開示の画像処理装置は、例えば、具体的には、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）等の情報処理装置によって構成することが可能である。

　図１９に示すように画像処理装置５００は、コントローラ５０１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）５０２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）５０３、入出力インタフェース５０５、および、これらを互いに接続するバス５０４を備える。

　コントローラ５０１は、必要に応じてＲＡＭ５０３等に適宜アクセスし、各種演算処理を行いながら画像処理装置５００の各ブロック全体を統括的に制御する。コントローラ５０１は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等であってもよい。ＲＯＭ５０２は、ＣＰＵ５０１に実行させるＯＳ、プログラムや各種パラメータなどのファームウェアが固定的に記憶されている不揮発性のメモリである。ＲＡＭ５０３は、ＣＰＵ５０１の作業用領域等として用いられ、ＯＳ、実行中の各種アプリケーション、処理中の各種データを一時的に保持する。

　入出力インタフェース５０５には、入力部５０６、出力部５０７、記憶部５０８、通信部５０９、および、リムーバブルメディア５１１を装着可能なドライブ５１０等が接続される。
　なお、入出力インタフェース５０５は、これらの各要素の他、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）端子やＩＥＥＥ端子等を介して外部周辺機器と接続可能に構成されてもよい。

　入力部５０６は、例えば、図１に示すＲＧＢ－Ｄカメラ１０の撮影画像（ＲＧＢ画像、デプスマップ）等を入力し、さらにユーザの操作情報等を入力可能な入力部である。入力部５０６が撮像部を有する構成としてもよい。
　入力部５０６には、例えばマウス等のポインティングデバイス、キーボード、タッチパネル、その他の入力装置も含まれる。
　出力部５０７は、画像、音声等のデータ出力を行う。出力部５０７が表示部を有する構成としてもよい。

　記憶部５０８は、例えばＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）や、フラッシュメモリ（ＳＳＤ；Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、その他の固体メモリ等の不揮発性メモリである。記憶部５０８には、ＯＳや各種アプリケーション、各種データが記憶される。記憶部５０８は、また、入力画像や、画像情報、生成した出力画像群等の記憶領域としても利用される。

　通信部５０９は、例えばＥｔｈｅｒｎｅｔ（登録商標）用のＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）であり、ネットワークを介した通信処理を担う。

　ドライブ５１０は、リムーバブルメディア５１１を利用したデータ記録、再生処理に利用される。
　リムーバブルメディア５１１は、例えばＢＤ、ＤＶＤ、ＣＤ、ＨＤＤ、フラッシュメモリ等によって構成される。

　　［７．本開示の構成のまとめ］
　以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。

　なお、本明細書において開示した技術は、以下のような構成をとることができる。
　（１）　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記画像処理部は、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成し、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する画像処理装置。

　（２）　前記画像処理部は、
　視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用して、前記可視光カメラの撮影画像から、前記被写体の三次元形状（ポリゴンメッシュ）を生成し、生成した前記三次元形状（ポリゴンメッシュ）を利用して、前記可視光画像ベースＴＳＤＦ空間を生成する（１）に記載の画像処理装置。

　（３）　前記画像処理部は、
　前記被写体を複数の異なる方向から撮影した複数の可視光カメラ撮影画像から取得される複数のシルエットの交差領域を検出して前記被写体の三次元形状（ポリゴンメッシュ）を生成する（２）に記載の画像処理装置。

　（４）　前記画像処理部は、
　前記被写体を複数の異なる方向からデプスカメラによって撮影した撮影画像から取得される複数のデプスマップを利用して、複数のデプスマップベースＴＳＤＦ空間を生成し、
　複数のデプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、前記統合ＴＳＤＦ空間を生成する（１）～（３）いすれかに記載の画像処理装置。

　（５）　前記画像処理部は、
　前記デプスマップベースＴＳＤＦ空間、および前記可視光画像ベースＴＳＤＦ空間の各ＴＳＤＦ空間を構成するボクセルに、前記被写体とボクセル間の距離情報を含む符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を格納したＴＳＤＦ空間を生成する（１）～（４）いすれかに記載の画像処理装置。

　（６）　前記画像処理部は、
　前記デプスマップベースＴＳＤＦ空間、および前記可視光画像ベースＴＳＤＦ空間各々のボクセル内の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）の重み付け加算を実行して算出した値を、前記統合ＴＳＤＦ空間のボクセルに格納する（５）に記載の画像処理装置。

　（７）　前記画像処理部は、
　前記重み付け加算に適用する重み値として、
　前記デプスマップベースＴＳＤＦ空間のボクセル内の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に対応付けて記録される信頼度値を適用する（６）に記載の画像処理装置。

　（８）　前記デプスカメラは赤外光を利用したデプスマップ生成処理を行う構成であり、
　前記信頼度値は、前記デプスカメラの撮影画像の画素値に応じた値である（７）に記載の画像処理装置。

　（９）　前記画像処理部は、
　前記被写体の周囲に配置された複数のカメラによって撮影された異なる方向からの被写体画像を入力して、前記被写体の三次元形状解析処理を実行する（１）～（８）いすれかに記載の画像処理装置。

　（１０）　前記画像処理部は、
　前記被写体の周囲を移動するカメラによって撮影された異なる方向からの被写体画像を入力して、前記被写体の三次元形状解析処理を実行する（１）～（８）いすれかに記載の画像処理装置。

　（１１）　前記画像処理部は、
　回転移動する前記被写体を撮影する固定カメラによって撮影された異なる方向からの被写体画像を入力して、前記被写体の三次元形状解析処理を実行する（１）～（８）いすれかに記載の画像処理装置。

　（１２）　前記画像処理装置は、さらに、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理に適用する重み係数を入力する入力部を有し、
　前記画像処理部は、
　前記入力部を介して入力される重み係数に応じて、前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間とを統合して前記統合ＴＳＤＦ空間を生成する（１）～（１１）いすれかに記載の画像処理装置。

　（１３）　前記画像処理装置は、さらに、
　前記画像処理部が生成した前記被写体の三次元構造データを表示する表示部を有し、
　前記画像処理部は、
　前記入力部を介して入力された前記重み係数に応じて変更される三次元構造データを前記表示部に表示する（１２）に記載の画像処理装置。

　（１４）　画像処理装置において実行する画像処理方法であり、
　前記画像処理装置は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記画像処理部が、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成し、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する画像処理方法。

　（１５）　画像処理装置において画像処理を実行させるプログラムであり、
　前記画像処理装置は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記プログラムは、前記画像処理部に、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する処理と、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成する処理と、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成する処理と、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する処理を実行させるプログラム。

　なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。

　また、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　以上、説明したように、本開示の一実施例の構成によれば、デプスカメラと、可視光カメラの撮影画像を入力して、被写体の高精度な三次元形状を解析、復元する構成が実現される。
　具体的には、例えば、デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有する。画像処理部は、デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成する。さらに、デプスマップベースＴＳＤＦ空間と、可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、統合ＴＳＤＦ空間を利用して、被写体の三次元形状解析処理を実行する。
　本構成により、デプスカメラと、可視光カメラの撮影画像を入力して、被写体の高精度な三次元形状を解析、復元する構成が実現される。

　　　１　被写体
　　１０　ＲＧＢ－Ｄカメラ
　　２０　画像処理装置
　　５０　入力部
　１００　画像処理部
　１１１　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部
　１２１　視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）ベース三次元形状（ポリゴンメッシュ）生成部
　１２２　ポリゴンメッシュベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）生成部
　１３１　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部
　１３２　三次元形状生成部
　３００　画像処理部
　３１１　デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部
　３１２　ＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）統合部
　４０１　重み係数入力部
　４５０　表示部
　５００　画像処理装置
　５０１　コントローラ
　５０２　ＲＯＭ
　５０３　ＲＡＭ
　５０４　バス
　５０５　入出力インタフェース
　５０６　入力部
　５０７　出力部
　５０８　記憶部
　５０９　通信部
　５１０　ドライブ
　５１１　リムーバブルメディア

Claims

　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記画像処理部は、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成し、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する画像処理装置。
　前記画像処理部は、
　視体積交差法（Ｖｉｓｕａｌ　Ｈｕｌｌ）を適用して、前記可視光カメラの撮影画像から、前記被写体の三次元形状（ポリゴンメッシュ）を生成し、生成した前記三次元形状（ポリゴンメッシュ）を利用して、前記可視光画像ベースＴＳＤＦ空間を生成する請求項１に記載の画像処理装置。
　前記画像処理部は、
　前記被写体を複数の異なる方向から撮影した複数の可視光カメラ撮影画像から取得される複数のシルエットの交差領域を検出して前記被写体の三次元形状（ポリゴンメッシュ）を生成する請求項２に記載の画像処理装置。
　前記画像処理部は、
　前記被写体を複数の異なる方向からデプスカメラによって撮影した撮影画像から取得される複数のデプスマップを利用して、複数のデプスマップベースＴＳＤＦ空間を生成し、
　複数のデプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、前記統合ＴＳＤＦ空間を生成する請求項１に記載の画像処理装置。
　前記画像処理部は、
　前記デプスマップベースＴＳＤＦ空間、および前記可視光画像ベースＴＳＤＦ空間の各ＴＳＤＦ空間を構成するボクセルに、前記被写体とボクセル間の距離情報を含む符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）を格納したＴＳＤＦ空間を生成する請求項１に記載の画像処理装置。
　前記画像処理部は、
　前記デプスマップベースＴＳＤＦ空間、および前記可視光画像ベースＴＳＤＦ空間各々のボクセル内の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）の重み付け加算を実行して算出した値を、前記統合ＴＳＤＦ空間のボクセルに格納する請求項５に記載の画像処理装置。
　前記画像処理部は、
　前記重み付け加算に適用する重み値として、
　前記デプスマップベースＴＳＤＦ空間のボクセル内の符号付距離値Ｆ（ｖ）（ＴＳＤＦ値）に対応付けて記録される信頼度値を適用する請求項６に記載の画像処理装置。
　前記デプスカメラは赤外光を利用したデプスマップ生成処理を行う構成であり、
　前記信頼度値は、前記デプスカメラの撮影画像の画素値に応じた値である請求項７に記載の画像処理装置。
　前記画像処理部は、
　前記被写体の周囲に配置された複数のカメラによって撮影された異なる方向からの被写体画像を入力して、前記被写体の三次元形状解析処理を実行する請求項１に記載の画像処理装置。
　前記画像処理部は、
　前記被写体の周囲を移動するカメラによって撮影された異なる方向からの被写体画像を入力して、前記被写体の三次元形状解析処理を実行する請求項１に記載の画像処理装置。
　前記画像処理部は、
　回転移動する前記被写体を撮影する固定カメラによって撮影された異なる方向からの被写体画像を入力して、前記被写体の三次元形状解析処理を実行する請求項１に記載の画像処理装置。
　前記画像処理装置は、さらに、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理に適用する重み係数を入力する入力部を有し、
　前記画像処理部は、
　前記入力部を介して入力される重み係数に応じて、前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間とを統合して前記統合ＴＳＤＦ空間を生成する請求項１に記載の画像処理装置。
　前記画像処理装置は、さらに、
　前記画像処理部が生成した前記被写体の三次元構造データを表示する表示部を有し、
　前記画像処理部は、
　前記入力部を介して入力された前記重み係数に応じて変更される三次元構造データを前記表示部に表示する請求項１２に記載の画像処理装置。
　画像処理装置において実行する画像処理方法であり、
　前記画像処理装置は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記画像処理部が、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成し、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成し、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成し、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する画像処理方法。
　画像処理装置において画像処理を実行させるプログラムであり、
　前記画像処理装置は、
　デプスカメラと、可視光カメラの撮影画像を入力して、被写体の三次元形状を解析する画像処理部を有し、
　前記プログラムは、前記画像処理部に、
　前記デプスカメラの撮影画像から取得されるデプスマップを利用して、デプスマップベースＴＳＤＦ空間（ＴＳＤＦ　Ｖｏｌｕｍｅ）を生成する処理と、
　前記可視光カメラの撮影画像を利用して、可視光画像ベースＴＳＤＦ空間を生成する処理と、
　前記デプスマップベースＴＳＤＦ空間と、前記可視光画像ベースＴＳＤＦ空間との統合処理によって、統合ＴＳＤＦ空間を生成する処理と、
　前記統合ＴＳＤＦ空間を利用して、前記被写体の三次元形状解析処理を実行する処理を実行させるプログラム。