JP7032179B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP7032179B2
JP7032179B2 JP2018038789A JP2018038789A JP7032179B2 JP 7032179 B2 JP7032179 B2 JP 7032179B2 JP 2018038789 A JP2018038789 A JP 2018038789A JP 2018038789 A JP2018038789 A JP 2018038789A JP 7032179 B2 JP7032179 B2 JP 7032179B2
Authority
JP
Japan
Prior art keywords
image data
image
image processing
marker
calibration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018038789A
Other languages
English (en)
Other versions
JP2018120604A (ja
Inventor
竜基 坂本
進一 東野
紗記子 西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018038789A priority Critical patent/JP7032179B2/ja
Publication of JP2018120604A publication Critical patent/JP2018120604A/ja
Application granted granted Critical
Publication of JP7032179B2 publication Critical patent/JP7032179B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
従来、タイムスライス(Time Slice)やバレットタイム(Bullet Time)等と呼ばれる撮影技術が知られている。この撮影技術では、複数の撮像装置(例えば、カメラ)が撮像対象(例えば、人間などの被写体)の周囲に配置される。このとき、複数の撮像装置は、各撮像装置の光軸が撮像対象における所定の位置を通過するように配置され、被写体を撮像する。かかる撮影技術により撮像された画像データを結合することで生成される画像は、自由視点画像等と呼ばれる。ユーザは、自由視点画像において任意の視点を選択することが可能であり、様々な角度から被写体を視認することができる。例えば、自由視点画像は、販促などに用いられた場合に、通常の画像よりも高い販促効果を発揮することがある。
なお、被写体の撮影に関して、特徴点であるマーカーが印刷されたシート上で被写体を撮影することで、被写体を認識する技術が知られている(例えば、特許文献1)。従来技術に係る文献では、マーカーにマーカー自体に関する情報である特徴点表示媒体情報を記録しておき、画像認識でそれを特定することにより、マーカーの使用できる条件を自由に変更出来る旨が開示されている。なお、自由視点画像に関する技術として、自由視点画像の生成処理の手法等が開示されている(例えば、特許文献2及び3)。
特開2007-286715号公報 特開2014-239384号公報 特開2015-127903号公報
しかしながら、上記の従来技術(特許文献1)では、一般ユーザに自由視点画像を有効に活用させることは困難であった。具体的には、上記の特許文献1に係る従来技術は、一つの被写体を一つの角度で撮影する場合に被写体を認識する技術である。すなわち、自由視点画像の生成のために、一つの被写体を様々な角度で撮影する場合には、上記の特許文献1に係る従来技術を適用することは難しい。このため、上記の特許文献1に係る従来技術では、例えば、一般ユーザが容易に自由視点画像を生成したり、生成した自由視点画像を第三者に閲覧させたりといった、自由視点画像の活用を促進させることが難しい。
本願の開示する技術は、上記に鑑みてなされたものであって、一般ユーザに自由視点画像を有効に活用させることができる画像処理装置、画像処理方法及び画像処理プログラムを提供することを目的とする。
本願に係る画像処理装置は、視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能であるマーカーが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける受付部と、前記受付部によって受け付けられた複数の画像データの各々において、当該マーカーが有するパラメータを用いて推定される平面情報と当該平面情報に対応する平面に含まれる当該マーカーの位置情報とに基づいて算出される、当該画像データを撮像した撮像装置と当該マーカーとの回転角及び平行移動量から、当該複数の画像データを撮像した各々の撮像装置のカメラパラメータを導出する校正を行う校正部と、前記校正部によって導出されたカメラパラメータに基づき算出される射影変換行列を用いて、前記複数の画像データに射影変換を行うことにより、前記複数の画像データをそれぞれ変換後画像データに変換し、変換された前記変換後画像データに基づいて、複数の視点位置に対応する画像を滑らかに遷移させて表示可能である自由視点画像を生成する生成部と、を備え、前記受付部は、各画像データ内に複数のマーカーが含まれる前記複数の画像データを受け付け、前記校正部は、前記パラメータとして、前記複数のマーカーの各々の位置情報の対応関係に基づいて、当該複数の画像データに関する校正を行うことを特徴とする。
実施形態の一態様である画像処理装置によれば、一般ユーザに自由視点画像を有効に活用させることができるという効果を奏する。
図1は、実施形態に係る画像処理の一例を示す図である。 図2は、実施形態に係る画像処理装置の構成例を示す図である。 図3は、実施形態に係る画像データ記憶部の一例を示す図である。 図4は、実施形態に係る自由視点画像記憶部の一例を示す図である。 図5は、自由視点画像に関する撮像装置の理想的な配置の一例を示す図である。 図6は、実施形態に係る自由視点画像に関する撮像処理の一例を示す図である。 図7は、実施形態に係る自由視点画像に関する撮像装置の配置の一例を示す図である。 図8は、実施形態に係る画像処理装置が利用するマーカーを説明するための図(1)である。 図9は、実施形態に係る画像処理装置が利用するマーカーを説明するための図(2)である。 図10は、実施形態に係る生成部による生成処理の一例を示す図である。 図11は、実施形態に係る画像処理手順を示すフローチャートである。 図12は、画像処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る画像処理装置、画像処理方法及び画像処理プログラムの実施形態を図面に基づいて詳細に説明する。なお、この実施形態により本願に係る画像処理装置、画像処理方法及び画像処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.画像処理の一例〕
まず、図1を用いて、実施形態に係る画像処理の一例について説明する。図1は、実施形態に係る画像処理の一例を示す図である。図1に示すように、実施形態に係る画像処理システム1には、ユーザ端末10と、画像処理装置100とが含まれる。ユーザ端末10と画像処理装置100とは、図示しないネットワークN(例えば、インターネット)を介して互いに通信可能に接続される。なお、画像処理システム1に含まれる各装置の台数は、図1に示した例に限られない。例えば、画像処理システム1には、複数台のユーザ端末10が含まれてもよい。
ユーザ端末10は、自由視点画像の生成を画像処理装置100に要求するユーザによって利用される情報処理装置である。例えば、ユーザ端末10は、デスクトップ型PC(Personal Computer)や、ノート型PC、スマートフォン等の携帯電話機、PDA(Personal Digital Assistant)、タブレット端末等により実現される。なお、以下では、ユーザとユーザ端末10とを同一視する場合がある。例えば、「ユーザに自由視点画像を配信する」とは、実際には、「ユーザが利用するユーザ端末10に自由視点画像を配信する」ことを意味する場合がある。
実施形態において、ユーザ端末10を利用するユーザは、例えば、自身が所有する商品をオークションサイト等に出品する出品者である。ユーザは、商品を被写体として様々な角度から撮影を行い、複数の画像データを取得する。続いて、ユーザは、ユーザ端末10を介して、複数の画像データを画像処理装置100に送信する。そして、ユーザは、複数の画像データに基づいて生成される自由視点画像を画像処理装置100から取得する。ユーザは、例えば、商品を紹介するための情報の一つとして自由視点画像を用いて、オークションサイト等に出品する。
画像処理装置100は、任意の視点位置に対応する画像を連続的に表示可能な画像である自由視点画像を生成するサーバ装置である。具体的には、実施形態に係る画像処理装置100は、自由視点画像の配信を所望するユーザから複数の画像データの入稿を受け付け、受け付けた複数の画像データから自由視点画像を生成する。そして、画像処理装置100は、生成した自由視点画像をユーザ端末10に配信する。
画像処理装置100は、ユーザ端末10から入稿される元画像データに所定の変換処理を行うことにより、自由視点画像を生成する。画像処理装置100は、多視点から撮像された複数の画像を、3次元位置のある一点で各撮像装置(カメラ)の光軸が重なった状態で撮影されたかのような画像である自由視点画像へ変換するため、射影変換行列を導出する。この場合、画像処理装置100は、各画像を撮像する撮像装置のパラメータとして、撮像装置の位置姿勢を含むカメラパラメータを参照する。言い換えれば、自由視点画像の生成においては、各画像データが取得される際の撮像装置が強校正されていることが望ましい。
カメラパラメータが特定できない場合に、撮像された画像データに基づいて、カメラパラメータを推定する既知の手法も知られている。しかし、業務用の機材や設備を用いて撮像が行われない場合、既知の手法では、正確なカメラパラメータの推定を高精度で行うことができず、自由視点画像の生成において不具合が生じることがある。例えば、オークションサイトに出品する商品を紹介するような目的で撮像される画像は、出品者自身によって撮像される機会が多く、専門の撮影業者等によって撮像が行われる機会は少ない。このため、既知の手法では、自由視点画像の元となる画像データに関してカメラパラメータを高精度に推定することが困難な場合がある。
そこで、実施形態に係る画像処理装置100は、画像データに含まれるビジュアルマーカー(以下、単に「マーカー」と表記する)を利用して、入稿された複数の画像データに関して所定の校正(カメラキャリブレーション)を行う。マーカーは、各々が識別可能なように描画された図形を用いる。なお、画像処理装置100は、マーカーを用いる場合、画像内のマーカーと撮像装置との回転角Rと平行移動量Tを求めることで、校正処理を行うことができる。これにより、画像処理装置100は、元の画像から自由視点画像を構成するための画像に射影変換するための適切なパラメータ(例えば、射影変換行列)を取得する。そして、画像処理装置100は、射影変換された画像を連結することにより、複数の画像について滑らかに表示を遷移させることのできる自由視点画像を生成する。以下、画像処理装置100が行う画像処理について、流れに沿って説明する。
まず、ユーザは、自由視点画像を生成するための元となる画像データを準備する。このとき、ユーザは、被写体とともに、マーカーを画像内に含むような複数の画像データを準備するものとする(ステップS11)。ユーザは、マーカーの一例として、用紙(シート)に描かれた円を利用することができる。具体的には、ユーザは、画像処理装置100から提供されるシートであって、所定の円が4隅に描かれたシート70を準備する。例えば、ユーザは、ネットワークNを介してシート70の画像データを取得する。そして、ユーザは、シート70の画像データを所定の用紙(例えば、A4サイズの紙など)にプリントアウトすることで、シート70を取得する。
シート70には、円で示される円マーカーM01、M02、M03及びM04が描かれる。円マーカーとして採用される円は、円周上の任意の点から中心までの距離が等しい正円であるものとする。また、画像処理装置100は、円マーカーM01、M02、M03及びM04のシート70上における位置関係(例えば、座標上の関係性)に係る情報を有しているものとする。また、円マーカーは、一つの円としてではなく、黒色で描かれる外円と、内側の白色部分で描かれる内円という、二つの同心円として認識される。
また、円マーカーM01、M02、M03及びM04は、画像処理装置100が認識可能な程度に、異なるサイズを有しているものとする。このため、画像処理装置100は、画像データに二つの円マーカーが含まれている場合、射影変換後の正しい円のサイズを照らすことにより、円マーカーを識別可能である。また、詳細は後述するが、画像処理装置100は、外円と内円の円周の比率を用いることで、円マーカーM01、M02、M03及びM04をそれぞれ識別するようにしてもよい。この場合、画像処理装置100は、画像データに一つの円マーカーしか含まれていない場合であっても、円マーカーを識別することができる。
ユーザは、シート70の中央に被写体60を乗せて、様々な角度から撮像を行う。例えば、ユーザは、ユーザ端末10の撮像機能を用いて、被写体60を撮像する。あるいは、ユーザは、デジタルカメラ等、撮像によって画像データを取得することが可能な機器を用いて被写体60を撮像する。そして、ユーザは、撮像によって取得した画像データをユーザ端末10に格納する。
このようにして、ユーザは、シート70に乗せられた状態で撮像された被写体60の画像データを複数準備する。図1に示すように、ユーザは、被写体60を取り囲むようにして撮像された元画像データP01、P02、P03、・・・、P0N(Nは任意の数)を準備する。図1に示す例では、元画像データP01は、被写体60を右側から撮像した画像である。また、元画像データP02は、被写体60を右斜め前から撮像した画像である。また、元画像データP03は、元画像データP02と比較して、被写体60を正面側に近い右斜め前側から撮像した画像である。このように、元画像データP01~P0Nは、例えば、被写体60を半円状に取り囲むようにして順番に撮像された画像データである。
上述のように、シート70には、円マーカーM01、M02、M03及びM04が描かれている。しかしながら、被写体60がシート70の中央に乗せられて撮像が行われる場合、多くの画像データにおいて、一つ乃至二つの円マーカーは、被写体60によって遮蔽されることで画像データに含まれなくなる。図1に示す元画像データP01、P02及びP03の例では、円マーカーM04は、被写体60によって遮蔽されるため、完全な形では画像データに含まれなくなる。言い換えれば、被写体60がシート70の中央に乗せられて撮像が行われる場合、多くの画像データにおいて、二つ乃至3つの円マーカーが画像データに含まれることとなる。例えば、図1に示すように、元画像データP01、P02及びP03は、被写体60とともに、円マーカーM01、M02及びM03を含む画像データである。なお、詳細については後述するが、画像処理装置100が行う画像処理では、マーカーの種類によって画像データ内に含む必要のあるマーカーの数が変化する。例えば、画像に含まれるマーカーが円マーカーである場合、画像処理装置100は、各画像に少なくとも二つの円マーカーを含む複数の画像データから、自由視点画像を生成することができる。
続いて、ユーザ端末10は、ユーザの操作に従って、複数の元画像データP01~P0Nを画像処理装置100に入稿する(ステップS12)。例えば、ユーザ端末10は、画像処理装置100が提供する画像生成サービスを提供するウェブページにおいて、複数の元画像データP01~P0Nをアップロードすることにより、画像データを入稿する。
画像処理装置100は、各画像データに、被写体60とともに少なくとも二つの円マーカーが含まれる元画像データP01~P0Nの入稿を受け付ける。そして、画像処理装置100は、入稿された画像データに基づいて、自由視点画像を生成する(ステップS13)。具体的には、画像処理装置100は、一つの画像データに含まれる少なくとも二つの円マーカーに基づいて、入稿された複数の画像データに関して所定の校正を行う。
一般に、マーカーを利用した画像データに関する校正処理は、画像データ内におけるマーカーと、当該画像データを撮像した撮像装置(カメラ)との回転角R及び平行移動量Tというパラメータを算出することで実現される。
ここで、実施形態に係る画像処理装置100が行う校正処理について、元画像データP01を例に挙げて説明する。まず、画像処理装置100は、元画像データP01内の各円マーカーを検出する。この例では、画像処理装置100は、円マーカーM01及びM02を検出するものとする。なお、画像処理装置100は、円マーカーM01及びM02それぞれの外円と内円の比率の相違によって、円マーカーM01及びM02を識別する。上述のように、シート70上に描かれる各円マーカーは、正円である。このため、撮像によって取得された画像データ内では、各円マーカーは、楕円となる。
画像処理装置100は、検出した各楕円のパラメータに基づいて、各楕円の法線を推定する。楕円の法線は、一つの楕円につき2本算出される。このため、画像処理装置100は、二つの円マーカーM01及びM02から算出された法線の解を組み合わせることで、円マーカーM01及びM02を含む平面を推定できる。さらに、画像処理装置100は、推定した平面の法線を推定できる。
画像処理装置100は、推定した平面の法線を、元画像データP01におけるワールド座標系(空間の中での物体の位置を示すための座標系。「世界座標系」や「グローバル座標系」と表記される場合もある)におけるY軸と仮定する。そして、画像処理装置100は、適当な円心同士(例えば、円マーカーM01及びM02)を結ぶベクトルをワールド座標系における仮のX軸とする。これらの情報に基づいて、画像処理装置100は、画像内の円マーカーM01又はM02と撮像装置との回転角Rの関係を求めることができる。また、画像処理装置100は、円心同士の距離を1と仮定することで、仮の平行移動量Tを算出することができる。画像処理装置100は、仮のパラメータである回転角R及び平行移動量Tを用いて、検出された円の本来の大小関係を求めれば、どの円が楕円として検出できたのかを決定することができる。そして、シート70における円の位置情報は既知であるから、検出された円のワールド座標系における位置に基づいて、画像処理装置100は、正しいX軸と平行移動量Tを推定することができる。これにより、画像処理装置100は、強校正を完了する。
そして、画像処理装置100は、入稿された画像データから自由視点画像を構成するための画像に射影変換するための適切なパラメータを取得する。そして、画像処理装置100は、取得されたパラメータを用いて画像データを射影変換する。画像処理装置100は、射影変換された画像を連結することにより、入稿された各画像データを任意の視点で表示させることのできる自由視点画像F01を生成する。
画像処理装置100は、生成した自由視点画像F01をユーザ端末10に配信する(ステップS14)。図1に示すように、自由視点画像F01は、元画像データP01~P0Nが変換された変換後画像データRP01~RP0Nを含む。また、自由視点画像F01は、例えばユーザの操作に従って、変換後画像データRP01~RP0Nの表示を滑らかに遷移することが可能である。また、図1に示すように、変換後画像データRP01~RP0Nに含まれる各々の被写体60は、校正の結果、元画像データP01~P0Nに含まれる被写体60と比較して、大きさが均一に揃えられている。
ユーザ端末10は、画像処理装置100から配信された自由視点画像F01を取得する。ユーザは、例えば、オークションサイトの出品にあたり、自身の商品を紹介する情報の一つとして、自由視点画像F01を利用する(ステップS15)。
このように、実施形態に係る画像処理装置100は、視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能である円マーカーM01~M04が、各画像データ内に少なくとも二つは含まれる複数の元画像データP01~P0Nを受け付ける。そして、画像処理装置100は、円マーカーが有するパラメータに基づいて、受け付けられた複数の元画像データP01~P0Nに関する校正をする。さらに、画像処理装置100は、校正された複数の画像データに所定の変換処理を行うことにより、任意の視点位置に対応する画像を連続的に表示可能である自由視点画像F01を生成する。
これにより、実施形態に係る画像処理装置100は、例えば、ユーザ端末10のユーザのように、自由視点画像を活用して商材販売の促進を図るユーザに自由視点画像を提供することができる。すなわち、ユーザは、自由視点画像を販促などに利用することにより、通常の画像を提示するよりも、より高い販促効果を発揮させることができる。また、画像処理装置100は、自由視点画像を生成するにあたり、マーカーを利用した校正処理を行う。画像処理装置100は、マーカーを利用することで、専門の機材や装置の整った撮影環境で取得されていない元画像データからであっても、頑健に校正を行うことができる。すなわち、画像処理装置100は、強校正が行われていない撮像装置によって取得された元画像データからも、任意の視点からの表示を自然に行うことのできる自由視点画像を生成することができる。結果として、画像処理装置100は、一般ユーザに自由視点画像を有効に活用させることができるという効果を奏する。
〔2.画像処理装置の構成〕
次に、図2を用いて、実施形態に係る画像処理装置100の構成について説明する。図2は、実施形態に係る画像処理装置100の構成例を示す図である。図2に示すように、画像処理装置100は、通信部110と、記憶部120と、制御部130とを有する。
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、図示しないネットワークNと有線又は無線で接続され、ユーザ端末10との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図2に示すように、記憶部120は、画像データ記憶部121と、自由視点画像記憶部122とを有する。
(画像データ記憶部121について)
画像データ記憶部121は、ユーザ端末10から入稿された画像データに関する情報を記憶する。ここで、図3に、実施形態に係る画像データ記憶部121の一例を示す。図3に示した例では、画像データ記憶部121は、「入稿ID」、「画像データ」といった項目を有する。
「入稿ID」は、入稿された画像データを識別するための識別情報を示す。入稿IDが示す情報には、例えば、入稿された日時や、入稿元となるユーザ端末10を識別する情報が含まれてもよい。
「画像データ」は、入稿された画像データを示す。図1で示したように、ユーザ端末10は、自由視点画像の元となる画像データとして、複数の画像データを入稿する。「画像データ」の項目には、ユーザ端末10から入稿された一連の画像データが対応付けられて記憶される。また、各画像データには、「P01、P02、P03、P04、P05・・・」などの続き番号による識別情報が付与されてもよい。このような続き番号により、画像処理装置100は、自由視点画像における画像同士の連結順を認識する。
すなわち、図3では、入稿ID「A01」で識別される画像データの入稿では、画像データ「P01、P02、P03、P04、P05・・・」が自由視点画像を生成する元となる画像データとして入稿されたことを示す。
(自由視点画像記憶部122について)
自由視点画像記憶部122は、画像処理装置100が生成した自由視点画像に関する情報を記憶する。ここで、図4に、実施形態に係る自由視点画像記憶部122の一例を示す。図4に示した例では、自由視点画像記憶部122は、「自由視点画像ID」、「元画像データ」、「校正データ」、「変換後画像データ」、「初期表示画面」といった項目を有する。
「自由視点画像ID」は、自由視点画像の識別情報を示す。「元画像データ」は、自由視点画像の生成元となった画像データを示す。自由視点画像は複数の画像データから生成されるため、元画像データは、一つの自由視点画像に対して複数記憶される。
「校正データ」は、自由視点画像を生成するための所定の校正データ(カメラキャリブレーション)を示す。図4では、校正データを「R01」のような概念で示す。校正データには、画像処理装置100が自由視点画像を構成する画像を取得するために、元画像データを適切に射影変換するための種々のデータが含まれる。例えば、校正データには、マーカーと撮像装置との回転角Rや平行移動量Tが含まれる。なお、校正データには、各画像データに関して、撮像装置のカメラパラメータとして、撮像装置の焦点距離や、撮像装置によって生成される画像のアスペクト比及びスキューなどが含まれてもよい。
「変換後画像データ」は、自由視点画像を構成する画像データを示す。変換後画像データは、例えば、元画像データに対して所定の校正が行われ、校正で算出されたパラメータにより射影変換された後の画像データである。
「初期表示画面」は、自由視点画像の最初の表示に対応する画像を示す。初期表示画面は、変換後画像データのうちの一つの変換後画像データが選択される。
すなわち、図4では、自由視点画像ID「F01」で識別される自由視点画像は、元画像データが「P01、P02、P03、P04、P05、・・・」であり、それぞれの校正データは「R01、R02、R03、R04、R05、・・・」であり、変換後画像データは「RP01、RP02、RP03、RP04、RP05、・・・」であり、初期表示画面は「RP03」である例を示している。
なお、自由視点画像は、ユーザの任意の選択により自由視点画像の回転中心(注視点)が各々異なる自由視点画像が生成される場合がある。この場合、自由視点画像記憶部122には、自由視点画像IDに対応付けられて、注視点に関する情報が記憶されてもよい。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、画像処理装置100内部の記憶装置に記憶されている各種プログラム(画像処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
制御部130は、図2に示すように、受付部131と、校正部132と、生成部133と、配信部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
(受付部131について)
受付部131は、視点位置が異なる複数の画像データを受け付ける。具体的には、実施形態に係る受付部131は、視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能であるマーカーが、各画像データ内に少なくとも一つは含まれる複数の画像データの入稿を受け付ける。
上述のように、画像処理装置100が行う画像処理では、マーカーの種類によって画像データ内に含む必要のあるマーカーの数が変化する。例えば、画像に含まれるマーカーが円マーカーである場合、後述する校正部132及び生成部133は、各画像に少なくとも二つの円マーカーを含む複数の画像データから自由視点画像を生成することができる。すなわち、マーカーが円マーカーである場合、受付部131は、各々を識別可能である円マーカーが各画像データ内に少なくとも二つは含まれる複数の画像データの入稿を受け付ける。
また、画像処理装置100が利用するマーカーの有するパラメータについても、マーカーの種類によって異なる場合がある。例えば、画像処理装置100は、円マーカーの場合は、円マーカーを構成する同心円の径の長さや、シート70における各円マーカーの位置情報等をパラメータとして用いる。また、例えば、画像処理装置100は、四角形の2次元コード(例えば、QRコード(登録商標))のように、識別情報と平行する2組の線分とを有するマーカーである場合、識別情報と平行する2組の線分をパラメータとして用いる。言い換えれば、画像処理装置100は、円マーカーの場合に推定した法線に代わるパラメータとして、四角形のマーカーの場合には、四角形を構成する線分である平行する2組の線分をパラメータとして用いる。
受付部131は、入稿を受け付けた一連の画像データに入稿IDを付与し、画像データ記憶部121に格納する。
(校正部132について)
校正部132は、マーカーが有するパラメータに基づいて、受付部131によって受け付けられた複数の画像データに関する校正を行う。具体的には、実施形態に係る校正部132は、入稿された元画像データについて所定の校正を行うことで、自由視点画像を構成する画像に変換させるための変換行列に用いられるカメラパラメータを算出する。なお、後述する生成部133は、校正部132による校正の結果に基づいて、元画像データに所定の変換処理を行うことで、自由視点画像を生成する。
ここで、校正部132及び生成部133が扱う自由視点画像について、図5、図6及び図7を用いて説明する。まず、図5を用いて、自由視点画像に関する撮像装置の配置について説明する。図5は、自由視点画像に関する撮像装置の理想的な配置の一例を示す図である。図5では、自由視点画像の元となる複数の画像データの撮像について、理想的な撮像装置の配置の一例を示している。なお、図5では、被写体60を上から見た例を示す。
図5において、撮像装置C11~C16は、例えば、デジタルカメラである。また、撮像装置C11~C16は、各撮像装置における光軸が所定の位置を通過するように、撮像対象となる被写体60の周囲に配置される。図5の例では、撮像装置C11は、被写体60の中心に該当する3次元位置D1を光軸E11が通過するように配置される。また、撮像装置C12~C16は、それぞれの光軸E12~E16が3次元位置D1を通過するように配置される。なお、理想的な状況として、撮像装置C11~C16は、少なくとも投影面の底辺が地面と略平行となるように設置されるものとする。そして、撮像装置C11~C16は、図1に示した状態で一斉に被写体60を撮像することにより、被写体60の自由視点画像を生成する元となる画像データを取得することができる。
なお、図5の例では、6台の撮像装置C11~C16を用いて被写体60を撮像する例を示したが、撮像装置の数はこの例に限られない。また、撮像装置C11~C16の配置位置は、図5に示した例に限られない。例えば、撮像装置C11~C16は、被写体60を半円状に囲むのではなく、複数の撮像装置が被写体60を囲むように、円周上に等間隔に配置されてもよい。
ただし、図5の撮像手法では、撮像装置C11~C16の適切な配置や、撮像装置C11~C16の適切なキャリブレーションが求められる。すなわち、図5で示すような撮像処理をユーザのように撮像の専門家でない一般ユーザが行うのは困難である。
ここで、図6及び図7を用いて、撮像の専門家でない一般ユーザ等(以下、単に「ユーザ」と表記する)によって被写体60が撮像される場合の撮像処理について説明する。図6は、実施形態に係る自由視点画像に関する撮像処理の一例を示す図である。図6では、ユーザが、撮像装置C20を用いて、シート70に乗せられた被写体60を撮像する状況を示している。
図6に示すように、ユーザは、シート70に乗せられた被写体60の周囲を回転するように、連続的に被写体60を撮像する。この場合、図5と比較して、カメラの光軸や焦点距離が、撮像された各画像データについて一定でないことが想定される。
なお、図1でも説明したように、ユーザが被写体60を周囲から撮像した各画像データでは、シート70に描かれた円マーカーのいずれかが遮蔽されて隠れてしまうものの、少なくとも二つの円マーカーが各画像データに含まれることが想定される。
次に、図7を用いて、図6で示した撮像の状況を上から見た場合を説明する。図7は、実施形態に係る自由視点画像に関する撮像装置の配置の一例を示す図である。図7では、自由視点画像の元となる複数の画像データの撮像について、ユーザが実際に被写体60を撮像する場合に想定される撮像装置の配置等を示す。なお、以下の説明において、撮像装置C20~20を区別する必要のないときは、「撮像装置C20」と記載する。
撮像装置C20~20は、例えば、デジタルカメラである。理想的には、撮像装置C20~20は、図5で説明したように、それぞれ個別の撮像装置として、被写体60の周囲に配置されることが望ましい。ところが、実際には、ユーザは、1台の撮像装置C20を図7の撮像装置C20~20が示す箇所に移動させながら、被写体60を撮像することが想定される。具体的には、ユーザは、図7に示す撮像装置C20の場所から被写体60を撮像する。そして、ユーザは、被写体60を中心とした円に沿って、図7に示す撮像装置C20の場所へ移動し、被写体60を撮像する。かかる作業を繰り返し、ユーザは、被写体60について複数の画像データを取得する。
この場合、ユーザが、光軸E20が被写体60の中心を通るように注意深く撮像したとしても、自由視点画像の元画像として正確に(例えば、図5で示したように)被写体60を撮像することは難しい。また、ユーザによって扱われる撮像装置C20についてカメラキャリブレーションされているとは限らないため、画像データからカメラパラメータ等を取得することができない場合がある。
そこで、校正部132は、受付部131によって受け付けられた画像データについて、マーカーを利用した所定の校正を行うことにより、自由視点画像を構成する画像に変換できるようにする。この点について、図8を用いて説明する。
図8は、実施形態に係る画像処理装置100が利用するマーカーを説明するための図(1)である。図8では、校正部132が校正に利用する円マーカーM01、M02、M03及びM04が4隅に描かれた、シート70について説明する。
図8に示すように、シート70には、円マーカーM01、M02、M03及びM04と、中央表示75が含まれる。なお、中央表示75は、例えば、シート70に被写体60を設置する場合の目安となる表示である。ユーザは、図8に示すシート70を取得し、シート70に乗せられた被写体60を撮像する。
また、上述のように、校正部132は、シート70に描かれる円マーカーM01、M02、M03及びM04の位置情報を予め取得する。これにより、校正部132は、各円マーカーを識別することができれば、円マーカーM01、M02、M03及びM04の各々の位置関係を推定することができるため、マーカーを利用した校正処理を行うことができる。なお、校正部132は、画像データにおいて、マーカーの位置情報をワールド座標系における絶対値として与えておいてもよい。すなわち、校正部132は、複数のマーカーを予めワールド座標系においてマッピングするマッピング処理を行う。これにより、校正部132は、被写体60やその他の物体等に遮蔽されたマーカーが画像データ内にある場合でも、遮蔽されたマーカーの位置を推定して校正処理を行うことができる。
ここで、画像処理装置100が行う円マーカーの識別処理の一例について説明する。図9は、実施形態に係る画像処理装置100が利用するマーカーを説明するための図(2)である。図9では、画像処理装置100に係る校正部132が校正に利用する円マーカーM01を例に挙げて説明する。
図9に示すように、校正部132は、円マーカーM01について、内円80と外円85という同心の2円として認識可能である。図9の例では、内円80及び外円85の中心を点Cとし、内円80の径を線BD、外円85の径を線AEとして示している。
ここで、校正部132は、各円マーカーの識別に関して、射影空間において、線分の復比(長さの比の比)が不変という性質を利用する。例えば、校正部132は、(線AC/線AD)と(線BC/線BD)との比率が不変であることを利用する。言い換えれば、校正部132は、(線AC×線BD)/(線AD/線BC)の値が不変であることを利用する。このため、校正部132は、内円80と外円85の半径の比である(線BC/線AC)を予め登録することにより、円マーカーM01を識別することができる。
すなわち、校正部132は、円マーカーM01、M02、M03及びM04の各々の内円と外円の半径の比が異なるように描かれたシート70を作成する。これにより、校正部132は、ユーザから入稿された画像データに含まれる各々の円マーカーを識別することができる。
上述してきたように、校正部132は、各円マーカーを識別することにより、入稿された各元画像データ間の各円マーカーの対応を参照することができる。例えば、校正部132は、元画像データにおいて、マーカーが有するパラメータを用いて推定される平面情報と、平面情報に対応する平面に含まれるマーカーの位置情報とに基づいて、複数の画像データに関する校正を行う。
また、校正部132は、マーカーが有するパラメータとして、複数のマーカーの各々の位置情報の対応関係に基づいて、複数の画像データに関する校正を行う。また、校正部132は、マーカーが円マーカーである場合、円マーカーが有するパラメータを用いて推定される円マーカーの法線を含む平面情報と、平面情報に対応する平面に含まれる二つの円マーカーの位置情報の対応関係とに基づいて、複数の画像データに関する校正を行う。
(生成部133について)
生成部133は、校正部132によって校正された複数の画像データに所定の変換処理を行うことにより、任意の視点位置に対応する画像を連続的に表示可能である自由視点画像を生成する。
図7を用いて説明したように、ユーザ端末10から入稿される元画像データ群は、被写体60に光軸を向けて撮像されているものの、厳密には光軸が上下左右にばらついていることが想定される。このため、入稿される元画像データ群を単に連続的に表示させたとしても、かかる連続画像では、不連続性が際立つと推定される。
そのため、生成部133は、各々の元画像データが撮像された際の撮像装置C20の光軸が、3次元空間上のある1点(例えば、図5に示した3次元位置D1など)を通過していたかのような画像へと変換する射影変換行列を用いて、元画像データを変換する。かかる射影変換行列は、校正部132が行う校正処理によって導出されたパラメータにより作成されうる。
例えば、生成部133は、射影変換によって、自由視点画像を構成する変換後画像データを生成する。例えば、変換後の画像データに対応する所定の撮像装置(カメラ)をカメラkと仮定すると、このようなカメラkにおける射影変換行列Hは、各カメラの回転角(回転行列)R、及び光軸を通過させたい3次元点に基づいて、下記式(1)で求めることができる。
Figure 0007032179000001
上記式(1)において、Rの逆行列とは、カメラkにおける元の回転角Rであり、R´とは新しい回転角Rであり、Aとは内部パラメータである。内部パラメータは、例えば、画像中心位置や焦点距離により与えられる。なお、新しい回転角R´は、既知の手法により、カメラ位置と、ワールド座標系において回転させたい中心から求まる理想的な光軸と、元の光軸とから求めることが可能である。
生成部133は、上記式(1)のように生成された射影変換行列を用いて、各元画像データを変換することにより、自由視点画像を生成する。ここで、図10を用いて、実施形態に係る生成部133による生成処理の一例を説明する。図10は、実施形態に係る生成部133による生成処理の一例を示す図である。
図10に示すように、生成部133は、校正部132による校正処理とともに、所定の変換処理を行うことにより、元画像データP01~P05を、変換後画像データRP01~RP05に変換することで、自由視点画像を生成する。
元画像データP01を例に挙げると、校正部132は、元画像データP01から、円マーカーを少なくとも二つ検出する。例えば、校正部132は、元画像データP01から、円マーカーM02及び円マーカーM03を検出する。そして、校正部132は、上述した処理によって、元画像データP01に関する校正を行う。すなわち、校正部132は、校正処理によって、元画像データP01を撮像した撮像装置C20のカメラパラメータを導出する。言い換えれば、校正部132は、射影変換行列を生成するためのパラメータを取得する。
そして、生成部133は、校正部132による校正処理の結果を受けて、射影変換行列を生成する。続けて、生成部133は、元画像データP01を射影変換することで、変換後画像データRP01を生成する。生成部133は、同様に、元画像データP02~P05に基づいて、それぞれ、変換後画像データRP02~RP05を生成する(ステップS20)。
なお、校正部132又は生成部133は、マーカーを利用した校正処理が行われた後は、既知の種々の手法を用いて、校正処理を行ったり、射影変換を行ったりしてもよい。例えば、校正部132又は生成部133は、ストラクチャーフロムモーション(Structure From Motion、以下、「SFM」と記載する)と呼ばれる既知の手法を用いてもよい。SFMによれば、種々の視点位置から撮像された複数の画像データに基づいて、画像の3次元形状を復元することが可能となる。具体的には、SFMは、画像データ間で対応付けされた対応点を用いて、かかる対応点の移動を基礎行列で表現することにより、撮像装置C20の動きを算出する。なお、SFMによれば、撮像装置C20の位置情報を復元することができるため、校正部132は、所定の処理において、SFMの手法を適宜用いて、カメラパラメータを取得するようにしてもよい。
上記のように、校正部132は、所定の校正処理として、複数の画像データ間で対応するマーカーの関係に基づいて、当該画像データを取得した撮像装置C20のカメラパラメータ(例えば、相対的な位置情報等)を取得する。そして、生成部133は、校正部132によって取得されたパラメータ等の校正データを用いて、各画像データに対応する射影変換行列を算出する。そして、生成部133は、算出された射影変換行列を用いて、各元画像データを変換する。そして、生成部133は、変換した変換後画像データに基づいて、自由視点画像を生成する。生成部133は、生成した自由視点画像を自由視点画像記憶部122に格納する。なお、校正部132及び生成部133が実行する処理には、上記先行技術文献の特許文献2及び3にて開示された処理が、適宜応用されてもよい。
なお、生成部133は、複数の画像データが所定の連続性を有するか否かを判定することにより、生成処理で取り扱う画像データを抽出し、抽出された画像データを用いて自由視点画像を生成してもよい。言い換えれば、生成部133は、入稿された複数の画像データのうち、自由視点画像の生成に適する画像データを抽出して自由視点画像を生成する。例えば、生成部133は、生成処理において、入稿された複数の画像データのうち、誤って入稿された画像データや、自由視点画像の生成に不適切な画像データを排除することができる。かかる処理は、例えば、マーカーを利用した校正処理を行う際に、マーカーが検出できなかったり、元画像データにおいて対応するマーカーが検出されなかったりした場合に行われうる。また、生成部133は、入稿された複数の画像データによって自由視点画像を生成することができない場合には、生成することができない理由、又は自由視点画像を生成可能とするための画像データの差し換えに係る情報が含まれる通知データを生成してもよい。
(配信部134について)
配信部134は、生成部133によって生成された自由視点画像を配信する。具体的には、実施形態に係る配信部134は、生成部133によって生成され、自由視点画像記憶部122に記憶されている自由視点画像を、元画像データの入稿元であるユーザ端末10に配信する。
なお、配信部134は、元画像データが適切でなく、生成部133が自由視点画像を生成することができない旨や、自由視点画像の生成のための追加の画像データの入稿を求める旨を示した通知データを生成したときは、かかる通知データを元画像データの入稿元に配信してもよい。
〔3.画像処理手順〕
次に、図11を用いて、実施形態に係る画像処理装置100による画像処理の手順について説明する。図11は、実施形態に係る画像処理手順を示すフローチャートである。
図11に示すように、画像処理装置100の受付部131は、ユーザ端末10から画像データの入稿を受け付けたか否かを判定する(ステップS101)。このとき、受付部131は、画像データの入稿を受け付けていない場合には(ステップS101;No)、画像データの入稿を受け付けるまで待機する。
一方、受付部131は、画像データの入稿を受け付けた場合には(ステップS101;Yes)、受け付けた画像データを画像データ記憶部121に格納する。そして、校正部132は、各画像データに含まれるマーカーを特定(検出)する(ステップS102)。
そして、校正部132は、マーカーを利用して、画像データに関する校正処理を行う(ステップS103)。続けて、生成部133は、校正部132によって行われた校正処理の校正データに基づいて、画像データを変換する(ステップS104)。
そして、生成部133は、変換された画像データに基づいて、自由視点画像を生成する(ステップS105)。続いて、配信部134は、自由視点画像をユーザ端末10に配信する(ステップS106)。
〔4.変形例〕
上述してきた実施形態に係る画像処理装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下に、上記の画像処理装置100の他の実施形態について説明する。
〔4-1.円以外の図形を利用したマーカー〕
上記実施形態では、画像処理装置100は、円マーカーを利用して各画像データに関する校正処理を行うことを説明した。しかし、画像処理装置100は、円マーカー以外のマーカーを利用してもよい。
例えば、画像処理装置100は、上記のように、識別情報を有する2次元コードを利用することができる。この場合、2次元コード自体に識別情報が含まれ、かつ、一つの2次元コードには2組の(互いに平行ではない)平行の線分が含まれるため、画像処理装置100は、各画像データから少なくとも一つのマーカーを検出することで、校正処理を実行することができる。なお、画像データ内に平面を規定することのできる線分であれば、校正処理において、線分が平行である必要はない。
このように、画像処理装置100は、マーカーとして、四角形の形状と識別情報とを有する2次元コードが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける。そして、画像処理装置100は、2次元コードが有する2辺の線分の情報を用いて推定される平面情報と、平面情報に対応する平面に含まれる少なくとも一つの2次元コードの位置情報とに基づいて、複数の画像データに関する校正を行う。このように、画像処理装置100は、校正に利用されるマーカーが円以外の図形であっても、適切な校正を行うことができる。
〔4-2.4点を利用するマーカー〕
また、画像処理装置100は、マーカーとして、互いの位置関係が既知である4つ以上の点をマーカーとして用いることもできる。この場合、画像処理装置100は、各画像データに少なくとも4つの点が含まれている画像データの入稿を受け付ける。
すなわち、画像処理装置100は、画像データ内からマーカーとして4つの点を検出することで、4つの点のうちから2点を結び、線分を二つ規定することができる。これにより、画像処理装置100は、上記実施形態で説明したような、円マーカーを用いた処理と同様の処理を行うことができる。
具体的には、画像処理装置100は、互いの位置情報の対応関係が予め規定された複数の点であって、各画像データ内に少なくとも4つは含まれる複数の点を含んだ複数の画像データを受け付ける。そして、画像処理装置100は、複数の点のうち2点を結ぶ線分から2本の線分を抽出し、抽出された2本の線分を用いて推定される複数の点を含む平面情報と、平面情報に対応する平面に含まれる複数の点の位置情報の対応関係とに基づいて、複数の画像データに関する校正を行う。このように、画像処理装置100は、マーカーそのものに識別情報を有しなくても、各点の位置情報や座標に基づいて各点の対応関係を利用することにより、点をマーカーとして利用することができる。
〔4-3.活用例(1)〕
上記実施形態では、画像処理装置100は、オークションの出品を所望するユーザから入稿された複数の画像データに基づいて、自由視点画像を生成する処理を例として示した。この場合、画像処理装置100は、生成した自由視点画像を、自由視点画像の元となる複数の画像データを入稿したユーザ端末10もしくはユーザ端末10を利用するユーザを識別する識別情報、又は、ユーザが利用するサービスにおける出品情報の少なくともいずれか一つと対応付けて、所定の記憶部に格納するようにしてもよい。
すなわち、画像処理装置100は、生成した自由視点画像をユーザに配信するのみならず、ユーザ端末10やユーザの識別情報(例えば、ユーザID)や、ユーザが利用するサービスにおける出品情報とともに、自由視点画像記憶部122等に記憶するようにしてもよい。なお、ユーザが利用するサービスにおける出品情報とは、例えば、オークションサイトにおける出品商品を示す識別情報であったり、オークションサイトにおいて行われているオークションを識別する識別情報であったり、ショッピングサイトにおける商品を識別する識別情報といった、出品物(例えば、自由視点画像の元画像データの被写体であることが想定される)を特定することのできる情報である。
この場合、画像処理装置100は、例えば、サービスを管理運営するウェブサーバ等から自由視点画像の配信の要求を受け付ける。そして、画像処理装置100は、要求を受けた場合に、ユーザ端末10やユーザの識別情報や出品情報に基づいて、自由視点画像を特定する。そして、画像処理装置100は、特定された自由視点画像をサービス側(例えばウェブサーバ)に配信する。自由視点画像を取得したウェブサーバは、オークションにおける商品の紹介画像として、自由視点画像を掲載する。
このように、画像処理装置100は、ユーザに自由視点画像を配信するのみならず、ユーザを識別する情報とともに自由視点画像を記憶部120内に格納しておき、要求に応じて、サービス側に自由視点画像を配信するようにしてもよい。これにより、画像処理装置100は、多様な要求に応答して自由視点画像を配信することができるため、より自由視点画像を活用させることができる。この場合、画像処理装置100は、例えば、図6に示した自由視点画像記憶部122内に、自由視点画像IDと対応付けて、ユーザIDや、ユーザの出品情報ID等の情報を格納するようにしてもよい。
〔4-4.活用例(2)〕
上記実施形態においては、自由視点画像がユーザに利用される例として、オークションサイトへの商品の出品等を示した。しかし、画像処理装置100は、生成した自由視点画像を様々な対象に配信してもよい。例えば、画像処理装置100は、ユーザ端末10ではなく、直接、ウェブサーバ等に配信するサービスを行ってもよい。また、画像処理装置100は、主としてUGC(User-Generated Contents)を掲載するサイトであるUGM(User-Generated Media)、またはCGM(Consumer-Generated Media)等に、生成した自由視点画像を配信してもよい。なお、UGMには、投稿動画共有サイト、写真共有サイト、イラスト投稿サイト、SNS(Social Networking Service)等が含まれる。
〔5.その他〕
また、上述した各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図2に示した校正部132と生成部133とは統合されてもよい。また、画像処理装置100は、ユーザ等の利用者とデータのやりとりを主に行うフロントエンドサーバと、生成処理等を行うバックエンドサーバとに分散される態様であってもよい。この場合、フロントエンドサーバは、少なくとも、受付部131と配信部134とを有する。また、バックエンドサーバは、少なくとも、校正部132と生成部133とを有する。また、画像処理装置100は、記憶部120を内部に備えるのではなく、外部のストレージサーバを利用する態様であってもよい。
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔6.ハードウェア構成〕
また、上述してきた実施形態に係る画像処理装置100は、例えば図12に示すような構成のコンピュータ1000によって実現される。図12は、画像処理装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が画像処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔7.効果〕
上述してきたように、実施形態に係る画像処理装置100は、受付部131と、校正部132と、生成部133とを有する。受付部131は、視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能であるマーカーが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける。校正部132は、マーカーが有するパラメータに基づいて、受付部131によって受け付けられた複数の画像データに関する校正を行う。生成部133は、校正部132によって校正された複数の画像データに所定の変換処理を行うことにより、任意の視点位置に対応する画像を連続的に表示可能である自由視点画像を生成する。
このように、実施形態に係る画像処理装置100は、自由視点画像を生成するにあたり、マーカーを利用した校正処理を行う。例えば、画像処理装置100は、被写体とともにマーカーを撮像した画像データを利用することで、専門の機材や装置の整った撮影環境で取得されていない、一般ユーザによって撮像されたような元画像データからであっても、頑健に校正を行うことができる。すなわち、画像処理装置100は、強校正が行われていない撮像装置によって取得された元画像データからも、任意の視点からの表示を自然に行うことのできる自由視点画像を生成することができる。結果として、画像処理装置100は、一般ユーザに自由視点画像を有効に活用させることができるという効果を奏する。
また、校正部132は、画像データにおいて、マーカーが有するパラメータを用いて推定される平面情報と、平面情報に対応する平面に含まれるマーカーの位置情報とに基づいて、複数の画像データに関する校正を行う。
このように、実施形態に係る画像処理装置100は、平面情報を規定することのできるパラメータ(例えば、2本の線分を規定する情報)を有するマーカーを利用して、校正処理を行う。これにより、画像処理装置100は、一般的なユーザによって撮像された画像データであっても、適切な校正処理を行うことができる。
また、受付部131は、各画像データ内に複数のマーカーが含まれる複数の画像データを受け付ける。校正部132は、パラメータとして、複数のマーカーの各々の位置情報の対応関係に基づいて、複数の画像データに関する校正を行う。
このように、実施形態に係る画像処理装置100は、画像データ内におけるマーカーの位置情報の対応関係(マッピング情報)に基づいて、複数の画像データに関する校正を行うことができる。これにより、画像処理装置100は、互いのマーカー、すなわち、各画像間の対応点を適切に特定することができるため、頑健な校正を行うことができる。
また、受付部131は、同心を有する二つの円から構成されるマーカーである円マーカーが、各画像データ内に少なくとも二つは含まれる複数の画像データを受け付ける。校正部132は、円マーカーが有するパラメータを用いて推定される円マーカーの法線を含む平面情報と、平面情報に対応する平面に含まれる二つの円マーカーの位置情報の対応関係とに基づいて、複数の画像データに関する校正を行う。
このように、実施形態に係る画像処理装置100は、円マーカーによる校正処理を行うことができる。円マーカーは、画像データとして投影された場合に、楕円パラメータを有するため、法線を推定できる。このため、画像処理装置100は、法線に基づく平面情報を容易に推定可能であり、さらに平面の法線を推定可能である。これにより、画像処理装置100は、画像データにおけるワールド座標系との対応をとることができるため、適切な校正処理を行うことができる。
また、受付部131は、互いの位置情報の対応関係が予め規定された複数の点であって、各画像データ内に少なくとも4つは含まれる複数の点を含んだ複数の画像データを受け付ける。校正部132は、複数の点のうち2点を結ぶ線分から2本の線分を抽出し、抽出された2本の線分を用いて推定される複数の点を含む平面情報と、平面情報に対応する平面に含まれる複数の点の位置情報の対応関係とに基づいて、複数の画像データに関する校正を行う。
このように、実施形態に係る画像処理装置100は、少なくとも4点をマーカーとして利用することもできる。このため、画像処理装置100は、互いに識別可能な情報であれば、円などの図形を用いなくとも、適切な校正処理を行うことができる。すなわち、画像処理装置100は、汎用性の高い画像処理を行うことができる。
また、受付部131は、四角形の形状と識別情報とを有する2次元コードが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける。校正部132は、2次元コードが有する2辺の線分の情報を用いて推定される平面情報と、平面情報に対応する平面に含まれる少なくとも一つの2次元コードの位置情報とに基づいて、複数の画像データに関する校正を行う。
このように、実施形態に係る画像処理装置100は、2次元コードをマーカーとして用いてもよい。2次元コードは、2次元コード自体を識別する識別情報を有するため、円マーカーのようにサイズ等を用いて二つの円を特定せずとも、一つのマーカーで識別されることができる。このため、画像処理装置100は、少なくとも一つの2次元コードに基づいて、校正処理を行うことができる。すなわち、画像処理装置100は、複数個のマーカーの対応関係を算出するといった処理負担を軽減させることができる。
また、実施形態に係る画像処理装置100は、生成部133によって生成された自由視点画像を配信する配信部134をさらに備える。また、受付部131は、ユーザ端末10から複数の画像データの入稿を受け付けるとともに、ユーザ端末10を識別する情報を受け付ける。配信部134は、受付部131によって受け付けられたユーザ端末10を識別する情報に基づいて、ユーザ端末10に自由視点画像を配信する。
上述してきたように、実施形態に係る画像処理装置100は、ユーザが自由に撮像したような、校正がなされていない画像データによっても、自由視点画像を生成することができる。そして、画像処理装置100は、生成した自由視点画像をユーザが利用するユーザ端末10に配信する。すなわち、画像処理装置100によれば、ユーザは、自由視点画像をオークションサイトの出品等に利用することが可能になる。このように、画像処理装置100は、一般ユーザの自由視点画像の活用を促進させることができる。
また、生成部133は、生成した前記自由視点画像を、当該自由視点画像の元となる複数の画像データを入稿したユーザ端末10もしくはユーザ端末10を利用するユーザを識別する識別情報、又は、ユーザが利用するサービスにおける出品情報の少なくともいずれか一つと対応付けて、所定の記憶部に格納する。
このように、実施形態に係る画像処理装置100は、ユーザを識別する情報とともに自由視点画像を記憶部120内に格納しておき、例えば、要求に応じて、サービス側に自由視点画像を配信するようにしてもよい。これにより、画像処理装置100は、多様な要求に応答して自由視点画像を利用させることができるため、よりユーザに自由視点画像を有用に利用させることができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述した画像処理装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、生成手段は、生成部や生成回路に読み替えることができる。
1 画像処理システム
10 ユーザ端末
100 画像処理装置
110 通信部
120 記憶部
121 画像データ記憶部
122 自由視点画像記憶部
130 制御部
131 受付部
132 校正部
133 生成部
134 配信部

Claims (9)

  1. 視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能であるマーカーが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける受付部と、
    前記受付部によって受け付けられた複数の画像データの各々において、当該マーカーが有するパラメータを用いて推定される平面情報と当該平面情報に対応する平面に含まれる当該マーカーの位置情報とに基づいて算出される、当該画像データを撮像した撮像装置と当該マーカーとの回転角及び平行移動量から、当該複数の画像データを撮像した各々の撮像装置のカメラパラメータを導出する校正を行う校正部と、
    前記校正部によって導出されたカメラパラメータに基づき算出される射影変換行列を用いて、前記複数の画像データに射影変換を行うことにより、前記複数の画像データをそれぞれ変換後画像データに変換し、変換された前記変換後画像データに基づいて、複数の視点位置に対応する画像を滑らかに遷移させて表示可能である自由視点画像を生成する生成部と、
    を備え
    前記受付部は、
    各画像データ内に複数のマーカーが含まれる前記複数の画像データを受け付け、
    前記校正部は、
    前記パラメータとして、前記複数のマーカーの各々の位置情報の対応関係に基づいて、当該複数の画像データに関する校正を行う、
    ことを特徴とする画像処理装置。
  2. 前記受付部は、4隅にマーカーが描かれたシートの中央に乗せられた被写体を視点位置が異なるように撮像した複数の画像データであって、前記4隅のマーカーのうち前記被写体により遮蔽されていないマーカーが各画像データ内に含まれる複数の画像データを受け付ける、
    ことを特徴とする請求項に記載の画像処理装置。
  3. 前記受付部は、
    同心を有する二つの円から構成されるマーカーである円マーカーが、各画像データ内に少なくとも二つは含まれる複数の画像データを受け付け、
    前記校正部は、
    前記円マーカーが有するパラメータを用いて推定される当該円マーカーの法線を含む平面情報と、当該平面情報に対応する平面に含まれる二つの円マーカーの位置情報の対応関係とに基づいて、前記複数の画像データに関する校正を行う、
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記受付部は、
    互いの位置情報の対応関係が予め規定された複数の点であって、各画像データ内に少なくとも4つは含まれる複数の点を含んだ前記複数の画像データを受け付け、
    前記校正部は、
    前記複数の点のうち2点を結ぶ線分から2本の線分を抽出し、抽出された2本の線分を用いて推定される当該複数の点を含む平面情報と、当該平面情報に対応する平面に含まれる複数の点の位置情報の対応関係とに基づいて、前記複数の画像データに関する校正を行う、
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  5. 前記受付部は、
    四角形の形状と識別情報とを有する2次元コードが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付け、
    前記校正部は、
    前記2次元コードが有する2辺の線分の情報を用いて推定される平面情報と、当該平面情報に対応する平面に含まれる少なくとも一つの当該2次元コードの位置情報とに基づいて、前記複数の画像データに関する校正を行う、
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  6. 前記生成部によって生成された自由視点画像を配信する配信部、
    をさらに備え、
    前記受付部は、
    端末装置から前記複数の画像データの入稿を受け付けるとともに、当該端末装置を識別する情報を受け付け、
    前記配信部は、
    前記受付部によって受け付けられた前記端末装置を識別する情報に基づいて、当該端末装置に前記自由視点画像を配信する、
    ことを特徴とする請求項1~のいずれか一つに記載の画像処理装置。
  7. 前記生成部は、
    生成した前記自由視点画像を、当該自由視点画像の元となる複数の画像データを入稿した端末装置もしくは当該端末装置を利用するユーザを識別する識別情報、又は、当該ユーザが利用するサービスにおける出品情報の少なくともいずれか一つと対応付けて、所定の記憶部に格納する、
    ことを特徴とする請求項1~のいずれか一つに記載の画像処理装置。
  8. コンピュータが実行する画像処理方法であって、
    視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能であるマーカーが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける受付工程と、
    前記受付工程によって受け付けられた複数の画像データの各々において、当該マーカーが有するパラメータを用いて推定される平面情報と当該平面情報に対応する平面に含まれる当該マーカーの位置情報とに基づいて算出される、当該画像データを撮像した撮像装置と当該マーカーとの回転角及び平行移動量から、当該複数の画像データを撮像した各々の撮像装置のカメラパラメータを導出する校正を行う校正工程と、
    前記校正工程によって導出されたカメラパラメータに基づき算出される射影変換行列を用いて、前記複数の画像データに射影変換を行うことにより、前記複数の画像データをそれぞれ変換後画像データに変換し、変換された前記変換後画像データに基づいて、複数の視点位置に対応する画像を滑らかに遷移させて表示可能である自由視点画像を生成する生成工程と、
    を含み、
    前記受付工程では、
    各画像データ内に複数のマーカーが含まれる前記複数の画像データを受け付け、
    前記校正工程では、
    前記パラメータとして、前記複数のマーカーの各々の位置情報の対応関係に基づいて、当該複数の画像データに関する校正を行う、
    ことを特徴とする画像処理方法。
  9. 視点位置が異なる複数の画像データであって、所定のパラメータを有するとともに各々を識別可能であるマーカーが、各画像データ内に少なくとも一つは含まれる複数の画像データを受け付ける受付手順と、
    前記受付手順によって受け付けられた複数の画像データの各々において、当該マーカーが有するパラメータを用いて推定される平面情報と当該平面情報に対応する平面に含まれる当該マーカーの位置情報とに基づいて算出される、当該画像データを撮像した撮像装置と当該マーカーとの回転角及び平行移動量から、当該複数の画像データを撮像した各々の撮像装置のカメラパラメータを導出する校正を行う校正手順と、
    前記校正手順によって導出されたカメラパラメータに基づき算出される射影変換行列を用いて、前記複数の画像データに射影変換を行うことにより、前記複数の画像データをそれぞれ変換後画像データに変換し、変換された前記変換後画像データに基づいて、複数の視点位置に対応する画像を滑らかに遷移させて表示可能である自由視点画像を生成する生成手順と、
    をコンピュータに実行させ
    前記受付手順では、
    各画像データ内に複数のマーカーが含まれる前記複数の画像データを受け付け、
    前記校正手順では、
    前記パラメータとして、前記複数のマーカーの各々の位置情報の対応関係に基づいて、当該複数の画像データに関する校正を行う、
    ことを特徴とする画像処理プログラム。
JP2018038789A 2018-03-05 2018-03-05 画像処理装置、画像処理方法及び画像処理プログラム Active JP7032179B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018038789A JP7032179B2 (ja) 2018-03-05 2018-03-05 画像処理装置、画像処理方法及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018038789A JP7032179B2 (ja) 2018-03-05 2018-03-05 画像処理装置、画像処理方法及び画像処理プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016032444A Division JP6339609B2 (ja) 2016-02-23 2016-02-23 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2018120604A JP2018120604A (ja) 2018-08-02
JP7032179B2 true JP7032179B2 (ja) 2022-03-08

Family

ID=63043914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018038789A Active JP7032179B2 (ja) 2018-03-05 2018-03-05 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP7032179B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240002559A (ko) * 2022-06-29 2024-01-05 삼성전자주식회사 이미지 표시를 위한 전자 장치 및 그 동작 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139294A (ja) 2002-10-17 2004-05-13 Hitachi Ltd 多視点画像処理プログラム、システム及びマーカ
JP2010179403A (ja) 2009-02-05 2010-08-19 Denso Wave Inc ロボットシミュレーション画像表示システム
JP2014239384A (ja) 2013-06-10 2014-12-18 ヤフー株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2015127903A (ja) 2013-12-27 2015-07-09 ヤフー株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2017151643A (ja) 2016-02-23 2017-08-31 ヤフー株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5867210B2 (ja) * 2011-07-15 2016-02-24 株式会社大林組 鉄筋規格判別装置及び鉄筋規格情報作成装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139294A (ja) 2002-10-17 2004-05-13 Hitachi Ltd 多視点画像処理プログラム、システム及びマーカ
JP2010179403A (ja) 2009-02-05 2010-08-19 Denso Wave Inc ロボットシミュレーション画像表示システム
JP2014239384A (ja) 2013-06-10 2014-12-18 ヤフー株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2015127903A (ja) 2013-12-27 2015-07-09 ヤフー株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2017151643A (ja) 2016-02-23 2017-08-31 ヤフー株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
加藤博一、Mark Billinghurst、浅野浩一、橘啓八郎、「マーカー追跡に基づく拡張現実感システムとそのキャリブレーション」、日本バーチャルリアリティ学会論文誌、1999年、Vol.4、No.4、p.607~616
西紗記子、東野進一、坂本竜基、「Webオークション出品時における疑似3D画像の生成」、情報処理学会 インタラクション 2016、2016年3月4日、163C47、p.961~963

Also Published As

Publication number Publication date
JP2018120604A (ja) 2018-08-02

Similar Documents

Publication Publication Date Title
Pagliari et al. Calibration of kinect for xbox one and comparison between the two generations of microsoft sensors
JP6166409B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US9852336B2 (en) Relative positioning of a mobile computing device in a network
US20150369593A1 (en) Orthographic image capture system
US8897539B2 (en) Using images to create measurements of structures through the videogrammetric process
JP6716996B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
Morgan et al. Standard methods for creating digital skeletal models using structure‐from‐motion photogrammetry
JP2012098087A (ja) 測定装置及び測定方法
JP2014071850A (ja) 画像処理装置、端末装置、画像処理方法、およびプログラム
US11373335B2 (en) Camera parameter estimation device, method and program
CN110728649A (zh) 用于生成位置信息的方法和装置
Hafeez et al. Evaluating feature extraction methods with synthetic noise patterns for image-based modelling of texture-less objects
US10600202B2 (en) Information processing device and method, and program
Guidi et al. Optimal lateral displacement in automatic close-range photogrammetry
Kwiatek et al. Immersive photogrammetry in 3D modelling
US11605183B2 (en) Aligning and merging contents from multiple collaborative workstations
JP7032179B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
Li et al. Real-time RGB-D image stitching using multiple Kinects for improved field of view
JP5837404B2 (ja) 画像処理装置、画像処理方法
JP6339609B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
KR20180090499A (ko) 증강현실과 가상현실 쇼핑을 위한 상품의 3d모델 적용방법
Jose et al. Human wound photogrammetry with low-cost hardware based on automatic calibration of geometry and color
JP6794316B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US10083545B2 (en) Image processing device, image processing method, and non-transitory computer-readable recording medium for specifying markers in accepted image data
CN109242941A (zh) 三维对象合成通过使用视觉引导作为二维数字图像的一部分

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190208

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200605

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201022

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20201022

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20201030

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20201104

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20201211

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20201215

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20210706

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20211012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211210

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20220104

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20220201

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20220201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220224

R150 Certificate of patent or registration of utility model

Ref document number: 7032179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250