WO2016024375A1

WO2016024375A1 - 画像処理装置及び画像処理方法

Info

Publication number: WO2016024375A1
Application number: PCT/JP2015/002907
Authority: WO
Inventors: 江島　公志
Original assignee: ソニー株式会社
Priority date: 2014-08-12
Filing date: 2015-06-10
Publication date: 2016-02-18

Abstract

　入力画像の被写体である面領域を、容易にかつ精度よく所望の形状に変形することが可能な画像処理装置及び画像処理方法を提供する。　本技術の一形態に係る画像処理装置は、曲線算出部と、ホモグラフィ推定部とを具備する。　上記曲線算出部は、第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出する。　上記ホモグラフィ推定部は、上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定する。

Description

画像処理装置及び画像処理方法

　本技術は、入力画像の被写体である面領域を変形することが可能な画像処理装置及び画像処理方法に関する。

　書籍を見開きにして撮像した場合や、柱等の曲面に貼り付けられたポスター等を撮像した場合、これらの書籍やポスター中の文字、図形等が湾曲して見にくくなることがあった。

　そこで、例えば特許文献１には、被写体の特定位置の詳細な形状データを得ることにより、湾曲歪みを平面に補正する構成が記載されている。また、例えば特許文献２には、書籍の綴じ部等の被写体距離を測距することで書籍画像の湾曲歪を補正する構成が記載されている。

特許第４１６２５０１号特開２０１３－９３７０４号公報

　しかしながら、特許文献１に記載の構成は、上記特定位置付近を高い撮像倍率で撮像することで形状データを取得するため、高い撮像倍率の撮像データを撮像していない場合には適用することができなかった。特許文献２に記載の構成は、画像情報の他、撮像時の被写体距離の情報を必要とするため、当該被写体距離の情報を取得していない場合には適用することができなかった。

　以上のような事情に鑑み、本技術の目的は、入力画像の被写体である面領域を、容易にかつ精度よく所望の形状に変形することが可能な画像処理装置及び画像処理方法を提供することにある。

　上記目的を達成するため、本技術の一形態に係る画像処理装置は、曲線算出部と、ホモグラフィ推定部とを具備する。
　上記曲線算出部は、第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出する。
　上記ホモグラフィ推定部は、上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定する。

　上記構成によれば、輪郭の近似曲線に基づいて、第１の面領域から第２の面領域へ変換するホモグラフィを推定することが可能となる。したがって、第１の面領域から知覚される湾曲状態を輪郭の近似曲線で把握し、第１の面領域を、異なる湾曲状態と知覚される第２の面領域へ容易にかつ精度よく変換することが可能となる。

　また、上記曲線算出部は、上記近似曲線に基づいて上記第１の面領域を分割する複数の分割曲線を算出し、
　上記ホモグラフィ推定部は、上記近似曲線及び上記複数の分割曲線に基づいて、上記ホモグラフィを推定してもよい。

　これにより、第１の面領域内部の湾曲状態を複数の分割曲線で把握することが可能となり、より精度の高い変換が可能となる。

　また、上記曲線算出部は、上記近似曲線をスプライン曲線として算出してもよい。

　これにより、輪郭をより滑らかで安定的に近似することが可能となる。

　また、上記近似曲線は、相互に対向する２本の近似曲線を含む近似曲線対を有し、
　上記複数の分割曲線は、上記近似曲線対から推定される複数の曲線を含む曲線群を有してもよい。

　これにより、例えば長方形等の面と知覚される第１の面領域を近似曲線対及び曲線群によって所定の方向に分割することが可能となり、高い精度で湾曲状態を把握することが可能となる。

　この場合に、上記近似曲線は、相互に対向する２本の近似曲線をそれぞれ含む２つの近似曲線対を有し、
　上記複数の分割曲線は、上記２つの近似曲線対各々から推定される２つの曲線群を有してもよい。

　これにより、第１の面領域を２方向により細かく分割し、より高い精度で湾曲状態を把握することが可能となる。

　具体的には、上記２つの近似曲線対と、上記２つの曲線群とによって形成された複数の交点に基づいて上記ホモグラフィを推定してもよい。

　さらに、この場合に、上記ホモグラフィ推定部は、上記２つの近似曲線対及び上記２つの曲線群によって区画される複数の分割片各々を、隣接する分割片と重複するように拡大して複数の拡大分割片を形成し、上記複数の拡大分割片各々の頂点に基づいて上記ホモグラフィを推定してもよい。

　これにより、拡大分割片を用いることで、隣接する分割片間のホモグラフィを平滑化することができ、より安定化したホモグラフィを推定することができる。

　また、上記第１の面領域の輪郭は、曲線状であり、
　上記ホモグラフィ推定部は、上記近似曲線を直線状に伸ばして形成された複数の第１の直線と、上記複数の分割曲線を直線状に伸ばして形成された複数の第２の直線とに基づいて、上記ホモグラフィを推定してもよい。

　これにより、湾曲していると知覚される第１の面領域を、平面と知覚される面領域に変換し、ホモグラフィを推定することができる。

　この場合に、上記ホモグラフィ推定部は、上記複数の第１の直線により区画された台形状の第３の面領域の形状についての情報と、上記入力画像の撮像角度情報とに基づいて、上記第２の面領域のアスペクト比情報を算出し、上記アスペクト比情報に基づいて上記ホモグラフィを推定してもよい。

　第３の面領域の形状についての情報と、上記撮像角度情報とによって、台形補正と同様の手法により、第２の面領域のアスペクト比情報を算出することができる。したがって、より容易にホモグラフィを推定することができる。

　また、上記入力画像から上記第１の面領域の輪郭を検出する輪郭検出部をさらに具備し、
　上記曲線算出部は、上記検出された輪郭に基づいて上記近似曲線を算出してもよい。

　これにより、画像処理装置により、輪郭を検出することが可能となる。

　より具体的には、上記輪郭検出部は、上記入力画像のエッジ検出結果に基づいて上記第１の面領域の複数の輪郭候補を検出し、上記複数の輪郭候補から上記第１の面領域の輪郭を選出することで、上記第１の面領域の輪郭を検出してもよい。

　この場合に、上記輪郭検出部は、上記複数の輪郭候補のうち、囲む面積が最も大きいという第１の条件、及び各輪郭候補をオブジェクトとした場合のバウンディングボックスの中心点が上記入力画像の中心点に最も近いという第２の条件の少なくとも一方の条件を満たす輪郭候補を、上記第１の面領域の輪郭として選出してもよい。

　これにより、第１の面領域が入力画像中で大きな領域を占め、あるいは入力画像の中央部に写っていると推定できる場合、第１の面領域の輪郭を精度よく選出することができる。
上記入力画像は、見開き２ページの書籍類の画像を含み、

　また、上記第１の面領域は、上記書籍類の見開き１ページに対応する領域であり、
　上記輪郭検出部は、上記書籍類のページ分割線を検出し、上記ページ分割線を上記第１の面領域の輪郭の一部として検出してもよい。

　これにより、エッジ検出等によって検出することが難しい書籍類のページ分割線を検出することが可能となる。

　本技術の他の形態に係る画像処理方法は、
　第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出するステップと、
　上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定するステップとを含む。

　本技術のさらに他の形態に係るプログラムは、
　情報処理装置に、
　第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出するステップと、
　上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定するステップと
　を実行させる。

　以上のように、本技術によれば、入力画像の被写体である面領域を、容易にかつ精度よく所望の形状に変形することが可能な画像処理装置及び画像処理方法を提供することが可能となる。
　なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本技術の第１の実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。上記画像処理装置の機能的構成を示すブロック図である。上記画像処理装置の動作例を示すフローチャートである。上記画像処理装置の処理に供される入力画像の例を示す図である。上記画像処理装置の輪郭検出部による輪郭検出処理例を示すフローチャートである。上記入力画像中の第１の面領域を含む被写体領域と、当該被写体領域の周囲の背景領域との輝度の差（コントラスト）について説明する図である。上記コントラストの他の検出例について説明する図である。上記輪郭検出処理におけるテクスチャ除去後の上記入力画像の例を示す図である。上記輪郭検出処理における輪郭線候補の検出例を示す図である。上記画像処理装置の曲線算出部による近似曲線及び複数の分割曲線の算出処理例を示す図である。上記画像処理装置のホモグラフィ推定部によるホモグラフィ推定処理例を示すフローチャートである。Ａは、上記ホモグラフィ推定部による２つの近似曲線対、第１の曲線群及び第２の曲線群の出力例を示す図であり、Ｂは、Ａに示す一つの分割片を模式的に示す図である。Ａは、上記ホモグラフィ推定部による複数の第１の直線及び複数の第２の直線の出力例を示す図であり、Ｂは、Ａに示す一つの分割片を模式的に示す図である。上記ホモグラフィ推定部により第２の面領域に変換された一つの分割片を模式的に示す図である。上記入力画像と上記画像処理装置による出力画像の一例を示す図である。上記入力画像と上記画像処理装置による出力画像の他の例を示す図である。変形例１－１に係る画像処理装置のページ分割線を検出する処理について説明する図であり、ＢはＡの拡大図を示す。変形例１－１に係る画像処理装置のページ分割線を検出する他の処理について説明する図である。画像処理装置により算出された２つの近似曲線対及び２つの曲線群が歪んでいた場合の第３の面領域の出力例を示す図であり、Ａは入力画像、Ｂは出力画像の例を示す。変形例１－２を説明するための図であり、Ａは第１の面領域を示す拡大図、Ｂは第２の面領域を示す拡大図である。出力画像を拡大した模式的な図であり、Ａは、変形例１－３に係る奥行きの調整を行わない場合の例を示し、Ｂは当該奥行きの調整を行う場合の例を示す。変形例１－４に係る画像処理装置の機能的構成を示すブロック図である。変形例１－１２に係る画像処理装置のハードウェア構成を示す図である。本技術の第２の実施形態に係る画像処理システムの概略構成を示すブロック図である。上記画像処理システムの機能的構成を示すブロック図である。本技術の第３の実施形態に係る画像処理システムの概略構成を示すブロック図である。上記画像処理システムの機能的構成を示すブロック図である。本技術の第４の実施形態に係る画像処理システムの概略構成を示すブロック図である。上記画像処理システムの機能的構成を示すブロック図である。変形例４－２に係る画像処理システムの機能的構成を示すブロック図である。

　以下、本技術に係る実施形態を、図面を参照しながら説明する。

　＜第１の実施形態＞
　［画像処理装置のハードウェア構成］
　図１は、本技術の第１の実施形態に係る画像処理装置１００のハードウェア構成を示すブロック図である。画像処理装置１００は、具体的には、スマートフォン、タブレット端末、ウェアラブル機器、ＰＣ（Personal Computer）、タブレットＰＣ等の情報処理装置や、情報処理が可能な構成の撮像装置、電子書籍等を生成するドキュメントスキャナ装置等とすることができる。

　同図において、画像処理装置１００は、コントローラ１１、ＲＯＭ（Read Only Memory）１２、ＲＡＭ（Random Access Memory）１３、入出力インタフェース１５、及び、これらを互いに接続するバス１４を備える。

　コントローラ１１は、必要に応じてＲＡＭ１３等に適宜アクセスし、各種演算処理を行いながら画像処理装置１００の各ブロック全体を統括的に制御する。コントローラ１１は、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）等であってもよい。ＲＯＭ１２は、コントローラ１１に実行させるＯＳ、プログラムや各種パラメータなどのファームウェアが固定的に記憶されている不揮発性のメモリである。ＲＡＭ１３は、コントローラ１１の作業用領域等として用いられ、ＯＳ、実行中の各種アプリケーション、処理中の各種データを一時的に保持する。

　入出力インタフェース１５には、ディスプレイ１６、操作受付部１７、記憶部１８、通信部１９、撮像部２０等が接続される。

　ディスプレイ１６は、例えばＬＣＤ（Liquid Crystal Display）、ＯＬＥＤ（Organic Light Emitting Diode）、ＣＲＴ（Cathode Ray Tube）等を用いた表示デバイスである。

　操作受付部１７は、例えばマウス等のポインティングデバイス、キーボード、タッチパネル、その他の入力装置である。操作受付部１７がタッチパネルである場合、そのタッチパネルはディスプレイ１６と一体となり得る。

　記憶部１８は、例えばＨＤＤ（Hard Disk Drive）や、フラッシュメモリ（ＳＳＤ；Solid State Drive）、その他の固体メモリ等の不揮発性メモリである。当該記憶部１８には、上記ＯＳや各種アプリケーション、各種データが記憶される。記憶部１８は、また、後述する入力画像や、画像情報、生成した空間フィルタ、生成した出力画像群等を記憶することが可能に構成される。

　通信部１９は、３Ｇ（Third Generation）やＬＴＥ（Long Term Evolution）等の広域通信システム、Wi Fi（登録商標）等の無線ＬＡＮ（Local Area Network）通信システム、あるいは有線ＬＡＮ通信システム等によりネットワークに通信可能に構成される。

　撮像部２０は、被写体の光画像から画像データを得る。撮像部２０は、図示しない撮像光学系及びイメージセンサを有してもよい。撮像光学系は、被写体の光画像をイメージセンサの撮像面上に結像させる。イメージセンサは、ＣＣＤ（Charge Coupled Device）センサやＣＭＯＳ（Complementary Metal Semiconductor）センサ等により実現され、結像された光画像を電気信号に変換し、画像データを得る。なお、撮像部２０は、スキャナカメラとして構成されてもよい。

　以上のようなハードウェア構成の画像処理装置１００において、コントローラ１１、及びディスプレイ１６は、以下のような機能的構成を有する。

　［画像処理装置の機能的構成］
　図２は、画像処理装置１００の機能的構成を示すブロック図である。同図に示すように、画像処理装置１００は、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４と、表示部１０５とを備える。画像処理装置１００は、以下に説明するように、入力画像の被写体である第１の面領域の輪郭を検出し、その情報を用いて第１の面領域を第２の面領域に変換する。これにより、例えば入力画像中の被写体である湾曲面を平坦面に変換することが可能となる。

　輪郭検出部１０１は、入力画像から第１の面領域の輪郭を検出する。輪郭検出部１０１は、例えば、コントローラ１１により実現される。入力画像は、例えば、撮像部２０により撮像された画像であってもよいし、他の装置等によって撮像され記憶部１８に記憶された画像であってもよい。

　ここでいう「輪郭」は、第１の面領域を囲む輪郭をいう。また、輪郭に含まれる各線分を、以下、「輪郭線」と称する。

　第１の面領域は、入力画像に被写体として含まれる領域であって、例えば湾曲した面として知覚される領域である。以下の説明において「知覚される」とは、輪郭や面領域内部の文字・図形情報等に基づき、画像を鑑賞するユーザの視覚によって認識されることをいう。第１の面領域の具体例は特に限定されないが、例えば、見開き２ページの書籍類の画像の見開き１ページに対応する領域とすることができる。ここでいう「書籍類」とは、綴じ部を有する書籍や冊子、雑誌等や、折り目を有するパンフレットや新聞等を含むものをいう。あるいは、被写体は、柱等の曲面に貼り付けられ、又は曲面に印刷された掲示物等であってもよい。

　輪郭検出部１０１は、例えば、入力画像のエッジ検出結果に基づいて第１の面領域の複数の輪郭候補を検出し、当該複数の輪郭候補のうちから第１の面領域の輪郭を選出することで、第１の面領域の輪郭を検出してもよい。

　輪郭検出部１０１は、入力画像を縮小した縮小入力画像から第１の面領域の輪郭を検出してもよい。これにより、ノイズを省いた状態での輪郭検出が可能となる。この場合、「入力画像」とは、縮小入力画像も含むものとする。

　輪郭検出部１０１の輪郭検出方法は特に限定されず、例えば、エッジ検出やテクスチャ除去、直線検出等の技術を適宜組み合わせて用いることができる。輪郭検出部１０１の詳細な処理例については、後述する。

　曲線算出部１０２は、第１の面領域を被写体として含む入力画像に基づいて第１の面領域の輪郭の近似曲線を算出する。曲線算出部１０２は、例えば、コントローラ１１により実現される。曲線算出部１０２は、本実施形態において、輪郭検出部１０１により検出された輪郭に基づいて近似曲線を算出することができる。

　ここでいう「輪郭の近似曲線を算出」とは、検出された輪郭の通過する入力画像中の座標位置を算出し、当該座標位置に基づいて近似曲線を算出することをいう。近似曲線は、スプライン曲線、ベジエ曲線、ラグランジェ曲線等を適用することができる。なお、近似曲線は、上記算出方法により算出できる線であって、実際は曲線に限定されず、直線であってもよい。

　近似曲線は、相互に対向する２本の近似曲線を含む近似曲線対を有していてもよく、あるいは、相互に対向する２本の近似曲線をそれぞれ含む２つの近似曲線対を有していてもよい。

　曲線算出部１０２は、本実施形態において、近似曲線に基づいて第１の面領域を分割する複数の分割曲線を算出してもよい。

　複数の分割曲線は、上記輪郭の近似曲線を参照して第１の面領域内を分割することで、第１の面領域の湾曲状態を視覚的に表す曲線となり得る。複数の分割曲線は、例えば近似曲線が近似曲線対を有する場合には、近似曲線対から推定される複数の曲線を含む曲線群を有していてもよい。曲線群に含まれる複数の曲線は、略均等な間隔で配列されていてもよい。あるいは、複数の分割曲線は、例えば近似曲線が２つの近似曲線対を有する場合には、２つの近似曲線対各々から推定される２つの曲線群を有していてもよい。

　曲線算出部１０２は、本実施形態において、近似曲線及び複数の分割曲線をスプライン曲線として算出してもよい。これにより、より滑らかで精度の高い曲線近似が可能となる。

　ホモグラフィ推定部１０３は、近似曲線に基づいて、第１の面領域を第２の面領域へ変換するホモグラフィを推定する。ホモグラフィ推定部１０３は、例えば、コントローラ１１により実現される。

　「ホモグラフィ」とは、一般に、３×３の射影変換行列であり、ここでは第１の面領域の属する平面座標系から第２の面領域の属する平面座標系へ変換する行列をいう。ホモグラフィは、一般に、２つの平面座標系の４点以上の点の対応関係に基づいて算出される。

　第２の面領域は、第１の面領域とは異なる湾曲状態を有すると知覚される面領域である。第２の面領域は、例えば、平坦であると知覚される領域であってもよく、さらに、平坦であって当該第２の面領域から知覚される法線方向とディスプレイ１６の表示面の法線方向とが略同一であると知覚される領域であってもよい。

　ホモグラフィ推定部１０３は、本実施形態において、近似曲線及び複数の分割曲線に基づいて、ホモグラフィを推定してもよい。より具体的には、ホモグラフィ推定部１０３は、曲線算出部１０２によって算出された一方の曲線群と他方の曲線群との複数の交点に基づいてホモグラフィを推定してもよい。これにより、上記複数の交点と、第２の面領域における上記複数の交点に対応する点とに基づいて、ホモグラフィを容易に算出することができる。なお、ホモグラフィ推定部１０３の詳細な処理例については、後述する。

　出力画像生成部１０４は、推定されたホモグラフィを用いて第１の面領域が第２の面領域へ変換された出力画像を生成する。出力画像生成部１０４は、例えばコントローラ１１により実現される。

　表示部１０５は、生成された出力画像を表示する。表示部１０５は、例えばディスプレイ１６により実現される。

　以下、上記構成の画像処理装置１００の動作例について説明する。

　［画像処理装置の動作］
　図３は、画像処理装置１００の動作例を示すフローチャートである。

　まず、輪郭検出部１０１が入力画像から第１の面領域の輪郭を検出する（ＳＴ３１）。

　図４は、入力画像の例を示す図である。同図に示すように、入力画像Ｉｇの被写体は見開き２ページの書籍であって、各ページが長方形の面で構成されるものとする。また、第１の面領域Ｓ１は、当該書籍の画像の見開き１ページに対応する領域とし、当該書籍の綴じてある部分は、綴じ部と表現されるものとする。なお、図中のｘ軸方向は入力画像の上下方向を示し、ｙ軸方向はｘ軸方向に直交する入力画像の水平方向を示す。

　図５は、輪郭検出部１０１による輪郭検出処理例を示すフローチャートである。

　輪郭検出部１０１は、入力画像を縮小して縮小入力画像を生成する（ＳＴ５１）。以下の輪郭検出処理例においては、輪郭検出部１０１が縮小入力画像に対して処理を行うため、明記しない限り「入力画像」が「縮小入力画像」を示すものとする。

　続いて輪郭検出部１０１は、入力画像中の第１の面領域を含む被写体領域と、被写体領域の周囲の背景領域との輝度の差（コントラスト）を検出する（ＳＴ５２）。コントラストを検出することで、後述するエッジ検出処理及び直線検出処理において最適な閾値を設定することが可能となる。

　図６は、上記コントラストについて説明する図である。同図Ａは、被写体領域Ｓと背景領域Ｂのコントラストが低い。一方、同図Ｂは被写体領域Ｓと背景領域Ｂのコントラストが高い。このようなコントラストの高低は、例えば、画像認識技術等によって被写体領域Ｓを検出し、当該検出された被写体領域Ｓの輝度の平均値と背景領域Ｂの輝度の平均値とを比較することで、検出することができる。

　図７は、上記コントラストの他の検出例について説明する図である。コントラストは、より簡易に検出してもよい。例えば同図に示すように、入力画像の中央部Ｃに被写体領域Ｓが配置され、入力画像の周縁部Ｐに背景領域Ｂが配置されていると推定される場合、入力画像を中央部Ｃと周縁部Ｐとにセグメント分割する。そして、中央部Ｃと周縁部Ｐとで各々の輝度の平均値を算出し、各平均値を比較することで、上記コントラストを検出することができる。

　続いて輪郭検出部１０１は、エッジ検出を行う（ＳＴ５３）。この際、上記コントラストの検出結果に基づいて、エッジ検出における閾値を設定することができる。エッジ検出方法は特に限定されないが、例えば、キャニー（Ｃａｎｎｙ）フィルタを用いることができる。これにより、精度よくエッジ検出を行うことが可能となる。

　続いて輪郭検出部１０１は、テクスチャ除去処理を行う（ＳＴ５４）。これにより、図８に示すように、テクスチャ除去後の入力画像が出力され得る。テクスチャ除去処理方法については特に限定されない。

　続いて輪郭検出部１０１は、輪郭線候補を検出する（ＳＴ５５）。まず輪郭検出部１０１は、輪郭線候補検出処理として、例えば直線検出を行うことができる。この際、輪郭検出部１０１は、上記コントラストの検出結果に基づいて直線検出における閾値を設定することができる。直線検出方法は特に限定されないが、例えばハフ（Ｈｏｕｇｈ）変換を用いることができる。これにより、図９Ａに示すように、ｙ軸方向と４５度以下の鋭角をなす複数の輪郭線候補Ｌｃ１，Ｌｃ２，Ｌｃ３が検出され得る。

　さらに輪郭検出部１０１は、輪郭線候補検出処理として、図８に示したテクスチャ除去後の出力から上下方向に近い方向に沿った２本の輪郭線候補（第１の輪郭線候補対）等を除去した線分であって、ｘ軸方向と４５度以下の鋭角をなす方向に沿った複数の輪郭線候補Ｌｃ４，Ｌｃ５，Ｌｃ６を検出することができる（図９Ｂ参照）。

　なお以下の説明において、ｙ軸方向と４５度以下の鋭角をなす方向を、「上下方向に近い方向」と表現し、ｘ軸方向と４５度以下の鋭角をなす方向を、「水平方向に近い方向」と表現するものとする。

　続いて輪郭検出部１０１は、第１の面領域の複数の輪郭候補を検出する（ＳＴ５６）。ここでいう輪郭候補とは、上下方向に近い方向に沿った２本の輪郭線候補（第１の輪郭線候補対）と、水平方向に近い方向に沿った２本の輪郭線候補（第２の輪郭線候補対）との組をいうものとする。

　具体的には、輪郭検出部１０１は、まず水平方向に近い方向に沿った輪郭線候補Ｌｃ４～Ｌｃ６のうち、上下方向に近い方向に沿った輪郭線候補Ｌｃ１～Ｌｃ３の各端点から所定以下の距離にある輪郭線候補が存在するか否か判定する。存在すると判定された場合、輪郭検出部１０１は、当該端点を有する上下方向に近い方向に沿った輪郭線候補を第１の輪郭線候補対とし、所定以下の距離にあると判定された水平方向に近い方向に沿った輪郭線候補を第２の輪郭線候補対とすることができる。さらに、輪郭検出部１０１は、これら第１の輪郭線候補対と第２の輪郭線候補の組を１つの輪郭候補と検出することができる。

　なお、綴じ部の輪郭線候補が検出できなかった場合は、後述する変形例１－１のページ分割処理を行うことができる。

　続いて輪郭検出部１０１は、上記複数の輪郭候補から第１の面領域の輪郭を選出する（ＳＴ５７）。これにより、上下方向に近い方向に沿った第１の輪郭線対及び水平方向に近い方向に沿った第２の輪郭線対を含む第１の面領域の輪郭が検出され得る。

　輪郭の選出方法は特に限定されないが、以下のように行うことができる。例えば輪郭検出部１０１は、複数の輪郭候補のうち、囲む面積が最も大きいという第１の条件、及び各輪郭候補をオブジェクトとした場合のバウンディングボックスの中心点が入力画像の中心点に最も近いという第２の条件の少なくとも一方の条件を満たす輪郭候補を、第１の面領域の輪郭として選出することができる。また、輪郭の選出方法は、第１の条件及び第２の条件の双方の条件を満たす輪郭候補を選出してもよいし、いずれか一方の条件を満たす輪郭候補を選出してもよい。

　続いて輪郭検出部１０１は、選出された輪郭に含まれる各輪郭線のマージ処理を行う（ＳＴ５８）。輪郭検出部１０１は、例えば、第２の輪郭線対と第１の輪郭線対との距離、及び隣接する輪郭線のなす角度を算出し、これらの情報に基づいて隣接する輪郭線をマージする処理を行うことができる。

　続いて輪郭検出部１０１は、縮小入力画像を元のサイズに拡大し、微調整を行う（ＳＴ５９）。これにより、仮に縮小入力画像上でのわずかな誤差がサイズの拡大に伴い大きな誤差となった場合であっても、その誤差を補正することが可能となる。

　輪郭検出部１０１は、以上の各ステップ５１～５９により第１の面領域の輪郭を検出することが可能となる。

　図３の処理に戻り、続いて曲線算出部１０２が、第１の面領域を被写体として含む入力画像に基づいて第１の面領域の輪郭の近似曲線を算出する（ＳＴ３２）。ここでは、曲線算出部１０２が、輪郭検出部１０１により検出された輪郭に基づいて近似曲線を算出する。曲線算出部１０２は、近似曲線をスプライン曲線として算出する。

　続いて曲線算出部１０２が、算出した近似曲線に基づいて第１の面領域を分割する複数の分割曲線を算出する（ＳＴ３３）。

　図１０は、近似曲線及び複数の分割曲線の算出処理例を示す図である。同図に示すように、近似曲線は、相互に対向する２本の近似曲線を含む第１の近似曲線対Ａｐ１と、相互に対向する２本の第２の近似曲線対Ａｐ２とを含む。第１の近似曲線対Ａｐ１は第１の輪郭対の近似曲線であり、第２の近似曲線対Ａｐ２は第２の輪郭対の近似曲線である。また、複数の分割曲線は、２つの近似曲線対各々から推定される２つの曲線群を有する。すなわち、複数の分割曲線は、第１の近似曲線対Ａｐ１から推定される複数の曲線を含む第１の曲線群Ａｇ１を有し、第２の近似曲線対Ａｐ２から推定される複数の曲線を含む第２の曲線群Ａｇ２を有する。

　第１の曲線群Ａｇ１に含まれる複数の曲線は、例えば、第１の近似曲線対Ａｐ１各々のスプライン曲線の係数から各曲線の係数を推定することにより、算出することができる。また第２の曲線群Ａｇ２に含まれる複数の曲線も同様に、第２の近似曲線対Ａｐ２各々のスプライン曲線の係数から各曲線の係数を推定することにより、算出することができる。

　続いてホモグラフィ推定部１０３が、近似曲線に基づいて、第１の面領域を第２の面領域へ変換するホモグラフィを推定する（ＳＴ３４）。ホモグラフィ推定部１０３は、本実施形態において、近似曲線及び複数の分割曲線に基づいて、第１の面領域を第２の面領域へ変換するホモグラフィを推定する。

　本動作例では、ホモグラフィ推定部１０３は、以下の２段階により第１の面領域と第２の面領域との対応関係を算出し、ホモグラフィを推定する。まず第１の段階は、湾曲していると知覚され得る第１の面領域を、平坦であると知覚され得る台形状の第３の面領域に変換し、これらの対応関係について算出する。第２の段階は、第３の面領域を、平坦であって表示領域の法線方向と一致する法線方向を有すると知覚される第２の面領域に変換し、これらの対応関係を算出する。以下、詳細に説明する。

　図１１は、ホモグラフィ推定部１０３によるホモグラフィ推定処理例を示すフローチャートである。

　まずホモグラフィ推定部１０３が、２つの近似曲線対と、２つの曲線群とによって形成された複数の交点の座標位置を算出する（ＳＴ１１１）。

　図１２Ａは、２つの近似曲線対、第１の曲線群及び第２の曲線群の出力例を示す図である。同図に示すように、第１の面領域Ｓ１に対応する領域には、２つの近似曲線対Ａｐ１，Ａｐ２及び２つの曲線群Ａｇ１，Ａｇ２によって区画される複数の分割片Ｄａが形成されている。また、第１の面領域の輪郭は曲線状であり、２つの近似曲線対Ａｐ１，Ａｐ２及び２つの曲線群Ａｇ１，Ａｇ２も曲線状に形成される。なお、説明のため、図１０に示す分割曲線の数と図１２Ａに示す分割曲線の数とは異なっている。

　図１２Ｂは、図１２Ａに示す一つの分割片Ｄａを模式的に示す図である。同図に示す分割片Ｄａ各々の頂点（Ａｖ１～Ａｖ４）は、上記複数の交点となり得る。

　続いてホモグラフィ推定部１０３が、近似曲線を直線状に伸ばして形成された複数の第１の直線と、複数の分割曲線を直線状に伸ばして形成された複数の第２の直線とによって形成された複数の交点の座標位置を算出する（ＳＴ１１２）。当該複数の交点（以下、直線による交点と称する）の座標位置は、以下のように算出することができる。すなわちホモグラフィ推定部１０３は、隣接する交点間の曲線の長さに基づいて、この交点間の曲線が直線であった場合の２つの近似曲線対と２つの曲線群とによって形成された複数の交点（以下、元の交点と称する）に対応する座標位置を算出することにより、直線による複数の交点を算出することができる。

　図１３Ａは、複数の第１の直線及び複数の第２の直線の出力例を示す図である。同図に示すように、第１の面領域に対応する領域は、複数の第１の直線Ｒ１により区画された台形状の第３の面領域Ｓ３に変換されている。また、第３の面領域Ｓ３には、複数の第１の直線Ｒ１及び複数の第２の直線Ｒ２によって区画される複数の台形状の分割片Ｄｒが形成されている。

　図１３Ｂは、図１３Ａに示す一つの分割片Ｄｒを模式的に示す図である。同図に示す台形状の分割片Ｄｒ各々の頂点（Ｒｖ１～Ｒｖ４）は、図１２Ｂに示す各頂点Ａｖ１～Ａｖ４にそれぞれ対応し、上記直線による交点となり得る。

　続いてホモグラフィ推定部１０３が、第３の面領域の形状についての情報と、入力画像の撮像角度情報とに基づいて、第２の面領域のアスペクト比情報を算出する（ＳＴ１１３）。これにより、ホモグラフィ推定部１０３は、当該アスペクト比情報に基づいてホモグラフィを推定することが可能となる。

　図１３Ｂを参照し、ホモグラフィ推定部１０３は、第３の面領域Ｓ３の上辺の長さｗ及び高さｈを検出することで、第３の面領域Ｓ３の形状についての情報を算出することができる。ホモグラフィ推定部１０３は、当該形状についての情報と撮像角度情報とに基づいて、同図Ｂに示す第２の面領域Ｓ２のアスペクト比情報を算出することができる。

　ここでいう形状についての情報とは、上述の上辺の長さ及び高さの情報に限定されず、例えば下辺の長さ及び高さの情報でもよく、あるいは上辺の長さ、下辺の長さ及び高さ等の情報であってもよい。また、撮像角度情報は、いわゆる「垂直方向のビューアングル（垂直画角）」の情報を含み、例えば、入力画像のメタデータとして記憶されている。また、アスペクト比情報とは、第２の面領域Ｓ２の幅ｗ'及び高さｈ'の比をいう（図１４参照）。

　続いて、ホモグラフィ推定部１０３が、上記アスペクト比情報に基づいて、第２の面領域Ｓ２において上記直線による交点に対応する座標位置をそれぞれ算出する（ＳＴ１１４）。

　図１４は、図１２Ｂ及び図１３Ｂと同様に、第２の面領域Ｓ２に変換された一つの分割片Ｄｂを模式的に示す図である。同図に示す長方形状の分割片Ｄｂ各々の頂点（Ｂｖ１～Ｂｖ４）は、図１３Ｂに示す各頂点Ｒｖ１～Ｒｖ４、及び図１２Ｂに示す各頂点Ａｖ１～Ａｖ４にそれぞれ対応する。

　続いて、ホモグラフィ推定部１０３が、複数の元の交点の座標位置と、第２の面領域Ｓ２において上記直線による交点に対応する座標位置とに基づいて、第１の面領域を第２の面領域へ変換するホモグラフィを推定する（ＳＴ１１５）。ホモグラフィ推定部１０３による具体的なホモグラフィの推定方法は特に限定されない。例えば、ホモグラフィ推定部１０３は、各分割片毎にホモグラフィを推定することができる。また、ホモグラフィ推定部１０３は、例えば第１の面領域を第２の面領域へ直接変換するホモグラフィを推定してもよい。あるいは、ホモグラフィ推定部１０３は、複数の元の交点の座標位置と、直線による交点の座標位置とに基づいて第１の面領域を第３の面領域へ変換する第１のホモグラフィを推定し、直線による交点の座標位置と第２の面領域において直線による交点に対応する座標位置とに基づいて第３の面領域を第１の面領域へ変換する第２のホモグラフィを推定し、第１のホモグラフィと第２のホモグラフィとに基づいて上記ホモグラフィを推定してもよい。

　ホモグラフィ推定部１０３は、以上の各ステップ１１１～１１５によりホモグラフィを算出することが可能となる。

　図３の処理に戻り、続いて出力画像生成部１０４が、推定されたホモグラフィを用いて第１の面領域が第２の面領域へ変換された出力画像を生成する（ＳＴ３５）。

　図１５は、入力画像Ｉｇと出力画像Ｏｇとの一例を示す図であり、図１６は、入力画像Ｉｇと出力画像Ｏｇとの他の例を示す図である。これらの図に示すように、出力画像生成部１０４は、ディスプレイ１６の表示面の法線方向と略同一の法線方向を有するように知覚される第２の面領域を含む出力画像を出力することが可能となる。

　最後に表示部１０５が、生成された出力画像を表示する（ＳＴ３６）。この出力画像を鑑賞したユーザは、操作受付部１７等によりこの出力画像を記憶部１８に記憶させることが可能となる。

　以上のように、本実施形態によれば、第１の面領域の輪郭の近似曲線に基づいてホモグラフィを推定することが可能となる。したがって、第１の面領域から知覚される湾曲状態を輪郭の近似曲線で把握でき、容易にかつ精度よく第２の面領域へ変換することが可能となる。

　また、本実施形態によれば、２つの近似曲線対と２つの曲線群の交点の座標位置と、これらの曲線を直線状に伸ばした場合の直線による交点の座標位置、及び第３の面領域を台形補正した第２の面領域において直線による交点に対応する座標位置に基づいて、第１の面領域から第２の面領域へ変換するホモグラフィを推定することが可能となる。したがって、本実施形態によれば、複数枚の入力画像等を必要とせずに、入力画像の被写体である第１の面領域を容易にかつ精度よく第２の面領域に変形することが可能となる。

　さらに、本実施形態によれば、第１の面領域の輪郭線を曲線近似法によって算出するため、入力画像中の第１の面領域（処理対象）に対する制約を非常に少なくすることができる。例えば、第１の面領域の輪郭線の一部が他の被写体等によって隠れていた場合であっても、当該隠れた輪郭線部分を滑らかに補間することが可能となる。あるいは、第１の面領域に、曲面を示す手掛かりとなり得る影等が写っていない場合であっても処理を行うことが可能となる。したがって、より汎用性が高い技術を提供することが可能となる。

　［変形例１－１］
　第１の輪郭線候補対は、輪郭線候補検出処理（ＳＴ５５）によって２本の輪郭線候補が検出される例に限定されず、綴じ部と対向する１本の輪郭線候補のみ検出されていればよい。この場合は、上述の処理に加えて以下のような処理を行うことができる。

　輪郭検出部１０１は、書籍類のページ分割線を検出し、ページ分割線を第１の面領域の輪郭の一部として検出してもよい。ページ分割線とは、書籍類の綴じ部や折り目に沿った輪郭線をいうものとする。この場合、入力画像は、見開き２ページの書籍類の画像を含み、第１の面領域は、見開き２ページの書籍類の見開き１ページに対応する領域とすることができる。

　ページ分割線を検出する処理は、以下の３つの処理を有してもよい。第１の処理は、水平方向に近い方向に沿った輪郭線の傾きによりページ分割線を検出する処理である。第２の処理は、影を検出することによりページ分割線を検出する処理である。第３の処理は、各ピクセルの輝度の分散値に基づいてページ分割線を検出する処理である。ページ分割線を検出する処理としては、第１の処理から第３の処理までのいずれか１つ又は２つの処理を行ってもよいし、全ての処理を行ってもよい。

　図１７は、上記第１の処理について説明する図であり、ＢはＡの拡大図を示す。図１７Ａに示すように、水平方向に近い方向に沿った各輪郭線Ｌ３，Ｌ４上には、当該輪郭線の傾きの変化の大きさが所定以上となる点がプロットされている。輪郭検出部１０１は、隣接する点の間隔が所定の間隔以下となる点、あるいは当該輪郭線の傾きの変化の大きさが最も大きくなる点等を検出し、その点を輪郭線（ページ分割線）Ｌ２の端点と決定することができる。なお、同図中の符号Ｌ１は、上下方向に近い方向に沿った輪郭線であって、輪郭線Ｌ２と対向する輪郭線を示す。

　ここで、上部の輪郭線Ｌ３は、図１７Ａに示すように、ページ分割線付近の傾きの変化が顕著であり、ページ分割線Ｌ２の端点の決定が比較的容易である。一方で下部の輪郭線Ｌ４は、図１７Ｂの拡大図に示すように、傾きの変化が緩やかな場合が多く、ページ分割線Ｌ２の端点の決定が難しいことがある。その場合は、上記第２の処理、第３の処理によって端点を決定すればよい。

　第２の処理は、ページ分割線Ｌ２に沿って影が形成され得ることを利用する。したがって、例えば第１の処理によって決定されたページ分割線Ｌ２の上部の端点から影に沿って下方へ辿り、影が途切れた点をページ分割線Ｌ２の下部の端点と決定することができる。

　図１８は、上記第３の処理について説明する図である。同図に示すように、本処理では、輪郭検出部１０１が、例えば第１の処理によって決定されたページ分割線Ｌ２の上部の端点Ｐｎ２１から異なるラインＬｎ１～Ｌｎ４上をスキャニングして、各ピクセルの輝度の分散値が最も低いラインＬｎ４をページ分割線Ｌ２として決定する。これにより、書籍類において他の領域と比較して文字や図等が少ないページ分割線を検出することができる。

　ページ分割線を検出する処理は、例えば、マージ処理（ＳＴ５８）の後に行ってもよいし、輪郭選出処理（ＳＴ５７）の後に行ってもよい。また、輪郭候補が第１の輪郭線候補対として１本の輪郭線候補のみ有している場合、輪郭選出処理（ＳＴ５７）において説明した「囲む面積」については、第２の輪郭線候補対の端点を結ぶ輪郭線候補を仮想的に想定し、面積を算出してもよい。

　本変形例により、綴じ部の輪郭線が検出できなかった場合や、検出された輪郭線の信頼性が低いような場合であっても、確実に綴じ部の輪郭線を検出することが可能となる。

　［変形例１－２］
　ホモグラフィ推定部１０３は、２つの近似曲線対及び２つの曲線群によって区画される複数の分割片各々を、隣接する分割片と重複するように拡大して複数の拡大分割片を形成し、複数の拡大分割片各々の頂点に基づいてホモグラフィを推定してもよい。

　図１９は、算出された２つの近似曲線対及び２つの曲線群が歪んでいた場合の第３の面領域の出力例を示す図であり、Ａは入力画像Ｉｇ、Ｂは出力画像Ｏｇの例を示す。なお、この例では、出力画像Ｏｇは台形状の第２の面領域Ｓ２を含むものとする。

　ホモグラフィ推定部１０３は、図１９Ａに示すような歪んでいる２つの近似曲線対及び２つの曲線群によって区画される複数の分割片を用いてホモグラフィを推定した場合、図１９Ｂの拡大図に示すように、第２の面領域も歪んでしまう。

　図２０は、本変形例を説明するための図であり、Ａは第１の面領域を示す拡大図、Ｂは第２の面領域を示す拡大図である。同図Ａに示すように、ホモグラフィ推定部１０３は、２つの近似曲線対及び２つの曲線群によって区画される複数の分割片を拡大した拡大分割片Ｅａを形成する。ホモグラフィ推定部１０３は、この拡大分割片Ｅａの頂点の座標位置と、拡大分割片Ｅａに対応する第２の面領域Ｓ２の拡大分割片Ｅｂの頂点の座標位置とに基づいて、ホモグラフィを推定することができる。

　これにより、隣接する分割片間のホモグラフィを平滑化することができ、ホモグラフィの推定を安定して行うことができる。したがって、図２１に示すように、歪みのない第２の面領域を含む出力画像Ｏｇを出力することができる。

　［変形例１－３］
　上述の実施形態の処理を行った場合、出力画像において、綴じ部付近の文字等がｘ軸方向につぶれ、ｙ軸方向に細長くなることがあった。これは、綴じ部付近における、撮像部２０等のレンズの光軸に対して平行な方向への奥行きの変化が大きいためと考えられる。

　そこで出力画像生成部１０４は、近似曲線の湾曲状態から被写体の奥行き情報を推定し、当該奥行き情報に基づいて出力画像を調整してもよい。出力画像生成部１０４は、具体的には、入力画像からスプライン曲線として算出された近似曲線の係数値から奥行き情報を推定してもよい。この場合、実験的に計測した綴じ部等の奥行き値と、その際に算出された近似曲線の係数値とからテーブル等が予め作成され、出力画像生成部１０４は、このテーブルを参照して出力画像を調整することができる。

　また、上記近似曲線は、例えば、水平方向に近い方向に沿った輪郭線のうち上部の輪郭線であってもよい。当該上部の輪郭線は、第１の面領域の湾曲状態を反映して特に湾曲しやすいため、精度よく奥行き値との相関を調べることができる。

　図２１は、出力画像Ｏｇを拡大した模式的な図であり、Ａは、当該奥行きの調整を行わない場合の例を示し、Ｂは当該奥行きの調整を行う場合の例を示す。これらの図に示すように、本変形例により、ホモグラフィの推定のみでは補正することが難しかった綴じ部付近の調整を行い、より文字や図が見やすい出力画像を提供することが可能となる。

　さらに、本変形例によれば、予めテーブル等を作成することにより、入力画像毎に撮像時の奥行き情報を取得せずとも、奥行きの調整を行うことが可能となる。したがって、入力画像の画像情報のみから、当該調整を行うことが可能となり、より簡便に見やすい出力画像を提供することが可能となる。

　［変形例１－４］
　図２２は、本変形例に係る画像処理装置１００の機能的構成を示すブロック図である。同図に示すように、画像処理装置１００は、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４と、表示部１０５とに加え、さらに輪郭補正部１０６を備えていてもよい。

　輪郭補正部１０６は、輪郭検出部１０１の輪郭検出結果を補正して、第１の面領域の輪郭を決定することができる。より具体的には、輪郭検出部１０１は、輪郭検出結果をディスプレイ１６等に出力し、輪郭補正部１０６は、操作受付部１７により受け付けられたユーザによる入力に基づいて、輪郭検出部１０１の輪郭検出結果を補正することができる。

　これにより、曲線算出部１０２は、検出された輪郭をさらに補正した輪郭に基づいて、近似曲線を算出することが可能となる。したがって、上述のマージ処理においてエッジ未検出の区間があった場合や、入力画像中に含まれるユーザの指等の存在により輪郭線が分断されたことで精度よく輪郭線が検出できなかった場合であっても、曲線算出部１０２が信頼性の高い輪郭線に基づいて曲線を算出することが可能となる。

　［変形例１－５］
　上述の実施形態では、輪郭検出部１０１が、縮小入力画像に対して処理を行う例を示したが、これに限定されず、縮小しない入力画像に対して処理を行ってもよい。

　［変形例１－６］
　上述の実施形態では、入力画像の被写体は見開き２ページの書籍であって、第１の面領域は、当該書籍の画像の見開き１ページに対応する領域である例を示したが、これに限定されない。例えば被写体は、書籍以外の書籍類（綴じ部を有する冊子、雑誌等や、折り目を有するパンフレットや新聞等）であってもよいし、書籍類以外（柱等の曲面に貼り付けられ、又は曲面に印刷された掲示物等）であってもよい。

　［変形例１－７］
　輪郭検出部１０１の動作は、第１の面領域の輪郭が検出できればよく、上述の動作例に限定されない。例えば、輪郭検出部１０１は、輪郭候補の検出（ＳＴ５６）までの各ステップを行い、処理を終えてもよい。その後、画像処理装置１００がユーザに処理結果を提示し、変形例１－４で説明したように輪郭補正部１０６が輪郭の補正を行ってもよい。

　［変形例１－８］
　上述の実施形態では、近似曲線が相互に対向する２本の近似曲線をそれぞれ含む２つの近似曲線対を有し、複数の分割曲線は、２つの近似曲線対各々から推定される２つの曲線群を有すると説明したが、これに限定されない。例えば、第１の面領域の湾曲状態によっては、近似曲線が１対の近似曲線対を有し、複数の分割曲線が１対の近似曲線対から推定される１つの曲線群を有していてもよい。これにより、上下方向に近い方向又は水平方向に近い方向等、一方向に沿った分割片を生成し、これに基づいてホモグラフィを推定することが可能となる。

　さらに、近似曲線のみに基づいてホモグラフィを推定してもよい。

　［変形例１－９］
　ホモグラフィ推定部１０３のホモグラフィの推定方法も上述の処理に限定されない。例えば、上記複数の分割片の中心（重心）等に基づいてホモグラフィを推定してもよい。

　［変形例１－１０］
　第２の面領域は、ディスプレイ１６の表示面の法線方向と略同一の法線方向を有するように知覚される例に限定されず、例えば第３の面領域のような表示面の法線方向と異なる法線方向を有すると知覚される形状であってもよい。この場合、動作例で説明したホモグラフィ推定部１０３による第２の段階の処理が不要となる。

　また、第２の面領域は、平坦な面と知覚される領域に限定されず、第１の面領域と異なる湾曲状態を有すると知覚される面領域であってもよい。

　［変形例１－１１］
　画像処理装置１００は、表示部１０５から出力画像を表示した後、操作受付部１７等によりユーザからの入力操作を受け付け、出力画像の補正が可能に構成されてもよい。

　［変形例１－１２］
　図２３は、本変形例に係る画像処理装置１００のハードウェア構成を示す図である。同図に示すように、画像処理装置１００は、撮像部２０を有さない構成とすることができる。この場合、入力画像は、他の撮像装置等によって撮像され、記憶部１８に記憶された画像とすることができる。このような構成の画像処理装置１００であっても、上述の実施形態と同様の作用効果を得ることができる。

　＜第２の実施形態＞
　上述の実施形態においては、画像処理及び表示が一装置で行われると説明したが、以下の実施形態のように、複数の装置を含む画像処理システムにより行われてもよい。

　［画像処理システムの概略構成］
　図２４は、本技術の第２の実施形態に係る画像処理システム２の概略構成を示すブロック図である。画像処理システム２は、画像処理装置２００及び表示装置２６０を備え、画像処理装置２００において画像処理され生成された出力画像が、表示装置２６０から表示されることが可能に構成される。なお、以下の説明において、上述の実施形態と同様の構成は同一の符号を付して説明を省略する。

　画像処理装置２００は、スマートフォン、タブレット端末、ＰＣ、タブレットＰＣ、ウェアラブル機器、情報処理が可能な撮像装置等の情報処理装置として構成され得る。画像処理装置２００のハードウェア構成は、上述の画像処理装置１００と同様であるため、省略する。なお、画像処理装置２００は、撮像部を有する構成であってもよいし（図１参照）、有さない構成であってもよい（図２３参照）。

　表示装置２６０は、例えばディスプレイ装置、プロジェクタ装置、ウェアラブル端末、ＰＣ、タブレットＰＣ、スマートフォン、タブレット端末、電子書籍端末等の画像表示が可能な装置として構成される。

　［画像処理システムの機能的構成］
　図２５は、画像処理システム２の機能的構成を示すブロック図である。同図に示すように、画像処理システム２は、画像処理装置１００と同様の、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４と、表示部１０５とを備える。画像処理装置２００は、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４とを備える。表示装置２６０は、表示部１０５を備える。

　画像処理装置２００は、出力画像生成部１０４により生成された出力画像を、表示装置２６０に送信する。表示装置２６０は、表示部１０５により当該出力画像を表示する。

　以上のように、本実施形態によっても、複数枚の入力画像等を必要とせずに、入力画像の被写体である第１の面領域を、容易にかつ精度よく第２の面領域に変形することが可能となる。

　［変形例２－１］
　画像処理システム２は、クラウドシステムとして構成され、画像処理装置２００と表示装置２６０が、ネットワークを介して相互に接続されてもよい。この場合、画像処理装置２００は、サーバ装置（情報処理装置）として構成され、表示装置２６０は、例えばＰＣ、タブレットＰＣ、スマートフォン、タブレット端末、電子書籍端末、画像の表示及び通信が可能な撮像装置等のユーザ端末として構成されてもよい。

　また、画像処理装置２００は、図２３に示す画像処理装置１００と同様に、撮像部を備えない構成とすることができる。この場合、画像処理装置２００は、撮像可能な表示装置２６０や他の撮像装置が撮像した入力画像を取得することができる。あるいはネットワーク上の画像データベース等に記憶された入力画像を取得することができる。

　＜第３の実施形態＞
　図２６は、本技術の第３の実施形態に係る画像処理システム３の概略構成を示すブロック図である。同図において、画像処理システム３は、画像処理装置３００及び表示装置３６０を備える。画像処理システム３は、画像処理装置３００が推定したホモグラフィの情報を表示装置３６０へ送信し、表示装置３６０がホモグラフィに基づいて出力画像を生成し、表示することが可能に構成される。

　画像処理装置３００は、スマートフォン、タブレット端末、ＰＣ、タブレットＰＣ、ウェアラブル機器、ドキュメントスキャナ装置、情報処理が可能な撮像装置等の情報処理装置として構成され得る。画像処理装置３００のハードウェア構成は、上述の画像処理装置１００と同様であるため、省略する。なお、画像処理装置３００は、撮像部を有する構成であってもよいし（図１参照）、有さない構成であってもよい（図２３参照）。

　表示装置３６０は、例えばディスプレイ装置、プロジェクタ装置、ウェアラブル端末、ＰＣ、タブレットＰＣ、スマートフォン、タブレット端末、電子書籍端末、撮像装置等の画像表示が可能な装置として構成される。

　［画像処理システムの機能的構成］
　図２７は、画像処理システム３の機能的構成を示すブロック図である。同図に示すように、画像処理システム３は、画像処理装置１００と同様の、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４と、表示部１０５とを備える。画像処理装置３００は、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３とを備える。表示装置３６０は、出力画像生成部１０４と、表示部１０５とを備える。

　画像処理装置３００は、ホモグラフィ推定部３０３により推定されたホモグラフィの情報を、表示装置３６０に送信する。表示装置３６０は、出力画像生成部３０４により出力画像を生成し、表示部３０５により当該出力画像を表示する。

　［変形例３－１］
　画像処理システム３は、上述の変形例２－１と同様に、クラウドシステムとして構成され、画像処理装置３００と表示装置３６０が、ネットワークを介して相互に接続されてもよい。また、画像処理装置３００は、図２３に示す画像処理装置１００と同様に、撮像部を備えない構成とすることができる。

　＜第４の実施形態＞
　図２８は、本技術の第４の実施形態に係る画像処理システム４の概略構成を示すブロック図である。同図において、画像処理システム４は、画像処理装置４００及び表示装置４６０を備える。画像処理システム４は、表示装置４６０により輪郭の検出が可能に構成される。

　画像処理装置４００は、スマートフォン、タブレット端末、ＰＣ、タブレットＰＣ、ウェアラブル機器、ドキュメントスキャナ装置、情報処理が可能な撮像装置等の情報処理装置として構成され得る。画像処理装置４００のハードウェア構成は、上述の画像処理装置１００と同様であるため、省略する。なお、画像処理装置４００は、撮像部を有する構成であってもよいし（図１参照）、有さない構成であってもよい（図２３参照）。

　表示装置４６０は、例えばディスプレイ装置、プロジェクタ装置、ウェアラブル端末、ＰＣ、タブレットＰＣ、スマートフォン、タブレット端末、電子書籍端末、撮像装置等の画像表示が可能な装置として構成される。

　［画像処理システムの機能的構成］
　図２９は、画像処理システム４の機能的構成を示すブロック図である。同図に示すように、画像処理システム４は、画像処理装置１００と同様の、輪郭検出部１０１と、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４と、表示部１０５とを備える。画像処理装置４００は、曲線算出部１０２と、ホモグラフィ推定部１０３と、出力画像生成部１０４とを備える。表示装置４６０は、輪郭検出部１０１と、表示部１０５とを備える。

　表示装置４６０は、入力画像から第１の面領域の輪郭を検出し、その情報を画像処理装置４００に送信する。画像処理装置４００は、これに基づいてホモグラフィを推定し、出力画像を生成して表示装置４６０へ送信する。これにより、表示装置４６０は、表示部１０５により出力画像を表示することが可能に構成される。

　［変形例４－１］
　画像処理システム４は、上述の変形例２－１，３－１と同様に、クラウドシステムとして構成され、画像処理装置３００と表示装置３６０が、ネットワークを介して相互に接続されてもよい。また、画像処理装置３００は、図２３に示す画像処理装置１００と同様に、撮像部を備えない構成とすることができる。

　［変形例４－２］
　図３０は、本変形例に係る画像処理システム４の機能的構成を示すブロック図である。同図に示すように、画像処理装置４００は、曲線算出部１０２と、ホモグラフィ推定部１０３とを備え、表示装置４６０は、輪郭検出部１０１と、出力画像生成部１０４と、表示部１０５とを備えてもよい。これによっても、上述の実施形態と同様の処理が可能となる。

　さらに、本技術は上述の実施形態にのみ限定されるものではなく、本開示の要旨を逸脱しない範囲内において種々変更され得る。また、上述の第１～第４の各実施形態及び各変形例は、矛盾が生じない限り如何様にも組み合わされて実行され得る。

　なお、本技術は以下のような構成もとることができる。
（１）第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出する曲線算出部と、
　上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定するホモグラフィ推定部と
　を具備する画像処理装置。
（２）上記（１）に記載の画像処理装置であって、
　上記曲線算出部は、上記近似曲線に基づいて上記第１の面領域を分割する複数の分割曲線を算出し、
　上記ホモグラフィ推定部は、上記近似曲線及び上記複数の分割曲線に基づいて、上記ホモグラフィを推定する
　画像処理装置。
（３）上記（１）又は（２）に記載の画像処理装置であって、上記曲線算出部は、上記近似曲線をスプライン曲線として算出する
　画像処理装置。
（４）上記（１）から（３）のうちいずれか１つに記載の画像処理装置であって、
　上記近似曲線は、相互に対向する２本の近似曲線を含む近似曲線対を有し、
　上記複数の分割曲線は、上記近似曲線対から推定される複数の曲線を含む曲線群を有する
　画像処理装置。
（５）上記（４）に記載の画像処理装置であって、
　上記近似曲線は、相互に対向する２本の近似曲線をそれぞれ含む２つの近似曲線対を有し、
　上記複数の分割曲線は、上記２つの近似曲線対各々から推定される２つの曲線群を有する
　画像処理装置。
（６）上記（５）に記載の画像処理装置であって、
　上記ホモグラフィ推定部は、上記２つの近似曲線対と、上記２つの曲線群とによって形成された複数の交点に基づいて上記ホモグラフィを推定する
　画像処理装置。
（７）上記（６）に記載の画像処理装置であって、
　上記ホモグラフィ推定部は、上記２つの近似曲線対及び上記２つの曲線群によって区画される複数の分割片各々を、隣接する分割片と重複するように拡大して複数の拡大分割片を形成し、上記複数の拡大分割片各々の頂点に基づいて上記ホモグラフィを推定する
　画像処理装置。
（８）上記（１）から（７）のうちいずれか１つに記載の画像処理装置であって、
　上記第１の面領域の輪郭は、曲線状であり、
　上記ホモグラフィ推定部は、上記近似曲線を直線状に伸ばして形成された複数の第１の直線と、上記複数の分割曲線を直線状に伸ばして形成された複数の第２の直線とに基づいて、上記ホモグラフィを推定する
　画像処理装置。
（９）上記（８）に記載の画像処理装置であって、
　上記ホモグラフィ推定部は、上記複数の第１の直線により区画された台形状の第３の面領域の形状についての情報と、上記入力画像の撮像角度情報とに基づいて、上記第２の面領域のアスペクト比情報を算出し、上記アスペクト比情報に基づいて上記ホモグラフィを推定する
　画像処理装置。
（１０）上記（１）から（９）のうちいずれか１つに記載の画像処理装置であって、
　上記入力画像から上記第１の面領域の輪郭を検出する輪郭検出部をさらに具備し、
　上記曲線算出部は、上記検出された輪郭に基づいて上記近似曲線を算出する
　画像処理装置。
（１１）上記（１０）に記載の画像処理装置であって、
　上記入力画像から上記第１の面領域の輪郭を検出する輪郭検出部をさらに具備し、
　上記曲線算出部は、上記検出された輪郭に基づいて上記近似曲線を算出する
　画像処理装置。
（１２）上記（１１）に記載の画像処理装置であって、
　上記輪郭検出部は、上記複数の輪郭候補のうち、囲む面積が最も大きいという第１の条件、及び各輪郭候補をオブジェクトとした場合のバウンディングボックスの中心点が上記入力画像の中心点に最も近いという第２の条件の少なくとも一方の条件を満たす輪郭候補を、上記第１の面領域の輪郭として選出する
　画像処理装置。
（１３）上記（１０）から（１２）のうちいずれか１つに記載の画像処理装置であって、
　上記入力画像は、見開き２ページの書籍類の画像を含み、
　上記第１の面領域は、上記書籍類の見開き１ページに対応する領域であり、
　上記輪郭検出部は、上記書籍類のページ分割線を検出し、上記ページ分割線を上記第１の面領域の輪郭の一部として検出する
　画像処理装置。
（１４）第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出し、
　上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定する
　画像処理方法。
（１５）情報処理装置に、
　第１の面領域を被写体として含む入力画像に基づいて上記第１の面領域の輪郭の近似曲線を算出するステップと、
　上記近似曲線に基づいて、上記第１の面領域を第２の面領域へ変換するホモグラフィを推定するステップと
　を実行させるプログラム。

　１００，２００，３００，４００…画像処理装置
　１０１…輪郭検出部
　１０２…曲線算出部
　１０３…ホモグラフィ推定部
　Ｓ１…第１の面領域
　Ｓ２…第２の面領域
　Ｓ３…第３の面領域

Claims

　第１の面領域を被写体として含む入力画像に基づいて前記第１の面領域の輪郭の近似曲線を算出する曲線算出部と、
　前記近似曲線に基づいて、前記第１の面領域を第２の面領域へ変換するホモグラフィを推定するホモグラフィ推定部と
　を具備する画像処理装置。
　請求項１に記載の画像処理装置であって、
　前記曲線算出部は、前記近似曲線に基づいて前記第１の面領域を分割する複数の分割曲線を算出し、
　前記ホモグラフィ推定部は、前記近似曲線及び前記複数の分割曲線に基づいて、前記ホモグラフィを推定する
　画像処理装置。
　請求項１に記載の画像処理装置であって、
　前記曲線算出部は、前記近似曲線をスプライン曲線として算出する
　画像処理装置。
　請求項１に記載の画像処理装置であって、
　前記近似曲線は、相互に対向する２本の近似曲線を含む近似曲線対を有し、
　前記複数の分割曲線は、前記近似曲線対から推定される複数の曲線を含む曲線群を有する
　画像処理装置。
　請求項４に記載の画像処理装置であって、
　前記近似曲線は、相互に対向する２本の近似曲線をそれぞれ含む２つの近似曲線対を有し、
　前記複数の分割曲線は、前記２つの近似曲線対各々から推定される２つの曲線群を有する
　画像処理装置。
　請求項５に記載の画像処理装置であって、
　前記ホモグラフィ推定部は、前記２つの近似曲線対と、前記２つの曲線群とによって形成された複数の交点に基づいて前記ホモグラフィを推定する
　画像処理装置。
　請求項６に記載の画像処理装置であって、
　前記ホモグラフィ推定部は、前記２つの近似曲線対及び前記２つの曲線群によって区画される複数の分割片各々を、隣接する分割片と重複するように拡大して複数の拡大分割片を形成し、前記複数の拡大分割片各々の頂点に基づいて前記ホモグラフィを推定する
　画像処理装置。
　請求項１に記載の画像処理装置であって、
　前記第１の面領域の輪郭は、曲線状であり、
　前記ホモグラフィ推定部は、前記近似曲線を直線状に伸ばして形成された複数の第１の直線と、前記複数の分割曲線を直線状に伸ばして形成された複数の第２の直線とに基づいて、前記ホモグラフィを推定する
　画像処理装置。
　請求項８に記載の画像処理装置であって、
　前記ホモグラフィ推定部は、前記複数の第１の直線により区画された台形状の第３の面領域の形状についての情報と、前記入力画像の撮像角度情報とに基づいて、前記第２の面領域のアスペクト比情報を算出し、前記アスペクト比情報に基づいて前記ホモグラフィを推定する
　画像処理装置。
　請求項１に記載の画像処理装置であって、
　前記入力画像から前記第１の面領域の輪郭を検出する輪郭検出部をさらに具備し、
　前記曲線算出部は、前記検出された輪郭に基づいて前記近似曲線を算出する
　画像処理装置。
　請求項１０に記載の画像処理装置であって、
　前記輪郭検出部は、前記入力画像のエッジ検出結果に基づいて前記第１の面領域の複数の輪郭候補を検出し、前記複数の輪郭候補から前記第１の面領域の輪郭を選出することで、前記第１の面領域の輪郭を検出する
　画像処理装置。
　請求項１１に記載の画像処理装置であって、
　前記輪郭検出部は、前記複数の輪郭候補のうち、囲む面積が最も大きいという第１の条件、及び各輪郭候補をオブジェクトとした場合のバウンディングボックスの中心点が前記入力画像の中心点に最も近いという第２の条件の少なくとも一方の条件を満たす輪郭候補を、前記第１の面領域の輪郭として選出する
　画像処理装置。
　請求項１０に記載の画像処理装置であって、
　前記入力画像は、見開き２ページの書籍類の画像を含み、
　前記第１の面領域は、前記書籍類の見開き１ページに対応する領域であり、
　前記輪郭検出部は、前記書籍類のページ分割線を検出し、前記ページ分割線を前記第１の面領域の輪郭の一部として検出する
　画像処理装置。
　第１の面領域を被写体として含む入力画像に基づいて前記第１の面領域の輪郭の近似曲線を算出し、
　前記近似曲線に基づいて、前記第１の面領域を第２の面領域へ変換するホモグラフィを推定する
　画像処理方法。
　情報処理装置に、
　第１の面領域を被写体として含む入力画像に基づいて前記第１の面領域の輪郭の近似曲線を算出するステップと、
　前記近似曲線に基づいて、前記第１の面領域を第２の面領域へ変換するホモグラフィを推定するステップと
　を実行させるプログラム。