JPWO2007142227A1 - 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム - Google Patents

画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム Download PDF

Info

Publication number
JPWO2007142227A1
JPWO2007142227A1 JP2008520583A JP2008520583A JPWO2007142227A1 JP WO2007142227 A1 JPWO2007142227 A1 JP WO2007142227A1 JP 2008520583 A JP2008520583 A JP 2008520583A JP 2008520583 A JP2008520583 A JP 2008520583A JP WO2007142227 A1 JPWO2007142227 A1 JP WO2007142227A1
Authority
JP
Japan
Prior art keywords
image
candidate
input image
angle
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008520583A
Other languages
English (en)
Other versions
JP4957922B2 (ja
Inventor
真澄 石川
真澄 石川
山田 昭雄
昭雄 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008520583A priority Critical patent/JP4957922B2/ja
Publication of JPWO2007142227A1 publication Critical patent/JPWO2007142227A1/ja
Application granted granted Critical
Publication of JP4957922B2 publication Critical patent/JP4957922B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

画像取得装置に傾きを検出するための特別な機器を組み込むことなく、入力画像の上下方向をより正確に判定する。対象物候補検出手段101は、入力画像から対象物候補とその対象物候補の入力画像中における角度とを検出する。類似度算出手段103は、検出された各対象物候補について、予め記憶しておいた各対象物との類似度を算出する。そして、入力画像角度算出手段104は、算出した各対象物候補の類似度と、入力画像中における角度とに基づいて、入力画像の上下方向を判定する。入力画像角度算出手段104は、例えば、各対象物候補の入力画像中における角度に対し、類似度に基づく重み付けを行い、重み付けの角度を用いて入力画像の上下方向に対する傾き角度を算出する。

Description

本発明は、画像の上下方向を判定する画像方向判定装置、画像方向判定方法、および画像方向判定用プログラムに関し、特にディジタルカメラ等で撮影された静止画像の上下方向を判断するための画像方向判定装置、画像方向判定方法、および画像方向判定用プログラムに関する。
従来の画像方向判定装置の一例が特許文献1に記載されている。特許文献1に記載されている手法は、電子カメラに傾き検出器を組み込み、画像撮影時にカメラの傾きを取得して画像の上下方向を判定する手法である。そのための構成として、静止画像を取得する電子画像取得装置と、垂直回転平面内での画像取得装置の回転を検出し、画像取得装置の縦長方向の位置にある基準位置から90度の整数倍に対応する回転出力値を生成する回転検出器と、回転出力値に基づいて処理済みディジタル画像信号を発生する信号プロセッサとを備える。
また、別の画像方向判定装置の一例が、特許文献2に記載されている。特許文献2に記載されている手法は、撮影した画像データの中から人物の顔画像を検出して顔の上下方向を画像の上下方向として判定する手法である。図19は、特許文献2等に記載されている従来の画像方向判定装置の構成例を示すブロック図である。図19に示すように、顔の上下方向によって画像の上下方向を判定する画像方向判定装置は、静止画像を撮影して静止画像データを出力するカメラ撮像部91と、静止画像データを圧縮するディジタル画像信号処理部92と、圧縮静止画像データを記録する記憶部93と、静止画像の被写体に含まれる人間の顔を検出して、顔の上下方向を判定し、判定の結果、顔の上下方向が画像の上下方向と異なる場合には、画像の上下方向を顔の上下方向と一致するように画像を回転させるよう指示する顔画像認識・処理部95とを備える。
また、特許文献3には、文字画像について、文字画像から抽出した文字方向に依存しない特徴量個数情報に基づき認識候補文字を選択し、その候補文字に関する辞書データを回転させて、文字画像から抽出した文字方向に依存する特徴量データ(文字閉ループ,文字十字交差点,文字T字交差点,文字端点等の局所的形状の相対的位置)との一致度によって判定した回転角を角度情報とする手法が記載されている。
特開平11−225283号公報(段落0005、図1) 特開2005−260870号公報(段落0012−0013) 特開平10−224596号公報(段落0010−0013)
しかしながら、特許文献1に記載の手法を用いる場合、傾き検出器を組み込んでいない画像取得装置では上下判定が行ない。また、上下判定を行えるようにするためには、画像取得装置に傾き検出器を組み込む必要があり、ディジタルカメラ等の画像取得装置の製造に、画像の上下判定を行うためのコストがかかるという問題点がある。
また、特許文献2に記載の手法では、入力画像から検出された顔の上下方向のみを利用して画像の上下方向を判定するために、正確な判定を行えない。その理由は、一般に顔画像検出の精度は高くなく、顔の誤検出が頻繁に生じるため、誤検出された顔をもとに不正確な上下判定が行われる可能性が高いためである。
また、特許文献3に記載の手法は、文字画像に特化した手法であり、文字の切り出し精度の高さや、原稿から検出される文字の多さ等の助勢特性によるところであるといえる。つまり、原稿画像からひとつ切り出した文字の一致度がある程度高い場合にその文字の上下方向を判定する、という特許文献3の手法では、単純な閾値処理で条件のよい候補が選択される必要があり、比較対象となる文字が数多く検出でき、かつ、文字の切り出し精度が高くなければならない。
しかしながら、一般の写真の場合、対象物の検出精度は高くなく、また、対象物の検出個数も多くない。例えば、顔を対象物としてみると、顔の表情や向き、照明条件の影響により、あらかじめ記憶された特徴量との一致度は高くなく、また、原稿画像から抽出される文字数と比較すると、検出される顔の数も少ない。このため、単純な閾値処理で条件のよい候補を選ぶことは難しく、条件の良くない候補から角度を判定してしまう可能性が高い。
また、特許文献2および特許文献3に記載の手法において、複数の候補から異なる角度が検出されることが考慮されておらず、集合写真等の画像に対して正しく判定できない。
そこで、本発明は、画像取得装置に傾き検出器を組み込むことなく、入力画像の上下方向をより正確に判定することを目的とする。
また、本発明は、具体的には、入力画像を限定することなく、一般の写真画像であっても、上下方向を判定するための特別な機器(傾き検出器等)の組み込みコストをかけずに、正確に上下方向を判定できるような画像方向判定装置、画像方向判定方法、および画像方向判定用プログラムを提供することを目的とする。
上記課題を解決する本発明は、入力画像の上下方向を判定する画像方向判定装置であって、入力画像から、固定的な形状または配置をもち、その形状または配置から一定の角度が検出可能な対象物を対象物候補として検出する対象物候補検出手段(例えば、対象物候補検出手段101)と、対象物候補抽出手段によって抽出された対象物候補について、予め記憶している登録対象物との類似度を算出する類似度算出手段(例えば、類似度算出手段103)と、対象物候補抽出手段によって抽出された対象物候補の入力画像中における角度と、類似度算出手段によって算出された類似度とに基づいて、入力画像の上下方向を判定する上下方向判定手段(例えば、入力画像角度算出手段104)とを備えたことを特徴とする。
また、画像方向判定装置は、対象物候補検出手段によって検出された対象物候補について、入力画像内の対象物候補領域の画像情報に基づいて、対象物候補の特徴量を抽出する特徴量抽出手段(例えば、特徴量抽出手段102)を備え、対象物候補検出手段は、入力画像から、複数の対象物候補を検出するとともに、検出した対象物候補の入力画像中における角度を抽出し、類似度算出手段は、特徴量抽出手段によって抽出される各対象物候補の特徴量と、予め記憶している登録対象物の特徴量とを比較することによって、類似度を算出し、上下方向判定手段は、各対象物候補の入力画像中における角度に対し、登録対象物との類似度に基づいて重みを付与することによって、入力画像の上下方向に対する傾き角度を算出する入力画像角度算出手段を含んでいてもよい。
また、対象物検出手段は、入力画像を所定の角度で回転させた回転画像から、回転画像中における角度が0度の対象物候補を検出するとともに、検出した際の回転画像の回転角度に基づいて、対象物候補の入力画像中における角度を算出してもよい。
また、類似度算出手段は、対象物候補抽出手段によって抽出された各対象物候補と、予め記憶している各登録対象物との組み合わせによる類似度を算出してもよい。
また、特徴量抽出手段は、対象物の方向に応じて値が変わる特徴量を抽出し、類似度算出手段は、特徴量抽出手段によって抽出される、対象物の方向に応じて値の変わる特徴量を用いて類似度を算出してもよい。
また、入力画像角度算出手段は、入力画像から対象物候補が検出されない場合には、入力画像の上下方向に対する傾き角度を0度としてもよい。
また、入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、予め記憶している登録対象物との類似度が最大となる対象物候補の入力画像中における角度に基づいて、入力画像の上下方向に対する傾き角度を算出してもよい。
また、入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、予め記憶している登録対象物との類似度が所定の閾値以上である対象物候補の入力画像中における角度の平均をもとに、入力画像の上下方向に対する傾き角度を算出してもよい。
入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、予め記憶している登録対象物との類似度が所定の閾値以上である対象物候補の入力画像中における角度に基づいて、入力画像の上下方向に対する傾き角度を算出してもよい。
また、入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、対象物候補の入力画像中における角度に対して、予め記憶している登録対象物との類似度を重みづけることによって算出された角度をもとに、入力画像の上下方向に対する傾き角度を算出してもよい。
また、入力画像角度算出手段は、0度、90度、180度、270度のうち、算出した入力画像の上下方向に対する傾き角度に最も近い角度を入力画像の上下方向に対する傾き角度としてもよい。
また、対象物候補検出手段は、所定の対象物の特定部位の相対位置情報を保持し、保持している相対位置情報と入力画像から検出される特定部位の相対位置情報との類似性に基づいて、対象物候補を検出してもよい。
また、対象物候補検出手段は、所定の対象物の特徴量を保持し、保持している特徴量と入力画像から抽出される特徴量との類似性に基づいて、対象物候補を検出してもよい。
また、対象物候補検出手段は、所定の対象物を含む画像をテンプレートとして保持し、保持しているテンプレートを用いて、入力画像に対しテンプレートマッチングを行うことによって対象物候補を検出してもよい。
また、画像方向判定装置は、対象物候補検出用のテンプレートとして、予め記憶している対象物の画像を用いてもよい。
また、画像方向判定装置は、登録対象物として、特定人物を示す情報を記憶する人物特徴量記憶手段(例えば、特徴量記憶部122)を備えていてもよい。
また、対象物候補検出手段は、対象物候補として人物の顔候補を検出してもよい。
また、対象物候補検出手段は、検出した人物の顔候補の入力画像中における角度として、左右の目を結ぶ直線の垂直二等分線の垂直方向となす角度を抽出してもよい。
また、対象物候補検出手段は、入力画像中に含まれる複数の人物候補を検出するとともに、検出した人物候補の入力画像中における角度を抽出する人物候補検出手段を含み、特徴量抽出手段は、人物候補検出手段によって検出された人物候補の特徴量を抽出し、類似度算出手段は、人物候補検出手段によって検出された各人物候補について、特徴量抽出手段によって抽出された特徴量と、予め記憶している特定人物の特徴量との類似度を算出し、入力画像角度算出手段は、人物候補抽出手段によって抽出された各人物候補の入力画像中における角度と、類似度算出手段によって算出された特定人物との類似度とに基づいて、入力画像の上下方向に対する傾き角度を算出してもよい。
上記課題を解決する本発明は、入力画像の上下方向を判定する画像方向判定方法であって、入力画像から、固定的な形状または配置をもち、その形状または配置から一定の角度が検出可能な対象物を対象物候補として検出するステップと、抽出された対象物候補について、予め記憶されている登録対象物との類似度を算出するステップと、対象物候補の入力画像中における角度と、算出された類似度とに基づいて、入力画像の上下方向を判定するステップとを含むことを特徴とする。
また、画像方向判定方法は、入力画像から、複数の対象物候補を検出するとともに、検出した対象物候補の入力画像中における角度を抽出するステップと、検出された各対象物候補について、入力画像内の対象物候補領域の画像情報に基づいて、対象物候補の特徴量を抽出するステップと、抽出された各対象物候補の特徴量と、予め記憶されている登録対象物の特徴量とを比較することによって、類似度を算出するステップと、各対象物候補の入力画像中における角度に対し、登録対象物との類似度に基づいて重みを付与することによって、入力画像の上下方向に対する傾き角度を算出するステップとを含んでいてもよい。
上記課題を解決する本発明は、入力画像の上下方向を判定するための画像方向判定用プログラムであって、コンピュータに、入力画像から、固定的な形状または配置をもち、その形状または配置から一定の角度が検出可能な対象物を対象物候補として検出する処理、抽出された対象物候補について、予め記憶されている登録対象物との類似度を算出する処理、および対象物候補の入力画像中における角度と、算出された類似度とに基づいて、入力画像の上下方向を判定する処理を実行させることを特徴とする。
また、画像方向判定用プログラムは、コンピュータに、入力画像から、複数の対象物候補を検出するとともに、検出した対象物候補の入力画像中における角度を抽出する処理、検出された各対象物候補について、入力画像内の対象物候補領域の画像情報に基づいて、対象物候補の特徴量を抽出する処理、抽出された各対象物候補の特徴量と、予め記憶されている登録対象物の特徴量とを比較することによって、類似度を算出する処理、および各対象物候補の入力画像中における角度に対し、登録対象物との類似度に基づいて重みを付与することによって、入力画像の上下方向に対する傾き角度を算出する処理を実行させてもよい。
本発明によれば、ディジタルカメラ等の画像取得装置の製造にあたり、上下方向の判定を行うための機器コストがかからない。その理由は、画像取得装置に傾き検出器等の上下方向の判定を行うための機器を組み込む必要がないためである。
また、本発明によれば、画像の上下方向をより正確に判定できる。その理由は、画像から検出された対象物候補の中から対象物として信頼性の高い対象物候補を選び、信頼性の高い対象物候補の入力画像中における角度を利用して算出された傾き角度を基に画像の上下方向を判定するため、誤検出された対象物候補をもとに不正確な上下方向の判定を行う可能性が低いためである。
第1の実施の形態よる画像方向判定装置の構成例を示すブロック図である。 入力画像の例と角度記憶部121に記憶されるデータ構造の例を示す説明図である。 第1の実施の形態における特徴量記憶部122に記憶されるデータ構造の例を示す説明図である。 第1の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。 第2の実施の形態よる画像方向判定装置の構成例を示すブロック図である。 第2の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。 第3の実施の形態による画像方向判定装置の構成例を示すブロック図である。 第3の実施の形態における角度記憶部321に記憶されるデータ構造の例を示す説明図である。 第3の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。 第4の実施の形態による画像方向判定装置の構成例を示すブロック図である。 第4の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。 第5の実施の形態による画像方向判定装置の構成例を示すブロック図である。 第6の実施の形態による画像方向判定装置の構成例を示すブロック図である。 第1の実施例の構成例を示す説明図である。 第2の実施例の構成例を示す説明図である。 第3の実施例の構成例を示す説明図である。 第4の実施例の構成例を示す説明図である。 第5の実施例の構成例を示す説明図である。 顔の上下方向によって画像の上下方向を判定する従来の画像方向判定装置の一例を示す説明図である。
符号の説明
100 データ処理装置
101 対象物候補検出手段
102 特徴量抽出手段
103 類似度算出手段
104 入力画像角度算出手段
110 画像入力手段
120 記憶装置
130 出力手段
205 画像加工手段
3011 画像回転手段
3012 一方向対象物候補検出手段
440 コマンド入出力装置
550 入力画像角度算出用プログラム
実施の形態1.
以下、本発明の実施の形態を図面を参照して説明する。図1は、本実施の形態よる画像方向判定装置の構成例を示すブロック図である。図1に示す画像方向判定装置は、プログラムに従って動作するデータ処理装置100と、画像信号を入力する画像入力手段110と、入力画像の上下方向の判定に用いる情報を記憶する記憶装置120と、入力画像の上下方向の判定結果を出力する出力手段130とを備える。また、データ処理装置100は、対象物候補検出手段101と、特徴量抽出手段102と、類似度算出手段103と、入力画像角度算出手段104とを含む。また、記憶装置120は、角度記憶部121と、特徴量記憶部122とを含む。
画像入力手段110は、判定対象である画像の画像信号を入力する。また、画像入力手段110は入力した画像信号を対象物候補検出手段101に出力する。
対象物候補検出手段101は、画像入力手段110から入力される画像信号を用いて、画像から上下判定に用いる対象物の候補とする対象物候補、およびその角度を検出する。ここで、対象物とは、撮影の対象となりうるものであって、固定的な形状または配置をもち、その形状または配置から一定の角度(上下方向に対する傾斜角度)が検出可能なものをいう。対象物は、形状または配置から一定の角度が検出可能であれば、どのようなもの(人物、動植物、建築物、自然物等、またはこれらの組み合わせ)であってもよく、また、その部分であってもよい。また、対象物候補検出手段101は、画像から対象物候補が検出された場合には、特徴量抽出手段102に、検出した対象物候補に関する情報(例えば、画像領域や角度)を出力する。また、各対象物候補の入力画像中における角度を角度記憶部121に記憶する。なお、画像から対象物候補が検出されなかった場合には、入力画像角度算出手段104に「対象物なし」の旨を出力する。
角度記憶部121は、対象物候補検出手段101によって検出された各対象物候補の入力画像中における角度を記憶する。図2は、入力画像の例と角度記憶部121に記憶されるデータ構造の例を示す説明図である。図2に示すように、角度記憶部121は、例えば、対象物候補検出手段101によって検出された各対象物候補を識別するための識別子(以下、対象物候補識別子という。)と、その対象物候補の入力画像中における角度情報とを対応づけて記憶する。図2の例では、入力画像から3つの対象物候補(α,β,γ)が検出され、また、それらの入力画像中における角度として、−10度,30度,45度が検出されたことを示している。
また、特徴量記憶部122は、予め撮影されうる対象物であって、入力画像から検出される対象物候補の比較対象とする対象物(以下、登録対象物という。)に関する情報(例えば、識別子や特徴量)を記憶する。対象物の蓄積の形態は、対象物を含む画像情報(登録画像)であっても、背景を含む対象物の画像領域であっても、対象物の画像領域から抽出した特徴量であってもよい。また、対象物の種類および個数は、単数でも複数でも構わない。図3は、登録画像の例と特徴量記憶部122に記憶されるデータ構造の例を示す説明図である。図3に示すように、特徴量記憶部122は、例えば、登録対象物を識別するための識別子(以下、登録対象物識別子という。)と、その登録対象物の特徴量とを対応づけて記憶する。登録対象物は、例えば、人物A,人物Bといった特定人物であっても、犬X,猫Y等の動物であっても、木P,花Q等の植物であっても、東京タワー、ベイブリッジなどの建造物であっても、富士山,琵琶湖といった自然物であっても、カメラ,車といった人工物であってもかまわない。また、例えば、空と地面のような固定的な配置をもつ景色であってもよい。なお、登録対象物は、撮影されうるものの中で利用者が着目するものであることがより好ましい。
特徴量抽出手段102は、対象物候補検出手段101から入力された対象物候補に関する情報を用いて、対象物候補の画像領域から対象物候補の特徴量を抽出する。また、特徴量抽出手段102は、抽出した特徴量を類似度算出手段103に出力する。特徴量抽出手段102は、例えば、対象物を識別可能な特徴量として、色ヒストグラムのように上下方向に応じて変わらない値を抽出してもよい。また、例えば、エッジ方向のヒストグラムのように上下方向に応じて変わる値を抽出してもよい。特徴量抽出手段102は、複数の種類の特徴量を抽出してもよい。なお、登録対象物の蓄積形態として、特徴量記憶部122に登録画像を記憶しておく場合には、特徴量抽出手段102が、登録画像から検出された登録対象物の特徴量を抽出して、特徴量記憶部122に記憶してもよい。
なお、特徴量抽出手段102が抽出する特徴量は、入力画像中における対象物候補と特徴量記憶部122に記憶される登録対象物との比較において、視覚的な特徴の相違(例えば、対象物の相違、対象物の角度のずれ)が導出される特徴量であることが望ましい。
類似度算出手段103は、特徴量抽出手段102から入力される各対象物候補の特徴量と、特徴量記憶部122に記憶されている登録対象物の特徴量との類似度を算出する。また、類似度算出手段103は、類似度を算出した各対象物候補と登録対象物との組み合わせ、およびその組み合わせにおける類似度を入力画像角度算出手段104に出力する。
類似度算出手段103は、例えば、各対象物候補の特徴量と、登録対象物の特徴量との差分を求めることによって類似度を算出する。なお、類似度は、対象物候補と登録対象物との全組み合わせについて算出してもよいし、選択的な組み合わせについて算出してもよい。なお、特徴量抽出手段102によって複数の特徴量が抽出される場合には、それらの特徴量を統合して差分を求めてもよいし、ある特徴量を組み合わせ選択に用い、ある特徴を差分算出に用いるといった用途をわけた用い方をしてもよい。
特徴量の性質と類似度との関係について、図2に示す入力画像と図3に示す登録画像とを用いた場合を例にして説明する。例えば、上下方向に応じて値が変わる特徴量を用いた場合には、対象物候補の画像領域と角度とが共に正しく検出できたときに、高い類似度が算出される。ここで、図2に示す入力画像中の対象物候補αは、図3に示す登録画像中の対象物Aと同一の対象物である。また、対象物候補αの入力画像中における角度は正しく検出されているものとする。この場合、正しい上下方向をもとに特徴量が抽出されるので、対象物候補αと登録対象物Aとの類似度は高い値が算出される。また、入力画像中の対象物候補βは、登録画像中には同一の対象物が存在しない。この場合、対象物候補βはどの登録対象物との類似度も低い値が算出される。また、入力画像中の対象物候補γは、登録画像中の対象物Cと同一の対象物である。しかし、対象物候補γの入力画像中における角度が誤って判定されているものとする。この場合、誤った上下方向をもとに特徴量が抽出されるので、対象物候補γと登録対象物Cとの類似度は低い値が算出される。なお、他の組み合わせについては、互いに異なる対象物であるため、類似度は低い値が算出される。
また、例えば、上下方向に応じて値が変わらない特徴量を用いた場合には、対象物候補の画像領域が正しく検出できたときに、高い類似度が算出される。上記例と比較すると、対象物候補γと登録対象物Cとの類似度として高い値が算出されるという点で異なる。従って、上下方向に応じて値が変わらない特徴量を用いる場合には、対象物候補の画像中における角度が正しく検出できる場合には、精度の高い上下方向の判定を行うことができる。一方、上下方向に応じて値が変わる特徴量を用いる場合には、角度が正しく検出された対象物候補だけに絞り込むことができるので、対象物によっては角度が正しく検出されない可能性がある場合に、上下方向に応じて値が変わらない特徴量を用いた場合に比較して、精度の高い判定を行うことができる。
なお、利用する特徴量を1つに限定せず、上下に応じて値が変わらない特徴量を用いて比較対象を絞り込み、絞り込んだ対象物についてさらに上下方向に応じて値が変わる特徴量を用いて類似度を算出してもよい。このような場合には、信頼性の低い対象物候補の角度を入力画像の上下判定に用いることを防ぎ、高精度な上下判定を実現することができる。
入力画像角度算出手段104は、入力画像の上下方向に対する傾き角度を算出する。また、入力画像角度算出手段104は、算出した傾き角度を出力手段130に出力する。入力画像角度算出手段104は、類似度算出手段103が算出した各対象物候補と登録対象物との組み合わせにおける各類似度と、対象物候補検出手段101が検出した各対象物候補の角度とに基づいて、入力画像の上下方向に対する傾き角度を算出する。なお、入力画像角度算出手段104は、対象物候補検出手段101から「対象物なし」の旨が入力された場合には、傾き角度を0度とする。
入力画像角度算出手段104は、例えば、各対象物候補の入力画像中における角度に対し、類似度に基づく重み付けを行った重み付き角度に基づいて入力画像の上下方向に対する傾き角度を算出してもよい。入力画像角度算出手段104は、例えば、最も類似度が高い対象物候補の角度を重み1、その他の対象物候補の角度を重み0としてもよい。図2に示す入力画像と図3に示す登録画像とを用いた場合を例にすると、対象物候補αと登録対象物Aとの類似度が最も高くなるので、対象物候補αの入力画像中における角度(−10度)に重み1を付与することで、入力画像中における写像物全体の傾き角度を−10度と算出する。そして、写像物全体の傾き角度の符号を反転させた値(10度)を、入力画像の上下方向に対する傾き角度とする。
本実施の形態において、類似度は、登録対象物と対象物候補との間で視覚的特徴が一致したときに最大であり、視覚的な相違が大きくなるにつれて低くなる。類似度が低くなる要因として、対象物の相違、登録対象物と対象物候補の角度のずれ、対象物の状態の違い(向き・照明条件・表情)が考えられるが、どの要因によるものかを判定することは難しく、角度のずれによるものである可能性はなくならない。このため、類似度が低い場合には、対象物候補の角度の信頼性が低いものとして、重み付けを低くする。また、類似度が高い場合には、対象物が正しく検出され、かつ角度のずれもなく、状態も一致しているという、いずれの要因に対しても条件を満たしたことを意味するため、対象物候補の角度も信頼性が高いものとして、重み付けを高くする。このように、特定の対象物をいくつか登録しておき、類似度をもとに重み付けした角度を利用することで、結果的に、登録画像と同じ表情,向き,照明条件の顔の角度を上下判定に利用したり、高い検出精度の得られる種類の対象物候補の角度を上下判定に利用することができる。
出力手段130は、入力画像角度算出手段104の算出した入力画像の上下方向に対する傾き角度を出力する。上記の例では、入力画像の上下方向に対する傾き角度として10度を出力する。出力結果から、利用者は、入力画像を10度回転させれば、上下方向について画像補正できることを認知できる。
次に、図4のフローチャートを参照して本実施の形態の動作について説明する。図4は、第1の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。図4に示すように、まず、画像入力手段110は、対象物候補検出手段101に画像信号を入力する(ステップA01)。対象物候補検出手段101は、入力画像から対象物候補を検出する(ステップA02)。対象物候補検出手段101は、例えば、対象物候補として検出したい対象物の特徴(形状や構成要素の位置関係や濃淡分布等)を示す情報やテンプレートを予め記憶しておき、入力画像の画像情報(エッジ情報、輝度情報)との一致度に基づいて、対象物候補を検出する。
ここで、対象物候補が検出されなかった場合には(ステップA03のNo)、対象物候補検出手段101は、例えば、「対象物なし」を示すフラグ信号を入力画像角度算出手段104に出力する(ステップA04)。対象物候補が検出された場合には(ステップA03のYes)、対象物候補検出手段101は、例えば、「対象物あり」を示すフラグ信号を入力画像角度算出手段104に出力する(ステップA05)。なお、対象物候補検出手段101は、「対象物あり/なし」を示すフラグ信号を出力する代わりに、「対象物あり/なし」を示すフラグをセットしてもよい。
また、対象物候補検出手段101は、対象物候補が検出された場合には、対象物候補の画像情報を抽出する(ステップA06)。対象物候補検出手段101は、例えば、対象物候補の輪郭に沿って切り出した画像領域を示す情報を画像情報として抽出してもよい。なお、画像情報は、対象物候補の特徴量を抽出できる情報であれば、背景を含む画像領域を示す情報であっても、また、画像領域として抽出せずにその画像領域に含まれる画素情報のうち、特徴量抽出に用いる情報のみを格納した配列情報等であってもよい。
また、対象物候補検出手段101は、対象物候補の入力画像中における角度を抽出する(ステップA07)。入力画像角度算出手段104は、例えば、形状や構成要素の位置関係等をもとに対象物候補を検出する場合には、検出した形状や構成要素から定めた基準点(例えば左右の目)を結んだ線と入力画像の枠線との角度に基づいて求めてもよい。また、例えば、テンプレートを用いて対象物候補を検出する場合には、検出したときのテンプレートの回転角度を対象物候補の角度としてもよい。そして、検出した各対象物候補について、その画像情報と入力画像中における角度とを特徴量抽出手段102に出力するとともに、検出した対象物候補に対象物候補識別子を割り当て、対象物候補識別子と抽出した角度とを対応づけて角度記憶部121に記憶する。なお、角度記憶部121には、合わせて対象物候補の画像領域を示す情報を記憶してもよい。また、特徴量抽出手段102が、対象物候補検出手段101から入力される情報に基づいて角度記憶部121に記憶してもよい。
特徴量抽出手段102は、対象物候補の画像情報と上下方向(入力画像中における角度)をもとに、対象物候補の特徴量を抽出する(ステップA08)。特徴量抽出手段102は、例えば、予め定められた方法に従って、上下方向に応じて値が変わる特徴量(例えば、形状特徴量、構成要素の位置関係)、上下方向に応じて値が変わらない特徴量(例えば、色特徴量)、またはどちらも含む複数の特徴量を抽出する。また、特徴量抽出手段102は、抽出した特徴量を類似度算出手段103に入力する。
次に、類似度算出手段103は、対象物候補検出手段101によって入力画像から検出された対象物候補と、特徴量記憶部122に記憶された登録対象物との類似度を算出する(ステップA09)。類似度算出手段103は、例えば、検出された各対象物候補について、特徴量記憶部122に記憶されている各登録対象物との組み合わせにおいて、類似度算出手段103によって算出された対象物候補の特徴量と、特徴量記憶部122に記憶されている登録対象物の特徴量との差分を求めることによって、類似度を算出する。
また、入力画像角度算出手段104は、対象物候補検出手段101から「対象物あり」を示すフラグ信号を受け取った場合には、角度記憶部121に記憶された各対象物候補の入力画像中における角度と、類似度算出手段103によって算出された各対象物候補についての各登録対象物との類似度とに基づいて、入力画像の上下方向に対する傾き角度を算出する(ステップA10)。入力画像角度算出手段は、例えば、最も高い類似度が算出された対象物候補の角度を利用する手法や、最も高い類似度でかつ閾値以上の類似度が算出された対象物候補の角度を利用する手法や、閾値以上の類似度が算出された対象物候補の角度の平均を利用する手法や、閾値以上の類似度が算出された対象物候補の角度のうち最頻値を利用する手法や、各対象物候補の角度に対して位置や大きさや類似度による重みを付与した重み付き角度を利用する手法等を用いて、入力画像の上下方向に対する傾き角度を算出する。
なお、入力画像角度算出手段104は、対象物候補検出手段101から「対象物なし」を示すフラグ信号を受け取った場合には、入力画像の上下方向に対する傾き角度として0度を算出する。
そして、出力手段130は、入力画像角度算出手段104が算出した入力画像の上下方向に対する傾き角度を出力する(ステップA11)。
以上のように、本実施の形態によれば、画像取得時の装置の傾き情報を必要とせずに、上下方向の判定を行うことができる。また、従来手法では、画像から検出された対象物の方向を基に画像の上下方向を判定するため、対象物が誤検出された場合には正確な上下判定を行えなかった。これに対し、本実施の形態では、画像から検出された対象物候補の中から、あらかじめ記憶された登録対象物との類似度をもとに選択した信頼性の高い対象物候補の上下方向を利用して画像の上下方向を判定するため、高精度な判定を行うことができる。
実施の形態2.
次に、本発明による第2の実施の形態について図面を参照して説明する。図5は、第2の実施の形態よる画像方向判定装置の構成例を示すブロック図である。本実施の形態による画像方向判定装置は、図1に示す第1の実施の形態と比べて、データ処理装置200が、さらに画像加工手段205を備える点で異なる。なお、対象物候補検出手段201等の他の手段は、第1の実施の形態における対象物候補検出手段101等の他の手段と同様である。
画像加工手段205は、入力画像角度算出手段204によって算出された入力画像の上下方向に対する傾き角度に基づいて、画像入力手段210から入力される画像信号を加工した加工画像を生成する。画像加工手段205が生成する加工画像は、例えば、入力画像上に画像の上下方向を示す矢印を重畳した画像、入力画像を上下方向に対する傾き角度をもとに回転した画像、入力画像に含まれる全対象物の上下方向が画像の上下方向と一致するように対象物領域を回転させた画像など、入力画像の上下方向に対する傾き角度をもとに加工を施した画像であればどのような画像であってもよい。
次に、図6のフローチャートを参照して本実施の形態の動作について説明する。図6は、第2の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。なお、本実施の形態における対象物候補検出手段201,特徴量抽出手段202,類似度算出手段203および入力画像角度算出手段204の動作は(ステップB01〜B10)、図4に示す第1の実施の形態における対象物候補検出手段101,特徴量抽出手段102,類似度算出手段103および入力画像角度算出手段104の動作(ステップA01〜A10)と同様であるため、説明省略する。
図6に示すように、本実施の形態では、入力画像角度算出手段204によって算出された入力画像の上下方向に対する傾き角度を用いて、入力画像を加工して出力する。画像加工手段205は、入力画像角度算出手段204が算出した入力画像の上下方向に対する傾き角度に基づいて、入力画像を加工する(ステップB11)。そして、出力手段230は、入力画像角度算出手段204によって生成された加工画像を出力する(ステップB12)。
以上のように、本実施の形態によれば、算出された入力画像の上下方向に対する傾き角度を利用して入力画像を加工した画像が出力される。これにより、利用者は、入力画像の上下方向を手動で補正する必要がない。また、上下方向に対する傾き角度が数値ではなく加工画像で提示されることにより、利用者は入力画像の上下方向を即座に理解することができる。
実施の形態3.
次に、本発明による第3の実施の形態について図面を参照して説明する。図7は、第3の実施の形態による画像方向判定装置の構成例を示すブロック図である。本実施の形態による画像方向判定装置は、図1に示す第1の実施の形態と比べて、対象物候補検出手段301が、画像回転手段3011と、一方向対象物候補検出手段3012とによって構成される点で異なる。なお、特徴量抽出手段302等の他の手段は、第1の実施の形態における対象物候補検出手段101等の他の手段と同様である。
画像回転手段3011は、画像入力手段310から受け取った入力画像を、反時計周りを正として様々な角度で回転させた回転画像群を生成する。また、画像回転手段3011は、生成した回転画像群の画像情報を一方向対象物候補検出手段3012に出力する。
一方向対象物候補検出手段3012は、画像回転手段3011から入力される各回転画像の画像情報を用いて、各回転画像について、回転画像中における角度が0度の対象物候補を検出する。回転画像から対象物候補が検出された場合には、回転画像の回転角度に基づいて、対象物候補の入力画像中における角度を算出し、特徴量抽出手段302に、検出した対象物候補に関する情報(画像情報、角度)を出力する。また、一方向対象物候補検出手段3012は、各回転画像を識別するための画像識別子と回転角度とともに、検出した対象物候補の角度を角度記憶部321に記憶する。なお、全回転画像からひとつも対象物候補が検出されなかった場合には、入力画像角度算出手段304に「対象物なし」の旨を出力する。
角度記憶部321は、一方向対象物候補検出手段3012によって検出された各対象物候補の入力画像中における角度を記憶する。図8は、入力画像および回転画像群の例と角度記憶部321に記憶されるデータ構造の例を示す説明図である。図8に示すように、角度記憶部321は、例えば、画像回転手段3011によって生成された回転画像を識別するための識別子(以下、回転画像識別子という。)と、その回転画像の回転角度と、その回転画像から検出された対象物候補を識別するため対象物候補識別子と、その対象物候補の入力画像中における角度とを対応づけて記憶してもよい。図8の例では、回転画像中における角度が0度の対象物候補として、入力画像を10度回転させた回転画像Q1からは対象物候補α,σが検出され、また、入力画像を−30度回転させた回転画像Q2からは対象物候補βが検出され、また、入力画像を−7度回転させた回転画像Q3からは対象物候補γが検出されたことを示している。また、図8の例では、検出された4つの対象物候補(α,β,γ,σ)の入力画像中における角度として、それぞれ回転画像の回転角度に応じて、−10度,−10度,30度,7度が検出されたことを示している。
次に、図9のフローチャートを参照して本実施の形態の動作について説明する。図9は、第3の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。図9に示すように、まず、画像入力手段310は、画像回転手段3011に画像信号を入力する(ステップC01)。画像回転手段3011は、入力画像を、反時計回りを正として様々な角度に回転させた回転画像群を生成する(ステップC02)。また、画像回転手段3011は、各回転画像について、回転画像識別子と回転角度とを角度記憶部321に記憶する(ステップC02)。
次に、一方向対象物候補検出手段3012は、各回転画像から、回転画像中における角度が0度の対象物候補を検出する(ステップC04)。ここで、回転画像群から対象物候補が検出されなかった場合には(ステップC05のNo)、一方向対象物候補検出手段3012は、例えば、「対象物なし」を示すフラグ信号を入力画像角度算出手段304に出力する(ステップC06)。回転画像群から対象物候補が検出された場合には(ステップC05のYes)、画像回転手段3011は、例えば、「対象物あり」を示すフラグ信号を入力画像角度算出手段304に出力する(ステップC07)。そして、一方向対象物候補検出手段3012は、検出した対象物候補の画像情報を抽出し(ステップC08)、特徴量抽出手段302に、対象物候補の識別子と画像情報と回転画像の回転角度から算出される入力画像中における角度とを出力する。また、一方向対象物候補検出手段3012は、角度記憶部321に、回転画像識別子と対応づけて、その回転画像から検出した各対象物候補の識別子と、その対象物候補の入力画像中における角度とを記憶する(ステップC09)。
特徴量抽出手段302は、対象物候補の画像情報と入力画像中における角度とをもとに、対象物候補の上下方向を判定し、対象物候補の特徴量を抽出する(ステップC10)。また、特徴量抽出手段302は、抽出した特徴量を類似度算出手段303に入力する。類似度算出手段303は、類似度算出手段303によって入力画像から算出された各対象物候補の特徴量と、特徴量記憶部322に記憶された各登録対象物の特徴量との類似度を算出する(ステップC11)。
入力画像角度算出手段304は、一方向対象物候補検出手段3012から「対象物あり」を示すフラグ信号を受け取った場合には、各対象物候補の入力画像中における角度と、各対象物候補と各登録対象物との組み合わせにおける類似度とに基づいて、入力画像の上下方向に対する傾き角度を算出する(ステップC12)。また、入力画像角度算出手段304は、「対象物なし」を示すフラグ信号を受け取った場合には、入力画像の上下方向に対する傾き角度として0度を算出する。そして、出力手段330は、入力画像角度算出手段304が算出した入力画像の上下方向に対する傾き角度を出力する(ステップC13)。
以上のように、本実施の形態によれば、画像回転手段によって生成された回転画像を用いて対象物候補を検出するので、例えば、対象物候補検出手段が、予め登録されるテンプレートの角度に制限される等によって、一定の角度の対象物候補しか検出できない場合であっても、様々な角度の対象物候補を検出できる。換言すれば、対象物候補を検出するための情報として、角度に応じた情報を登録しなくても、回転画像の回転角度に応じて、様々な角度の対象物候補を検出することができる。
実施の形態4.
次に、本発明による第4の実施の形態について図面を参照して説明する。図10は、第4の実施の形態による画像方向判定装置の構成例を示すブロック図である。本実施の形態による画像方向判定装置は、図1に示す第1の実施の形態と比べて、さらにコマンド入出力装置440を備える点で異なる。なお、対象物候補検出手段401等の他の手段は、第1の実施の形態における対象物候補検出手段101等の他の手段と同様である。
コマンド入出力装置440は、利用者からの操作に応じて、画像入力手段410から入力される画像が登録画像であることを示す信号を入力する。コマンド入出力装置440から「登録画像」を示す信号が入力された場合には、特徴量抽出手段402は、入力画像から検出された対象物を登録対象物として、登録対象物の特徴量を抽出する。また、特徴量抽出手段402は、抽出した特徴量を登録対象物の特徴量として、登録対象物を識別する登録対象物識別情報と登録対象物の画像情報とともに、特徴量記憶部422に記憶する。また、特徴量抽出手段402は、コマンド入出力装置440を介して、特徴量を抽出する対象物領域およびその角度を利用者に提示し、また、利用者によって加えられる修正信号を受け付けてもよい。修正信号を受け付けた場合には、修正された対象物領域および角度に基づいて抽出した特徴量を、特徴量記憶部422に記憶する。なお、コマンド入出力装置440から「登録画像」を示す信号が入力されない場合には、第1の実施の形態と同様に、対象物候補の特徴量として処理する。
次に、図11のフローチャートを参照して本実施の形態の動作について説明する。図11は、第4の実施の形態による画像方向判定装置の動作の一例を示すフローチャートである。なお、「登録画像」を示す信号が入力されない場合の動作(ステップD09〜D17)は、図4に示す第1の実施の形態の動作(ステップA03〜A11)と同様であるため、説明省略する。
まず、画像入力手段410は、対象物候補検出手段401に画像信号を入力する(ステップD01)。また、その際、コマンド入出力装置440を介して、「登録画像」を示す信号が入力される(ステップD02)。
対象物候補検出手段401は、画像入力手段410から入力された入力画像から対象物候補を検出し(ステップD03)、検出した対象物候補の画像領域および角度を抽出して、特徴量抽出手段402に出力する。次に、特徴量抽出手段402は、コマンド入出力装置440から「登録画像」を示す信号が入力された場合には(ステップD04のYes)、対象物候補検出手段401から入力される対象物候補について、その画像領域およびその上下方向(入力画像中における角度)を、コマンド入出力装置440に出力する(ステップD05)。
コマンド入出力装置440は、特徴量抽出手段402より出力された対象物候補の画像領域および画像中における角度を受け取って利用者に提示する。利用者が、提示された対象物候補の画像領域および角度に誤りがあると判断し、修正信号を加えた場合には、コマンド入出力装置440は、修正信号を特徴量抽出手段402に出力する(ステップD06)。
特徴量抽出手段402は、コマンド入出力装置440から入力される修正信号に基づいて、対象物候補の画像領域およびその角度を修正し、修正した画像領域および角度をもとに、対象物候補の特徴量を抽出する(ステップD07)。そして、抽出した特徴量を、登録対象物の特徴量として、画像領域およびその角度とともに特徴量記憶部422に記憶する(ステップD08)。以降、入力画像の画像信号が入力される度に同様の動作を行う。なお、ステップD04において、「登録画像」を示す信号が入力されなかった場合の動作は、第1の実施の形態と同様である。
以上のように、本実施の形態によれば、登録対象物の特徴量を登録するためのコマンド入出力装置440が備えられているため、利用者が、入力画像の上下判定に用いる登録対象物の登録を行うことができる。
実施の形態5.
次に、本発明による第5の実施の形態について図面を参照して説明する。図12は、第5の実施の形態による画像方向判定装置の構成例を示すブロック図である。本実施の形態による画像方向判定装置は、データ処理装置500と、画像入力装置510と、記憶装置520と、出力手段530と、入力画像角度算出用プログラム550とを備える。
入力画像角度算出用プログラム550は、データ処理装置500に読み込まれ、データ処理装置500を制御し、本発明による第1,第2または第3の実施の形態の動作を行うためのプログラムである。なお、入力画像角度算出用プログラム550は、例えば、画像方向判定装置が備える記憶装置(メモリ,外部記憶装置等)に記憶される。データ処理装置500は、入力画像角度算出用プログラム550に従って動作することによって、第1,第2または第3の実施の形態におけるデータ処理装置100,200,300の処理と同一の処理を実行する。また、記憶装置520には、データ処理装置500がプログラムに従って動作することによって、角度記憶部または特徴量記憶部としての記憶領域が割り当てられ、データ処理装置500の各手段によって生成される中間データおよび登録データが記憶される。
実施の形態6.
次に、本発明による第6の実施の形態について図面を参照して説明する。図13は、第6の実施の形態による画像方向判定装置の構成例を示すブロック図である。本実施の形態による画像方向判定装置は、データ処理装置600と、画像入力装置610と、記憶装置620と、出力手段630と、コマンド入出力装置640と、入力画像角度算出用プログラム650とを備える。
入力画像角度算出用プログラム650は、データ処理装置600に読み込まれ、データ処理装置600を制御し、本発明による第4の実施の形態の動作を行うためのプログラムである。なお、入力画像角度算出用プログラム650は、例えば、画像方向判定装置が備える記憶装置(メモリ,外部記憶装置等)に記憶される。データ処理装置600は、入力画像角度算出用プログラム650に従って動作することによって、第4の実施の形態におけるデータ処理装置400の処理と同一の処理を実行する。また、記憶装置620には、データ処理装置600がプログラムに従って動作することによって、角度記憶部または特徴量記憶部としての記憶領域が割り当てられ、データ処理装置600の各手段によって生成される中間データおよび登録データが記憶される。
[実施例1]
次に、具体的な実施例を用いて本発明を実施するための形態を説明する。本実施例は、本発明の第1の実施の形態に対応するものである。図14は、第1の実施例としてパーソナルコンピュータに適用した画像方向判定装置の構成例を示す説明図である。図14に示すように、本実施例におけるパーソナルコンピュータは、データ処理装置100として中央演算装置を、画像入力装置110として画像入力端子を、記憶装置120としてハードディスクを、出力手段130としてディスプレイを備える。なお、本実施例による画像方向判定装置は、あらかじめ人物A,人物B,・・・といった特定人物の画像を登録画像として記憶しておき、入力画像として人物を含む画像が入力された場合に、入力画像の上下方向を判定する。
中央演算装置100は、プログラムに従って動作することによって、対象物候補検出手段101,特徴量抽出手段102,類似度算出手段103,および入力画像角度算出手段104として機能する。なお、本実施例では、対象物候補検出手段101は、対象物候補として人物を検出する人物候補検出手段101として動作する。また、特徴量抽出手段1
02は、人物候補の特徴量を抽出する人物特徴量抽出手段102として動作する。また、類似度算出手段103は、各人物候補と各登録画像に含まれる登録人物との類似度を算出し、入力画像角度算出手段104は、各人物候補と登録人物との組み合わせにおける各類似度と各人物候補の角度とに基づいて、入力画像の上下方向に対する傾き角度を算出する。
また、ハードディスク120には、角度記憶部121および特徴量記憶部122として機能する記憶領域が割り当てられる。なお、本実施例では、角度記憶部121は、人物候補検出手段によって検出された人物候補について入力画像中における角度とその人物候補を識別するための人物候補識別子とを対応づけて記憶する。また、特徴量記憶部122は、人物特徴量記憶部122として、予め登録画像から抽出された上下方向が既知の人物(登録人物)の特徴量とその登録人物を識別するための登録人物識別子とを対応づけて記憶する。
ここで、画像入力端子110から画像が入力されたとする。中央演算装置100は、人物候補検出手段101において、入力画像から人物候補の検出を行う。人物候補が検出された場合には、「人物あり」を示すフラグ信号を入力画像角度算出手段104に出力するとともに、各人物候補の入力画像中における角度を抽出し、ハードディスク120内の角度記憶部121に記憶する。また、各人物候補の画像領域とその角度とを人物特徴量抽出手段102に出力する。
人物候補の検出方法として、例えば、文献「岩井儀雄、勞世▲広▼、山口修、平山高嗣、“画像処理による顔検出と顔認識”、情報処理学会研究報告(CVIM−149)、2005年、pp.343〜368」(参考文献1)に記載されている人物顔の検出手法を用いてもよい。参考文献1に記載の人物顔の検出手法は、顔(頭部)の輪郭を楕円、目や口を細長の形状をしていることを利用して作成したテンプレートを用いて顔検出を行う手法である。なお、参考文献1に記載の人物顔の検出手法に限らず、例えば、頬や額の部分は輝度が高く、目や口の部分の輝度は低いという輝度分布の特性を利用する手法や、顔の対称性や肌色領域と位置を利用して顔検出を行う手法などの手法を用いてもよい。
また、人物の全身あるいは人物顔が映っている画像をテンプレートとして記憶しておき、入力画像とテンプレートの画像情報から求めた差分が所定の閾値以下のときに、人物が入力画像中に存在すると判定する手法が挙げられる。テンプレートとして記憶する人物画像は、ユーザが画像入力端子110を介して入力する画像であっても、ユーザが指定する人物の特徴をもとに人物候補検出手段101が選択した画像であってもよい。
また、大量の人物顔と非顔の学習サンプルから得られた特徴量分布を統計的に学習し、入力画像から得られる特徴量が顔と非顔のどちらの分布に属するかを判定する、ニューラルネットやサポートベクターマシン、Adaboost法などを利用した手法も挙げられる。
また、人物候補の入力画像中における角度は、顔の輪郭、目、口の形状をもとに作成したテンプレートをもとに人物の顔を検出する手法を用いた場合には、例えば、検出された左右の目を結ぶ直線の垂直二等分線が入力画像の垂直方向となす角度を算出することにより求められる。
また、人物顔が映っている画像をテンプレートとして記憶し、様々な角度で回転したテンプレートと入力画像の一部との差分値により人物顔を検出する手法を用いた場合には、人物候補として検出したときに用いたテンプレートの回転角度を、人物候補の入力画像中における角度としてもよい。
人物の検出手法として、上記の例を利用しても、他の手法を適用しても構わない。また、抽出する人物の領域は、人物特徴量抽出手段によって人物の特徴量を抽出できる領域であれば、人物の輪郭に沿って正確に切り出した画像領域であっても、背景を含む人物の画像領域であっても、どんな領域でも構わない。なお、人物候補検出手段101は、入力画像から人物候補が検出されなかった場合には、「人物なし」を示すフラグ信号を入力画像角度算出手段104に出力する。
人物特徴量抽出手段102は、入力画像から人物候補の画像領域として抽出された領域から、人物の特徴量を抽出する。人物特徴量抽出手段102は、例えば、人物の着衣の色情報や、人物の顔特徴量、人物の形状などを用いて人物の特徴量を抽出する。人物の顔特徴量として、例えば、文献「赤松茂、“コンピュータによる顔の認識―サーベイ―”、電子情報通信学会論文誌、1997年8月、Vol.J80−A、No.8、pp.1215〜1230」(参考文献2)に記載されている、顔の構造に関する知識を活用して目・鼻・口の形状や位置関係などを数値的に記述した特徴ベクトルを用いてもよい。また、参考文献2に記載の特徴量に限らず、顔の各画素の濃淡値を2次元配列として表現する特徴ベクトルや、顔の各特徴点においてウェーブレット変換を施すことで得られるパターンの局所的な周期性とその方向性を表現可能なGabor jetと呼ばれる特徴ベクトルなどが挙げられる。人物間の類似度判定に用いる人物顔の特徴量として、上述の例を利用しても他の手法を適用しても構わない。
類似度算出手段103は、あらかじめハードディスク120内の人物特徴量記憶部122に記憶された、登録画像から取得した各登録人物(人物A,人物B,・・・)の特徴量と、入力画像中から検出された各人物候補の特徴量との類似度を算出する。類似度は、一例として入力画像から検出された各人物候補の顔の特徴量ベクトルと、あらかじめ記憶された各登録人物(人物A,人物B,・・・)の顔の特徴量ベクトルとの差分によって求められる。
また、類似度の算出方法の別の例として、画素値の差を用いる手法が挙げられる。例えば、入力画像から検出された人物候補の顔の入力画像中における角度と、あらかじめ記憶された登録人物の顔の登録画像中における角度との差分zを求める。人物候補の顔の画像領域の大きさを、あらかじめ記憶された登録人物の顔の大きさに正規化し、入力画像から検出された人物候補の顔の画像領域をz度回転するアフィン変換によって、入力画像から検出された人物候補の顔と登録人物(人物A,人物B,・・・)の顔とを重ね合わせ、対応する各画素値の差の総和を求めることにより類似度を算出する。
また、重ね合わせに際しては、あらかじめ記憶された登録人物の画像領域の回転角度をz±Δとし、各回転において類似度を求め、その最大値を類似度として用いてもよい。この場合、最大値を算出する角度Δにより、あらかじめ記憶された登録人物の登録画像中における角度を補正することができる。なお、あらかじめ記憶しておく登録人物は、1名であっても複数名であってもよい。類似度算出手段103は、各人物候補と各登録人物との様々な組み合わせについて類似度を算出し、入力画像角度算出手段104に出力する。
入力画像角度算出手段104は、人物候補検出手段101から「人物なし」を示すフラグ信号を受け取ると、入力画像の上下方向に対する傾き角度を0度とする。一方、人物候補検出手段101から「人物あり」を示すフラグ信号を受け取ると、類似度算出手段103から入力される各人物候補と各登録人物との組み合わせにおける各類似度と、各人物候補の入力画像中における角度とに基づいて、入力画像の上下方向に対する傾き角度を算出する。入力画像角度算出手段104は、例えば、次に示すような手法を用いて傾き角度を算出してもよい。
[1]登録人物と最も類似する人物候補の角度を利用する手法
人物候補I(i)の入力画像中における角度をarg(i)とする。また、人物候補I(i)と登録人物J(j)との類似度をS(I(i),J(j))とする。なお、i=1〜N(N=人物候補の数)であり、j=1〜M(M=登録人物の数)である。このとき、人物候補I(i)および登録人物J(j)の組み合わせについて、最大の類似度が算出される人物候補I(i1)の角度に重み1を、その他の人物候補の角度には重み0を与えた場合、入力画像の上下方向に対する傾き角度x1は、式(1)によって求まる。
Figure 2007142227
このように、手法[1]では、登録人物との類似度が最も高い人物候補の角度のみが、上下方向に対する傾き角度の算出に利用される。そのため、仮に、人物候補検出手段で人物候補の誤検出が生じても精度劣化がおきにくいという効果がある。
[2]登録人物との類似度が閾値以上で、登録人物と最も類似する人物の角度を利用する手法
人物候補I(i)の入力画像中における角度をarg(i)とする。また、人物候補I(i)と登録人物J(j)との類似度をS(I(i),J(j))とする。なお、i=1〜N(N=人物候補の数)であり、j=1〜M(M=登録人物の数)である。このとき、人物候補I(i)および登録人物J(j)の組み合わせについて、最大の類似度が算出される人物候補I(i2)の類似度が所定の閾値以上であれば、その人物候補I(i2)の角度に重み1を、そうでなければ重み0を与え、かつ、その他の人物候補の角度には重み0を与えた場合、入力画像の上下方向に対する傾き角度x2は、式(2)によって求まる。
Figure 2007142227
x2=0 (人物候補I(i2)の類似度が所定の閾値に満たない場合)
このように、手法[2]では、登録人物との類似度が最も高く、かつ類似度が閾値以上となる人物候補の角度のみが、上下方向に対する傾き角度の算出に利用される。そのため、類似度が最大であっても、対象物として信頼性の低い人物候補の入力画像中における角度によって、誤った傾き角度を算出するのを防ぐ効果がある。
[3]類似度が閾値以上の人物の角度の平均を利用する手法
人物候補I(i)の入力画像中における角度をarg(i)とする。また、各人物候補I(i)について、各登録人物との類似度の最大値をSmax(I(i))とする。なお、i=1〜N(N=人物候補の数)である。このとき、Smax(I(i))が所定の閾値以上であれば、その人物候補I(i)の各角度に重みw(i)1を、そうでなければ重みw(i)=0を与えた場合、入力画像の上下方向に対する傾き角度x3は、式(3)によって求まる。
Figure 2007142227
このように、手法[3]では、登録人物との類似度が高い人物候補群の角度について平均をとることによって、上下方向に対する傾き角度を算出する。そのため、仮に、類似度が高い人物候補群の角度がそれぞれ多少の誤差を含んでいる場合であっても、誤差による精度劣化を抑える効果がある。
[4]類似度が閾値以上の人物の角度の最頻値を利用する手法
各人物候補I(i)について、各登録人物との類似度の最大値をSmax(I(i))とする。また、Smax(I(i))が所定の閾値以上である各人物候補I(i)の入力画像中における角度の最頻値をarg(i4)とする。なお、i=1〜N(N=人物候補の数)である。このとき、arg(i4)に重み1を、その他の角度には重み0を与えた場合、入力画像の上下方向に対する傾き角度x4は、式(4)によって求まる。
Figure 2007142227
このように、手法[4]では、登録人物との類似度が高い人物候補群の角度の最頻値が、上下方向に対する傾き角度の算出に利用される。そのため、類似度が高い人物候補群について、仮に、検出領域の誤差や角度のずれがあった場合であっても、精度劣化が生じにくいという効果がある。
[5]人物候補の位置による重みを利用する手法
各人物候補I(i)について、各登録人物との類似度の最大値をSmax(I(i))とする。なお、i=1〜N(N=人物候補の数)である。また、Smax(I(i))が所定の閾値以上である各人物候補I(i)について、人物候補の重心と入力画像の画像中心との距離をd(i)としたとき、d(i)が最小となる人物候補の角度をarg(i5)とする。このとき、arg(i5)に重み1を、その他の角度には重み0を与えた場合、入力画像の上下方向に対する傾き角度x5は、式(5)によって求まる。
Figure 2007142227
このように、手法[5]では、登録人物との類似度が高い人物候補の中で、画像中心に近い候補の角度を用いて上下方向に対する傾き角度を算出する。一般に、写真撮影する際は、人物を写真の中央に配置するように撮影することから、画像中心に近い候補を選ぶことにより、信頼性の高い傾き角度が算出できる。
[6]人物候補の面積による重みを利用する手法
各人物候補I(i)について、各登録人物との類似度の最大値をSmax(I(i))とする。なお、i=1〜N(N=人物候補の数)である。また、Smax(I(i))が所定の閾値以上である各人物候補I(i)について、人物候補の面積をa(i)としたとき、a(i)が最大となる人物候補の角度をarg(i6)とする。このとき、arg(i6)に重み1を、その他の角度には重み0を与えた場合、入力画像の上下方向に対する傾き角度x6は、式(6)によって求まる。
Figure 2007142227
このように、手法[6]では、登録人物との類似度の高い人物候補の中で、画像面積の大きい候補の角度を用いて上下方向に対する傾き角度を算出する。一般に、写真で人物を撮影する際は、人物が大きく写るように撮影することから、面積の大きな候補を選ぶことによって信頼性の高い傾き角度が算出できる。
[7]類似度による重みを利用する手法
各人物候補I(i)について、各登録人物との類似度の最大値をSmax(I(i))とする。なお、i=1〜N(N=人物候補の数)である。このとき、各人物候補I(i)の入力画像中における角度arg(i)に、重みw(i)=Smax(I(i))を与えた場合、入力画像の上下方向に対する傾き角度x7は、式(7)によって求まる。
Figure 2007142227
また、手法[7]では、Smax(I(i))が所定の閾値以上の各人物候補I(i)について、その人物候補I(i)の角度に重みw(i)=Smax(I(i))を与え、その他の人物候補には重みw(i)=0を与えて、式(7)により入力画像の上下方向に対する傾き角度x7を求めてもよい。このとき、Smax(I(i))が所定の閾値以上となる人物候補が存在しない場合には、入力画像の上下方向に対する傾き角度x7は0とする。
このように、手法[7]では、登録人物との類似度が高い人物候補群の角度について、それぞれ類似度により重み付けて上下方向に対する傾き角度を算出する。そのため、類似度が高い人物候補群の角度がそれぞれ誤差を含んでいる場合に、誤差による精度劣化を抑える効果がある。
[8]90度の倍数値に補正する手法
手法[1]〜[7]によって求めた上下方向に対する傾き角度について、−90,0,90,180の中で最も近い数値を入力画像の上下方向に対する傾き角度とする。
一般的に、ディジタルカメラ等で撮影される写真は90度の倍数値の傾きをもって撮影されるのが標準である。そのため、本手法では様々な方式で算出された上下方向に対する傾き角度を標準的な数値に修正できるという効果がある。
本実施例において、入力画像角度算出手段104は、上記のいずれかの手法を用いて入力画像の上下方向に対する傾き角度を算出する。なお、上記以外の方法を用いてもよい。入力画像角度算出手段104は、算出した入力画像の上下方向に対する傾き角度をディスプレイ130に出力する。
利用者は、ディスプレイに出力された画像の上下方向に対する傾き角度をもとに、入力画像の上下方向を知ることができる。
[実施例2]
次に、第2の実施例を用いて本発明を実施するための形態を説明する。本実施例は、本発明による第2の実施の形態に対応するものである。図15は、第2の実施例としてディジタルカメラに適用した画像方向判定装置の構成例を示す説明図である。図15に示すように、本実施例におけるディジタルカメラは、データ処理装置200としてCPUを、画像入力手段210として画像入力端子を、記憶装置220としてメモリを、出力手段230としてディスプレイを備える。なお、本実施例においても、あらかじめ特定人物の画像を登録画像として記憶しておき、入力画像として人物を含む画像が入力された場合に、入力画像の上下方向を判定する。
CPU200は、プログラムに従って動作することによって、対象物候補検出手段201,特徴量抽出手段202,類似度算出手段203,入力画像角度算出手段204,および画像加工手段205として機能する。なお、本実施例においても、第1の実施例と同様に、対象物候補検出手段201は、対象物候補として人物を検出する人物候補検出手段201として動作する。また、特徴量抽出手段202は、人物候補の特徴量を抽出する人物特徴量抽出手段202として動作する。また、類似度算出手段203は、各人物候補と各登録画像に含まれる登録人物との類似度を算出し、入力画像角度算出手段204は、各人物候補と登録人物との組み合わせにおける各類似度と、各人物候補の角度とに基づいて、入力画像の上下方向に対する傾き角度を算出する。
なお、本実施例では、さらに、画像加工手段205が、入力画像角度算出手段によって算出された入力画像の上下方向に対する傾き角度に基づいて、画像入力端子から入力される画像信号を加工して、加工画像を生成する。また、ディスプレイ230は、加工画像を表示する。
また、メモリ220には、角度記憶部221および特徴量記憶部222として機能する記憶領域が割り当てられる。なお、本実施例においても、第1の実施例と同様に、角度記憶部221は、人物候補検出手段201によって検出された人物候補について入力画像中における角度とその人物候補を識別するための人物候補識別子とを対応づけて記憶する。また、特徴量記憶部222は、人物特徴量記憶部222として、予め登録画像から抽出された上下方向が既知の人物(登録人物)の特徴量とその登録人物を識別するための登録人物識別子とを対応づけて記憶する。
利用者は、ディジタルカメラ内に蓄積された写真を登録画像として用いることができる。例えば、登録画像として家族の写真を用い、家族写真から抽出された各家族の特徴量をメモリ220内の人物特徴量記憶部222に記憶しておくことで、利用者は、再び家族を被写体として含む写真を撮影したときに、上下方向が補正された写真をディジタルカメラのディスプレイ230で確認できる。これにより、利用者は、写真の上下方向が正しい上下方向になるように手動で整形する必要がなく、容易に正しい上下方向の画像を得ることができる。
[実施例3]
次に、第3の実施例を用いて本発明を実施するための形態を説明する。本実施例は、本発明による第3の実施の形態に対応するものである。図16は、第2の実施例としてパーソナルコンピュータに適用した画像方向判定装置の構成例を示す説明図である。図16に示すように、本実施例におけるパーソナルコンピュータは、データ処理装置300として中央演算装置を、画像入力装置310として画像入力端子を、記憶装置320としてハードディスクを、出力手段330としてディスプレイを備える。なお、本実施例では、各回転画像を1つの対象物候補として捉え、予め登録しておいた登録画像との、画像全体の特徴量の類似度(例えば、画像内の色やエッジ等の配置関係)に基づいて、入力画像の上下方向を判定する。
中央演算装置300は、プログラムに従って動作することによって、画像回転手段3011,一方向対象物候補検出手段3012,特徴量抽出手段302,類似度算出手段303,入力画像角度算出手段304として機能する。なお、本実施例では、一方向対象物候補検出手段3012は、各回転画像から、その回転画像の画像領域全体を対象物候補として検出する。また、ハードディスク320には、角度記憶部321および特徴量記憶部322として機能する記憶領域が割り当てられる。本実施例では、角度記憶部321は、回転画像を識別するための回転画像識別子と、その回転画像の回転角度と、その回転画像から検出された対象物候補を識別するための対象物候補識別子と、その対象物候補の入力画像中における角度とを記憶する。また、特徴量記憶部322は、予め登録された上下方向が既知の画像(登録画像)の特徴量とその登録画像を識別するための登録画像識別子とを対応づけて記憶する。
ここで、画像入力端子310から画像が入力されたとする。中央演算装置300は、画像回転手段3011において、入力画像を様々な角度で回転させて、回転画像群を生成する。そして、生成した回転画像群を一方向対象物候補検出手段3012に出力するとともに、各回転画像について、その回転角度をハードディスク320内の角度記憶部322に記憶する。回転角度は様々な角度が想定されるが、ディジタルカメラ等で撮影される写真は、−90,0,90,180度の傾きをもって撮影されるのが標準である。従って、標準的な実装では、上記4種類の回転画像を生成する。
一方向対象物候補検出手段3012は、各回転画像について、その画像領域全体を対象物候補として検出し、その画像領域と回転角度から算出される対象物候補(回転画像)の入力画像中における角度とを、特徴量抽出手段302に出力する。なお、入力画像は、入力画像を角度0度で回転させた回転画像であるため、回転画像群として必ず1つ以上の回転画像が生成される。従って、本実施例では、対象物候補として必ず1つ以上の回転画像が検出されるので、入力画像角度算出手段には、必ず「対象物あり」を示すフラグ信号が出力される。
特徴量抽出手段302は、対象物候補として、各回転画像の画像領域とその角度とを受け取ると、各回転画像の特徴量を抽出する。また、特徴量抽出手段302は、抽出した各回転画像の特徴量を類似度算出手段303に出力する。特徴量として、画像領域内の画素値を用いる方法や、画像領域を矩形ブロックに分割し、各ブロックから抽出した色あるいはエッジ情報を用いる方法や、画像領域を色やエッジ等の画像特性により領域分割し、各領域の画像上における配置情報を用いる方法などが挙げられる。なお、各領域の配置情報の一例として、画像重心を始点、領域の重心を終点とする2次元ベクトルと領域の主要色情報により構成される3次元の配置ベクトルによって表現できる。このとき、N個の領域で構成される画像の配置情報は、配置ベクトルN本によって表現できる。
類似度算出手段303は、特徴量抽出手段302から入力される各回転画像の特徴量と、ハードディスク320内の特徴量記憶部322に登録された各登録画像の特徴量との類似度を算出する。一例として、登録画像として空と地面を含む風景写真を、入力画像として登録画像と同様に空と地面を含む風景写真を入力した場合の類似度算出方法について説明する。本例では、特徴量として、画像上の各色領域の配置情報を表す3次元の配置ベクトルを用いる。ハードディスク320内の特徴量記憶部322には、あらかじめ登録画像から抽出した特徴量として、青色の空領域は画像の上方に、茶色の地面領域は画像の下方に配置することを表す配置ベクトルが記憶されているものとする。一方、入力画像をもとに生成された各回転画像からも同様の手法によって、各色領域の配置情報を表す3次元の配置ベクトルが特徴量として算出される。各回転画像と登録画像との組み合わせについて、登録画像の配置ベクトルと回転画像の配置ベクトルとの類似度を算出すると、空領域が上、地面領域が下となる配置ベクトルが抽出された回転画像について、登録画像と最も高い類似度が得られる。
類似度算出手段303は、例えば、登録画像中の各領域と回転画像中の各領域について配置ベクトルの色成分を比較し、差分値が一定値以下の領域対は互いに同一の色領域であると判定する。そして、同一の色領域と判定された領域の組み合わせについて、配置ベクトルの位置成分について差分をとり、差分が小さいほど高い類似度が算出される関数を定義することにより、類似度を算出することができる。
入力画像角度算出手段304は、各回転画像の入力画像中における角度に対し、登録画像との類似度に基づく重み付けを行い、重み付き角度を利用して入力画像の上下方向に対する傾き角度を算出する。なお、入力画像角度算出手段304は、例えば、最も高い類似度を得られた回転画像の角度を用いる方法や、類似度が一定以上の回転画像の角度の平均値を用いる方法など、様々な手法を用いることが可能である。
ディスプレイ330は、入力画像角度算出手段が算出した入力画像の上下方向に対する傾き角度を出力する。利用者は、ディスプレイに表示された入力画像の上下方向に対する傾き角度をもとに、入力画像の上下方向を知ることができる。
[実施例4]
次に、第4の実施例を用いて本発明を実施するための形態を説明する。本実施例は、第3の実施例と同じ、本発明による第3の実施の形態に対応するものである。本実施例では、画像方向判定装置を、対象物として人物を含む入力画像の上下判定に利用した例を示す。図17は、第4の実施例としてパーソナルコンピュータに適用した画像方向判定装置の構成例を示す説明図である。図17に示すように、本実施例におけるパーソナルコンピュータは、データ処理装置300として中央演算装置を、画像入力装置310として画像入力端子を、記憶装置320としてハードディスクを、出力手段330としてディスプレイを備える。
中央演算装置300は、プログラムに従って動作することによって、画像回転手段3011,一方向対象物候補検出手段3012,特徴量抽出手段302,類似度算出手段303,入力画像角度算出手段304,および画像加工手段305として機能する。なお、本実施例では、一方向対象物候補検出手段3012は、各回転画像から、回転画像中における角度が0度の人物候補を検出する一方向人物候補検出手段3012として動作する。また、特徴量抽出手段302は、人物候補の特徴量を抽出する人物特徴量抽出手段3012として動作する。また、類似度算出手段303は、各人物候補と各登録画像に含まれる登録人物との類似度を算出する。また、入力画像角度算出手段304は、各人物候補と登録人物との組み合わせにおける各類似度と、各人物候補の角度とに基づいて、入力画像の上下方向に対する傾き角度を算出する。
また、ハードディスク320には、角度記憶部321および特徴量記憶部322として機能する記憶領域が割り当てられる。なお、本実施例では、角度記憶部321は、画像回転手段3011で生成された回転画像を識別するための回転画像識別子と、その回転角度とを対応づけて、一方向人物候補検出手段3012によって検出された人物候補の、入力画像中における角度と、その人物候補を識別するための人物候補識別子とを記憶する。また、特徴量記憶部322は、人物特徴量記憶部322として、予め登録画像から抽出された上下方向が既知の人物(登録人物)の特徴量とその登録人物を識別するための登録人物識別子とを対応づけて記憶する。
ここで、画像入力端子310から画像が入力されたとする。中央演算装置300は、画像回転手段3011において、入力画像を様々な回転角度で回転させて、回転画像群を生成する。そして、生成した回転画像群を一方向人物候補検出手段3012に出力するとともに、各回転画像について、その回転角度をハードディスク内の角度記憶部に記憶する。
一方向人物候補検出手段3012は、各回転画像から回転画像中の角度が0度の人物候補を検出する。人物候補が検出された場合には、入力画像角度算出手段304に「人物あり」を示すフラグ信号を出力するとともに、各人物候補の入力画像中における角度をハードディスク320内の角度記憶部321に記憶する。また、各人物候補の画像領域とその角度とを人物特徴量抽出手段に出力する。なお、人物候補が検出されない場合には、「人物なし」を示すフラグ信号を入力画像角度算出手段304に出力する。なお、以降の動作は、第1の実施例と同様であるため、説明省略する。
利用者は、ディスプレイ330に表示された画像の上下方向に対する傾き角度をもとに、入力画像の上下方向を知ることができる。
[実施例5]
次に、第5の実施例を用いて本発明を実施するための形態を説明する。本実施例は、本発明による第4の実施の形態に対応するものである。図18は、第5の実施例としてパーソナルコンピュータに適用した画像方向判定装置の構成例を示す説明図である。図18に示すように、本実施例におけるパーソナルコンピュータは、データ処理装置400として中央演算装置を、画像入力装置410として画像入力端子を、記憶装置420としてハードディスクを、出力手段430としてディスプレイを、コマンド入出力装置440として、マウス、キーボード、およびディスプレイを備える。なお、本実施例も、画像方向判定装置を、対象物として人物を含む入力画像の上下判定に利用した例である。
中央演算装置400は、プログラムに従って動作することによって、対象物候補検出手段401,特徴量抽出手段402,類似度算出手段403,入力画像角度算出手段404として機能する。また、ハードディスク420には、角度記憶部421および特徴量記憶部422として機能する記憶領域が割り当てられる。なお、本実施例では、コマンド入出力装置440に係る処理以外は第1の実施例と同様であるため、説明省略する。
ここで、画像入力端子410から画像が入力されたとする。また、その際、利用者からの操作に応じて、ディスプレイ440,キーボード440を介して、「登録画像」を示す信号が入力されたとする。例えば、ディスプレイに「入力した画像は登録画像です.(Y/N)」などのメッセージを表示し、利用者がその表示に従って、キーボードから「Y」を入力操作することによって実現できる。
人物特徴量抽出手段402は、「登録画像」を示すフラグ信号を受け取ると、人物候補検出手段401によって検出された人物候補について、人物候補の画像領域と入力画像中における角度とをディスプレイ440に出力する。利用者は、ディスプレイ440に表示された画像領域とその角度とを確認し、登録人物として、画像領域および角度に誤りがある場合には修正を行う。登録人物の画像領域の修正方法の一例として、利用者はディスプレイ440に表示された画像領域について、登録したい人物領域が含まれていない場合にはマウスで選択しdeleteキーで除去したり、背景などの人物領域以外の部分を一部含む場合には人物領域の一部をマウスで指定して切り取ったり、人物領域の一部が欠けている場合には不足した領域をマウスで指定して付け加えることにより実現できる。また、角度の修正の一例として、利用者はディスプレイに表示された人物の上下方向を意味する矢印を確認し、矢印が人物の正しい上下方向を示すように、角度をキーボードから入力することで実現する。
人物特徴量抽出手段402は、ディスプレイ440やマウス440、キーボード440を介して、人物領域および角度を修正されると、修正された画像領域および入力画像中における角度をもとに人物の特徴量を抽出し、人物特徴量記憶部422に記憶する。
なお、人物特徴量抽出手段402は、「登録画像」を示すフラグ信号を受け取らない場合には、第1の実施例と同様の処理を行う。「登録画像」を示すフラグ信号を受け取らない場合の一例として、ディスプレイ440に「入力した画像は登録画像です.(Y/N)」などのメッセージを表示し、利用者がその表示に従って、キーボードから「N」を入力することによって実現できる。または、人物特徴量抽出手段402が人物候補検出手段401から、人物候補に関する情報を受け取ってから、一定時間以上マウス440やキーボード440から入力が行われない場合に「登録画像」を示すフラグ信号を受け取らなかったと判定してもよい。
本発明によれば、ディジタルカメラを様々な角度で傾けて撮影した写真や、様々な角度でコンピュータに取り込まれたスキャナ画像について、利用者の手を煩わせることなく上下方向を正して閲覧するための画像閲覧装置や、画像閲覧装置をコンピュータあるいはディジタルカメラに適用するためのプログラムといった用途に適用できる。また、ディジタルビデオ等で撮影された手振れを含む映像について、各フレームの上下方向のそろった映像を生成するための手振れ補正装置や手振れ補正装置をコンピュータあるいはディジタルビデオに適用するためのプログラムといった用途にも適用できる。
本出願は、2006年6月7日に出願された日本出願特願2006−158253号を基礎とする優先権を主張し、その開示の全てをここに含む。

Claims (23)

  1. 入力画像の上下方向を判定する画像方向判定装置であって、
    入力画像から、固定的な形状または配置をもち、その形状または配置から一定の角度が検出可能な対象物を対象物候補として検出する対象物候補検出手段と、
    前記対象物候補抽出手段によって抽出された対象物候補について、予め記憶している登録対象物との類似度を算出する類似度算出手段と、
    前記対象物候補抽出手段によって抽出された対象物候補の入力画像中における角度と、前記類似度算出手段によって算出された類似度とに基づいて、入力画像の上下方向を判定する上下方向判定手段と
    を有することを特徴とする画像方向判定装置。
  2. 対象物候補検出手段によって検出された対象物候補について、入力画像内の対象物候補領域の画像情報に基づいて、対象物候補の特徴量を抽出する特徴量抽出手段を備え、
    対象物候補検出手段は、入力画像から、複数の対象物候補を検出するとともに、検出した対象物候補の入力画像中における角度を抽出し、
    類似度算出手段は、前記特徴量抽出手段によって抽出される各対象物候補の特徴量と、予め記憶している登録対象物の特徴量とを比較することによって、類似度を算出し、
    上下方向判定手段は、各対象物候補の入力画像中における角度に対し、登録対象物との類似度に基づいて重みを付与することによって、入力画像の上下方向に対する傾き角度を算出する入力画像角度算出手段を含む
    ことを特徴とする請求項1に記載の画像方向判定装置。
  3. 対象物検出手段は、入力画像を所定の角度で回転させた回転画像から、前記回転画像中における角度が0度の対象物候補を検出するとともに、検出した際の回転画像の回転角度に基づいて、前記対象物候補の入力画像中における角度を算出することを特徴とする請求項1または請求項2に記載の画像方向判定装置。
  4. 類似度算出手段は、対象物候補抽出手段によって抽出された各対象物候補と、予め記憶している各登録対象物との組み合わせによる類似度を算出することを特徴とする請求項1から請求項3のいずれかに記載の画像方向判定装置。
  5. 特徴量抽出手段は、対象物の方向に応じて値が変わる特徴量を抽出し、
    類似度算出手段は、前記特徴量抽出手段によって抽出される、対象物の方向に応じて値の変わる特徴量を用いて類似度を算出することを特徴とする請求項2から請求項4のいずれかに記載の画像方向判定装置。
  6. 入力画像角度算出手段は、入力画像から対象物候補が検出されない場合には、入力画像の上下方向に対する傾き角度を0度とすることを特徴とする請求項2に記載の画像方向判定装置。
  7. 入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、予め記憶している登録対象物との類似度が最大となる対象物候補の入力画像中における角度に基づいて、入力画像の上下方向に対する傾き角度を算出することを特徴とする請求項2に記載の画像方向判定装置。
  8. 入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、予め記憶している登録対象物との類似度が所定の閾値以上である対象物候補の入力画像中における角度の平均をもとに、入力画像の上下方向に対する傾き角度を算出することを特徴とする請求項2に記載の画像方向判定装置。
  9. 入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、予め記憶している登録対象物との類似度が所定の閾値以上である対象物候補の入力画像中における角度に基づいて、入力画像の上下方向に対する傾き角度を算出することを特徴とする請求項1から請求項6のいずれかに記載の画像方向判定装置。
  10. 入力画像角度算出手段は、入力画像から対象物候補が検出された場合に、対象物候補の入力画像中における角度に対して、予め記憶している登録対象物との類似度を重みづけることによって算出された角度をもとに、入力画像の上下方向に対する傾き角度を算出することを特徴とする請求項2に記載の画像方向判定装置。
  11. 入力画像角度算出手段は、0度、90度、180度、270度のうち、算出した入力画像の上下方向に対する傾き角度に最も近い角度を入力画像の上下方向に対する傾き角度と
    することを特徴とする請求項6から請求項10のいずれかに記載の画像方向判定装置。
  12. 対象物候補検出手段は、所定の対象物の特定部位の相対位置情報を保持し、保持している前記相対位置情報と入力画像から検出される特定部位の相対位置情報との類似性に基づいて、対象物候補を検出することを特徴とする請求項1から請求項11のいずれかに記載の画像方向判定装置。
  13. 対象物候補検出手段は、所定の対象物の特徴量を保持し、保持している前記特徴量と入力画像から抽出される特徴量との類似性に基づいて、対象物候補を検出することを特徴とする請求項1から請求項11のいずれかに記載の画像方向判定装置。
  14. 対象物候補検出手段は、所定の対象物を含む画像をテンプレートとして保持し、保持している前記テンプレートを用いて、入力画像に対しテンプレートマッチングを行うことによって対象物候補を検出することを特徴とする請求項1から請求項11のいずれかに記載の画像方向判定装置。
  15. 対象物候補検出用のテンプレートとして、予め記憶している対象物の画像を用いることを特徴とする請求項14に記載の画像方向判定装置。
  16. 登録対象物として、特定人物を示す情報を記憶する人物特徴量記憶手段を備えたことを特徴とする請求項1から請求項15のいずれかに記載の画像方向判定装置。
  17. 対象物候補検出手段は、対象物候補として人物の顔候補を検出することを特徴とする請求項16に記載の画像方向判定装置。
  18. 対象物候補検出手段は、検出した人物の顔候補の入力画像中における角度として、左右の目を結ぶ直線の垂直二等分線の垂直方向となす角度を抽出することを特徴とする請求項17に記載の画像方向判定装置。
  19. 対象物候補検出手段は、入力画像中に含まれる複数の人物候補を検出するとともに、検出した人物候補の入力画像中における角度を抽出する人物候補検出手段を含み、
    特徴量抽出手段は、前記人物候補検出手段によって検出された人物候補の特徴量を抽出し、
    類似度算出手段は、前記人物候補検出手段によって検出された各人物候補について、前記特徴量抽出手段によって抽出された特徴量と、予め記憶している特定人物の特徴量との類似度を算出し、
    入力画像角度算出手段は、前記人物候補抽出手段によって抽出された各人物候補の入力画像中における角度と、前記類似度算出手段によって算出された特定人物との類似度とに基づいて、入力画像の上下方向に対する傾き角度を算出することを特徴とする請求項2から請求項18のいずれかに記載の画像方向判定装置。
  20. 入力画像の上下方向を判定する画像方向判定方法であって、
    入力画像から、固定的な形状または配置をもち、その形状または配置から一定の角度が検出可能な対象物を対象物候補として検出するステップと、
    抽出された対象物候補について、予め記憶されている登録対象物との類似度を算出するステップと、
    前記対象物候補の入力画像中における角度と、算出された類似度とに基づいて、入力画像の上下方向を判定するステップとを含む
    ことを特徴とする画像方向判定方法。
  21. 入力画像から、複数の対象物候補を検出するとともに、検出した対象物候補の入力画像中における角度を抽出するステップと、
    検出された各対象物候補について、入力画像内の対象物候補領域の画像情報に基づいて、対象物候補の特徴量を抽出するステップと、
    抽出された各対象物候補の特徴量と、予め記憶されている登録対象物の特徴量とを比較することによって、類似度を算出するステップと、
    各対象物候補の入力画像中における角度に対し、登録対象物との類似度に基づいて重みを付与することによって、入力画像の上下方向に対する傾き角度を算出するステップとを含む
    ことを特徴とする請求項20に記載の画像方向判定方法。
  22. 入力画像の上下方向を判定するための画像方向判定用プログラムであって、
    コンピュータに、
    入力画像から、固定的な形状または配置をもち、その形状または配置から一定の角度が検出可能な対象物を対象物候補として検出する処理、
    抽出された対象物候補について、予め記憶されている登録対象物との類似度を算出する処理、および
    前記対象物候補の入力画像中における角度と、算出された類似度とに基づいて、入力画像の上下方向を判定する処理
    を実行させるための画像方向判定用プログラム。
  23. コンピュータに、
    入力画像から、複数の対象物候補を検出するとともに、検出した対象物候補の入力画像中における角度を抽出する処理、
    検出された各対象物候補について、入力画像内の対象物候補領域の画像情報に基づいて、対象物候補の特徴量を抽出する処理、
    抽出された各対象物候補の特徴量と、予め記憶されている登録対象物の特徴量とを比較することによって、類似度を算出する処理、および
    各対象物候補の入力画像中における角度に対し、登録対象物との類似度に基づいて重みを付与することによって、入力画像の上下方向に対する傾き角度を算出する処理
    を実行させるための請求項22に記載の画像方向判定用プログラム。
JP2008520583A 2006-06-07 2007-06-05 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム Active JP4957922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008520583A JP4957922B2 (ja) 2006-06-07 2007-06-05 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006158253 2006-06-07
JP2006158253 2006-06-07
JP2008520583A JP4957922B2 (ja) 2006-06-07 2007-06-05 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム
PCT/JP2007/061351 WO2007142227A1 (ja) 2006-06-07 2007-06-05 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム

Publications (2)

Publication Number Publication Date
JPWO2007142227A1 true JPWO2007142227A1 (ja) 2009-10-22
JP4957922B2 JP4957922B2 (ja) 2012-06-20

Family

ID=38801478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008520583A Active JP4957922B2 (ja) 2006-06-07 2007-06-05 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム

Country Status (3)

Country Link
US (1) US8548254B2 (ja)
JP (1) JP4957922B2 (ja)
WO (1) WO2007142227A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101465964A (zh) * 2007-12-17 2009-06-24 鸿富锦精密工业(深圳)有限公司 摄影装置及其摄影方法
US8086043B2 (en) * 2007-12-21 2011-12-27 Ati Technologies Ulc System and method of image correlation based on image structure
JP4655235B2 (ja) * 2008-03-14 2011-03-23 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP5561524B2 (ja) * 2010-03-19 2014-07-30 ソニー株式会社 画像処理装置および方法、並びにプログラム
US20110248919A1 (en) * 2010-04-08 2011-10-13 Sergei Bashinsky Method to enter characters into an electronic system
JP5795847B2 (ja) * 2010-09-15 2015-10-14 キヤノン株式会社 画像処理装置および画像処理方法
US8805074B2 (en) * 2010-09-27 2014-08-12 Sharp Laboratories Of America, Inc. Methods and systems for automatic extraction and retrieval of auxiliary document content
US8675957B2 (en) 2010-11-18 2014-03-18 Ebay, Inc. Image quality assessment to merchandise an item
JP5637383B2 (ja) * 2010-12-15 2014-12-10 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
US9183447B1 (en) * 2011-06-09 2015-11-10 Mobileye Vision Technologies Ltd. Object detection using candidate object alignment
JP2013041400A (ja) * 2011-08-15 2013-02-28 Sony Corp 画像処理装置、画像処理方法、およびプログラム
JP5826001B2 (ja) * 2011-11-30 2015-12-02 キヤノン株式会社 画像処理装置、及びその制御方法
JP5874474B2 (ja) * 2012-03-21 2016-03-02 富士ゼロックス株式会社 画像情報登録システム、画像情報登録プログラム
US9721292B2 (en) 2012-12-21 2017-08-01 Ebay Inc. System and method for image quality scoring
TWI510953B (zh) * 2013-12-20 2015-12-01 Wistron Corp 身份驗證防僞方法與應用此方法的身份驗證裝置
GB2522259B (en) 2014-01-20 2020-04-29 Apical Ltd A method of object orientation detection
JP6292911B2 (ja) * 2014-02-07 2018-03-14 キヤノン株式会社 画像処理方法、画像処理プログラムおよび画像処理装置
US9667860B2 (en) * 2014-02-13 2017-05-30 Google Inc. Photo composition and position guidance in a camera or augmented reality system
JP2015188738A (ja) * 2014-03-31 2015-11-02 富士フイルム株式会社 画像処理装置、画像処理方法及びプログラム
JP6613030B2 (ja) * 2015-01-19 2019-11-27 株式会社メガチップス 判定装置、制御プログラム及び判定方法
US9403278B1 (en) * 2015-03-19 2016-08-02 Waterloo Controls Inc. Systems and methods for detecting and picking up a waste receptacle
US10250801B2 (en) * 2017-04-13 2019-04-02 Institute For Information Industry Camera system and image-providing method
RU2667790C1 (ru) * 2017-09-01 2018-09-24 Самсунг Электроникс Ко., Лтд. Способ автоматической регулировки экспозиции для инфракрасной камеры и использующее этот способ вычислительное устройство пользователя
US11527072B2 (en) 2017-10-24 2022-12-13 Mcneilus Truck And Manufacturing, Inc. Systems and methods for detecting waste receptacles using convolutional neural networks
JP2020095757A (ja) * 2020-03-23 2020-06-18 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US11853844B2 (en) 2020-04-28 2023-12-26 Pfu Limited Information processing apparatus, image orientation determination method, and medium
CN113763466A (zh) * 2020-10-10 2021-12-07 北京京东乾石科技有限公司 一种回环检测方法、装置、电子设备和存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
US5031225A (en) * 1987-12-09 1991-07-09 Ricoh Company, Ltd. Character recognition method for recognizing character in an arbitrary rotation position
JPH08138024A (ja) 1994-11-04 1996-05-31 Konica Corp 画像の向き判定方法
JP3587009B2 (ja) 1997-02-07 2004-11-10 ミノルタ株式会社 画像入力装置
TW373396B (en) 1997-10-30 1999-11-01 Hewlett Packard Co Automatic digital camera image rotation
JP4170441B2 (ja) * 1997-11-28 2008-10-22 富士通株式会社 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
JP3688879B2 (ja) * 1998-01-30 2005-08-31 株式会社東芝 画像認識装置、画像認識方法及びその記録媒体
US6804414B1 (en) * 1998-05-01 2004-10-12 Fujitsu Limited Image status detecting apparatus and document image correcting apparatus
TW457458B (en) * 1998-06-01 2001-10-01 Canon Kk Image processing method, device and storage medium therefor
JP2000067156A (ja) * 1998-08-24 2000-03-03 Canon Inc 画像処理装置及び方法
JP2003296711A (ja) * 2002-03-29 2003-10-17 Nec Corp 顔画像識別方法、装置およびプログラム
US7177449B2 (en) * 2002-06-26 2007-02-13 Hewlett-Packard Development Company, L.P. Image correction system and method
JP4245872B2 (ja) * 2002-08-28 2009-04-02 富士フイルム株式会社 類似度判定方法および装置並びにプログラム
US7508984B2 (en) * 2003-07-31 2009-03-24 Ricoh Company, Ltd. Language recognition method, system and software
JP4140519B2 (ja) 2003-12-22 2008-08-27 富士ゼロックス株式会社 画像処理装置、プログラムおよび記録媒体
JP2005260870A (ja) 2004-03-15 2005-09-22 Matsushita Electric Ind Co Ltd デジタルカメラ及びデジタルカメラ機能付き携帯電話機並びに顔画像自動回転方法
JP2005334298A (ja) * 2004-05-27 2005-12-08 Fuji Photo Film Co Ltd 異常陰影検出方法および装置並びにプログラム
JP4553241B2 (ja) * 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP2006079533A (ja) * 2004-09-13 2006-03-23 Fuji Xerox Co Ltd 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム
EP1693784A3 (en) * 2005-01-28 2012-04-04 IDMS Software Inc. Handwritten word recognition based on geometric decomposition

Also Published As

Publication number Publication date
JP4957922B2 (ja) 2012-06-20
WO2007142227A1 (ja) 2007-12-13
US8548254B2 (en) 2013-10-01
US20090297038A1 (en) 2009-12-03

Similar Documents

Publication Publication Date Title
JP4957922B2 (ja) 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム
US7502496B2 (en) Face image processing apparatus and method
JP4824411B2 (ja) 顔抽出装置、半導体集積回路
CN109815845B (zh) 人脸识别的方法和装置、存储介质
US8081844B2 (en) Detecting orientation of digital images using face detection information
US8391645B2 (en) Detecting orientation of digital images using face detection information
TWI401608B (zh) 影像處理裝置、影像處理方法、個人識別裝置、及個人識別裝置中產生/更新字典資料之方法和程式
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
US20160267339A1 (en) Image processing apparatus and method of generating face image
JP2000306095A (ja) 画像照合・検索システム
JP2009211311A (ja) 画像処理装置及び方法
JP2007272685A (ja) 自動トリミング方法および装置ならびにプログラム
CN112434546A (zh) 人脸活体检测方法及装置、设备、存储介质
JP6492746B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JPWO2013122009A1 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
JP2015197708A (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
US7319778B2 (en) Image processing apparatus
CN111274602B (zh) 一种图像特征信息替换方法、装置、设备及介质
CN109785439A (zh) 人脸素描图像生成方法及相关产品
KR20150011714A (ko) 영상 방향 판단 장치
US20220392256A1 (en) Authentication device, registration device, authentication method, registration method, and storage medium
JP2003208611A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2021128540A (ja) 情報処理装置、情報処理方法、及びプログラム
CN116762098A (zh) 判定方法、判定程序、以及信息处理装置
JPWO2022079841A5 (ja) グループ特定装置、グループ特定方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120306

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4957922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150