JP4525519B2 - 四辺形評価方法及び装置及びプログラム - Google Patents

四辺形評価方法及び装置及びプログラム Download PDF

Info

Publication number
JP4525519B2
JP4525519B2 JP2005237857A JP2005237857A JP4525519B2 JP 4525519 B2 JP4525519 B2 JP 4525519B2 JP 2005237857 A JP2005237857 A JP 2005237857A JP 2005237857 A JP2005237857 A JP 2005237857A JP 4525519 B2 JP4525519 B2 JP 4525519B2
Authority
JP
Japan
Prior art keywords
quadrilateral
evaluation
corner
edge
intersection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005237857A
Other languages
English (en)
Other versions
JP2007052670A (ja
Inventor
亮 北原
淳 片山
高雄 中村
奏 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005237857A priority Critical patent/JP4525519B2/ja
Publication of JP2007052670A publication Critical patent/JP2007052670A/ja
Application granted granted Critical
Publication of JP4525519B2 publication Critical patent/JP4525519B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、四辺形評価方法及び装置及びプログラムに係り、特に、携帯電話などの処理能力の限られた端末上において、カメラなどの撮影画像の中から、ある矩形領域で囲まれた部分を、その四隅座標を判定することで正確に抜き出すための四辺形評価方法及び装置及びプログラムに関する。
特定の画像の中から直線を検出する手法としてハフ変換が知られている。ハフ変換では、まず、画像を二値化処理し、二値化画像の中で画素の値がある閾値を越える全ての画素をサンプリングする。次に、サンプリングした各画素について、その画素を通る全ての直線を考える。ここで、画像中にある原点を定めて、各画素を通る全ての直線について、原点との距離を計算する。角度と距離を軸とした極座標を考え、上記全ての直線を極座標上へ投票する。ここで、投票とは、距離が一致する直線が一本あれば、該当する座標の値を+1することである。各点における投票数は、その数だけ同じ角度と原点からの距離をもつ直線が存在することを示しており、投票数が多いほど直線成分の強い直線であることがわかる。この処理により、投票数が多い方から直線を選ぶことで、画像中から強い直線成分を検出することが可能となる(例えば、特許文献1参照)。
P.V.C. Hough, “Method and means for recognizing complex patterns,” U.S. Patent 3069654
但し、上記のハフ変換では必ずしも必要とする直線だけが得られるわけではない。強い直線成分であればハフ変換による投票数が増え、弱い直線であれば投票数が減る。そのため、必要とする直線が絵柄に埋もれやすい場合や薄い場合などは投票数が減り、直線選別のための閾値を大きく下げることが必要である。閾値を下げることでより投票数の多い、はっきりとした直線が検出されてしまい、直線の選別が必要となる。この選別は、求める画像のパターンマッチングや人の目視などにより行われる場合が多く、確立された選別技術は存在しない。
ハフ変換は上記のように、直線検出には非常に有効な手法であり、デスクトップパーソナルコンピュータのような潤沢なリソースがあるならば、十分な性能が期待できる。しかし、プログラムサイズ、メモリ量、処理能力などの限られた携帯端末上で動作させる場合には、十分な性能を発揮するのは困難である。
また、得られた直線候補の選別におけるパターンマッチングなどでは、目標となるテンプレートを用意し、直線成分の組み合わせから、最適解を求めるという操作が必要である。この場合も複数の直線の組み合わせを求め、マッチングを行うためには、携帯端末のリソースは不足していると言える。
本発明は、上記の点に鑑みなされたもので、撮影画像上の矩形領域の四辺と四隅座標を処理能力の限られた携帯端末上で検出し、また、同時に処理時間を一定時間以内に収めることが可能な四辺形評価方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項)は、四辺形評価装置が、
入力画像から検出された複数の辺候補を入力とする辺候補入力ステップ(ステップ1)と、
入力画像の4つの縁から各々検出される4本の辺候補の組み合わせを選ぶ辺候補選択ステップ(ステップ2)と、
4本の辺候補の中から入力画像の隣り合う2つの縁に対応する2本の辺候補に対し、辺の延長線上も含めた交点を求める交点計算ステップ(ステップ3)と、
交点を構成する2辺と該交点の位置関係から隅評価値を計算する隅評価ステップ(ステップ4)と、
四辺形の各4隅に対する各隅評価値から四辺形評価値を計算する四辺形総合評価ステップ(ステップ5)と、からなる。
また、本発明(請求項)は、請求項1の四辺形評価方法であって、
隅評価ステップにおいて、
交点位置と該交点をなす2本の辺の交点側の端点位置との各距離の和を隅評価値とする。
また、本発明(請求項)は、請求項1の四辺形評価方法であって、
隅評価ステップにおいて、
交点を成す2本の辺の位置関係がL字型であれば隅評価値を大きく、T字型及び十字型であれば隅評価値を小さく計算する。
また、本発明(請求項)は、請求項1の四辺形評価方法であって、
四辺形総合評価ステップにおいて、
四辺形の各4隅に対する各隅評価値に加え、四辺形の面積を四辺形評価値計算に用いる。
また、本発明(請求項5)は、請求項1の四辺形評価方法であって、
四辺形総合評価ステップにおいて、
四辺形の各4隅に対する各隅評価値に加え、四辺形の対角線の交わる点と四辺形の重心座標点との距離を四辺形評価値計算に用いる。
図2は、本発明の原理構成図である。
本発明(請求項)は、入力画像から検出された複数の辺候補を入力とする辺候補入力手段と、
入力画像の4つの縁から各々検出される4本の辺候補の組み合わせを選ぶ辺候補選択手段と、
4本の辺候補の中から入力画像の隣り合う2つの縁に対応する2本の辺候補に対し、辺の延長線上も含めた交点を求める交点計算手段と、
交点を構成する2辺と該交点の位置関係から隅評価値を計算する隅評価手段と、
四辺形の各4隅に対する各隅評価値から四辺形評価値を計算する四辺形総合評価手段と、
を有する。
また、本発明(請求項)は、請求項6の四辺形評価装置であって、
隅評価手段は、
交点位置と該交点をなす2本の辺の交点側の端点位置との各距離の和を隅評価値とする。
また、本発明(請求項)は、請求項6の四辺形評価装置であって、
隅評価手段は、
交点を成す2本の辺の位置関係がL字型であれば隅評価値を大きく、T字型及び十字型であれば隅評価値を小さく計算する。
また、本発明(請求項)は、請求項6の四辺形評価装置であって、
四辺形総合評価手段は、
四辺形の各4隅に対する各隅評価値に加え、四辺形の面積を四辺形評価値計算に用いる。
また、本発明(請求項10)は、請求項6の四辺形評価装置であって、
四辺形総合評価手段は、
四辺形の各4隅に対する各隅評価値に加え、四辺形の対角線の交わる点と四辺形の重心座標点との距離を四辺形評価値計算に用いる。
本発明(請求項11)は、四辺形を評価するプログラムであって、コンピュータを請求項6乃至10のいずれか1項に記載の四辺形評価装置として機能させる四辺形評価プログラムである。
本発明によれば、携帯電話などの処理能力が限られた携帯用端末上においても、撮影画像中にある任意の矩形領域を高速に、そして正確に検出することが可能である。
画像中から矩形領域を検出するためには、その矩形領域を構成する四辺を検出する必要がある。本発明では、一定の方向に連続して連なり、その周辺部とのコントラストが高い画素群を検出することで、画像の端から端までを突き抜ける直線を検出することが可能である。
また、それだけに留まらず、画素群の連続性が途切れる部分を判定することで、画像内部のある2点間のみを結ぶ線分をも検出可能である。
本発明では、線分(直線含む)検出漏れを防ぐため、辺検出手段におけるフィルタ処理の閾値を低く設定し、数多くの線分を検出している。検出した線分には必ず辺候補が含まれるため、この候補の中から求める矩形領域の辺を正確に判定できるように、精度の高い隅評価手段を実現した。
隅評価手段では、2本の線分の交点を求める矩形領域の隅と考えて、隅の座標と線分の端点座標の位置関係、2本の線分の交差状態、隅形状、四辺形の面積を合わせて評価することで求める矩形領域を構成する四辺を選択することが可能である。検出される隅座標は、ピクセル単位で検出され、正確な座標を得ることが可能である。
また、角が丸まっている四辺形なども、四辺の部分的な検出がなされていれば、四辺の接続関係から隅座標を仮想的に計算することで、矩形領域を検出可能である。
さらに、求める矩形領域のうち、一つの隅が画像外にある場合でも、四辺が部分的に検出されていれば、辺の延長上の隅座標を仮想的に計算することで、見えない隅座標を検出し、矩形領域を検出することが可能である。
本発明は、デスクトップパーソナルコンピュータのような処理能力の高い端末では当然実現可能であるが、携帯電話に代表されるような処理能力の低い端末でも動作可能であり、その処理速度も十分に速いことを特徴とする。そのため、矩形領域の抽出のための前処理として様々な機器への組み込みが可能となる。
携帯端末上にて動作可能なため、数多く出回っているカメラ付き携帯電話にも組み込み可能であり、今後カメラ付携帯電話の利用が変わる可能性を秘めている。矩形領域の収まっているモノを撮影すれば、その領域を自動的に検出できるため、リビングの椅子に座りながら、TV画面に向けてカメラ撮影することでTVの画面のみをキャプチャすることが可能である。例えば、番組毎に電子透かしが埋め込まれていれば、番組独自の情報をこれにより取得可能となる。
以下、図面と共に本発明の実施の形態を説明する。
本実施の形態では、カメラ付き携帯電話で電子透かし入り画像を撮影した場合について説明する。
図3は、本発明の一実施の形態における全体の動作のフローチャートであり、図4は、本発明の一実施の形態における実施イメージを示す。
まず、カメラ付き携帯電話のカメラモジュールから、電子透かしを埋め込んだ画像の撮影画像を取得し(ステップ100)、撮影画像中の電子透かし入り画像領域の辺候補を検出する(ステップ200)。辺候補の2本の組み合わせから導出される交点を画像の隅候補とし、各隅候補の座標について評価する(ステップ300)。評価値の高い隅候補を構成する辺候補の組み合わせを、検出結果として出力する(ステップ400)。
図5は、本発明の一実施の形態における用語を定義するための図である。同図は入力画像の例を示しており、当該入力画像において(a)の矢印は辺探索開始点探索、(b)の矢印は密探索(辺探索)、(c)の矢印は粗探索(辺探索)、(d)の矢印は辺探索方向を示す。(e)の点は、辺探索開始初期点、(f)の点は辺探索開始点、(g)の点は密探索終了点、(h)の点は粗探索終了点、(i)は辺探索途中の点であり、辺追跡点と呼ぶ。
図6は、本発明の一実施の形態における装置の基本構成を示す。
同図に示す装置は、画像入力部10、辺検出部11、隅評価部12、検出結果出力部13から構成される。なお、図示しないが、本装置は、メモリ等の記憶手段を有するものとする。
辺検出部11は、カメラ付き携帯電話などで撮影された画像から、画像内にある電子透かし入り画像の辺を含む辺候補を検出し、メモリ(図示せず)に格納する。
図7は、本発明の一実施の形態における辺検出部の構成を示す。
辺検出部11は、辺探索開始初期点決定部111、辺探索開始点探索部112、密探索部113、粗探索部114から構成される。
以下に、辺検出部11の動作を説明する。
図8は、本発明の一実施の形態における辺検出部の処理のフローチャートである。
ステップ201) 辺検出部11は、辺探索開始初期点決定部111へ入力された撮影画像を渡す。
ステップ202) 辺探索開始初期点決定部111は、入力画像の縁から一辺を選択する。
ステップ203) 辺探索開始初期点決定部111は、例えば、縁の中点を辺探索開始初期点と設定し、辺探索開始点座標を辺探索開始点探索部112へ渡す。本実施の形態では、画像の左辺が選択された場合について説明する。
ステップ204) 辺探索開始点探索部112は、ステップ203で決定した辺探索開始初期点から辺探索を開始する。辺探索開始点探索部112は、一画素ずつ画素の内側に向かって(この場合は右方向に)水平に辺探索開始点探索を行う。求める透かし入り画像が濃い色をしており、周辺部が白い画像であるなど、画像の縁の様にコントラストの大きい場所では大きいフィルタ出力が得られる。
ここで、辺探索開始点探索にて用いるフィルタについて説明する。図9は、本発明の一実施の形態における辺探索開始点探索部のフィルタを説明するための図である。同図では3×3の場合の例を示している。探索点座標をフィルタの中心と合わせて、フィルタ出力値を計算し、メモリ(図示せず)に格納する。図9(a)は、左側からの探索時に用いるフィルタであるが、例えば、上側からの探索であれば、同図(b)に示すように右90度回転したフィルタを用いる。但し、フィルタ形状は3×3に限らず、1×3や2×5の様な形状のフィルタでもよい。例えば、1×3であれば、(1,0,−1)というフィルタにすることが考えられる。また、白黒のような画像の輝度値変化を検出するフィルタに限らず、青黄のような色差の変化を検出するフィルタなども考えられる。また、画像に枠をつけた場合についても、例えば、フィルタを(1,0,1)などとすれば枠の検出が可能となる。
ステップ205) 画像の中心線まで辺探索開始点探索が続いた場合は、その縁についての探索は終了し、ステップ214にて入力画像の全ての縁について辺探索を行ったかどうかを判定する。まだ画像の中心線まで辿り着いていなければ、ステップ206へ移動し、辺探索開始点探索を続行する。
ステップ206) 現在のピクセルを中心ピクセルとして、フィルタ処理を行い、フィルタの出力をメモリ(図示せず)に格納する。メモリ(図示せず)に格納されているフィルタ出力がある閾値を超えた場合を辺検出とし、閾値を超えた座標を密探索部113へ送り、ステップ207へ処理を移す。フィルタの閾値は任意に設定でき、特に低く設定することにより、辺検出漏れを防ぐことが可能である。
ステップ207) 密探索部113は、ステップ206でエッジ検出した場合は、密探索を行う。辺探索開始点探索部112から受け取った座標を辺探索開始点とし、ステップ204の辺探索開始点探索と直交する方向(この場合は上下方向)に密探索を行う。本実施の形態では、上方向への密探索について説明する。エッジが左右に傾いている可能性があるので、密探索開始点から上方向へ1画素移動した点を中心とし、左右1画素の領域、合計3画素について辺探索開始点探索部112と同じフィルタを用いて密探索を行い、フィルタの出力をメモリ(図示せず)に格納する。メモリ(図示せず)のフィルタの出力が閾値を超えていて、かつ最も高い値の画素を次の密探索中心とする。フィルタ出力値が閾値を超えない場合は、その点で上方向への密探索を終了し、続いて辺探索開始点へ戻り、逆方向(この場合は下方向)への密探索を続ける。
ここでは、先に上方向へ探索、閾値を下回ったら、下方向へ探索としているが、辺探索開始点から上方向へ1ピクセル探索したら、次に下方向の探索を行い、また、上方向の探索と交互に進める方法などもある。
ステップ208) 密探索部113は、密探索による辺の追跡が、上下方向合わせて一定長以上続いた場合には密探索終了点とし、メモリ(図示せず)に格納し、ステップ209に移行し、そうでない場合はステップ213に移行する。
ステップ209) 上限密探索の途中の追跡点に基づいて得られる方向ベクトルを辺探索方向ベクトルとする。辺探索方向ベクトルの決定方法は、上下密探索終了点の二点を結ぶベクトルや辺追跡点から最小二乗近似から求まる直線の方向ベクトルから求めるといったことが考えられる。
ステップ210) 粗探索部114は、密探索部113でメモリ(図示せず)に格納された密探索終了点を粗探索開始点とし、ステップ209にて決定した辺方向探索ベクトルの向きに数ピクセルおきに飛び飛びに辺探索を行う(粗探索)。
ステップ211) 粗探索部114は、ステップ210の粗探索を続け、フィルタ出力値が閾値を下回った位置を、粗探索終了点とし、メモリ(図示せず)に格納する。
ステップ212) 予め各縁毎に辺探索にて検出する候補の上限数を決めておき、これまでの辺探索で検出したメモリ(図示せず)内の辺候補の数がその数に満たなければ、ステップ213に移行し、辺探索開始点に戻り再び辺探索を続ける。また、辺候補の数が上限数に達すれば、その辺における辺探索を終了する。
ステップ213) ステップ208において、密探索が一定長続かなかった場合は、文字などの短い線分の可能性や、求める矩形領域の辺ほどには長く続かない辺の可能性が高いため、途中で密探索は終了し、辺探索開始点に戻り、再び辺探索開始点探索を行う(ステップ204に移行する)。
ステップ214) 全ての縁について、上記の辺探索が終了していれば、辺探索は終了、まだ、探索を行っていない縁があれば、ステップ202に戻り、他の縁について辺探索を行う。
次に、隅評価部12について説明する。
上記の辺検出部11で撮影画像中の全ての辺候補を検出し、メモリ(図示せず)に格納した後は、隅評価部12において辺候補の組み合わせについて評価し、正解の辺の組み合わせを求める。
図10は、本発明の一実施の形態における隅評価部の構成を示す。
同図に示す隅評価部12は、隅座標評価部121、四辺形面積評価部122、隅総合評価部123から構成される。
隅座標評価部121が、辺検出部11で検出されメモリ(図示せず)に格納されている辺(辺候補)を読み出して、全ての辺についてその組み合わせを求め、その交点である隅について評価を行い、評価値をメモリ(図示せず)に格納する。
図11は、本発明の一実施の形態における隅座標評価部の構成を示す。隅座標評価部121は、辺選択部1211、隅座標計算部1212、辺端点・隅位置評価部1213、辺接続位置関係評価部1214、隅形状評価部1215から構成される。
まず、辺選択部1211が、メモリ(図示せず)に格納されている辺候補から2本の辺を選択する。先の図5に示す通り、辺候補は入力画像の上下左右の縁からそれぞれ検出されているため、選択する辺は隣り合う縁同士(例えば、左と上)の組み合わせとする。
隅座標計算部1212は、辺選択部1211にて選択された2本の辺の交点を求め、メモリ(図示せず)に格納する。2本の辺は線分であるため、直接交わらない場合もあるが、その場合は仮想的に延長した際の交点を求める。
辺端点・隅位置評価部1213は、2辺の粗探索終了点座標と2辺から求まる隅座標の位置関係について評価し、評価値をメモリ(図示せず)に格納する。辺検出部11の検出結果が正しい場合には、2辺の粗探索終了点座標と隅座標とは一致、もしくは、非常に距離が近い状態にあるはずである。逆に不正解の場合には、これらは離れていると考えられる。但し、正しい辺を検出していても途中で探索が途切れる場合もある。以上を考慮して、この2辺の組み合わせについて図12に示すように評価の大小を考え、この評価値を“connect”とする。具体的な評価値は画像などの条件で異なるが、例えば、“5,3,1”といった評価値を与えることが考えられる。
辺接続位置関係評価部1214は、2辺の交点がそれぞれの線分の内側で交わっているか、外側で交わっているかを判定する。正解の辺同士の組み合わせであれば、2辺は各線分の外側にて交わる可能性が高いが、画像の内側にある線分などを選択した場合は、線分の途中で2辺が交わる可能性が高い。以上を考慮し、この2辺の組み合わせについて、図13に示すように評価の大小を与え、評価値を“middle”とする。具体的な評価値は画像などの条件で異なるが、例えば、“5,1”といった評価値を与えることが考えられる。評価値は、メモリ(図示せず)に格納される。
隅形状評価部1215は、2辺の交点からその近傍にて辺探索をすることで、交点付近の矩形領域が隅の形状をしているかを確認する。矩形領域の隅から辺探索を開始した場合、矩形領域の縁に沿うL字型をした2方向へのみ辺探索を続けることが可能であり、3方向以上へ探索できる十字やT字で辺が交わっている場合は、矩形領域の隅である可能性は低いはずである。例えば、矩形領域の左下隅を考えた場合、右方向と上方向へは辺探索は可能であるが、左方向と下方向へは矩形領域が続いていないため、辺探索できないはずである。以上を考慮し、この2辺の組み合わせについて、図14に示すように評価の大小を与え、評価値を“shape”とする。具体的な評価値は、画像などの条件で異なるが、例えば、“5,1”といった評価値を与えることが考えられる。評価値は、メモリ(図示せず)に格納される。
次に、隅評価部12の四辺形評価部122について説明する。
隅座標評価部121が辺の組み合わせについて評価した後、四辺形評価部122が4辺の組み合わせについて評価し、評価値をメモリ(図示せず)に格納する。
図15は、本発明の一実施の形態における四辺形評価部の構成を示す。
同図に示すように、四辺形評価部122は、四辺選択部1221、四辺形面積計算部1222及び、四辺形重心座標評価部1223で構成される。
まず、四辺形選択部1221が辺検出部11で求められたメモリ(図示せず)に格納されている辺候補より、入力画像の上下左右から1辺ずつ計4本の辺候補を選択する。次に、四辺形面積計算部1222が、選択された4辺から交わる交点を求め、四辺形の面積と、カメラフレームに対する四辺形の面積比率αを求める。
また、四辺形重心座評価部1223は、選択された4辺からなる矩形領域の対角線の交わる点を矩形領域の重心座標とした時に、カメラフレームの対角線の半分の長さ(Lとする)に対する、カメラフレームと矩形領域の重心座標間の距離(Lengとする)の割合を評価する。
四辺形面積評価部1222は、以上の操作を全ての4辺の組み合わせについて行い、その結果をメモリ(図示せず)に格納する。
次に、隅評価部12の隅総合評価部123について説明する。
隅総合評価部123が、隅座標評価部121と四辺形評価部122で求めた評価値を用いて、総合評価値を計算し、最適な辺の組み合わせを求め、メモリ(図示せず)に格納する。
図16に示すように、カメラフレームに占める画像の面積が大きいほど、総合評価値を高く、面積が小さいほど低くする。また、図17に示すように、カメラフレームの重心座標と矩形領域の重心座標が近い程評価値を高くする。例えば、総合評価値を
(connect*middle*shape)(1+α/100)(1+√Leng/L)
という計算式により計算する。但し、電子透かしの検出にはある程度の画素数が必要であるため、検出する矩形領域の面積に下限値を設け、αがある閾値(TH)よりも小さい場合には、総合評価値を0とする。
総合評価値の評価計算式は、この式に限定されるわけではなく、撮影条件や撮影対象などにより、最適な式は様々に変化し、和集合を組み合わせて、例えば、
(2*connect+middle+shape)(√α)(1+Leng/L)
といった式も考えられる。
なお、上記の個々の評価値についても、本実施の形態に限定されるものではない。評価値は高低の2段階と高中低の3段階だけではなく、5段階などの複数段階の評価や、離散的ではなく連続的な評価値、0−1に正規化された評価値などの重み付けを変化させることも考えられる。例えば、評価値“connect”であれば、隅座標と線分端点との距離を連続的な評価値で表現したり、評価値“shape”であれば、線分の交わり具合をL字、T字、十字と分けて評価することなどが考えられる。
また、隅評価部12へは、辺検出部11で検出した線分が入力されているが、ハフ変換で検出した直線や目視で検出した直線など、何らかの手法により得られた両端座標のわかる線であればよい。画像の端から端までの直線であった場合でも、画像の端の座標を線分の端点座標と考えればよく、これにより隅評価手法への適用が可能となる。さらに、評価値“middle”や“connect”を用いない評価式(例えば、“shape*α”など)によって判定を行うことなどにより、直線のみの組み合わせに対応することも考えられる。
次に、隅はみ出し画像例について説明する。
図18は、本発明の一実施の形態におけるカメラフレームからはみ出した矩形領域の例を示す。同図に示すように、撮影対象画像の一つの隅がカメラフレームの外側に出てしまい、隅が欠けた状態の画像の場合もありうる。このとき、欠けた隅について評価値“shape”や“connect”は低い値となるが、評価値“middle”は通常の値を保つ。また、他の3つの隅の評価値や面積評価値が十分に高いことが考えられ、この組み合わせについて最も評価値が高い場合には、この欠けた隅を一つの隅として含めた矩形領域を検出することが可能である。
次に、角丸まり画像例について説明する。
図19は、本発明の一実施の形態における角の丸まった矩形領域の例を示す。同図に示すように、矩形領域の隅が丸まっている場合は、辺検出部11による辺の端点(粗探索終了点)は同図Aの位置になる。この時、2辺の延長上における交点は同図中Bであるため、評価値“shape”や“connect”は低い評価値となる可能性が高い。しかし、他の3つの隅の評価値が十分に高い場合や、評価値“middle”や画面評価の結果が他の辺候補の組み合わせよりも十分に高い場合に、評価式によっては、この丸まった隅が最も評価値が高くなることが考えられる。これにより、隅が丸まった矩形領域や、あるいは角の欠けた多角形なども本方法により検出可能となる。
次に、多画像の例について説明する。
図20は、本発明の一実施の形態における多画像中からの矩形領域抽出の例である。
同図に示すように、対象画像以外に他の画像が並んでいる場合など、求める矩形領域の辺以外に多数の辺候補がある場合について示す。辺検出部11では、なるべく多くの辺候補を検出するので、図20右側に示す太い線分を検出する。但し、画像右側の波打った線は、辺探索開始点探索において辺探索開始点を検出するが、その線が一定方向に連続して続かないため、辺候補としては検出されない。また、画像上部の幅の狭い矩形領域も、辺探索開始点の検出はされ、密探索が実行されるが、辺が連続して連なる距離が短いため、一定長の辺探索が続かず、辺候補として検出されることはない。
この画像の例では、辺検出部11にて、求める矩形領域の外側にある、他の矩形領域の辺についても検出するので、検出した辺候補について隅評価部12において評価が行われる。画像下側の辺を考えた場合、図20に示すように、(1)(2)(3)と3つの候補がある。これらと組み合わせられる辺として、左側にはA,B,Cと3つの候補、右側にはa,b,cと3つの候補があり、これらの組み合わせから評価値を計算し、最適な組み合わせを求める。
図20内の(1)の辺であれば、Bとbの組み合わせが最も評価値が高くなるといえる。Aやaを選んだ場合には、線分の粗探索終了座標とその交点座標が離れているため、評価値“connect”が低い値となる。Cやcを選んだ場合には、評価値“connect”に加えて、2本の辺候補が線分の途中で交わるために、評価値“middle”も低い値となる。評価値“shpae”については、どの候補の選び方をしても、交点座標から最適なL字型の二方向への探索はできないため、低い値となる。(2)の場合も(1)と略同様にして、Bとbの組み合わせが最も評価値が高くなると言える。(3)の場合は、Cとaの組み合わせが最も評価値が高くなる。
次に、(1)、(2)、(3)を比べた場合、(2)(3)は辺候補の粗探索終了点同士がくっついているため、評価値“connect”の値が最も高くなるといえる。また、評価値“shape”についても、交点からL字2方向へ探索可能なため、(1)より高い値となる。(2)と(3)を比較した場合、それぞれの矩形領域が囲む面積が(2)の方が大きいと言えるため、最終的に(2)、B,bの組み合わせが求める矩形領域と判定される。
逆に内側の矩形領域を取得したい場合には、面積による重み付けを変化させ、面積が小さくても評価値が高くなるようにしたり、面積に上限値を設定することなどが考えられる。
「片山淳、中村高雄、山室雅史、曽根原登:『電子透かし読み取りのためのiアプリ高速コーナー検出アルゴリズム』、電子情報通信学会論文誌、Vol. J88-D-II, No.6, 2005」においては、撮影画像からの電子透かし読み取りのための矩形領域の隅検出を行っているが、撮影画像の総ピクセルに数%程度の画素しか参照しておらず、携帯端末上において実行可能であることが示されている。本発明における方法でも、辺検出、隅評価の部分では必要最小限の画素しか利用していないことから、携帯端末上において実行可能であるといえる。
また、本発明は、上記の図6に示す画像入力10、辺検出部11、隅評価部12、検出結果出力部13の動作をプログラムとして構築し、これらから構成される辺検出装置として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることも可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、上記の実施の形態のみに依存するものではなく、映像や他の様々なメディアなどにも適用できるものである。文字認識やパターン認識の前処理として、風景中の矩形領域を抽出(看板やTVの領域検出)するといった利用方法も考えられる。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態における全体の動作のフローチャートである。 本発明の一実施の形態における実施イメージである。 本発明の一実施の形態における用語を定義するための図である。 本発明の一実施の形態における装置の基本構成図である。 本発明の一実施の形態における辺検出部の構成図である。 本発明の一実施の形態における辺検出部の処理のフローチャートである。 本発明の一実施の形態における辺探索開始点探索部のフィルタを説明するための図である。 本発明の一実施の形態における隅評価部の構成図である。 本発明の一実施の形態における隅座標評価部の構成図である。 本発明の一実施の形態における辺端点・隅位置評価部の評価例である。 本発明の一実施の形態における辺接続位置関係評価部の評価例である。 本発明の一実施の形態における隅形状評価部の評価例である。 本発明の一実施の形態における四辺形評価部の構成図である。 本発明の一実施の形態における四辺形面積評価部の評価例である。 本発明の一実施の形態におけるカメラフレームの重心座標と矩形領域の重心座標との関係を示す図である。 本発明の一実施の形態におけるカメラフレームからはみ出した矩形領域の例である。 本発明の一実施の形態における角の丸まった矩形領域の例である。 本発明の一実施の形態における多画像中からの矩形領域抽出の例である。
符号の説明
10 画像入力手段、画像入力部
11 辺検出手段、辺検出部
12 隅評価手段、隅評価部
13 検出結果出力手段、検出結果出力部
14 記憶手段
111 辺探索開始初期点決定部
112 辺探索開始点探索部
113 密探索部
114 粗探索部
121 隅座標評価部
122 四辺形面積評価部
123 隅総合評価部
1211 辺選択部
1212 隅座標計算部
1213 辺端点・隅位置評価部
1214 辺接続位置関係評価部
1215 隅形状評価部
1221 四辺選択部
1222 四辺形面積計算部
1223 四辺形重心座評価部

Claims (11)

  1. 四辺形評価装置が、
    入力画像から検出された複数の辺候補を入力とする辺候補入力ステップと、
    前記入力画像の4つの縁から各々検出される4本の前記辺候補の組み合わせを選ぶ辺候補選択ステップと、
    前記4本の辺候補の中から前記入力画像の隣り合う2つの縁に対応する2本の辺候補に対し、辺の延長線上も含めた交点を求める交点計算ステップと、
    前記交点を構成する2辺と該交点の位置関係から隅評価値を計算する隅評価ステップと、
    四辺形の各4隅に対する各隅評価値から四辺形評価値を計算する四辺形総合評価ステップと、
    からなることを特徴とする四辺形評価方法。
  2. 前記隅評価ステップにおいて、
    交点位置と該交点をなす2本の辺の交点側の端点位置との各距離の和を隅評価値とする
    請求項1記載の四辺形評価方法。
  3. 前記隅評価ステップにおいて、
    交点を成す2本の辺の位置関係がL字型であれば隅評価値を大きく、T字型及び十字型であれば隅評価値を小さく計算する
    請求項1記載の四辺形評価方法。
  4. 前記四辺形総合評価ステップにおいて、
    四辺形の各4隅に対する各隅評価値に加え、四辺形の面積を四辺形評価値計算に用いる
    請求項1記載の四辺形評価方法。
  5. 前記四辺形総合評価ステップにおいて、
    四辺形の各4隅に対する各隅評価値に加え、四辺形の対角線の交わる点と四辺形の重心座標点との距離を四辺形評価値計算に用いる
    請求項1記載の四辺形評価方法。
  6. 入力画像から検出された複数の辺候補を入力とする辺候補入力手段と、
    前記入力画像の4つの縁から各々検出される4本の前記辺候補の組み合わせを選ぶ辺候補選択手段と、
    前記4本の辺候補の中から前記入力画像の隣り合う2つの縁に対応する2本の辺候補に対し、辺の延長線上も含めた交点を求める交点計算手段と、
    前記交点を構成する2辺と該交点の位置関係から隅評価値を計算する隅評価手段と、
    四辺形の各4隅に対する各隅評価値から四辺形評価値を計算する四辺形総合評価手段と、
    を有することを特徴とする四辺形評価装置。
  7. 前記隅評価手段は、
    交点位置と該交点をなす2本の辺の交点側の端点位置との各距離の和を隅評価値とする
    請求項6記載の四辺形評価装置。
  8. 前記隅評価手段は、
    交点を成す2本の辺の位置関係がL字型であれば隅評価値を大きく、T字型及び十字型であれば隅評価値を小さく計算する
    請求項6記載の四辺形評価装置。
  9. 前記四辺形総合評価手段は、
    四辺形の各4隅に対する各隅評価値に加え、四辺形の面積を四辺形評価値計算に用いる
    請求項6記載の四辺形評価装置。
  10. 前記四辺形総合評価手段は、
    四辺形の各4隅に対する各隅評価値に加え、四辺形の対角線の交わる点と四辺形の重心座標点との距離を四辺形評価値計算に用いる
    請求項6記載の四辺形評価装置。
  11. 四辺形を評価するプログラムであって、コンピュータを請求項6乃至10のいずれか1項に記載の四辺形評価装置として機能させることを特徴とする四辺形評価プログラム。
JP2005237857A 2005-08-18 2005-08-18 四辺形評価方法及び装置及びプログラム Active JP4525519B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005237857A JP4525519B2 (ja) 2005-08-18 2005-08-18 四辺形評価方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005237857A JP4525519B2 (ja) 2005-08-18 2005-08-18 四辺形評価方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2007052670A JP2007052670A (ja) 2007-03-01
JP4525519B2 true JP4525519B2 (ja) 2010-08-18

Family

ID=37917067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005237857A Active JP4525519B2 (ja) 2005-08-18 2005-08-18 四辺形評価方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4525519B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
JP4715888B2 (ja) * 2008-09-02 2011-07-06 カシオ計算機株式会社 画像処理装置及びコンピュータプログラム
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
JP5563390B2 (ja) * 2010-06-30 2014-07-30 キヤノン株式会社 画像処理装置およびその制御方法、及びプログラム
JP5463269B2 (ja) * 2010-11-24 2014-04-09 日本電信電話株式会社 特徴図形付加方法、特徴図形検出方法、特徴図形付加装置、特徴図形検出装置、およびプログラム
JP5742399B2 (ja) 2011-04-06 2015-07-01 富士ゼロックス株式会社 画像処理装置及びプログラム
JP5767887B2 (ja) * 2011-08-02 2015-08-26 エヌ・ティ・ティ・コムウェア株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP5712859B2 (ja) * 2011-08-11 2015-05-07 富士通株式会社 画像認識装置および画像認識方法
JP5871571B2 (ja) * 2011-11-11 2016-03-01 株式会社Pfu 画像処理装置、矩形検出方法及びコンピュータプログラム
US8855375B2 (en) * 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
JP5362052B2 (ja) * 2012-01-24 2013-12-11 Eizo株式会社 表示装置、画像処理装置、画像領域検出方法及びコンピュータプログラム
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
JP2016518790A (ja) 2013-05-03 2016-06-23 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法
WO2015073920A1 (en) 2013-11-15 2015-05-21 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10467465B2 (en) 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
JP6676299B2 (ja) 2015-07-21 2020-04-08 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0789063A (ja) * 1993-09-24 1995-04-04 Toshiba Corp 印刷物検査システム
JPH08125855A (ja) * 1994-10-26 1996-05-17 Hitachi Ltd 表枠線の交点補正装置および表認識装置および光学文字読取装置
JPH08221506A (ja) * 1995-02-16 1996-08-30 Toshiba Corp 帳票文書認識装置および帳票文書認識方法
JP2004310726A (ja) * 2003-03-24 2004-11-04 Fuji Xerox Co Ltd 画像検査方法、画像検査装置、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0789063A (ja) * 1993-09-24 1995-04-04 Toshiba Corp 印刷物検査システム
JPH08125855A (ja) * 1994-10-26 1996-05-17 Hitachi Ltd 表枠線の交点補正装置および表認識装置および光学文字読取装置
JPH08221506A (ja) * 1995-02-16 1996-08-30 Toshiba Corp 帳票文書認識装置および帳票文書認識方法
JP2004310726A (ja) * 2003-03-24 2004-11-04 Fuji Xerox Co Ltd 画像検査方法、画像検査装置、およびプログラム

Also Published As

Publication number Publication date
JP2007052670A (ja) 2007-03-01

Similar Documents

Publication Publication Date Title
JP4525519B2 (ja) 四辺形評価方法及び装置及びプログラム
Lee et al. Interactive e-learning system using pattern recognition and augmented reality
US10824895B2 (en) Image processing apparatus, image processing method, and storage medium
US20050242186A1 (en) 2D rectangular code symbol scanning device and 2D rectangular code symbol scanning method
US20120092329A1 (en) Text-based 3d augmented reality
US10572762B2 (en) Image processing method for performing pattern matching for detecting a position of a detection target
US8811725B2 (en) Learning device, learning method, identification device, identification method, and program
JP5366756B2 (ja) 情報処理装置及び情報処理方法
CN109691080B (zh) 拍摄图像方法、装置和终端
US9805443B2 (en) Image processing method, image processing apparatus, program, storage medium, production apparatus, and method of producing assembly
CN104008542B (zh) 一种针对特定平面图形的快速角点匹配方法
JPWO2012077287A1 (ja) 姿勢状態推定装置および姿勢状態推定方法
JP5468824B2 (ja) 3次元における形状の一致を判定する方法および装置
JP6107372B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2009211490A (ja) 画像認識方法および装置
TW201428689A (zh) 光學導航方法以及相關裝置
KR101344851B1 (ko) 영상처리장치 및 영상처리방법
JP2008035301A (ja) 移動体追跡装置
JP4390487B2 (ja) 頭部領域抽出装置
Ha et al. Embedded panoramic mosaic system using auto-shot interface
JP4550768B2 (ja) 画像検出方法および画像検出装置
US20070242876A1 (en) Image Processing Apparatus, Image Processing Method, and Program
JP5708305B2 (ja) 画像認識装置、画像認識方法及び画像認識用コンピュータプログラム
CN114677439A (zh) 相机的位姿确定方法、装置、电子设备以及存储介质
KR101900797B1 (ko) 루빅스 큐브를 이용한 증강현실 제공 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100524

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4525519

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140611

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350