JP2019050030A - 画像抽出装置、画像抽出装置の制御方法及びプログラム - Google Patents

画像抽出装置、画像抽出装置の制御方法及びプログラム Download PDF

Info

Publication number
JP2019050030A
JP2019050030A JP2018217892A JP2018217892A JP2019050030A JP 2019050030 A JP2019050030 A JP 2019050030A JP 2018217892 A JP2018217892 A JP 2018217892A JP 2018217892 A JP2018217892 A JP 2018217892A JP 2019050030 A JP2019050030 A JP 2019050030A
Authority
JP
Japan
Prior art keywords
line segment
image
line
polygon
extraction device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018217892A
Other languages
English (en)
Other versions
JP6677412B2 (ja
Inventor
直視 相川
Naoshi Aikawa
直視 相川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wantedly Inc
Original Assignee
Wantedly Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wantedly Inc filed Critical Wantedly Inc
Priority to JP2018217892A priority Critical patent/JP6677412B2/ja
Publication of JP2019050030A publication Critical patent/JP2019050030A/ja
Application granted granted Critical
Publication of JP6677412B2 publication Critical patent/JP6677412B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】画像から線分をより高速に特定する線分抽出装置、その制御方法及びプログラムを提供する。【解決手段】画像から線分を抽出する線分抽出装置100であって、前記画像からエッジを検出するエッジ検出部901と、前記画像内で第1方向に所定間隔で延伸する複数の第1平行線と、前記エッジと、の交点を求める第1交点特定部902と、隣接する2本の第1平行線の各ペアについて、互いの第1平行線上の前記交点同士を直線の結合線で結ぶ第1交点結合部903と、前記交点で繋がる複数の前記結合線からなり、延伸方向の角度差が所定範囲以内である前記結合線の集合を、前記線分として抽出する第1線分特定部904と、を備える。【選択図】図2

Description

本発明は、線分抽出装置、線分抽出装置の制御方法及びプログラムに関する。
近年、カメラ機能を備えたスマートフォンや携帯電話機、タブレットなどの携帯端末が普及し、手軽に写真撮影が行えるようになっている。
またこのような携帯端末を用いて撮影された写真を加工して利用するアプリケーションソフトウェアも様々に開発されている。例えば、携帯端末を用いて撮影した名刺を電子化する技術が開発されている(例えば特許文献1参照)。
また、画像中のエッジ点の集合から輪郭を抽出する技術も開発されている(例えば特許文献2参照)。
特開2003−296353号公報 特開2004−234278号公報
しかしながら、携帯端末で実行されるアプリケーションソフトウェアは、ユーザの待ち時間が長くならないように高速に動作することが求められ、特許文献1のように名刺を電子化する場合も同様である。
そのため、カメラにより撮影された静止画像から、名刺のような多角形の撮影対象物の輪郭をなす線分をより高速に特定可能とするような技術が求められている。
本発明は上記課題を鑑みてなされたものであり、画像から線分をより高速に特定することを可能とする線分抽出装置、線分抽出装置の制御方法及びプログラムを提供することを一つの目的とする。
一つの側面に係る線分抽出装置は、画像から線分を抽出する線分抽出装置であって、前記画像からエッジを検出するエッジ検出部と、前記画像内で第1方向に所定間隔で延伸する複数の第1平行線と、前記エッジと、の交点を求める第1交点特定部と、隣接する2本の第1平行線の各ペアについて、互いの第1平行線上の前記交点同士を直線の結合線で結ぶ第1交点結合部と、前記交点で繋がる複数の前記結合線からなり、延伸方向の角度差が所定範囲以内である前記結合線の集合を、前記線分として抽出する第1線分特定部と、を備える。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄の記載、及び図面の記載等により明らかにされる。
画像から線分をより高速に特定することが可能となる。
本発明の一実施形態に係る線分抽出装置のハードウェア構成を示す図である。 本発明の一実施形態に係る線分抽出装置の機能構成を示すである。 本発明の一実施形態に係る静止画像から名刺の輪郭を特定した様子を示す図である。 本発明の一実施形態に係る静止画像を示す図である。 本発明の一実施形態に係る静止画像からエッジを検出した様子を示す図である。 本発明の一実施形態に係る静止画像から線分を抽出する様子を示す図である。 本発明の一実施形態に係る静止画像においてエッジとメッシュラインとの交点を特定する様子を示す図である。 本発明の一実施形態に係る静止画像から線分を抽出した様子を示す図である。 本発明の一実施形態に係る静止画像から抽出された線分を示す図である。 本発明の一実施形態に係る線分を組み合わせて多角形を形成する様子を示す図である。 本発明の一実施形態に係る線分を組み合わせて多角形を形成する様子を示す図である。 本発明の一実施形態に係る処理の流れを示すフローチャートである。 本発明の一実施形態に係る処理の流れを示すフローチャートである。 本発明の一実施形態に係る処理の流れを示すフローチャートである。
本明細書および添付図面の記載により、少なくとも以下の事項が明らかとなる。以下、本発明をその一実施形態に即して添付図面を参照しつつ説明する。
==線分抽出装置==
図1及び図2に、本発明の一実施形態に係る線分抽出装置100の構成を示す。本実施形態に係る線分抽出装置100は、例えばスマートフォンや携帯電話機、ノートパソコン、タブレットなどのカメラ機能を具備した携帯型の情報処理端末である。
そして本実施形態に係る線分抽出装置100は、名刺を撮影すると、その静止画像400(後述)の画像解析を行い、静止画像400から名刺の輪郭を特定し、名刺の部分の画像(名刺の輪郭で囲まれた部分の画像)を名刺画像410として抽出する。このようにして名刺を電子化することができる。
<ハードウェア構成>
線分抽出装置100のハードウェア構成図を図1に示す。線分抽出装置100は、CPU110、メモリ120、通信装置130、記憶装置140、入力装置150、出力装置160、及び記録媒体読取装置170を備えて構成される。
記憶装置140は、線分抽出装置100によって実行されるプログラム700や各種のデータを格納する。記憶装置140に記憶されているプログラム700やデータがメモリ120に読み出されてCPU110によって実行されることにより、線分抽出装置100の各種機能が実現される。ここで、記憶装置140は例えばハードディスクやSSD(Solid State Drive)、フラッシュメモリ等の不揮発性の記憶装置である。
記録媒体読取装置170は、SDカード等の記録媒体800に記録されたプログラム700やデータを読み取り、記憶装置140に格納する。
通信装置130は、LAN(Local Area Network)やインターネット等の通信網(不図示)を介して他のコンピュータ(不図示)と各種データやプログラム700の授受を行う。例えば他のコンピュータに上述したプログラム700やデータを格納しておき、線分抽出装置100がこのコンピュータからデータやプログラム700をダウンロードするようにすることができる。
入力装置150は、ユーザによるコマンドやデータの入力を受け付ける各種ボタンやスイッチ、キーボード、タッチパネルディスプレイ上でのタッチ位置を検出するタッチセンサ、マイクなどの入力インタフェース、加速度センサ、温度センサ、カメラ151などである。
また出力装置160は、例えばディスプレイ161などの表示装置、スピーカ、バイブレータ、照明などの出力ユーザインタフェースである。
<機能構成>
図2に、線分抽出装置100の機能ブロック図を示す。線分抽出装置100は、画像取得部101、画像表示部102、画像抽出部104を含んで構成される。また画像抽出部104は、線分抽出部900、多角形形成部910、調整度算出部920、輪郭特定部930及び形状比較部940を含む。
またさらに、線分抽出部900は、エッジ検出部901、第1交点特定部902、第1交点結合部903、第1線分特定部904、第2交点特定部905、第2交点結合部906、及び第2線分特定部907を有する。
これらの各機能は、線分抽出装置100のハードウェアによって本実施形態に係るプログラム700が実行されることにより実現される。
画像取得部101は、名刺を撮影して静止画像400を取得する。画像取得部101は例えばカメラ151を用いて実現される。
静止画像400は、カメラ151のシャッターを押下した瞬間に得られる1枚の写真の画像であっても良いし、動画として撮影された複数フレームからなる個々の画像であっても良い。さらに静止画像400は、動画の撮影開始前や、写真撮影時のシャッターを押下する前にディスプレイ161に表示される、CCD(Charge Coupled Device)によって検出されている画像であっても良い。
またこの静止画像400には、名刺だけでなく、名刺の背景や人物などのように名刺以外のものが写っていてもよい。また1つの静止画像400内に複数枚の名刺が写っていても良い。
画像表示部102は、画像取得部101が取得した名刺の静止画像400を表示する。画像表示部102は例えばタッチパネル型のディスプレイ161を用いて実現される。
静止画像400が線分抽出装置100のディスプレイ161に表示されている様子を図3に示す。図3に示す例は、3枚の名刺が同時に撮影された場合の様子を示す。図3に示すように、本実施形態では、複数枚の名刺を同時に撮影する場合にそれぞれの名刺の向きが揃っていなくても良い。
そして以下に詳しく述べるように、本実施形態に係る線分抽出装置100は、この静止画像400から名刺の輪郭を高速に特定し、名刺の部分の画像(名刺の輪郭で囲まれた部分の画像)を名刺画像410として抽出する。
そして画像表示部102は、抽出した名刺画像410をユーザに示すために、名刺画像410に重ねて名刺マーカ500を表示する。名刺マーカ500は、本実施形態では円形で所定色の画像であるが、特に表示態様は限定されない。このように名刺マーカ500が名刺画像410に重ねて表示されることにより、ユーザは正しく名刺が抽出されたことを確認することができる。
図2に戻って、画像抽出部104について説明する。
画像抽出部104は、静止画像400から名刺画像410を抽出する。
以下、図4〜図14を参照しながら、画像抽出部104の機能及び処理手順を具体的に説明する。
まず、名刺画像410が抽出される前の静止画像400を図4に示す。画像取得部101がこのような静止画像400を取得すると、エッジ検出部901はこの静止画像400のサイズを画素数に応じて所定の大きさに調整した後、静止画像400からエッジ420を検出する。エッジ検出部901は、例えばCanny法やSobel Filterを用いた手法などの周知の技術を用いてエッジを検出する。
エッジ検出部901が静止画像400からエッジ420を検出した様子を図5に示す。
そうすると次に、第1交点特定部902が、静止画像400内で第1方向に所定間隔で延伸する複数の第1メッシュライン(第1平行線)421と、エッジ420と、の交点422を求める。その様子を図6(A)、図6(B)、図6(C)に示す。
図6(A)は、静止画像400から検出されたエッジ420と、静止画像400内で第1方向に延伸する複数の第1メッシュライン421と、を示す図である。
この状態で第1交点特定部902は、図6(B)に示すように、エッジ420と第1メッシュライン421との交点422を特定する。
なお、エッジ420や第1メッシュライン421は、静止画像400を個々の画素を識別できるレベルで見ると、図7(A)に示すような不連続の点の集合である。そのため、エッジ420と第1メッシュライン421との交角が小さい場合には、図7(B)に示すように、エッジ420と第1メッシュライン421との交差する点が複数の画素に分散することがある。
そのため、本実施形態では、エッジ420と第1メッシュライン421とが交差する点が複数の画素に分散した場合には、図7(C)に示すように、これらの交差する点の中の1点(例えば中点)を選び、交点422として特定する。このような態様によって、エッジ420と第1メッシュライン421との交点422を画素単位の精度で特定することが可能となる。第1交点特定部902がこのようにして交点422を求めた様子を図6(C)に示す。
そうすると次に、第1交点結合部903は、図6(D)及び図6(E)に示すように、隣接する2本の第1メッシュライン421のペアのそれぞれについて、互いの第1メッシュライン421上の交点422同士を直線の結合線423で結ぶ。
そして第1線分特定部904は、図6(F)に示すように、交点422で繋がる複数の結合線423からなり、延伸方向の角度差が所定範囲以内(例えば±5°以内)である結合線423の集合を、線分430として抽出する。なおこのとき、第1線分特定部904は、第1メッシュライン421に対して所定角度以上(例えば45°以上)の交角を有する結合線423の集合を、線分430として抽出する。
その後、第2交点特定部905、第2交点結合部906及び第2線分特定部907は、第1メッシュライン421の延伸方向と直交する第2メッシュライン421(不図示)を用いて、それぞれ第1交点特定部902、第1交点結合部903及び第1線分特定部904と同様の処理を行うことにより、さらに線分430を抽出する。
つまり、第2交点特定部905は、第1メッシュライン421に直交する第2方向に所定間隔で延伸する複数の第2メッシュライン421とエッジ420との交点422を求める。そして第2交点結合部906は、隣接する2本の第2メッシュライン421の各ペアについて、互いの第2メッシュライン421上の交点422同士を直線の結合線423で結ぶ。そして第2線分特定部907は、交点422で繋がる複数の結合線423からなり、延伸方向の角度差が所定範囲以内(例えば±5°以内)である結合線423の集合のうち、第2メッシュライン421と所定角度の余角を超える(例えば45°を超える)交角を有する結合線423の集合を、線分430として抽出する。
このような態様によって、線分430を抽出する際に、交点422に対する処理を行なえば済み、エッジ420上の多数の点に対する処理を不要にできるので、より高速に線分430の抽出を行うことが可能となる。
またハフ変換等を用いて直線を検出する場合とは異なり、静止画像400内の被写体の境界を有限長の線分430として抽出できるため、以下に述べるように、これらの線分430を組み合わせて多角形432を形成する際に、多角形432の周長に対する線分430の調整部分431の長さ(調整量)の比率を算出することが可能となる。
また第1メッシュライン421と第2メッシュライン421とを用いてエッジ420との交点422を求めることによって、エッジ420が静止画像400内でどの方向に延伸していても、メッシュライン421との交角が45°以上となるような交点422を特定することができるため、エッジ420上の交点422の位置をより正確に特定することが可能となる。
なお、メッシュライン421の間隔を狭くすると交点422の数を増やすことができるため、より正確に線分430の抽出を行うことが可能であるが、その分処理時間が増大する。メッシュライン421は、例えば静止画像400内に50本〜100本程度となるような間隔で引くと良いが、種々変更することが可能である。
このようにして、第1線分特定部904及び第2線分特定部907によって、静止画像400から線分430が特定される。静止画像400から線分430が特定された様子を図8に示す。
その後、多角形形成部910は、静止画像400から抽出された線分430の中から名刺の辺の数に応じた本数の線分(つまり、4本の線分)を選ぶ組み合わせ毎に、線分430の長さを調整して、名刺と同じ数の頂点を有する多角形(つまり四角形)432を形成する。
例えば、図9に示すように、静止画像400から5本の線分430A〜Eが抽出されたとすると、これらの線分430A〜Eから4本を選ぶ組み合わせは下記(1)〜(5)の5通りである(=5)。
(1)430A、430B、430C、430D
(2)430A、430B、430C、430E
(3)430A、430B、430D、430E
(4)430A、430C、430D、430E
(5)430B、430C、430D、430E
多角形形成部910はこれらの各組み合わせについて、各線分430を用いて四角形432の形成を試みる。ただし、多角形形成部910は、線分430Bと線分430Dと線分430Eが同一方向に延伸する平行線であることから、これら3つの線分430を同時に含む組み合わせ(3)と(5)は、組み合わせから外すこともできる。このような態様によって、無駄な処理を効率的に省き、名刺の抽出をより高速に行うことが可能となる。
このようにして、多角形形成部910は、図10(A)〜図10(C)に示すような3通りの組み合わせの四角形432を形成する。図10(A)は(1)の組み合わせに対応し、図10(B)は(2)の組み合わせに対応し、図10(C)は(4)の組み合わせに対応する。
このようにして、図10(A)〜図10(C)に示した各組み合わせについて、多角形形成部910が四角形432を形成する様子を、それぞれ図11(A)〜図11(C)に示す。
図11(A)に示すケースでは、多角形形成部910は、線分430A、430B、430C、430Dの長さを調整して四角形432を形成している。そして図11(A)には、各線分430の長さの調整部分が調整部分431として破線で記載されている。
多角形形成部910は、図11(B)(C)に示すケースでも同様に、線分430の長さを調整して、四角形432を形成する。
そうすると調整度算出部920は、上記各組み合わせ毎に、四角形432を形成するために必要な線分430の長さの調整量の度合いを表す値を算出する。例えば調整度算出部920は、線分430の長さを調整して形成される四角形432の周長に対する調整部分431の長さ(調整量)の比率を算出する。
そして輪郭特定部930は、この調整量の度合いが小さい組み合わせから順に、組み合わせを構成する各線分430を、名刺の輪郭として割り当てていく。
例えば図11(A)(B)(C)の順で調整量の度合いを示す値が小さいと仮定した場合には、輪郭特定部930は、まず図11(A)で示す組み合わせの線分430(線分430A、430B、430C、430D)を、名刺の輪郭として特定する。
このようにして、線分430A、430B、430C、430Dが名刺の輪郭として割り当てられると、残りは線分430E1本のみとなり、もはや四角形432を形成できないため、画像抽出部104の処理が終了する。
このようにして本実施形態に係る線分抽出装置100は名刺の輪郭を特定する。図3に示したように、静止画像400内に複数枚の名刺が存在する場合であっても、各線分430の組み合わせ毎の調整量の度合いが小さい順に、名刺の輪郭として特定することが可能である。
なお本実施形態に係る線分抽出装置100は、さらに形状比較部940を有している。
形状比較部940は、線分430の長さを調整して形成される四角形432の形状を表す指標値を、名刺の形状を表す基準値と比較する。
そして輪郭特定部930は、この指標値が基準値に対して所定範囲内となるような四角形432が形成される線分430の組み合わせの中で、上記調整量の度合いが小さい組み合わせから順に、組み合わせを構成する線分430を名刺の輪郭として特定する。
例えば、形状比較部940は、4本の線分430を組み合わせて構成される四角形432において、隣り合う線分430の交角を基準値と比較する。基準値として、例えば90°±5°と定めておけば、輪郭特定部930は、4本の線分430を組み合わせて構成される様々な四角形432の中で、内角が90°±5°の範囲に入る長方形あるいは正方形であるものを選び、この中で、調整量の度合いが小さい組み合わせから順に、組み合わせを構成する線分430を名刺の輪郭として特定する。このような態様によって、より正確に名刺を特定することが可能となる。
あるいは、形状比較部940は、4本の線分430を組み合わせて構成される四角形432において、各線分430の長さを基準値と比較する。基準値として、例えば短辺=50mm〜60mm、長辺=85mm〜95mmと定めておけば、輪郭特定部930は、4本の線分430を組み合わせて構成される様々な四角形432の中で、このような辺の長さを有する長方形であるものを選び、この中で、調整量の度合いが小さい組み合わせから順に、組み合わせを構成する線分430を名刺の輪郭として特定する。このような態様によっても、より正確に名刺を特定することが可能となる。
次に、本実施形態に係る線分抽出装置100の処理の流れについて、図12〜図14に示すフローチャートを参照しながら説明する。
まず線分抽出装置100は、名刺を撮影して静止画像400を取得する(S1000)。画像取得部101は例えばカメラ151を用いて実現される。
次に、線分抽出装置100は、この静止画像400のサイズを画素数に応じて定められた所定の大きさに調整する(S1010)。例えば線分抽出装置100は、静止画像400の1辺が1000ピクセル以下になるように調整する。このような態様によって、線分抽出装置100が画像解析を行う際の処理量を減らし、静止画像400から高速に名刺の輪郭の特定を行うことが可能となる。
次に線分抽出装置100は、静止画像400からエッジ420を検出した後(S1020)、エッジを検出した静止画像400から線分430を抽出する(S1030)。
線分抽出装置100が静止画像400から線分430を抽出する際の処理の流れを図13に示す。
まず線分抽出装置100は、エッジ420が検出された静止画像400を取得する(S2000)。
そして線分抽出装置100は、静止画像400内で第1方向に所定間隔で延伸する複数の第1メッシュライン421を引く(S2010)。
次に線分抽出装置100は、第1メッシュライン421とエッジ420との交点422を求める(S2020)。
そして線分抽出装置100は、隣接する2本の第1メッシュライン421の各ペアについて、互いの第1メッシュライン421上の交点422同士を直線の結合線423で結ぶ(S2030)。
そして線分抽出装置100は、交点422で繋がる複数の結合線423からなり、延伸方向の角度差が所定範囲以内である結合線423の集合を、線分430の候補とする(S2040)。
このとき線分抽出装置100は、線分430の候補とした結合線423の集合のうち、その結合線423の位置にエッジ420が抽出されていないものを除いたうえで、線分430を抽出する(S2050)。
このようにして第1方向に延伸する第1メッシュライン421についての処理を終えると、線分抽出装置100は、静止画像400を90°回転させて(S2060、S2070)、S2010〜S2050の処理を繰り返す。静止画像400を90°回転させて同様の処理を行うことは、上述した第2メッシュライン421を用いて第2交点特定部905、第2交点結合部906及び第2線分特定部907が、線分430を抽出する処理を行うことに相当する。
そして線分抽出装置100は、静止画像400の向きを−90°回転して元に戻し(S2080)、検出した線分430を出力する(S2090)。
図12に戻って、線分抽出装置100は、抽出した線分430を組み合わせて形成できる四角形432を探索する(S1040)。
具体的には図14に示すように、線分抽出装置100はまず、静止画像400から抽出された線分430の中から名刺の辺の数に応じた本数の線分(つまり、4本の線分)を選ぶ組み合わせ毎に、線分430の長さを調整して、名刺と同じ数の頂点を有する多角形432(つまり四角形432)を形成する(S3000)。
そして線分抽出装置100は、これらの四角形432の内、四角形432の成す角(内角)が例えば90°±5°の範囲にないものを除去する(S3010、S3020)。このような態様によって、無駄な処理を効率的に省き、名刺の抽出をより高速に行うことが可能となる。
そして線分抽出装置100は、四角形432を構成する線分430の各組み合わせ毎に、四角形432を形成するために必要な線分430の長さの調整量の度合いを表す値(ペナルティ)を算出し(S3030)、出力する(S3040)。例えば調整度算出部920は、四角形432の周長に対する調整部分431の長さ(調整量)の比率をペナルティとして算出する。
そして線分抽出装置100は、ペナルティが小さい順に、上記線分430の組み合わせを並び替える(S3050)。
そして線分抽出装置100は、ペナルティが小さい組み合わせから順に、組み合わせを構成する各線分430を、名刺の輪郭として割り当てていく(S3060〜S3090)。四角形432を構成し得る線分430が無くなった場合には(S3100)、名刺の輪郭として特定した線分430をディスプレイ161に表示する(S3110)。またこの時、線分抽出装置100は、名刺の輪郭で囲まれる部分の名刺画像410に重ねるようにして、名刺マーカ500も合わせて表示する。
図12に戻って、線分抽出装置100は、このようにして静止画像400から名刺の輪郭を特定したら、次のフレームの静止画像400についても同様に処理を行う。このようにして、線分抽出装置100は、動画などのような連続する静止画像400についても、名刺の輪郭を特定することが可能である。
==他の実施形態==
上記実施形態では、多角形形成部910は、静止画像400から抽出された線分430の中から名刺の辺の数に応じた本数の線分(つまり、4本の線分)を選ぶ組み合わせ毎に、線分430の長さを調整して、名刺と同じ数の頂点を有する多角形(つまり四角形)432を形成したが、この場合、抽出されたn本の線分430から、4頂点の四角形432を形成する場合には、単純には通りの組み合わせが存在するため、計算量はnの4乗のオーダとなる。
そのため、この計算量を削減するために、多角形形成部910は、静止画像400から抽出された線分430のうち共通の端点を有して互いに角度をなす(例えば90°±5°の範囲内の角度をなす)2本の線分430を、線分ペアとして抽出した上で、これらの線分ペアの中から2つの線分ペアを選ぶ組み合わせ毎に、4本の線分430の長さを調整して四角形432を形成するようにしてもよい。
つまり、抽出されたn本の線分430から直接4本を選ぶのではなく、一旦、互いにほぼ直交する角度(90°±5°以内)で交わる2本の線分430からなる線分ペア(線分ペアの形状は、鍵括弧状の"「"、あるいは"」"となる)を抽出した上で、この線分ペア同士を組み合わせて四角形432を形成するようにする。
このような態様によれば、組み合わせの数が(n/2)となるため、計算量をnの2乗のオーダにすることができる。これにより、より高速に名刺の輪郭を特定することが可能となる。
なお、線分ペアを形成する2本の線分430の端点が共通するとは、第1の線分430の端点と、第2の線分430の端点とが、同一ピクセル上に位置する場合だけでなく、所定範囲内(例えば10ピクセル以内)に位置する場合を含む。
以上、本実施形態に係る線分抽出装置100、線分抽出装置100の制御方法、及びプログラム700について詳細に説明したが、本実施形態によれば、静止画像400から線分430をより高速に特定することが可能となる。
なお上述した実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得るとともに、本発明にはその等価物も含まれる。
例えば、上記実施形態では、静止画像400から名刺の輪郭を特定する場合を例に説明したが、名刺のような四角形の平面の輪郭を特定するだけでなく、一般的に三角形や五角形、六角形などの多角形の平面の輪郭を特定する場合にも同様に適用することができる。
100 線分抽出装置
101 画像取得部
102 画像表示部
104 画像抽出部
110 CPU
120 メモリ
130 通信装置
140 記憶装置
150 入力装置
151 カメラ
160 出力装置
161 ディスプレイ
170 記録媒体読取装置
400 静止画像
410 名刺画像
420 エッジ
421 メッシュライン
422 交点
423 結合線
430 線分
431 線分の調整部分
432 多角形(四角形)
500 名刺マーカ
700 プログラム
800 記録媒体
900 線分抽出部
901 エッジ検出部
902 第1交点特定部
903 第1交点結合部
904 第1線分特定部
905 第2交点特定部
906 第2交点結合部
907 第2線分特定部
910 多角形形成部
920 調整度算出部
930 輪郭特定部
940 形状比較部
本発明は、画像抽出装置画像抽出装置の制御方法及びプログラムに関する。
本発明は上記課題を鑑みてなされたものであり、画像から名刺のような矩形の輪郭をより高速に特定することを可能とする画像抽出装置画像抽出装置の制御方法及びプログラムを提供することを一つの目的とする。
一つの側面に係る画像抽出装置は、画像から矩形を抽出する画像抽出装置であって、前記画像から線分の抽出を行う線分抽出部と、前記画像から抽出された前記線分のうち共通の端点を有して互いに角度をなす2本の線分を線分ペアとして抽出した上で、前記線分ペアの中から2つの線分ペアを選ぶ組み合わせ毎に、4本の線分の長さを調整して矩形を形成する多角形形成部と、前記組み合わせ毎に形成される矩形の中から、前記画像から抽出すべき矩形の輪郭を特定する輪郭特定部と、を備える。
画像から矩形の輪郭をより高速に特定することが可能となる。

Claims (11)

  1. 画像から線分を抽出する線分抽出装置であって、
    前記画像からエッジを検出するエッジ検出部と、
    前記画像内で第1方向に所定間隔で延伸する複数の第1平行線と、前記エッジと、の交点を求める第1交点特定部と、
    隣接する2本の第1平行線の各ペアについて、互いの第1平行線上の前記交点同士を直線の結合線で結ぶ第1交点結合部と、
    前記交点で繋がる複数の前記結合線からなり、延伸方向の角度差が所定範囲以内である前記結合線の集合を、前記線分として抽出する第1線分特定部と、
    を備えることを特徴とする線分抽出装置。
  2. 請求項1に記載の線分抽出装置であって、
    前記画像内で前記第1方向と直交する第2方向に所定間隔で延伸する複数の第2平行線と、前記エッジと、の交点を求める第2交点特定部と、
    隣接する2本の第2平行線の各ペアについて、互いの第2平行線上の前記交点同士を直線の結合線で結ぶ第2交点結合部と、
    前記交点で繋がる複数の前記結合線からなり、延伸方向の角度差が所定範囲以内である前記結合線の集合を、前記線分として抽出する第2線分特定部と、
    をさらに備え、
    前記第1線分特定部は、前記第1平行線に対して所定角度以上の交角を有する前記結合線の集合を、前記線分として抽出し、
    前記第2線分特定部は、前記第2平行線に対して前記所定角度の余角を超える交角を有する前記結合線の集合を、前記線分として抽出する
    ことを特徴とする線分抽出装置。
  3. 請求項1又は2に記載の線分抽出装置であって、
    前記画像から抽出された前記線分の中から、前記画像から特定すべき多角形の辺の数に応じた本数の線分を選ぶ組み合わせ毎に、前記線分の長さを調整して前記多角形と同じ数の頂点を有する多角形を形成する多角形形成部と、
    前記組み合わせ毎に形成される多角形の中から、前記画像から特定すべき多角形の輪郭を特定する輪郭特定部と、
    を備えることを特徴とする線分抽出装置。
  4. 請求項3に記載の線分抽出装置であって、
    前記組み合わせ毎に、前記多角形を形成するために必要な前記線分の長さの調整量の度合いを表す値を算出する調整度算出部と、
    をさらに備え、
    前記輪郭特定部は、前記調整量の度合いが小さい組み合わせから順に、前記組み合わせを構成する各線分を、前記画像から特定すべき多角形の輪郭として割り当てる
    ことを特徴とする線分抽出装置。
  5. 請求項4に記載の線分抽出装置であって、
    前記線分の長さを調整して形成される多角形の形状を表す所定の指標値を、前記画像から特定すべき多角形の形状を表す基準値と比較する形状比較部と、
    をさらに備え、
    前記輪郭特定部は、前記指標値が前記基準値に対して所定範囲内となるような多角形が形成される前記線分の組み合わせの中で、前記調整量の度合いが小さい組み合わせから順に、前記組み合わせを構成する各線分を前記画像から特定すべき多角形の輪郭として割り当てる
    ことを特徴とする線分抽出装置。
  6. 請求項5に記載の線分抽出装置であって、
    前記指標値及び前記基準値は、前記多角形をなす隣り合う二辺の交角を含む
    ことを特徴とする線分抽出装置。
  7. 請求項5または6に記載の線分抽出装置であって、
    前記指標値及び前記基準値は、前記多角形をなす各辺の長さを含む
    ことを特徴とする線分抽出装置。
  8. 請求項4〜7のいずれかに記載の線分抽出装置であって、
    前記調整量の度合いを示す値は、前記線分の長さを調整して形成される多角形の周長に対する前記調整量の比率である
    ことを特徴とする線分抽出装置。
  9. 請求項3〜8のいずれかに記載の線分抽出装置であって、
    前記画像から特定すべき多角形は矩形であり、
    前記多角形形成部は、前記画像から抽出された前記線分のうち共通の端点を有して互いに角度をなす2本の線分を、線分ペアとして抽出した上で、前記線分ペアの中から2つの線分ペアを選ぶ組み合わせ毎に、4本の線分の長さを調整して前記画像から特定すべき多角形と同じ数の頂点を有する多角形を形成する
    ことを特徴とする線分抽出装置。
  10. 画像から線分を抽出する線分抽出装置の制御方法であって、
    前記線分抽出装置が、前記画像からエッジを検出し、
    前記線分抽出装置が、前記画像内で第1方向に所定間隔で延伸する複数の第1平行線と、前記エッジと、の交点を求め、
    前記線分抽出装置が、隣接する2本の第1平行線の各ペアについて、互いの第1平行線上の前記交点同士を直線の結合線で結び、
    前記線分抽出装置が、前記交点で繋がる複数の前記結合線からなり、延伸方向の角度差が所定範囲以内である前記結合線の集合を、前記線分として抽出する
    ことを特徴とする線分抽出装置の制御方法。
  11. 画像から線分を抽出するプログラムであって、コンピュータに、
    前記画像からエッジを検出する手順と、
    前記画像内で第1方向に所定間隔で延伸する複数の第1平行線と、前記エッジと、の交点を求める手順と、
    隣接する2本の第1平行線の各ペアについて、互いの第1平行線上の前記交点同士を直線の結合線で結ぶ手順と、
    前記交点で繋がる複数の前記結合線からなり、延伸方向の角度差が所定範囲以内である前記結合線の集合を、前記線分として抽出する手順と、
    を実行させるためのプログラム。
JP2018217892A 2018-11-21 2018-11-21 画像抽出装置、画像抽出装置の制御方法及びプログラム Active JP6677412B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018217892A JP6677412B2 (ja) 2018-11-21 2018-11-21 画像抽出装置、画像抽出装置の制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018217892A JP6677412B2 (ja) 2018-11-21 2018-11-21 画像抽出装置、画像抽出装置の制御方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017084433A Division JP6447890B2 (ja) 2017-04-21 2017-04-21 線分抽出装置、線分抽出装置の制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019050030A true JP2019050030A (ja) 2019-03-28
JP6677412B2 JP6677412B2 (ja) 2020-04-08

Family

ID=65906320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018217892A Active JP6677412B2 (ja) 2018-11-21 2018-11-21 画像抽出装置、画像抽出装置の制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6677412B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734780A (zh) * 2020-12-25 2021-04-30 哈尔滨市科佳通用机电股份有限公司 一种脱轨自动制动拉环装置拉环变形故障识别方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460456A (zh) * 2021-06-08 2022-12-09 微软技术许可有限责任公司 数字内容添加的目标区域提取

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171417A (ja) * 2007-01-12 2008-07-24 Seiko Epson Corp 画像内の略矩形のオブジェクトを検出する方法、画像内のバックグラウンド色を推定する方法、コンピュータ可読媒体、画像内の略矩形のオブジェクトを検出する装置、および画像内のバックグラウンド色を推定する装置
JP2016062123A (ja) * 2014-09-12 2016-04-25 キヤノン株式会社 画像処理装置および画像処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171417A (ja) * 2007-01-12 2008-07-24 Seiko Epson Corp 画像内の略矩形のオブジェクトを検出する方法、画像内のバックグラウンド色を推定する方法、コンピュータ可読媒体、画像内の略矩形のオブジェクトを検出する装置、および画像内のバックグラウンド色を推定する装置
JP2016062123A (ja) * 2014-09-12 2016-04-25 キヤノン株式会社 画像処理装置および画像処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734780A (zh) * 2020-12-25 2021-04-30 哈尔滨市科佳通用机电股份有限公司 一种脱轨自动制动拉环装置拉环变形故障识别方法
CN112734780B (zh) * 2020-12-25 2021-09-14 哈尔滨市科佳通用机电股份有限公司 一种脱轨自动制动拉环装置拉环变形故障识别方法

Also Published As

Publication number Publication date
JP6677412B2 (ja) 2020-04-08

Similar Documents

Publication Publication Date Title
JP6011470B2 (ja) 予備画像を分析する装置、方法及びプログラム
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
US10291843B2 (en) Information processing apparatus having camera function and producing guide display to capture character recognizable image, control method thereof, and storage medium
US11283987B2 (en) Focus region display method and apparatus, and storage medium
JP5975281B2 (ja) 画像処理装置及びプログラム
JP2019109624A (ja) 情報処理装置、プログラム及び情報処理方法
JP2019087945A (ja) 情報処理装置、プログラム及び情報処理方法
JP6325902B2 (ja) 寸法計測方法、カメラ付き電子機器、および、カメラ付き電子機器用プログラム
JP6677412B2 (ja) 画像抽出装置、画像抽出装置の制御方法及びプログラム
JP6098784B2 (ja) 画像処理装置及びプログラム
US9979858B2 (en) Image processing apparatus, image processing method and program
JP2015005221A (ja) 情報処理装置、情報処理方法、及び、コンピュータプログラム
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
JP6447890B2 (ja) 線分抽出装置、線分抽出装置の制御方法及びプログラム
JP4182937B2 (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP6669390B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP7183020B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6563084B1 (ja) カード番号認識装置およびカード番号認識方法
JP2013242826A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP7027043B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20210281742A1 (en) Document detections from video images
TWI395469B (zh) 影像擷取方法與應用該方法之影像擷取裝置
US10270929B2 (en) Image processing apparatus, control method, and recording medium
JP2013192101A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP6077873B2 (ja) 画像処理装置、画像処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200306

R150 Certificate of patent or registration of utility model

Ref document number: 6677412

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250