JP2009151759A - 画像処理方法及び画像処理装置 - Google Patents
画像処理方法及び画像処理装置 Download PDFInfo
- Publication number
- JP2009151759A JP2009151759A JP2008284749A JP2008284749A JP2009151759A JP 2009151759 A JP2009151759 A JP 2009151759A JP 2008284749 A JP2008284749 A JP 2008284749A JP 2008284749 A JP2008284749 A JP 2008284749A JP 2009151759 A JP2009151759 A JP 2009151759A
- Authority
- JP
- Japan
- Prior art keywords
- line segment
- image processing
- connected component
- line
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】画像内の線分を検出する画像処理方法及び画像処理装置を提供する。
【解決手段】入力画像内の線分を検出する画像処理方法は、前記入力画像内のエッジを検出し、エッジマップを取得するエッジ検出ステップと、前記エッジマップ上で連結成分を検索し、前記連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析ステップと、残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめステップと、前記短い線分をマージしてより長い線分にする線分マージステップとから成る。
【選択図】なし
【解決手段】入力画像内の線分を検出する画像処理方法は、前記入力画像内のエッジを検出し、エッジマップを取得するエッジ検出ステップと、前記エッジマップ上で連結成分を検索し、前記連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析ステップと、残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめステップと、前記短い線分をマージしてより長い線分にする線分マージステップとから成る。
【選択図】なし
Description
本発明は、画像処理方法及び画像処理装置に関し、特に、画像内の線分を検出する画像処理方法及び画像処理装置に関する。
線検出(又は線分検出)は、文書画像処理、財務データ画像処理及びナンバープレート検出等の画像処理における基本的な課題である。米国特許第6,026,186号公報「Line and curve detection using local information」における方法等の複数の線検出方法が提案されている。
ハフ変換(以下、「HT」と呼ぶ場合もある)は、最も広く使用される線検出アルゴリズムだろう。しかし周知のように、ハフ変換には莫大な計算コストがかかり、線しか検出できない。線分を検出するため、すなわち線の2つの端点を判定するためには、時間のかかる後処理が必要とされる。
本発明は、上述の状況に鑑みてなされたものであり、ハフ変換の欠点を解決し、確実且つ高速な線分検出を可能にする。
本発明にかかる入力画像内の線分を検出する画像処理方法は、前記入力画像内のエッジを検出し、エッジマップを取得するエッジ検出ステップと、前記エッジマップ上で連結成分を検索し、前記連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析ステップと、残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめステップと、前記短い線分をマージしてより長い線分にする線分マージステップと、を有することを特徴とする。
本発明にかかる入力画像内の線分を検出する画像処理装置は、前記入力画像内のエッジを検出し、エッジマップを取得するエッジ検出手段と、前記エッジマップ上で連結成分を検索し、前記連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析手段と、残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめ手段と、前記短い線分をマージしてより長い線分にする線分マージ手段と、を備えることを特徴とする。
本発明の更なる特徴は、実施形態の以下の説明から、添付の図面を参照して明らかとなるだろう。
添付の図面を参照して、本発明の好適な実施形態を詳細に説明する。
図1は、本発明の実施形態に従って、線分を検出する処理全体を示すフローチャートである。検出の前に、検出対象の画像は入力される。その後ステップS100において、入力画像のエッジは検出される。入力画像のエッジを検出する方法は、Sobelオペレータ(Sobel operator)及びCannyオペレータ(Canny operator)等の一般的なエッジ検出技術であってもよい。本発明においてはCannyオペレータ(Canny operator)が使用される。このようにして、エッジマップはステップS100において取得される。
次にステップS200において、連結成分(CC)はエッジマップ上で見つけられる。その後、所定の長さより短い(例えば、10画素未満の)小さなCCは廃棄される。これは、本実施形態の目的が長い線分を検索することであり、小さなCCが長い線分に属する可能性が少ないからである。所定の長さより短い小さなCCが廃棄されるため、計算コストは低減される。
エッジマップにおいて、線のエッジは他のオブジェクトのエッジに重ねられてもよい。従って、ステップS200において取得される検出されたCCは、線及び他の非線オブジェクトの双方を含んでもよい。線分を取得するため、ステップS300において、線分は非線オブジェクトから分離される必要がある。
上記の分離を実行するため、図2に示すような「曲線の当てはめ(curve fitting)」アルゴリズムと呼ばれる方法が採用される。図2は、本発明の実施形態に従って、連結成分(CC)をより小さな曲線に切断する例を示す図である。
図2において、最初に、CCの2つの端点により形成される線(線AB)から最も遠い最遠点(点C)を選択し、図2の上部に示すように、点Cから線ABまでの距離が所定の閾値(例えば5画素)より大きい場合、この点でCCを2つの小さな曲線に切断する。CCの2つの端点により形成される線からの最遠点(例えば、本例では点C)を選択する方法は当業界で周知であるため、説明を省略する。
その後、図2の下部に示すように、曲線をそれ以上切断できなくなるまで、結果として得られた曲線をより小さな曲線に更に切断する。例えば、曲線ACは、曲線AD及びDCに更に切断される。その結果得られる曲線AD上の任意の点から線ADまでの距離が所定の閾値以下であるため、曲線ADはそれ以上切断されない。
次に、以下のステップを使用して、結果として得られた小さな各曲線に線分を当てはめる。
1)曲線上の点を左から右及び上から下の順でソートする。
2)先頭の1/5の位置及び末尾の1/5の位置を2つの制御点(control points)として見つける。
3)2つの制御点から線分の線パラメータを算出する。
4)線パラメータ及び曲線の端点の座標により、線分の2つの端点を算出する。
CCに線分を当てはめる例を図3に示す。
図1を再度参照すると、不十分な照明及びノイズ等により、長い線分は複数の断片に分けられる場合がある。ステップS400において、これらの断片は、より長い線分にグループ化される。このフローチャートを図4に詳細に示す。
図4は、本発明の実施形態に従って、短い線分をマージ(又はグループ化)してより長い線分にする例を示すフローチャートである。
図4のステップS410において、長い線分の位置を見つけるためにハフ変換が実行される。ハフ変換は、以下のステップにより実行される。
1)ハフパラメータ空間を有限区画(finite intervals)又は累積セル(accumulator cells)に量子化することにより、2次元配列(2Darray)H(ρ,θ)を形成する。式中、θは[90o,+90o]の範囲にあり、ρは[ρmin,ρmax]の範囲にあり、ρmin=−hであり、ρmax =(w2+h2)(1/2)である。式中、w及びhは画像のサイズである。
2)短い線分(以下、「SLS」と呼ぶ場合もある)Lk毎に、Lk上の全ての点をハフパラメータ空間に累積する。
式中、θkはLkの法線角度であり、Δθは、θkを計算する際のある程度の誤差を許容するためのθの小さな範囲を定義し、(xc,yc)はLkの中心点であり、MはLk上の画素数である。上記式は、次式から導出される。
式中、(xi,yi)は線分上の各点である。
各線分に対してρcのみを算出する必要があるため、多くの計算時間が節約される。この変換後、画像空間内の線分は、SLSの長さに相関する値を有するHT空間内の点により表される。累積数に加えて、各セルに属するSLSのリンクリストが更に維持される。
図5は、本発明の実施形態に従って、線分に対するハフ変換(HT)の例を示す図である。累積アレイ内の結果として得られるピークは、対応する直線が画像内に存在することを明確に表す。
次に、図4のステップS420において、HT空間の同一の累積セル内の短い線分は、より長い線分を取得するためにグループ化及びマージされる。線分の位置は、以下のステップで決定される。
1)それらの十分に長いSLSをシードとして選択する。
2)シード毎に、HT空間内の対応する点の近傍において極大値点を見つける。図6は、本発明の実施形態に従って、HT空間内で極大値を検索する方法の例を示す図である。図6に示すように、シードP0の近傍ではP1が極大値点である。すなわち、P0を中心とする所定の範囲において、P1の値はその範囲内の他の任意の点の値より大きい。近傍は、半径が約2セルの円として選択される。
3)極大値P1は小さな新しい近傍P1を形成し、近傍P1内の点は逆変換され、それによって画像空間内の線分のグループは取得される。
4)極大値点P1に対応する線上に線分のグループを投影する。その後、投影プロファイル上で2つの端点及び間隙を探す。間隙が所定の閾値(閾値は、検出される最短の線分の長さとして選択される)より小さい場合、間隙は無視される。このようにして、同一線上にある、分けられた線分(broken line segments)は、図7に示すように1つの線分にマージされる。図7は、本発明の実施形態に従って、短い線分をマージして長い線分にする例を示す図である。
5)全ての所望の線分が見つけられるまで、ステップ2)〜4)を繰り返す。
図1を再度参照すると、ステップS400の完了後、出力する線分は取得される。
本実施形態において、上述のように、所定の長さより短い小さなCCが廃棄され且つ各線分に対してρcのみを算出する必要があるため、計算コスト及び計算時間は節約される。
図8は、本発明が適用される名刺読取りシステムの例を示す図である。
図8に示すように、名刺は、入力画像を取得するために名刺読取りシステムのデジタルカメラにより取り込まれる。入力画像の取得後、入力画像内の線分は本発明の方法を用いて検出される。次に、名刺の4つの境界線は形成され、それに基づいて遠近歪み(perspective distortion)の矯正は実行される。その後、テキスト抽出及びOCRは実行され、名刺カードに印刷されたテキストは取得される。
図9は、本発明が適用されるナンバープレート認識システムの例を示す図である。
図9に示すように、車両に搭載されたナンバープレートは、図8と同様に、入力画像を取得するためにナンバープレート認識システムのデジタルカメラにより取り込まれる。入力画像の取得後、入力画像内の線分は本発明の方法を用いて検出される。次に、ナンバープレートの4つの境界線は形成され、それに基づいてナンバープレートは2値化され、OCRは実行される。従って、ナンバープレート上のテキストは取得される。
図10は、本発明の実施形態に従って、線分を検出する画像処理装置の例を示すブロック図である。
図10に示す画像処理装置は、入力画像内のエッジを検出し、エッジマップを取得するエッジ検出手段1と、エッジ画像上で連結成分を検索し、連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析手段2と、残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめ手段3と、短い線分をマージしてより長い線分にする線分マージ手段4とを含む。
上述の方法は、上述の機能を実現するソフトウェアのプログラムコードを格納した記憶媒体をコンピュータシステム又は装置に提供することにより実現されてもよい。そのシステム又は装置のコンピュータ(あるいはCPU又はMPU)が記憶媒体に格納されたプログラムコードを読み出して実行することにより、上述の実施形態の機能は実現される。この場合、記憶媒体から読み出されたプログラムコードは実施形態に係る機能を実現し、プログラムコードを格納した記憶媒体は本発明を構成する。フロッピー(登録商標)ディスク、ハードディスク、光ディスク及び光磁気ディスク等の記憶媒体は、プログラムコードを提供するために使用される。CD−ROM、CD−R、磁気テープ、不揮発性メモリカード及びROM等が更に使用される。
更に、上述の機能は、コンピュータにより読み出されたプログラムコードを実行することによってのみ実現されるのではない。本発明は、コンピュータ上で稼動しているOS(オペレーティングシステム)等が、プログラムコードの指示に従って処理の一部又は全部を実行し、上述の実施形態に係る機能を実現する場合を更に含む。
更に、記録媒体から読み出されたプログラムコードは、コンピュータに挿入された機能拡張カード又はコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。その後、その機能拡張カード又は機能拡張ユニットに含まれるCPU等は、そのプログラムコードの指示に従って処理の一部又は全部を行ってもよく、上述の実施形態の機能を実現してもよい。
実施形態を参照して本発明を説明したが、本発明は開示される実施形態に限定されないことが理解されるべきである。添付の特許請求の範囲の範囲は、そのような変形、並びに等価な構成及び機能の全てを含むように最も広範に解釈されるべきである。
Claims (10)
- 入力画像内の線分を検出する画像処理方法であって、
前記入力画像内のエッジを検出し、エッジマップを取得するエッジ検出ステップと、
前記エッジマップ上で連結成分を検索し、前記連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析ステップと、
残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめステップと、
前記短い線分をマージしてより長い線分にする線分マージステップと、を有することを特徴とする画像処理方法。 - 前記曲線当てはめステップは、
前記残りの各連結成分をより小さな曲線に切断するステップと、
前記より小さな各曲線に線分を当てはめるステップと、を更に有することを特徴とする請求項1に記載の画像処理方法。 - 前記切断するステップは、
前記残りの連結成分の2つの端点により形成される線から最も遠い残りの連結成分上の点を選択するステップと、
前記点から前記線までの距離が所定の閾値より大きい場合、前記点において前記残りの連結成分を2つのより小さな曲線に分割するステップと、を更に有することを特徴とする請求項2に記載の画像処理方法。 - 前記最も遠い残りの連結成分上の点が前記より小さな各曲線において見つけられなくなるまで、前記選択及び前記分割は、前記より小さな各曲線に対して繰り返されることを特徴とする請求項3に記載の画像処理方法。
- 前記線分マージステップは、
前記短い線分をハフ変換空間に変換し、同様の線形式を有する前記短い線分をハフ変換空間内の同一の累積セルに変換するステップと、
ハフ変換空間における極大値点と同一の累積セル内にある前記短い線分をグループ化し、前記より長い線分を取得するために前記短い線分をマージするステップと、を更に有することを特徴とする請求項1に記載の画像処理方法。 - 入力画像内の線分を検出する画像処理装置であって、
前記入力画像内のエッジを検出し、エッジマップを取得するエッジ検出手段と、
前記エッジマップ上で連結成分を検索し、前記連結成分のうち所定の長さより短い長さを有する小さな連結成分を除去する連結成分解析手段と、
残りの各連結成分に線分を当てはめて短い線分を取得する曲線当てはめ手段と、
前記短い線分をマージしてより長い線分にする線分マージ手段と、を備えることを特徴とする画像処理装置。 - 前記曲線当てはめ手段は、
前記残りの各連結成分をより小さな曲線に切断する切断手段と、
前記より小さな各曲線に線分を当てはめる当てはめ手段と、を更に備えることを特徴とする請求項6に記載の画像処理装置。 - 前記切断手段は、
前記残りの連結成分の2つの端点により形成される線から最も遠い残りの連結成分上の点を選択する選択手段と、
前記点から前記線までの距離が所定の閾値より大きい場合、前記点において前記残りの連結成分を2つのより小さな曲線に分割する分割手段と、を更に備えることを特徴する請求項7に記載の画像処理装置。 - 前記最も遠い残りの連結成分上の点が前記より小さな各曲線において見つけられなくなるまで、前記選択及び前記分割は、前記より小さな各曲線に対して繰り返される請求項8に記載の画像処理装置。
- 前記線分マージ手段は、
前記短い線分をハフ変換空間に変換し、同様の線形式を有する前記短い線分をハフ変換空間内の同一の累積セルに変換する変換手段と、
ハフ変換空間における極大値点と同一の累積セル内にある前記短い線分をグループ化し、前記より長い線分を取得するために前記短い線分をマージするグループ化手段と、を更に備えることを特徴とする請求項6に記載の画像処理装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710186397 CN101436254B (zh) | 2007-11-14 | 2007-11-14 | 图像处理方法和图像处理设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009151759A true JP2009151759A (ja) | 2009-07-09 |
Family
ID=40710688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008284749A Pending JP2009151759A (ja) | 2007-11-14 | 2008-11-05 | 画像処理方法及び画像処理装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2009151759A (ja) |
CN (1) | CN101436254B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9245357B2 (en) | 2011-08-08 | 2016-01-26 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515714B2 (en) * | 2010-06-02 | 2013-08-20 | Livermore Software Technology Corp. | Curve matching for parameter identification |
CN102915522A (zh) * | 2012-09-12 | 2013-02-06 | 康佳集团股份有限公司 | 一种智能手机的名片提取系统及其实现方法 |
CN104200196B (zh) * | 2014-08-12 | 2017-09-01 | 侯志勇 | 一种x射线透视图像中导针位置自动识别方法 |
CN108345893B (zh) * | 2018-03-15 | 2021-01-26 | 京东方科技集团股份有限公司 | 一种直线检测方法、装置、计算机存储介质及终端 |
CN110292399B (zh) * | 2018-05-04 | 2022-03-08 | 深圳迈瑞生物医疗电子股份有限公司 | 一种剪切波弹性测量的方法及系统 |
CN110335448A (zh) * | 2019-07-29 | 2019-10-15 | 安徽久壬电气科技有限公司 | 一种输电线路覆冰预警系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0528254A (ja) * | 1991-07-23 | 1993-02-05 | Mitani Shoji Kk | 図画データの自動ベクトル化処理方法、及びそれに使用する装置 |
JPH0981740A (ja) * | 1995-09-12 | 1997-03-28 | Toshiba Corp | 線図形入力装置 |
JPH10334236A (ja) * | 1997-06-02 | 1998-12-18 | Nippon Telegr & Teleph Corp <Ntt> | 線図形の認識方法 |
JP2002092606A (ja) * | 2000-09-14 | 2002-03-29 | Sharp Corp | 画像処理装置、画像処理方法およびそれを記録した記録媒体 |
JP2004341663A (ja) * | 2003-05-14 | 2004-12-02 | Canon Inc | 図形の線分近似処理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1025764C (zh) * | 1992-05-12 | 1994-08-24 | 浙江大学 | 字符识别方法 |
CN1312625C (zh) * | 2004-07-02 | 2007-04-25 | 清华大学 | 基于游程邻接图的复杂背景彩色图像中字符提取方法 |
-
2007
- 2007-11-14 CN CN 200710186397 patent/CN101436254B/zh active Active
-
2008
- 2008-11-05 JP JP2008284749A patent/JP2009151759A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0528254A (ja) * | 1991-07-23 | 1993-02-05 | Mitani Shoji Kk | 図画データの自動ベクトル化処理方法、及びそれに使用する装置 |
JPH0981740A (ja) * | 1995-09-12 | 1997-03-28 | Toshiba Corp | 線図形入力装置 |
JPH10334236A (ja) * | 1997-06-02 | 1998-12-18 | Nippon Telegr & Teleph Corp <Ntt> | 線図形の認識方法 |
JP2002092606A (ja) * | 2000-09-14 | 2002-03-29 | Sharp Corp | 画像処理装置、画像処理方法およびそれを記録した記録媒体 |
JP2004341663A (ja) * | 2003-05-14 | 2004-12-02 | Canon Inc | 図形の線分近似処理方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9245357B2 (en) | 2011-08-08 | 2016-01-26 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
CN101436254B (zh) | 2013-07-24 |
CN101436254A (zh) | 2009-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107358596B (zh) | 一种基于图像的车辆定损方法、装置、电子设备及系统 | |
EP2742442B1 (en) | A method for detecting a copy of a reference video, corresponding apparatus for extracting a spatio-temporal signature from video data and corresponding computer readable storage medium | |
JP6000455B2 (ja) | フォーム認識方法及びフォーム認識装置 | |
JP6163344B2 (ja) | ナンバープレート画像の確実なクロッピング | |
JP5393428B2 (ja) | コード検出及び復号化システム | |
US8374454B2 (en) | Detection of objects using range information | |
US8611662B2 (en) | Text detection using multi-layer connected components with histograms | |
JP2009151759A (ja) | 画像処理方法及び画像処理装置 | |
CN109543501B (zh) | 图像处理装置、图像处理方法和存储介质 | |
US20130034305A1 (en) | Image-based crack quantification | |
US20170293819A1 (en) | Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks | |
US9679354B2 (en) | Duplicate check image resolution | |
JP6039413B2 (ja) | 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム | |
CN105450900A (zh) | 用于文档图像的畸变校正方法和设备 | |
JP4904330B2 (ja) | 画像からテキストを抽出する方法及び装置 | |
CN111079571A (zh) | 证卡信息识别及其边缘检测模型训练方法、装置 | |
US10592729B2 (en) | Face detection method and apparatus | |
KR101377910B1 (ko) | 화상 처리 방법 및 화상 처리 장치 | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
WO2018121414A1 (zh) | 电子设备、目标图像识别方法及装置 | |
JP2006018754A (ja) | 指紋読取方法、指紋読取システム及びプログラム | |
WO2013154062A1 (ja) | 画像識別システム、画像識別方法、およびプログラム | |
Pugliese et al. | A novel model-based dewarping technique for advanced Digital Library systems | |
JP2010092426A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JPWO2013084731A1 (ja) | 画像識別システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110509 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111014 |