JP2013089234A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2013089234A JP2013089234A JP2012219840A JP2012219840A JP2013089234A JP 2013089234 A JP2013089234 A JP 2013089234A JP 2012219840 A JP2012219840 A JP 2012219840A JP 2012219840 A JP2012219840 A JP 2012219840A JP 2013089234 A JP2013089234 A JP 2013089234A
- Authority
- JP
- Japan
- Prior art keywords
- vanishing point
- image
- correction
- horizontal
- vertical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 claims abstract description 260
- 238000012937 correction Methods 0.000 claims abstract description 257
- 238000001514 detection method Methods 0.000 claims abstract description 34
- 238000011156 evaluation Methods 0.000 claims description 103
- 230000008569 process Effects 0.000 claims description 82
- 238000003708 edge detection Methods 0.000 claims description 25
- 238000003384 imaging method Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 19
- 230000003287 optical effect Effects 0.000 claims description 15
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 description 27
- 238000010586 diagram Methods 0.000 description 13
- 238000013467 fragmentation Methods 0.000 description 12
- 238000006062 fragmentation reaction Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 239000000284 extract Substances 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 101100501795 Pseudomonas fluorescens estF gene Proteins 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000003702 image correction Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Studio Devices (AREA)
- Geometry (AREA)
Abstract
【解決手段】画像処理装置1は、撮像文書画像における水平方向の消失点の位置および垂直方向の消失点の位置を示す消失点情報を生成する消失点情報推定部14と、撮像文書画像におけるコーナーを検出するコーナー検出部15と、水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部16と、輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部19と、上記輪郭四角形と上記第1画像サイズとに基づいた第1補正方法により撮像文書画像に対して幾何学的補正を行う補正処理部20とを備えている。
【選択図】図1
Description
Lfragmentation<Tfragmentation かつ Llength≧Tlength
ここで、閾値の具体的な数値としては、例えば、Tfragmentation=0.3、Llength=25である。
Lnumgaps>Tnumgaps
を満たす場合に、直線構造を出力対象から除外してもよい。ギャップカウント閾値Tnumgapsは例えば3である。
Λ=λ3/λ1
に従って算出する(312)。
(baselineH>THbaseline)&(Λ<THeigenratio)
で示される。ここで、「&」は、論理演算子「AND」を意味する。各閾値は、例えば、THbaseline=imgH/2
THeigenratio=0.0005
である。なお、imgHは、水平方向の画像寸法を示している。
固有ベクトルv3=[ν3(1) ν3(2) ν3(3)]
の第1要素、第2要素、第3要素である。消失点情報推定部14は、算出した水平方向の消失点の位置を示す水平方向消失点情報を生成し、出力する(320)。
(baselineH<THbaseline)|(angle<THparallel)
で示される。ここで、「|」は、論理演算子の「OR」を意味している。また、angleは、2つの直線構造の法線間の角度である。各閾値は、例えば、
THbaseline=imgH/2
THparallel=1°
である。ここで、imgHは、水平方向の画像寸法である。そして、消失点情報推定部14は、決定した水平方向の消失点の方向を示す水平方向消失点情報を生成し、出力する(348)。
Λ=λ3/λ1
に従って算出する(412)。
(baselineV>TVbaseline)&(Λ<TVeigenratio)
で示される。ここで、「&」は、論理演算子「AND」を意味する。各閾値は、例えば、TVbaseline=imgV/2
TVeigenratio=0.0005
である。なお、imgVは、垂直方向の画像寸法を示している。
固有ベクトルv3=[ν3(1) ν3(2) ν3(3)]
の第1要素、第2要素、第3要素である。消失点情報推定部14は、算出した垂直方向の消失点の位置を示す垂直方向消失点情報を生成し、出力する(420)。
(baselineV<TVbaseline)|(angle<TVparallel)
で示される。ここで、「|」は、論理演算子の「OR」を意味している。また、angleは、2つの直線構造の法線間の角度である。各閾値は、例えば、
TVbaseline=imgV/2
TVparallel=1°
である。ここで、imgVは、垂直方向の画像寸法である。そして、消失点情報推定部14は、決定した垂直方向の消失点の方向を示す垂直方向消失点情報を生成し、出力する(448)。
farVPDist=max(‖vpCH‖,‖vpCV‖)
に従って、第2の焦点距離評価値farVPDistを求める。
ここで、‖ ‖はノルム演算子を示しており、例えばL2ノルムが用いられる。
vptest=vpCH・vpCV
で示される。「・」はベクトルの内積を示しており、vpCHは、画像の光学中心から水平方向の消失点へのベクトル、vpCVは、画像の光学中心から垂直方向の消失点へのベクトルを示している。
estF=(#vp=2)and(vptest<0)and(FOV>thFOV)and(farVPDist<thVPDist)
ここで、thFOVは、視野に関する閾値(視野閾値)であり、thVPDistは最大距離閾値であり、estFは焦点距離の信頼性を示すブーリアン(Boolean)型の値である。閾値は、例えば、thFOV=20°であり、thVPDist=5×104 である。
#vp1=2 and (vpAngle1<80° or vpAngle1>110°)
また、補正方法決定部18は、領域成長方法により決定された文書着目領域に基づく補正方法H2に対応するcorrectionAngle2が角度閾値θmaxよりも大きく、かつ、補正方法H2に対応する重なり度overlap2が重複閾値thcよりも小さい場合、補正方法H2を採用しない。この条件は、以下のように示される。
correctionAngle2>θmax かつ overlap2<thc
ここで、角度閾値θmaxは、信頼性があると見なされる最大補正角度であり、例えば40°である。thcは、文書着目領域の中に含まれるべきコーナーの最低パーセンテイジであり、例えばthc=98%である。このように、領域成長方法により出力される文書着目領域の形状が四角形に十分にマッチしない場合、補正方法H2は拒絶される。
以上のように、本発明の一態様に係る画像処理装置は、撮像装置により撮像された画像に対して幾何学的補正を行う画像処理装置であって、(a)撮像装置が矩形状の文書を撮像することにより得られた撮像文書画像を取得する撮像画像取得部と、(b)上記撮像文書画像における水平方向の消失点の位置または水平方向の消失点の方向を示す水平方向消失点情報を生成するとともに、上記撮像文書画像における垂直方向の消失点の位置または垂直水平方向の消失点の方向を示す垂直方向消失点情報を生成する消失点情報生成部(消失点情報推定部14)と、(c)上記撮像文書画像におけるコーナーを検出するコーナー検出部と、(d)(1)上記水平方向消失点情報が水平方向の消失点の位置を示す場合、当該水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、上記水平方向消失点情報が水平方向の消失点の方向を示す場合、当該水平方向の消失点の方向に平行な2つの線分を上辺および下辺とし、(2)上記垂直方向消失点情報が垂直方向の消失点の位置を示す場合、当該垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、上記垂直方向消失点情報が垂直方向の消失点の方向を示す場合、当該垂直方向の消失点の方向に平行な2つの線分を左辺および右辺とし、(3)上記コーナー検出部により検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部と、(e)上記輪郭四角形の信頼性を示す第1の評価値を算出する幾何学的補正評価部と、(f)上記第1の評価値を基に、上記輪郭四角形に基づいた第1補正方法により幾何学的補正を行うか否かを決定する補正方法決定部と、(g)上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部と、(h)上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形と上記第1画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行う補正処理部とを備えている。
11 撮像画像取得部
12 エッジ検出部
13 直線構造抽出部
14 消失点情報推定部
15 コーナー検出部
16 輪郭決定部
17 幾何学的補正評価部
18 補正方法決定部
19 画像サイズ決定部
20 補正処理部
100 画像補正処理
104 推定処理
1104 前景除去処理
1106 エッジ検出処理
1108 テキスト特徴算出処理
1112 不均一性低減処理
1116 2値化処理
1128 着目領域補正処理
500 輪郭四角形
606 画像面
610 文書面
LH 水平方向のライングループ
LV 垂直方向のライングループ
O 画像中心(基準点)
Claims (8)
- 撮像装置により撮像された画像に対して幾何学的補正を行う画像処理装置であって、
撮像装置が矩形状の文書を撮像することにより得られた撮像文書画像を取得する撮像画像取得部と、
上記撮像文書画像における水平方向の消失点の位置または水平方向の消失点の方向を示す水平方向消失点情報を生成するとともに、上記撮像文書画像における垂直方向の消失点の位置または垂直水平方向の消失点の方向を示す垂直方向消失点情報を生成する消失点情報生成部と、
上記撮像文書画像におけるコーナーを検出するコーナー検出部と、
(1)上記水平方向消失点情報が水平方向の消失点の位置を示す場合、当該水平方向の消失点の位置に集まる2つの線分を上辺および下辺とし、上記水平方向消失点情報が水平方向の消失点の方向を示す場合、当該水平方向の消失点の方向に平行な2つの線分を上辺および下辺とし、(2)上記垂直方向消失点情報が垂直方向の消失点の位置を示す場合、当該垂直方向の消失点の位置に集まる2つの線分を左辺および右辺とし、上記垂直方向消失点情報が垂直方向の消失点の方向を示す場合、当該垂直方向の消失点の方向に平行な2つの線分を左辺および右辺とし、(3)上記コーナー検出部により検出されたコーナーを囲む四角形の輪郭を輪郭四角形として決定する輪郭決定部と、
上記輪郭四角形の信頼性を示す第1の評価値を算出する幾何学的補正評価部と、
上記第1の評価値を基に、上記輪郭四角形に基づいた第1補正方法により幾何学的補正を行うか否かを決定する補正方法決定部と、
上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形に基づいて、幾何学的補正後の第1画像サイズを決定する画像サイズ決定部と、
上記補正方法決定部が第1補正方法による幾何学的補正を行うと決定した場合に、上記輪郭四角形と上記第1画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行う補正処理部とを備えたことを特徴とする画像処理装置。 - 上記輪郭決定部は、(1)撮像文書画像の前景成分を除去して前景除去画像を生成し、上記前景除去画像における不均一性を低減して再構成画像を生成し、(2)上記再構成画像に2値化処理を施すことにより第1文書着目領域候補マスクを生成し、(3)上記撮像文書画像におけるエッジ部を示すエッジマスクと上記第1文書着目領域候補マスクとを結合して第2文書着目領域候補マスクを生成し、(4)上記撮像文書画像から算出されるテキストの特徴点に基づいて上記第2文書着目領域候補マスクを補正することにより最終文書着目領域を特定し、
上記幾何学的補正評価部は、上記最終文書着目領域の信頼性を示す第2の評価値を算出し、
上記補正方法決定部は、上記第1の評価値および第2の評価値に基づいて、上記第1補正方法により幾何学的補正を行うか、上記最終文書着目領域に基づいた第2補正方法により幾何学的補正を行うか決定し、
上記画像サイズ決定部は、上記補正方法決定部が第2補正方法を選択した場合に、最終文書着目領域に基づいて、幾何学的補正後の第2画像サイズを決定し、
上記補正処理部は、上記補正方法決定部が第2補正方法を選択した場合に、上記最終文書着目領域と上記第2画像サイズとに基づいて上記撮像文書画像に対して幾何学的補正を行うことを特徴とする請求項1に記載の画像処理装置。 - 上記補正方法決定部は、(1)上記第2の評価値が予め設定された第1条件を満たす場合に、上記第2補正方法を幾何学的補正の方法として決定し、(2)上記第2の評価値が上記第1条件を満たさず、かつ、上記第1の評価値が予め設定された第2条件を満たす場合に、上記第1補正方法を幾何学的補正の方法として決定し、(3)上記第2の評価値が上記の第1条件を満たさず、かつ、上記第1の評価値が上記第2条件を満たさない場合に、幾何学的補正を行わないものと決定し、
上記補正処理部は、上記補正方法決定部が幾何学的補正を行わないと決定した場合、撮像文書画像に対して幾何学的補正を行わないことを特徴とする請求項2に記載の画像処理装置。 - 上記撮像文書画像におけるエッジ部を示すエッジマスクを生成するエッジ検出部と、
上記エッジマスクから複数の直線構造を抽出し、当該複数の直線構造を水平方向のライングループと垂直方向のライングループとにグループ分けする直線構造抽出部とを備え、
上記消失点情報生成部は、(1)上記水平方向のライングループに属する各直線構造について陰関数形式の複数の係数を求め、(2)上記水平方向のライングループに属する直線構造間の最大距離を示す水平方向ベースライン量を算出し、(3)上記水平方向のライングループに属する直線構造の数が2よりも大きい場合に、上記水平方向のライングループに属する各直線構造に対応する上記複数の係数を連結した係数行列を生成し、当該係数行列に特異値分解を適用して、複数の固有ベクトルおよび固有値を決定し、(4)上記複数の固有値のうちの最大値に対する最小値の割合を示す第1固有値割合を算出し、(5)上記水平方向ベースライン量が予め設定されたベースライン閾値よりも大きく、かつ、上記第1固有値割合が予め設定された平行度閾値よりも小さい場合に、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて水平方向の消失点の位置を求め、当該水平方向の消失点の位置を示す水平方向消失点情報を生成することを特徴とする請求項1から3の何れか1項に記載の画像処理装置。 - 上記消失点情報生成部は、(1)上記水平方向のライングループに属する2つの直線構造について、一方の直線構造と上記撮像文書画像の中心を通る垂直方向のラインである垂直ラインとの第1交点を決定するとともに、他方の直線構造と上記垂直ラインとの第2交点を決定し、上記第1交点と第2交点との距離を算出し、(2)上記水平方向のライングループに属する2つの直線構造の全ての組合せについて求めた上記第1交点と第2交点との距離のうちの最大値を水平方向ベースライン量として設定することを特徴とする請求項4に記載の画像処理装置。
- 上記消失点情報生成部は、(1)上記垂直方向のライングループに属する各直線構造について陰関数形式の複数の係数を求め、(2)上記垂直方向のライングループに属する直線構造間の最大距離を示す垂直方向ベースライン量を算出し、(3)上記垂直方向のライングループに属する直線構造の数が2よりも大きい場合に、上記垂直方向のライングループに属する各直線構造に対応する上記複数の係数を連結した係数行列を生成し、当該係数行列に特異値分解を適用して、複数の固有ベクトルおよび固有値を決定し、(4)上記複数の固有値のうちの最大値に対する最小値の割合を示す第2固有値割合を算出し、(5)上記垂直方向ベースライン量が予め設定されたベースライン閾値よりも大きく、かつ、上記第2固有値割合が予め設定された平行度閾値よりも小さい場合に、上記複数の固有値のうちの最小値に対応する固有ベクトルを用いて垂直方向の消失点の位置を求め、当該垂直方向の消失点の位置を示す垂直方向消失点情報を生成することを特徴とする請求項4または5に記載の画像処理装置。
- 上記消失点情報生成部は、(1)上記垂直方向のライングループに属する2つの直線構造について、一方の直線構造と上記撮像文書画像の中心を通る水平方向のラインである水平ラインとの第3交点を決定するとともに、他方の直線構造と上記水平ラインとの第4交点を決定し、上記第3交点と第4交点との距離を算出し、(2)上記垂直方向のライングループに属する2つの直線構造の全ての組合せについて求めた上記第3交点と第4交点との距離のうちの最大値を垂直方向ベースライン量として設定することを特徴とする請求項6に記載の画像処理装置。
- 上記第1の評価値は、消失点の数、焦点距離の信頼度、基準点および水平方向の消失点を通る直線と基準点および垂直方向の消失点を通る直線とのなす角度、検出されたコーナーと輪郭四角形との重なり度、および、推定される文書面の法線に対する撮像装置の光軸との角度である補正角度から選択される少なくとも1つであることを特徴とする請求項1から7の何れか1項に記載の画像処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/275,256 US9390342B2 (en) | 2011-10-17 | 2011-10-17 | Methods, systems and apparatus for correcting perspective distortion in a document image |
US13/275,256 | 2011-10-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013089234A true JP2013089234A (ja) | 2013-05-13 |
JP5542889B2 JP5542889B2 (ja) | 2014-07-09 |
Family
ID=48086035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012219840A Active JP5542889B2 (ja) | 2011-10-17 | 2012-10-01 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9390342B2 (ja) |
JP (1) | JP5542889B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016225671A (ja) * | 2015-05-27 | 2016-12-28 | 京セラドキュメントソリューションズ株式会社 | 撮像装置および画像形成装置 |
US9984435B2 (en) | 2014-09-05 | 2018-05-29 | Samsung Electronics Co., Ltd. | Digital image processing method, non-transitory computer-readable recording medium having recorded thereon a program for executing the digital image processing method, and digital image processing apparatus |
KR20180059108A (ko) * | 2016-11-25 | 2018-06-04 | 한국전자통신연구원 | 영상 보정 장치 및 방법 |
JP2019510223A (ja) * | 2016-03-18 | 2019-04-11 | ライブニッツ−インスティトゥート ヒュア フォトニッシェ テクノロジエン エーファオ | 概観画像をセグメント化することにより分散オブジェクトを検査するための方法 |
KR20210041241A (ko) * | 2019-10-07 | 2021-04-15 | 계명대학교 산학협력단 | 가변 시점에서 촬영된 카메라 왜곡 보정 방법 및 이를 이용한 블록 3차원 모델링 방법 |
KR102279259B1 (ko) * | 2020-01-17 | 2021-07-20 | 네이버 주식회사 | 영상왜곡보정방법 및 이를 이용하는 객체수집방법 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5871571B2 (ja) | 2011-11-11 | 2016-03-01 | 株式会社Pfu | 画像処理装置、矩形検出方法及びコンピュータプログラム |
JP5854774B2 (ja) | 2011-11-11 | 2016-02-09 | 株式会社Pfu | 画像処理装置、直線検出方法及びコンピュータプログラム |
JP5822664B2 (ja) * | 2011-11-11 | 2015-11-24 | 株式会社Pfu | 画像処理装置、直線検出方法及びコンピュータプログラム |
US9064309B2 (en) | 2013-10-29 | 2015-06-23 | Google Inc. | Automatic rectification of distortions in images |
US9915857B2 (en) * | 2013-12-09 | 2018-03-13 | Geo Semiconductor Inc. | System and method for automated test-pattern-free projection calibration |
US8811751B1 (en) * | 2013-12-20 | 2014-08-19 | I.R.I.S. | Method and system for correcting projective distortions with elimination steps on multiple levels |
US8913836B1 (en) * | 2013-12-20 | 2014-12-16 | I.R.I.S. | Method and system for correcting projective distortions using eigenpoints |
JP6369078B2 (ja) * | 2014-03-20 | 2018-08-08 | 富士通株式会社 | 画像補正装置、画像補正方法及び画像補正用コンピュータプログラム |
US9524445B2 (en) * | 2015-02-27 | 2016-12-20 | Sharp Laboratories Of America, Inc. | Methods and systems for suppressing non-document-boundary contours in an image |
JP6676299B2 (ja) | 2015-07-21 | 2020-04-08 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
US10354364B2 (en) | 2015-09-14 | 2019-07-16 | Intel Corporation | Automatic perspective control using vanishing points |
US10809895B2 (en) * | 2016-03-11 | 2020-10-20 | Fuji Xerox Co., Ltd. | Capturing documents from screens for archival, search, annotation, and sharing |
RU2631765C1 (ru) | 2016-04-26 | 2017-09-26 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот |
US10503997B2 (en) | 2016-06-22 | 2019-12-10 | Abbyy Production Llc | Method and subsystem for identifying document subimages within digital images |
US10650526B2 (en) * | 2016-06-28 | 2020-05-12 | Canon Kabushiki Kaisha | Image processing apparatus, image capturing apparatus, image processing method, and storage medium |
JP6986854B2 (ja) * | 2016-06-28 | 2021-12-22 | キヤノン株式会社 | 画像処理装置、撮像装置、画像処理方法、及びプログラム |
US10366469B2 (en) | 2016-06-28 | 2019-07-30 | Abbyy Production Llc | Method and system that efficiently prepares text images for optical-character recognition |
RU2628266C1 (ru) * | 2016-07-15 | 2017-08-15 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и система подготовки содержащих текст изображений к оптическому распознаванию символов |
CN108230394A (zh) * | 2016-12-14 | 2018-06-29 | 中南大学 | 一种轨道图像自动校正方法 |
US10719937B2 (en) * | 2017-12-22 | 2020-07-21 | ABYY Production LLC | Automated detection and trimming of an ambiguous contour of a document in an image |
WO2019231462A1 (en) * | 2018-06-01 | 2019-12-05 | Hewlett-Packard Development Company, L.P. | Substantially real-time correction of perspective distortion |
US10331966B1 (en) * | 2018-10-19 | 2019-06-25 | Capital One Services, Llc | Image processing to detect a rectangular object |
US11341605B1 (en) * | 2019-09-30 | 2022-05-24 | Amazon Technologies, Inc. | Document rectification via homography recovery using machine learning |
CN113255413B (zh) * | 2020-02-13 | 2024-04-05 | 北京小米松果电子有限公司 | 确定文档边框的方法、装置及介质 |
CN111832558A (zh) * | 2020-06-15 | 2020-10-27 | 北京三快在线科技有限公司 | 文字图像矫正方法、装置、存储介质及电子设备 |
CN111899303B (zh) * | 2020-07-14 | 2021-07-13 | 中国人民解放军63920部队 | 一种新的考虑空间逆投影约束的特征匹配与相对定位方法 |
CN113096051B (zh) * | 2021-04-30 | 2023-08-15 | 上海零眸智能科技有限公司 | 一种基于消失点检测的图矫正方法 |
CN114255337A (zh) * | 2021-11-03 | 2022-03-29 | 北京百度网讯科技有限公司 | 文档图像的矫正方法、装置、电子设备及存储介质 |
CN114973292B (zh) * | 2022-07-29 | 2022-11-15 | 山东矩阵软件工程股份有限公司 | 一种基于不规则表面的文字识别方法、系统及存储介质 |
CN115482538B (zh) * | 2022-11-15 | 2023-04-18 | 上海安维尔信息科技股份有限公司 | 一种基于Mask R-CNN的物料标号提取方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000013612A (ja) * | 1998-06-18 | 2000-01-14 | Minolta Co Ltd | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 |
JP2007058634A (ja) * | 2005-08-25 | 2007-03-08 | Ricoh Co Ltd | 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体 |
JP2009043265A (ja) * | 2007-08-09 | 2009-02-26 | Fujitsu Ltd | 字幕領域抽出装置、字幕領域抽出方法および字幕領域抽出プログラム |
JP2010171976A (ja) * | 2009-01-22 | 2010-08-05 | Canon Inc | 歪み文書画像を補正する方法及びシステム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5528290A (en) | 1994-09-09 | 1996-06-18 | Xerox Corporation | Device for transcribing images on a board using a camera based board scanner |
JPH08237407A (ja) | 1994-12-09 | 1996-09-13 | Xerox Corp | 画像タイルの相対的なアラインメントを見当合わせすると共に透視歪みを修正するための方法 |
JP3631576B2 (ja) | 1997-01-27 | 2005-03-23 | コニカミノルタフォトイメージング株式会社 | デジタルカメラ |
JPH10210355A (ja) | 1997-01-27 | 1998-08-07 | Minolta Co Ltd | デジタルカメラ |
JPH11232378A (ja) | 1997-12-09 | 1999-08-27 | Canon Inc | デジタルカメラ、そのデジタルカメラを用いた文書処理システム、コンピュータ可読の記憶媒体、及び、プログラムコード送出装置 |
TW468331B (en) | 1998-09-30 | 2001-12-11 | Hitachi Ltd | Non-contact image reading device and the system using the same |
JP2000200344A (ja) | 1999-01-04 | 2000-07-18 | Minolta Co Ltd | 画像処理装置および画像処理プログラムを記録した記録媒体 |
US6493469B1 (en) | 1999-06-28 | 2002-12-10 | Xerox Corporation | Dual video camera system for scanning hardcopy documents |
JP2002074351A (ja) | 2000-08-30 | 2002-03-15 | Minolta Co Ltd | 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6975352B2 (en) | 2000-12-18 | 2005-12-13 | Xerox Corporation | Apparatus and method for capturing a composite digital image with regions of varied focus and magnification |
GB0104664D0 (en) | 2001-02-23 | 2001-04-11 | Hewlett Packard Co | Improvements relating to document capture |
US7224392B2 (en) | 2002-01-17 | 2007-05-29 | Eastman Kodak Company | Electronic imaging system having a sensor for correcting perspective projection distortion |
US7593595B2 (en) | 2004-08-26 | 2009-09-22 | Compulink Management Center, Inc. | Photographic document imaging system |
US20070024714A1 (en) | 2005-07-29 | 2007-02-01 | Sam Kim | Whiteboard camera apparatus and methods |
US7978900B2 (en) | 2008-01-18 | 2011-07-12 | Mitek Systems, Inc. | Systems for mobile image capture and processing of checks |
US8345106B2 (en) | 2009-09-23 | 2013-01-01 | Microsoft Corporation | Camera-based scanning |
-
2011
- 2011-10-17 US US13/275,256 patent/US9390342B2/en not_active Expired - Fee Related
-
2012
- 2012-10-01 JP JP2012219840A patent/JP5542889B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000013612A (ja) * | 1998-06-18 | 2000-01-14 | Minolta Co Ltd | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 |
JP2007058634A (ja) * | 2005-08-25 | 2007-03-08 | Ricoh Co Ltd | 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体 |
JP2009043265A (ja) * | 2007-08-09 | 2009-02-26 | Fujitsu Ltd | 字幕領域抽出装置、字幕領域抽出方法および字幕領域抽出プログラム |
JP2010171976A (ja) * | 2009-01-22 | 2010-08-05 | Canon Inc | 歪み文書画像を補正する方法及びシステム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9984435B2 (en) | 2014-09-05 | 2018-05-29 | Samsung Electronics Co., Ltd. | Digital image processing method, non-transitory computer-readable recording medium having recorded thereon a program for executing the digital image processing method, and digital image processing apparatus |
JP2016225671A (ja) * | 2015-05-27 | 2016-12-28 | 京セラドキュメントソリューションズ株式会社 | 撮像装置および画像形成装置 |
JP2019510223A (ja) * | 2016-03-18 | 2019-04-11 | ライブニッツ−インスティトゥート ヒュア フォトニッシェ テクノロジエン エーファオ | 概観画像をセグメント化することにより分散オブジェクトを検査するための方法 |
KR20180059108A (ko) * | 2016-11-25 | 2018-06-04 | 한국전자통신연구원 | 영상 보정 장치 및 방법 |
KR102002531B1 (ko) * | 2016-11-25 | 2019-07-22 | 한국전자통신연구원 | 영상 보정 장치 및 방법 |
KR20210041241A (ko) * | 2019-10-07 | 2021-04-15 | 계명대학교 산학협력단 | 가변 시점에서 촬영된 카메라 왜곡 보정 방법 및 이를 이용한 블록 3차원 모델링 방법 |
KR102267442B1 (ko) * | 2019-10-07 | 2021-06-22 | 계명대학교 산학협력단 | 가변 시점에서 촬영된 카메라 왜곡 보정 방법 및 이를 이용한 블록 3차원 모델링 방법 |
KR102279259B1 (ko) * | 2020-01-17 | 2021-07-20 | 네이버 주식회사 | 영상왜곡보정방법 및 이를 이용하는 객체수집방법 |
Also Published As
Publication number | Publication date |
---|---|
US20130094764A1 (en) | 2013-04-18 |
JP5542889B2 (ja) | 2014-07-09 |
US9390342B2 (en) | 2016-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5542889B2 (ja) | 画像処理装置 | |
JP5699788B2 (ja) | スクリーン領域検知方法及びシステム | |
US8463029B2 (en) | Face and head detection | |
US8811751B1 (en) | Method and system for correcting projective distortions with elimination steps on multiple levels | |
US8897600B1 (en) | Method and system for determining vanishing point candidates for projective correction | |
KR20130030220A (ko) | 고속 장애물 검출 | |
US10586321B2 (en) | Automatic detection, counting, and measurement of lumber boards using a handheld device | |
US8548247B2 (en) | Image processing apparatus and method, and program | |
JP5538868B2 (ja) | 画像処理装置、その画像処理方法及びプログラム | |
CN103119609B (zh) | 一种确定视频前景主体图像区域的方法和装置 | |
KR20150117646A (ko) | 적어도 하나의 추가적인 이미지를 사용한 이미지 향상과 에지 검증을 위한 방법 및 장치 | |
JP5301694B2 (ja) | 画像処理装置、画像処理方法、プログラムおよびその記録媒体 | |
Krishnan et al. | A survey on different edge detection techniques for image segmentation | |
CN110268442B (zh) | 在图像中检测背景物上的外来物的计算机实现的方法、在图像中检测背景物上的外来物的设备以及计算机程序产品 | |
US8913836B1 (en) | Method and system for correcting projective distortions using eigenpoints | |
JP2012048484A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5437414B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP7518433B2 (ja) | 角度計測装置、角度計測方法、角度計測プログラム | |
US11216905B2 (en) | Automatic detection, counting, and measurement of lumber boards using a handheld device | |
JP2013037539A (ja) | 画像特徴量抽出装置およびそのプログラム | |
KR101792564B1 (ko) | 영상 처리 방법 및 이를 이용한 영상 처리 장치 | |
WO2015092059A1 (en) | Method and system for correcting projective distortions. | |
JP2013080389A (ja) | 消失点推定方法、消失点推定装置及びコンピュータプログラム | |
Fang et al. | 1-D barcode localization in complex background | |
JP2013011950A (ja) | 画像処理装置、画像処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140408 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5542889 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |