JP4859061B2 - 画像の補正方法、補正プログラムおよび画像歪み補正装置 - Google Patents
画像の補正方法、補正プログラムおよび画像歪み補正装置 Download PDFInfo
- Publication number
- JP4859061B2 JP4859061B2 JP2007169502A JP2007169502A JP4859061B2 JP 4859061 B2 JP4859061 B2 JP 4859061B2 JP 2007169502 A JP2007169502 A JP 2007169502A JP 2007169502 A JP2007169502 A JP 2007169502A JP 4859061 B2 JP4859061 B2 JP 4859061B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- deformation
- local pattern
- local
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 98
- 238000012937 correction Methods 0.000 title claims description 52
- 238000003702 image correction Methods 0.000 title description 4
- 230000009466 transformation Effects 0.000 claims description 40
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 6
- 238000000844 transformation Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Description
一方、カメラによって取得された文書画像の場合、その画像中の文字が受けている幾何変形はより多様で複雑なものになる(例えば、非特許文献1参照)。例えば、カメラと紙面が正対していないことによる射影変換歪み、紙面自体が平面になっていないことによる非線形な歪みが生じうる。これらの歪みの補正法はdewarpingと呼ばれており、カメラベース文字認識の隆盛と共に、現在活発に研究されている。
(3)は、複数のカメラ(例えば、非特許文献6参照)もしくは動画(例えば、非特許文献7参照)を用いて3次元形状を復元する方法である。
また、(2)の方法は、文書のレイアウトに強い仮定を課しているため、適用範囲が限定される点に課題がある。特殊なレイアウトのページにはまず適用不可能であり、レイアウトが一般的であっても文書中に図や数式を多く含むページでは文字行の両端の推定は容易でないからである。
(3)の方法は、一台のスチルカメラを用いて撮影された画像を対象とするものではなく、この発明とは用いる装置の数や種類が異なる。
また、この発明の補正方法を用いて文書画像のスキュー補正を行えば、文字が直線的な部分形状と並びを持つという、従来一般に利用されてきた仮定が成り立たない場合でも、回転角度を精度よく補正することが可能となる。即ち、文書画像における局所パターンとしての文字が直線状に並んでいなくても、またひらがなのように曲線の多い文字が支配的な場合でも、回転角度を精度よく推定することができる。
この発明による補正方法および補正プログラムにおいて、前記幾何学的変形は、射影変換、アフィン変換もしくは相似変換であってもよい。
あるいは、前記変量は局所パターンの黒画素部分の面積であってもよい。
ここで、凸包とは、あるパターン(ここでは、局所パターン)を包含する凸多角形のうち最小面積のものをいう。凸多角形とは、頂部の内角がすべて180度未満の多角形をいう。
の関係を満たす局所パターンからなっていてもよい。
具体的には、例えば、「変量」として連結成分の面積、「不変量」として面積の比を用いる。これらの値はどのような文書からも計算できる基本的な量であり、簡便に計算できるため、他の手法のように文書の長方形の枠が完全に写っていることや、文書中の文字が直線上に並んでいるなどのレイアウトに関する強い制約を課さない。そのため、図15に示す特異なレイアウトの文書を始め、幅広い対象に適用することが可能である
≪実施の形態1≫
この実施形態では、まず、この発明の手法を文書画像のスキュー補正に適用する場合を例としてその手順を説明する。なお、補正の結果の定量的・定性的な説明は、実験例1に後述する。
ここでは、変量と不変量の組み合わせによる幾何変形推定の方法について述べる。前述のように、幾何変形のうち回転を例にとって説明する。また、補正の対象についても文書画像に限定して論ずる。この発明の補正方法を用いて文書画像のスキュー補正を行えば、文字が直線的な部分形状と並びを持つという、従来一般に利用されてきた仮定が成り立たない場合でも、回転角度を精度よく補正することが可能となる。即ち、文書画像における局所パターンとしての文字が直線状に並んでいなくても、またひらがなのように曲線の多い文字が支配的な場合でも、回転角度を精度よく推定することができる。
まず、文書画像内に存在しうる文字カテゴリについて、標準パターンを準備する。前述のように、この標準パターンのすべての回転画像を事例として登録しておけば、それらすべてと入力文書画像中の各文字(連結成分)を比較照合し、最も照合した回転標準パターン画像の角度から、文書画像の回転角を推定できる。この力づくの単純方式は、非常に明確ではあるが、明らかに効率が悪い。
各カテゴリcの標準パターンを少しずつ回転させながら変量pを測定する。これを回転角θと変量pの関係p=pc(θ)として保存しておく。一種の学習ステップであり、事例の収集段階でもある。カテゴリ集合については、英文書画像の場合、"A"〜"Z"、"a"〜"z"である。
入力文書画像中の(傾いた)文字パターンxについて変量pxを求める。そのカテゴリをcとすれば、px=pc(θ)を満たすθが、入力文書画像の回転角の候補になる。このθを求めるのは、1次元関数pc(θ)の逆引きテーブルを作っておけばよく、O(1)の少ない計算量で済む。
このように回転変量を使えば、非常に容易に傾き推定が可能になる。以下では、カテゴリcの推定法、推定ステップの詳細、ならびに実際に用いる変量と不変量について述べる。
前節では、各文字のカテゴリcがわかっていることを仮定していた。しかし、傾き補正以前の段階でカテゴリcを知ることができるならば、そもそも傾き補正の不要な状況であろう。このため、不確かながら、事例を参照するためのカテゴリの確定が必要になる。
そこで、各文字(連結成分)のカテゴリcを、画像情報から計算される回転不変量qを用いて、回転変形に対してロバストに(安定して確実に)推定することを考える。具体的には、各カテゴリcの標準パターンについて、その回転不変量qcを求めておく。そうして、入力文字xのカテゴリを推定する際は、その文字から回転不変量qxを求め、qx=qcとなるcを求める。文書画像の回転についてqxは不変であるから、原理的には正しいcが求められる。
以上の推定ステップで「候補」という言葉が用いられていることからもわかるように、1文字だけではθを一意に決めることは困難である。これは次の理由による。
第二に、回転角θを変えても変量pがあまり変化しないような場合(関数pc(θ)が平坦になる場合)、変量pの測定誤差にθが鋭敏に反応し、推定値θの信頼性が低くなる。
第三に、前述したように推定されるカテゴリcが複数存在する点である。結局、これら複数のcについて、前節の推定ステップを駆動する他なく、結局複数の回転角の候補が与えられることになる。
ステップ1:まず、入力文書画像中の文字パターンxについて変量px、不変量qxを計算する。
ステップ2:算出されたqxに基づき、
ステップ3:px=pc(θ)となる角度、θ1, θ2, θ3にそれぞれ投票する。図1の場合、θ2が2つあるので2回投票する。このような処理を文書画像中の全ての連結成分に対して行い、最も投票数の多かったものをその文書の回転角とする。
以上のステップで画像の回転角度(傾き)が推定できたならば、その推定結果に応じて対象の文書画像を補正する。つまり、傾きがゼロになるように画像を回転させる。
この発明では、回転に対する任意の変量と不変量を用いてもよいが、この発明では最も単純なものを用いる。具体的には、変量pとして、文書画像中の1連結成分を回転させることにより変化する値、具体的には外接矩形の面積(図3(a))を用いる。また、不変量qとして、回転させても変化しない値、具体的には凸包内の面積(図3(b))を用いる。図3は、文字「A」を例に、この実施形態における変量/不変量である文字の外接矩形の面積/凸包の面積を示す説明図である。ここで、これらの面積と黒画素の面積の比をとることによりこの変量と不変量を、画像中に占める連結成分の大きさに依らないようにしておく。すなわち、p,q共にスケール不変量としておく。
この実施形態では、文書画像の射影歪みをアフィン歪みに補正する場合を例としてその手順を説明する。なお、補正の結果の定量的・定性的な説明は、実験例2に後述する。
この実施形態の説明のために、最初にコンピュータビジョンにおける3次元座標と2次元座標の関係について述べ、その後この実施形態の詳細について述べる。
3次元空間の物体をカメラで対象の物体を撮影するとき、どのように2次元画像が得られるかを考える。図11は、ピンホールカメラをモデルとする座標系と、それを配置し直した座標系(コンピュータビジョンの技術分野で慣用される座標系)とを示す説明図である。
通常、カメラのモデルに図11(a)のようなピンホールカメラを用いる。点Cがピンホールで、物体11から来る光は全てピンホールを通り、画像平面Iに像を結ぶ。点Cを焦点と呼ぶ。また、画像平面Iと焦点Cの距離fを焦点距離、焦点Cを通り画像平面に垂直な直線を光軸と呼び、光軸と画像平面の交点を画像中心cとおく。このモデルでは平行な2線は必ずしも平行線に変換されない。このような変換を射影変換、射影変換による歪みを射影歪みと呼ぶ。また射影変換のうち、平行線を変換したとき平行線であるものをアフィン変換、アフィン変換を受けたときの歪みをアフィン歪みと呼ぶ。
文書画像中の各文字に注目すると、本来同じ字種であっても位置によって大きさが変化している。例えば、画像中からアルファベットのaのような特定の文字だけを取り出したときを考える。このとき、文字の黒画素の面積は射影歪みによって、カメラから近い方が大きく、遠い方が小さくなる。この面積の変化から文書の奥行き情報を求めることができるので、この実施形態ではこれを基に文書画像の補正を行う。
次に各文字の奥行きからカメラ座標系における紙面13の傾きを考える。式(1)よりj番目の文字の座標(Xj,Yj,Zj)Tは、
前記項目2.2で述べた、面積から奥行きを推定する方法は文書中に文字が一種類しか存在しない場合にのみ使用できる。しかし、実際の文書中には複数の字種が混在しているため、あらかじめ文字をその種類ごとに分けておく必要がある。字種を判別する方法として、文字認識が考えられるが、射影歪みを受けている場合は処理が難しい。また、ここでは字種を分類できればよく、文字認識のように文字にラベルを付ける必要はない。
(1) 面積比(面積)を計算する領域は射影変換を受けても同一でなければならない。
(2) 面積比は、字種を十分に判別できなくてはならない。
以上のようにクラスタリングを行うと、各クラスタにおいて前記項目2.2で述べた平面への当てはめを考えることができる。紙面の傾きを高精度に推定するためには同一字種が文書中で分散していることが望ましいが、このような状況は必ずしも期待できない。そこで、クラスタ(字種)毎に推定した紙面の傾き情報を統合することを考える。その際に問題になるのは黒画素の面積Sである。前記項目2.2の説明ではSが既知であるとしていたが、実際には未知であり、文字毎に異なる。そこで、それぞれの平面の傾きが等しくなるように、クラスタ毎の黒画素の面積の比も同時に推定することにする。以下でその詳細を述べるが、以降の説明では前記項目2.2におけるS,(Xj,Yj,Zj)T,Z'jにクラスタ番号iを付し、Si,(Xij,Yij,Zij)T,Z'ijとしてそれぞれ用いる。式(6)〜式(8)も同様である。
まず、式(8)は式(6)を利用して、
ただし、平面への当てはめを行う際にはノイズ(外れ値)の影響を考慮する必要がある。ノイズの原因としては、画像中から文字を抽出する際の画像処理の失敗やクラスタリングにおける誤分類、更には2.3で述べた、文書中に同一字種で複数の大きさの文字が存在する場合が考えられる。これらのノイズに対応するために、この実施形態では2種類のノイズ除去を行う。
最後に画像中の紙面を回転して、正面に向ける。これは紙面の正面に視点を移すことと等価であるので、傾いた紙面の法線ベクトルを求め、これの延長上に視点を移すことを考える。回転表現には、任意の回転をZ軸周りの回転φ,Y軸周りの回転θ,X軸周りの回転psiの3段階の回転で表すロール・ピッチ・ヨー型の回転変換を利用する。ロール・ピッチ・ヨーを用いた回転行列Rは次式で表される。
以下、回転後の2次元画像を求める。カメラ座標系の点(Xij,Yij,Zij)Tを回転して得られる点を
以上、回転に対する補正および射影歪みからアフィン歪みへの補正を例にとって説明したが、これは他の幾何変形の推定とそれに基づく補正にも応用できる。すなわち、補正したい幾何学的変形の変量と不変量を組み合わせることにより、様々な幾何変形の程度を推定できる。例えば、アフィン変換に対する不変量(当然平行移動・スケール変換・回転にも不変)と、相似変換(平行移動・スケール変換・回転)に不変である量があるとすれば、これら2つの量を組み合わせることによりアフィン変換のうちせん断成分を推定できると考える。
以下の実験例1では、実施の形態1に対応した実験例について述べる。
3-1. 実験試料
スキュー推定の対象は、テキストベースの組版処理システムとして知られるLaTeXで作成された5種類の文書画像D1, D2, D3, D4およびD5である。それら文書の画像を図5に示す。大部分は事例と同じフォントから構成されるが、数式を含む文書もある。これら数式中のイタリックフォントや数学記号については対応する事例がなく、したがって誤推定の要因になりうる。それぞれの文書画像を±30°,±20°,±10°,±5°,±2°,0°で回転させて44個のテスト画像を生成した。図6はその例である。これらのテスト画像に対して左上から順に右下まで1連結成分(多くの場合、単文字)づつ投票を行うこととした。
44枚のテスト画像について傾きを推定した結果をまとめたものを表1に示す。表1のカッコ内の単位は%である。テスト画像の95%を誤差2.0°以下で推定することができた。
以上の原因を踏まえて誤差の大きくなった2サンプルについて考察する。テスト画像D3の傾き20°の場合の、入力x="e"における投票の様子は図9のようになっている。20°回転させた文字"e"の変量は同図のpxである。このpxに応じて投票される角度は、斜線部分では1つ、黒色部分では変量が重なっているために2つ投票される。その結果、投票してほしい20°近辺よりも、-11°から-12°に2倍近く投票されることになる。結果、正しい角度よりも誤った角度に多く投票されてしまったと考えられる。
次に、実施形態2の有効性を検証するために実験を行った。実験データには Canon EOS 5D で撮影した、サイズが4,368×2,912の画像を使用した。実験結果の定量評価は今後行うことにして、この実施形態では実験結果を目視で評価した。実施の形態2の手法は文書の枠を必要としないが、今回の実験では手法の効果がわかりやすいように、枠が写っている画像を選んだ。
不変量の組み合わせを考える上で、2文字のうち黒画素の面積が大きい方を「文字大」、面積が小さい方を「文字小」と呼ぶことにする。用いた5種類の不変量の組み合わせは、
図15は、この発明に係る射影歪みの補正の実験結果を示す説明図である。図15は、対象の画像1〜3、それらの画像の補正に用いたパラメータおよび画像1〜3の補正結果を示す。
補正結果について、まず未知である焦点距離をf=1としたときの結果を図15に「補正後(f=1)」として示す。理想的には文書の角の直角は復元されないものの、平行線は復元されるはずである。実験の結果、画像1の平行線はほぼ復元されるものの、画像2と画像3では若干の誤差が残った。この主な原因は、平面当てはめの際に外れ値が影響し、パラメータの推定に誤差が生じたことである。
実験例2では、本来は長方形である物を平行四辺形に(射影歪みをアフィン歪み程度に)復元できる潜在能力を確認したが、本来の長方形を復元するまでには至っていない。この原因は推定した奥行き情報に定数倍の不確定性が残っていることと、平面の当てはめに誤差が生じていることによる。前者は実施形態2で用いたのとは別の「変量」と「不変量」を利用することで解決できると考えられ、後者はロバスト推定の導入やノイズ除去の精度向上によって解決可能であると思われる。なお、ここでいうロバスト推定とは、この技術分野の用語であって、パラメータの推定に用いるサンプルにその性質が他と異なるもの(いわゆる「外れ値」)が混じっている場合、その影響が極力排除されるような推定方法のことをいう。
図17は、この発明の画像歪み補正装置の機能的な構成を示すブロック図である。図17に示すように、この発明の装置は、分割部21、算出部23、分類部25、推定部27および補正部29を備えてなる。この装置を実現するハードウェアの一態様は、パーソナルコンピュータに、この発明の補正プログラムがインストールされたものである。パーソナルコンピュータのCPUがその補正プログラムを実行することによって各ブロックの機能が実現される。即ち、入力された画像を局所的なパターンである局所パターンに分割する処理を前記CPUが実行することによって分割部21の機能が実現される。各局所パターンについて、変形の程度によって値が略一定である不変量と変形の程度に応じて値が変化する変量とを所定の手順に基づいて算出する処理を前記CPUが実行することによって算出部23の機能が実現される。また、算出された不変量に基づいて各局所パターンを複数カテゴリの何れかに分類する処理を前記CPUが実行することによって分類部25の機能が実現される。さらに、各カテゴリの各局所パターンについて算出された変量に基づいてその局所パターンが受けた変形の程度を推定する処理を前記CPUが実行することによって推定部27の機能が実現される。さらにまた、推定結果に基づいて画像を補正する処理を前記CPUが実行することによって補正部29の機能が実現される。
13 紙面
21 分割部
23 算出部
25 分類部
27 推定部
29 補正部
C 焦点
D1, D2, D3, D4, D5 文書画像
I 画像平面
f 焦点距離
Claims (16)
- 幾何学的変形を受けた画像を入力とし、前記画像が受けた変形を補正する方法であって、
入力された画像を局所的なパターンである局所パターンに分割する工程と、
各局所パターンについて、変形の程度によって値が略一定である不変量と変形の程度に応じて値が変化する変量とを所定の手順に基づいて算出する算出工程と、
算出された不変量に基づいて各局所パターンを複数カテゴリの何れかに分類する工程と、各カテゴリの各局所パターンについて算出された変量に基づいてその局所パターンが受けた変形の程度を推定する推定工程と、
推定結果に基づいて画像を補正する工程とを備え、
各工程をコンピュータが実行することを特徴とする画像の補正方法。 - 前記幾何学的変形は、射影変換、アフィン変換もしくは相似変換である請求項1記載の方法。
- 前記画像は文書画像であり、少なくとも一部の前記局所パターンは文字パターンである請求項1または2に記載の方法。
- 前記幾何学的変形は回転であり、
前記変量は、前記局所パターンを回転させることにより変化する値であり、
前記不変量は、前記局所パターンを回転させても略一定の値である請求項1〜3の何れか一つに記載の方法。 - 前記幾何学的変形は射影変換であり、
前記変量は、奥行きにより変化する値であり、
前記不変量は、奥行きの変化に対して略一定の値である請求項1〜3の何れか一つに記載の方法。 - 前記変量は前記局所パターンに外接する矩形の面積である請求項1〜4のいずれか一つに記載の方法。
- 前記変量は前記局所パターンの黒画素部分の面積である請求項1、2、3および5のいずれか一つに記載の方法。
- 前記不変量は、前記局所パターンの凸包内の面積である請求項1〜5のいずれか一つに記載の方法。
- 前記局所パターンは画像中の連結成分として分割されるパターン、もしくは、そのパターンの集合である請求項1〜8のいずれか一つに記載の方法。
- 各カテゴリは、そのカテゴリに対する前記不変量をqc、各局所パターンの前記不変量をqxとするとき、
の関係を満たす前記局所パターンからなる請求項1〜9の何れか一つに記載の方法。 - 前記推定工程は、各局所パターンから算出される前記変量と各カテゴリに対応して予め記憶された基準値とを比較して前記局所パターン毎に変形の程度を仮推定し、仮推定された各結果を統計的に処理して変形の程度を推定する請求項1〜10の何れか一つに記載の方法。
- 前記基準値は、各カテゴリの標準パターンを段階的に変形させて前記変量を測定し、各段階の変形量と測定された前記変量とを対応付けて記憶されたものである請求項11記載の方法。
- 前記推定工程は、各局所パターンの位置とその局所パターンの前記変量との関係に基づいて変形の程度をカテゴリ別に仮推定し、仮推定された各結果を統計的に処理して変形の程度を推定する請求項1〜10の何れか一つに記載の方法。
- 入力された画像は文書画像であり、
前記幾何学的変形は射影変換であり、
前記変量は、局所パターンの黒画素部分の面積であり、
前記不変量は、局所パターンの凸包内の面積であり、
前記推定工程は、各局所パターンの黒画素部分の面積と前記黒画素部分の紙面上の位置との関係に基づいて前記文書画像の紙面の傾きの仮推定を行う請求項5に記載の方法。 - 幾何学的変形を受けた画像を入力としてその画像が受けた変形を補正するためのプログラムであって、
入力された画像を局所的なパターンである局所パターンに分割する処理と、
各局所パターンについて、変形の程度によって値が略一定である不変量と変形の程度に応じて値が変化する変量とを所定の手順に基づいて算出する算出処理と、
算出された不変量に基づいて各局所パターンを複数カテゴリの何れかに分類する処理と、各カテゴリの各局所パターンについて算出された変量に基づいてその局所パターンが受けた変形の程度を推定する推定処理と、
推定結果に基づいて画像を補正する処理とをコンピュータに実行させることを特徴とする画像の補正プログラム。 - 幾何学的変形を受けた画像を入力としてその画像が受けた変形を補正する装置であって、
入力された画像を局所的なパターンである局所パターンに分割する分割部と、
各局所パターンについて、変形の程度によって値が略一定である不変量と変形の程度に応じて値が変化する変量とを所定の手順に基づいて算出する算出部と、
算出された不変量に基づいて各局所パターンを複数カテゴリの何れかに分類する分類部と、
各カテゴリの各局所パターンについて算出された変量に基づいてその局所パターンが受けた変形の程度を推定する推定部と、
推定結果に基づいて画像を補正する補正部とを備えることを特徴とする画像歪み補正装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007169502A JP4859061B2 (ja) | 2007-03-07 | 2007-06-27 | 画像の補正方法、補正プログラムおよび画像歪み補正装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007057705 | 2007-03-07 | ||
JP2007057705 | 2007-03-07 | ||
JP2007169502A JP4859061B2 (ja) | 2007-03-07 | 2007-06-27 | 画像の補正方法、補正プログラムおよび画像歪み補正装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008252856A JP2008252856A (ja) | 2008-10-16 |
JP4859061B2 true JP4859061B2 (ja) | 2012-01-18 |
Family
ID=39977220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007169502A Expired - Fee Related JP4859061B2 (ja) | 2007-03-07 | 2007-06-27 | 画像の補正方法、補正プログラムおよび画像歪み補正装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4859061B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010092952A1 (ja) * | 2009-02-10 | 2010-08-19 | 公立大学法人大阪府立大学 | パターン認識装置 |
KR101190276B1 (ko) * | 2009-10-28 | 2012-10-12 | 주식회사 애트랩 | 입력 장치 및 이 장치의 접촉 위치 검출 방법 |
CN107704854A (zh) * | 2017-09-21 | 2018-02-16 | 苏州轩明视测控科技有限公司 | 一种基于光流场的印刷字符缺陷的检测方法 |
CN114175091A (zh) * | 2019-06-11 | 2022-03-11 | 伊美景象公司 | 利用基于上下文分割层的自适应去扭曲的最优身体或面部保护的方法 |
CN113554558A (zh) * | 2020-04-26 | 2021-10-26 | 北京金山数字娱乐科技有限公司 | 一种图像处理的方法和装置 |
CN116453131B (zh) * | 2023-06-15 | 2023-10-20 | 荣耀终端有限公司 | 文档图像矫正方法、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006080568A1 (ja) * | 2005-01-31 | 2006-08-03 | Nec Corporation | 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム |
-
2007
- 2007-06-27 JP JP2007169502A patent/JP4859061B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008252856A (ja) | 2008-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240048658A1 (en) | Content-based object detection, 3d reconstruction, and data extraction from digital images | |
CN108562274B (zh) | 一种基于标志器的非合作目标位姿测量方法 | |
Liang et al. | Geometric rectification of camera-captured document images | |
US11620733B2 (en) | Content-based object detection, 3D reconstruction, and data extraction from digital images | |
Tian et al. | Rectification and 3D reconstruction of curved document images | |
Liang et al. | Flattening curved documents in images | |
US8170368B2 (en) | Correcting device and method for perspective transformed document images | |
US10417489B2 (en) | Aligning grid lines of a table in an image of a filled-out paper form with grid lines of a reference table in an image of a template of the filled-out paper form | |
JP4859061B2 (ja) | 画像の補正方法、補正プログラムおよび画像歪み補正装置 | |
JP5468332B2 (ja) | 画像特徴点抽出方法 | |
Merino-Gracia et al. | Fast perspective recovery of text in natural scenes | |
Meng et al. | Exploiting vector fields for geometric rectification of distorted document images | |
Holtkamp et al. | Precision registration and mosaicking of multicamera images | |
Takezawa et al. | Robust perspective rectification of camera-captured document images | |
CN110288040B (zh) | 一种基于拓扑验证的图像相似评判方法及设备 | |
Koo et al. | State estimation in a document image and its application in text block identification and text line extraction | |
Bukhari et al. | Segmentation of curled textlines using active contours | |
JP2011107878A (ja) | 位置検出装置、位置検出方法 | |
CN109978829B (zh) | 一种待检测对象的检测方法及其系统 | |
Nachappa et al. | Adaptive dewarping of severely warped camera-captured document images based on document map generation | |
Shemiakina et al. | Fast projective image rectification for planar objects with Manhattan structure | |
CN113920525A (zh) | 文本矫正方法、装置、设备及存储介质 | |
Simon et al. | Generic document image dewarping by probabilistic discretization of vanishing points | |
Wu et al. | Towards fitting a 3D dense facial model to a 2D image: A landmark-free approach | |
Konishi et al. | Fast and precise template matching based on oriented gradients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111027 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |