JP2017500662A - 投影ひずみを補正するための方法及びシステム - Google Patents
投影ひずみを補正するための方法及びシステム Download PDFInfo
- Publication number
- JP2017500662A JP2017500662A JP2016541592A JP2016541592A JP2017500662A JP 2017500662 A JP2017500662 A JP 2017500662A JP 2016541592 A JP2016541592 A JP 2016541592A JP 2016541592 A JP2016541592 A JP 2016541592A JP 2017500662 A JP2017500662 A JP 2017500662A
- Authority
- JP
- Japan
- Prior art keywords
- text
- pixel
- image
- point
- vertical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
Abstract
Description
− グループの固有ポイントの間のポイント・ツー・ポイント距離が、第1の距離しきい値よりも下にある条件と、
− グループの各固有ポイントと、グループの固有ポイントによって形成されるラインとの間のポイント・ツー・ライン距離が、第2の距離しきい値よりも下にある条件と、
− グループの固有ポイントによって形成されるラインのオフ水平角度が、最大角度よりも下にある条件と、
− 固有ポイント・グループが、最小の数の固有ポイントを含んでいる条件と
のうちの少なくとも1つを満たすことができる。前記テキスト・ベースラインは、前記固有ポイント・グループに基づいて、推定されることもある。
− グループの固有ポイントの間のポイント・ツー・ポイント距離が、第1の距離しきい値よりも下にある条件と、
− グループの各固有ポイントと、グループの固有ポイントによって形成されるラインとの間のポイント・ツー・ライン距離が、第2の距離しきい値よりも下にある条件と、
− グループの固有ポイントによって形成されるラインのオフ水平角度が、最大角度よりも下にある条件と、
− 固有ポイント・グループが、最小の数の固有ポイントを含んでいる条件と
のうちの少なくとも1つを満たすことができる。前記テキスト・ベースラインは、次いで、前記固有ポイント・グループに基づいて、推定されることもある。
を使用して決定され、式中で、mと、sとは、それぞれ、ローカルな平均偏差と、標準偏差とであり、Rは、標準偏差の最大値であり、kは、しきい値の値を制御するパラメータである。パラメータkは、ドキュメント画像に応じて選択されることもある。一実施例においては、kは、手動で設定されることもある。別の実施例においては、パラメータkは、ドキュメント画像のテキスト特性に応じて自動的に設定されることもある。
であり、式中で、(vx,vy)は、消失ポイントであり、(w,h)は、ドキュメント画像の幅と、高さとであり、tx=w/2であり、ty=h/2であり、
である。投影行列を使用して、画像の投影補正が実行される。
を使用して推定されることもある。
によって規定される最小化問題の同等形態と考えられることもある。
を使用して実行されることもある。各固有ポイントに対する重み付けファクタは、重み付け関数、すなわち、
wi=exp(−disi)……[6]
を使用して割り当てられることもあり、式中で、disiは、固有ポイントと期待されたテキスト・ベースラインとの間の距離として規定される。したがって、固有ポイントが期待されたテキスト・ベースラインにより近い場合に、固有ポイントには、より高い重み付けファクタが割り当てられることもあり、逆もまた同様である。反復的プロシージャを使用して、期待されたテキスト・ベースラインのより近くに近づくことができる。実例の一実装形態においては、反復は、所定の数のラウンド(例えば、約10〜70ラウンド)にわたって、又は2つの逐次的ライン角度の間の差が小さなしきい値(例えば、約0.01度)よりも下になるまで実行されることもある。
として規定されることもあり、式中で、smaxと、sminとは、すべてのn個のライン・セグメントの最大標準偏差と、最小標準偏差とを表しており、lmaxは、すべてのn本のラインのうちの最長のライン・セグメントを表している。それゆえに、より長い水平テキスト・ベースラインには、より高い信頼度レベルが割り当てられる。これは、水平テキスト・ベースラインが長くなれば長くなるほど、水平テキスト・ベースラインの推定はよりよくなるという仮定に基づいている。同様に、標準偏差(対応する推定されたテキスト・ベースラインに対する固有ポイントの近接性を示す)が低くなれば低くなるほど、テキスト・ベースライン推定はよりよくなる。その結果として、そのようなテキスト・ベースラインには、より高い信頼度レベルが割り当てられる。所定のしきい値よりも上の信頼度レベルを有する、サンプル・ポイントの中のデータ・ポイントは、優先順位サンプル・アレイへとグループ分けされることもある。優先順位サンプル・アレイの中のデータ・ポイントは、いくつかのサンプル・グループへとクラスタ化されることもある。一実施例においては、各サンプル・グループは、2つ以上のデータ・ポイントを含むことができる。ライン推定では、精度はまた、ラインを推定するために使用されるデータ・ポイントの距離によって決定されることもある。2つのデータ・ポイントが互いに遠く離れている場合、そのときにはライン推定が正確になることになる、より高い信頼度が存在している。それゆえに、第2の信頼度レベル・インジケータが、サンプル・グループの中のポイント対に割り当てられることもあり、すなわち、
であり、式中で、Disj,kは、垂直方向におけるラインjとラインkとの間の距離であり、Dismaxは、ラインのm*(m−1)対のうちの最大の距離である。m(m<<n)本のラインの選択が、最良の信頼度レベルを有する第1のm本のラインを選択する優先順位サンプル・グループを定式化するために考慮されることもある。各サンプル・グループには、サンプル・グループの中の各データ・ポイントに割り当てられる、少なくとも信頼度レベルに基づいて、グループ信頼度値が割り当てられることもある。
によって測定されることもあり、式中で、nは、ドキュメント画像の中の水平ラインの数であり、αiは、投影補正が実行された後の水平方向に関するi番目のライン角度の角度として規定され(180°≧αi≧0°)、pは、m個の候補消失ポイントから選択されるp番目の候補水平消失ポイントのインデックスである。
ステップ1:マージン・ポイント特徴距離しきい値TEndthを設定し、識別される(ステップ402における)すべての左マージン・ポイントが、{Pi}として示され、
ステップ2:{Pi}からのランダムに選択された1つのポイントを用いて左マージン・ポイント・グループ{C1}を初期化し、このポイントを{Pi}から取り除き、グループ_インデックス=1を設定し、
ステップ3:{Pi}の中の各ポイントについて、このポイントと{Ci}の中のポイントとの間の最小距離を算出する(グループ_インデックス≧i≧1)。距離が、TEndthよりも低い場合、そのときには、このポイントは、最小距離に到達するポイント・グループに割り当てられ、そうでなければ、グループ・インデックスは、1だけ増大することになり、すなわち、グループ_インデックス=グループ_インデックス+1であり、このポイントは、最新の左マージン・ポイント・グループ:{Cグループ_インデックス}に割り当てられるであろう。
に対応している。
を使用して実施される可能性がある。
に従って、それを算出することができ、式中で、aと、bとは、楕円の長軸と、短軸とを表している。中国語やロシア語などの言語では、エッジ検出や数学的形態学フィルタリングなど、オプションの前処理プロシージャを使用して、ピクセル・ブロブの偏心度の特徴を強化することができる。0.97を有するピクセル・ブロブは、適切なフィルタを使用してフィルタをかけられることもある。画像の境界に対するピクセル・ブロブの近さは、推定のために使用されないこともある。一実施例においては、近接性フィルタリングを使用して、画像境界との交差を有するピクセル・ブロブを除去することができる。同様にして、一実施例においては、角度フィルタリングが実行されて、70度と、110度との内部にないテキスト・ストロークを有するピクセル・ブロブにフィルタをかけることができる。[0.3,5]*エリアmの範囲の中にエリアを有するピクセル・ブロブが選択されることもある。そのような範囲の内部のブロブを識別するために、堅牢な方法を使用して、上記で述べられた判断基準のフィルタリングの後に選択されるピクセル・ブロブのメジアン・エリアを推定することができる。そのエリア値が[0.3,5]*エリアmの範囲の中にあるピクセル・ブロブは、垂直消失ポイント推定のために使用される。図16は、テキスト・ストロークの特徴の識別の後に、選択的に抽出されたブロブを示す実例の画像を示すものである。
− 水平消失ポイントを推定するための固有ポイントの使用。一般に、これらのベースラインが、ほとんど、テキスト部分の中の複数の逐次的なキャラクタのために位置合わせされているので、位置決定ピクセルとして境界ボックスのベースラインの上のピクセルのうちの1つを使用することが好ましい。これらのうちでは、それらの固有ポイントは、それらが、標準の連結成分分析の副産物であり、それゆえに、追加の処理ステップが、各ピクセル・ブロブについてこれらを取得するために必要とされないので、好ましい。
− 固有ポイント選択プロシージャが、テキスト・ライン推定のために使用され得る固有ポイントを選択するために提案される。混同させる固有ポイントを除去し、クラスタ化すること、又はマージすることにより残りの固有ポイントをグループ分けする実施例が開示されている。さらに、固有ポイントのクラスタ化することの結果は、既に推定されたベースラインである。
− テキスト部分のベースラインの左エンド・ポイントと、右エンド・ポイントとが、マージン・ライン推定のためのマージン特徴ポイントとして使用される。左及び右のエンド・ポイント・クラスタ化アルゴリズムが、マージン・ラインを推定するために提案される。
− 消去ポイント推定においてインライアを識別するために、優先順位−RANSACと称され得る従来のRANSACアルゴリズムの適応が提案され、そこでは、従来のアルゴリズムは、先験的知識、例えば、信頼度値又は信頼度レベルを考慮に入れることにより改善される。
− 消失ポイント選択プログラムが、異なるやり方で決定され得るいくつかの候補消失ポイントのうちから選択するために採用される。
− 重み付けされたライン推定が、信頼度レベルを使用して、水平消失ポイント推定のために提案され、適応的重み付けされたライン推定が、垂直消失ポイント推定のために提案される。
− 垂直オフセット最小二乗法と、x−y交換可能な重み付けされた最小二乗法とが、垂直マージン・ラインを算出するために提案される。
− ブロブ分析に基づいた垂直消失ポイント推定が、特に、ピクセル・ブロブの垂直ストロークの特徴を考慮することにより提案される。
− ページ分析が処理チェーンの中に組み込まれ、テキスト情報だけが投影補正のために使用される。ステップが、投影補正を実行する前にピクチャを除去し、又は分離するために取られる実施例が提案される。
− 投影補正問題を解決する完全な処理チェーンが提案され、そこではユーザ介入のための必要性が、回避される可能性がある。
− 異なるレベルについての、すなわち、固有ポイント、ベースラインと、消失ポイント候補とについての除去ステップを含む投影補正方法が、投影補正の結果をまとめて改善するために提案される。
Claims (53)
- 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のための方法であって、
前記画像が2値化される、画像2値化のステップと、
ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出される、連結成分分析のステップと、
前記ピクセル・ブロブの固有ポイントを用いてテキスト・ベースラインを推定するステップ、及び前記テキスト・ベースラインを用いて前記少なくとも1つのテキスト部分の水平消失ポイントを決定するステップを含む水平消失ポイント決定のステップと、
垂直消失ポイントが、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分について決定される、垂直消失ポイント決定のステップと、
前記画像における前記透視図法が、前記の水平及び垂直の消失ポイントに基づいて補正される、投影補正のステップと
を含む方法。 - 各固有ポイントは、前記それぞれのピクセル・ブロブの境界ボックスの底部の中心である、請求項1に記載の方法。
- テキスト・ベースラインを推定する前記ステップは、混同させる固有ポイントの除去のステップを含み、考慮している前記固有ポイントの近くにおいて、固有ポイントに関するラインを外れている混同させる固有ポイントは、検出され、前記混同させる固有ポイントは、前記テキスト・ベースライン推定のために無視される、請求項1に記載の方法。
- 前記混同させる固有ポイントの除去ステップは、
前記ピクセル・ブロブの幅と、高さとを決定するステップと、
前記ピクセル・ブロブの幅と、高さとについての平均値を決定するステップと、
考慮している前記ピクセル・ブロブの幅と、高さとのうちの少なくとも一方が、前記算出された平均値から所定の範囲だけ異なるピクセル・ブロブに属する固有ポイントとして前記混同させる固有ポイントを検出するステップと
を含む、請求項3に記載の方法。 - テキスト・ベースラインを推定する前記ステップは、固有ポイントを固有ポイント・グループへとクラスタ化するステップを含み、前記固有ポイント・グループは、以下の複数の条件、すなわち、
− 前記グループの前記固有ポイントの間のポイント・ツー・ポイント距離が、第1の距離しきい値よりも下にある条件と、
− 前記グループの各固有ポイントと、前記グループの前記固有ポイントによって形成されるラインとの間のポイント・ツー・ライン距離が、第2の距離しきい値よりも下にある条件と、
− 前記グループの前記固有ポイントによって形成される前記ラインのオフ水平角度が、最大角度よりも下にある条件と、
− 前記固有ポイント・グループが、最小の数の固有ポイントを含んでいる条件と
のうちの少なくとも1つを満たし、前記テキスト・ベースラインは、前記固有ポイント・グループに基づいて、推定される、請求項1に記載の方法。 - 前記第1の距離しきい値と、前記第2の距離しきい値と、前記最大角度と、前記最小の数の固有ポイントとは、前記画像のコンテンツに基づいて、適応的に設定される、請求項5に記載の方法。
- テキスト・ベースラインを推定する前記ステップは、固有ポイント・グループ・マージングのステップをさらに含み、無視された固有ポイントの両側の上の固有ポイント・グループは、より大きな固有ポイント・グループへとマージされる、請求項5に記載の方法。
- 前記水平消失ポイントを決定する前記ステップは、
前記推定されたテキスト・ベースラインのそれぞれをデカルト座標系におけるラインとして規定するステップと、
前記デカルト座標系において規定される前記テキスト・ベースラインのそれぞれを同次座標系におけるデータ・ポイントへと変換するステップと、
信頼度レベルを前記データ・ポイントのそれぞれに割り当てるステップであって、前記信頼度レベルは、前記それぞれのテキスト・ベースラインの少なくとも長さと、前記テキスト・ベースラインを推定するために使用される固有ポイントの前記グループと、前記結果として生ずるテキスト・ベースラインとの近接性とに基づいている、割り当てるステップと、
所定のしきい値よりも上の信頼度レベルを有するいくつかのデータ・ポイントを優先順位サンプル・アレイへとグループ分けするステップと、
前記優先順位サンプル・アレイの中の前記データ・ポイントをいくつかのサンプル・グループへとクラスタ化するステップであって、各サンプル・グループは、少なくとも2つのデータ・ポイントを含む、クラスタ化するステップと、
前記サンプル・グループの中の各データ・ポイントに割り当てられる少なくとも前記信頼度レベルに基づいて、グループ信頼度値を各サンプル・グループに割り当てるステップと、
ライン・フィッティングのために前記優先順位サンプル・アレイからデータ・ポイントのサンプル・グループを反復的に選択するステップであって、前記反復は、前記優先順位サンプル・アレイにおける、最高の信頼度値を有する前記サンプル・グループから開始される、反復的に選択するステップと、
第1の適合されたラインをもたらす前記第1のサンプル・グループについてライン・フィッティングを実行するステップ、及びさらなる適合されたラインをもたらすそれぞれのさらなるサンプル・グループについてライン・フィッティングをその後に実行するステップと、
前記の第1の適合されたラインと、さらなる適合されたラインとに基づいて、前記第1の適合されたラインからの所定の距離しきい値よりも下に位置づけられるデータ・ポイントの組を決定するステップと、
データ・ポイントの前記決定された組に対応する水平テキスト・ベースラインから少なくとも第1及び第2の水平消失ポイント候補を推定するステップと、
それぞれの推定された水平消失ポイント候補に基づいて、投影補正を実行するステップと、
投影補正の後に結果として生ずる水平テキスト方向に対する各水平消失ポイント候補の近接性を比較するステップと、
投影補正の後に画像ドキュメントの水平テキスト方向に最も近い前記水平消失ポイント候補を選択するステップと
を含む、請求項1に記載の方法。 - 前記の第1及び第2の消失ポイント候補は、最小二乗法と、重み付けされた最小二乗法と、適応最小二乗法とから成る群から選択される異なる近似方法を使用して推定される、請求項8に記載の方法。
- 前記垂直消失ポイントを決定する前記ステップは、
それぞれが、前記画像の前記テキスト部分に対するブロブ・フィルタリング・アルゴリズムによって選択される前記ピクセル・ブロブのうちの選択された1つの方向に対応する、複数の垂直テキスト・ブロブ・ラインを推定するステップと、
デカルト座標系におけるラインとして、前記推定された垂直テキスト・ブロブ・ラインのそれぞれを規定するステップと、
前記デカルト座標系において推定される前記垂直テキスト・ブロブ・ラインのそれぞれを同次座標系におけるデータ・ポイントへと変換するステップと、
信頼度レベルを前記データ・ポイントのそれぞれに割り当てるステップであって、前記信頼度レベルは、前記それぞれの垂直テキスト・ブロブ・ラインを推定するために使用される前記ピクセル・ブロブの形状の少なくとも偏心度に基づいている、割り当てるステップと、
所定のしきい値よりも上の信頼度レベルを有するいくつかのデータ・ポイントを優先順位サンプル・アレイへとグループ分けするステップと、
前記優先順位サンプル・アレイの中の前記データ・ポイントをいくつかのサンプル・グループへとクラスタ化するステップであって、各サンプル・グループは、少なくとも2つのデータ・ポイントを含む、クラスタ化するステップと、
前記サンプル・グループの中の各データ・ポイントに割り当てられる前記信頼度レベルに基づいて、グループ信頼度値を各サンプル・グループに割り当てるステップと、
ライン・フィッティングのために、前記優先順位サンプル・アレイからデータ・ポイントのサンプル・グループを反復的に選択するステップであって、前記反復は、前記優先順位サンプル・アレイにおける最高のグループ信頼度値を有する前記サンプル・グループから開始される、反復的に選択するステップと、
第1の適合されたラインをもたらす前記第1のサンプル・グループについてライン・フィッティングを実行するステップ、及びさらなる適合されたラインをもたらすそれぞれのさらなるサンプル・グループについてライン・フィッティングをその後に実行するステップと、
前記の第1の適合されたラインと、さらなる適合されたラインとに基づいて、前記第1の適合されたラインからの所定の距離しきい値よりも下に位置づけられるデータ・ポイントの組を決定するステップと、
データ・ポイントの前記決定された組に対応する前記垂直テキスト・ブロブ・ラインから少なくとも第1及び第2の垂直消失ポイント候補を推定するステップと、
それぞれの推定された垂直消失ポイント候補に基づいて、投影補正を実行するステップと、
投影補正の後に結果として生ずる垂直テキスト方向に対するそれぞれの推定された垂直消失ポイント候補の近接性を比較するステップと、
画像ドキュメントの前記垂直テキスト方向に最も近い前記垂直消失ポイント候補を選択するステップと
を含む、請求項1に記載の方法。 - 前記の第1及び第2の消失ポイント候補は、最小二乗法と、重み付けされた最小二乗法と、適応最小二乗法とから成る群から選択される異なる近似方法を使用して推定される、請求項10に記載の方法。
- 前記ブロブ・フィルタリング・アルゴリズムは、以下の複数の条件、すなわち、
前記ピクセル・ブロブの主要な方向を表す、前記考慮されたピクセル・ブロブの形状の偏心度が、所定のしきい値よりも上にある条件と、
前記画像の境界に対する各ピクセル・ブロブの近接性が、所定の距離しきい値よりも上にある条件と、
前記結果として生ずる垂直ラインの角度が、最大角度しきい値よりも下にある条件と、
ピクセルの数によって規定される各ピクセル・ブロブのエリアが、最大エリアしきい値よりも下にある条件と
のうちの少なくとも1つに基づいて、ピクセル・ブロブを選択する、請求項10に記載の方法。 - テキストとピクチャとの分離のステップは、前記画像2値化の後、且つ前記連結成分分析の前に実行され、テキスト情報だけが前記2値化された画像において保持される、請求項1に記載の方法。
- 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のための方法であって、
前記画像が2値化される、画像2値化のステップと、
連結成分分析のステップであって、ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において、検出され、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルが、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、連結成分分析のステップと、
前記位置決定ピクセルを用いてテキスト・ベースラインを推定するステップ、及び前記テキスト・ベースラインを用いて前記少なくとも1つのテキスト部分の水平消失ポイントを決定するステップとを含む水平消失ポイント決定のステップと、
垂直消失ポイント決定のステップであって、垂直消失ポイントが、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分のために決定される、垂直消失ポイント決定のステップと、
投影補正のステップであって、前記画像における前記透視図法が、前記の水平及び垂直の消失ポイントに基づいて補正される、投影補正のステップと
を含む方法。 - 前記位置決定ピクセルは、前記ピクセル・ブロブの境界ボックスの底部の中心である、請求項14に記載の方法。
- 前記位置決定ピクセルは、前記ピクセル・ブロブの境界ボックスの底部コーナーである、請求項14に記載の方法。
- 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のためのシステムであって、前記システムが、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサを用いて実行可能なプログラムを含む関連するストレージとを備えており、
実行されるときに、前記画像を2値化する画像2値化のために構成された第1のソフトウェア・コード部分と、
実行されるときに、前記2値化された画像の前記少なくとも1つのテキスト部分におけるピクセル・ブロブを検出する連結成分分析のために構成された第2のソフトウェア・コード部分と、
実行されるときに、前記ピクセル・ブロブの固有ポイントを用いてテキスト・ベースラインを推定し、前記テキスト・ベースラインを用いて前記少なくとも1つのテキスト部分の水平消失ポイントを決定する水平消失ポイント決定のために構成された第3のソフトウェア・コード部分と、
実行されるときに、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分についての垂直消失ポイントを決定する垂直消失ポイント決定のために構成された第4のソフトウェア・コード部分と、
実行されるときに、前記の水平及び垂直の消失ポイントに基づいて、前記画像における前記透視図法を補正する投影補正のために構成された第5のソフトウェア・コード部分と
を含むシステム。 - 以下のうちの、すなわち、パーソナル・コンピュータ、ポータブル・コンピュータ、ラップトップ・コンピュータ、ネットブック・コンピュータ、タブレット・コンピュータ、スマートフォン、デジタル・スチル・カメラ、ビデオ・カメラ、モバイル通信デバイス、携帯型個人情報端末、スキャナ、多機能デバイスのうちの1つを備えている、請求項17に記載のシステム。
- コンピュータ・デバイスの上で実行可能であり、前記コンピュータ・デバイスの上で実行されるときに、以下のステップを、すなわち、
画像が2値化される、画像2値化のステップと、
ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出される、連結成分分析のステップと、
前記ピクセル・ブロブの固有ポイントを用いて、テキスト・ベースラインを推定するステップ、及び前記テキスト・ベースラインを用いて前記少なくとも1つのテキスト部分の水平消失ポイントを決定するステップを含む水平消失ポイント決定のステップと、
垂直消失ポイントが、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分について決定される、垂直消失ポイント決定のステップと、
前記画像における前記透視図法は、前記の水平及び垂直の消失ポイントに基づいて補正される、投影補正のステップと
を実行するように構成されたフォーマットにおけるソフトウェア・コード部分を含んでいる、その上にコンピュータ・プログラム製品が記憶される非一時的ストレージ媒体。 - 透視図法によってひずみを受ける画像ドキュメントの中のテキスト部分の消失ポイント候補を決定するための方法であって、
前記画像が2値化される、画像2値化のステップと、
連結成分分析を実行するステップであって、ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出され、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルは、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、実行するステップと、
各テキスト・ラインが、前記位置決定ピクセルに基づいて、前記テキスト部分の水平又は垂直のテキスト方向の近似を表す、いくつかのテキスト・ラインをデカルト座標系において推定するステップと、
前記テキスト・ラインのそれぞれを同次座標系におけるデータ・ポイントへと変換するステップと、
信頼度レベルを前記データ・ポイントのそれぞれに割り当てるステップと、
所定のしきい値よりも上の信頼度レベルを有するいくつかのデータ・ポイントを優先順位サンプル・アレイへとグループ分けするステップと、
前記優先順位サンプル・アレイの中の前記データ・ポイントをいくつかのサンプル・グループへとクラスタ化するステップであって、各サンプル・グループが、少なくとも2つのデータ・ポイントを含む、クラスタ化するステップと、
前記サンプル・グループの中の各データ・ポイントに割り当てられる少なくとも前記信頼度レベルに基づいて、グループ信頼度値を各サンプル・グループに割り当てるステップと、
前記データ・ポイントのうちで、第1の適合されたラインに関するインライアの組を決定するためにRANSACアルゴリズムを適用するステップであって、前記RANSACアルゴリズムが、前記優先順位サンプル・アレイの中の最高のグループ信頼度値を有する前記サンプル・グループから開始される、適用するステップと、
インライアの前記組に対応する前記テキスト・ラインから少なくとも1つの消失ポイント候補を推定するステップと
を含む方法。 - 前記データ・ポイントに割り当てられる前記信頼度レベルは、前記それぞれのテキスト・ラインの少なくとも長さと、前記それぞれのテキスト・ラインに対する前記位置決定ピクセルの近接性とに基づいている、請求項20に記載の方法。
- 前記RANSACアルゴリズムは、以下のステップ、すなわち、
ライン・フィッティングのために、前記優先順位サンプル・アレイからデータ・ポイントのサンプル・グループを反復的に選択するステップであって、前記反復は、前記優先順位サンプル・アレイの中の最高のグループ信頼度値を有する前記サンプル・グループから開始される、反復的に選択するステップと、
第1の適合されたラインをもたらす前記第1のサンプル・グループについてのライン・フィッティングを実行するステップ、及びさらなる適合されたラインをもたらすそれぞれのさらなるサンプル・グループについてのライン・フィッティングをその後に実行するステップと、
前記の第1の適合されたラインと、さらなる適合されたラインとに基づいて、前記第1の適合されたラインからの所定の距離しきい値よりも下に位置づけられるデータ・ポイントの組を決定するステップであって、データ・ポイントの前記組は、インライアの前記組を形成する、決定するステップと
を含む、請求項20に記載の方法。 - 前記第1の適合されたラインからの前記所定の距離しきい値は、固定されたパラメータである、請求項22に記載の方法。
- 前記第1の適合されたラインからの前記所定の距離しきい値は、前記画像ドキュメントのコンテンツに基づいて適応させられる適応パラメータである、請求項22に記載の方法。
- 少なくとも第1及び第2の消失ポイント候補は、インライアの前記組に対応する前記テキスト・ラインから推定される、請求項20に記載の方法。
- 前記の第1及び第2の消失ポイント候補は、最小二乗法と、重み付けされた最小二乗法と、適応最小二乗法とから成る群から選択される異なる近似方法を使用して推定される、請求項25に記載の方法。
- 前記推定された消失ポイント候補から消失ポイントを選択するステップをさらに含み、前記選択は、
それぞれの推定された消失ポイント候補に基づいて、前記画像ドキュメントに対する投影補正を実行するステップと、
投影補正の後に、前記結果として生ずる水平又は垂直のテキスト方向に対する各消失ポイント候補の近接性を比較するステップと、
投影補正の後に、前記画像ドキュメントの前記水平又は垂直のテキスト方向に最も近い前記消失ポイント候補を選択するステップと
を含む、請求項20に記載の方法。 - 各サンプル・グループの前記グループ信頼度値は、さらに、前記サンプル・グループの中の前記データ・ポイントに対応する前記それぞれの推定されたテキスト・ラインの間の距離に基づいている、請求項20に記載の方法。
- 前記データ・ポイントのそれぞれの前記信頼度レベルは、さらに、それぞれの各テキスト・ラインを推定するために使用される前記ピクセル・ブロブの主要な方向に基づいており、前記主要な方向は、各ピクセル・ブロブの形状の偏心度によって規定される、請求項20に記載の方法。
- 前記優先順位サンプル・アレイの中にグループ分けされるデータ・ポイントの最大数は、2と20との間にあり、5と10との間にあることがより好ましい、請求項20に記載の方法。
- 前記少なくとも1つの消失ポイント候補のそれぞれは、水平消失ポイント候補であり、前記位置決定ピクセルは、前記ピクセル・ブロブの固有ポイントである、請求項20に記載の方法。
- 前記少なくとも1つの消失ポイント候補のそれぞれは、垂直消失ポイント候補であり、前記推定されたテキスト・ラインは、前記画像の前記テキスト部分に対するブロブ・フィルタリング・アルゴリズムによって選択される、それぞれが、前記ピクセル・ブロブのうちの選択された1つの前記方向に対応する垂直テキスト・ブロブ・ラインである、請求項20に記載の方法。
- テキストとピクチャとの分離のステップは、前記画像2値化の後、且つ前記連結成分分析の前に実行され、テキスト情報だけが前記2値化された画像の中で保持される、請求項20に記載の方法。
- 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のための方法であって、
前記画像が2値化される、画像2値化のステップと、
連結成分分析を実行するステップであって、ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出され、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルが、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、実行するステップと、
前記ピクセル・ブロブの前記位置決定ピクセルを用いて、テキスト・ベースラインを推定するステップ、及び前記テキスト・ベースラインを用いて前記少なくとも1つのテキスト部分の少なくとも1つの水平消失ポイント候補を決定するステップを含む水平消失ポイント決定のステップと、
前記画像の前記テキスト部分に対するブロブ・フィルタリング・アルゴリズムによって選択される、それぞれが、前記ピクセル・ブロブのうちの選択された1つの方向に対応する垂直テキスト・ブロブ・ラインを推定するステップ、及び前記垂直テキスト・ブロブ・ラインを用いて前記少なくとも1つのテキスト部分の少なくとも1つの垂直消失ポイント候補を決定するステップを含む垂直消失ポイント決定のステップであって、
前記の水平及び垂直の消失ポイント決定のうちの少なくとも一方が、
前記推定されたテキスト・ラインのそれぞれを同次座標系におけるデータ・ポイントへと変換するステップと、
信頼度レベルを前記データ・ポイントのそれぞれに割り当てるステップと、
所定のしきい値よりも上の信頼度レベルを有するいくつかのデータ・ポイントを優先順位サンプル・アレイへとグループ分けするステップと、
各サンプル・グループが少なくとも2つのデータ・ポイントを含むいくつかのサンプル・グループへと前記優先順位サンプル・アレイの中の前記データ・ポイントをクラスタ化するステップと、
前記サンプル・グループの中の各データ・ポイントに割り当てられる少なくとも前記信頼度レベルに基づいて、グループ信頼度値を各サンプル・グループに割り当てるステップと、
前記データ・ポイントのうちで、第1の適合されたラインに関するインライアの組を決定するためにRANSACアルゴリズムを適用するステップであって、前記RANSACアルゴリズムが、前記優先順位サンプル・アレイの中で最高のグループ信頼度値を有する前記サンプル・グループから開始される、適用するステップと、
インライアの前記組に対応する前記テキスト・ラインから前記少なくとも1つの消失ポイント候補を推定するステップと
を含む、垂直消失ポイント決定のステップと、
投影補正のステップであって、前記画像の中の前記透視図法が、前記少なくとも1つの水平消失ポイント候補のうちから選択される水平消失ポイントと、前記少なくとも1つの垂直消失ポイント候補のうちから選択される垂直消失ポイントとに基づいて補正される、投影補正のステップと
を含む方法。 - 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のためのシステムであって、前記システムが、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサを用いて実行可能なプログラムを含む関連するストレージとを備えており、
実行されるときに、前記画像を2値化する画像2値化のために構成された第1のソフトウェア・コード部分と、
実行されるときに、前記2値化された画像の前記少なくとも1つのテキスト部分におけるピクセル・ブロブを検出し、前記ピクセル・ブロブのそれぞれについて、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上の、前記2値化された画像における前記ピクセル・ブロブの位置を規定する位置決定ピクセルを選択する連結成分分析のために構成された第2のソフトウェア・コード部分と、
実行されるときに、前記ピクセル・ブロブの前記位置決定ピクセルを用いてテキスト・ベースラインを推定し、前記テキスト・ベースラインを用いて前記少なくとも1つのテキスト部分の少なくとも1つの水平消失ポイント候補を決定する水平消失ポイント決定のために構成された第3のソフトウェア・コード部分と、
実行されるときに、前記画像の前記テキスト部分に対するブロブ・フィルタリング・アルゴリズムによって選択される、それぞれが、前記ピクセル・ブロブのうちの選択された1つの方向に対応する垂直テキスト・ブロブ・ラインを推定し、前記垂直テキスト・ブロブ・ラインを用いて前記少なくとも1つのテキスト部分の少なくとも1つの垂直消失ポイント候補を決定する垂直消失ポイント決定のために構成された第4のソフトウェア・コード部分であって、
前記の第3及び第4のソフトウェア・コード部分のうちの少なくとも一方が、
前記推定されたテキスト・ラインのそれぞれを同次座標系におけるデータ・ポイントへと変換するステップと、
信頼度レベルを前記データ・ポイントのそれぞれに割り当てるステップと、
所定のしきい値よりも上の信頼度レベルを有するいくつかのデータ・ポイントを優先順位サンプル・アレイへとグループ分けするステップと、
各サンプル・グループが少なくとも2つのデータ・ポイントを含むいくつかのサンプル・グループへと前記優先順位サンプル・アレイの中の前記データ・ポイントをクラスタ化するステップと、
前記サンプル・グループの中の各データ・ポイントに割り当てられる少なくとも前記信頼度レベルに基づいて、グループ信頼度値を各サンプル・グループに割り当てるステップと、
前記データ・ポイントのうちで、第1の適合されたラインに関するインライアの組を決定するためにRANSACアルゴリズムを適用するステップであって、前記RANSACアルゴリズムは、前記優先順位サンプル・アレイの中で最高のグループ信頼度値を有する前記サンプル・グループから開始される、適用するステップと、
インライアの前記組に対応する前記テキスト・ラインから前記少なくとも1つの消失ポイント候補を推定するステップと
を実行するために構成されている、第4のソフトウェア・コード部分と、
実行されるときに、前記少なくとも1つの水平消失ポイント候補のうちから選択される水平消失ポイントと、前記少なくとも1つの垂直消失ポイント候補のうちから選択される垂直消失ポイントとに基づいて、前記画像における前記透視図法を補正する投影補正を実行するために構成された第5のソフトウェア・コード部分と
を含むシステム。 - 以下のうちの、すなわち、パーソナル・コンピュータ、ポータブル・コンピュータ、ラップトップ・コンピュータ、ネットブック・コンピュータ、タブレット・コンピュータ、スマートフォン、デジタル・スチル・カメラ、ビデオ・カメラ、モバイル通信デバイス、携帯型個人情報端末、スキャナ、多機能デバイスのうちの1つを備えている、請求項35に記載のシステム。
- コンピュータ・デバイスの上で実行可能であり、前記コンピュータ・デバイスの上で実行されるときに以下のステップを、すなわち、
前記画像が2値化される、画像2値化のステップと、
連結成分分析を実行するステップであって、ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出され、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルが、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、実行するステップと、
各テキスト・ラインが、前記位置決定ピクセルに基づいて、前記テキスト部分の水平又は垂直のテキスト方向の近似を表す、いくつかのテキスト・ラインをデカルト座標系において推定するステップと、
前記テキスト・ラインのそれぞれを同次座標系におけるデータ・ポイントへと変換するステップと、
信頼度レベルを前記データ・ポイントのそれぞれに割り当てるステップと、
所定のしきい値よりも上の信頼度レベルを有するいくつかのデータ・ポイントを優先順位サンプル・アレイへとグループ分けするステップと、
前記優先順位サンプル・アレイの中の前記データ・ポイントをいくつかのサンプル・グループへとクラスタ化するステップであって、各サンプル・グループが、少なくとも2つのデータ・ポイントを含む、クラスタ化するステップと、
前記サンプル・グループの中の各データ・ポイントに割り当てられる少なくとも前記信頼度レベルに基づいて、グループ信頼度値を各サンプル・グループに割り当てるステップと、
前記データ・ポイントのうちで、第1の適合されたラインに関するインライアの組を決定するためにRANSACアルゴリズムを適用するステップであって、前記RANSACアルゴリズムが、前記優先順位サンプル・アレイの中の最高のグループ信頼度値を有する前記サンプル・グループから開始される、適用するステップと、
インライアの前記組に対応する前記テキスト・ラインから少なくとも1つの消失ポイント候補を推定するステップと
を実行するように構成されたフォーマットにおけるソフトウェア・コード部分を含んでいる、その上にコンピュータ・プログラム製品が記憶される非一時的ストレージ媒体。 - 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のための方法であって、
前記画像が2値化される、画像2値化のステップと、
連結成分分析のステップであって、ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出され、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルが、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、連結成分分析のステップと、
前記ピクセル・ブロブの前記位置決定ピクセルを用いてテキスト・ベースラインを推定するステップと、前記推定されたテキスト・ベースラインから水平消失ポイント候補を識別するステップと、前記水平消失ポイント候補を用いて前記少なくとも1つのテキスト部分の水平消失ポイントを決定するステップとを含む水平消失ポイント決定のステップと、
垂直消失ポイント決定のステップであって、垂直消失ポイントが、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分のために決定される、垂直消失ポイント決定のステップと、
投影補正のステップであって、前記画像における前記透視図法が、前記の水平及び垂直の消失ポイントに基づいて補正される、投影補正のステップと
を含み、
前記水平消失ポイント決定が、前記位置決定ピクセルのレベルに対する第1の除去ステップと、テキスト・ベースラインのレベルに対する第2の除去ステップと、水平消失ポイント候補のレベルに対する第3の除去ステップとを含む、方法。 - 前記位置決定ピクセルは、前記ピクセル・ブロブの固有ポイントである、請求項38に記載の方法。
- 前記第1の除去ステップは、考慮している前記固有ポイントの近くの固有ポイントに関してラインを外れている混同させる固有ポイントを検出するステップを含み、前記混同させる固有ポイントは、前記テキスト・ベースライン推定のために無視される、請求項39に記載の方法。
- 前記混同させる固有ポイントは、以下のステップ、すなわち、
前記ピクセル・ブロブの幅と、高さとを決定するステップと、
前記ピクセル・ブロブの幅と、高さとについての平均値を決定するステップと、
考慮している前記ピクセル・ブロブの幅と、高さとのうちの少なくとも一方が、前記算出された平均値から所定の範囲だけ異なるピクセル・ブロブに属する固有ポイントとして前記混同させる固有ポイントを検出するステップと
を用いて検出される、請求項40に記載の方法。 - テキスト・ベースラインを推定する前記ステップは、固有ポイントを固有ポイント・グループへとクラスタ化するステップを含み、前記固有ポイント・グループは、以下の複数の条件、すなわち、
− 前記グループの前記固有ポイントの間のポイント・ツー・ポイント距離が、第1の距離しきい値よりも下にある条件と、
− 前記グループの各固有ポイントと、前記グループの前記固有ポイントによって形成されるラインとの間のポイント・ツー・ライン距離が、第2の距離しきい値よりも下にある条件と、
− 前記グループの前記固有ポイントによって形成される前記ラインのオフ水平角度が、最大角度よりも下にある条件と、
− 前記固有ポイント・グループが、最小の数の固有ポイントを含んでいる条件と
のうちの少なくとも1つを満たし、前記テキスト・ベースラインは、前記固有ポイント・グループに基づいて、推定される、請求項39に記載の方法。 - 前記第1の距離しきい値と、前記第2の距離しきい値と、前記最大角度と、前記最小の数の固有ポイントとは、前記画像のコンテンツに基づいて、適応的に設定される、請求項42に記載の方法。
- テキスト・ベースラインを推定する前記ステップは、固有ポイント・グループ・マージングのステップをさらに含み、無視されない固有ポイントの両側の上の固有ポイント・グループは、より大きな固有ポイント・グループへとマージされる、請求項42に記載の方法。
- 前記第2の除去ステップは、
信頼度レベルを前記テキスト・ベースラインに割り当てるステップと、
前記信頼度レベルに基づいて、テキスト・ベースラインを除去するステップと
を含む、請求項38に記載の方法。 - 前記信頼度レベルは、前記それぞれのテキスト・ベースラインの少なくとも長さと、前記テキスト・ベースラインと、前記結果として生ずるテキスト・ベースラインとを推定するために使用される固有ポイントの前記グループの近接性とに基づいて、決定される、請求項45に記載の方法。
- テキスト・ベースラインの前記除去は、前記信頼度レベルが考慮に入れられるRANSACアルゴリズムを用いて実行される、請求項8に記載の方法。
- 前記第3の除去ステップは、
それぞれの識別された水平消失ポイント候補に基づいて、投影補正を実行するステップと、
投影補正の後に、結果として生ずる水平又テキスト方向に対する各水平消失ポイント候補の近接性を比較するステップと、
投影補正の後に、画像ドキュメントの水平テキスト方向に最も近い前記水平消失ポイント候補を選択するステップと
を含む、請求項38に記載の方法。 - 第1及び第2の水平消失ポイント候補は、前記第2の除去ステップの後に前記テキスト・ベースラインから推定され、前記の第1及び第2の水平消失ポイント候補の前記推定のために、最小二乗法と、重み付けされた最小二乗法と、適応最小二乗法とから成る群から選択される異なる近似方法が使用される、請求項38に記載の方法。
- テキストとピクチャとの分離のステップは、前記画像2値化の後、且つ前記連結成分分析の前に実行され、テキスト情報だけが前記2値化された画像において保持される、請求項38に記載の方法。
- 透視図法によってひずみを受ける少なくとも1つのテキスト部分を含む画像の投影補正のためのシステムであって、前記システムが、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサを用いて実行可能なプログラムを含む関連するストレージとを備えており、
実行されるときに、前記画像を2値化する画像2値化のために構成された第1のソフトウェア・コード部分と、
実行されるときに、前記2値化された画像の前記少なくとも1つのテキスト部分におけるピクセル・ブロブを検出する連結成分分析であって、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルが、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、連結成分分析のために構成された第2のソフトウェア・コード部分と、
実行されるときに、前記ピクセル・ブロブの前記位置決定ピクセルを用いてテキスト・ベースラインを推定するステップと、前記推定されたテキスト・ベースラインから水平消失ポイント候補を識別するステップと、前記水平消失ポイント候補を用いて前記少なくとも1つのテキスト部分の水平消失ポイントを決定するステップとを実行する水平消失ポイント決定のために構成された第3のソフトウェア・コード部分と、
実行されるときに、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分についての垂直消失ポイントを決定する垂直消失ポイント決定のために構成された第4のソフトウェア・コード部分と、
実行されるときに、前記の水平及び垂直の消失ポイントに基づいて、前記画像における前記透視図法を補正する投影補正のための第5のソフトウェア・コード部分と
を含み、
前記第3のソフトウェア・コード部分が、実行されるときに、前記位置決定ピクセルのレベルに対する第1の除去ステップと、テキスト・ベースラインのレベルに対する第2の除去ステップと、水平消失ポイント候補のレベルに対する第3の除去ステップとを実行する、システム。 - 以下のうちの、すなわち、パーソナル・コンピュータ、ポータブル・コンピュータ、ラップトップ・コンピュータ、ネットブック・コンピュータ、タブレット・コンピュータ、スマートフォン、デジタル・スチル・カメラ、ビデオ・カメラ、モバイル通信デバイス、携帯型個人情報端末、スキャナ、多機能デバイスのうちの1つを備えている、請求項51に記載のシステム。
- コンピュータ・デバイスの上で実行可能であり、前記コンピュータ・デバイスの上で実行されるときに、以下のステップを、すなわち、
画像が2値化される、前記画像の2値化のステップと、
連結成分分析のステップであって、ピクセル・ブロブが、前記2値化された画像の前記少なくとも1つのテキスト部分において検出され、前記ピクセル・ブロブのそれぞれについて、位置決定ピクセルが、前記ピクセル・ブロブのピクセル・ブロブ・ベースラインの上で選択され、前記位置決定ピクセルが、前記2値化された画像における前記ピクセル・ブロブの位置を規定している、連結成分分析のステップと、
前記ピクセル・ブロブの前記位置決定ピクセルを用いて、テキスト・ベースラインを推定するステップ、前記推定されたテキスト・ベースラインから水平消失ポイント候補を識別するステップ、及び前記水平消失ポイント候補を用いて、前記少なくとも1つのテキスト部分の水平消失ポイントを決定するステップを含む水平消失ポイント決定のステップと、
垂直消失ポイントが、その垂直の特徴に基づいて、前記少なくとも1つのテキスト部分について決定される、垂直消失ポイント決定のステップと、
前記画像における前記透視図法が、前記の水平及び垂直の消失ポイントに基づいて補正される、投影補正のステップと
を実行するように構成されたフォーマットにおけるソフトウェア・コード部分を含んでおり、
前記水平消失ポイント決定が、前記位置決定ピクセルのレベルに対する第1の除去ステップと、テキスト・ベースラインのレベルに対する第2の除去ステップと、水平消失ポイント候補のレベルに対する第3の除去ステップとを含む、
その上にコンピュータ・プログラム製品が記憶される非一時的ストレージ媒体。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/136,695 US8811751B1 (en) | 2013-12-20 | 2013-12-20 | Method and system for correcting projective distortions with elimination steps on multiple levels |
US14/136,501 US8913836B1 (en) | 2013-12-20 | 2013-12-20 | Method and system for correcting projective distortions using eigenpoints |
US14/136,585 | 2013-12-20 | ||
US14/136,585 US8897600B1 (en) | 2013-12-20 | 2013-12-20 | Method and system for determining vanishing point candidates for projective correction |
US14/136,501 | 2013-12-20 | ||
US14/136,695 | 2013-12-20 | ||
PCT/EP2014/078930 WO2015092059A1 (en) | 2013-12-20 | 2014-12-19 | Method and system for correcting projective distortions. |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017500662A true JP2017500662A (ja) | 2017-01-05 |
JP6542230B2 JP6542230B2 (ja) | 2019-07-10 |
Family
ID=52292917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016541592A Active JP6542230B2 (ja) | 2013-12-20 | 2014-12-19 | 投影ひずみを補正するための方法及びシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6542230B2 (ja) |
WO (1) | WO2015092059A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2631765C1 (ru) | 2016-04-26 | 2017-09-26 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот |
CN108323389B (zh) * | 2018-01-18 | 2019-11-08 | 华南农业大学 | 水稻插秧机的插秧秧苗株距与穴秧苗数的检测方法和装置 |
CN110084236B (zh) * | 2019-04-29 | 2021-05-28 | 北京朗镜科技有限责任公司 | 一种图像的矫正方法及装置 |
CN113421257A (zh) * | 2021-07-22 | 2021-09-21 | 凌云光技术股份有限公司 | 一种点阵字体文本行旋转校正方法及装置 |
CN115306165A (zh) * | 2022-08-25 | 2022-11-08 | 中国建筑第二工程局有限公司 | 一种装配式预制构件安装系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02116987A (ja) * | 1988-10-27 | 1990-05-01 | Toshiba Corp | 文字認識装置 |
JPH04127288A (ja) * | 1990-05-21 | 1992-04-28 | Fuji Facom Corp | ベースラインによる文字判別方法 |
JPH04271488A (ja) * | 1991-02-27 | 1992-09-28 | Nec Corp | ノイズ検出方式 |
JPH07121658A (ja) * | 1993-10-20 | 1995-05-12 | Nippon Digital Kenkyusho:Kk | 文字列検出方式 |
JP2008257713A (ja) * | 2007-03-16 | 2008-10-23 | Fujitsu Ltd | 透視変換歪み発生文書画像補正装置および方法 |
US20080260256A1 (en) * | 2006-11-29 | 2008-10-23 | Canon Kabushiki Kaisha | Method and apparatus for estimating vanish points from an image, computer program and storage medium thereof |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6873732B2 (en) * | 2001-07-09 | 2005-03-29 | Xerox Corporation | Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images |
NO20052656D0 (no) * | 2005-06-02 | 2005-06-02 | Lumex As | Geometrisk bildetransformasjon basert pa tekstlinjesoking |
CN101520852B (zh) * | 2008-02-29 | 2011-09-07 | 富士通株式会社 | 消失点检测装置和检测方法 |
-
2014
- 2014-12-19 WO PCT/EP2014/078930 patent/WO2015092059A1/en active Application Filing
- 2014-12-19 JP JP2016541592A patent/JP6542230B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02116987A (ja) * | 1988-10-27 | 1990-05-01 | Toshiba Corp | 文字認識装置 |
JPH04127288A (ja) * | 1990-05-21 | 1992-04-28 | Fuji Facom Corp | ベースラインによる文字判別方法 |
JPH04271488A (ja) * | 1991-02-27 | 1992-09-28 | Nec Corp | ノイズ検出方式 |
JPH07121658A (ja) * | 1993-10-20 | 1995-05-12 | Nippon Digital Kenkyusho:Kk | 文字列検出方式 |
US20080260256A1 (en) * | 2006-11-29 | 2008-10-23 | Canon Kabushiki Kaisha | Method and apparatus for estimating vanish points from an image, computer program and storage medium thereof |
JP2008257713A (ja) * | 2007-03-16 | 2008-10-23 | Fujitsu Ltd | 透視変換歪み発生文書画像補正装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6542230B2 (ja) | 2019-07-10 |
WO2015092059A1 (en) | 2015-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8811751B1 (en) | Method and system for correcting projective distortions with elimination steps on multiple levels | |
US8897600B1 (en) | Method and system for determining vanishing point candidates for projective correction | |
US10803554B2 (en) | Image processing method and device | |
US9363499B2 (en) | Method, electronic device and medium for adjusting depth values | |
US8913836B1 (en) | Method and system for correcting projective distortions using eigenpoints | |
CN110717489B (zh) | Osd的文字区域的识别方法、装置及存储介质 | |
WO2014160433A2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
US10455163B2 (en) | Image processing apparatus that generates a combined image, control method, and storage medium | |
US10169673B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
CN109697414B (zh) | 一种文本定位方法及装置 | |
US20180082456A1 (en) | Image viewpoint transformation apparatus and method | |
US20180253852A1 (en) | Method and device for locating image edge in natural background | |
CN111353961B (zh) | 一种文档曲面校正方法及装置 | |
US9131193B2 (en) | Image-processing device removing encircling lines for identifying sub-regions of image | |
JP5656768B2 (ja) | 画像特徴量抽出装置およびそのプログラム | |
US11216905B2 (en) | Automatic detection, counting, and measurement of lumber boards using a handheld device | |
KR101377910B1 (ko) | 화상 처리 방법 및 화상 처리 장치 | |
US10893167B2 (en) | Extracting a document page image from a electronically scanned image having a non-uniform background content | |
JP6669390B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US10970847B2 (en) | Document boundary detection using deep learning model and image processing algorithms | |
CN112419207A (zh) | 一种图像矫正方法及装置、系统 | |
WO2024016632A1 (zh) | 亮点定位方法、亮点定位装置、电子设备及存储介质 | |
CN110245674A (zh) | 模板匹配方法、装置、设备及计算机存储介质 | |
US10032073B1 (en) | Detecting aspect ratios of document pages on smartphone photographs by learning camera view angles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161107 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181101 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190131 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6542230 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |