JP5754065B2 - 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム - Google Patents
光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム Download PDFInfo
- Publication number
- JP5754065B2 JP5754065B2 JP2012557155A JP2012557155A JP5754065B2 JP 5754065 B2 JP5754065 B2 JP 5754065B2 JP 2012557155 A JP2012557155 A JP 2012557155A JP 2012557155 A JP2012557155 A JP 2012557155A JP 5754065 B2 JP5754065 B2 JP 5754065B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- text
- background
- foreground
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/457—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18076—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/01—Solutions for problems related to non-uniform document background
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
。テキストの品質が、例えば、画像補間を実行し、画像解像度を改善することによって改善され得る。
[0035]この定義はRGBカラーシステムから導かれ、
[0036]定義2.幅W及び高さHのグレースケールのデジタル画像は、2つの独立変数のスカラー関数
−GS=[gl,g2]であって、グレースケール画像を2進、2レベル、又は2つの色調の画像として参照する。
−GS=[gl,g2,g3,...,g256]であって、グレースケール画像を256レベルのグレースケール画像として参照する。
[0039]通常、座標、値、並びに座標及び値双方に関して用語「画素」を互換的に使用する。この様にいかなる混乱も生じることがないような場合、本明細書において用語「画素」を使用し、さもなければ、正確な用語を使用する。いかなる混乱も生じることがないような場合、記法I(x,y)も互換的に使用する。
[0042]上記の定義は、演算子が変換規則の集合をいくつか使用し、画像(又はいくつかの画像)を別の画像へ変換する関数であることを意味している。最も重要な画像演算子は、フィルター基本演算子である。(カーネル又はマスクと呼ぶこともある)フィルターは、大きさがn×mのマトリクスAnm
[0043]言い換えると、出力画像中の画素は、フィルターを用いて入力画像中の対応する画素の近傍を畳み込むことによって構築される。
[0046]定義6.I(x2,y2)がI(x1,y1)の8近傍集合の要素であって、それらの画素値が「類似」している場合、2つの画素I(xl,y1)及びI(x2,y2)は隣接している。
[0049]定義8.連結部分は画素の部分集合であって、集合にある画素それぞれが、集合にある残りの画素すべてと連結される。
する方が好都合である。実際、テキストがこのような場合、テキストと背景の組み合わせすべてが一様に処理され得る。従って、必要なときに図4に示した画像変換が実行される必要がある。
テキスト行の分析
[0053]最初に留意するべきことは、テキスト行の画像が、テキストから成るものと、背景から成るものと、の2つの画素タイプを有していることである。テキストと背景との間のエッジには、急激な色変化も存在する。これが、エッジ空間においてテキスト行が観測され得る結果をもたらす。様々な周知のエッジ検出技法のいずれかを利用し、エッジ空間における行の表現を取得し得る。図5にエッジ空間における行の表現例を示している。
[0056]CCiはi番目の連結部分であって、nlが原文の行の場合、行は
[0057]原文の行に対する行の分析手順を開始し、以下の定義式に定義される行の分析結
果を生成する。
[0060]図2の画像のグレースケール版である図6を参照した後、行の分析結果を導入する重要性を明確にする必要がある。多くの場合、テキストの色の明度及び背景色明度が水平軸に沿ってほぼ一様であることが妥当な想定であるが、図6の場合、この仮定は成立しない。画像の左側の背景の平均明度は約190であるが、一方、画像の右側の平均明度は(差がグレースケール範囲全体0〜255の3分の1よりも大きい)約100である。
って、ある種の見積りを実行する必要がある。
[0066]この近似は、行の分析に関する階段状の近似をもたらす。df及びdbの値を算出するためには、図8に示したエッジ空間において図7の矩形が表されなければならない。別の近似も使用され得る。例えば、区分的な線形近似は、多くの処理時間を要求し得るが、より良好な結果を与え得る。
る。示したように、背景の画素によってもたらされる1つのピークが存在する。厳密に言うと、この支配的なピークの存在は規則的ではないので(十分に線が太いテキストを考えられたい)、これが実際に背景を表しているとはまだ仮定されない。テキスト及び背景並びにこれらの混合によってもたらされるピークの左側に比較的変化が少ないヒストグラムの一部が存在する。
この演算子は
[0075]この演算子を適用した結果を図12に示している。この反転が実行された後は、必要なときに明色の背景上に暗色のテキストが現れていることを支障なく仮定できる。背景及び前景の行分析結果が、一旦算出(必要なときに画像反転が実行)されると、後述する閾値化を利用し、背景がフィルタリングされ得る。
閾値化
[0076]行の分析結果が、一旦算出されると、背景のフィルタリング処理は非常に簡単である。
[0077]つまり、前景及び背景の分析結果の平均値よりも小さな画素明度値を有する画素それぞれが、そのまま残っているが、一方、その他の画素は変更され、それらが最大密度を有しているように見える。すなわち、これらは白色に変更される。この種の閾値化は、画素の画素値に基づいてそれらを前景か背景として分類する処理として見なされ得る。画素が前景の画素として分類された場合、その値は変更されず、画素が背景の画素として分類された場合、その値は白に変更される。
低品質のテキスト解像度の改善
[0080]図13は低品質のテキスト画像の例を示している。この画像に対し前述の閾値化手順を適用した結果を図14に示す。明らかに結果の画像は低品質である。画像が人間にとっても大部分が読みにくいため、その後、いずれかの処理段階で最終的に間違った決定をすることになる。不十分な結果となる理由は明確である。図13において、テキストのストロークを構成する画素値は大きな変化を有している。これらのいくつかは、前景の画
素よりも背景の画素とより類似していて、ノイズ画素の中に前景の画素値と類似した値を有しているものもある。加えて、ストロークの幅は極度に小さく、完全なテキストの状態をもたらさない。
低品質のテキスト検出
[0082]低品質のテキスト画像を検出するときの最初のステップは、このような画像の品質を低くする特徴を識別することを含んでいる。このようなテキスト画像は、前述したようなストロークの小さな幅及びテキストの色の大きな変化によって特徴付けられる。ストロークの幅がより大きい場合、前述した閾値化処理が「細字」の文字表示を生じるが、しかしながらそれらは、依然として判読可能である。これは、色の小さな変化に関しても当てはまる。低品質のテキスト画像の主な特徴は、色の明度の大きな変化と組み合わせたストロークの小さな幅であると結論づけられ得る。
[0085]定義11.
[0086]図14の前景の画素のエッジすべてに関する局所的なストロークの幅を算出することによってストロークの幅の評価手順を始める。これは、図15に例示した前景の矢印
が出ている単一の画素に対して可能なすべての方向のストロークの幅を算出することによって達成され得る。
[0089]低品質の画像が、一旦検出されると、テキストの解像度を改善する方法が適用され得る。テキストの解像度を改善するための例示的な2つの方法を後述する。第1の方法は、要求される処理能力が非常に正確であるが、しかしながら高価であって、一方、第2の方法は、より効率的であるが、しかしながらいくらか精度が落ちる。
テキストの正確な解像度改善
[0090]テキストの解像度改善コンポーネントへ渡される画像は、ストロークの幅SWorを有していて、所定のいくつかの閾値よりも小さい。これは、処理時にわずかな自由度しかないことを意味している。この課題を克服するための一方法は、画像補間を実行することである。画像補間は、画像解像度を改善するための技法である。多くの補間技法が利用可能であるが、適切な一例は、双線形補間であって非常に単純であるが、それにもかかわらず、テキストの解像度改善処理に関する必要性に応えるためには十分強力である。
得る(図17b参照)。現段階では出力画像中、奇数の座標を有する画素だけが割り当てられていないままである。これらの画素値が、4近傍集合の中の画素の画素値すべての平均として算出され得る。双線形補間処理のこの最終段階は、補間された画像(図17c)をもたらす。図17cの最終的な画像は、画素値が図に示していない画素値と関係しているため、割り当てられた値をまったく持たない画素をいくつか有する。
[0094]画像補間を低品質のテキスト画像に適用することによって生じる好都合な一副作用は、補間処理の影響の本質的な平滑化である。これがテキストの色の明度において、よりわずかな差異を有する画像を生じ、低品質のテキストを持つ課題の1つであった。
−背景の行分析結果BLP(x)
−前景の行分析結果FLP(x)
−ストロークの幅SWtr=2*SWor+1
[0096]閾値化アルゴリズムが、テキストを損なっている版を製造するため、(BLP(x)+FLP(x))/2よりも小さな画素すべてはテキストの一部であると支障なく見みなされ得、0の値が割り当てられ得る。同様に、BLP(x)よりも大きな値を有する画素は背景の画素として分類され得、255の値が割り当てられ得る。しかしながら、((BLP(x)+FLP(x))/2からBLP(x))=(L1(x),L2(x))の範囲内の値を有する画素は、分類に関しては疑わしく、それらがテキスト又は背景に属しているか否か決定するための付加的な処理がいくつか必要である。
ここで
[0098]明度間隔の大きさを決定するパラメーターはnであって、少数の明度間隔を生成
するように選択される必要がある。実施例の中には、例えば、良好な選択が
[0099]ここでテキストの解像度改善処理が図19の文字Fに適用される。図20は、この文字に画素を追加することによる処理を示している。第1の間隔ΔI内の明度を持った画素が、図20の最左の文字に追加される。第2の間隔ΔI内の明度を持った画素が、図20の左から2番目の文字に追加される。より高い次の明度間隔それぞれの範囲内の画素を図中の次の文字それぞれに追加することによってこの処理を繰り返す。
[00102]図21aは、連結部分の例を示している。図21bにおいて、より暗色の画素が、この連結部分に対するエッジ画素であって、図21cにおいて斜交平行の画素が連結部分のスケルトンを表している。
1)低品質のテキスト画像を2倍の高解像度で補間する。
3)画像中の最暗色の画素(例えば、0の明度を持った画素)だけから形成される連結部分すべてを識別する。これらの連結部分を基線となる連結部分として参照する。
a.連結部分のスケルトンを算出する。
b.スケルトン中の画素がエッジ画素から距離SWtr/2よりも近くにある場合、次の明度間隔(現在のI+ΔI)に属する隣接した画素を現在の連結部分に追加することによって、新たな連結部分を生成する。
効率的なテキスト解像度の改善
[00107]ストロークの回復を使用し、テキストの画像解像度を改善するための前述のアルゴリズムは、多くの場合、非常に良好な結果を提供し得る。しかしながら、欠点の1つがアルゴリズムの計算量である。この節では、(処理能力に関し)安価なアルゴリズムの一変形であるが、しかしながら同程度の品質を有するアルゴリズムを記載する。
一アプローチを後述する。
り当てる。一方、画質が十分に高くない場合、ステップ(340)において、連結部分のストロークの幅の解像度を改善するストローク解像度改善コンポーネント(210)が実行され、画像解像度が改善される。最後にステップ(345)において、その後、OCRエンジンのコンポーネントが使用し得る出力コンポーネント(212)が、解像度を改善した画像を生成する。
10 スキャナー
15 文書
20 OCRエンジン
202 入力コンポーネント
204 分析コンポーネント
206 画質検出コンポーネント
208 閾値化コンポーネント
210 解像度改善コンポーネント
212 出力コンポーネント
300 画像処理装置
Claims (10)
- 光学文字認識されるテキスト画像の解像度を改善するための方法であって、
原文のテキスト行を含んでいる画像を受け取るステップと、
前記画像中の前記原文の行に沿って、平均の背景明度を表す背景の行分析結果を決定するステップと、
前記画像中の前記原文の行に沿って、平均の前景明度を表す前景の行分析結果を決定するステップと、
前記画像中のテキストを表す連結部分のストロークの幅の平均値又は中央値を推定するステップと、
前記ストロークの幅の平均値又は中央値が閾値よりも小さい場合、テキスト品質を改善するステップと
を含み、前記改善するステップは、
選定したパラメーターよりも小さな明度を持った前記画像中の画素を前記画像の前景部分に割り当てるステップであって、前記選定したパラメーターが、前記背景の行分析結果及び前記前景の行分析結果から少なくとも部分的に決定される、ステップと、
前記背景の行分析結果よりも大きな明度を持った前記画像中の画素を前記画像の背景部分に割り当てるステップと、
前記選定したパラメーターと前記背景の行分析結果との間の明度を持った選定された画素をエッジ空間において表される前記原文の行の基線となる連結部分に割り当てるステップと
を含む方法。 - 前記前景の明度値に割り当てられた各々の画素に対する局所的なストロークの幅を決定することによって、前記画像中のテキストを表す前記連結部分のストロークの幅の平均値又は中央値を推定し、前記ストロークの幅の平均値又は中央値が閾値よりも小さい場合、テキスト品質を改善するステップをさらに含む請求項1に記載の方法。
- 前記テキスト品質を改善するステップが、画像解像度を改善するための画像補間を実行するステップを含む請求項1又は2に記載の方法。
- 前記画像補間が、前記画像中の各画素を少なくとも2つの画素の集合にマッピングする双線形補間である請求項3に記載の方法。
- 前記選定したパラメーターと前記背景の行分析結果との間の明度を持った選定された画素を割り当てるステップは、次第に高くなる明度内の画素集合を次第に追加することによって実行され、各集合が、明度間隔の有限集合のうち1つの範囲内の明度を持った画素を定義している、ステップと
をさらに含む請求項1〜4のいずれか一項に記載の方法。 - 前記基線となる連結部分のエッジ画素とスケルトン画素との間の距離が、前記ストロークの幅の平均値又は中央値の2分の1よりも大きい場合、選定した画素を前記基線となる連結部分の少なくとも1つに割り当てることを終了するステップをさらに含む請求項5に記載の方法。
- 光学文字認識されるテキスト画像の解像度を改善する、プロセッサー及び記憶装置を備えるシステムであって、
原文のテキスト行を有する入力画像を受け取る、前記記憶装置に格納されて前記プロセッサーによって実行される入力コンポーネントと、
前記画像中の平均の背景及び前景の明度をそれぞれ表す背景及び前景の行分析結果を決定する、前記記憶装置に格納されて前記プロセッサーによって実行される背景及び前景の行分析コンポーネントと、
ストロークの幅の平均値又は中央値に基づいて及び前記背景及び前景の明度の変化に基づいて、前記画像の品質が閾値を満たすか否か決定する、前記記憶装置に格納されて前記プロセッサーによって実行される画質検出コンポーネントと、
前記背景及び前景の行分析結果に基づいて、画素を前記画像の背景部分か前景部分のどちらか一方に割り当てる、前記記憶装置に格納されて前記プロセッサーによって実行される閾値化コンポーネントと、
前記画質検出コンポーネントが、前記画像の品質が閾値を満たすことを決定した場合、前記画像中のテキストを表している連結部分のストロークの解像度を改善する、前記記憶装置に格納されて前記プロセッサーによって実行されるストローク解像度改善コンポーネントと
を具備するシステム。 - 前記画質検出コンポーネントが、前記画像中のテキストを表している前記連結部分のストロークの幅の平均値又は中央値を推定し、ストロークの幅の平均値又は中央値を閾値と比較することによって、前記画像の品質を決定する請求項7に記載のシステム。
- 前記背景及び前景の行分析コンポーネントが、エッジ空間において表された前記原文の行の各々に沿って、複数の局所的領域に対する複数の背景及び前景の明度値を決定するようにさらに構成され、各局所的領域が、所定の値よりも小さいか又は等しい大きさを有する請求項7又は8に記載のシステム。
- 前記背景及び前景の行分析コンポーネントが、
各局所的領域について、それぞれの局所的領域に配置される連結部分をそれぞれが囲む境界ボックス内の画素の明度値のヒストグラムを用意することであって、前記ヒストグラムは定義された範囲内の明度を有する画素を含む支配的なピークを有する、ヒストグラムを用意することと、
各境界ボックスについて、前記定義された範囲内の明度値を有する画素を前記背景の明度値に割り当て、残りの画素を前記前景の明度値に割り当てることと
によって、前記複数の局所的領域についての前記複数の背景及び前景の明度値を決定するようにさらに構成される請求項9に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/720,732 US8526732B2 (en) | 2010-03-10 | 2010-03-10 | Text enhancement of a textual image undergoing optical character recognition |
US12/720,732 | 2010-03-10 | ||
PCT/US2011/027439 WO2011112522A2 (en) | 2010-03-10 | 2011-03-07 | Text enhancement of a textual image undergoing optical character recognition |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013527513A JP2013527513A (ja) | 2013-06-27 |
JP2013527513A5 JP2013527513A5 (ja) | 2014-03-20 |
JP5754065B2 true JP5754065B2 (ja) | 2015-07-22 |
Family
ID=44560016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012557155A Active JP5754065B2 (ja) | 2010-03-10 | 2011-03-07 | 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム |
Country Status (8)
Country | Link |
---|---|
US (1) | US8526732B2 (ja) |
EP (1) | EP2545499B1 (ja) |
JP (1) | JP5754065B2 (ja) |
KR (1) | KR101795823B1 (ja) |
CN (1) | CN102782706B (ja) |
CA (1) | CA2790402A1 (ja) |
ES (1) | ES2773719T3 (ja) |
WO (1) | WO2011112522A2 (ja) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11610653B2 (en) * | 2010-09-01 | 2023-03-21 | Apixio, Inc. | Systems and methods for improved optical character recognition of health records |
US20120106845A1 (en) * | 2010-10-30 | 2012-05-03 | Prakash Reddy | Replacing word with image of word |
US9053361B2 (en) * | 2012-01-26 | 2015-06-09 | Qualcomm Incorporated | Identifying regions of text to merge in a natural image or video frame |
US9064191B2 (en) | 2012-01-26 | 2015-06-23 | Qualcomm Incorporated | Lower modifier detection and extraction from devanagari text images to improve OCR performance |
US8606011B1 (en) * | 2012-06-07 | 2013-12-10 | Amazon Technologies, Inc. | Adaptive thresholding for image recognition |
JP2014006614A (ja) * | 2012-06-22 | 2014-01-16 | Sony Corp | 画像処理装置、画像処理方法、並びにプログラム |
US9183458B2 (en) | 2012-07-19 | 2015-11-10 | Qualcomm Incorporated | Parameter selection and coarse localization of interest regions for MSER processing |
US9141874B2 (en) | 2012-07-19 | 2015-09-22 | Qualcomm Incorporated | Feature extraction and use with a probability density function (PDF) divergence metric |
US9047540B2 (en) | 2012-07-19 | 2015-06-02 | Qualcomm Incorporated | Trellis based word decoder with reverse pass |
US9262699B2 (en) | 2012-07-19 | 2016-02-16 | Qualcomm Incorporated | Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR |
US9076242B2 (en) | 2012-07-19 | 2015-07-07 | Qualcomm Incorporated | Automatic correction of skew in natural images and video |
US8787702B1 (en) * | 2012-11-30 | 2014-07-22 | Accusoft Corporation | Methods and apparatus for determining and/or modifying image orientation |
US9256798B2 (en) * | 2013-01-31 | 2016-02-09 | Aurasma Limited | Document alteration based on native text analysis and OCR |
GB2514410A (en) | 2013-05-24 | 2014-11-26 | Ibm | Image scaling for images including low resolution text |
JPWO2015071923A1 (ja) * | 2013-11-12 | 2017-03-09 | 三菱電機株式会社 | 運転支援画像生成装置、運転支援画像表示装置、運転支援画像表示システム、及び運転支援画像生成プログラム |
KR102159389B1 (ko) | 2014-03-17 | 2020-09-24 | 삼성디스플레이 주식회사 | 디지털 비디오 데이터를 보정하기 위한 보정 데이터 산출방법과 이를 이용하여 생성한 룩-업 테이블을 포함하는 유기전계발광 표시장치 |
US9536161B1 (en) | 2014-06-17 | 2017-01-03 | Amazon Technologies, Inc. | Visual and audio recognition for scene change events |
CN105718926A (zh) * | 2014-12-03 | 2016-06-29 | 夏普株式会社 | 一种文本检测的方法和装置 |
JP2016143310A (ja) * | 2015-02-04 | 2016-08-08 | ソニー株式会社 | 情報処理装置、画像処理方法及びプログラム |
CN106156766B (zh) | 2015-03-25 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
CN105245756B (zh) | 2015-09-28 | 2018-05-29 | 珠海奔图电子有限公司 | 图像处理方法及系统 |
US9916492B1 (en) * | 2017-03-21 | 2018-03-13 | SkySlope, Inc. | Image processing and analysis for UID overlap avoidance |
RU2657181C1 (ru) * | 2017-09-01 | 2018-06-08 | Общество с ограниченной ответственностью "Аби Продакшн" | Способ улучшения качества распознавания отдельного кадра |
CN110533049B (zh) * | 2018-05-23 | 2023-05-02 | 富士通株式会社 | 提取印章图像的方法和装置 |
CN111986095B (zh) * | 2019-05-22 | 2024-03-19 | 上海哔哩哔哩科技有限公司 | 基于边缘提取的图像处理方法及图像处理装置 |
CN111080554B (zh) * | 2019-12-20 | 2023-08-04 | 成都极米科技股份有限公司 | 一种投影内容中字幕区域增强方法、装置及可读存储介质 |
US11205084B2 (en) * | 2020-02-17 | 2021-12-21 | Wipro Limited | Method and system for evaluating an image quality for optical character recognition (OCR) |
US11386687B2 (en) | 2020-03-30 | 2022-07-12 | Wipro Limited | System and method for reconstructing an image |
CN111507352B (zh) * | 2020-04-16 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、计算机设备以及存储介质 |
CN111753832B (zh) * | 2020-07-02 | 2023-12-08 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备和存储介质 |
US11494944B2 (en) | 2020-11-18 | 2022-11-08 | Disney Enterprises, Inc. | Automatic low contrast detection |
US11544828B2 (en) | 2020-11-18 | 2023-01-03 | Disney Enterprises, Inc. | Automatic occlusion detection |
CN112906686A (zh) * | 2021-03-11 | 2021-06-04 | 北京小米移动软件有限公司 | 文字识别方法、装置、电子设备及存储介质 |
JP7137170B1 (ja) * | 2021-03-22 | 2022-09-14 | 楽天グループ株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN113793403B (zh) * | 2021-08-19 | 2023-09-22 | 西南科技大学 | 一种模拟绘画过程的文本合成图像方法 |
US11749006B2 (en) * | 2021-12-15 | 2023-09-05 | Intuit Inc. | Optical character recognition quality evaluation and optimization |
CN116071763B (zh) * | 2023-03-06 | 2023-06-16 | 山东薪火书业有限公司 | 基于文字识别的教辅图书智能校编系统 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0256688A (ja) * | 1988-08-23 | 1990-02-26 | Toyota Central Res & Dev Lab Inc | 文字切出し装置 |
US5513304A (en) | 1993-04-19 | 1996-04-30 | Xerox Corporation | Method and apparatus for enhanced automatic determination of text line dependent parameters |
US5384864A (en) | 1993-04-19 | 1995-01-24 | Xerox Corporation | Method and apparatus for automatic determination of text line, word and character cell spatial features |
US5915039A (en) | 1996-11-12 | 1999-06-22 | International Business Machines Corporation | Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition |
KR100480024B1 (ko) | 1997-12-31 | 2005-08-01 | 엘지전자 주식회사 | 획의두께정보를이용한모음인식방법 |
US6301386B1 (en) * | 1998-12-09 | 2001-10-09 | Ncr Corporation | Methods and apparatus for gray image based text identification |
JP2002157552A (ja) * | 2000-11-22 | 2002-05-31 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
JP2003203205A (ja) * | 2002-01-08 | 2003-07-18 | Ricoh Co Ltd | 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20030198386A1 (en) | 2002-04-19 | 2003-10-23 | Huitao Luo | System and method for identifying and extracting character strings from captured image data |
JP4118749B2 (ja) * | 2002-09-05 | 2008-07-16 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記憶媒体 |
JP4350778B2 (ja) * | 2002-09-05 | 2009-10-21 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記録媒体 |
JP2004199622A (ja) * | 2002-12-20 | 2004-07-15 | Ricoh Co Ltd | 画像処理装置、画像処理方法、記録媒体およびプログラム |
US7236632B2 (en) | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
JP4259950B2 (ja) * | 2003-08-08 | 2009-04-30 | 株式会社リコー | 画像認識装置、画像認識プログラムおよび記録媒体 |
US8086050B2 (en) * | 2004-08-25 | 2011-12-27 | Ricoh Co., Ltd. | Multi-resolution segmentation and fill |
TWI248754B (en) | 2004-11-08 | 2006-02-01 | Avision Inc | Image acquiring device with background filtering function |
US7953295B2 (en) | 2006-06-29 | 2011-05-31 | Google Inc. | Enhancing text in images |
JP2008187327A (ja) | 2007-01-29 | 2008-08-14 | Sharp Corp | 画像処理装置およびこれを備えた画像形成装置 |
US8223395B2 (en) * | 2007-07-20 | 2012-07-17 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text color in a digital image |
US8320674B2 (en) * | 2008-09-03 | 2012-11-27 | Sony Corporation | Text localization for image and video OCR |
-
2010
- 2010-03-10 US US12/720,732 patent/US8526732B2/en active Active
-
2011
- 2011-03-07 EP EP11753880.1A patent/EP2545499B1/en active Active
- 2011-03-07 JP JP2012557155A patent/JP5754065B2/ja active Active
- 2011-03-07 CN CN201180013195.8A patent/CN102782706B/zh active Active
- 2011-03-07 CA CA2790402A patent/CA2790402A1/en not_active Abandoned
- 2011-03-07 ES ES11753880T patent/ES2773719T3/es active Active
- 2011-03-07 WO PCT/US2011/027439 patent/WO2011112522A2/en active Application Filing
- 2011-03-07 KR KR1020127023496A patent/KR101795823B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
WO2011112522A3 (en) | 2011-11-03 |
CN102782706A (zh) | 2012-11-14 |
US8526732B2 (en) | 2013-09-03 |
KR20130016213A (ko) | 2013-02-14 |
JP2013527513A (ja) | 2013-06-27 |
CN102782706B (zh) | 2014-07-23 |
US20110222768A1 (en) | 2011-09-15 |
EP2545499B1 (en) | 2020-01-08 |
WO2011112522A2 (en) | 2011-09-15 |
EP2545499A4 (en) | 2017-08-30 |
CA2790402A1 (en) | 2011-09-15 |
ES2773719T3 (es) | 2020-07-14 |
KR101795823B1 (ko) | 2017-11-08 |
EP2545499A2 (en) | 2013-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5754065B2 (ja) | 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム | |
US8417033B2 (en) | Gradient based background segmentation and enhancement of images | |
JP6100744B2 (ja) | 自動修復を用いたカラー文書画像セグメンテーション及び二値化 | |
CA2789813C (en) | Document page segmentation in optical character recognition | |
US8200012B2 (en) | Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program | |
EP1910994B1 (en) | Binarization of an image | |
JP2014057306A (ja) | 画像位相一致を用いた文書画像の二値化及び分割 | |
JP2016521890A (ja) | 文書バウンダリ検知方法 | |
JP5488530B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8306335B2 (en) | Method of analyzing digital document images | |
US8989493B1 (en) | Method and apparatus for identifying regions of an image to be filtered during processing of the image | |
US20240086661A1 (en) | Method and apparatus for processing graphic symbol and computer-readable storage medium | |
JP4857975B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP3906221B2 (ja) | 画像処理方法及び画像処理装置 | |
JP5979008B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US7599556B2 (en) | Apparatus, system, and method for scanning segmentation | |
Som et al. | Application of threshold techniques for readability improvement of Jawi historical manuscript images | |
CN109934215B (zh) | 一种身份证识别方法 | |
CN113569859A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
Boiangiu et al. | Bitonal image creation for automatic content conversion | |
Cooksey et al. | Rapid image binarization with morphological operators | |
Das et al. | Adaptive method for multi colored text binarization | |
CN112991470B (zh) | 一种复杂背景下的证件寸照背景颜色检查方法及其系统 | |
Elmaleeh et al. | Detection and removal of cracks in digitized paintings via digital image processing | |
KR100514734B1 (ko) | 디지털 화질 개선방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140128 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150410 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20150508 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5754065 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |