JP4904330B2 - 画像からテキストを抽出する方法及び装置 - Google Patents

画像からテキストを抽出する方法及び装置 Download PDF

Info

Publication number
JP4904330B2
JP4904330B2 JP2008284748A JP2008284748A JP4904330B2 JP 4904330 B2 JP4904330 B2 JP 4904330B2 JP 2008284748 A JP2008284748 A JP 2008284748A JP 2008284748 A JP2008284748 A JP 2008284748A JP 4904330 B2 JP4904330 B2 JP 4904330B2
Authority
JP
Japan
Prior art keywords
edge
image
pixel
connected components
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008284748A
Other languages
English (en)
Other versions
JP2009123206A (ja
Inventor
シュ リーフェン
ヤンキン・ワン
ホンジュ・ジャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2009123206A publication Critical patent/JP2009123206A/ja
Application granted granted Critical
Publication of JP4904330B2 publication Critical patent/JP4904330B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像からテキストを抽出する方法及び装置に関し、特に、自然画像からテキストを自動抽出する方法及び装置に関する。
自然画像からのテキスト抽出は、ナンバープレートの位置特定及び内容ベースの画像/ビデオ索引付け等、非常に広く適用される。しかし、低い画像コントラスト及び複雑な背景に加えて、サイズ、様式、向き及び字並びの差異によるテキストの相違は、自動テキスト抽出の問題を極めて困難にする。
画像及びビデオからテキストを抽出する種々の手法は、特定の用途に対して提案されている(非特許文献1〜3を参照)。利用される特徴に従って、テキスト抽出方法は、領域ベースの方法及びテクスチャベースの方法の2種類に分類される。
領域ベースの方法は、連結成分(以下、「CC」と呼ぶ)ベースの手法及びエッジベースの手法の2つの手法に更に分割される。これら2つの手法は、CC又はエッジ等の下部構造の識別後にこれらの下部構造をマージしてテキストのバウンディングボックスを示すことにより、ボトムアップ式に動作する。尚、いくつかの手法は、CCベースの手法及びエッジベースの方法の双方の組合せを使用する。
テクスチャベースの方法において、テキストを背景から区別する明確なテクスチャ特性を画像内のテキストが有するかが観察される。ガボールフィルタ(Gabor filters)、ウェーブレット(Wavelet)、FFT及び空間変化等に基づく技術は、画像内のテキスト領域のテクスチャ特性を検出するために使用可能である。
CCベースの方法は、全てのテキスト領域が画像内で識別されるまで、小さい成分をより大きな成分に順次グループ化することによるボトムアップ方式を使用する。テキスト成分の空間構成を使用して成分をマージし、それによって非テキスト成分をフィルタリングしてテキスト領域の境界を示すには、幾何学的解析が必要とされる。CCベースの方法の重要な点は、成分を生成する方法及び幾何学的解析処理であり、これらは、種々のCCベースの方法の主な相違点でもある。
C. M. Lee, and A. Kankanhalli, Automatic Extraction of Characters in Complex Images, International Journal of Pattern Recognition Artificial Intelligence, 9 (1) (1995) 67-82. Yu Zhong, Kalle Karu, and Anil K. Jain, Locating Text In Complex Color Images, Pattern Recognition, 28 (10) (1995) 1523-1535. V. Wu, R. Manmatha, and E. M, Riseman, TextFinder: An Automatic System to Detect and Recognize Text in Images, IEEE Transactions on Pattern Analysis and Machine Intelligence, 21 (11) (1999) 1224-1229.
しかし、画像からのテキスト抽出の精度は、種々の条件に依存して変化する。例えば、画像は不均一な照明条件下にあり且つ/又は画像内の文字は異なるサイズ及び形状を有する。更に、現在の方法の大部分は、水平又は垂直に整列されたテキストストリングしか検出できない。更に、画像の背景が非常に複雑な場合、テキスト抽出の精度も低下する。
本発明は、上述の状況に鑑みてなされたものであり、本発明の目的は、画像からテキストを抽出する確実な方法及び装置を提供することである。
本発明にかかる画像からテキストストリングを生成する方法は、画像上でエッジとなる画素を検出し、当該検出された画素と隣接する画素との画素値の差分に基づいて、暗いエッジ画像及び明るいエッジ画像の2種類のエッジ画像を生成するステップと、
前記2種類のエッジ画像のそれぞれの上で連結成分を見つけるステップと、
前記2種類のエッジ画像のそれぞれにおいて、見つけられた前記連結成分から所定の条件を満たす連結成分を除去するステップと、
前記2種類のエッジ画像のそれぞれにおいて、前記除去の後に残される前記連結成分から、同一直線上に存在する連結成分を1つにグループ化するステップと、
前記2種類のエッジ画像のそれぞれについて、前記グループ化された連結成分に基づいてテキストストリングを生成するステップと、
を有することを特徴とする。
本発明にかかる画像からテキストストリングを生成する装置は、画像上でエッジとなる画素を検出し、当該検出された画素と隣接する画素との画素値の差分に基づいて、暗いエッジ画像及び明るいエッジ画像の2種類のエッジ画像を生成する検出手段と、
前記2種類のエッジ画像のそれぞれの上で連結成分を見つける手段と、
前記2種類のエッジ画像のそれぞれにおいて、見つけられた前記連結成分から所定の条件を満たす連結成分を除去する除去手段と、
前記2種類のエッジ画像のそれぞれにおいて、前記除去の後に残される前記連結成分から、同一直線上に存在する連結成分を1つにグループ化するグループ化手段と、
前記2種類のエッジ画像のそれぞれについて、前記グループ化された連結成分に基づいてテキストストリングを生成する生成手段と、
を備えることを特徴とする。
本発明において提供される方法及び装置は、不均一な照明条件にあり且つサイズ及び形状の異なる文字を有する画像からテキストを確実に抽出でき、任意の向きのテキストストリングを抽出できる。更に、白背景の黒テキスト及び黒背景の白テキストの双方が抽出可能である。
本発明の更なる特徴は、実施形態の以下の説明から、添付の図面を参照して明らかとなるだろう。
添付の図面を参照して、本発明の好適な実施形態を詳細に説明する。
図1は、本発明の実施形態に従って、自然画像内のテキストを抽出する処理全体を示すフローチャートである。図1に示すように、本発明に従ってテキストを抽出する処理は、5つの主な段階から構成される。すなわち、「暗い」エッジ画像及び「明るい」エッジ画像の2つのエッジ画像は入力画像上で検出され(ステップS100)、2つのエッジ画像のそれぞれで連結成分を見つけ(ステップS200)、非テキスト成分を可能な限り除去し(ステップS300)、同一線上の成分はハフ変換を使用して1つにグループ化され(ステップS400)、テキストストリングは成分グループから生成される(ステップS500)。
第1のステップは、入力画像(元の自然画像)上でのエッジの検出である(ステップS100)。連結成分は、検出されたエッジ画像上で生成される。Cannyオペレータ(Canny operator)及びSobelオペレータ(Sobel operator)等の複数の一般的なエッジ検出技術がある。しかし、これらの技術により取得されるエッジ画像上では、テキストオブジェクトのエッジと非テキストオブジェクトのエッジとが互いに接触する場合があり、その結果正確なテキスト成分を見つけられないため、本発明はこれらの技術を使用しない。
非テキストオブジェクトの干渉を減少するため、本発明は、近接する文字のエッジを分離すると共に、テキストオブジェクトのエッジを非テキストオブジェクトから効果的に分離できる特定のエッジ検出方法を提案した。この方法により、「暗い」エッジのエッジ画像及び「明るい」エッジのエッジ画像の2つのエッジ画像が得られる。「暗い」エッジは、白背景上の黒テキストを検出するために使用され、「明るい」エッジは、黒背景上の白テキストを検出するために使用される。
次に図2に従って、本発明において提案されるステップS100のエッジ検出方法を詳細に説明する。
図2は、本発明の実施形態に係るエッジ検出処理の例を示すフローチャートである。
最初にステップS110において、各画素の勾配は以下の式により算出される。
G0 = max(|I0 − In|)
式中、G0は画素の勾配であり、I0は画素のグレー値であり、Inは隣接画素のグレー値である。隣接画素は8個であってもよく、又は4個であってもよい。
上記の式は、中心画素とその隣接画素との間の差分を算出し、最大差分を中心画素の勾配として選択することを意味する。
その後ステップS120において、勾配のヒストグラムは算出される。その後、エッジ閾値は勾配のヒストグラムから判定される。この場合、大津の方法等の閾値を判定するいくつかの一般的な方法が適用可能である。
本発明において、閾値は、画素の何パーセント(例えば35%)がエッジであるかを単純に特定することにより判定される。
次にステップS130において、閾値より大きい勾配を有する全ての画素はエッジとして設定される。
ステップS140において、検出されたエッジは、以下の式により「暗い」エッジ及び「明るい」エッジの2種類に分類される。
最後にステップS150において、2つのエッジ画像は、「暗い」エッジ及び「明るい」エッジをそれぞれ抽出することにより生成される。
図5は、ナンバープレートのストリングを含み、ナンバープレートの1つの文字がプライバシー保護のため隠されている自然画像を示す図である。図6は、図5に示す元の自然画像上で検出されたエッジ画像を示す図である。このエッジ画像は、ステップS150において生成される。図6において、「暗い」エッジは暗画素で表され、「明るい」エッジはグレー画素で表され、非エッジは白画素で表される。
図1を再度参照すると、エッジ検出の実行後にステップS200へ進む。ステップS200において、連結成分は、双方の種類のエッジ画像において個別に見つけられる。すなわち連結成分は、各種類のエッジ画像(すなわち、暗いエッジ及び明るいエッジ)に対してそれぞれ見つけられる。更に、後続の処理は、同様に2つの成分グループに対して個別に実行される。
次にステップS300へ進み、非テキスト成分を除去する。ステップS300において、非テキスト成分をフィルタリングするために、いくつかの経験則が使用される。この経験則を以下に示す。
1)テキスト成分のサイズは、[Hmni, Hmax]の範囲内になければならない。Hmin及びHmaxは、本発明が適用される実際の用途に従って特定される。多くの場合、Hmin = 12及びHmax = 45が適切である。Hmaxより大きいサイズのテキストを抽出するため、本実施形態は元の画像を縮小し、テキスト抽出ステップ全体を縮小画像に適用する。
図7は、「暗い」エッジ画像上で検出された連結成分を示す図である。サイズが[Hmin, Hmax]の範囲外の成分は除去される。
2)画像領域をHmax*Hmaxのサイズの格子に分割し、各格子に「含まれる」成分の数を数える。成分の中心点が格子に含まれる場合、その成分は格子に含まれる。格子内の成分の数が所定の閾値(例えば18)より大きい場合、この格子内の全成分は削除される。この経験則は、テキスト成分の近傍では成分数はあまり大きくないという観察に基づく。
3)各成分の境界矩形において判定される閾値により、各成分を2値化する(例えば、大津(Otsu)の閾値法により)。「暗い」エッジ画像上で検出された成分において、そのバウンディングボックス(bounding box)の4つの境界線上の黒画素の数が4つの境界線上の全画素の20%より大きい場合、その成分は削除される。同様に、「明るい」エッジ画像上で検出された成分において、そのバウンディングボックス(bounding box)の4つの境界線上の白画素の数が4つの境界線上の全画素の20%より大きい場合、その成分は削除される。
図8は、非テキスト連結成分を除去の後の連結成分を示す図である。図8を図5とを比較すると、大部分の非テキスト成分がフィルタリングされる一方、図中符号801〜803で示されるテキスト成分は画像内に残存していることがわかる。
非テキスト成分を除去後、ステップS400へ進み、中心点が同一線上にある成分は1つにグループ化される。図3は、本発明の実施形態に従って、同一線上の成分のグループ化の例を示すフローチャートである。
図3に示すように、ステップS410において、成分の中心点はハフ変換を使用してパラメータ空間に変換される。その後、テキストストリングを通る線は、パラメータ空間上で極大点を見つけることにより検出される。極大点は、注目点を中心とする所定の範囲内の点であり、極大点の値は、その範囲内の他の任意の点の値より大きい。
次にステップS420において、中心点が同一線上にあるか又は同一線に近接する成分は1つにグループ化される。従って、出力される成分グループは取得される。
図1を再度参照すると、同一直線上の成分を1つにグループ化した後、ステップS500へ進み、テキストストリングは、ステップS400において取得されたグループから生成される。図4は、本発明の実施形態に従って、線上の成分のグループからテキストストリングを生成する例を示すフローチャートである。
図4に示すように、ステップS510において、文字の平均の高さは、グループ内の全ての成分の高さの平均値として選択される。次にステップS520において、高さが平均の高さと非常に異なる(例えば、高差の閾値は20%に設定されてもよい)成分は、非テキスト成分と見なされ除去される。最後にステップS530において、テキストストリングは、隣接する成分を繰り返し連結することにより生成される。2つの隣接する成分間の距離が所定の閾値(例えば、ストリングの高さの1.2倍)より小さい場合、これらの成分は連結される。
更に各ストリングの領域は、ストリングの高さに加えて、開始点及び終了点を使用して識別可能である。
ステップS500においてテキストストリングを生成後、テキストストリングは出力され、光学的文字認識(OCR)処理等の更なる処理に使用されてもよい。
図9は、本発明の実施形態によって、線901で示すように位置を特定されたテキストストリングを示す図である。図5と比較すると、ナンバープレートの場所のテキストストリングが正確に見つけられていることがわかる。
本発明は、自動ナンバープレート認識システムにおいて使用可能である。別の興味深い使用法は、辞書とカメラとを組み合わせる電訳機(electric translator)である。図10は、本発明を適用可能な例であるデジタルカメラを有する電訳機を示すブロック図である。
図10に示すように、外国語のストリングを含む画像は、電訳機のデジタルカメラにより取得される。本実施形態の方法を使用して画像上のテキストストリングを抽出後、OCR処理は、テキストストリングを母国語に翻訳するために実行される。最後に、母国語のテキストストリングはユーザに対して表示される。
図11は、本発明の実施形態に従って、画像からテキストを抽出する装置の例を示すブロック図である。その詳細な説明は省略する。
上述の方法は、上述の機能を実現するソフトウェアのプログラムコードを格納した記憶媒体をコンピュータシステム又は装置に提供することにより実現されてもよい。そのシステム又は装置のコンピュータ(あるいはCPU又はMPU)を用いて、記憶媒体に格納されたプログラムコードを読み出して実行することにより、上述の実施形態の機能は実現される。この場合、記憶媒体から読み出されたプログラムコードは実施形態に係る機能を実現し、プログラムコードを格納した記憶媒体は本発明を構成する。フロッピディスク(登録商標)、ハードディスク、光ディスク及び光磁気ディスク等の記憶媒体は、プログラムコードを提供するために使用される。CD−ROM、CD−R、磁気テープ、不揮発性メモリカード及びROM等が更に使用される。
更に、上述の機能は、コンピュータにより読み出されたプログラムコードを実行することによってのみ実現されるのではない。本発明は、コンピュータ上で稼動しているOS(オペレーティングシステム)等が、プログラムコードの指示に従って処理の一部又は全部を実行し、上述の実施形態に係る機能を実現する場合を更に含む。
更に、記録媒体から読み出されたプログラムコードは、コンピュータに挿入された機能拡張カード又はコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。その後、その機能拡張カード又は機能拡張ユニットに含まれるCPU等は、そのプログラムコードの指示に従って処理の一部又は全部を行ってもよく、上述の実施形態の機能を実現してもよい。
実施形態を参照して本発明を説明したが、本発明は開示される実施形態に限定されないことが理解されるべきである。添付の特許請求の範囲の範囲は、そのような変形、並びに等価な構成及び機能の全てを含むように最も広範に解釈されるべきである。
本発明の実施形態に従って、自然画像内のテキストを抽出する処理全体を示すフローチャートである。 本発明の実施形態に係るエッジ検出処理の例を示すフローチャートである。 本発明の実施形態に従って、同一線上の成分のグループ化の例を示すフローチャートである。 本発明の実施形態に従って、線上の成分のグループからテキストストリングを生成する例を示すフローチャートである。 ナンバープレートのストリングを含み、ナンバープレートの1つの文字がプライバシー保護のため隠されている自然画像を示す図である。 図5に示す元の自然画像上で検出されたエッジ画像を示し、「暗い」エッジ(暗画素)及び「明るい」エッジ(グレー画素)を同一画像上に示す図である。 「暗い」エッジ画像上で検出された連結成分を示し、「格子」が画像上に重ねられる図である。 非テキスト連結成分を除去後の連結成分を示す図である。 本発明の実施形態によって、線で示すように位置を特定されたテキストストリングを示す図である。 本発明を適用可能な例であるデジタルカメラを有する電訳機を示すブロック図である。 本発明の実施形態に従って、画像からテキストを抽出する装置の例を示すブロック図である。

Claims (10)

  1. 画像からテキストストリングを生成する方法であって、
    前記画像上でエッジとなる画素を検出し、当該検出された画素と隣接する画素との画素値の差分に基づいて、暗いエッジ画像及び明るいエッジ画像の2種類のエッジ画像を生成するステップと、
    前記2種類のエッジ画像のそれぞれの上で連結成分を見つけるステップと、
    前記2種類のエッジ画像のそれぞれにおいて、見つけられた前記連結成分から所定の条件を満たす連結成分を除去するステップと、
    前記2種類のエッジ画像のそれぞれにおいて、前記除去の後に残される前記連結成分から、同一直線上に存在する連結成分を1つにグループ化するステップと、
    前記2種類のエッジ画像のそれぞれについて、前記グループ化された連結成分に基づいてテキストストリングを生成するステップと、
    を有することを特徴とする方法。
  2. 前記画像上でエッジを検出する検出ステップは、
    G0が画素の勾配であり、I0が前記画素のグレー値であり且つInが隣接画素のグレー値であって、前記隣接画素の数が4又は8である場合、式G0 = max(|I0−In|)により各画素の勾配を算出するステップと、
    閾値が判定される基準となる前記勾配のヒストグラムを算出するステップと、
    前記閾値より大きい勾配を有する前記画素をエッジとして設定するステップと、
    により、前記エッジを暗いエッジ及び明るいエッジの2種類に分類するステップと、
    暗いエッジ画像及び明るいエッジ画像の2つのエッジ画像を生成するステップと、を更に有することを特徴とする請求項に記載の方法。
  3. 前記所定の条件は、連結成分のサイズと、所定領域内の連結成分の数と、及び、前記エッジ画像上のある特定の色の画素数と前記エッジ画像上の全画素数との比と、のうちの少なくとも1つを含むことを特徴とする請求項1に記載の方法。
  4. 前記グループ化するステップは、
    ハフ変換を使用して連結成分の中心点をパラメータ空間に変換し、ストリングを通る線を検出するために、前記パラメータ空間上で極大点を検出するステップと、
    中心点が同一線上にあるか又は同一線に近接する連結成分を1つにグループ化するステップと、を更に有することを特徴とする請求項1に記載の方法。
  5. 前記テキストストリングを生成するステップは、
    グループ内の前記連結成分の高さから前記テキストストリングにおけるテキストの平均の高さを決定するステップと、
    高さが前記平均の高さから所定の程度異なる連結成分を除去するステップと、
    隣接する連結成分を連結するステップと、を更に有することを特徴とする請求項1に記載の方法。
  6. 画像からテキストストリングを生成する装置であって、
    前記画像上でエッジとなる画素を検出し、当該検出された画素と隣接する画素との画素値の差分に基づいて、暗いエッジ画像及び明るいエッジ画像の2種類のエッジ画像を生成する検出手段と、
    前記2種類のエッジ画像のそれぞれの上で連結成分を見つける手段と、
    前記2種類のエッジ画像のそれぞれにおいて、見つけられた前記連結成分から所定の条件を満たす連結成分を除去する除去手段と、
    前記2種類のエッジ画像のそれぞれにおいて、前記除去の後に残される前記連結成分から、同一直線上に存在する連結成分を1つにグループ化するグループ化手段と、
    前記2種類のエッジ画像のそれぞれについて、前記グループ化された連結成分に基づいてテキストストリングを生成する生成手段と、
    を備えることを特徴とする装置。
  7. 前記検出手段は、更に、
    G0が画素の勾配であり、I0が前記画素のグレー値であり且つInが隣接画素のグレー値であって、前記隣接画素の数が4又は8である場合、式G0 = max(|I0−In|)により各画素の勾配を算出し、
    閾値が判定される基準となる前記勾配のヒストグラムを算出し、
    前記閾値より大きい勾配を有する前記画素をエッジとして設定し、

    により、前記エッジを暗いエッジ及び明るいエッジの2種類に分類し、
    暗いエッジ画像及び明るいエッジ画像の2つのエッジ画像を生成することを特徴とする請求項に記載の装置。
  8. 前記所定の条件は、連結成分のサイズと、所定領域内の連結成分の数と、及び、前記エッジ画像上のある特定の色の画素数と前記エッジ画像上の全画素数との比と、のうちの少なくとも1つを含むことを特徴とする請求項に記載の装置。
  9. 前記グループ化手段は、更に、
    ハフ変換を使用して連結成分の中心点をパラメータ空間に変換し、ストリングを通る線を検出するために、前記パラメータ空間上で極大点を検出し、
    中心点が同一線上にあるか又は同一線に近接する連結成分を1つにグループ化することを特徴とする請求項に記載の装置。
  10. 前記テキストストリングを生成する生成手段は、更に、
    グループ内の前記連結成分の高さから前記テキストストリング内のテキストの平均の高さを決定し、
    高さが前記平均の高さから所定の程度異なる連結成分を除去し、
    隣接する連結成分を連結することを特徴とする請求項に記載の装置。
JP2008284748A 2007-11-14 2008-11-05 画像からテキストを抽出する方法及び装置 Expired - Fee Related JP4904330B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710186396.3 2007-11-14
CN200710186396A CN101436248B (zh) 2007-11-14 2007-11-14 用于根据图像生成文本字符串的方法和设备

Publications (2)

Publication Number Publication Date
JP2009123206A JP2009123206A (ja) 2009-06-04
JP4904330B2 true JP4904330B2 (ja) 2012-03-28

Family

ID=40710682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008284748A Expired - Fee Related JP4904330B2 (ja) 2007-11-14 2008-11-05 画像からテキストを抽出する方法及び装置

Country Status (2)

Country Link
JP (1) JP4904330B2 (ja)
CN (1) CN101436248B (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5631362B2 (ja) 2011-08-08 2014-11-26 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
US8837830B2 (en) * 2012-06-12 2014-09-16 Xerox Corporation Finding text in natural scenes
US9305239B2 (en) 2014-05-13 2016-04-05 Samsung Electronics Co., Ltd. Detecting and processing small text in digital media
CN106503634B (zh) * 2016-10-11 2020-02-14 讯飞智元信息科技有限公司 一种图像对齐方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1025764C (zh) * 1992-05-12 1994-08-24 浙江大学 字符识别方法
JP3852218B2 (ja) * 1998-09-10 2006-11-29 富士ゼロックス株式会社 画像処理方法および画像処理装置
JP4077094B2 (ja) * 1998-12-11 2008-04-16 富士通株式会社 カラー文書画像認識装置
JP3913985B2 (ja) * 1999-04-14 2007-05-09 富士通株式会社 文書画像中の基本成分に基づく文字列抽出装置および方法
JP3990375B2 (ja) * 2004-03-30 2007-10-10 東芝ソリューション株式会社 画像処理装置および画像処理方法
CN1312625C (zh) * 2004-07-02 2007-04-25 清华大学 基于游程邻接图的复杂背景彩色图像中字符提取方法

Also Published As

Publication number Publication date
JP2009123206A (ja) 2009-06-04
CN101436248B (zh) 2012-10-24
CN101436248A (zh) 2009-05-20

Similar Documents

Publication Publication Date Title
JP4904330B2 (ja) 画像からテキストを抽出する方法及び装置
US8611662B2 (en) Text detection using multi-layer connected components with histograms
JP4208918B2 (ja) 文書画像からテキストを抽出する方法及び装置並びにコンピュータプログラム及びその記憶媒体
US6263113B1 (en) Method for detecting a face in a digital image
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
Cohen et al. Robust text and drawing segmentation algorithm for historical documents
US9679354B2 (en) Duplicate check image resolution
CN105303156B (zh) 字符检测装置、方法及程序
JP2018136926A (ja) コンテナコード認識のための方法及びシステム
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN105225218A (zh) 用于文档图像的畸变校正方法和设备
CN113011426A (zh) 一种识别证件的方法和装置
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
JP2009151759A (ja) 画像処理方法及び画像処理装置
CN110321887B (zh) 文档图像处理方法、文档图像处理装置及存储介质
Phan et al. Text detection in natural scenes using gradient vector flow-guided symmetry
Hurtik et al. Automatic license plate recognition in difficult conditions—Technical report
Bhaskar et al. Implementing optical character recognition on the android operating system for business cards
Huang A novel video text extraction approach based on Log-Gabor filters
Tang et al. A novel similar background components connection algorithm for colorful text detection in natural images
Samuel et al. Automatic Text Segmentation and Recognition in Natural Scene Images Using Msocr
Anthimopoulos et al. Detecting text in video frames
Huang et al. A new video text extraction method based on stroke
Rahman et al. Text Information Extraction from Digital Image Documents Using Optical Character Recognition
US10304195B2 (en) Information processing apparatus, computer-readable storage medium, and information processing method for judging a recognition target area

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120106

R151 Written notification of patent or utility model registration

Ref document number: 4904330

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees