JP5624004B2 - ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 - Google Patents

ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 Download PDF

Info

Publication number
JP5624004B2
JP5624004B2 JP2011206636A JP2011206636A JP5624004B2 JP 5624004 B2 JP5624004 B2 JP 5624004B2 JP 2011206636 A JP2011206636 A JP 2011206636A JP 2011206636 A JP2011206636 A JP 2011206636A JP 5624004 B2 JP5624004 B2 JP 5624004B2
Authority
JP
Japan
Prior art keywords
text
halftone
image
halftone text
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011206636A
Other languages
English (en)
Other versions
JP2012109941A (ja
Inventor
ユ ソンヤン
ユ ソンヤン
メイ イ
メイ イ
Original Assignee
コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド
コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド, コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド filed Critical コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド
Publication of JP2012109941A publication Critical patent/JP2012109941A/ja
Application granted granted Critical
Publication of JP5624004B2 publication Critical patent/JP5624004B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/405Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Description

本発明は、スキャンされた文書画像を2値化するための方法および装置に関し、特に、ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法および装置に関する。
コンピューターテクノロジーおよびインターネットの発達に伴って、簡易保存、簡易検索や読出し、高速転送および環境配慮等、紙ベースの文書より優れた利点のため、電子文書はますます一般的となってきている。従来、紙ベースの文書が長期間主となっており、長年にわたって大量の紙ベースの文書が生成されてきた。紙ベースの文書は、スキャナーを使用して、電子文書に変換できる。テキストを含む文書に関しては、文字検索やその他の目的のために、スキャンされた文書画像をテキストに変換することは、さらに好ましい。
自動文書分析システムが、スキャンされた文書画像を検索可能な電子文書に変換するために開発されてきた。このようなシステムは、典型的に、2値化要素、分離化要素および光学式文字認識要素(OCR)の、3つの主となる構成要素を含む。第1構成要素、2値化要素は、前景(テキスト、写真、線図等)を背景から分離する。2値化要素は、カラーまたはグレースケールの画像を、各画素が0または1の値を有する2値画像に変換する。後続の分離化要素および認識要素は高質な2値化された画像に依存するため、2値化は重要なステップである。良い2値化は、計算負荷を低減でき、後続の分析を容易にできるだけではなく、自動文書分析システムの全体的なパフォーマンスを向上できる。
従来の方法では、2値化は、典型的に、グローバルまたは局所的に実行される。グローバル2値化法は、マルチビット画素値をバイナリ画素値に変換するために、スキャンされた全体画像について算出された1つの閾値を使用する。閾値より大きい画素値は1(または0)に変換され、閾値より小さい画素値は0(または1)に変換される。局所的2値化法は、局所領域の2値化のための閾値として、局所領域から算出され、適応された統計値を使用する。
グローバル2値化法の例は、以下に見ることができる。エヌ オーツ(N.Otsu),「グレーレベルヒストグラムからの閾値選択法」(“A Threshold Selection Method from Gray−Level Histograms”),システム、人、サイバネティクスに関するIEEE議事録(IEEE Transactions on Systems,Man,and Cybernetics),Vol.9,No.1,1979,pp.62−66(以下、「オーツ」);エー ローゼンフィールド(A.Rosenfield),アール シー スミス(R.C.Smith),「緩和を使用する閾値化」(“Thresholding using Relaxation”),パターン分析と人口知能に関するIEEE議事録(IEEE Transactions on Pattern Analysis and Machine Intelligence),Vol.3,No.5,1981,pp.598−606;およびブイ エー シャピロ(V.A.Shapiro),ピー ケー ヴェレヴァ(P.K.Veleva),ブイ エス スグレフ(V.S.Sgurev),「画像閾値化のための適応した方法」(“An Adaptive method for Image Thresholding”)、第11回IAPRパターン認識国際会議議事録(Proceedings of the 11th IAPR International Conference on Pattern Recognition),1992,pp.696−699。局所的2値化法の例は、以下に見ることができる。タブリュ ニブラック(W.Niblack),「画像処理入門」(“An introduction to Image Precessing”),Prentice−Hall,Englewood Cliffs,1986,pp.115−116;ジェイ サウヴォラ(J.Sauvola)、エム ピーティカイネン(M.Peitikainen)、「最適な文書画像2値化」(“Adaptive document image binarization”)、Pattern Recognition,Vol.33,2000,pp.225−236(以下、「サウヴォラ他」);およびアイ キム(I.Kim),ディー ジュン(D.Jung),アール パク(R.Park)、水流モデルを使用するトポグラフィー分析に基づく文書画像2値化、(“Document image binarization based on topographic analysis using a water flow model”)、Pattern Recognition Vol.35,2002,pp.265−277。
したがって、本発明は、関連する技術の制約および短所に起因する1以上の問題を実質的に除去する2値化法に関する。
本発明の目的は、ハーフトーンテキストおよびハーフトーンではないテキストの両方を含む、スキャンされたグレースケール画像から、高質な2値画像を生成することである。
本発明のさらなる特徴および利点は以下の記載に説明され、部分的には当該記載から明らかであり、または、本発明を実施することを通して理解される。本発明の目的およびその他の利点は、添付の図面同様、記載される内容および特許請求の範囲に特に指摘された構成によって理解され、達成されうる。
具体的かつ広義に記載される通り、これらおよび/またはその他の目的を達成するために、本願発明は、紙ベースの文書をスキャンすることによって生成された、グレースケールの文書画像を2値化するためのデータ処理装置に実装される方法を提供する。
前記方法は、(a)前記グレースケールの文書画像内のテキスト文字を特定するステップと、(b)前記テキスト文字のトポロジー的分析に基づいて、前記ステップ(a)で特定された各前記テキスト文字を、ハーフトーンテキスト文字または非ハーフトーンテキスト文字として分類するステップと、(c)前記ステップ(b)で分類されたハーフトーンテキスト文字のみから取得された画素値特性を使用して、前記ハーフトーンテキスト文字を2値化するステップと、を含み、前記ステップ(a)は、前記グレースケールの文書画像の初期2値化を実行して、初期2値画像を生成するステップと、テキスト文字として、前記初期2値画像内の連結された画像要素を抽出するステップと、を含み、前記ステップ(b)は、各前記テキスト文字について、前記ステップ(a)において抽出した前記画像要素内のホールの数に応じてオイラー数を算出するステップと、前記テキスト文字の前記オイラー数が予め決められた値より小さい場合、当該テキスト文字を前記ハーフトーンテキスト文字として分類するステップと、前記テキスト文字の前記オイラー数が前記予め決められた値以上の場合、当該テキスト文字を前記非ハーフトーンテキスト文字として分類するステップと、を含む。
前記方法は、(d)前記ステップ(b)後、前記ステップ(c)前に、前記グレースケールの文書画像を、前記ハーフトーンテキスト文字のみを含むハーフトーンテキスト領域と、前記非ハーフトーンテキスト文字を含む非ハーフトーンテキスト領域とに分割するステップをさらに含み、前記ステップ(c)は、各前記ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該ハーフトーンテキスト領域を2値化して、各前記ハーフトーンテキスト領域の2値マップを生成するステップを含む。
前記方法は、(e)前記ステップ(d)後、各前記非ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該非ハーフトーンテキスト領域を2値化して、各前記非ハーフトーンテキスト領域の2値マップを生成するステップをさらに含む。
他の側面では、本発明は、コンピュータープログラムおよびコンピュータープログラム製品を提供する。当該コンピュータープログラム製品は、コンピューター使用可能な非遷移媒体(メモリーまたは記憶装置)を含み、そこに組み込まれた、データ処理装置を制御するためのコンピュータープログラムを有する。当該コンピュータープログラムは、当該データ処理装置が前記方法を実行するように構成されている。
他の側面では、本発明は、ハードコピー文書をスキャンしてグレースケールの文書画像を生成するスキャン部と、前記グレースケールの文書画像を処理して前記グレースケールの文書画像の2値マップを生成するデータ処理装置と、を含むスキャナーを提供する。前記処理は、前記方法ステップを含む。
上述の一般的な記載および以下の詳細な記載は例示的および解説的であり、請求の範囲にある発明についてさらなる説明を付与するものと意図されると解されるべきである。
紙文書内の対応するテキストが黒テキストとして印刷された場合における、テキストのスキャンされた画像を示す拡大図である。 紙文書内の対応するテキストがハーフトーングレーとして印刷された場合における、テキストのスキャンされた画像を示す拡大図である。 暗(黒)色テキストおよび淡(グレー)色テキストの両方を含む文書の1ページの画像を概略的に示す。 本発明の第1の実施形態に係る、ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法を概略的に示す。 本発明の第2の実施形態に係る、ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法を概略的に示す。 非ハーフトーンテキスト文字およびハーフトーンテキスト文字に対するオイラー数を示す、スキャンされた文書内のテキスト文字の画像である。 本発明の第1の実施形態に係る方法を使用した2値化結果の一部を示す。 従来のグローバル閾値法を使用した2値化結果の一部を示す。 本発明の実施形態に係る2値化法が実装されるデータ処理装置を含むスキャナーを概略的に示す。
本発明の実施形態は、紙ベースの文書をスキャンすることによって得られる文書画像を2値化するための改良された方法を提供する。本開示において、「紙ベースの文書」、「印刷された文書」および「ハードコピー文書」という文言が、区別することなく使用される。これらの文書は、用紙上のみに印刷される必要はなく、透明フィルム等の他の物理的媒体上に印刷されてもよい。
高画質のテキストおよび画像への要請に伴い、印刷された文書は、典型的に、たとえば、しばしば600dpi(ドットパーインチ)またはそれ以上の高解像度でスキャンされる。印刷された文書においては、グレーまたは淡色のテキストまたは画像は、しばしばハーフトーン法を使用して印刷される。たとえば、印刷されたグレー領域は、インクまたはトナーの複数の黒ドットを含み、当該ドットのサイズおよび/または密度は、当該グレー領域のグレースケール値に依存する。同様に、淡色の領域は、色飽和したドットを印刷することによって印刷される。本開示において、ハーフトーン法によって印刷されたテキストは、ハーフトーンテキストと称する。
ハーフトーンテキストを含む印刷された文書が高解像度でスキャンされる場合、特に、スキャンの画素サイズが実質的にハーフトーンドットよりも小さい場合、ハーフトーンドットは、典型的にスキャンされた画像内に見ることができる。図1(b)は、紙文書内の対応するテキストがハーフトーングレーテキストとして印刷された場合における、テキストのスキャンされた画像を示す拡大図である。この図において、ハーフトーントッドは、はっきり見える。さらに、ハーフトーンテキスト内のスキャンされた画素は、様々なグレー画素値を有する。ハーフトーンドット内に位置する画素は、より暗いグレー画素値を有し、隣接するハーフトーンドット間の領域に位置する画素は、より淡いグレーまたは白色の画素値を有する。様々なグレー画素値は、文書をスキャンするために使用されたスキャナーの限定的な感度または精度に由来する。
対照的に、図1(a)は、紙文書内の対応するテキストが黒テキストとして印刷された場合における、テキストのスキャンされた画像を示す拡大図である。可視なハーフトーンドットはない。さらに、テキスト領域内の画素値は、黒値または黒値に近い値である。
黒テキストおよびグレーテキストは、しばしば文書の同一ページ内に同時に存在する。図1(c)は、黒テキスト(概略的に太い実線11によって示されている)およびグレーテキストの両方を含む文書の1ページの画像を概略的に示す。
本開示では、画素値と言う時、「黒値」は黒画素を表す数値を指し、「白値」は白画素を表す数値を指すものとする。多くのシステムにおいては、白画素は画素値225を有し、黒画素は画素値0を有する。「グレー値」は、黒値および白値の間の値である。
これらの図面では、黒およびグレーテキストが使用されるが、カラー画像に対しても同じ効果がある。当該カラー画像では、テキストは、色飽和したテキスト(黒テキストと同様)または淡色テキスト(ハーフトーン法を使用した場合における、淡いグレーテキストと同様)として印刷される。以下では黒を例として使用するが、ここに記載される方法は、色を有するテキストにも適用可能である。
印刷された文書が黒テキストおよびハーフトーンテキストの両方を含む場合、従来の2値化法では、しばしばハーフトーンテキストに関しては、不満足な結果となる。上述したように、従来の2値化法は、典型的に、グローバルにまたは局所的に2値化を行う。従来のグローバル2値化法や従来の局所的2値化法のいずれも、ハーフトーンテキストを含むスキャン画像については、満足な結果を生じない。典型的に、ハーフトーンテキストは、文書画像全体のうち小部分のみを占める。上に説明したように、ハーフトーンテキストではない画素値は黒値にずっと近い一方、ハーフトーンパターンの存在のために、ハーフトーンテキストの画素値は、グレー値となる傾向がある。その結果、オーツ文献に記載されるオーツ閾値のようにグローバル閾値法が使用される場合、算出されるグローバル閾値は、暗色テキストの黒画素値に非常に近い傾向がある。そのような閾値を使用して2値化が実行される場合、ハーフトーンテキストは、画素値が閾値に満たないため、しばしば完全にまたは部分的に2値化の結果に残らない。局所的閾値法が使用される場合でさえ、局所ウィンドウ内のテキストの主部分が暗色テキストであれば、ハーフトーンテキストのいくつかは、やはり残らない。ハーフトーンテキストが、より淡いグレーレベルである(すなわち、背景値に近い)場合、状況はより悪化する。ハーフトーンテキストに関する低質な2値化結果は、自動文書分析システムの後続の構成要素、特にOCR要素に、極度に不利な効果を及ぼす。
図2(a)は、本発明の一実施形態に係る、ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法を概略的に示す。当該方法は、テキスト文字のトポロジー的特徴分析に基づいて、ハーフトーンテキストを非ハーフトーンテキストから分離し、その後それぞれのこれら閾値を使用して、ハーフトーンテキストおよび非ハーフトーンテキストを2値化する。
最初に、スキャンされた文書画像が、まず2値化される(ステップS21)。このステップは、従来の方法を含む、いかなる適した局所的またはグローバルなテキスト2値化法を使用できる。典型的に、局所的2値化は、画像を複数の小さな重複しないブロックに分割し、各ブロックについて閾値を算出し、閾値を使用してブロックを2値化することを伴う。一実施形態では、サウヴォラ他に記載される方法が、初期2値化を実行するために使用される。初期2値画像は、ステップS21で生成される。
初期2値画像内の連結された画像要素が、その後抽出される(ステップS22)。2値画像では、連結された一画像要素は、同じ画素値(たとえば黒)の画素の連結された一グループである。連結された画像要素を抽出するための方法は、一般的に知られている。いかなる適したアルゴリズムがこのステップで採用されてもよい。このステップで抽出された連結された各画像要素は、潜在的にはテキスト文字である。ステップS21およびS22は、まとめて、スキャンされた文書画像内のテキスト文字を特定するステップとも言える。
その後、連結された各画像要素(テキスト文字)は、トポロジー的特徴の分析に基づいて、ハーフトーンテキスト文字または非ハーフトーン文字として分類される(ステップS23およびS24)。ハーフトーン処理が原因で、ハーフトーンテキストの連結された画像要素は、非ハーフトーンテキストの連結された画像要素よりも多くのホールを含む。ホールとは、連結された画像要素の黒画素によって囲まれた白画素の領域である。より好ましい実施形態では、この特徴は、連結された各画像要素(文字)を分類するために使用される。特定の実施形態では、ハーフトーンテキスト文字および非ハーフトーンテキスト文字を分類するための基準として、オイラー数が使用される。オイラー数(整数)は、画像のトポロジー的な尺度である。これは、以下のように定義される。
ここで、Eはオイラー数、Cは画像内の連結された画像要素の数、Hはホールの数である。テキスト文字のオイラー数(たとえば、英字およびアラビア数字)は、典型的に1,0または−1である。たとえば、図4(a)〜図4(c)に示されるように、文字「C」は、オイラー数1を有する。なぜなら、1つの連結画像要素を有し、ホールを有さないからである。文字「A」は、オイラー数0を有する。なぜなら、1つの連結画像要素を有し、1つのホールを有するからである。数字「8」は、オイラー数−1を有する。なぜなら、1つの連結画像要素を有し、2つのホールを有するからである。ハーフトーンテキストは典型的に多くのホールを含むため、ハーフトーンテキスト文字(数字を含む)のオイラー数は、一般的に−1よりずっと小さい。たとえば、図4(d)のハーフトーン文字「N」は、オイラー数−43を有する。このように、オイラー数は、ハーフトーンテキスト検出のための良い尺度となる。
ステップS23において、検出された各テキスト文字(すなわち、連結画像要素)のオイラー数が算出される。オイラー数を算出するために、いかなる適したアルゴリズムが使用されてもよい。ステップS24では、各連結画像要素は、オイラー数に基づいて、ハーフトーンテキスト文字または非ハーフトーンテキスト文字として分類される。一実装では、連結画像要素が−2等の予め決められた値のオイラー数を有する場合、それは、ハーフトーンテキスト文字として分類される。そうでなければ、非ハーフトーンテキスト文字として分類される。
より概略的に、ステップS23は、テキスト文字のトポロジー的特徴を分析するステップであり、ステップS24は、トポロジー的特徴に基づいてテキスト文字を分類するステップである。ステップS23およびS24は、まとめて、トポロジー的分析に基づいて、ハーフトーンテキスト文字または非ハーフトーンテキスト文字としてテキスト文字を分類するステップを構成する。
より具体的には、ステップS23およびS24は、図2(b)に示される判断ループによって実装される。連結画像要素(すなわち、テキスト文字)は、一度に一つずつ処理される。次の連結画像要素について(ステップS231の「Y」)、オイラー数が算出される(ステップS232)。その後、当該オイラー数が−2よりも小さいか否かが判断される(ステップS241)。そうである場合(ステップS241の「Y」)、テキスト文字は、ハーフトーンテキスト文字として分類される(ステップS242)。そうでない場合(ステップS241の「N」)、テキスト文字は、非ハーフトーンテキスト文字として分類される(ステップS243)。処理は、その後、次に処理されるべき連結画像要素があるか否かを判断する(ステップS231)。ある場合(ステップS231の「Y」)、ステップS232、A241およびS243が繰り返される。処理されるべき連結画像要素がそれ以上ないと判断される場合(ステップS231の「N」)、処理は、次のステップ(すなわち、ステップS25)に続く。
図2(b)は、単なる例示的な実装であることに留意すべきである。他の実装において(図示せず)、連結画像要素を抽出するステップ(ステップS22)は、ループ内に構成してもよい。すなわち、一つの連結画像要素が抽出された後、オイラー数が算出され、ハーフトーンまたは非ハーフトーンテキスト文字として分類される。それから次の連結画像要素が抽出され、処理が繰り返される。この技術に精通する者であれば、その他の適した実装があることを理解できるであろう。
文書画像内に検出されたテキスト文字が、ハーフトーンまたは非ハーフトーンテキストに分類された後、文書画像は、ハーフトーンテキスト文字のみを含むハーフトーンテキスト領域と、非ハーフトーンテキスト文字を含む非ハーフトーンテキスト領域とに分類される(ステップS25)。グラフィクスや写真等のその他の文書要素がスキャンされた文書画像内に存在する場合、非ハーフトーンテキスト領域は、これらをも含む。一つまたは複数のハーフトーンテキスト領域、および一つまたは複数の非ハーフトーンテキスト領域が存在しうる。図1(c)には、異なるテキスト領域が、非ハーフトーンテキスト領域13およびハーフトーンテキスト領域14を規定する細い点線によって概略的に示されている。
好ましい実施形態では、分割ステップS25は、非ハーフトーンテキストおよび/またはハーフトーンテキストに、2値モルフォロジー演算を適用することによって達成される。モルフォロジーは、形状に基づいて画像を処理する画像処理演算の大まかな体系の一つである。モルフォロジー演算は、入力画像に構造要素を適用して、同サイズの出力画像を生成する。モルフォロジー演算では、出力画像内の各画素値は、入力画像内の対応する画素とその近傍との比較に基づく。近傍のサイズおよび形状(構造要素)を選択することによって、入力画像内の特定の形状に高感度なモルフォロジー演算を構築することができる。最も基本的なモルフォロジー演算は、膨張および収縮である。好ましい実施形態では、ハーフトーンテキスト領域を生成するために、2値モルフォロジー演算がハーフトーンテキストに適用され、非ハーフトーンテキスト領域を生成するために、同じ2値モルフォロジー演算が非ハーフトーンテキストに適用される。または、ハーフトーンテキスト領域を生成するために、2値モルフォロジー演算がハーフトーンテキストに適用され、画像の残りの領域は、非ハーフトーンテキスト領域として考慮される。好ましい実施形態では、膨張演算で使用される構造要素のパラメーターは、それぞれハーフトーンテキスト文字および非ハーフトーンテキスト文字の幅および高さから予測される。これらは、テキスト文字の平均幅および平均高さの、予め決められた倍数として選択してもよい。
その後、各ハーフトーンテキスト領域および各非ハーフトーンテキスト領域について、画像を2値化して領域の最終2値化の結果(2値マップ)を生成するために、元のスキャン文書画像に局所的閾値またはグローバル閾値法が実行される(ステップS26)。換言すると、各領域は、その領域内のみの画素から取得された画素値特性を使用して2値化される。特に、各ハーフトーンテキスト領域では、その領域内のみのハーフトーンテキストの画素値特性が、ハーフトーンテキストを2値化する閾値を算出するために使用される。
好ましい実装では、オーツ文献に記載された従来の方法が、各ハーフトーンテキスト領域に対して閾値化を実行するために使用される。画像は、ハーフトーンテキスト領域および非ハーフトーンテキスト領域に分割されたので、ハーフトーンテキスト領域に適用された従来の閾値法でさえ、ハーフトーンテキストに対して満足な2値化結果を生ずるであろう。これは、ハーフトーンテキスト領域がハーフトーンテキストのみを含んでおり、そして、従来の閾値法によって算出された閾値は、非ハーフトーンテキストによって影響されないためである。好ましい実装では、各非ハーフトーンテキスト領域は、オーツ文献に記載された従来の閾値法を使用して2値化される。当然、ハーフトーンテキスト領域および非ハーフトーンテキスト領域を2値化するために、その他の閾値法が使用されてもよい。
領域が2値化された後、スキャンされた文書画像の全体の2値マップを生成するために、複数領域の2値マップが結合される(ステップS27)。
図3は、本発明の第2の実施形態に係る、ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法を概略的に示す。第2の実施形態において、ステップS31からS34は、図2(a)および2(b)に示された第1の実施形態のステップS21からS24と同一である。
ハーフトーンテキスト文字の大部分が分類ステップS34によって特定された後、平均画素値、最小画素値および最大画素値等のハーフトーンテキストの画素値の統計が、予測される(ステップS35)。この目的のために、ハーフトーンテキストの全ての文字が特定される必要がないことに注意すべきである。いくつかのハーフトーン文字を見落としたとしても、予測される画素値の統計には大きな変化を生じない。その後、第1の2値画像を生成するために、ハーフトーンテキストの画素値の統計を使用して、スキャンされた文書画像が2値化される(ステップS36)。好ましい実施形態では、最小画素値と最大画素値との間の画素値を有する画素は、2値のうち1つの値(たとえば、黒)が割り当てられ、その範囲外の画素値を有する画素は、2値のうち他方の値が割り当てられる(たとえば、白)。その結果生じる第1の2値画像は、元のスキャンされた文書のハーフトーンテキストの2値化された画像を含む。第1の2値画像は、ハーフトーンテキストではない、元のスキャンされた文書内の特定のグレー画素に対応する他の画像、とりわけ黒テキスト文字のエッジにおける画素も含む。
その後、スキャンされた文書画像は、第2の2値画像を生成するために再度2値化される(ステップS37)。従来の局所的またはグローバル2値化法等のいかなる適した2値化法が、このステップで使用されてもよい。好ましくは、この2値化ステップの前に、ステップS36で取得されたハーフトーンテキスト文字の画素値を、背景値(たとえば、白)に設定するために、元のスキャンされた文書画像が変更される。その結果、ステップS36で見つけられたハーフトーンテキスト文字は、第2の2値画像内には出現しない。この理由は、ハーフトーンテキストの、ステップS37における非ハーフトーンテキストの閾値算出への影響を最小化するためである。その後、第1および第2の2値画像は、最終的な2値画像を生成するために、(ビット毎のAND演算によって)結合される。第1の2値画像は2値化されたハーフトーンテキストを含み、第2の2値画像は2値化された非ハーフトーンテキストを含むので、最終的な2値画像は、ハーフトーンおよび非ハーフトーンテキストの両方にとって満足な2値化結果となりうる。
上述した両方の2値化法(第1および第2実施形態)において、テキスト文字は、ハーフトーンテキスト文字および非ハーフトーンテキスト文字に分類され、そしてその後ハーフトーンテキストは、ハーフトーンテキストのみから取得された画素値特性を使用して2値化されることがわかる。グローバルヒストグラムに基づく閾値法等の従来の方法に比べると、本発明の実施形態に係る2値化法は、ハーフトーンテキストおよび非ハーフトーンテキストの両方を含むスキャンされた文書画像について、より優れた2値化結果を生む。
発明者は、ハーフトーンテキストおよび非ハーフトーンテキストの両方を含む文書画像に、第1実施形態の特定の実装を試験した。図1(a)および図1(b)のサンプル画像に対応する2値化結果の部分が、図5(a)および図5(b)に示されている。
初期2値化については(ステップS21)、サウヴォラ他に記載される従来の方法が、試験において使用された。特に、スキャンされた文書画像は、64×64画素のブロックに分割され、各ブロックの閾値は、次の公式によって算出される。
ここで、Tはブロックの算出された閾値、mはブロックの平均画素値、Sはブロックの画素値の標準偏差、定数kは0.2、定数Rは128である。オイラー数は、ステップS23でトポロジー的特徴として使用され、−2以下のオイラー数を有する連結画像要素は、ステップS24でハーフトーンテキストとして分類された。
ステップS25では、膨張演算が、ハーフトーンテキスト領域を生成するためにハーフトーンテキストに適用され、非ハーフトーンテキスト領域を生成するために非ハーフトーンテキストに適用された。ハーフトーンテキストについて、膨張演算で使用された構造要素の幅および高さは、両方とも、ハーフトーンテキストの平均幅および平均高さの4倍であった。非ハーフトーンテキストについて、構造要素の幅および高さは、両方とも、非ハーフトーンテキストの平均幅および平均高さの2倍であった。
最終2値化ステップS26では、ハーフトーンテキスト領域および非ハーフトーンテキスト領域は、オーツ法を使用して個別に2値化された。
比較のため、発明者は、同じ試験用文書を2値化するために、従来のオーツ法を適用した。図1(a)および図1(b)のサンプル画像に対応する2値化の結果の部分が、図6(a)および図6(b)に示されている。視覚的な比較から、黒テキストの2値化結果(図5(a)および図6(a)は両方の技法を使用しても同等であり、ハーフトーンテキストについては上記した本方法を使用した結果(図5(b))は、従来のグローバル閾値法(図6(b))を使用した結果より顕著により良いことが見て取れる。図6(b)では、テキスト文字の連結性が適切に保持されておらず、2値化されたテキスト文字内に多くのホールがあることが見て取れる。図5(b)では、テキスト文字の連結性は顕著により良く保持されており、2値化されたテキスト文字には、はるかに少ないかまたは全くホールがない。
発明者はさらに、2つの2値化結果をAdobe(登録商標)Acrobat(登録商標)9ProのOCRテキスト認識機能に入力した。グローバル閾値法の2値化結果がOCR機能に供給された時、ハーフトーンテキスト文字の57%未満だけが正確に認識された。上記本方法を使用した2値化結果がOCR機能に供給された時、ハーフトーンテキスト文字の99%が正確に認識された。これは、より良い2値化結果は、OCR要素を含む自動文書分析システムのパフォーマンスを改善できることを示している。
発明者はまた、ハーフトーンテキストよび非ハーフトーンテキストの両方を含む文書画像に、第2実施形態の実装を試験した。この実装は、上述した従来のオーツ法より優れているが、第1実施形態の実装ほど満足のいく結果ではないことを、2値化結果は示している。したがって、発明者は、現在のところ、第1実施形態が本発明を実行する上で最良のモードであると確信している。
上記本方法は、図7に示されるように、プロセッサー、メモリー(たとえばRAM)、およびプログラムを格納するための記憶装置(たとえばROM)を含むデータ処理装置によって実装されうる。データ処理装置は、スタンドアロンのコンピューターであり、または、ハードコピーの文書をスキャンするためのスキャン部も含むスキャナー(多機能プリンター−スキャナー−コピー装置を含む)の一部である(図7参照)。データ処理装置は、メモリーに格納されたコンピュータープログラムを実行するプロセッサーによって本方法を実行する。データ処理装置は、スキャンされたグレースケール画像を入力として取り込み、2値画像を出力として生成する。一側面では、本発明は、データ処理装置によって実行される方法である。他の側面では、本発明は、コンピュータープログラム製品である。当該製品は、コンピューター使用可能な非遷移媒体に実装されている。当該媒体には、データ処理装置を制御するために、コンピューター読み取り可能なプログラムコードが記述されている。その他の側面では、本発明は、コンピューターまたはスキャナー等のデータ処理装置に実装される。特に、本発明は、ハードコピーの文書をスキャンして、グレースケールのスキャンされた画像を生成するためのスキャン部と、スキャンされた文書画像を2値化して2値文書画像を生成するためのデータ処理装置とを含むスキャナーに実装されうる。
本発明の思想および範囲から乖離することなく様々な改変および変形が本発明の2値化方法および装置になされうることは、当業者にとって明らかである。したがって、本発明は、添付された請求の範囲およびそれと同等な範囲内での改変および変形を包含するものと解される。

Claims (22)

  1. 紙ベースの文書をスキャンすることによって生成された、グレースケールの文書画像を2値化するためのデータ処理装置に実装される方法であって、
    当該方法は、
    (a)前記グレースケールの文書画像内のテキスト文字を特定するステップと、
    (b)前記テキスト文字のトポロジー的分析に基づいて、前記ステップ(a)で特定された各前記テキスト文字を、ハーフトーンテキスト文字または非ハーフトーンテキスト文字として分類するステップと、
    (c)前記ステップ(b)で分類されたハーフトーンテキスト文字のみから取得された画素値特性を使用して、前記ハーフトーンテキスト文字を2値化するステップと、
    を含み、
    前記ステップ(a)は、
    前記グレースケールの文書画像の初期2値化を実行して、初期2値画像を生成するステップと、
    テキスト文字として、前記初期2値画像内の連結された画像要素を抽出するステップと、
    を含み、
    前記ステップ(b)は、
    各前記テキスト文字について、前記ステップ(a)において抽出した前記画像要素内のホールの数に応じてオイラー数を算出するステップと、
    前記テキスト文字の前記オイラー数が予め決められた値より小さい場合、当該テキスト文字を前記ハーフトーンテキスト文字として分類するステップと、
    前記テキスト文字の前記オイラー数が前記予め決められた値以上の場合、当該テキスト文字を前記非ハーフトーンテキスト文字として分類するステップと、
    を含む2値化方法。
  2. (d)前記ステップ(b)後、前記ステップ(c)前に、前記グレースケールの文書画像を、前記ハーフトーンテキスト文字のみを含むハーフトーンテキスト領域と、前記非ハーフトーンテキスト文字を含む非ハーフトーンテキスト領域とに分割するステップをさらに含み、
    前記ステップ(c)は、各前記ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該ハーフトーンテキスト領域を2値化して、各前記ハーフトーンテキスト領域の2値マップを生成するステップを含む、請求項1に記載の2値化方法。
  3. (e)前記ステップ(d)後、各前記非ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該非ハーフトーンテキスト領域を2値化して、各前記非ハーフトーンテキスト領域の2値マップを生成するステップをさらに含む、請求項に記載の2値化方法。
  4. (f)前記ステップ(c)および(e)で生成された前記ハーフトーンテキスト領域の2値マップと、前記非ハーフトーンテキスト領域の2値マップとを結合して、前記グレースケール文書画像の2値マップを生成するステップをさらに含む、請求項3に記載の2値化方法。
  5. 前記ステップ(d)は、全ての前記非ハーフトーンテキスト文字、または全ての前記ハーフトーンテキスト文字、またはその両方に、2値モルフォロジー演算を適用するステップを含む、請求項2に記載の2値化方法。
  6. 前記ステップ(c)は、各前記ハーフトーンテキスト領域に、局所的閾値法を適用するステップを含む、請求項2に記載の2値化法。
  7. 前記ステップ(e)は、各前記非ハーフトーンテキスト領域に、局所的閾値法またはグローバル閾値法を適用するステップを含む、請求項3に記載の2値化方法。
  8. 前記ステップ(c)は、
    (c1)前記ステップ(b)で分類された前記ハーフトーンテキスト文字の少なくともいくつかから、平均画素値、最小画素値および最大画素値を含む画素値統計を算出するステップと、
    (c2)前記ステップ(c1)で算出された画素値統計を使用することによって前記文書画像を2値化して、第1の2値画像を生成するステップと、
    を含み、
    前記文書画像を2値化して第2の2値画像を生成するステップと、
    ビット毎のAND演算により、前記第1および第2の2値画像を結合するステップと、
    をさらに含む請求項1〜7のいずれか一項に記載の2値化方法。
  9. データ処理装置を制御するためのコンピュータープログラムであって、
    前記コンピュータープログラムは、前記データ処理装置が、紙ベースの文書をスキャンすることによって生成されたグレースケールの文書画像を2値化するための処理を実行するように構成されており、
    前記処理は、
    (a)前記グレースケールの文書画像内のテキスト文字を特定する手順と、
    (b)前記テキスト文字のトポロジー的分析に基づいて、前記手順(a)で特定された各前記テキスト文字を、ハーフトーンテキスト文字または非ハーフトーンテキスト文字として分類する手順と、
    (c)前記手順(b)で分類されたハーフトーンテキスト文字のみから取得された画素値特性を使用して、前記ハーフトーンテキスト文字を2値化する手順と、
    を含み、
    前記手順(a)は、
    前記グレースケールの文書画像の初期2値化を実行して、初期2値画像を生成する手順と、
    テキスト文字として、前記初期2値画像内の連結された画像要素を抽出する手順と、
    を含み、
    前記手順(b)は、
    各前記テキスト文字について、前記手順(a)において抽出した前記画像要素内のホールの数に応じてオイラー数を算出する手順と、
    前記テキスト文字の前記オイラー数が予め決められた値より小さい場合、当該テキスト文字を前記ハーフトーンテキスト文字として分類する手順と、
    前記テキスト文字の前記オイラー数が前記予め決められた値以上の場合、当該テキスト文字を前記非ハーフトーンテキスト文字として分類する手順と、
    を含むコンピュータープログラム。
  10. (d)前記手順(b)後、前記手順(c)前に、前記グレースケールの文書画像を、前記ハーフトーンテキスト文字のみを含むハーフトーンテキスト領域と、前記非ハーフトーンテキスト文字を含む非ハーフトーンテキスト領域とに分割する手順をさらに含み、
    前記手順(c)は、各前記ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該ハーフトーンテキスト領域を2値化して、各前記ハーフトーンテキスト領域の2値マップを生成する手順を含む、請求項に記載のコンピュータープログラム。
  11. (e)前記手順(d)後、各前記非ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該非ハーフトーンテキスト領域を2値化して、各前記非ハーフトーンテキスト領域の2値マップを生成する手順をさらに含む、請求項10に記載のコンピュータープログラム。
  12. (f)前記手順(c)および(e)で生成された前記ハーフトーンテキスト領域の2値マップと、前記非ハーフトーンテキスト領域の2値マップとを結合して、前記グレースケール文書画像の2値マップを生成する手順をさらに含む、請求項11に記載のコンピュータープログラム。
  13. 前記手順(d)は、全ての前記非ハーフトーンテキスト文字、または全ての前記ハーフトーンテキスト文字、またはその両方に、2値モルフォロジー演算を適用する手順を含む、請求項10に記載のコンピュータープログラム。
  14. 前記手順(c)は、各前記ハーフトーンテキスト領域に、局所的閾値法を適用する手順を含む、請求項10に記載のコンピュータープログラム。
  15. 前記手順(e)は、各前記非ハーフトーンテキスト領域に、局所的閾値法またはグローバル閾値法を適用する手順を含む、請求項11に記載のコンピュータープログラム。
  16. 前記手順(c)は、
    (c1)前記手順(b)で分類された前記ハーフトーンテキスト文字の少なくともいくつかから、平均画素値、最小画素値および最大画素値を含む画素値統計を算出する手順と、
    (c2)前記手順(c1)で算出された画素値統計を使用することによって前記文書画像を2値化して、第1の2値画像を生成する手順と、
    を含み、
    前記文書画像を2値化して第2の2値画像を生成する手順と、
    ビット毎のAND演算により、前記第1および第2の2値画像を結合する手順と、
    をさらに含む請求項13のいずれか一項に記載のコンピュータープログラム。
  17. ハードコピー文書をスキャンしてグレースケールの文書画像を生成するスキャン部と、
    前記グレースケールの文書画像を処理して前記グレースケールの文書画像の2値マップを生成するデータ処理装置と、
    を含み、
    前記グレースケールの文書画像を処理するステップは、
    (a)前記グレースケールの文書画像内のテキスト文字を特定するステップと、
    (b)前記テキスト文字のトポロジー的分析に基づいて、前記ステップ(a)で特定された各前記テキスト文字を、ハーフトーンテキスト文字または非ハーフトーンテキスト文字として分類するステップと、
    (c)前記ステップ(b)で分類されたハーフトーンテキスト文字のみから取得された画素値特性を使用して、前記ハーフトーンテキスト文字を2値化するステップと、
    を含み、
    前記ステップ(a)は、
    前記グレースケールの文書画像の初期2値化を実行して、初期2値画像を生成するステップと、
    テキスト文字として、前記初期2値画像内の連結された画像要素を抽出するステップと、
    を含み、
    前記ステップ(b)は、
    各前記テキスト文字について、前記ステップ(a)において抽出した前記画像要素内のホールの数に応じてオイラー数を算出するステップと、
    前記テキスト文字の前記オイラー数が予め決められた値より小さい場合、当該テキスト文字を前記ハーフトーンテキスト文字として分類するステップと、
    前記テキスト文字の前記オイラー数が前記予め決められた値以上の場合、当該テキスト文字を前記非ハーフトーンテキスト文字として分類するステップと、
    を含むスキャナー。
  18. (d)前記ステップ(b)後、前記ステップ(c)前に、前記グレースケールの文書画像を、前記ハーフトーンテキスト文字のみを含むハーフトーンテキスト領域と、前記非ハーフトーンテキスト文字を含む非ハーフトーンテキスト領域とに分割するステップと、
    ここで、前記ステップ(c)は、各前記ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該ハーフトーンテキスト領域を2値化して、各前記ハーフトーンテキスト領域の2値マップを生成するステップを含み、
    (e)前記ステップ(d)後、各前記非ハーフトーンテキスト領域内のみの画素から算出された画素値統計を使用することによって当該非ハーフトーンテキスト領域を2値化して、各前記非ハーフトーンテキスト領域の2値マップを生成するステップと、
    (f)前記ステップ(c)および(e)で生成された前記ハーフトーンテキスト領域の2値マップと、前記非ハーフトーンテキスト領域の2値マップとを結合して、前記グレースケール文書画像の2値マップを生成するステップと、
    をさらに含む請求項17に記載のスキャナー。
  19. 前記ステップ(d)は、全ての前記非ハーフトーンテキスト文字、または全ての前記ハーフトーンテキスト文字、またはその両方に、2値モルフォロジー演算を適用するステップを含む、請求項18に記載のスキャナー。
  20. 前記ステップ(c)は、各前記ハーフトーンテキスト領域に、局所的閾値法を適用するステップを含む、請求項17に記載のスキャナー。
  21. 前記ステップ(e)は、各前記非ハーフトーンテキスト領域に、局所的閾値法またはグローバル閾値法を適用するステップを含む、請求項18に記載のスキャナー。
  22. 請求項16のいずれか一項に記載のコンピュータープログラムが格納されたコンピューター読取可能な記録媒体。
JP2011206636A 2010-11-15 2011-09-21 ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 Active JP5624004B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/946,801 US8947736B2 (en) 2010-11-15 2010-11-15 Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US12/946,801 2010-11-15

Publications (2)

Publication Number Publication Date
JP2012109941A JP2012109941A (ja) 2012-06-07
JP5624004B2 true JP5624004B2 (ja) 2014-11-12

Family

ID=46047512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011206636A Active JP5624004B2 (ja) 2010-11-15 2011-09-21 ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法

Country Status (3)

Country Link
US (1) US8947736B2 (ja)
JP (1) JP5624004B2 (ja)
CN (1) CN102592126B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8331670B2 (en) * 2011-03-22 2012-12-11 Konica Minolta Laboratory U.S.A., Inc. Method of detection document alteration by comparing characters using shape features of characters
US9319556B2 (en) 2011-08-31 2016-04-19 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for authenticating printed documents that contains both dark and halftone text
US9842281B2 (en) * 2014-06-05 2017-12-12 Xerox Corporation System for automated text and halftone segmentation
CN106033528A (zh) * 2015-03-09 2016-10-19 富士通株式会社 从彩色文档图像中提取特定区域的方法和设备
CN105472392B (zh) * 2015-12-11 2018-11-20 西安万像电子科技有限公司 基于渐进式文字块压缩的屏幕视频编解码方法及编解码器
CN105721738B (zh) * 2016-01-15 2018-05-01 天津大学 一种彩色扫描文档图像预处理方法
US9715624B1 (en) * 2016-03-29 2017-07-25 Konica Minolta Laboratory U.S.A., Inc. Document image segmentation based on pixel classification
US10460219B2 (en) 2016-03-31 2019-10-29 Hewlett-Packard Development Company, L.P. Generating an object map from a plurality of binary images
US10062001B2 (en) * 2016-09-29 2018-08-28 Konica Minolta Laboratory U.S.A., Inc. Method for line and word segmentation for handwritten text images
US9965695B1 (en) * 2016-12-30 2018-05-08 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method based on content type separation
US10922801B2 (en) 2017-07-19 2021-02-16 Lockheed Martin Corporation Channel-based binarization of color
CN107644391B (zh) * 2017-09-18 2019-11-26 北京邮电大学 一种用于打印文档溯源的数字水印处理方法及装置
US10909406B2 (en) * 2018-01-08 2021-02-02 Newgen Software Technologies Limited Image processing system and method
CN110032348B (zh) * 2019-03-21 2022-05-24 北京空间飞行器总体设计部 一种字符显示方法、装置、介质
WO2020225430A2 (en) * 2019-05-08 2020-11-12 Vrije Universiteit Brussel Computer implemented method for segmenting a binarized document
US11941794B2 (en) * 2019-08-19 2024-03-26 Current Lighting Solutions, Llc Commissioning of lighting system aided by augmented reality
CN110992387B (zh) * 2019-11-08 2022-06-10 浪潮电子信息产业股份有限公司 一种图像处理方法、装置及电子设备和存储介质
CN113362361B (zh) * 2021-07-20 2023-09-05 辽宁师范大学 形态学先验约束的甲骨文字检测的图像数据集构建方法
CN116469111B (zh) * 2023-06-08 2023-09-15 江西师范大学 一种文字生成模型训练方法及目标文字生成方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3706071A (en) * 1970-06-22 1972-12-12 Information Int Inc Binary image processor
US4701807A (en) * 1983-09-22 1987-10-20 Canon Kabushiki Kaisha Method and apparatus for processing an image
JPS6488690A (en) * 1987-09-29 1989-04-03 Toshiba Corp Euler number calculating circuit
US5131049A (en) 1989-12-08 1992-07-14 Xerox Corporation Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask
KR910020571A (ko) * 1990-05-21 1991-12-20 다카도리 수나오 데이터 처리장치
JPH06231306A (ja) 1993-02-04 1994-08-19 Matsushita Electric Ind Co Ltd 文字認識装置
JP3313447B2 (ja) 1993-03-19 2002-08-12 株式会社リコー 画像処理装置
US5974195A (en) * 1994-10-14 1999-10-26 Canon Kabushiki Kaisha Image processing apparatus and method
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
JPH10222602A (ja) * 1997-01-31 1998-08-21 Oki Electric Ind Co Ltd 光学式文字読取装置
US6266154B1 (en) 1998-05-21 2001-07-24 Oak Technology, Inc. Grayscale enhancement system and method
JP3639452B2 (ja) * 1999-02-12 2005-04-20 シャープ株式会社 画像処理装置
JP2000350021A (ja) * 1999-06-04 2000-12-15 Ricoh Co Ltd デジタル画像処理装置
US7239430B2 (en) 2002-12-12 2007-07-03 Xerox Corporation Binary halftone detection
US7453604B2 (en) * 2003-06-30 2008-11-18 Xerox Corporation Systems and methods for estimating an image marking process using scanned image attributes
JP4706187B2 (ja) 2004-05-12 2011-06-22 パナソニック株式会社 文字認識装置およびその文字認識方法
US7260276B2 (en) * 2004-06-30 2007-08-21 Sharp Laboratories Of America, Inc. Methods and systems for complexity estimation and complexity-based selection
JP4137890B2 (ja) * 2005-01-21 2008-08-20 シャープ株式会社 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
US7684633B2 (en) * 2005-06-28 2010-03-23 Xerox Corporation System and method for image file size control in scanning services
JP4139834B2 (ja) * 2005-08-31 2008-08-27 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
CN101267493B (zh) * 2007-03-16 2011-01-19 富士通株式会社 透视变形文档图像的校正装置和校正方法
US8068684B2 (en) 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
US8155437B2 (en) * 2007-09-07 2012-04-10 CVISION Technologies, Inc. Perceptually lossless color compression
JP4549418B2 (ja) * 2008-03-04 2010-09-22 シャープ株式会社 画像処理装置、画像処理方法、画像形成装置、並びに、プログラム、記録媒体
CN101567049B (zh) * 2009-05-26 2011-11-16 西安交通大学 一种半色调文档图像的噪声处理方法

Also Published As

Publication number Publication date
JP2012109941A (ja) 2012-06-07
US20120120453A1 (en) 2012-05-17
US8947736B2 (en) 2015-02-03
CN102592126B (zh) 2017-05-31
CN102592126A (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
JP5624004B2 (ja) ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
US9596378B2 (en) Method and apparatus for authenticating printed documents that contains both dark and halftone text
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
JP4494563B2 (ja) トークン化によるイメージ分割を用いたイメージ処理方法および装置
JP2005318593A (ja) より小さく圧縮された画像データ・サイズを生成するための画像データの再フォーマッティング
US8189917B2 (en) Methods and systems for locating text in a digital image
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2003132358A (ja) 画像処理方法、装置およびシステム
JP2007172132A (ja) レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2007193750A (ja) 画像処理装置、文字判定プログラム、および文字判定方法
US20100054586A1 (en) Image processing apparatus and image processing method
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
JP4164489B2 (ja) 文書画像強調方法、装置及びそのための記憶媒体
US8229214B2 (en) Image processing apparatus and image processing method
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
KR101571681B1 (ko) 동질 영역을 이용한 문서 구조의 분석 방법
JPH1027214A (ja) 光学式文字認識コンピュータにおける接触文字の分離方法及び装置
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP5222776B2 (ja) 画像処理装置及び方法
JP5517028B2 (ja) 画像処理装置
Zramdini et al. A study of document image degradation effects on font recognition
Boiangiu et al. Bitonal image creation for automatic content conversion

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140925

R150 Certificate of patent or registration of utility model

Ref document number: 5624004

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150