JP2010004152A - 画像処理装置および文字領域抽出方法、並びにコンピュータプログラム - Google Patents

画像処理装置および文字領域抽出方法、並びにコンピュータプログラム Download PDF

Info

Publication number
JP2010004152A
JP2010004152A JP2008159506A JP2008159506A JP2010004152A JP 2010004152 A JP2010004152 A JP 2010004152A JP 2008159506 A JP2008159506 A JP 2008159506A JP 2008159506 A JP2008159506 A JP 2008159506A JP 2010004152 A JP2010004152 A JP 2010004152A
Authority
JP
Japan
Prior art keywords
character
image
edge
pixel
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008159506A
Other languages
English (en)
Inventor
Takahiro Tsutsumi
隆弘 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2008159506A priority Critical patent/JP2010004152A/ja
Publication of JP2010004152A publication Critical patent/JP2010004152A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】文字領域の判別の処理において、必要となるメモリの容量を抑えつつ、従来よりも高い精度で判別ができるようにする。
【解決手段】原画像内の所定の領域に含まれる部分画像のエッジを抽出する第2エッジ抽出部107と、部分画像の低解像度画像を生成する解像度変換部101と、低解像度画像のエッジを抽出する第1エッジ抽出部102と、第1エッジ抽出部102が抽出したエッジをクロージング処理するクロージング部103と、低解像度画像内の各画素が当該低解像度画像内においてポジ領域の画素であるかネガ領域の画素であるかを判別するネガポジ判別部105と、第2エッジ抽出部107が抽出したエッジの画素、クロージング部103の処理結果、およびネガポジ判別部105の判別結果に基づいて、文字を構成する画素を抽出する文字属性判別部109と、を画像形成装置1に設けておく。
【選択図】図3

Description

本発明は、画像内において文字を示す領域を抽出する画像処理装置およびその抽出の方法などに関する。
近年、高圧縮PDF(Portable Document Format)またはコンパクトPDFなどと呼ばれる、従来よりも高い圧縮率を実現するPDFの方式が用いられている。この方式では、次のようにしてPDFファイルを生成する。まず、画像内の所定の領域を、文字が示される文字領域であるかそれ以外の非文字領域(背景領域)であるかを判別する。文字領域に対しては、文字の判読性を考慮して非文字領域よりも低い圧縮率で圧縮を行い単色の文字レイヤを生成する。非文字領域に対しては、JPEGなどの方式で高い圧縮率で圧縮を行い、JPEGレイヤを生成する。そして、それらのレイヤを用いてPDFファイルを生成する。
コンパクトPDFの方式において、文字の判読性が適切に維持されるようにする処理を行うためには、文字が示される領域を文字領域であると正しく判別する必要がある。
図12には、従来の文字領域の判別の処理の流れが示される。図12に示す方法では、まず、処理対象の画像データDJを取得し(#901)、その画像データDJに示される画像GJ内の各画素について、R(レッド)、G(グリーン)、およびB(ブルー)の色変数のうちの最小の値(MIN(RGB))を取得する(#902)。取得した値を用いてエッジ判別の処理およびネガポジ判別の処理を行う(#903および#904)。
エッジ判別の処理では、画像GJ内の各画素について、それらが画像GJのエッジの部分(エッジ部分)を形成する画素であるか否かを判別する。この処理は、例えば、公知の微分フィルタを用いて行う。
エッジ部分が検出できると、次に、検出したエッジ部分に対してクロージング処理を行う(#905)。クロージング処理では、一旦エッジ部分に対して拡張処理(ダイレーション)を行ってそのエッジ部分を太らせた(膨張させた)後、縮小処理(エローション)を行う。
図13(a)に示すように、通常、文字のエッジとエッジとの間隔は狭いので、図13(b)のようにエッジ部分を拡張処理してエッジ部分を太らせていくと、図13(c)に示すように文字の内側においてエッジ同士が結合してエッジ間が埋められる。どの程度太らせるかは、クロージングに用いるマトリクス(クロージングマトリクス)によって調整できる。エッジ間が埋められた状態で、縮小処理を行うと、図13(d)に示すような、エッジとエッジとに挟まれた文字の内部がエッジの色で塗り潰された画像が生成される。塗り潰されている部分の画素が文字の内部を構成する画素であることが検出される。
ネガポジ判別の処理では、画像GJ内の各画素が、濃度の濃い領域(ポジ領域)内の画素であるか、濃度の薄い領域(ネガ領域)内の画素であるかを判別する。この処理は、例えば次のようにして行う。
まず、図14に示すように、画像GJを所定のサイズのマトリクスに区画する(マトリクス展開する)。マトリクス内の画素の濃度値の最大値および最小値を求めそれらの中間値をリファレンス値として求める。図15に示すように、そのマトリクス内の各画素の濃度値を入力値として、リファレンス値よりも入力値が高い画素をポジ領域の画素と判別し、リファレンス値よりも入力値が低い画素をネガ領域の画素と判別する。
クロージングの処理の結果とネガポジ判別の処理の結果とによって、所定の領域内の画像が文字であるか否かおよびその文字が濃い色の文字であるか周囲の色に対して薄く抜けた文字であるかを知ることができる。
文字の色の判別は、画像GJの各画素の明度または彩度に基づいて行う(#906および#907)。彩度(W)は、例えば、次の式(1)で求めることができる。
W=MAX(RGB)-MIN(RGB) ……(1)
明度と彩度との関係を示すリファレンステーブルの値と画素の彩度とを比較することでカラーの領域とグレーの領域とを判別する。
以上の処理によって、画像GJ内にどのような文字が含まれているかが検出される(#908)。
上述のような文字領域の判別に関連する技術として、従来、特許文献1のような方法が提案されている。
特許文献1の方法によると、処理対象の600dpiの画像を半分の解像度の300dpiまで低解像度化する。その低解像度化した画像を用いて、網点の検出およびエッジの検出を行い、それらの検出の結果を用いて文字画像域を分離する。
特開平11−136505号公報
ところで、図13(d)に示すように、クロージングの処理によってエッジ間が塗り潰されると、塗り潰された部分の画素が文字の内部の画素であると特定できる。塗り潰すことができるエッジ間の距離はクロージングマトリクスによって決まるので、判別可能な文字のサイズはクロージングマトリクスに依存すると言える。よって、大きなサイズの文字に対応できるようにしようとすると、大きなサイズのクロージングマトリクスが必要となり、それによって、必要なメモリの容量が増加しコストの増加を招いてしまう。そこで、上述の特許文献1のような方法を適用することが考えられる。この方法のように画像の解像度を下げて処理を行うことによって、クロージングマトリクスのデータ量を減らすことができるので必要なメモリの容量を削減できる。
しかし、このような従来の方法では、解像度を下げたことによって、文字を構成する画素を高精度で抽出できないことがあり、文字の形状を正確に検出できないことがある。それによって、文字を表す部分が文字ではないと誤判定されてしまうおそれが増加する。小さなサイズの文字に対してはそのような問題が特に顕著に現れる。
本発明はそのような問題点に鑑み、必要となるメモリの容量を抑えつつ、従来よりも高い精度で文字領域を判別できるようにすることを目的とする。
本発明の一形態に係る画像処理装置は、原画像内の所定の領域に含まれる部分画像において文字を構成する画素を抽出する画像処理装置であって、前記部分画像のエッジを抽出する第1エッジ抽出手段と、前記部分画像を低解像度化して低解像度画像を生成する低解像度化手段と、前記低解像度画像のエッジを抽出する第2エッジ抽出手段と、前記第2エッジ抽出手段が抽出したエッジに対してクロージングを行うことによって、当該低解像度画像内の各画素について、それぞれの画素が文字の内部を構成する画素であるか否かを判別するクロージング処理手段と、前記低解像度画像の各画素について、それぞれの画素が当該低解像度画像において濃度の高いポジ領域に含まれる画素であるか濃度の低いネガ領域に含まれる画素であるかを判別するネガポジ判別手段と、前記第1エッジ抽出手段が抽出したエッジを構成する画素、前記クロージング処理手段の判別の結果、およびネガポジ判別手段の判別の結果に基づいて、前記部分画像において文字を構成する画素を抽出する文字領域抽出手段と、を有する。
好ましくは、前記部分画像内の各画素について、それぞれの画素が前記エッジ抽出手段が抽出したエッジを構成する画素であるか否かを判別するエッジ部内外判別手段を有し、
前記文字領域抽出手段は、前記エッジ部内外判別手段の判別の結果、前記クロージング処理手段の判別の結果、および前記ネガポジ判別手段の判別の結果に基づいて、前記部分画像において文字を構成する画素を抽出する。
または、前記クロージング処理手段によって文字の内部を構成すると判別された画素によって示される文字内部画像が所定画素数分拡張されるように、当該文字内部画像の境界から当該所定画素数の距離範囲内の画素を文字の内部を構成する画素として判別し直す第1ダイレーション処理手段を、有し、前記文字領域抽出手段は、前記エッジ部内外判別手段の判別の結果、前記ネガポジ判別手段の判別の結果、および前記クロージング処理手段または前記第1ダイレーション処理手段によって文字の内部を構成すると判別された画素に基づいて、前記部分画像において文字を構成する画素を抽出する。
または、前記ネガポジ判別手段によって前記ポジ領域内の画素であると判別された画素によって示されるポジ画像が所定画素数分拡張されるように、当該ポジ画像の境界から当該所定画素数の距離範囲内の画素を当該ポジ領域内の画素として判別し直す第2ダイレーション処理手段を、有し、前記文字領域抽出手段は、前記第1エッジ抽出手段が抽出したエッジを構成する画素、前記クロージング処理手段の判別の結果、および前記ネガポジ判別手段または前記第2ダイレーション処理手段によって前記ポジ領域内の画素と判別された画素に基づいて、前記部分画像において文字を構成する画素を抽出する。
または、前記文字領域抽出手段は、文字のエッジ部分については前記第1エッジ抽出手段によって抽出された画素を用い、文字の内部については前記クロージング処理手段によって文字の内部と判別された画素を用いて、文字を構成する画素を抽出する。
本発明によると、必要となるメモリの容量を抑えつつ、従来よりも高い精度で文字領域を判別できるようになる。
図1は本発明の一形態に係る画像形成装置1のハードウェア構成の例を示す図である。
画像形成装置1は、コピー、スキャナ、ファックス、ネットワークプリンティング、ドキュメントサーバ、およびファイル転送などの様々な機能を集約した複合機またはMFP(Multi Function Peripherals)などと呼ばれる画像処理装置である。
図1に示すように、画像形成装置1は、CPU10a、RAM10b、ROM10c、ハードディスク10d、制御用回路10e、操作パネル10f、通信インタフェース10g、印刷装置10h、およびスキャナ10iなどによって構成される。
スキャナ10iは、原稿の用紙に描かれている写真、文字、絵、図表などの画像を光学的に読み取って画像データを生成する装置である。
印刷装置10hは、スキャナ10iでスキャンして得た画像データまたは他の装置から送信されてきた画像データに基づいて、画像を用紙に印刷する装置である。
通信インタフェース10gは、他の装置と通信を行うためのNIC(Network Interface Card)またはモデムなどである。
操作パネル10fは、ユーザが画像形成装置1に指令を入力するための装置であり、タッチパネルおよび複数の操作ボタンなどによって構成される。
制御用回路10eは、ハードディスク10d、スキャナ10i、印刷装置10h、通信インタフェース10g、および操作パネル10fなどの装置を制御するための回路である。制御用回路10eは、例えば、種々の電子部品を用いたハードウェア回路によって構成される。
ROM10cおよびハードディスク10dには、後で説明する図2の各部の機能を実現する種々プログラム(コンピュータプログラム)およびデータがインストールされている。これらのプログラムおよびデータは必要に応じてRAM10bに読み出され、CPU10aによってプログラムが実行される。つまり、CPU10aは、コンピュータとして動作することが可能である。なお、コンピュータプログラムは、半導体メモリ、CD−ROM、およびDVDなどの記録媒体に記憶され、適宜インストールされる。または、サーバからネットワークを介してダウンロードしてインストールするようにしてもよい。
図2は画像形成装置1の機能的構成の例を示す図である。図2に示されるように、画像形成装置1は、画像データ調整部11、文字領域処理部12、孤立点判別部13、周期性判別部14、網点領域判別部15、色空間変換部16、画像データ補正部17、スクリーン・誤差拡散処理部18、およびデータ保存部19などによって構成される。
画像データ調整部11は、スキャナ10iで読み取った多階調の画像GZを示す画像データDGを取得し、画像データDGに対して、画像形式の変換および下地除去などの、これ以降の処理のための準備の処理を行う。以下、図2に示す各部によって処理された後の画像も含めて「画像GZ」と記載し、それらの各部によって処理された後の画像データも含めて「画像データDG」と記載する。
文字領域処理部12は、画像GZ内の所定の領域に示される画像(以下、「部分画像」)が文字を示すか否かを判定するための処理を行う。これについては、後で詳しく説明する。
孤立点判別部13は、画像GZに含まれる孤立点を除去する。周期性判別部14は、画像GZの周期性を判定する。
網点領域判別部15は、画像GZ内の各画素について、それらが網点を示すものであるか否かを判別する。
色空間変換部16は、画像データDGを他の色空間のデータに変換する。例えばRGBの色空間のデータからLABの色空間のデータに変換する。
画像データ補正部17は、画像データDGに対して、色補正などの種々の補正の処理を行う。スクリーン・誤差拡散処理部18は、画像データDGに対して、スクリーン制御および誤差拡散処理を行う。
データ保存部19は、スクリーン・誤差拡散処理部18によって処理された後の画像データDGをPDF(Portable Document Format)などの形式のファイルとして保存する。
図3は文字領域処理部12の構成の例を示す図、図4は第1低解像度処理の流れを説明するためのフローチャート、図5は第2低解像度処理の流れを説明するためのフローチャート、図6は高解像度処理の流れを説明するためのフローチャート、図7は本実施形態の処理の結果の画像の遷移を示す図、図8は画像GZに含まれる文字の例を示す図、図9はエッジ画像の例を示す図、図10はエッジ付近のネガポジ判別の処理を説明するための図である。
図3に示すように、文字領域処理部12は、解像度変換部101、第1エッジ抽出部102、クロージング部103、第1拡大処理部104、ネガポジ判別部105、第2拡大処理部106、第2エッジ抽出部107、エッジ部ネガポジ判別部108、および文字属性判別部109などによって構成される。
次に、文字領域処理部12の処理の詳細について、「第1低解像度処理」、「第2低解像度処理」、および「高解像度処理」の3つの処理に分けて、図4〜図6のフローチャートおよび図7を参照しながら説明する。また、図8に示すような、画像GZに含まれる「A」の文字を表す領域AR1内の部分画像GBに対して処理を行った場合の例を適宜示す。
解像度変換部101は、画像データ調整部11から取得した多階調の画像GZを示す画像データDGを低解像度化する。本実施形態では、画像データDGを、600dpiから300dpiに低解像度化する。これによって、図8に示す600dpiの「A」の文字の部分画像GBから図7の#51に示す300dpiの画像が生成される。
以下、低解像度化された後の画像を「低解像度画像GT」と記載し、低解像度画像GTを示す画像データを「低解像度画像データDT」と記載する。
第1エッジ抽出部102、クロージング部103、および第1拡大処理部104は、図4に示す第1低解像度処理を行う。
第1エッジ抽出部102は、低解像度画像GTを図14に示すように所定のサイズのマトリックスに区画してマトリクス展開し(#101)、低解像度画像GTのエッジの部分(エッジ部分)を抽出する(#102)。これによって、図7の#52の例に示すような、低解像度画像GTのエッジ部分を示す画像(以下、「低解像度エッジ画像GE」と記載する。)が生成される。
クロージング部103は、比較的大きなサイズのクロージング用のマトリクス(クロージングマトリクス)を用いて、生成された低解像度エッジ画像GEに対してクロージングの処理を行う(#104)。クロージングマトリクスとして、例えば、縦61画素および横61画素のサイズのマトリクスを用いる。これによって、図7の#53に示すような、抽出されたエッジとエッジとの間(文字の内部)がエッジの色で塗り潰された(埋められた)画像(以下、「クロージング画像GC」と記載する。)が生成される。
第1拡大処理部104は、クロージング画像GCの解像度を高解像度化することによって単純拡大する(#105)。本実施形態では、300dpiの解像度から600dpiの解像度に戻す処理を行う。これによって、図7の#54に示すような画像が得られる。
ネガポジ判別部105および第2拡大処理部106は、図5に示すような第2低解像度処理を行う。
ネガポジ判別部105は、低解像度画像GTの各画素について、それぞれが、濃度の濃い領域(ポジ領域)の画素であるか濃度の薄い領域(ネガ領域)の画素であるかの判別(ネガポジ判別)を行う。ここでは、例えば縦63画素および横63画素の比較的大きなサイズのマトリクスを用いてマトリクス展開を行い(#201)、画素の判別を行う(#202)。この判別の方法は、図15において既に説明したとおりである。
図8の例の場合、ネガポジ判別部105の処理によって、「A」の文字が濃い色で表される文字であるか、周辺の背景に対して薄く抜けた文字であるかが判別される。例えば、黒文字であるか白文字であるかが判別される。
さらに、ネガポジ判別部105は、第1拡大処理部104と第2拡大処理部106との処理の同期が図られるタイミングで、判別結果を第2拡大処理部106に出力する(#203)。
第2拡大処理部106は、ネガポジ判別部105における低解像度(300dpi)での判別結果のデータを高解像度(600dpi)の場合のデータに変換する(#204)。すなわち、低解像度でのネガポジ判別部105の判別結果に基づいて、高解像度の画像内の各画素について、それぞれの画素がポジ領域の画素であるかネガ領域の画素であるかを求める。
第2エッジ抽出部107およびエッジ部ネガポジ判別部108は、図6に示すような高解像度処理を行う。
第2エッジ抽出部107は、図9(a)に示すような、画像GZのエッジを示すエッジ画像GFを生成する(#301)。通常、文字のエッジ部分は、図9(b)に示すように、複数画素分の幅を有している。
エッジ部ネガポジ判別部108は、エッジ付近の画素について、それぞれの画素がエッジ部分の内側にあるか外側にあるかを判別する。すなわち、それぞれの画素が、エッジの部分を構成する画素であるか否かを判別する。
エッジ部ネガポジ判別部108では、比較的小さなサイズのマトリクスでマトリクス展開し(#302)、図15で説明した方法を用いて各画素がポジ領域の画素かまたはネガ領域の画素かを判別する(#303)。ここでは、ポジ領域の画素をエッジの内側の画素とし、ネガ領域の画素をエッジの外側の画素とする。なお、例えば、縦7画素および横7画素のサイズのマトリクスを用いる。
エッジ部分のように比較的狭い範囲でポジ領域およびネガ領域が入れ替わる部分については、比較的小さなサイズのマトリクスを用いてフィルタを組む。原稿をスキャナ10iで読み取った場合、MTF(Modulation Transfer Function)の影響で、原稿に含まれる細い線(細線)が、周囲の白い領域の階調に影響を受けて実際よりも明るい色の線として検出されることがある。比較的狭い範囲でポジ領域およびネガ領域が入れ替わる部分で大きなサイズのマトリクスを用いると、図10(a)に示すように、そのような細線とエッジ部分とが同じ1つのマトリクス内に含まれる可能性が高くなる。エッジ部分が含まれると、エッジ部分の濃度値の影響でそのマトリクスのリファレンス値が高くなる。細線が実際よりも明るい色として検知されるとその細線の部分の画素の入力値は低くなる。そうすると、図10(b)に示すように、細線の入力値がリファレンス値よりも低くなってしまうことがあり、それによって、細線が検出されなくなってしまうことがある。よって、エッジ付近においては、比較的小さなサイズのマトリクスを用いて、細線が正しく検出されるようにすることが望ましい。なお、図10(b)に示す入力値は、図10(a)に示す画像内のラインL1における各画素の濃度値に基づく値である。
また、低解像度でのネガポジ判別部105による判別の結果と高解像度でのエッジ部ネガポジ判別部108による判別の結果とが異なる場合は、エッジ部ネガポジ判別部108の判別の結果を採用することによって、エッジ部分の判別の精度を向上させる。
エッジ部ネガポジ判別部108は、第1拡大処理部104および第2拡大処理部106の出力との同期が図られるようにして、判別の結果を文字属性判別部109に出力する(#304)。
第1拡大処理部104、第2拡大処理部106、およびエッジ部ネガポジ判別部108の結果を統合することによって、図7の#56に示すような結果を得ることができる。なお、図7の#56において、黒色で表される部分はエッジ部ネガポジ判別部108においてポジ領域と判別された画素、つまりエッジ部分を構成する画素である。グレーで表される部分は、第1拡大処理部104から出力された、文字の内部と判定された画素を示す。または、第2拡大処理部106から出力された、ポジ領域またはネガ領域と判定された画素を示す。
なお、それぞれの出力結果を統合した際に、図7の#56に示すように、第1拡大処理部104および第2拡大処理部106の出力結果のグレーの部分がエッジ部ネガポジ判別部108の出力結果のエッジの画像よりも小さくならないようにすることが好ましい。そこで、第1拡大処理部104および第2拡大処理部106において、ダイレーション処理を行うようにしてもよい。
例えば、第1拡大処理部104において、600dpiに単純拡大した文字の内部を示す画像である文字内部画像(図7の#54においてグレーで表される部分)に対して、文字内部画像が大きくなるように外側に所定画素分拡大するようにしてもよい。すなわち、 クロージング部103によって文字の内部を構成すると判別された画素によって示される画像(文字内部画像)が所定画素数分拡張されるように、その文字内部画像の境界から当該所定画素数の距離範囲内の画素を文字の内部を構成する画素として判別し直すようにしてもよい。
また、例えば、第2拡大処理部106において、高解像度で求めたポジ領域およびネガ領域に関して、ポジ領域をネガ領域の方に所定画素数分拡大するようにしてもよい。すなわち、ネガポジ判別部105によってポジ領域内の画素であると判別された画素によって示される画像(ポジ画像)が所定画素数分拡張されるように、そのポジ画像の境界から当該所定画素数の距離範囲内の画素をポジ領域内の画素として判別し直すようにしてもよい。または、ネガ領域をポジ領域の方に所定画素数分拡大するようにしてもよい。
また、第1拡大処理部104および第2拡大処理部106におけるダイレーションの処理を高解像度化の前に行い、ダイレーションの後の画像を高解像度化するようにしてもよい。
文字属性判別部109は、第1拡大処理部104、第2拡大処理部106、およびエッジ部ネガポジ判別部108による各処理の結果のデータを用いて、処理対象の部分画像GBが文字を示す画像であるか否かを判別する。文字を示すと判別した場合に、その文字を構成する画素を抽出するとともに、その文字が周囲の色に対して色の濃い文字であるか、周囲の色に対して薄く抜けた文字であるかを判別する。
文字属性判別部109は、抽出されたエッジとエッジとの間がクロージングよってエッジの色で完全に埋められた場合に、それらのエッジが文字を形成するエッジであると判別する。
さらに、文字のエッジについて第2エッジ抽出部107によって抽出された画素を用い、文字の内部について第1拡大処理部104によって文字の内部の画素に指定された画素を用いて、当該文字を表す文字画像を生成した場合のその文字画像(図7の#57)を用いて、部分画像GB内の各画素が文字を構成する画素であるか否かを判別する。
図11は文字領域処理部12における処理の流れを説明するためのフローチャートである。
高い圧縮率を実現するPDF(コンパクトPDF)のファイルを生成する際の文字領域処理部12の処理の流れを説明する。
ユーザが画像データの保存形式としてPDFを選択し、スキャナ10iに原稿をセットして画像形成装置1にスキャンの実行を指示すと、画像形成装置1は、セットされた原稿をスキャンする。さらに、スキャンして得た画像データDGをPDFファイルに変換するために画像を調整する前処理を行う。
文字領域処理部12は、前処理が施された後の600dpiの画像GZを示す画像データDGを取得し(#11)、それを用いて300dpiの低解像度画像GTを示す低解像度画像データDTを生成する(#12)。
その低解像度画像データDTを用いて、図4の第1低解像度処理および図5の第2低解像度処理を行う(#13および#14)。また、画像データDGを用いて、図6の高解像度処理を行う(#15)。
ステップ#13〜15のそれぞれの処理によって出力されたデータの遅延を整合して同期を図る(#16)。そして、同期させたデータに基づいて、文字属性の判別を行う(#17)。
画像形成装置1は、文字を示す画像であると判別された部分画像に対しては、高い解像度を保ったままでMMRなどの可逆の圧縮方式で圧縮する。それ以外の部分画像に対しては、低解像度化した後でJPEGなどの非可逆の圧縮方式で圧縮する。それぞれの圧縮方式による圧縮データを用いてPDFファイルを生成し保存する。
本実施形態によると、比較的大きなサイズのマトリクスを用いるが厳密さが要求されない処理であるクロージングおよびネガポジ判別においては低解像度画像GTを用いる。また、高い判別精度が要求されるが小さなサイズのマトリクスで処理できるエッジ部分の判別の処理においては、元の解像度のままの画像GZを用いる。つまり、多くのメモリの容量を必要とするクロージングおよびネガポジ判別において低解像度画像GTを用いるので、必要なメモリ容量を少なく抑えることができる。しかも、高い精度が要求されるエッジ部分の判別の処理においては、解像度が高い元の画像GZを用いるので、エッジを正確に抽出でき、従来の方法よりも文字領域の判別精度を高めることができる。その結果、文字がきれいに見える。
本実実施形態では、エッジ部ネガポジ判別部108の処理を行う場合の例を示したが、これを行わないようにしてもよい。その場合は、文字属性判別部109は、第1拡大処理部104による処理の結果、第2拡大処理部106による処理の結果、および第2エッジ抽出部107によって抽出されたエッジに基づいて判別を行うようにしてもよい。
また、文字属性判別部109は、第1拡大処理部104による処理の結果および第2エッジ抽出部107によって抽出されたエッジに基づいて判別を行うようにしてもよい。
なお、画像形成装置1の全体または各部の構成、機能、処理の内容または順序、各データが示す内容などは、本発明の趣旨に沿って適宜変更することができる。
本発明の一形態に係る画像形成装置のハードウェア構成の例を示す図である。 画像形成装置の機能的構成の例を示す図である。 文字領域処理部の構成の例を示す図である。 第1低解像度処理の流れを説明するためのフローチャートである。 第2低解像度処理の流れを説明するためのフローチャートである。 高解像度処理の流れを説明するためのフローチャートである。 本実施形態の処理の結果の画像の遷移を示す図である。 画像に含まれる文字の例を示す図である。 エッジ画像の例を示す図である。 エッジ付近のネガポジ判別の処理を説明するための図である。 文字領域処理部における処理の流れを説明するためのフローチャートである。 文字領域の判別の従来の処理の流れを示す図である。 クロージングの処理の具体例を示す図である。 マトリクス展開を説明するための図である。 ネガポジ判別の処理における判別の方法を説明するための図である。
符号の説明
1 画像形成装置(領域判別装置、文字領域抽出装置)
10a CPU(コンピュータ)
101 解像度変換部(低解像度化手段)
102 第1エッジ抽出部(第2エッジ抽出手段)
103 クロージング部(クロージング処理手段)
104 第1拡大処理部(第1ダイレーション処理手段)
105 ネガポジ判別部(ネガポジ判別手段)
106 第2拡大処理部(第2ダイレーション処理手段)
107 第2エッジ抽出部(第1エッジ抽出手段)
108 エッジ部ネガポジ判別部(エッジ部内外判別手段)
109 文字属性判別部(文字領域判別手段)
GZ 画像(原画像)

Claims (7)

  1. 原画像内の所定の領域に含まれる部分画像において文字を構成する画素を抽出する画像処理装置であって、
    前記部分画像のエッジを抽出する第1エッジ抽出手段と、
    前記部分画像を低解像度化して低解像度画像を生成する低解像度化手段と、
    前記低解像度画像のエッジを抽出する第2エッジ抽出手段と、
    前記第2エッジ抽出手段が抽出したエッジに対してクロージングを行うことによって、当該低解像度画像内の各画素について、それぞれの画素が文字の内部を構成する画素であるか否かを判別するクロージング処理手段と、
    前記低解像度画像の各画素について、それぞれの画素が当該低解像度画像において濃度の高いポジ領域に含まれる画素であるか濃度の低いネガ領域に含まれる画素であるかを判別するネガポジ判別手段と、
    前記第1エッジ抽出手段が抽出したエッジを構成する画素、前記クロージング処理手段の判別の結果、およびネガポジ判別手段の判別の結果に基づいて、前記部分画像において文字を構成する画素を抽出する文字領域抽出手段と、
    を有することを特徴とする画像処理装置。
  2. 前記部分画像内の各画素について、それぞれの画素が前記エッジ抽出手段が抽出したエッジを構成する画素であるか否かを判別するエッジ部内外判別手段を有し、
    前記文字領域抽出手段は、前記エッジ部内外判別手段の判別の結果、前記クロージング処理手段の判別の結果、および前記ネガポジ判別手段の判別の結果に基づいて、前記部分画像において文字を構成する画素を抽出する、
    請求項1記載の画像処理装置。
  3. 前記クロージング処理手段によって文字の内部を構成すると判別された画素によって示される文字内部画像が所定画素数分拡張されるように、当該文字内部画像の境界から当該所定画素数の距離範囲内の画素を文字の内部を構成する画素として判別し直す第1ダイレーション処理手段を、有し、
    前記文字領域抽出手段は、前記エッジ部内外判別手段の判別の結果、前記ネガポジ判別手段の判別の結果、および前記クロージング処理手段または前記第1ダイレーション処理手段によって文字の内部を構成すると判別された画素に基づいて、前記部分画像において文字を構成する画素を抽出する、
    請求項1または2記載の画像処理装置。
  4. 前記ネガポジ判別手段によって前記ポジ領域内の画素であると判別された画素によって示されるポジ画像が所定画素数分拡張されるように、当該ポジ画像の境界から当該所定画素数の距離範囲内の画素を当該ポジ領域内の画素として判別し直す第2ダイレーション処理手段を、有し、
    前記文字領域抽出手段は、前記第1エッジ抽出手段が抽出したエッジを構成する画素、前記クロージング処理手段の判別の結果、および前記ネガポジ判別手段または前記第2ダイレーション処理手段によって前記ポジ領域内の画素と判別された画素に基づいて、前記部分画像において文字を構成する画素を抽出する、
    請求項1ないし3のいずれかに記載の画像処理装置。
  5. 前記文字領域抽出手段は、文字のエッジ部分については前記第1エッジ抽出手段によって抽出された画素を用い、文字の内部については前記クロージング処理手段によって文字の内部と判別された画素を用いて、文字を構成する画素を抽出する、
    請求項1ないし4のいずれかに記載の画像処理装置。
  6. 原画像内の所定の領域に含まれる部分画像において文字を構成する画素を抽出する文字領域抽出方法であって、
    前記部分画像のエッジを抽出する第1エッジ抽出ステップと、
    前記部分画像を低解像度化して低解像度画像を生成する低解像度化ステップと、
    前記低解像度画像のエッジを抽出する第2エッジ抽出ステップと、
    前記第2エッジ抽出ステップにおいて抽出したエッジに対してクロージングを行うことによって、当該低解像度画像内の各画素について、それぞれの画素が文字の内部を構成する画素であるか否かを判別するクロージング処理ステップと、
    前記低解像度画像の各画素について、それぞれの画素が当該低解像度画像において濃度の高いポジ領域に含まれる画素であるか濃度の低いネガ領域に含まれる画素であるかを判別するネガポジ判別ステップと、
    前記第1エッジ抽出ステップで抽出したエッジを構成する画素、前記クロージング処理ステップにおける判別の結果、およびネガポジ判別ステップにおける判別の結果に基づいて、前記部分画像において文字を構成する画素を抽出する文字領域抽出ステップと、
    を有することを特徴とする文字領域抽出方法。
  7. 原画像内の所定の領域に含まれる部分画像において文字を構成する画素を抽出する処理を行うコンピュータにおいて実行されるコンピュータプログラムであって、
    前記部分画像のエッジを抽出する第1エッジ抽出処理と、
    前記部分画像を低解像度化して低解像度画像を生成する低解像度化処理と、
    前記低解像度画像のエッジを抽出する第2エッジ抽出処理と、
    前記第2エッジ抽出処理において抽出したエッジに対してクロージングを行うことによって、当該低解像度画像内の各画素について、それぞれの画素が文字の内部を構成する画素であるか否かを判別するクロージング処理と、
    前記低解像度画像の各画素について、それぞれの画素が当該低解像度画像において濃度の高いポジ領域に含まれる画素であるか濃度の低いネガ領域に含まれる画素であるかを判別するネガポジ判別処理と、
    前記第1エッジ抽出処理で抽出したエッジを構成する画素、前記クロージング処理における判別の結果、およびネガポジ判別処理における判別の結果に基づいて、前記部分画像において文字を構成する画素を抽出する文字領域抽出処理と、
    を前記コンピュータに実行させることを特徴とするコンピュータプログラム。
JP2008159506A 2008-06-18 2008-06-18 画像処理装置および文字領域抽出方法、並びにコンピュータプログラム Pending JP2010004152A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008159506A JP2010004152A (ja) 2008-06-18 2008-06-18 画像処理装置および文字領域抽出方法、並びにコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008159506A JP2010004152A (ja) 2008-06-18 2008-06-18 画像処理装置および文字領域抽出方法、並びにコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2010004152A true JP2010004152A (ja) 2010-01-07

Family

ID=41585521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008159506A Pending JP2010004152A (ja) 2008-06-18 2008-06-18 画像処理装置および文字領域抽出方法、並びにコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2010004152A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014129018A1 (ja) * 2013-02-25 2014-08-28 三菱重工業株式会社 文字認識装置、文字認識方法及び記録媒体
JP7447472B2 (ja) 2019-12-19 2024-03-12 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014129018A1 (ja) * 2013-02-25 2014-08-28 三菱重工業株式会社 文字認識装置、文字認識方法及び記録媒体
JP2014164528A (ja) * 2013-02-25 2014-09-08 Mitsubishi Heavy Ind Ltd 文字認識装置、文字認識方法及びプログラム
JP7447472B2 (ja) 2019-12-19 2024-03-12 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
JP4498233B2 (ja) 画像処理装置および画像処理方法
US8830546B2 (en) Apparatus and method determining whether object specified to enable an underlying object to be seen there through is included in data to be printed, and medium having instructions for performing the method
CN110536040B (zh) 进行多裁剪处理的图像处理装置、生成图像的方法和介质
CN106303150B (zh) 图像处理装置及图像处理装置的控制方法
JP2010035139A (ja) 画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
JP2005045404A (ja) 画像処理装置、画像処理方法およびプログラム
JP7367159B2 (ja) 画像処理装置、画像処理方法、および、プログラム
JP6923037B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2022147074A (ja) 画像処理装置、画像処理方法およびプログラム
US9888147B2 (en) Image processing apparatus, electronic file generating method, and recording medium
JP2010004152A (ja) 画像処理装置および文字領域抽出方法、並びにコンピュータプログラム
JP2009017247A (ja) 画像処理装置およびプログラム
JP2007249774A (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2018182464A (ja) 画像処理装置及びプログラム
JP4893198B2 (ja) ファイル生成プログラム、画像処理装置、及びファイル生成方法
JP2010268138A (ja) 色調整装置、色調整方法、プログラム
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
JP5454466B2 (ja) 文字検出装置、文字検出方法、およびコンピュータプログラム
JP7330337B2 (ja) 画像処理装置、画像処理方法、及び、プログラム
US20230224421A1 (en) Image processing apparatus, image processing method, and storage medium
JP2010283464A (ja) 画像処理装置及び画像処理方法
JP2005269072A (ja) 画像処理装置
JP2019213190A (ja) 画像処理装置、画像処理方法、および、プログラム
JP2009124221A (ja) 画像処理装置及び画像処理プログラム
JP2021061564A (ja) 画像処理装置、画像処理方法、およびプログラム