JP4240107B2 - 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム - Google Patents

領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム Download PDF

Info

Publication number
JP4240107B2
JP4240107B2 JP2006293200A JP2006293200A JP4240107B2 JP 4240107 B2 JP4240107 B2 JP 4240107B2 JP 2006293200 A JP2006293200 A JP 2006293200A JP 2006293200 A JP2006293200 A JP 2006293200A JP 4240107 B2 JP4240107 B2 JP 4240107B2
Authority
JP
Japan
Prior art keywords
area
image
edge
predetermined
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006293200A
Other languages
English (en)
Other versions
JP2008112215A (ja
Inventor
和也 矢後
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2006293200A priority Critical patent/JP4240107B2/ja
Priority to US11/925,222 priority patent/US8009908B2/en
Publication of JP2008112215A publication Critical patent/JP2008112215A/ja
Application granted granted Critical
Publication of JP4240107B2 publication Critical patent/JP4240107B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

画像に含まれる特定の領域の種別を判定するための方法または装置などに関する。
スキャナなどで読み取った原稿の画像データ(画像)から特定の領域を抽出し、抽出した領域ごとに、その領域に応じた画像処理を施すことが行われている。
このような画像処理においては、まず、抽出した領域に含まれる画像の特性に応じて、その領域の種別(属性)を判定する処理を行う。
従来、そのような判定の処理の一例として、その領域が「表」についての画像を含む表領域であるか否かを判定することが行われている。
表領域についての判定を行う場合、その領域の画像に示される罫線の本数をカウントし、その本数に応じて判定を行うことが一般的である。これに関連するものとして特許文献1または2に示されるような方法が提案されている。
特許文献1の方法では、入力された画像情報から、連続している黒画素を検出することにより矩形の領域を認識する。認識した領域について、その領域の幅、高さ、面積、画素密度を用いて「文字」、「図形」、「表」などの種別を仮識別する。「表」と仮識別された領域について、ヒストグラムを作成し、そのヒストグラムの形状が所定の閾値以上である場所を罫線とみなす。そして、罫線の数が所定の閾値を超えている場合にその領域の種別が「表」であると確定する。
特許文献2の方法では、文書画像から表領域を含む図形領域を抽出する。そこから、所定の閾値以上黒画素が連続している部分を罫線として取り出し、罫線画像を生成する。その罫線画像から表領域度を求め、その表領域度をもとに、対象画像が表領域か否かを判定する。
また、上記のように罫線の本数をカウントする方法以外にも、特許文献3に示されるような方法が提案されている。
特許文献3の方法では、画像データの黒画素領域の外接矩形を求め、その外接矩形の幅および高さが所定の値より大きいかどうかを判定する。大きい場合に、その外接矩形内に2か所以上の交点があるかどうかを判断し、あれば、その外接矩形を表領域と判定する。
特開平6−208625 特開平8−249419 特開平8−44822
しかしながら、特許文献1のような方法は、画像が傾いている場合には有効ではない。なぜならば、画像が傾いていると、そこに含まれる罫線が複数のライン(画素を縦または横に連ねたライン)に跨ってしまうため、その本数を正確に求められなくなるからである。
傾きの補正を行ったとしても、若干の傾斜(0.5度程度)が残ってしまうことが多く、それによって弊害が発生する。
例えば、1画素分の幅の罫線を構成する画素の1ラインに並ぶ個数をxとすると、画像が1度傾斜している場合は、tan 1=1/xより、x=57.2 pixelとなる。これは、長さに換算して約4.84 mmとなる。また、0.5度傾斜している場合は、tan 0.5=1/xより、x=114.5 pixelとなり、約9.68 mm(約10mm)となる。すなわち、例えば判定対象の領域の画像が0.5度傾いていた場合は、判定のための閾値を、10mm未満に設定しなければ、罫線である旨の判定がされないことになる。
黒画素が10mm程度連続することは、表領域以外の領域でも十分に起こりうる。そのため、閾値をこのように低く設定してしまうと、表領域以外の領域が表領域であると誤判定されやすくなり、判定の精度を低下させてしまう。このことは、特許文献2についても同様である。
また、特許文献3の方法では、外接矩形内に2か所以上の交点がある場合に、その外接矩形を表領域と判定する。しかし、画像によっては、表領域以外で交点が2か所以上ある領域が多く存在ことがあり、そのような場合に、誤判定が多く発生することになる。
本発明は、このような問題点に鑑み、画像おける特定の領域の種別を従来よりも正確に判定できるようにすることを目的とする。
本発明の一構成に係る領域判定方法は、画像処理の対象となるべき対象画像に含まれる所定の領域の種別を領域判定装置により判定する領域判定方法であって、前記領域判定装置が、前記対象画像の画像データを入力するステップと、前記入力された画像データからエッジ画像を生成した場合に前記所定の領域においてエッジを表す画素をエッジ画素として、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成した場合に、当該第1のヒストグラムおよび当該第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出ステップと、求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定ステップと、を実行する
または、前記判定ステップにおける判定を、生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の個数と前記分散値算出ステップで求められた分散値とに基づいて行う。
また好ましくは、前記判定ステップにおける判定を仮の判定とし、前記所定の領域を表領域およびグラフ領域のうちの少なくとも一方であると前記判定ステップにおいて仮に判定した場合に、前記領域判定装置が、前記エッジ画像を生成した場合に前記所定の領域においてエッジを表す部分の量に関する、当該所定の領域内における割合の値を求め、求めた値に基づいて、当該所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する本判定ステップをさらに実行する
また、前記所定の領域は、小領域、下地領域、写真領域、表領域、グラフ領域、またはそれら以外のその他領域のいずれかであり、前記所定の領域が小領域であるか否かを判定し、小領域でないと判定した場合に、当該所定の領域が下地領域または前記その他領域のいずれかであるか否かを判定し、下地領域および前記その他領域のいずれでもないと判定した場合に、当該所定の領域に含まれる画像の傾きを補正する処理を行い、画像の傾きを補正する処理が行われた後の前記所定の領域について前記第1のヒストグラムおよび前記第2のヒストグラムを生成する。
また、前記所定の領域を表領域およびグラフ領域のうちの少なくとも一方であると判定した場合に、前記対象画像から2値画像を生成した場合に前記所定の領域においてドットが打たれる画素をドット画素として、当該所定の領域内の連なった当該ドット画素である連結画素群の境界に接する画素の個数に関する割合の値を求め、求められた値に基づいて、前記所定の領域が表領域またはグラフ領域のいずれであるかを判定する。
なお、前記所定の領域は、前記対象画像から2値画像を生成した場合の当該2値画像においてドットが打たれる画素をドット画素とした場合に、連なった当該ドット画素を包含する矩形の領域である。
本発明の一構成に係る画像処理装置は、画像処理を実行するための画像処理装置であって、画像処理の対象となるべき対象画像に基づいてエッジ画像を生成するエッジ画像生成手段と、生成された前記エッジ画像の所定の領域においてエッジを表す画素であるエッジ画素に関して、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成する、ヒストグラム生成手段と、生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出手段と、求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定手段と、前記判定手段による判定の結果に応じた画像処理を前記対象画像の当該判定に係る領域に対して施す画像処理実行手段と、を有する。
画像が傾いていたとしても、その画像の特定の領域の種別を的確に判定できるようになる。
一般に、高圧縮PDFという機能が用いられている。この機能では、画像データから特定の領域を抽出し、領域ごとにその領域に応じた処理を施すことによってデータ量の小さなPDF形式のファイル(PDFファイル)を生成する。
本実施形態では、画像形成装置1がこの高圧縮PDFファイルを生成する際の処理に本発明を適用する場合の例を示す。
〔画像形成装置の構成〕
図1は本発明に係る画像形成装置1を有するシステム構成の例を示す図、図2は画像形成装置1のハードウェア構成の例を示す図である。
図1に示す画像形成装置1は、コピー、スキャナ、ファックス、ネットワークプリンティング、ドキュメントサーバ、およびファイル転送などの様々な機能を集約した画像処理装置である。複合機またはMFP(Multi Function Peripherals)などと呼ばれることもある。
この画像形成装置1は、役所または企業などのオフィス、学校または図書館などの公共施設、コンビニエンスストアなどの店舗、その他種々の場所に設置され、複数のユーザによって共用することができる。また、パーソナルコンピュータまたはワークステーションなどの端末装置2およびサーバ3と通信回線4を介して接続可能である。通信回線4として、インターネット、LAN、公衆回線、または専用線などが用いられる。
画像形成装置1は、図2に示すように、スキャナ10a、CPU10b、ハードディスク10c、RAM10d、ROM10e、印刷装置10f、モデム10g、ネットワークインタフェース10h、制御用回路10k、および操作パネル10mなどによって構成される。
スキャナ10aは、原稿の用紙(以下、単に「原稿」と記載する。)に描かれている写真、文字、絵、図表などの画像を光学的に読み取って電子データ化する装置である。読み取られた原稿の画像データ(イメージデータ)はRAM10dに記憶され、後に説明するように、様々な処理が施されてファイル化される。本実施形態では、カラースキャナが用いられる。
印刷装置10fは、スキャナ10aで読み取られた画像データ(画像)または端末装置2などから送信されてきた画像を、イエロー、マゼンタ、シアン、およびブラックの4色のトナーを使用して用紙に印刷する装置である。
操作パネル10mは、操作部および表示部によって構成される。操作部としてテンキーなどが用いられ、表示部として液晶ディスプレイなどが用いられる。ユーザは、操作部を操作することによって、画像形成装置1に対して、処理の実行開始または中断などの指令を与え、データの宛先、スキャン条件、または画像ファイルフォーマットなどの処理条件を指定し、その他種々の事項を指定することができる。表示部には、ユーザに対してメッセージまたは指示を与えるための画面、ユーザが所望する処理の種類および処理条件を入力するための画面、および画像形成装置1で実行された処理の結果を示す画面などが表示される。操作パネル10mとしてタッチパネルを用いた場合は、タッチパネルが操作部および表示部の両方を兼ねる。このように、操作パネル10mは、画像形成装置1を操作するユーザのためのユーザインタフェースの役割を果たしている。
CPU10bは、スキャナ10aが読み取った原稿の画像データをTIFF、JPEG、ビットマップ、およびPDFなどの形式のファイルに変換するための処理を行う。また、ユーザからの入力の検出、操作パネル10mの表示の制御,または電子メールの作成など、画像形成装置1の全体的な制御を行う。
モデム10gは、NCU(Network Control Unit)が内蔵されており、アナログの公衆回線を介して他のファックス端末と接続し、ファクシミリプロトコルに基づくデータ制御およびファックスデータの変復調などを行う。ネットワークインタフェース10hは、NIC(Network Interface Card)であって、LANまたはインターネットなどを介して端末装置2などへの接続を行い、プロトコルの作成などを行う。
制御用回路10kは、ハードディスク10c、操作パネル10m、スキャナ10a、印刷装置10f、モデム10g、およびネットワークインタフェース10hなどの装置を制御するための回路である。
ハードディスク10cには、後に説明する図3に示すような各部の機能を実現するためのプログラムおよびデータなどが格納されている。これらは必要に応じてRAM10dに読み出され、CPU10bによってプログラムが実行される。これらのプログラムまたはデータの一部または全部を、ROM10eに記憶させておいてもよい。または、図3の機能の一部または全部を、制御用回路10kによって実現するようにしてもよい。
〔画像処理装置の機能的な構成〕
図3は画像形成装置1の機能的な構成の例を示す図、図4は前処理部13、領域属性判定部14、および文字ブロック処理部15の構成の例を示す図、図5は原稿画像GGおよび明度原稿画像GMなどの例を示す図、図6はエッジ画像の例を示す図、図7はブロックAKの統合を説明するための図である。次に、図3などを参照して画像形成装置1の各部の処理について説明する。
図3に示すように、画像形成装置1は、ファイル保存部11、画像データ取得部12、前処理部13、領域属性判定部14、文字ブロック処理部15、文字ブロック統合部16、可逆圧縮部17、非文字ブロック統合部18、解像度変換部19、非可逆圧縮部20、およびファイル生成部21などから構成される。
ファイル保存部11は、ファイル生成部19によって生成されるPDFファイルを保存する。
画像データ取得部12は、スキャナ10aが読み取った原稿の画像データである原稿画像データGGを取得する。この原稿画像データGGは、TIFF、JPEG、またはビットマップなどの形式のイメージデータとしてスキャナ10aから出力される。なお、以下において、「画像データ」および「原稿画像データ」の「データ」を省略し、それぞれ、単に「画像」および「原稿画像」と記載することがある。後に説明するその他の画像データについても同様である。
前処理部13は、領域属性判定部14の処理のための前処理を行う。この前処理部13は、図4に示すように下地除去部41、明度画像生成部42、およびスムージング部43などによって構成される。
図4において、下地除去部41は、原稿画像GGに対してコントラスト伸張処理を施し、薄い色で表される下地の部分を除去する。これによって、原稿画像GGの画像の傾向を整える。
明度画像生成部42は、下地除去の処理が施された原稿画像GGbに基づいて明度を算出し、明度で表される画像(明度画像)を生成する。ここで明度画像を生成するのは、これ以降の処理が明度画像を対象にしているからである。
これによって、元の原稿画像GGに対応した明度画像である明度原稿画像GMが生成される。例えば、図5に示すような原稿画像GGであった場合、同図に示すように、対応した内容の画像を表す明度原稿画像GMが生成される。すなわち、「元の原稿画像GGに対応した明度画像」とは、この例のように、元の原稿画像GGと同じまたは対応する広さの領域にその原稿画像GGに対応した内容を表す明度画像のことである。他の画像についても同様である。
なお、本実施形態では、R(赤)、G(緑)、およびB(青)の各原色(以下、「RGB」と記載する。)による24ビットの階調性を有するフルカラー画像(カラー画像)である原稿画像GGbから8ビットの階調性を有する明度原稿画像GMを生成する。
スムージング部43は、明度画像生成部42によって生成された明度原稿画像GMに対してスムージングを行う。スムージングによってノイズが除去されることにより以降の処理における情報の誤検出が低減される。
図3に戻って、領域属性判定部(図写真判定部)14は、図4に示すように、2値化部51、ラベリング部52、および判定処理部53などから構成されており、スムージングが施された明度原稿画像GMbに含まれる特定の領域の属性(種別)を判定(判別)するための処理を行う。すなわち、別の属性を有した領域同士を区分けする(分離または分割する)処理を行う。
図4において、2値化部51は、明度原稿画像GMbを2値化し、元の原稿画像GGに対応した2値画像である2値原稿画像GVを生成する。
ラベリング部52は、2値化部51によって生成された2値原稿画像GVから、連なった黒画素(ドットが打たれている画素)によってできる連結黒画素群を検出し、その連結黒画素群に対してラベリングを行う。すなわち、一つの連結黒画素群を構成する各画素に対して同じ識別番号(ラベリング番号)を割り振り、その連結黒画素群を包含する(囲む)矩形の領域(矩形領域)を定義して求め、その位置を検出する。または、互いに所定の距離内にある連結黒画素群同士を一つの連結黒画素群とみなし、一つとみなしたその連結黒画素群に対してラベリングするようにしてもよい。それによって、比較的近い距離にある文字などに対して一つの矩形領域が定義される。なお、このようにラベリングを行うのは、次の判定処理部53での処理が矩形領域の単位で行われるからである。
以下、ラベリングされた各画素のことを「ラベリング画素」と記載することがある。また、連結黒画素群を包含する矩形領域を「ブロックAK1」、「ブロックAK2」、…と記載することがある。また、連番を省略することによってこれらを「ブロックAK」とまとめて記載することもある。他の符号についても同様に、連番などを付すことによって区別して記載しまたは連番を省略することによってまとめて記載することがある。
ところで、原稿画像GGには、図5の例のように様々な内容の部分(部分画像)が含まれる。例えば、小さな文字を表す部分画像、小さな枠線を表す部分画像、丸または三角などの図形を表す部分画像、写真の部分画像、表を表す部分画像、グラフを表す部分画像、および大きな文字など上記以外のものを表す部分画像などである。
これらの部分画像は2値化された場合に連結黒画素群を含む。従って、上記のラベリングにおいては、2値原稿画像GVから、これらのような部分画像の単位でブロックAKが求められる。図5の原稿画像GGに対応付けて考えると、同図において一点鎖線で示されるようなブロックAK1、AK2、…が求められる。図では省略しているが、原稿画像GG内において一点鎖線で囲まれていないその他の文字にもそれぞれラベリング番号が与えられる。ブロックAK6の中の他の文字についても同様にそれぞれラベリング番号が与えられる。
なお、「小さな文字を表す部分画像」とは、例えば、図5において、ブロックAK5に含まれるような画像のことである。「小さな枠線を表す部分画像」とは、ブロックAK4に含まれるような画像のことである。「写真の部分画像」とは、ブロックAK3に含まれるような画像のことである。「表を表す部分画像」とは、ブロックAK6に含まれるような画像のことである。「グラフを表す部分画像」とは、ブロックAK10に含まれるような画像のことである。「大きな文字など上記以外のものを表す部分画像」とは、ブロックAK1に含まれるような画像のことである。
さらに、ラベリング部52は、原稿画像GGまたは原稿画像GGbのうちでブロックAKに対応する部分のカラー画像を取得する。そして、そのブロックAKの位置(ブロック位置)、サイズ(ブロックサイズ)、および取得したカラー画像など、そのブロックAKについての情報を示すブロックデータDKを生成する。以下、ブロックデータDKに示されるカラー画像などの画像を「ブロック画像」と記載することがある。これ以降の処理においてブロックAKについての処理を行う場合、その処理の対象となるブロックAKの情報は、対応するブロックデータDKから取得される。
なお、本実施形態においては、ブロック位置は、原稿画像GGの左上端を原点とした場合の、そのブロックAK内の左上端の画素のその原稿画像GG内における座標によって示される。ブロックサイズは、ブロックAKの縦方向の画素数および横方向の画素数によって示される。
判定処理部53は、ブロックAK内の画像の特性に応じてそのブロックAKの属性を判定するため処理を行う。
具体的には、文字または枠線などの小さな部分画像に対して定義されたブロックAKの属性を「小領域」と判定し、下地を表す部分画像(下地についての部分画像)に対して定義されたブロックAKの属性を「下地領域」と判定し、写真の部分画像に対して定義されたブロックAKの属性を「写真領域」と判定し、表を表す部分画像に対して定義されたブロックAKの属性を「表領域」と判定し、グラフを表す部分画像に対して定義されたブロックAKの属性を「グラフ領域」と判定し、大きな文字などを表す上記以外の部分画像に対して定義されたブロックAKの属性を「その他領域」と判定するための処理を行う。
ここにおいて、「下地を表す部分画像」とは、1つの色で塗りつぶされたような部分画像のことである。
本実施形態では、丸または三角などの図形を表す部分画像の領域(「図領域」)を「写真領域」として考える。
なお、この判定処理部53の処理の手順などについては、後に〔判定処理部の構成〕において詳しく説明する。
図3にもどって、文字ブロック処理部(文字抽出部)15は、図4に示すように文字エッジ抽出部71、傾き補正部72、罫線除去部73、文字判定部74、網点除去部75、2値化部76、および色決定部77などによって構成されており、これら各部によって、文字が含まれているブロックAKに対して所定の処理を行う。
図4において、文字エッジ抽出部71は、スムージングが施された明度原稿画像GMb中のエッジの部分を抽出し、画像のエッジの部分を示すエッジ画像を生成する。エッジ画像とは、例えば図6に示すような画像である。
図6(a)は、建物の写真の画像を基にして生成したエッジ画像を示している。図6(b)は、表を表す画像を基にして生成したエッジ画像を示している。図6では、画像のエッジの部分をドットが打たれていない白の画素(白画素)で表し、それ以外の部分を黒画素で表している。
これによって、元の原稿画像GGに対応したエッジ画像であるエッジ原稿画像GEが生成される。
ここで生成したエッジ原稿画像GEは、これ以降の処理において使用する。2値画像を使用することも考えられるが、エッジ画像を用いた方が2値画像を用いるよりも処理を高速化できるという利点がある。
傾き補正部72は、エッジ原稿画像GE全体またはブロックAK内の画像の傾きを検出し、それを補正する。この傾き補正は、次の罫線除去部73で罫線を除去する処理の精度を向上させるために行う。傾きの補正に関しては後に〔判定処理部の構成〕において詳しく説明する。
罫線除去部73は、エッジ原稿画像GEから罫線を除去することによってそのエッジ原稿画像GEに含まれる文字と罫線とを分離するための処理(罫線除去処理)を行う。係る処理は例えば以下のようにして行う。
まず、エッジ原稿画像GEから、横方向(水平方向)に連続する白画素の個数を縦方向(垂直方向)の各位置(座標位置)において求める。求めた個数が所定の閾値以上である場合に、その個数に係る白画素を横方向に引かれた罫線とみなし、それをエッジ原稿画像GEから除去する。すなわち、その白画素を黒画素に変換する。同様にして、縦方向に引かれた罫線も除去する。
この罫線除去処理は、次の文字判定部74で文字を判定する処理の精度を向上させるために行う。
文字判定部(文字連結部)74は、罫線除去処理が施されたエッジ原稿画像GEbを用いて、ブロックAK内の画像が文字を表している(ブロックAKが文字を含む)か否かを判定する。例えば、エッジ原稿画像GEbのうちでブロックAKに対応する部分のエッジ画像を用いて、そのブロックAK内に占めるエッジ部分の画素の割合などに基づいて判定する。
このような文字を含むか否かの判定(文字の判定)の方法または判定に用いられる閾値などは、判定処理部53によって判定されたブロックAKの属性に応じて変更される。その理由は、ブロックAK内の画像の内容によってそこに含まれる文字の特徴が変わるからである。
例えば、表を表す画像には行単位で文字が羅列されていることが多く、グラフを表す画像には1文字単位、長くても単語単位に文字が表されていることが多い。そのため、「表領域」と判定されたブロックAKについては、行単位に文字を判定するのに適した処理を行う。「グラフ領域」と判定されたブロックAKについては、単語単位に文字を判定するのに適した処理を行う。
また、写真の画像については、文字の判定をすることが難しい。従って、ブロックAKの属性が「写真領域」と判定された場合は、文字の判定は行わない。写真の画像に対して文字の判定を行った場合、実際には文字ではないものを文字と判定することにより画質の劣化を招くことがある。
従って、判定処理部53での判定の結果は、文字判定部74での判定の精度に影響することになる。
さらに、文字判定部74は、文字を含むと判定したブロックAK(以下、「文字ブロックAKM」と記載することがある。)についてのブロックデータDK(以下、「文字ブロックデータDKM」と記載することがある。)を網点除去部75に対して出力する。また、文字を含むと判定しなかったブロックAK(以下、「非文字ブロックAKH」と記載することがある。)についてのブロックデータDK(以下、「非文字ブロックデータDKH」と記載することがある。)を非文字ブロック統合部18に対して出力する。
網点除去部75は、文字ブロックデータDKMに示されるブロック画像に対して公知の方法を用いて網点除去を行う。
2値化部76は、網点除去が施されたブロック画像を2値化する。これによって、ブロック画像内の文字と背景とを分離する。
色決定部77は、原稿画像GGbのうちで文字ブロックAKMに対応する部分のカラー画像を取得し、それを用いてその文字ブロックAKMに含まれる文字の色(ブロック文字色)およびその背景の色(ブロック背景色)を決定する。決定した色を示すデータをその文字ブロックAKMの文字ブロックデータDKMに対して付加する。なお、ここにおいて、原稿画像GGbではなく、前処理が施される前の原稿画像GGを用いてもよい。
図3に戻って、文字ブロック統合部16は、文字ブロックデータDKMのうちで所定の条件を満たす関係にあるもの同士を統合して一つの文字ブロックデータDKMにするための処理を行う。ここで、図7を参照して、この統合の処理について説明する。
図7において、「あ」、「い」、「う」、「え」、および「お」などの文字を含む文字ブロックAKM1、AKM2、…が示されている。なお、図7において、各文字ブロックAKMのブロック位置を、原稿画像GGの左上端を原点とし画素の横方向の座標をX座標とし画素の縦方向の座標をY座標して、それぞれ、(x,y)、(x,y)、…とする。また、ブロックサイズを、縦の長さと横の長さを「(縦の長さ,横の長さ)」と表記して、それぞれ、(a,b)、(a,b)、…とする。
ここにおいて、図7(a)の文字ブロックAKM1の文字ブロックデータDKM1と文字ブロックAKM2の文字ブロックデータDKM2とを統合する場合を考える。この統合は以下の手順で行う。
まず、文字ブロックAKM1と文字ブロックAKM2とを包含する矩形領域を検出する。これによって、図7(b)に示す文字ブロックAKM6が検出される。次に、文字ブロックデータDKM1および文字ブロックデータDKM2に示されるブロック文字色およびブロック背景の加重平均を求め、それらをそれぞれ統合後の文字ブロックAKM6のブロック文字色およびブロック背景色とする。そして、文字ブロックAKM6内に含まれる画像、求めたブロック文字色、求めたブロック背景色、文字ブロックAKM6のブロック位置(x,y)、およびブロックサイズ(a,b)を示す文字ブロックデータDKM6を生成する。新たな文字ブロックデータDKM6が生成されることによって統合が完了する。
文字ブロック統合部16は、統合の後に残った文字ブロックデータDKMに対して、さらに上記のような統合の処理を繰り返す。例えば、図7(b)の文字ブロックAKM3および文字ブロックAKM4の文字ブロックデータDKMを統合することによって、図7(c)に示すような文字ブロックAKM7の文字ブロックデータDKM7を生成する。さらに、図7(c)の文字ブロックAKM6および文字ブロックAKM7の文字ブロックデータDKMを統合することによって、図7(d)に示すような文字ブロックAKM8の文字ブロックデータDKM8を生成する。このような統合によって、図7の例では、文字ブロックデータDKMの個数、すなわち文字ブロックAKMの個数が5個から2個に減少する。文字ブロックデータDKMの個数が減少することによって、後に作成されるPDFファイルのデータ量が低減される。
なお、図7では、横方向に並ぶ文字ブロックAKMについての統合の例を示したが、縦方向または斜め方向についても同様の手順で統合が行われる。
図3に戻って、可逆圧縮部17は、統合処理部15の統合の処理の後に残った文字ブロックデータDKMを取得し、それに示されるブロック画像を可逆圧縮の方式で圧縮する(可逆圧縮する)。そして、圧縮されたブロック画像を含む文字ブロックデータDKMを出力する。なお、本実施形態では、可逆圧縮の方式としてMMRを用いる。
非文字ブロック統合部18は、非文字ブロックデータDKHのうちで所定の条件を満たす関係にあるもの同士を統合して一つの非文字ブロックデータDKHにするための処理を行う。統合の方法は、文字ブロック統合部16と同様である。
解像度変換部19は、非文字ブロックデータDKHに示されるブロック画像に対して低解像度化の処理を行う。
非可逆圧縮部20は、低解像度化された非文字ブロックデータDKHのブロック画像を非可逆圧縮し、圧縮されたブロック画像を含む非文字ブロックデータDKHを出力する。なお、本実施形態では、非可逆圧縮の方式としてJPEGを用いる。
ファイル生成部21は、可逆圧縮部17および非可逆圧縮部20から出力される文字ブロックデータDKMおよび非文字ブロックデータDKHを用いてPDFファイルを生成するための処理を行う。
〔判定処理部の構成〕
図8は判定処理部53の構成の例を示す図、図9は下地その他領域についての判定方法を説明するための図、図10は下地その他領域についての判定の際に作成するヒストグラムの例を示す図、図11は傾き補正における傾き検出の処理の流れを説明するためのフローチャート、図12は傾き検出を説明するための図、図13は傾き補正の処理の流れを説明するためのフローチャート、図14は傾き補正の方法を説明するための図、図15は表を表す画像についてのヒストグラムの例を示す図、図16はヒストグラムの山の幅の求め方を説明するための図、図17はグラフを表す画像についてのヒストグラムの例を示す図、図18は写真の画像についてのヒストグラムの例を示す図、図19は表を表す画像が傾いている場合のヒストグラムの例を示す図、図20はエッジ画素の個数の求めた方を説明するための図、図21はラベリングエッジ画素率の求め方を説明するための図である。次に、図8に示す判定処理部53の各部の処理について説明する。
図8に示すように、判定処理部53は、小領域抽出部61、下地その他領域抽出部62、傾き補正部63、表グラフ領域仮判別部64、表グラフ領域本判定部65、および表グラフ判別部66などから構成される。
小領域抽出部61は、小さな文字または枠線の部分画像に対して定義されたブロックAK(ブロックAKの属性)を小領域と判定し、そのブロックAKのブロックデータDKを抽出するための処理を行う。この処理は以下のようにして行う。
まず、ブロックデータDKを取得し、処理するブロックデータDKを一つ選択する。選択したブロックデータDKからそこに示されるブロックサイズを取得する。取得したブロックサイズから、処理対象のブロックAKの縦および横の長さがいずれも250pixel以下であるか否かを判定する。250pixel以下であった場合に、そのブロックAKのラベリング率が70%以上であるか否かを判定する。このラベリング率は、そのブロックAK内のラベリング画素の個数を「k」、そのブロックAKの縦の長さを「a」、横の長さを「b」として、次の式によって算出する。
ラベリング率 = (k/(a×b))×100 ……(1)
ラベリング率が、70%以上であった場合に、そのブロックAKを小領域と判定する。
さらに、このような判定を全てのブロックAKについて行い、小領域と判定したブロックAKのブロックデータDK(ブロックデータDKw)を抽出する。
なお、この際に、抽出するブロックデータDKwに対して、そのブロックAKが小領域であることを示すデータを付加する。
上記の処理によって、小さな文字などについてのブロックAKを適切に小領域と判定できる。その理由は、小さな文字などを表す部分画像についての矩形領域はブロックサイズが小さく且つラベリング率が高い傾向にあるため、その特徴(特徴量)を利用することで、それを小さな文字などを表す部分画像についての矩形領域であると識別できるからである。
これによって、小さな文字などを表す部分画像についてのブロックAKが、下地その他領域抽出部62以降の判定の処理の対象から除外される。
なお、前処理部13の処理の際に小領域についてのブロックデータDKwを予め抽出しておくようにしてもよい。
下地その他領域抽出部62は、下地または大きな文字などを表す部分画像に対して定義されたブロックAKを下地領域またはその他領域と判定し、そのブロックAKのブロックデータDKを抽出するための処理を行う。なお、ここでは、小領域抽出部61の処理の際に抽出されずに残ったブロックデータDKを処理の対象とする。
これに際して、まず、ブロックAKが下地領域またはその他領域のいずれかであるか否かをブロックAKごとに判定する。この判定は図9に示すような手順で行う。
まず、小領域抽出部61の処理の際に抽出されずに残ったブロックデータDKを取得し、処理するブロックデータDKを一つ選択する。選択したブロックデータDKに示されるブロック画像(この時点では、カラー画像)を取得し、そのブロック画像に基づいてRGBごとに、図10(a)に示すようなヒストグラムを生成する(図9の#101)。
図10において、ヒストグラムのX軸は、画素の濃度値を示す。Y軸は、X軸に示される濃度値の画素のそのブロックAK内における個数を示す。このヒストグラムの生成に際しては、そのブロックAKを縦方向(副走査方向)および横方向(主走査方向)に1/8にスムージングしながら走査してRGBごとに各濃度値についての個数を求める。すなわち、8個おきに画素の濃度値を取得し、その濃度値についての個数をカウントアップする。求めた個数をRGBごとに集計してヒストグラムを生成する。1/8にスムージングして圧縮することによって、網点のように鋭いピークがでにくいものまたは単色の線画などを除外することができる。
生成した各ヒストグラムにおいて個数の最大値(ピーク値)PVr、PVg、およびPVbの点(ピーク)PKr、PKg、およびPKbを求める(#102)。各ヒストグラムにおいて、求めたピークPKのX座標を「255」に一致させる。すなわち、個数がピーク値PVであるヒストグラムの柱が「255」の濃度値の場所に位置するように、ヒストグラム全体を平行移動する。そして、平行移動させた各ヒストグラムを合成(集計)する(#103)。これによって、図10(b)のような合成ヒストグラムが生成される。
そして、合成ヒストグラムにおいて、ピークPKのX座標(「255」)から±16の範囲内にブロックAKの全体の2/3(約66%)の画素が集中しているかどうかを判定する。すなわち、±16の範囲内の画素の個数(画素数)が全体の画素の個数(ヒストグラムの面積)に対して66%以上であるかどうかを判定する。そして、66%以上であった場合に、そのブロックAKを下地領域またはその他領域と判定する。なお、本実施形態においては、1/8にスムージングしてこのヒストグラム作成した。よって、この場合の「全体の画素の個数」とは、ブロックAK内の画素の総数の1/8を指す。
続いて、そのように判定された各ブロックAKが下地領域またはその他領域のいずれであるかを判別する。この判別に際して、まず、各ブロックAKのラベリング率(下地率)を既に説明した式(1)によって求める。
求めたラベリング率が90%以上であるブロックAKを下地領域と判別し、90%未満であるブロックAKをその他領域と判別する。
小領域抽出部61によって抽出されなかった全てのブロックデータDKのブロックAKに対して上記の処理を行う。そして、下地領域であると判別したブロックAKのブロックデータDKであるブロックデータDKsと、その他領域であると判別したブロックAKのブロックデータDKであるブロックデータDKoとを抽出し、これ以降の判定の処理の対象から除外する。
なお、この際に、ブロックデータDKsに対して、ブロックAKが下地領域であることを示すデータを付加し、ブロックデータDKoに対して、ブロックAKがその他領域であることを示すデータを付加する。
上記の処理によって、下地または大きな文字などを表す部分画像についてのブロックAKを下地領域またはその他領域と適切に判定できる。その理由は、下地はラベリング画素が単色で構成されていることが多くまた大きな文字などについての部分画像は単色の構成比率が多いため、それらのような特徴をヒストグラムによって抽出できるからである。なお、通常は、スペクトルスケールの1/8の区間に画素の2/3が集中していれば、下地領域またはその他領域のいずれかであると判定する。
傾き補正部63は、下地・その他領域抽出部62の処理の際に抽出されずに残ったブロックデータDKのブロックAKに含まれる画像に対して傾きを補正する処理(傾き補正)を行う。これに際して、まず、図11に示すような手順で傾きの検出しその傾斜角度を求める。
まず、ラベリング画素によって構成される画像(以下、「ラベリング画像GR」と記載する。)に沿った、図12に示すような矩形KK1を求める(図11の#111)。このような矩形KK1を求めるにあたっては、例えば、ラベリング画像GR内で最も上側にある画素PTt、最も下側にある画素PTb、最も左側にある画素PTe、最も右側にある画素PTwの位置を検出する。検出した位置に基づいて、画素PTtと画素PTeとを結ぶ直線、画素PTeと画素PTbとを結ぶ直線、画素PTbと画素PTwとを結ぶ直線、および画素PTwと画素PTtとを結ぶ直線をそれぞれ求める。そして、それらの直線に囲まれる領域を矩形KK1と定義する。
矩形KK1を求めた後、それに外接する外接矩形KK2を求める(#112)。外接矩形KK2と矩形KK1とによってできる余白部分の三角形TRの縦の長さおよび横の長さ(画素数)を求める(#113)。
求めた縦の長さ(trv)および横の長さ(trh)から矩形KK1の傾斜角度θを次の式によって求める(#114)。
θ=tan-1(trv/trh) ……(2)
次に、求めた傾斜角度θに基づいて、傾きを補正するための処理を図13に示すような手順で行う。
まず、図14(a)に示すように、ラベリング画像GRの各ラベリング画素を、矩形KK1の左側の辺が外接矩形KK2の左側の辺に沿うようになる長さ分だけ横方向に平行移動する(図13の#121)。この長さは、画素PTeの位置を原点とした場合の各ラベリング画素の縦方向の位置と傾斜角度θとによって求めることができる。
さらに、図14(b)に示すように、各ラベリング画素を、矩形KK1の上側の辺が外接矩形KK2の上側の辺に沿うようになる長さ分だけ縦方句に平行移動する(#122)。この長さは、画素PTtの位置を原点とした場合の各ラベリング画素GRの横方向の位置と傾斜角度θとによって求めることができる。すなわち、三角形TRの余白を埋めるように画素を縦および横の方向に移動することによって傾きを補正する。これによって、図14(c)に示すような、傾きが補正されたラベリング画像GRbが得られる。
表グラフ領域仮判定部64は、表またはグラフを表す部分画像に対して定義されたブロックAKを表グラフ領域と仮判定するための処理を行う。この処理は以下のようにして行う。
まず、傾き補正部によって傾き補正が施されたブロックデータDKを取得し、処理するブロックデータDKを一つ選択する。選択したブロックデータDKに示されるブロック画像(カラー画像)のエッジ部分を抽出することによってそのブロック画像に対応したエッジ画像(以下、「ブロックエッジ画像BE」と記載する。)を生成する。
なお、ここでは、ブロック画像からエッジ部分を抽出する(エッジ画像を生成する)ことによってブロックエッジ画像BEを取得する場合の例を示したが、他の方法によって取得することも可能である。例えば、エッジ原稿画像GEを予め生成しておき、そのエッジ原稿画像GEから、処理対象のブロックAKに対応する部分のエッジ画像を抽出することによって、そのブロックAKについてのブロックエッジ画像BEを取得するようにしてもよい。
また、図6においては、エッジ部分を白画素で表しその他の部分を黒画素で表したエッジ画像の例を示したが、ここでは、説明簡単のため、それを反転したエッジ画像、すなわちエッジ部分を構成する画素(エッジ画素)を黒画素で表しその他の部分を白画素で表したエッジ画像用いることとする。
生成したブロックエッジ画像BEを用いて図15に示すようなヒストグラムを生成する。図15はブロックエッジ画像BEが表を表すエッジ画像である場合の縦方向に伸びるヒストグラムHSvと横方向に伸びるヒストグラムHShとを示している。ここにおいて、ヒストグラムHSvのX軸は、ブロックAK内における横方向の画素の位置(座標)を示す。Y座標は、X軸に示される各位置において縦方向に配置されている黒画素の個数を示す。ヒストグラムHShのX軸は、ブロックAK内における縦方向の画素の位置(座標)を示す。Y座標は、X軸に示される各位置において横方向に配置されている黒画素の個数を示す。
生成した各ヒストグラムHSからピークPKHを検出し、ヒストグラムの最大値(ピーク値PVH)を求める。求めた各ピーク値PVHvおよびPVHhの33%にあたる値を求め、その値を各ヒストグラムHSのそれぞれの閾値VSHvおよびVSHhとする。
極値が閾値VSHを越える山MTをヒストグラムHSvおよびHShのそれぞれについて検出し、その個数を求めて合計する。さらに、検出した各山MTの閾値VSHの位置における幅WTを求める。ここで、幅WTの求め方について、図16のようなヒストグラムHSである場合を例に説明する。
図16において、まず、X座標(ライン番号)が「1」の位置からX座標の正の方向にヒストグラムを辿る。閾値VSHを跨ぎ超えるときの点PTUのライン番号を記録する。さらにヒストグラムを辿って行く。そして、閾値VSHを跨ぎ減ったときに、そのときの点PTDのライン番号を取得する。取得したライン番号と既に記録したライン番号の差を算出し、その差をその山MTの幅WTとする。図16の例では、跨ぎ超えるときのライン番号が「10」であり、跨ぎ減るときのライン番号が「15」である。従って、山MT7の幅WT7は「5」となる。
さらに、ライン番号の最後(X座標の端)までヒストグラムを辿って行き、閾値VSHを超える全ての山MTについて幅WTを求める。
このようにして、ヒストグラムHSvおよびHShのそれぞれについて閾値VSHを超える各山MTの幅WTを求める。
幅WTを求めた後、次に、その幅WTの分散値をヒストグラムHSvおよびHShのそれぞれについて算出する。なお、ヒストグラムHSvおよびHShについてまとめて一つの分散値を求めるようにしてもよい。
そして、既に求めた山MTの個数の合計が「5個」以上であり且つ幅WTの各分散値が「10」未満である場合に、そのブロックAKを表グラフ領域と仮判定する。
同様にして、下地その他領域抽出部62によって抽出されなかった全てのブロックデータDKのブロックAKに対して上記の処理を行う。そして、表グラフ領域であると仮判定されなかったブロックAKを写真領域と判定し、そのブロックデータDKであるブロックデータDKpを抽出する。なお、この際に、ブロックデータDKpに対して、ブロックAKが写真領域であることを示すデータを付加する。
ところで、ブロックエッジ画像BEが表を表す画像である場合、図15に示すように、そのブロックエッジ画像BEには、表の罫線によってエッジの線が複数個生じる。そのため、そのヒストグラムに、ある程度の高さをもった山MTが複数個できる。また、エッジの線によってできる山であるため、それらの幅(形状)にはほとんどばらつきがない。
ブロックエッジ画像BEがグラフを表す画像である場合は、例えば、図17に示すようなブロックエッジ画像BEが生成される。この場合も表の場合と同様に、そこにエッジの線が複数個生じるため、それによって、ある程度の高さがありほぼ幅(形状)がそろっている複数の山MTが表されたヒストグラムHSが形成される。
それに対して、ブロックエッジ画像BEが写真の画像である場合、表またはグラフに比べて線成分(罫線)が少ないことが多いため、例えば、図18に示すような、高さが低く幅にばらつきのある複数の山MTが表されたヒストグラムHSが形成される。
このようなことから、上記のように高さが閾値VSH以上である山MTの個数およびその山MTの幅WTの分散値についての判定を行なうことにより、ブロックAKが表グラフ領域または写真領域いずれであるかを適切に見分けられるようになる。
本実施形態においては、表グラフ領域仮判定部64の処理に先立って傾き補正を行なった。この傾き補正を行なわなかった場合、ブロックエッジ画像BEが例えば、図19のように大きく傾いていたとしたら、ヒストグラムHSの作成に、表の罫線同士重なり合いが影響する。そのため、ヒストグラムHSの山MTは低くなり、また、幅WTにばらつきが生じてしまうため、そのブロックAKを表グラフ領域と判定できなくなることがある。表グラフ領域仮判定部64の処理に先立って傾き補正を行なうことにより、このような弊害を抑えることができる。
ところが、傾き補正を行なったとしても、若干の傾きが残ってしまうことがある。そうすると、発明が解決しようとする課題の欄において説明したとおり、山MTの高さについての閾値を下げる必要が生じる。従来の方法の場合、それによって、写真の画像が表を表す画像であると誤判定されることが多くなってしまう。
本実施形態では、高さが閾値VSH以上である山MTの個数に加えてその山MTの幅WTの分散値についても判定を行なう。写真の画像はヒストグラムHSの山MTの幅WTにばらつきが生じることが多いので、その幅WTの分散値の判定によって、それが表グラフ領域と誤判定されることを相当程度低減することができるようになる。すなわち、画像に多少の傾斜があったとしても適切な判定ができるようになる。
なお、上記の処理によって、表およびグラフの双方を含むブロックAKが存在した場合も、それを表グラフ領域と判定することができる。
表グラフ領域本判定部65は、表グラフ領域仮判定部64によって仮判定されたブロックAKの内で所定の条件を満たすものを表グラフ領域と判定(本判定)するための処理を行う。
まず、表グラフ領域仮判定部64によってブロックAKが表グラフ領域と仮判定されたブロックデータDKを取得し、処理対象のブロックデータDKを一つ選択する。そのブロックデータDKに示されるブロックエッジ画像BEのエッジ画素率(エッジのばらつき率)を例えば以下のような方法で算出する。
ブロックエッジ画像BEを横方向(主走査方向)に走査し、画像が黒画素から白画素に変化する回数を数える。その回数を各ラインLN(1つの画素の幅の行または列のライン)について求め、それらの合計値(エッジ画素数)を算出する。例えば、図20に示すような、表を表すブロックエッジ画像BEである場合は、ラインLNnにおけるその回数は「5回」となる。なお、白画素から黒画素に変化する回数を数えるようにしてもよい。
求めたエッジ画素数を「c」、ブロックAKの縦の長さを「a」、横の長さを「b」として、次の式によってエッジ画素率を算出する。
エッジ画素率 = (c/(a×b))×100 ……(3)
エッジ画素率が求まると、次に、そのエッジ画素率が所定の閾値未満であるか否かを判定する。閾値未満である場合は、そのブロックAKを表グラフ領域と判定(本判定)する。閾値未満でない場合は、写真領域と判定(本判定)する。取得した全てのブロックデータDKのブロックAKに対して同様に判定を行う。そして、写真領域であると判定したブロックAKのブロックデータDKpを抽出し、それ以降の処理対象から除外する。
なお、この際に、ブロックデータDKpに対して、ブロックAKが写真領域であることを示すデータを付加する。
本実施形態では、表グラフ領域仮判定部64によって、写真の画像を含むブロックAKを表グラフ領域の対象から除外する処理を行った。
しかし、写真の中には、図6(a)に示すようにエッジ部分を多く含むものがあり、そのような写真は、表グラフ領域仮判定部64での判定における表グラフ領域の条件を満たす場合ある。そうすると、そのブロックAKは表グラフ領域であると判定されてしまう。
そこで、本実施形態では、表グラフ領域本判定部65によって、さらに、エッジ画素率による判定を行う。図6(a)から分かる通り、エッジ画像に変換した場合に、写真の画像には表およびグラフの場合よりもエッジ部分が多く発生する。従って、上記のような表グラフ領域本判定部65の処理により、写真についてのブロックAKを識別でき、表グラフ領域の対象から排除できるようになる。
表グラフ領域仮判定部64および表グラフ領域本判定部6によって2度の判定を行うことによって表グラフ領域についての判定の精度を向上させることができる。
表グラフ判別部66は、表グラフ領域本判定部65によって表グラフ領域と判定されたブロックAKを表領域またはグラフ領域のいずれかに判別するための処理を以下のようにして行う。
まず、表グラフ領域本判定部65によってブロックAKが表グラフ領域と判定されたブロックデータDKを取得し、処理するブロックデータDKを一つ選択する。そして、原稿画像GGの内でそのブロックデータDKのブロックAK(処理対象のブロックAK)に対応する部分の画像にどの程度文字が含まれているかを求める。
それに際して、そのブロックAKの内側に存在するブロックAKのラベリング画素を抽出する。例えば、処理対象が図5のブロックAK6であった場合、その内側に存在するブロックAK7、8、9、…を抽出する。抽出の対象となるブロックAKは、そのブロック位置およびブロックサイズと、処理対象のブロックAKのブロック位置およびブロックサイズとから求めることができる。
さらに、2値原稿画像GVのうちで抽出したブロックAKに対応する部分の2値画像を取得する。取得した各2値画像を処理対象のブロックAK内の対応する位置に配置した場合の画像である対象2値画像BNを生成する。例えば、ブロックAK6が処理対象であった場合、これによって、図21に示すような、ブロックAK6のブロックサイズの広さをもった対象2値画像BNが生成される。なお、図21では、対象2値画像BNの画素の例として、「1」を構成する画素を拡大表示して示すが、実際にはブロックAK6内全域における処理、計算を行う。
次に、生成した対象2値画像BNからラベリングエッジ画素の個数を求める。ラベリングエッジ画素とは、ラベリング画素と白画素との境界部分の白画素のことである。図21の例では、斜線で示される画素がラベリングエッジ画素である。
そして、対象2値画像BN内の全てのラベリングエッジ画素の個数C1とそれ以外の白画素の個数C2とに基づいて、次の式によって、ラベリングエッジ画素率を算出する。
ラベリングエッジ画素率 = (C1/(C1+C2))×100 ……(4)
そして、算出したラベリングエッジ画素率が「5%」未満であるか否かを判定する。「5%」未満である場合は、処理対象のブロックAKをグラフ領域と判定する。「5%」未満でない場合は、表領域と判定する。取得した全てのブロックデータDKのブロックAKに対して同様に判定を行う。そして、表領域であると判定したブロックAKのブロックデータDKであるブロックデータDKcと、グラフ領域であると判定したブロックAKのブロックデータDKであるブロックデータDKgとを抽出する。
上記の処理によって、表領域またはグラフ領域の判別を適切に行えるようになる。その理由は、グラフを表す画像よりも表を表す画像の方が文字を多く含む傾向にあるからである。
文字を多く含む場合、ブロックAK内の画像において、文字の部分(黒画素)とそれ以外の部分(白画素)との境界が多く発生する。ラベリングエッジ画素率を求めることにより、その境界が多いか否かを判定でき、表領域またはグラフ領域の判別を適切に行えるようになる。
なお、この時点で、文字ブロックAKMが確定していれば、その個数によって処理対象のブロックAKに含まれる文字が多いかどうかを判定できる。しかし、文字ブロックAKMが確定していないので、ここでは、ラベリングエッジ画素を用いて判定を行った。
なお、本実施形態においては、ラベリングエッジ画素率を求めるために2値画像を用いたが、エッジ画像を用いるようにしてもよい。
図22は画像形成装置1におけるPDFファイルを生成するまでの概略の処理の流れを説明するためのフローチャートである。次に、図22のフローチャートを参照して、画像形成装置1において、スキャンされた原稿についてのPDFファイルが生成されるまでの概略の処理の流れについて説明する。
図22において、スキャナ10aが原稿をスキャンすると(#11)、画像形成装置1は、それによって得られた原稿画像GGに対して下地除去、明度変換、およびスムージングなどの処理を施す(#12)。
そのような前処理が施された原稿画像DGbを2値化して2値原稿画像GVを生成し(#13)、ラベリングの処理を行う(#14)。さらに、ラベリングによって求められた矩形領域であるブロックAKについて、その属性を判定するための処理を行う(#15)。
属性についての判定結果に基づいて、さらに、各ブロックAKに文字が含まれるか否かを判定し、文字が含まれると判定したブロックAKを文字ブロックAKMとして抽出する(#16)。また、文字が含まれると判定しなかったブロックAKを非文字ブロック(図写真領域)AKHとして抽出する。
文字ブロックAKM同士を所定のルールに従って統合し、その個数を減らす(#17)。さらに、2値原稿画像GVの内で統合の後に残った文字ブロックAKMに対応する部分の2値画像を可逆圧縮する(#18)。
次に、非文字ブロックAKH同士を所定のルールに従って統合して、その個数を減らす(#19)。さらに、原稿画像GGbの内で統合の後に残った非文字ブロックAKHに対応する部分のカラー画像を低解像度化し(#20)、非可逆圧縮する(#21)。
ステップ#18およびステップ#21の圧縮によって生成された圧縮データを用いてPDFファイルを生成する。
図23は領域属性判定処理の流れの例を説明するためのフローチャート、図24は表グラフ領域判定処理の流れを説明するためのフローチャートである。次に、領域属性判定処理において、1つのブロックAKに着目した場合の領域属性判定処理の流れについて図23および図24を参照して説明する。
図23において、まず、処理対象のブロックAKのラベリング率を求める(#31)。そのブロックAKのブロックサイズに示される縦および横の長さがいずれも所定の閾値(250pixel)以下であり且つ求めたラベリング率が所定の閾値(70%)以上であった場合(#32でYes)、そのブロックAKを小領域と判定する(#33)。
ブロックサイズが所定の閾値より大きいかまたはラベリング率が所定の閾値未満であった場合は(#32でNo)、そのブロックAKが下地その他領域であるか否かの判定を行う(#34)。その判定に際して、原稿画像GGbのうちでそのブロックAKに対応する部分のカラー画像を用いて、RGBごとにその濃度と個数との関係を示すヒストグラムを生成する。RGBについての各ヒストグラムを、それぞれのピークを「255」にあわせた状態で合成する。そして、合成したヒストグラムのピークのX座標から±16の範囲内の画素の個数が全体の画素の個数に対して所定の割合(66%)以上であればそのブロックAKを下地その他領域と判定する。なお、本実施形態においては、1/8にスムージングしてこのヒストグラム作成する。よって、この場合の「全体の画素の個数」とは、ブロックAK内の画素の総数の1/8を指す。
ブロックAKを下地その他領域であると判定した場合は(#35でYes)、そのブロックAKの下地率を求める(#36)。
その下地率が所定の閾値(90%)以上である場合は(#37でYes)、そのブロックAKを下地領域と判定する。その下地率が所定の閾値未満であった場合は(#37でNo)、そのブロックAKをその他領域と判定する(#39)。
ステップ#34において下地その他領域と判定しなかった場合は(#35でNo)、そのブロックAK内の画像に対して傾き補正を行い(#40)、そのブロックAKについて表グラフ領域判定処理を行う(#41)。
表グラフ領域判定処理において、まず、原稿画像GGbのうちでそのブロックAKに対応する部分のカラー画像を取得し、それに対応するエッジ画像を生成する。ブロックAK内の縦方向の位置と縦方向の各位置において横方向に配置されているそのエッジ画像の黒画素の個数との関係を表すヒストグラムを作成する(図24の#61)。作成の際に、ヒストグラムのピーク値を検出し、そのピーク値と所定の設定値〔割合(33%)〕とに基づいて閾値を求める(#62)。さらに、その作成において横方向にブロックAK内を走査する際に、黒画素から白画素に移る回数をラインごとに求めそれを合計してエッジ画素数を求める(#63)。作成したヒストグラムにおいて、ステップ#62で求めた閾値を超える高さの山の個数を求める。(#64)
作成したヒストグラムをライン番号が「1」の位置から順番に辿って行き、所定の閾値を跨ぎ超えるときのライン番号と跨ぎ減るときのライン番号とを取得し、その差をその山の幅とする。ヒストグラムを最後まで辿って行き、極値がその閾値を超える全ての山のその閾値の高さでの幅を求め(#65)、求めた幅の平均値を算出する(#66)。その平均値を用いてその山の幅の分散値を求める(#67)。
次に、ブロックAK内の横方向の位置と横方向の各位置において縦方向に配置されている生成したエッジ画像の黒画素の個数との関係を表すヒストグラムを作成する(#68)。その作成の際に、ヒストグラムのピーク値を求め、そのピーク値と所定の設定値(割合)とに基づいて閾値を求める(#69)。作成したヒストグラムにおいて、求めた閾値を超える高さの山の個数を求める(#70)。
ステップ#65から67の手順と同様にして、ステップ#68で作成したヒストグラムの山の幅の分散値を求める(#71から#73)。
ステップ#64および#70で求めた山の個数の合計が所定の閾値(5個)以上であり且つステップ#67および#73で求めた分散値が双方とも所定の閾値(10)未満である場合(#74でYes)に、そのブロックAKを表グラフ領域と仮判定する(#75)。
山の個数の合計が所定の閾値未満または各分散値のいずれかが所定の閾値以上であった場合(#74でNo)は、表グラフ領域判定処理を終了する。
表グラフ領域と仮判定したあと、ステップ#63で求めたエッジ画素数とそのブロックAKのブロックサイズとに基づいてエッジ画素率を求める(#76)。
求めたエッジ画素率が所定の閾値未満である場合(#77でYes)、そのブロックAKを表グラフ領域と判定する(#78)。求めたエッジ画素率が所定の閾値以上である場合は(#77でNo)、表グラフ領域判定処理を終了する。
図23に戻って、ステップ#41において表グラフ領域と判定しなかった場合は(#42でNo)、そのブロックAKを写真領域と判定する(#43)。
ステップ#41において表グラフ領域と判定した場合は(#42でYes)、そのブロックAKの対象2値画像BNを生成する。その対象2値画像BNに含まれるラベリングエッジ画素の個数と白画素の個数を数える(#44)。ラベリングエッジ画素の個数と白画素の個数とに基づいてラベリングエッジ画素率を求める(#45)。
求めたラベリングエッジ画素率が所定の閾値(5%)以上である場合は(#46でYes)、そのブロックAKを表領域と判定する(#47)。所定の閾値未満である場合は(#46でNo)、そのブロックAKをグラフ領域と判定する(#48)。
ところで、近年、MFP(Multi Function Peripherals)などの複合機は、白黒の画像に対応した処理を行なうものからカラーの画像に対応した処理を行なうもの(カラー対応のMFP)へ移行しつつある。
また、このような複合機のスキャナで読み取った原稿の画像をPDFファイルなどに変換し、それを電子メールに添付してその複合機から直接送信する機能が一般に普及している。
カラー対応のMFPにおいてそのような機能を実行しようとすると、例えば、A4サイズの原稿を300dpiのフルカラーの画像としてスキャンする場合、生成されるPDFファイルのデータ量は25MB程度となり電子メールでの送信が困難になる。
そのため、スキャンした原稿の画像を圧縮して送信するのが一般的である。しかし、データ量を小さくするために高い圧縮率で圧縮すると文字の部分がつぶれて読めなくなることがある。それを避けるために圧縮率を下げる必要があるが、そうすると、データ量を十分に小さくできない。
そこで、従来、高圧縮PDFという機能が用いられている。この機能では、画像データ全体に対して同じ圧縮方法を適用するのではなく、処理する領域によって別の圧縮方法を適用する。
具体的には、スキャンした原稿の画像データから写真または図形などの単位で領域を抽出し、その領域が文字を含む文字領域であるかそれ以外の非文字領域であるかを判定する。そして、文字領域の画像については、高い解像度を保ったままで二値化し、MMRなどの可逆圧縮の方式で圧縮する。非文字領域の画像については、低解像度化した後、JPEGなどの非可逆圧縮の方式によって高い圧縮率で圧縮する。これによって、文字の判読性を維持しつつデータ量(ファイルサイズ)の小さなPDFファイル(高圧縮PDFファイル)を生成することが可能となる。
この高圧縮PDFファイルの生成において重要なことは、スキャンした原稿の画像から文字の部分を正確に抽出すること、すなわち文字を含む領域を正確に文字領域と判別することである。なぜならば、誤って判別されるとその領域の画像は、低解像度化された後高い圧縮率で圧縮され、それによって、その領域の文字が読めなくなってしまうことがあるからである。
領域に文字が含まれるか否かの判定(文字の判定)は、その領域(ブロックAK)の属性に応じて行う。従って、領域AKの属性についての判定結果が文字の判定の精度を左右することになる。本実施形態では、上記の処理によって領域(ブロックAK)の属性を適切に判定できるため、結果として文字の判定の精度を高めることができるようになる。それによって、より文字の判読性の高い高圧縮PDFファイルを生成できるようになる。
本実施形態では、画像形成装置1においてPDFファイルを生成する場合の例を示したが、端末装置2において生成するようにしてもよい。その場合は、本実施形態において説明した処理によってPDFファイルを生成するためのモジュールを含んだ専用のソフトウェア(専用ソフト)を端末装置2にインストールしておく。さらに、画像形成装置1によって原稿がスキャンされるとその画像データが電子メールに添付されて端末装置2に自動的に送信されるように設定しておく。そうすることで、端末装置2のユーザが、各自、目的に合わせてPDF化する画像を選択し、専用ソフトを用いてPDFファイルを生成できるようになる。
または、サーバ3(メールサーバ)によってPDFファイルを生成するようにしてもよい。その場合は、上記のような専用ソフトをサーバ3にインストールしておく。さらに、画像形成装置1によって原稿がスキャンされるとその画像データがサーバ3に自動的に送信されるように設定しておく。そして、サーバ3に画像データが送信されて来ると、サーバ3の専用ソフトによって自動的にその画像データのPDFファイルが生成され、それが電子メールに添付されてユーザの端末装置2に送信されるようにする。これによって、サーバ3を利用できるユーザは誰でも本実施形態の処理によって生成されるPDFファイルを得ることができるようになる。
また、図3の各部の機能の一部をハードウェアによって実現してもよい。例えば、入力画像処理部および出力画像処理部などのハードウェアを画像形成装置1に設けておく。入力画像処理部は、スキャナ10aから原稿画像GGを取得し、それに対して、色変換、色補正、解像度変換、領域判別などの処理を行う。処理された後のデータは、ハードディスク10c、RAM10d、またはROM10eなどに保持する。
保持されたデータに基づいて印刷が実行される際には、印刷装置10fの印刷の処理に先立って、出力画像処理部が、スクリーン制御、スムージング処理、およびPWM制御などを行う。
なお、ドットが打たれている画素が黒画素である場合の例を示したが、これは黒画素に限られるものではない。
その他、画像形成装置1の全体または各部の構成、機能、閾値、設定値、上限値、各データが示す内容、処理の内容または順序などは、本発明の趣旨に沿って適宜変更することができる。
画像形成装置を有するシステム構成の例を示す図である。 画像形成装置のハードウェア構成の例を示す図である。 画像形成装置の機能的な構成の例を示す図である。 前処理部、領域属性判定部、および文字ブロック処理部の構成の例を示す図である。 原稿画像および明度原稿画像などの例を示す図である。 エッジ画像の例を示す図である。 ブロックの統合を説明するための図である。 判定処理部の構成の例を示す図である。 下地その他領域についての判定方法を説明するための図である。 下地その他領域についての判定の際に作成するヒストグラムの例を示す図である。 傾き補正における傾き検出の処理の流れを説明するためのフローチャートである。 傾きの検出を説明するための図である。 傾き補正の処理の流れを説明するためのフローチャートである。 傾き補正の方法を説明するための図である。 表を表す画像についてのヒストグラムの例を示す図である。 ヒストグラムの山の幅の求め方を説明するための図である。 グラフを表す画像についてのヒストグラムの例を示す図である。 写真の画像についてのヒストグラムの例を示す図である。 表を表す画像が傾いている場合のヒストグラムの例を示す図である。 エッジ画素の個数の求めた方を説明するための図である。 ラベリングエッジ画素率の求め方を説明するための図である。 画像形成装置におけるPDFファイルを生成するまでの概略の処理の流れを説明するためのフローチャートである。 領域属性判定処理の流れの例を説明するためのフローチャートである。 表グラフ領域判定処理の流れを説明するためのフローチャートである。
符号の説明
1 画像形成装置(領域判定装置、画像処理装置、コンピュータ)
2 端末装置(領域判定装置、画像処理装置、コンピュータ)
3 サーバ(領域判定装置、画像処理装置、コンピュータ)
15 文字ブロック処理部(画像処理実行手段)
16 文字ブロック統合部(画像処理実行手段)
17 可逆圧縮部(画像処理実行手段)
18 非文字ブロック統合部(画像処理実行手段)
19 解像度変換部(画像処理実行手段)
20 非可逆圧縮部(画像処理実行手段)
64 表グラフ領域仮判定部(エッジ画像生成手段、ヒストグラム生成手段、分散値算出手段、判定手段)
AK ブロック(領域)
BE ブロックエッジ画像(エッジ画像)
BN 対象2値画像(2値画像)
GE エッジ原稿画像(対象画像、エッジ画像)
GG、GGb 原稿画像(対象画像)
GM、GMb 明度原稿画像(対象画像)
GV 2値原稿画像(対象画像、2値画像)
HS ヒストグラム(第1のヒストグラム、第2のヒストグラム)
MT 山
VSH 閾値
WT 幅

Claims (11)

  1. 画像処理の対象となるべき対象画像に含まれる領域の種別を領域判定装置により判定する領域判定方法であって、
    前記領域判定装置が、
    前記対象画像の画像データを入力するステップと、
    前記入力された画像データに基づいてエッジ画像を生成するエッジ画像生成ステップと、
    生成された前記エッジ画像の所定の領域においてエッジを表す画素であるエッジ画素に関して、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成する、ヒストグラム生成ステップと、
    生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出ステップと、
    求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定ステップと、
    実行することを特徴とする領域判定方法。
  2. 画像処理の対象となるべき対象画像に含まれる所定の領域の種別を領域判定装置により判定する領域判定方法であって、
    前記領域判定装置が、
    前記対象画像の画像データを入力するステップと、
    前記入力された画像データからエッジ画像を生成した場合に前記所定の領域においてエッジを表す画素をエッジ画素として、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成した場合に、当該第1のヒストグラムおよび当該第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出ステップと、
    求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定ステップと、
    実行することを特徴とする領域判定方法。
  3. 前記判定ステップにおける判定を、生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の個数と前記分散値算出ステップで求められた分散値とに基づいて行う、
    請求項2記載の領域判定方法。
  4. 前記判定ステップにおける判定を仮の判定とし、
    前記所定の領域を表領域およびグラフ領域のうちの少なくとも一方であると前記判定ステップにおいて仮に判定した場合に、前記領域判定装置が、前記エッジ画像を生成した場合に前記所定の領域においてエッジを表す部分の量に関する、当該所定の領域内における割合の値を求め、求めた値に基づいて、当該所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する本判定ステップをさらに実行する
    請求項2または3記載の領域判定方法。
  5. 前記所定の領域は、小領域、下地領域、写真領域、表領域、グラフ領域、またはそれら以外のその他領域のいずれかであり、
    前記所定の領域が小領域であるか否かを判定し、
    小領域でないと判定した場合に、当該所定の領域が下地領域または前記その他領域のいずれかであるか否かを判定し、
    下地領域および前記その他領域のいずれでもないと判定した場合に、当該所定の領域に含まれる画像の傾きを補正する処理を行い、
    画像の傾きを補正する処理が行われた後の前記所定の領域について前記第1のヒストグラムおよび前記第2のヒストグラムを生成する、
    請求項2ないし4のいずれかに記載の領域判定方法。
  6. 前記所定の領域を表領域およびグラフ領域のうちの少なくとも一方であると判定した場合に、
    前記対象画像から2値画像を生成した場合に前記所定の領域においてドットが打たれる画素をドット画素として、当該所定の領域内の連なった当該ドット画素である連結画素群の境界に接する画素の個数に関する割合の値を求め、
    求められた値に基づいて、前記所定の領域が表領域またはグラフ領域のいずれであるかを判定する、
    請求項2ないし5のいずれかに記載の領域判定方法。
  7. 前記所定の領域は、前記対象画像から2値画像を生成した場合の当該2値画像においてドットが打たれる画素をドット画素とした場合に、連なった当該ドット画素を包含する矩形の領域である、
    請求項2ないし6のいずれかに記載の領域判定方法。
  8. 画像処理の対象となるべき対象画像に含まれる所定の領域の種別を判定する領域判定方法であって、
    前記対象画像から2値画像を生成した場合の当該2値画像においてドットが打たれる画素をドット画素とした場合に連なった当該ドット画素である連結画素群を包含する矩形の領域であり、かつ小領域、下地領域、写真領域、表領域、グラフ領域、またはそれら以外のその他領域のいずれかである前記所定の領域の中から、まず、小領域を抽出し、
    抽出されずに残った前記所定の領域の中から下地領域または前記その他領域を抽出し、
    さらに残った前記所定の領域に含まれる画像の傾きを補正する処理を行い、
    画像の傾きを補正する処理が行われた後の前記所定の領域について、
    前記対象画像からエッジ画像を生成した場合に前記所定の領域においてエッジを表す画素をエッジ画素として、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成し、
    生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求め、
    求められた分散値に基づいて、当該分散値に係る前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを仮判定し、
    表領域およびグラフ領域のうちの少なくとも一方であると仮判定された前記所定の領域について、
    前記エッジ画像を生成した場合に前記所定の領域においてエッジを表す部分の量に関する、当該所定の領域における割合の値を求め、
    求められた値に基づいて、当該値に係る前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定し、
    表領域およびグラフ領域のうちの少なくとも一方であると判定された前記所定の領域について、
    前記所定の領域内の前記連結画素群の境界に接する画素の個数に関する割合の値を求め、
    求められた値に基づいて、当該値に係る前記所定の領域が表領域またはグラフ領域のいずれであるかを判定する、
    ことを特徴とする領域判定方法。
  9. 画像処理の対象となるべき対象画像に含まれる所定の領域の種別を判定するための領域判定装置であって、
    前記対象画像からエッジ画像を生成した場合に前記所定の領域においてエッジを表す画素をエッジ画素として、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成した場合に、当該第1のヒストグラムおよび当該第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出手段と、
    求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定手段と、
    を有することを特徴とする領域判定装置。
  10. 画像処理を実行するための画像処理装置であって、
    画像処理の対象となるべき対象画像に基づいてエッジ画像を生成するエッジ画像生成手段と、
    生成された前記エッジ画像の所定の領域においてエッジを表す画素であるエッジ画素に関して、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成する、ヒストグラム生成手段と、
    生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出手段と、
    求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定手段と、
    前記判定手段による判定の結果に応じた画像処理を前記対象画像の当該判定に係る領域に対して施す画像処理実行手段と、
    を有することを特徴とする画像処理装置。
  11. 画像処理を行うコンピュータに、
    画像処理の対象となるべき対象画像に基づいてエッジ画像を生成するエッジ画像生成ステップと、
    生成された前記エッジ画像の所定の領域においてエッジを表す画素であるエッジ画素に関して、当該所定の領域内の縦方向の各位置において横方向に存在する当該エッジ画素の個数を表す第1のヒストグラムと、当該所定の領域内の横方向の各位置において縦方向に存在する当該エッジ画素の個数を表す第2のヒストグラムとを生成する、ヒストグラム生成ステップと、
    生成された前記第1のヒストグラムおよび前記第2のヒストグラムにおいてそれらの極値が所定の閾値を超える山の幅の分散値を求める分散値算出ステップと、
    求められた分散値に基づいて、前記所定の領域が表領域およびグラフ領域のうちの少なくとも一方であるか否かを判定する判定ステップと、
    を実行させることを特徴とするコンピュータプログラム。
JP2006293200A 2006-10-27 2006-10-27 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム Expired - Fee Related JP4240107B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006293200A JP4240107B2 (ja) 2006-10-27 2006-10-27 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
US11/925,222 US8009908B2 (en) 2006-10-27 2007-10-26 Area testing method for image processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006293200A JP4240107B2 (ja) 2006-10-27 2006-10-27 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2008112215A JP2008112215A (ja) 2008-05-15
JP4240107B2 true JP4240107B2 (ja) 2009-03-18

Family

ID=39330245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006293200A Expired - Fee Related JP4240107B2 (ja) 2006-10-27 2006-10-27 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム

Country Status (2)

Country Link
US (1) US8009908B2 (ja)
JP (1) JP4240107B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7471418B2 (en) * 2005-06-02 2008-12-30 Xerox Corporation Image/document analysis tool and method for multi-station image forming device
JP4442701B2 (ja) * 2008-06-04 2010-03-31 コニカミノルタビジネステクノロジーズ株式会社 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP5005732B2 (ja) * 2008-06-26 2012-08-22 株式会社東芝 画像形成装置及び画像処理方法
JP5222126B2 (ja) * 2008-12-25 2013-06-26 キヤノン株式会社 画像処理方法、画像処理装置及びプログラム
US8885967B2 (en) * 2009-01-19 2014-11-11 Csr Technology Inc. Method and apparatus for content adaptive sharpness enhancement
US8503814B2 (en) * 2009-01-19 2013-08-06 Csr Technology Inc. Method and apparatus for spectrum estimation
JP5521449B2 (ja) * 2009-09-09 2014-06-11 村田機械株式会社 画像判別装置
JP5842441B2 (ja) * 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP6031921B2 (ja) * 2012-09-28 2016-11-24 ブラザー工業株式会社 画像処理装置およびプログラム
JP2016076283A (ja) * 2014-10-06 2016-05-12 富士通株式会社 データ判定装置,ライブラリ装置,及びデータ判定方法
WO2019124137A1 (ja) * 2017-12-19 2019-06-27 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN111918065A (zh) * 2019-05-08 2020-11-10 中兴通讯股份有限公司 一种信息压缩/解压缩方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208625A (ja) 1993-01-11 1994-07-26 Canon Inc 画像処理方法及び装置
DE69333694T2 (de) * 1992-09-11 2005-10-20 Canon K.K. Verfahren und Anordnung zur Bildverarbeitung
JPH06203165A (ja) * 1993-01-07 1994-07-22 Canon Inc 画像情報処理方法及び装置
JP3165589B2 (ja) 1994-06-06 2001-05-14 シャープ株式会社 画像分類装置
JPH0844822A (ja) 1994-08-03 1996-02-16 Matsushita Electric Ind Co Ltd 文字認識装置
JPH08249419A (ja) 1995-03-10 1996-09-27 Fuji Xerox Co Ltd 表領域判定装置
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image
US5862270A (en) * 1995-12-08 1999-01-19 Matsushita Electric Industrial Co., Ltd. Clock free two-dimensional barcode and method for printing and reading the same
US6371373B1 (en) * 1999-05-25 2002-04-16 Matsushita Electric Industrial Co., Ltd. Method for reading a two-dimensional barcode
JP3756719B2 (ja) 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
US7474337B1 (en) * 2000-10-24 2009-01-06 Sony Corporation Method and apparatus to provide edge enhancements as part of a demosaicing process
JP3864945B2 (ja) * 2003-09-24 2007-01-10 アイシン精機株式会社 路面走行レーン検出装置
JP2006128987A (ja) 2004-10-28 2006-05-18 Matsushita Electric Ind Co Ltd 画像判別装置

Also Published As

Publication number Publication date
US8009908B2 (en) 2011-08-30
JP2008112215A (ja) 2008-05-15
US20080101698A1 (en) 2008-05-01

Similar Documents

Publication Publication Date Title
JP4240107B2 (ja) 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
US7747089B2 (en) Image processing apparatus, image processing method, and image processing program
JP4469885B2 (ja) 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体
JP4586891B2 (ja) 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
JP4362538B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP2009069917A (ja) 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体
JP2018121226A (ja) 画像処理装置、画像処理方法およびプログラム
JP4362537B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP5042917B2 (ja) 画像処理装置およびプログラム
JP4487000B2 (ja) 画像処理装置、画像形成装置、画像処理方法、画像処理システム、画像処理プログラムおよびその記録媒体
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP4605260B2 (ja) ベクタ画像生成方法、画像処理装置、およびコンピュータプログラム
JP4442701B2 (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP5132440B2 (ja) 画像処理装置及び画像処理方法
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2009095007A (ja) 画像データ出力処理装置、画像データ出力処理方法、プログラム及び記録媒体
JP5517028B2 (ja) 画像処理装置
US8260057B2 (en) Image processing apparatus that obtains a ruled line from a multi-value image
JP4412339B2 (ja) 画像形成装置および画像データの補正方法
JP7413751B2 (ja) 画像処理システムおよびプログラム
JP2006093880A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US9098768B2 (en) Character detection apparatus, character detection method, and computer-readable storage medium
JP6752263B2 (ja) 画像処理装置、画像形成装置、及び、画像処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees