JP2007066084A - 文書処理装置、文書処理方法、および文書処理用プログラム - Google Patents
文書処理装置、文書処理方法、および文書処理用プログラム Download PDFInfo
- Publication number
- JP2007066084A JP2007066084A JP2005252379A JP2005252379A JP2007066084A JP 2007066084 A JP2007066084 A JP 2007066084A JP 2005252379 A JP2005252379 A JP 2005252379A JP 2005252379 A JP2005252379 A JP 2005252379A JP 2007066084 A JP2007066084 A JP 2007066084A
- Authority
- JP
- Japan
- Prior art keywords
- blank
- area
- document
- detecting
- blank area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】文書要素を分離するための空白帯セパレータを高精度に検出して、文書領域を高精度に抽出することが可能な文書処理装置を提供することを目的とする。
【解決手段】文書画像中で、文書要素を分離するための空白帯セパレータを検出する文書処理装置において、文書画像の黒画素の外接矩形を検出する矩形検出部11と、文書画像を分割線により複数の短冊状の部分領域に分割し、各部分領域において、外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出し、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を空白帯セパレータとして検出する空白帯セパレータ検出部13とを備えている。
【選択図】 図5
【解決手段】文書画像中で、文書要素を分離するための空白帯セパレータを検出する文書処理装置において、文書画像の黒画素の外接矩形を検出する矩形検出部11と、文書画像を分割線により複数の短冊状の部分領域に分割し、各部分領域において、外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出し、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を空白帯セパレータとして検出する空白帯セパレータ検出部13とを備えている。
【選択図】 図5
Description
本発明は、文書処理装置、文書処理方法、および文書処理用プログラムに関し、詳細には、多種多様なレイアウトの原稿から精度良く文字領域を抽出するための空白帯セパレータを検出する文書処理装置、文書処理方法、および文書処理用プログラムに関する。
文書画像の構造を解析しようとした場合、黒画素領域を抽出し、抽出された黒画素領域の間に存在するセパレータ(空白領域)を基に画像を領域分割する方法が知られている。ここでは、文書の内容が大きく変化するセパレータをうまく抽出することが必要である。
文書要素間のセパレータとして空白帯(以降、「空白帯セパレータ」とも称する)を使用する方法として、例えば、特許文献1で知られている。特許文献1では、対象領域内の射影分布を縦または横方向について求め、射影分布中である閾値より小さい区間を空白帯としている。
しかしながら、複雑なレイアウトの原稿においては、空白帯が領域全体を横断または縦断する場合を除いて黒画素が極端に少ない位置はまれであり、射影分布において空白帯の開始位置および終了位置を示す黒画素計数結果の明確な変化は起らないため、射影分布によって部分的な空白帯を検出することは困難であるという問題がある。
本発明は、上記課題に鑑みてなされたものであり、文書要素を分離するための空白帯セパレータを高精度に検出して、文書領域を高精度に抽出することが可能な文書処理装置、文書処理方法、および文書処理用プログラムを提供することを目的とする。
上記した課題を解決して、本発明の目的を達成するために、本発明は、文書画像中で、文書要素を分離するための空白帯セパレータを検出する文書処理装置において、前記文書画像の黒画素の外接矩形を検出する外接矩形検出手段と、前記文書画像を分割線により複数の短冊状の部分領域に分割する分割手段と、各部分領域において、前記外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出する空白領域検出手段と、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を前記空白帯セパレータとして検出する空白帯セパレータ検出手段と、を備えたことを特徴とする。
また、本発明の好ましい態様によれば、前記分割手段は、前記文書画像の水平方向および垂直方向の両方向に分割線を施して前記短冊状の部分領域に分割することが望ましい。
また、本発明の好ましい態様によれば、前記空白帯セパレータ検出手段は、前記共通の空白領域を検出する場合に、距離の離れた前記2つの空白領域から順に処理を開始し、当該共通の空白領域が求められた場合には、前記2つの空白領域に関する処理を終了することが望ましい。
また、本発明の好ましい態様によれば、前記空白帯セパレータ検出手段は、前記連結空白領域のサイズに応じて、空白帯セパレータとして採用するか否かを決定することが望ましい。
また、本発明の好ましい態様によれば、前記空白帯セパレータ検出手段は、前記対象となる2つの空白領域のサイズに応じて、当該空白領域を空白帯セパレータとするか否かを決定することが望ましい。
また、本発明の好ましい態様によれば、前記空白帯セパレータ検出手段は、前記連結空白領域の外側方向に空白領域を探索し、前記連結空白領域を拡大することが望ましい。
上記した課題を解決して、本発明の目的を達成するために、本発明は、文書画像中で、文書要素を分離するための空白帯セパレータを検出する文書処理方法において、前記文書画像の黒画素の外接矩形を検出する外接矩形検出工程と、前記文書画像を分割線により複数の短冊状の部分領域に分割する分割工程と、各部分領域において、前記外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出する空白帯検出工程と、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を前記空白帯セパレータとして検出する空白帯セパレータ検出工程と、を含むことを特徴とする。
上記した課題を解決して、本発明の目的を達成するために、文書画像中で、文書要素を分離するための空白帯セパレータを検出するための文書処理用プログラムにおいて、前記文書画像の黒画素の外接矩形を検出する外接矩形検出工程と、前記文書画像を分割線により複数の短冊状の部分領域に分割する分割工程と、各部分領域において、前記外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出する空白帯検出工程と、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を前記空白帯セパレータとして検出する空白帯セパレータ検出工程と、をコンピュータに実行させることを特徴とする。
本発明によれば、文書画像の黒画素の外接矩形を検出し、文書画像を分割線により複数の短冊状の部分領域に分割し、各部分領域において、外接矩形に基づいて、分割線と垂直に交わる空白領域を検出し、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を文書要素を分離するための空白帯セパレータとして検出することとしたので、多種多様なレイアウトの文書に対しても、文字領域のセパレータとして機能する空白帯セパレータを高精度に検出することができ、文字領域の抽出精度を向上させることが可能な文書処理装置、文書処理方法、および文書処理用プログラムを提供することが可能となるという効果を奏する。
以下、この発明に係る文書処理装置、文書処理方法、および文書処理用プログラムの好適な実施の形態について、図面を参照しつつ詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。また、下記実施の形態における構成要素には、当業者が容易に想定できるものまたは実質的に同一のものが含まれる。
(発明の原理)
図1〜図4を参照して、本発明の原理を従来技術との比較により説明する。図1は、切り出し処理を説明するための図である。図1−1は原稿例、図1−2は図1−1の原稿の矩形抽出例、図1−3は切り出し例を示す図である。
図1〜図4を参照して、本発明の原理を従来技術との比較により説明する。図1は、切り出し処理を説明するための図である。図1−1は原稿例、図1−2は図1−1の原稿の矩形抽出例、図1−3は切り出し例を示す図である。
図1−1に示す原稿の黒画素の外接矩形を求めると、図1−2に示すようになる。同図において、波線は外接矩形を示している。この外接矩形を連結して行に成長させると(行切り出し処理)、図3−3に示すようになる。同図において、切り出し領域を実線で示している。切り出し処理は公知であるのでその詳細な説明は省略する。外接矩形の成長を、水平方向および垂直方向の両方向で実施すると、水平行と垂直行との両方が切り出される。
図2を参照して、上述した射影によって空白帯セパレータを抽出可能な原稿例と抽出不可能な原稿例について説明する。図2−1は、射影によって空白帯セパレータを抽出可能な例を示す図である。同図において、波線は空白帯セパレータを示している。図2−2は射影によって空白帯セパレータを抽出不可能な例を示す図である。同図において、波線は射影によって抽出可能な空白帯セパレータを示し、一点鎖線は射影によって抽出不可能な場合を示している。
図3は、射影によって空白帯セパレータを抽出できない場合の具体例を説明するための図である。複雑なレイアウトの原稿の場合、外接矩形間の距離が近接する個所があり、距離の近い外接矩形同士を単純に連結していくと、誤った行を生成してしまう可能性がある。
図3−1は、行方向が異なる行が近接する場合、図3−2は行方向が同じ行が近接する場合を示している。いずれも空白領域によって文書要素が分離されている。
図4は、切り出し結果を統合して文字領域を生成する例を示している。図4−1は、行が正しく切り出された場合、図4−2は行が正しく切り出されなかった場合を示している。このように、誤った行を統合して文字領域(段落)を構成しても、正しい結果を得ることができない。
本実施の形態では、連続する空白領域(空白帯)に注目する。一般的に下式(1)に示すように、文字間よりも行間は広く、行間よりも段落間は広い傾向がある。また、特別な場合を除いて、文字間の空白は行高さより小さい。
文字間<行間<段落間・・・(1)
したがって、文字間より大きい空白帯が連続している場合は、行間か段落間である可能性が高い。そこで、文字間距離として適当な閾値を設定し、それを越える空白帯の連続を求めてそれを空白帯セパレータとし、空白帯セパレータを跨って外接矩形を統合することを禁止すれば、誤った外接矩形の統合を避けることができる。
(実施の形態)
図5は、本発明の実施の形態に係る文書処理装置1の構成を示す図である。文書処理装置1は、図5に示すように、文書処理装置1の全体を制御する制御部10と、画像入力部として機能するスキャナなどの画像入力装置20と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)などの表示装置30と、入力部として機能するキーボードやマウスなどの操作部40と、外部記憶装置となるHDドライブ50と、CD(Compact Disc)−ROM61に記録されたプログラムやデータを読み取るCD−ROMドライブ60と、FD61に記録されたプログラムやデータを読み取るFDドライブ70と、文書処理装置1とネットワークとの通信を司る通信部80とがバスを介して互いに接続された構成となっており、通常のコンピュータを利用したハードウェア構成となっている。
図5は、本発明の実施の形態に係る文書処理装置1の構成を示す図である。文書処理装置1は、図5に示すように、文書処理装置1の全体を制御する制御部10と、画像入力部として機能するスキャナなどの画像入力装置20と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)などの表示装置30と、入力部として機能するキーボードやマウスなどの操作部40と、外部記憶装置となるHDドライブ50と、CD(Compact Disc)−ROM61に記録されたプログラムやデータを読み取るCD−ROMドライブ60と、FD61に記録されたプログラムやデータを読み取るFDドライブ70と、文書処理装置1とネットワークとの通信を司る通信部80とがバスを介して互いに接続された構成となっており、通常のコンピュータを利用したハードウェア構成となっている。
制御部10は、各部を集中的に制御するCPU(Central Processing Unit)を備えており、このCPUには、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)と、各種データを書換え可能に記憶し、CPUのワークエリアとして使用されるRAM(Random Access Memory)を備えており、文書処理装置の全体動作を制御する。
本実施の形態の文書処理装置1で実行される文書処理用プログラムは、インストール可能な形式又は実行可能な形式のファイルでHDドライブ50、CD−ROM61、FD71、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。また、本実施の形態の文書処理用プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施の形態の文書処理用プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。また、本実施の形態の文書処理用プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
制御部10では、CPUが、HDドライブ50、CD−ROMドライブ60、またはFDドライブ70から文書処理用プログラムをリードして、RAM上で当該プログラムを実行することにより、矩形抽出部11、検出方向設定部12、空白帯セパレータ検出部13、領域識別部14として機能する。
矩形抽出部11は、画像入力装置20によって入力されRAMに記憶された原稿画像の黒画素の連続する範囲毎に、それと外接する矩形(外接矩形)を検出する。検出方向設定処理部12は、原稿画像の検出方向を水平方向(行方向)および垂直方向(列方向)に設定する。
空白帯セパレータ検出部13は、空白帯セパレータ検出処理を実行して、文書要素を分離するための空白帯セパレータを検出する。具体的には、空白帯セパレータ検出部13は、検出方向設定処理部12により設定された検出方向と直交する方向に分割線で原稿画像を短冊状に分割する。そして、空白帯セパレータ検出部13は短冊状の各部分領域において、外接矩形に基づいて分割線と垂直に交わる空白領域を検出し、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を空白帯セパレータとして検出する。
領域識別部14は、原稿画像を領域識別し、文字領域、表領域、図領域、写真領域などに分類する。ここで、文書領域の識別は、空白帯セパレータ検出部13で検出された空白帯セパレータを使用して行う。
以下、上記文書処理装置1の空白帯セパレータの検出方法を詳細に説明する。ここでは、上記図2−2のような複雑なレイアウトの原稿を処理対象としている。前述したように、このようなレイアウトの場合、縦方向および横方向に射影分布を求めても、黒画素の計数結果に明確な変化は見られないことは明らかである。本実施の形態では、黒画素の外接矩形のみに注目し、黒画素そのものには注目しない。すなわち、上記図1−2における外接矩形に対して処理を実行する。
図6〜図15を参照して、制御部10の空白帯セパレータの検出方法を詳細に説明する。図6は、制御部10の空白帯セパレータ検出方法を説明するためのフローチャートである。図7〜図15は、制御部10の空白帯セパレータ検出方法を説明するための図である。
図6−1において、まず、画像入力装置20によって、原稿画像を入力してRAMに格納する(ステップS1)。次に、矩形抽出部11は、原稿画像において、黒画素の連続する範囲毎に、それと外接する矩形(外接矩形)を求める(ステップS2)。この後、検出方向設定処理部12は、検出方向を水平方向(行方向)に設定する(ステップS3)。
空白帯セパレータ検出部13は、矩形抽出結果に基づいて、水平方向について空白帯セパレータ検出処理を実行する(ステップS4)。
つづいて、検出方向設定部12は、検出方向を垂直方向(列方向)に設定する(ステップS5)。そして、空白帯セパレータ検出部13は、矩形抽出結果に基づいて、垂直方向空白帯セパレータ検出処理を実行する(ステップS6)。
上記ステップS4およびS6の空白帯セパレータ検出部13の空白帯セパレータ検出処理の詳細を説明する。図6−2において、まず、原稿画像を分割線により短冊状に分割する(ステップS11)。検出方向が水平方向(行方向)の場合は、原稿画像を垂直方向(列方向)に短冊上に分割する。
図7は、原稿画像をN等分の短冊状の部分領域に分割した例(例えば、N=8)を示す図である。まず、図7に示すように、処理対象領域を短冊状に分割する。ここで、分割単位は、処理対象をN等分してもよいし、固定幅にて分割してもよい。短冊状に分割された部分領域の詳細は、図8のようになる。
次に、短冊状の各部分領域内で、部分領域を横断する横断空白領域(空白領域)を検出し、検出結果を部分領域毎にRAMに記憶する(ステップS12)。具体的には、図8の各部分領域において、領域を横断する横断空白領域を検出する。これは、部分領域内の外接矩形の座標をソートしておき、隣接する外接矩形間の終点と始点との距離を順次求め、予め設定した閾値以上の空白を検出することによって横断空白領域を検出することができる。なお、射影分布を用いても横断空白領域を検出することができる。
また、図8に示すように、短冊状の部分領域を、・・・、n−2、n−1、n、n+1、n+2、・・・というように、その存在位置の左から右(垂直の場合、上から下)の順に番号づけしておくことにより、開始する部分領域はnが小さい順から先に、終了する部分領域はnが大きい順から先にとすることにより、注目する横断空白領域を容易に選択することができる。
そして、部分領域間において共通な空白領域を検出し、これらを連結して、より長い空白領域を作成する(ステップS13)。図9は、部分領域を横断する空白領域の検出結果を示す図である(横断空白領域1、横断空白領域2、横断空白領域3)。求めた横断空白領域に共通な空白領域を見つけることによって、セパレータ候補となる空白領域の連続を求めることができる。ここでは、横断空白領域1と横断空白領域3間の共通空白領域を求める場合を例に説明する。
まず、横断空白領域1と横断空白領域3の始点と終点座標とを比較し、重複する範囲がなければ、両者に共通する空白領域は存在しない。両者に重複する範囲がある場合は、横断空白領域1の属する部分領域(n−1)と横断空白領域3の属する部分領域(n+1)との間に存在する部分領域(この場合nのみ)において、横断空白領域(この場合、横断空白領域2)の座標の始点と終点とが、横断空白領域1と横断空白領域3と重複する範囲があるものが1つ以上存在する場合は、横断空白領域1と横断空白領域3を連結する横断空白領域が存在することになり、それらの重複範囲が共通空白領域である。最初に注目した2つの横断空白領域の間に、重複する横断空白領域を持たない空白領域がある場合は、注目した2つの横断空白領域の間に共通な空白領域は存在しない。
図10は、横断空白領域1と横断空白領域3との間に共通な空白領域2を求めて、横断空白領域1〜3を連結した結果を示す。
連結し終わった空白領域の長さが所定の閾値より長いか否かを判断する(ステップS14)。なお、空白帯セパレータとして機能する空白領域を求める場合に、実用上は極大な空白領域のみを求めることにしてもよい。たとえば、図9において、横断空白領域1と横断空白領域3との間の空白領域2を求めることができれば、横断空白領域1と横断空白領域2間と、横断空白領域2と横断空白領域3間の空白領域を求める必要はない。
この判断の結果、連結空白領域の長さが所定の閾値よりも長い場合には(ステップS14の「Yes」)、連結空白領域を空白帯セパレータとして、当該連結空白領域の座標を、RAMの現在の検出方向用の記録領域に格納する(ステップS15)。他方、連結空白領域の長さが所定の閾値よりも長くない場合には(ステップS14の「No」)、連結空白領域を空白帯セパレータとして採用しない。連結空白領域が複数検出された場合には、検出された領域数だけステップS14、S15の処理を繰り返す。なお、検出方向が垂直方向(列方向)の場合は、原稿画像を水平方向(行方向)に短冊上に分割して、同様の処理を行う。
なお、上記ステップS14では、連結し終わった空白領域の長さが所定の閾値より長い場合に、空白帯セパレータとして採用することとしたが、ステップS14の処理は必ずしも必要なものではなく、ステップS14の処理を省略して、連結し終わった空白領域を空白帯セパレータとして採用することとしても、本発明の課題を解決することが可能である。
前述したように、連続する空白領域は段落間だけでなく行間にも存在する。また、定ピッチで印刷された原稿においては、文字間の空白が段落全体を通じて他の行と同期してしまい、文字間を分離するような連結空白領域を生じる可能性がある。そこで、求められた連結空白領域のサイズを判定し、予め設定した閾値より細い場合には空白帯セパレータとして採用しないことにしてもよい。閾値に関しては、空白領域の長さに応じて、その幅を決定することができる。例えば、長い空白領域については小さい(細い)閾値を設定し、短い空白領域については大きい(太い)閾値を設定することにしてもよい。
図11は、黒画素が疎な原稿の場合の部分領域の一例を示す図である。上述した方法により、図11の部分領域を横断する横断空白領域を求めると、図12に示すようになる。これらの横断空白領域を連結すると、n−1〜n+1の範囲に及ぶ空白帯セパレータとなる。これは実際に使用する空白帯セパレータより長く感じられる。そこで、最初に注目する空白領域のサイズに制限を設け、閾値よりも大きい空白領域の場合は、その空白領域を空白帯セパレータとしないことにしてもよい。図12において、空白領域の幅に制限を設けた場合には、n−1およびn+1の横断空白領域を採用せずに最終的な空白帯セパレータは、図13に示すようになる。
また、図14に示すような原稿の場合、その横断空白領域を求めた結果は上記図9と同じとなり、セパレータとなる空白帯は図10と同じとなる。しかしながら、短冊状の部分領域の単位でしか、セパレータの長さが求められないので、本来、セパレータが挿入されるべき、図14の破線丸部分の空白領域を連結することができない。
そこで、2つの空白領域および共通の空白領域を連結した連結空白領域を求めた後、連結空白領域の外側方向に空白領域を探索し、空白領域を拡大することにしてもよい。具体的には、求められた空白帯セパレータ範囲に対し、外側(始点についてはnが小さい方、終点についてはnの大きい方)に、最も近接する矩形を求めればよい。これは、矩形を始点および終点に関して、それぞれソートしておけば容易に実現できる。図15に、極大な空白帯セパレータを求めた結果を示している。
また、対象として空白領域のサイズと、それと隣接する空白領域の間の距離に応じて、空白帯セパレータとして採用するか否かを決定することにしてもよい。
以上説明したように、本実施の形態によれば、文書画像の黒画素の外接矩形を検出し、文書画像を分割線により複数の短冊状の部分領域に分割し、各部分領域において、外接矩形に基づいて、分割線と垂直に交わる空白領域を検出し、異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を、文書要素を分離するための空白帯セパレータとして検出することとしたので、多種多様なレイアウトの文書に対してもセパレータとして機能する空白帯セパレータを高精度に検出することができ、文字領域の抽出精度を向上させることが可能となる。
以上のように、本発明に係る文書処理装置、文書処理方法、および文書処理用プログラムは、文字処理装置やOCR認識装置等の各種装置、文字処理用やOCR用の各種プログラムに好適に実施可能である。
10 制御部
11 矩形抽出部
12 検出方向設定部
13 空白帯セパレータ検出部
14 領域識別部
20 画像入力装置
30 表示装置
40 操作部
50 HDドライブ
60 CD−ROMドライブ
61 CD−ROM
70 FDドライブ
71 FD
80 通信部
11 矩形抽出部
12 検出方向設定部
13 空白帯セパレータ検出部
14 領域識別部
20 画像入力装置
30 表示装置
40 操作部
50 HDドライブ
60 CD−ROMドライブ
61 CD−ROM
70 FDドライブ
71 FD
80 通信部
Claims (8)
- 文書画像中で、文書要素を分離するための空白帯セパレータを検出する文書処理装置において、
前記文書画像の黒画素の外接矩形を検出する外接矩形検出手段と、
前記文書画像を分割線により複数の短冊状の部分領域に分割する分割手段と、
各部分領域において、前記外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出する空白領域検出手段と、
異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を前記空白帯セパレータとして検出する空白帯セパレータ検出手段と、
を備えたことを特徴とする文書処理装置。 - 前記分割手段は、前記文書画像の水平方向および垂直方向の両方向に分割線を施して、前記短冊状の部分領域に分割することを特徴とする請求項1に記載の文書処理装置。
- 前記空白帯セパレータ検出手段は、前記共通の空白領域を検出する場合に、距離の離れた前記2つの空白領域から順に処理を開始し、当該共通の空白領域が求められた場合には、前記2つの空白領域に関する処理を終了することを特徴とする請求項1に記載の文書処理装置。
- 前記空白帯セパレータ検出手段は、前記連結空白領域のサイズに応じて、空白帯セパレータとして採用するか否かを決定することを特徴とする請求項1に記載の文書処理装置。
- 前記空白帯セパレータ検出手段は、前記対象となる2つの空白領域のサイズに応じて、当該空白領域を空白帯セパレータとするか否かを決定することを特徴とする請求項1に記載の文書処理装置。
- 前記空白帯セパレータ検出手段は、前記連結空白領域の外側方向に空白領域を探索し、前記連結空白領域を拡大することを特徴とする請求項1に記載の文書処理装置。
- 文書画像中で、文書要素を分離するための空白帯セパレータを検出する文書処理方法において、
前記文書画像の黒画素の外接矩形を検出する外接矩形検出工程と、
前記文書画像を分割線により複数の短冊状の部分領域に分割する分割工程と、
各部分領域において、前記外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出する空白帯検出工程と、
異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を前記空白帯セパレータとして検出する空白帯セパレータ検出工程と、
を含むことを特徴とする文書処理方法。 - 文書画像中で、文書要素を分離するための空白帯セパレータを検出するための文書処理用プログラムにおいて、
前記文書画像の黒画素の外接矩形を検出する外接矩形検出工程と、
前記文書画像を分割線により複数の短冊状の部分領域に分割する分割工程と、
各部分領域において、前記外接矩形に基づいて、前記分割線と垂直に交わる空白領域を検出する空白帯検出工程と、
異なる部分領域の対象となる2つの空白領域間に、共通の空白領域があるか否かを検出し、共通な空白領域がある場合にはこれらを連結した連結空白領域を前記空白帯セパレータとして検出する空白帯セパレータ検出工程と、
をコンピュータに実行させることを特徴とする文書処理用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005252379A JP2007066084A (ja) | 2005-08-31 | 2005-08-31 | 文書処理装置、文書処理方法、および文書処理用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005252379A JP2007066084A (ja) | 2005-08-31 | 2005-08-31 | 文書処理装置、文書処理方法、および文書処理用プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007066084A true JP2007066084A (ja) | 2007-03-15 |
Family
ID=37928188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005252379A Pending JP2007066084A (ja) | 2005-08-31 | 2005-08-31 | 文書処理装置、文書処理方法、および文書処理用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007066084A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097551A (ja) * | 2016-12-13 | 2018-06-21 | 株式会社アイエスピー | 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置 |
JP2020144719A (ja) * | 2019-03-08 | 2020-09-10 | 国立大学法人秋田大学 | 紙面領域分類装置及びそのプログラム |
-
2005
- 2005-08-31 JP JP2005252379A patent/JP2007066084A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097551A (ja) * | 2016-12-13 | 2018-06-21 | 株式会社アイエスピー | 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置 |
JP2020144719A (ja) * | 2019-03-08 | 2020-09-10 | 国立大学法人秋田大学 | 紙面領域分類装置及びそのプログラム |
JP7243981B2 (ja) | 2019-03-08 | 2023-03-22 | 国立大学法人秋田大学 | 紙面領域分類装置及びそのプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8594422B2 (en) | Page layout determination of an image undergoing optical character recognition | |
CN110069767B (zh) | 基于电子书的排版方法、电子设备及计算机存储介质 | |
US5384864A (en) | Method and apparatus for automatic determination of text line, word and character cell spatial features | |
JP3253356B2 (ja) | 文書画像の領域識別方法 | |
JPH05233873A (ja) | 領域分割方法 | |
JP5600723B2 (ja) | 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム | |
US9256792B2 (en) | Image processing apparatus, image processing method, and program | |
JP2011065643A (ja) | 文字認識方法及び文字認識装置 | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP2007066084A (ja) | 文書処理装置、文書処理方法、および文書処理用プログラム | |
JP6247103B2 (ja) | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム | |
JP4867401B2 (ja) | 画像処理装置及びプログラム | |
JP4040905B2 (ja) | 縮小画像表示装置、方法、プログラムおよびプログラムを記録した記録媒体 | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP3607753B2 (ja) | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP2007295210A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体 | |
US9607218B2 (en) | Information processing apparatus, control method, and storage medium storing program | |
JP2004246929A (ja) | 文書画像の領域分割方法および装置 | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2003016385A (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JPH117493A (ja) | 文字認識処理装置 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 |