JPH09212580A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH09212580A
JPH09212580A JP8034239A JP3423996A JPH09212580A JP H09212580 A JPH09212580 A JP H09212580A JP 8034239 A JP8034239 A JP 8034239A JP 3423996 A JP3423996 A JP 3423996A JP H09212580 A JPH09212580 A JP H09212580A
Authority
JP
Japan
Prior art keywords
area
title
line
author name
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8034239A
Other languages
English (en)
Inventor
Tsutomu Kuramochi
勉 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP8034239A priority Critical patent/JPH09212580A/ja
Publication of JPH09212580A publication Critical patent/JPH09212580A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文書画像中の点列の片側にタイトルが配置さ
れその反対側に著者名が配置された目次の画像から、タ
イトルと著者名が書かれた部分領域を抽出する文書画像
処理装置を提供する。 【解決手段】 文書画像処理装置は、文書の画像データ
を読み込み、当該画像データを解析して、文書画像中の
部分領域を分離抽出する領域分割処理部と、前記部分領
域からタイトルと著者名を含む文字行の領域を抽出する
対象領域抽出処理部と、抽出した各文字行の領域がタイ
トルまたは著者名を含むか否かを判定する文字行種別判
定処理部と、判定した文字行から点列の領域を判定し当
該点列の両側からタイトルまたは著者名の部分領域を抽
出するタイトル著者名抽出処理部とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像ファイリ
ング装置,文字認識装置などにおいて、文書の画像を解
析して処理し、例えば、検索のためのキーとするタイト
ルおよび著者名などを抽出する場合に好適な文書画像処
理装置に関する。更に詳細には、文書画像中において点
列の片側にタイトルが配置され、その反対側に著者名が
配置された目次の画像を解析し、タイトルおよび著者名
の記載された部分領域を自動的に抽出する文書画像処理
装置に関するものである。
【0002】
【従来の技術】従来、文書画像処理において文書画像中
から所望の領域を抽出するには、例えば、特開平6−1
76127号公報に記載されているように、操作者がキ
ーボード装置のカーソルキーまたはポインティングデバ
イス(マウス)のポインタカーソルの操作を行い、画像
中の所望の領域を指示することが一般的である。このよ
うな方法では、操作者が画像中の所望の領域を直接指示
することになるので、どのような領域でも正確に抽出す
ることができる。
【0003】
【発明が解決しようとする課題】このような従来の方法
によると、多様な文書画像から所望の領域を抽出する場
合に、操作者の意図にあった適切な処理を行うことがで
きる。しかしながら、レイアウトがある程度共通してい
る文書画像から特定の項目を抽出する場合にも、操作者
がその都度領域を指示する操作を必要とし、非常に多く
の文書画像を処理する場合には、使用者に煩雑な同じ操
作を強いることになり、負担がかかるという問題があ
る。
【0004】本発明は、これらの問題を解決するために
なされたものであり、本発明の目的は、文書画像中の点
列の片側にタイトルが配置されその反対側に著者名が配
置された目次の画像から、タイトルと著者名が書かれた
部分領域を自動的に抽出することができる文書画像処理
装置を提供することにある。
【0005】
【課題を解決するための手段】上記の目的を達成するた
め、本発明による文書画像処理装置は、文書画像の画像
データを読み込み、当該画像データを解析して、点列の
一方側にタイトルが配置され他方側に著者名が配置され
た目次の画像から部分領域を抽出し、タイトルおよび著
者名の記載された部分領域を抽出する文書画像処理装置
であって、文書画像中の部分領域を分離抽出する領域分
割処理部と、前記部分領域からタイトルと著者名を含む
文字行の領域を抽出する対象領域抽出処理部と、抽出し
た各文字行の領域がタイトルまたは著者名を含むか否か
を判定する文字行種別判定処理部と、判定した文字行か
ら点列の領域を判定し当該点列の両側からタイトルまた
は著者名の部分領域を抽出するタイトル著者名抽出処理
部とを備えることを特徴とする。
【0006】このような特徴を有する本発明の文書画像
処理装置においては、領域分割処理部が、文書画像中の
部分領域を分離抽出すると、対象領域抽出処理部が、前
記部分領域からタイトルと著者名を含む文字行の領域を
抽出する。次に、文字行種別判定処理部が、抽出した各
文字行の領域がタイトルまたは著者名を含むか否かを判
定し、タイトル著者名抽出処理部が、判定した文字行か
ら点列の領域を判定し当該点列の両側からタイトルまた
は著者名の部分領域を抽出する。このようにして、文書
画像の画像データを読み込み、当該画像データを解析し
て、点列の一方側にタイトルが配置され他方側に著者名
が配置された目次の画像から部分領域を抽出し、タイト
ルおよび著者名の記載された部分領域を自動的に抽出す
る。これにより、操作者は同じような煩雑な操作を行う
ことなく、タイトルと著者名が書かれた部分領域が得ら
れる。
【0007】
【発明の実施の形態】以下、本発明を実施する場合の形
態について、図面を参照して具体的に説明する。図1
は、本発明の文書画像処理装置で処理対象とする文書画
像の目次の頁の一例を示す図である。図1において、1
0は文書画像の目次の頁、11はタイトル部分、12は
点列部分、13は著者名部分、14は頁番号部分であ
る。図1に示すように、文書画像の目次の頁は、点列部
分(「…」)12の左側にタイトル部分11が配置さ
れ、点列部分12の「…」の右側には著者名部分13と
頁番号部分14が配置された横書きの目次となっている
部分である。なお、図1において、周囲の黒枠は、文書
画像の端部を明示的に示すものであり、文書画像を読み
取るスキャナ装置によっては、紙の端部が読み取られて
現れる場合があるが、実際に黒い枠が存在するものでな
い。
【0008】なお、この実施例の説明においては、図1
に示すような横書きの目次の画像を処理対象として説明
するが、縦書きの文書の目次の頁に対しても同様に処理
可能である。その場合には、目次の頁には、縦方向の点
列「…」の上側にタイトルが配置され、下側に著者名が
配置されているレイアウトとなっているため、後述する
ような処理を縦方向に行うことになる。
【0009】図2は、本発明の一実施例の文書画像処理
装置の全体の構成を示すブロック図である。図2におい
て、20は入力処理部、21は領域分割処理部、22は
対象領域抽出処理部、23は文字行種別判定処理部、2
4はタイトル著者名抽出処理部、25は出力処理部であ
る。図2に示すブロック図は、そのまま、この文書画像
処理装置が、文書画像処理を行う場合の処理フローを示
すものとなっている。つまり、入力処理部20から、図
1に示すような目次の文書画像の画像データが入力され
ると、文書画像を解析し、点列の片側にタイトルが配置
されその反対側に著者名が配置された目次の画像からタ
イトルおよび著者名の記載された部分領域を抽出し、出
力処理部25からその判定結果を出力する。
【0010】次に本発明の一実施例の文書画像処理装置
の処理内容について、図2のブロック図を参照して説明
する。この文書画像処理装置においては、入力処理部2
0から入力された画像データに基づいて処理を開始す
る。まず、領域分割処理部21が、文書画像の画像デー
タを読み取り、目次の画像をあるまとまった1つ以上の
領域に分割する。次に、対象領域抽出処理部22が、そ
の領域のうちタイトルと著者名を含む領域を抽出する
と、文字行種別判定処理部23が、抽出した領域の中の
文字行を切り出し、各文字行にタイトルまたは著者名が
含まれるか否かを判定する。そして、タイトル著者名抽
出処理部24が、その判定の結果にしたがって、タイト
ルおよびと著者名の記載された部分領域を抽出する。
【0011】このような各々の処理部分のブロック要素
(図2)における詳細な処理について、次に示す図3か
ら図10を参照して説明する。なお、ここでの文書画像
の処理においては、文書画像中の文字などの有意画素は
黒画素(黒画素の集合)であり、背景部は白画素として
説明する。
【0012】図3は、領域分割処理部の処理フローを示
すフローチャートである。図3を参照して、領域分割処
理部21による領域分割処理について説明する。この領
域分割処理では、処理を開始すると、まず、ステップ3
1において、単位矩形領域の抽出を行う。すなわち、文
書画像中の画像データの黒画素を文字程度のまとまりに
分割して抽出する処理を行う。これにより、画像データ
の文字を含む部分領域が分割されて抽出される。
【0013】すなわち、領域分割処理では、まず、文書
画像の画像データから連結黒画素を抽出する。連結黒画
素の抽出は、例えば、従来から周知のラベル付けと呼ば
れる画像処理の手法を用いて行う。このような画像処理
のラベル付けに関しては、例えば、文献「森健一監修,
“パターン認識”,電子情報通信学会,171頁〜17
2頁」が参照できる。ラベル付けの画像処理によって、
例えば、図1の示す文書画像中のタイトル部分11の文
字列“ゼログラフィーの誕生”の中の先頭文字「ゼ」の
部分では、「セ」の連結黒画素部分と濁点部分「゛」の
2つの連結黒画素部分との3つの連結黒画素が抽出さ
れ、これらがまとめられる。
【0014】次に、まとめられた各々の連結黒画素に外
接する矩形領域を求める。当該矩形領域が他の矩形領域
と重複または包含関係にある場合、それらの矩形領域に
外接する矩形領域に統合する。この統合する処理を、各
々の矩形領域の間で重複または包含がなくなるまで繰り
返す。これにより、前述した図1の文書画像中の文字
「ゼ」を表している複数の連結黒画素の集合を一つにし
て矩形領域として扱えるようになる。ところで、また、
図1に示す文書画像の中の文字「岩」は、文字の形によ
っては(例えば、ゴシック体の場合には)、「山」と
「石」との2つの矩形領域に分割されてしまうので、必
ずしも1文字が1つの矩形領域になるとは限らないが、
この場合に対しては、後述するように、単位矩形サイズ
を基準とする矩形領域の判定の処理を行い、1つの文字
の領域として扱うことができる。このようにして得られ
た矩形領域を単位矩形領域とする。
【0015】次に、ステップ32において、フィールド
セパレータの検出処理を行う。この検出処理では、文書
画像中のフィールドセパレータを検出する場合、まず、
各単位矩形領域の幅と高さの大きい方の値を求め、その
値の総和を単位矩形領域数で割る。このようにして求め
た平均値を、ここでは「単位矩形サイズ」とする。この
単位矩形サイズは、文書中の平均的な文字のサイズに近
い値となる。そして、幅が単位矩形サイズのm倍以上、
高さが単位矩形サイズのn倍以下の単位矩形領域をフィ
ールドセパレータ領域として検出する。ただし、mとn
は予め定めた正の実数であり、例えば、ここでは、m=
5.0,n=0.1と設定しておく。これにより、このフ
ィールドセパレータ領域によって、文字行が区別でき
る。
【0016】次に、ステップ33において、矩形領域の
1次統合の処理を行う。この1次統合の処理では、単位
矩形領域を文字行程度のまとまりに統合する。すなわ
ち、まず、着目した1つの単位矩形領域を水平方向に予
め定めた量だけ拡張した矩形領域が、他の単位矩形領域
と重複または包含関係にある場合に、それらの矩形領域
に外接する矩形領域に統合する。ただし、統合した矩形
領域が、フィールドセパレータ領域と重複または包含関
係にある場合には、この統合処理は実行しない。なお、
ここで水平方向に拡張する量として、例えば、矩形領域
の右側および左側とも、「“単位矩形サイズ”×1.
2」程度に設定しておく。そして、この1次統合の処理
をフィールドセパレータ領域以外の統合されていない単
位矩形領域および統合して得た矩形領域に着目して、繰
り返し実行し、新たな統合がなくなるまで繰り返す。
【0017】次に、ステップ34において、矩形領域の
2次統合の処理を行う。前のステップ33の1次統合の
処理において統合した領域を、更に統合して、文書の領
域分割の結果とする。具体的には、複数行に渡っている
タイトルと著者名の行を統合する処理を行う。この場
合、まず、ステップ33の1次統合処理により抽出した
着目した1つの矩形領域を、水平方向に予め定めた量だ
け拡張し、更に、その拡張した領域を垂直方向に予め定
めた量だけ拡張した矩形領域が、他の矩形領域と重複ま
たは包含関係にある場合は、それらの矩形領域に外接す
る矩形領域に統合する。ただし、統合した矩形領域がフ
ィールドセパレータ領域と重複または包含関係にある場
合、この統合処理は実行しない。
【0018】ここでの水平方向および垂直方向に拡張す
る量としては、例えば、矩形領域の上側,下側,左側,
右側とも、それぞれ「“単位矩形サイズ”×2.2」程
度に設定する。そして、この2次統合処理を、当該処理
で未だ統合されていない領域であり、かつ、ステップ3
3の処理で抽出した領域と、当該処理で統合して得た矩
形領域とに着目して繰り返し実行し、新たな統合がなく
なるまで繰り返す。この処理結果を文書画像の領域分割
処理の最終的な処理結果とする。
【0019】図4は、矩形領域の1次統合処理および2
次統合処理を図1に示した文書画像の目次の画像を対象
にして行った処理結果を説明する図である。この1次統
合処理の処理結果によると、図4の上部側のブロック4
1に示すように、各々の単位矩形領域42〜45に対し
て、水平方向に直近の単位矩形領域の矩形領域のみが統
合される。つまり、上述のような処理が行われ、水平方
向に単位矩形領域の矩形領域が統合されて、例えば、統
合された矩形領域44となる。この結果、破線の枠で示
したように、17個の矩形領域に統合されることにな
る。なお、図4に示す図面の表現において、矩形領域を
表す破線の枠が包含する黒画素に外接するように表現し
ていないが、実際の画像データに対する処理では、矩形
領域に包含される黒画素に外接する座標データが記憶さ
れている。
【0020】このようにして、1次統合処理が行われた
結果に対して、更に、上述したような2次統合の処理が
行われる。その結果、図4の下部側のブロック46に示
すように、更に、水平方向および垂直方向に直近の近傍
の矩形領域どうしが統合されて、更に大きな矩形領域に
まとめられる。この1次統合処理の結果の矩形領域に対
して更に2次統合処理が行われた結果、水平方向および
垂直方向に1次統合処理の結果の近傍の矩形領域が統合
され、矩形領域42と矩形領域43とが統合されて矩形
領域47となり、矩形領域44と矩形領域45などが統
合されて矩形領域48となる。その結果、破線の枠で示
したように、4個の矩形領域に統合される。
【0021】次に、対象領域抽出処理部22(図2)の
処理について詳細に説明する。ここでの対象領域抽出処
理は、具体的には、例えば、領域分割処理部21により
抽出した領域の中から面積が最大のものを対象領域と判
定して抽出するアルゴリズムによる処理とする。これに
より、図4の下部側に示すブロック46の2次統合処理
結果に対して、対象領域抽出処理を行うと、目次の画像
中の4つの矩形領域からは、最大の矩形領域48が取り
出され、タイトル,点列,著者名,頁番号を含む領域
が、処理を行うベき対象の領域と判定される。
【0022】続いて行う文字行種別判定処理部23(図
2)の処理について説明する。ここでの文字行種別判定
処理部23においては、上述したようにして、前段の対
象領域抽出処理部22において、抽出した対象領域の矩
形領域48の中の各文字行について、最終的に、(1)
タイトルの全てまたは一部を含むが著者名を含まない
行、(2)タイトルと著者名を含む行、(3)タイトル
の一部と著者名を含む行、(4)著者名を含むがタイト
ルは含まない行、(5)ノイズだけの行の5種類の行の
それぞれに分類する処理を行う。
【0023】図5は、文字行種別判定処理部の処理フロ
ーを示すフローチャートである。図5を参照して、文字
行種別判定処理部23による文字行種別判定処理の概略
について説明する。この文字行種別判定処理では、処理
を開始すると、まず、ステップ51において、対象領域
の文字行を切り出す。次に、ステップ52において、切
り出した文字行から点列領域を検出し、次のステップ5
3において、文字列の矩形領域を検出する。そして、次
のステップ54において、文字行を5種類に分類する文
字行分類処理を行う。
【0024】すなわち、ここでの文字行種別判定処理で
は、まず、ステップ51において、対象領域中の文字行
を切り出す。この文字行を切り出す方法の例としては、
図3により説明した矩形領域の1次統合処理(ステップ
33)と同様な処理をそのまま適用できる。つまり、処
理の対象を文書画像全体ではなく、対象領域だけに限定
し、着目した矩形領域を水平方向に拡張する量を無限大
に設定して処理を行うようにする。
【0025】次に、ステップ52において、切り出した
文字行から点列を検出し、各点列に外接する矩形(点列
領域と呼ぶ)を検出する。ここでの点列を検出する方法
としては、各文字行に含まれる単位矩形領域を、左側に
位置するものから順に取り出し、次に、幅と高さが所定
の閾値1の値以下の単位矩形領域が、続けて所定の閾値
2の値の個数以上あり、各々の間隔が所定の閾値3の値
以下であることを判定し、その場合に、その複数の単位
矩形領域を点列と判定する。ここでの各々の閾値の値と
しては、例えば、閾値1の値は「“単位矩形サイズ”×
0.4」に設定し、閾値2の値は“5”に設定し、閾値
3の値は「“単位矩形サイズ”×0.3」に予め設定し
ておく。ただし、ここでの点列領域はノイズを含むもの
である場合があり、また、ノイズだけを含む領域である
場合があり得る。これらのノイズは後述する文字行分類
処理(図7〜図9)によって明確に区別される。
【0026】次のステップ53においては、点列を除く
文字列を空白で区切って検出し、各文字列に外接する矩
形領域(文字列領域と呼ぶ)を検出する。ここでの文字
列を空白で区切って検出する方法としては、例えば、文
字行切り出しと同様に、図3の参照により説明した矩形
領域の1次統合処理(ステップ33)と同様な処理を適
用することにより行う。つまり、この場合には、処理対
象を点列領域を除く対象領域に限定し、着目した矩形領
域を水平方向に拡張する量を「“単位矩形サイズ”×
1.0」程度、すなわち、空白の幅程度の値に設定して
おく。また、前の処理と同様に、ここでの文字列領域は
ノイズを含む場合があり、また、ノイズだけを含む領域
である場合があり得る。
【0027】次に、ステップ54において、各文字行を
上述した5種類の行に分類する文字行分類処理を行う。
この文字行分類処理では、まず、「(3)タイトルの一
部と著者名を含む行」または「(4)著者名を含むがタ
イトルは含まない行(以下、著者名を含む行と略称す
る)」を検出したことを、フラグのON状態で表すフラ
グをOFFに初期設定してから、下に位置する文字行か
ら上に位置する文字行に向かう順に、各文字行に対し
て、5種類の行に分類する処理を実行する。
【0028】つまり、この場合、ここでの判定処理が終
了した後に、ここでのフラグがOFFであると、
「(1)タイトルを含むが著者名を含まない行(以下、
タイトルを含む行と略称する)」または「(2)タイト
ルと著者名を含む行」が検出されたことを意味する。
【0029】図6は、文字行種別判定処理を図4の下部
側に示した対象領域に対して行った処理結果の途中結果
を説明する図である。上述の文字行種別判定処理のステ
ップ51〜53までの処理が行われた処理結果、図6に
示すように、その処理結果のブロック61においては、
文字列領域62と点列領域63とが明確に区別された判
定が行われた結果となっている。つまり、図6において
は、破線の枠が文字列領域62を表しており、一点鎖線
の枠が点列領域63を表している。なお、この処理結果
においては、文字列領域62については、例えば、2行
に渡たっているタイトル領域と、著者名領域との区別
は、未だ判定されていない。また、この場合において
も、図4の場合と同様に、図面の表現において、図6に
おいては矩形領域を表している破線および一点鎖線の枠
が包含する黒画素に外接するように表現されていない
が、実際の画像データに対する処理では、矩形領域に包
含される黒画素に外接する黒画素の座標データが記録さ
れている。
【0030】次に、タイトル領域と著者名領域との区別
を行うため、文字行を5種類の行に分類する文字行分類
処理(ステップ54)の詳細について説明する。図7〜
図9は、文字行を5種類の行に分類する文字行分類処理
の具体的な処理フローを示すフローチャートである。図
7〜図9を参照して具体的に説明する。まず、図7を参
照する。この文字行分類処理を開始すると、ステップ7
01において、文字行の中に文字列領域があるか否かを
判定する。文字列領域がない場合には、ステップ702
に進み、ノイズ(「ノイズだけの行」)と判定して、こ
の行に対する処理を終了する。そして、次の行の処理に
進む。
【0031】また、ステップ701の判定において、文
字列領域がある判定の場合には、ステップ703に進
み、文字行に点列があるか否かを判定する。点列がある
場合には、次のステップ704に進み、フラグはONで
あるか否かを判定する。フラグはONである場合、次の
ステップ705において、1つ下の文字行は著者名であ
るか否かを判定する。この判定において、1つ下の文字
行が著者名であると判定される場合には、更に、ステッ
プ706に進み、タイトルらしい文字列があるか否かを
判定する。このステップ706の判定でタイトルらしい
文字列がある場合には、ステップ707に進み、この処
理対象の行を「タイトルを含む行」であると判定する。
次に、ステップ708において、フラグをOFFとして
処理を終了し、次の行に対する処理に進む。
【0032】一方、この一連の判定処理の中のステップ
705の判定において、1つ下の文字行は著者名を含む
行ではない場合には、ステップ709に進み、ノイズ
(「ノイズだけの行」)と判定して、ここでの処理を終
了し、次の行に対する処理を行う。また、ステップ70
5の判定で1つ下の文字行が著者名を含む行であるが、
次のステップ706の判定において、タイトルらしい文
字列がない場合にも、ステップ709に進み、ノイズと
判定し、ここでの処理を終了し、次の行に対する処理を
行う。つまり、着目している行の点列の左側にタイトル
と判定できる程度の幅を持つ文字列領域がない場合に
は、同じく、ステップ709に進み、ノイズ(「ノイズ
だけの行」)と判定し、ここでの処理を終了して、次の
行の処理に進む(ステップ703〜ステップ706,ス
テップ709)。なお、この判定において、タイトルと
判定できる程度の領域の幅は、例えば、「“単位矩形サ
イズ”×6.0」程度の値に設定しておく。
【0033】また、この一連の判定処理の中のステップ
704の判定において、フラグがONでない場合には、
ステップ722(図9)に進む。図9を参照して、説明
を続けると、ステップ722においては、タイトルらし
い文字列があるか否かを判定する。このステップ722
の判定でタイトルらしい文字列がある場合には、ステッ
プ723に進み、更に、著者名らしい文字列があるか否
かを判定する。なお、この判定において、著者名と判定
できる程度の領域の幅は、例えば、「“単位矩形サイ
ズ”×4.0」程度の値に設定しておく。このステップ
723の判定において、著者名らしい文字列があると判
定される場合には、ステップ724において、この処理
対象の行を「タイトルと著者名を含む行」と判定する。
また、ステップ723の判定において、著者名らしい文
字列があると判定されない場合は、ステップ725の判
定において、ノイズ(「ノイズだけの行」)と判定し
て、ここでの処理を終了し、次の行に対する処理に進
む。
【0034】つまり、文字行中に文字列領域があり、更
に点列があり、フラグがONでない場合には、ステップ
722に進み、タイトルらしい文字列があるか否かを判
定する(ステップ722)。タイトルらしい文字列があ
る場合には、更に、著者名らしい文字列があるか否かを
判定し(ステップ723)、この判定において、著者名
らしい文字列がある場合には、この判定対象の行を「タ
イトルと著者名を含む行」と判定して(ステップ72
4)、ここでの処理を終了して、次の行の処理に進む。
また、この判定で著者名らしい文字列がない場合には、
ノイズ(「ノイズだけの行」)と判定して(ステップ7
25)、ここでの処理を終了して、次の行の処理に進
む。
【0035】また、先のステップ722の判定におい
て、タイトルらしい文字列がない場合には、ステップ7
26に進む。ステップ726の判定においては、更に、
著者名らしい文字列があるか否かを判定する。この判定
において、著者名らしい文字列があると判定される場合
には、次に、ステップ727に進み、ステップ727に
おいて、点列で始まっているか否かを判定する。点列で
始まっている場合には、次のステップ728において、
この処理対象の行を「著者名を含む行」であると判定す
る。また、ステップ727の判定において、点列で始ま
っていない場合には、ステップ730において、この処
理対象の行を「タイトルの一部と著者名を含む行」であ
ると判定する。そして、ステップ729に進み、フラグ
をONと設定して、ここでの処理を終了し、次の行に対
する処理に進む。
【0036】一方、ステップ726の判定において、著
者名らしい文字列がないと判定される場合には、ステッ
プ731に進み、ノイズ(「ノイズだけの行」)と判定
し、ここでの処理を終了して、次の行の処理に進む。
【0037】ところで、先のステップ703(図7)の
判定において、点列がない場合には、ステップ710
(図8)に進む。図8を参照して説明を続ける。ステッ
プ710においては、フラグがONであるか否かを判定
する。フラグがONでない場合には、ステップ721に
おいて、ノイズ(「ノイズだけの行」)と判定して、こ
こでの処理を終了し、次の行の処理に進む。
【0038】このステップ710の判定処理において、
フラグがONである場合、次に、ステップ711に進
み、1つ下の文字行は著者名であるか否かを判定する。
この判定において、1つ下の文字行が著者名であると判
定される場合には、更に、ステップ712に進み、タイ
トルらしい文字列があるか否かを判定する。このステッ
プ712の判定でタイトルらしい文字列がある場合に
は、次のステップ713に進み、この処理対象の行を
「タイトルを含む行」であると判定する。そして、次
に、ステップ714において、フラグをOFFに設定し
て、ここでの処理を終了し、次の行に対する処理に進
む。また、ステップ712の判定処理において、タイト
ルらしい文字列がない場合には、ステップ715に進
み、ノイズ(「ノイズだけの行」)と判定し、ここでの
処理を終了し、次の行に対する処理を行う。
【0039】また、先のステップ711の判定処理おい
て、1つ下の文字行が著者名でないと判定される場合に
は、次に、ステップ716に進み、1つ下の文字行はタ
イトルの一部と著者名であるか否かを判定する。この判
定の結果、1つ下の文字行はタイトルの一部と著者名で
あると判定される場合、ステップ717に進み、タイト
ルらしい文字列があるか否かを判定する。このステップ
717の判定でタイトルらしい文字列がある場合には、
次のステップ718に進み、この処理対象の行を「タイ
トルの一部を含む行」であると判定する。そして、次の
ステップ719において、フラグをOFFに設定して、
ここでの処理を終了し、次の行に対する処理に進む。ま
た、ステップ717の判定処理において、タイトルらし
い文字列がない場合には、ステップ715に進み、ノイ
ズ(「ノイズだけの行」)と判定し、ここでの処理を終
了し、次の行に対する処理を行う。同じく、ステップ7
16の判定において、1つ下の文字行はタイトルの一部
と著者名であると判定されない場合、ステップ720に
進み、ノイズ(「ノイズだけの行」)と判定して、ここ
での処理を終了し、次の行に対する処理を行う。
【0040】このようにして、各文字行を判定し、文字
行中に文字列領域があり、点列があり、フラグがON
で、かつ、1つ下の文字行が著者名を含む行であり、着
目している行の点列(点列領例)左側にタイトルと判定
できる程度の幅を持った文字列領域がある場合には、こ
の処理対象の文字行を「タイトルを含む行」であると判
定して、フラグをOFFに設定し、この行に対する処理
を終了して次の行に対する処理に進む(ステップ70
1,703〜708)。
【0041】また、1つ下の文字行が著者名を含む行で
はなく、または、着目している行の点列の左側にタイト
ルと判定できる程度の幅を持つ文字列領域がない場合に
は、ノイズ(「ノイズだけの行」)と判定し、次の行の
処理に進む(ステップ701,703〜706,70
9)。
【0042】文字行中に文字列領域があり、点列がない
場合には、フラグがOFFである場合に、ノイズ(「ノ
イズだけの行」)と判定し、次の行の処理に進む(ステ
ップ701,710,721)。また、フラグがONで
あり、1つ下の文字行が著者名を含む行であり、着目し
ている行にタイトルと判定できる程度の幅を持つ文字列
領域がある場合には、タイトルを含む行と判定し、フラ
グをOFFに設定して、次の行の処理に進む(ステップ
701,703,710〜714)。
【0043】同じく、フラグがONであり、1つ下の文
字行が著者名を含む行であり、着目している行にタイト
ルと判定できる程度の幅を持つ文字列領域がない場合に
は、ノイズ(「ノイズだけの行」)と判定して、次の行
の処理に進む(ステップ701,703,710〜71
2,715)。
【0044】同じく、フラグがONであり、1つ下の文
字行が著者名を含む行ではなく、1つ下の文字行はタイ
トルの一部と著者名を含む行であり、着目している行に
タイトルと判定できる程度の幅を持つ文字列領域がある
場合には、タイトルの一部を含む行と判定し、フラグを
OFFに設定して、次の行の処理進む(ステップ70
1,703,710〜711,716〜719)。
【0045】また、同じく、フラグがONであり、1つ
下の文字行が著者名を含む行ではなく、1つ下の文字行
はタイトルの一部と著者名を含む行であり、着目してい
る行にタイトルと判定できる程度の幅を持つ文字列領域
がない場合には、ノイズ(「ノイズだけの行」)と判定
し、次の行の処理進む(ステップ701,703,71
0〜711,716〜717,720)。
【0046】一方、文字行中に文字列領域があり、点列
があり、フラグがOFFである場合においては、着目し
ている行の点列の左側にタイトルと判定できる程度の幅
を持つ文字領域があり、当該点列の右側に著者名と判定
できる文字領域がある場合には、タイトルと著者名を含
む行と判定し、次の行の処理進む(ステップ701,7
03〜704,722〜724)。
【0047】ただし、この場合において、著者名と判定
できる文字列領域とは、例えば、点列の右隣の文字列領
域の左端から同じ行の一番右側に位置する文字列領域の
右端までの幅が「“矩形サイズ”×4.0」程度である
場合、その区間に含まれる文字列領域を指す。また、こ
の時点では、著者名と判定した文字領域に頁番号が含ま
れることもあるが、後の処理で著者名だけを抽出する。
【0048】また、着目している行の点列の右側に著者
名と判定できる程度の幅を持つ文字列領域がない場合、
ノイズ(「ノイズだけの行」)と判定し、次の行の処理
進む(ステップ701,703〜704,722〜72
3,725)。著者名と判定できる程度に領域の幅とし
ては、「“矩形サイズ”×4.0」程度の値を設定して
おく。つまり、ここでは著者名のタイトルとの区別を、
文字数に対応して4文字程度の矩形領域のサイズにより
判定している。
【0049】他方、文字行中に文字列領域があり、点列
があり、更に、フラグがOFFであり、着目している行
の点列領域の左側にタイトルと判定できる程度の幅を持
つ文字列領域がない場合には、着目している行の右側に
著者名と判定できる程度の幅を持つ文字列領域があり、
着目している行の先頭が点列領域である場合に、著者名
を含む行と判定し、フラグをONに設定して、次の行の
処理に進む(ステップ701,703〜704,72
2,726〜729)。
【0050】また、この場合において、着目している行
の右側に著者名と判定できる程度の幅を持つ文字列領域
があり、着目している行の先頭が点列でない場合には、
タイトルの一部と著者名を含む行と判定して、フラグを
ONに設定して、次の行の処理に進む(ステップ70
1,703〜704,722,726〜727,729
〜730)。
【0051】また、同じく、この場合に、着目している
行の右側に著者名と判定できる程度の幅を持つ文字列領
域がない場合には、ノイズ(「ノイズだけの行」)と判
定して、次の行の処理に進む(ステップ701,703
〜704,722,726,731)。
【0052】次に、タイトル著者名抽出処理部(24:
図2)の具体的な処理方法の一例について説明すると、
タイトルの抽出は、文字行種別判定処理部23において
少なくともタイトルまたはタイトルの一部を含む行と判
定された行に含まれている文字領域(タイトルまたはタ
イトルの一部と判定できる文字列領域)をそのまま結果
として出力する。ただし、タイトルが2行に分割されて
いる場合もあるので、その場合、既にタイトルの一部と
して抽出されているので、一つの領域にまとめて最終的
な結果とする。
【0053】著者名の抽出は、次のような手順により抽
出する。つまり、文字行種別判定処理部23の処理にお
いて、少なくとも著者名を含むと判定された各行の著者
名であると判定できる文字列領域に対して、その左側に
位置するものから順に着目して抽出する。そして、文字
列領域の幅が閾値4の値以上の場合は、その文字列領域
を一人分の著者名として抽出し、閾値4の値未満である
場合は、次の文字列領域と統合して一人分の著者名とし
て抽出する。最後的に、幅が閾値4未満である文字列が
残った場合には、著者名以外の文字列、例えば、頁番号
であると判定する。
【0054】このようにして、文書画像を解析し、目次
の画像からタイトルと著者名が書かれた部分領域を自動
的に抽出する。図10は、文書画像の目次の画像からタ
イトルと著者名が書かれた部分領域を抽出した処理結果
を示す図である。図10においては、文書画像100か
ら、点列の左側のタイトル領域101と、点列の右側の
著者名領域102とが抽出された様子を模式的に示して
いる。破線の枠がタイトルの部分領域を表し、一点鎖線
の枠が著者名を表している。
【0055】
【発明の効果】以上に説明したように、本発明の文書画
像処理装置によれば、文書の目次が記載されている画像
の画像データを解析し、点列の片側にタイトルが配置さ
れ、その反対側に著者名を配置された目次の画像から、
タイトルと著者名が書かれた部分領域を自動的に抽出す
ることができる。これにより、操作者は同じような煩雑
な操作を行うことなく、タイトルと著者名が書かれた部
分領域が得られる。
【図面の簡単な説明】
【図1】 図1は本発明の文書画像処理装置で処理対象
とする文書画像の目次の頁の一例を示す図、
【図2】 図2は本発明の一実施例の文書画像処理装置
の全体の構成を示すブロック図、
【図3】 図3は領域分割処理部の処理フローを示すフ
ローチャート、
【図4】 図4は矩形領域の1次統合処理および2次統
合処理を図1に示した文書画像の目次の画像を対象にし
て行った処理結果を説明する図、
【図5】 図5は文字行種別判定処理部の処理フローを
示すフローチャートである。
【図6】 図6は文字行種別判定処理を図4の下部側に
示した対象領域に対して行った処理結果の途中結果を説
明する図、
【図7】 図7は文字行を5種類の行に分類する文字行
分類処理の具体的な処理フローを示す第1のフローチャ
ート、
【図8】 図8は文字行を5種類の行に分類する文字行
分類処理の具体的な処理フローを示す図7に続く第2の
フローチャート、
【図9】 図9は文字行を5種類の行に分類する文字行
分類処理の具体的な処理フローを示す図7に続く第3の
フローチャート、
【図10】 図10は文書画像の目次の画像からタイト
ルと著者名が書かれた部分領域を抽出した処理結果を示
す図である。
【符号の説明】
10…文書画像の目次の頁、11…タイトル部分、12
…点列部分、13…著者名部分、14…頁番号部分、2
0…入力処理部、21…領域分割処理部、22…対象領
域抽出処理部、23…文字行種別判定処理部、24…タ
イトル著者名抽出処理部、25…出力処理部、41…1
次統合処理結果のブロック、42〜45…矩形領域、4
6…2次統合処理結果のブロック、47〜48…矩形領
域、61…処理の途中結果のブロック、62…文字列領
域、63…点列領域、100…文書画像、101…タイ
トル領域、102…著者名領域。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書の画像データを読み込み、当該画像
    データを解析して、点列の一方側にタイトルが配置され
    他方側に著者名が配置された目次の画像から部分領域を
    抽出し、タイトルおよび著者名の記載された部分領域を
    抽出する文書画像処理装置であって、 文書画像中の部分領域を分離抽出する領域分割処理部
    と、 前記部分領域からタイトルと著者名を含む文字行の領域
    を抽出する対象領域抽出処理部と、 抽出した各文字行の領域がタイトルまたは著者名を含む
    か否かを判定する文字行種別判定処理部と、 判定した文字行から点列の領域を判定し当該点列の両側
    からタイトルまたは著者名の部分領域を抽出するタイト
    ル著者名抽出処理部とを備えることを特徴とする文書画
    像処理装置。
JP8034239A 1996-01-30 1996-01-30 文書画像処理装置 Pending JPH09212580A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8034239A JPH09212580A (ja) 1996-01-30 1996-01-30 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8034239A JPH09212580A (ja) 1996-01-30 1996-01-30 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH09212580A true JPH09212580A (ja) 1997-08-15

Family

ID=12408616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8034239A Pending JPH09212580A (ja) 1996-01-30 1996-01-30 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH09212580A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164384A (ja) * 2013-02-22 2014-09-08 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2020123925A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及びプログラム
CN116092108A (zh) * 2023-03-20 2023-05-09 四川竺信档案数字科技有限责任公司 一种实体文档扫描生成pdf文件的方法、系统及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164384A (ja) * 2013-02-22 2014-09-08 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2020123925A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及びプログラム
US11494923B2 (en) 2019-01-31 2022-11-08 Fujifilm Business Innovation Corp. Information processing device and non-transitory computer readable medium
CN116092108A (zh) * 2023-03-20 2023-05-09 四川竺信档案数字科技有限责任公司 一种实体文档扫描生成pdf文件的方法、系统及存储介质

Similar Documents

Publication Publication Date Title
JP3253356B2 (ja) 文書画像の領域識別方法
JP3753357B2 (ja) 文字抽出方法および記録媒体
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH1031716A (ja) 文字行抽出方法および装置
JPH09212580A (ja) 文書画像処理装置
JP3912463B2 (ja) 論理構造抽出装置及び論理構造抽出方法
JPH08320914A (ja) 表認識方法および装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2918666B2 (ja) 文字画像切出し方法
JP3187895B2 (ja) 文字領域抽出方法
JP2003256772A (ja) 文字認識装置及び記録媒体
JPH0713994A (ja) 文字認識装置
JP3020662B2 (ja) 文字行切り出し装置及び文字認識装置
JP2995818B2 (ja) 文字切り出し方法
JPH09114923A (ja) 領域分割装置
JP3203749B2 (ja) 文書処理装置
JPH08171643A (ja) メッシュ状図形の輪郭抽出方式
JPH11316797A (ja) 文書画像の領域識別方法および装置
JP2797523B2 (ja) 図面続取装置
JP2933947B2 (ja) 画像処理方法及び装置
JPH0713996A (ja) 文字認識装置
JPH0728933A (ja) 文字認識装置
JPH01113887A (ja) 文字切り出し及び認識方式
JPH04112282A (ja) 単語領域抽出方式
JPH05210759A (ja) 文字認識装置