JPH11316797A - 文書画像の領域識別方法および装置 - Google Patents

文書画像の領域識別方法および装置

Info

Publication number
JPH11316797A
JPH11316797A JP11056842A JP5684299A JPH11316797A JP H11316797 A JPH11316797 A JP H11316797A JP 11056842 A JP11056842 A JP 11056842A JP 5684299 A JP5684299 A JP 5684299A JP H11316797 A JPH11316797 A JP H11316797A
Authority
JP
Japan
Prior art keywords
line
line width
pixels
circumscribed rectangle
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11056842A
Other languages
English (en)
Inventor
Kenji Hiramoto
建志 平本
Hiroshi Matsuuchi
浩 松内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11056842A priority Critical patent/JPH11316797A/ja
Publication of JPH11316797A publication Critical patent/JPH11316797A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像データから領域識別に必要な周辺分布特
徴や線密度特徴を簡便な処理で抽出し、高速に領域識別
を可能にする。 【解決手段】 線幅特徴抽出部4で、画像データより外
接矩形とその外接矩形の総画素数、水平シフト差分画素
数、垂直シフト差分画素数を抽出し、特徴値算出部5に
より領域識別を行なう際に必要となる周辺分布特徴を、
特定方向の周辺分布特徴抽出部6、7が抽出済みの外接
矩形と総画素数を基に簡便に算出する。また、同様に、
必要な線密度特徴を、特定方向の線密度特徴抽出部8、
9が抽出済みの外接矩形と水平シフト差分画素数、垂直
シフト差分画素数を基に簡便に算出し、高速な領域識別
を実現する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学的文字読み取
り装置(OCR)等において、文書画像の領域を識別す
る方法および装置に関する。
【0002】
【従来の技術】従来、OCR等における文書画像の領域
識別を行ない、本文、図、写真領域等を抽出する方法と
して、特許第2550867号公報や特開昭62−11
9690公報に開示されているような様々な方法が提案
されている。これらの方法は、周辺分布特徴と線密度特
徴の一方あるいは両方、更に、これらに外接矩形を組み
合わせて実現されているようになっている。
【0003】ここで、周辺分布特徴とは、特定方向に所
定長さとそれに直交する所定高さを持つ抽出対象領域の
画像データより得られる画素数であり、抽出対象領域の
文字の数や大きさに関係のない黒の画素数に相当し、上
記特定の方向とは、通常水平および垂直の両方向とな
る。
【0004】また、線密度特徴とは、特定方向に所定長
さとそれに直交する所定高さを持つ抽出対象領域の画像
データより得られる単位高さあたりの線数を意味し、上
記周辺分布特徴が高くても太い線で少ない文字が書かれ
ている場合と、細い文字で多くの文字が書かれている場
合の見分けがつかないところから、上記線の密度の分布
を表す線密度特徴を加味するようになっている。このよ
うに2つの特徴を使用すると、例えば見出し領域である
のか、文書領域であるのかの判別がし易くなる。
【0005】また、上記外接矩形とは、上記画像デ−タ
の連続する黒画素の外周を囲む形状であり、これを参照
することによって、それぞれの文字の領域を判別した
り、あるいは、行の傾斜を補正したりすることができる
ようになっている。ここで連続する黒画素とは、上下、
左右、斜めの8方向いずれかに連続すれば足りる。
【0006】まず、図41(a) に示すように用紙中央上
側に比較的大きな文字で主見出しTm が表示され、その
下に左右に2段組で文章が記入されるとともに、左段の
先頭に副見出しTs が表示されている文書の領域認識を
行う場合を例に、上記従来の方法を説明する。
【0007】先ず全体の画像データをビットマップメモ
リ上に取り込んだ状態で、垂直方向、水平方向に上記の
周辺分布特徴と線密度特徴を取得する。周辺分布特徴と
線密度特徴は同時に取得する必要はなく、特に線密度特
徴は後に必要になってから取得するようにしてもよい。
ここで水平方向の周辺分布特徴から、最上部と、その下
部の全面とが異なる領域であるらしいことが理解でき
る。そこで、さらに上記最上部と他の部分とで個別に垂
直水平の両方向に周辺分布特徴と線密度特徴とを取得す
る。
【0008】最上部の垂直方向の線密度特徴は図41
(b) に示すように著しく小さくなっており、この部分は
文字数が少ない見出し領域Tm であることが理解でき
る。また、上記最上部以外の部分の垂直方向の周辺分布
特徴が、図41(c) に示すように中央付近で小さくなっ
ていることから、左右に段組みがあることが判り、水平
方向に周辺分布特徴は周期性を持っているので、文書領
域であることが理解できる。
【0009】そこで更に、段組みの左右より別個に周辺
分布特徴と線密度特徴を取得すると、図41(d) 左段上
部が他の部分の周期性と異なっているので、この部分に
副見出しTs があることが予測される。この状態で更
に、上記左段の上部とそれ以外の部分の周辺分布特徴と
線密度特徴を取得して、副見出しのあることを確認する
ことになる。
【0010】
【発明が解決しようとする課題】以上述べたように、従
来の領域識別方法では、周辺分布特徴や線密度特徴を直
接画像メモリに格納されたビットマップ状の画像データ
より抽出する必要がある。しかも、文書領域をブロック
に分割する場合、上記のように一度求められた周辺分布
特徴や線密度特徴に基づいて分割域の候補を抽出し、再
度その周辺の画像データの周辺分布特徴や線密度特徴を
抽出して、真の分割域であるか否かを確認して分割処理
を実行するといった重複処理が必要であり、多くの処理
時間を必要とするという課題があった。
【0011】また、文字サイズが同じで線幅のみ違う文
字により見出しが書かれた文書画像から、簡素な方法
で、見出し領域を抽出することが困難であるという課題
があった。
【0012】さらに、認識辞書の選択が、文字の複雑度
に基づいて行なわれており、文字の線幅による更に細密
な辞書の分類はなされていないという課題があった。
【0013】そして、画像の文字などの構成要素の線幅
が予め解っている場合においても、簡素な方法で線幅の
違いを利用し、文字の判別を行なったり、あるいは、抽
出結果を線幅で棄却したりといった、処理速度や領域識
別の精度向上へ、線幅を利用していないという課題があ
った。
【0014】そこで、本発明はこのような課題を解決
し、周辺分布特徴と線密度特徴の抽出時間を短縮し、高
速な領域識別方法を実現する方法および装置を提供する
ことを目的とする。
【0015】また、線幅に着目し、簡単な方法で見出し
領域の抽出を実現すると共に、文字サイズが同じで線幅
のみ違う文字により見出しが書かれた文書画像からの、
見出し領域抽出を実現する方法および装置を提供するこ
とを目的とする。
【0016】さらに、文字の線幅に基づき、更に細密な
認識辞書の分類を行ない、認識率の向上を実現する方法
および装置を提供することを目的とする。
【0017】そして、文字などの構成要素の線幅が予め
解っている画像を対象とする場合に、線幅を利用した高
速な領域識別や、領域識別の精度向上を実現する方法お
よび装置を提供することを目的とする。
【0018】
【課題を解決するための手段】上記目的を達成するため
に、本発明は以下の手段を採用している。まず、本発明
は、特定方向に所定長さとそれに直交する所定高さを持
つ抽出対象領域の画像データの画素数に相当する周辺分
布特徴、上記抽出対象領域の単位高さ当たりの画像デー
タの線の数に相当する線密度特徴、更に、文書を構成す
る文字の線幅の内の少なくとも1つの要素を使用する文
書画像の領域識別装置を前提としている。
【0019】上記領域識別装置において、線幅特徴処理
部4は、上記画像デ−タの連続する画素の外周を囲む形
状である外接矩形を生成するとともに、該外接矩形内の
総画素数を算出する。また、外接矩形内の画素配列を特
定の方向に微分したときの白から黒もしくは黒から白へ
の変化点に位置する画素の数である特定方向毎のシフト
差分画素数を求める上記特定方向シフト差分画素数、更
に、水平および垂直方向のシフト差分画素であって、両
者に重なりがある場合はいずれか一方の画素である総合
シフト差分画素の総和を求めるようにしておく。
【0020】上記外接矩形の総画素数に基づいて、周辺
分布特徴処理部6、7は、上記外接矩形の上記特定方向
に直交する方向の高さに対する抽出対象領域の高さの割
合を乗じた値を、上記抽出対象領域と重なりがある全て
の外接矩形から取得してその総和を特定方向の周辺分布
特徴値として求める。このとき、また特定の外接矩形の
上記特定方向のシフト差分画素数に基づいて、線幅密度
特徴抽出部8、9は、該特定方向のシフト差分画素数
に、その外接矩形の上記特定方向に直交する方向の高さ
に対する抽出対象領域の高さの割合を乗じた値を、抽出
対象領域と重なりがある全ての外接矩形から取得すると
ともに、その総和の上記抽出対象領域の単位高さ当たり
の画素数を特定方向の線密度特徴値として求める。
【0021】更に、上記総合シフト差分画素数と特定の
外接矩形の総画素数に基づいて、線幅概算値抽出部10
は、抽出対象領域に属する外接矩形を構成する画素数の
総和を、上記抽出対象領域に属する外接矩形の総合シフ
ト差分画素数の総和で割った線幅概算値を線幅相当値と
して算出する。
【0022】以上によって、従来の方法では、画像デー
タを直接参照して抽出していた周辺分布特徴値や線密度
特徴値を、画像データの直接参照なしに抽出可能とな
り、繰り返し抽出を行なっても、より少ない処理時間で
抽出できる。
【0023】また、線幅概算値を用いることによって、
見出しの抽出が効率よく実行できることになる。
【0024】例えば、見出し抽出部13は、文書画像か
ら抽出された文字行より抽出された上記線幅概算値に基
づいて、見出しとして十分大きな線幅の最小値を抽出す
る最小見出し線幅を得ておき、該最小見出し線幅を越え
る線幅の文字行を見出しとすることができる。また、上
記最小見出し線幅は、対象文字行の前後の複数行もしく
は文書ブロックに基づいて求めることもできる。
【0025】上記最小見出し線幅は、特定の方法で抽出
された見出し候補以外の文字行に基づいて実行すること
も可能であり、このとき、上記見出し候補行の前後数
行、または、前後の文書ブロックを対象とすることもで
きる。
【0026】更に、線幅概算値を用いることによって、
文字行、文書ブロックの抽出を効率よく実行することが
できる。
【0027】例えば、文書ブロック抽出部11は、外接
矩形単位の線幅概算値が、既知の線幅に近似するとき
に、該近似する複数行に跨がる外接矩形を1の文書ブロ
ックとすることができ、また、既知の方法で抽出された
文書ブロック候補より取得された上記線幅概算値(ある
いは線幅概算値の比率)が、既知の文書ブロックの線幅
(あるいは線幅の比率)に近いときに、上記候補を文書
ブロックとすることができる。
【0028】また、文字行抽出部12は、外接矩形単位
の線幅概算値が、既知の線幅に近似するときに、該近似
する1行の外接矩形を1文字行とすることができ、ま
た、既知の方法で抽出された文字行候補より取得された
上記線幅概算値(あるいは線幅概算値の比率)が、既知
の文字行の線幅(あるいは線幅の比率)に近いときに、
上記文字行候補を文字行とすることができる。
【0029】更に、上記線幅概算値に基づいて当該文字
行をの内容を解読するための認識認識辞書を選択するこ
とも可能である。
【0030】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図を用いて説明する。
【0031】図1は本発明に係る領域識別方法および領
域識別装置を用いた文字認識装置の構成を示すブロック
図である。かかる文字認識装置は、紙面に印字された文
書画像等を光電変換して画像デ−タを得るスキャナ等の
画像入力部1、後に詳述する画像データを各種領域に分
割する領域識別部2、抽出された見出し領域や本文領域
中の文字行を構成する文字を一文字づつ認識する文字認
識部15により構成される。
【0032】上記装置の領域識別部2、文字認識部15
は専用の回路あるいは汎用のコンピュ−タ−とこれに格
納されるプログラムによっても達成することができ、こ
のプログラムはフロッピ−ディスク等の記録媒体に記録
することができる。
【0033】図1に示される上記領域識別部2は、図1
1に示す動作手順で作動する。
【0034】まず、領域識別部2の前処理部3は、上記
画像入力部1から入力された画像データを以降の領域識
別が容易な画像に公知の技術により変換・補正し線幅特
徴抽出部4に入力する(ステップ101)。
【0035】線幅特徴抽出部4は、上記変換・補正され
た画像データから以下に説明するように外接矩形を抽出
し、さらに、その外接矩形毎に総画素数、水平シフト差
分画素数、垂直シフト差分画素数、総合シフト差分画素
数を抽出する(ステップ102)。
【0036】文書ブロック抽出部11は、上記線幅特徴
抽出部4で得られる上記各特徴値に基づいて、画像デー
タより本文領域、見出し領域、図領域、写真領域、表領
域等の文書ブロックを抽出する(ステップ103)。
【0037】文字行抽出部12は、上記文書ブロック抽
出部11で抽出された本文領域から文字行を抽出し、ま
た、見出し抽出部13は、上記抽出された文書ブロック
から見出しを抽出する(ステップ104→105)。
【0038】尚、上記線幅特徴抽出部4での処理以外の
文書ブロック抽出処理および文字行の抽出処理は従来の
方法を用いるので、ここでは詳しい説明を省略する。
【0039】更に、認識辞書選択部14は、順次抽出さ
れる文字行に最適な認識辞書を選択するとともに、以降
に説明する文字認識処理で最適な辞書が使われるよう
に、当該文字行に認識辞書IDを付与するようになって
いる(ステップ106→107→108)。
【0040】図2は上記線幅特徴抽出部4の更に詳しい
構成を示すブロック図であり、図3にその具体的な処理
の内容を示す説明図であり、更に、図12は線幅特徴抽
出部の動作手順を示すフロー図である。
【0041】線幅特徴抽出部4の行内ラン抽出部401
は、画像データの高さが1画素、幅が画像データの幅で
ある1画素行を対象としてラン、すなわち連続する黒画
素の位置と長さの情報を抽出する(ステップ201)。
ここで、図3(a) に示すような画素pの配列よりなる画
像データからランを抽出すると、図3(b) のランR1〜
R10がそれぞれ抽出され、上記位置の情報と長さの情
報は、例えば各ランR1〜R10の黒画素の水平方向始
点(水平方向の右端または左端)の座標と個数を以って
表わされる。
【0042】外接矩形生成部402は、上記のように抽
出されたランを基に外接矩形を生成・更新する(ステッ
プ202)。すなわち、ランからは直接行方向の画素の
繋がりが分かり、また、上記ランの始点の座標と個数を
参照すると、列方向の画素の繋がりも判ることになる。
例えば、図3(b) のランR1、R2・・・R10に対応
して画素の繋がりを行方向(紙面左右方向)、列方向
(紙面上下方向)にトレースすると図3(a) の外接矩形
Cが抽出される。
【0043】総画素数計数部403は、上記のようにし
て抽出された外接矩形を形成する画素数を、当該外接矩
形毎に計数する(ステップ203)。すなわち、図3
(b) のランR1、R2・・・R10各々のランの長さ
(画素数)の総和である33が総画素数として抽出され
る。
【0044】水平シフト差分画素数計数部404は、ラ
ンの数を外接矩形毎に計数する(ステップ204)。す
なわち、図3(b) の各ランR1、R2・・・R10を右
端もしくは左端から微分した(以下に説明するシフト差
分画素数との関係で、右端と考えるのが合理的)ときの
白から黒(黒から白)への変化点に位置する画素の数で
あり、この数はランの数と同じになり、ここでは10が
水平シフト差分画素数として抽出される。
【0045】垂直シフト差分画素数計数部405は、前
画素行(下記の図3(c) の例では上の行)中のランと重
なりを持たないラン部分の画素を外接矩形毎に計数する
(ステップ205)。すなわち、図3(b) のランの配列
を列方向に微分したときの白から黒(黒から白)への変
化点に位置する画素の数である。
【0046】例えば、図3(b) の1行目の行は、更にそ
の上の行がないので、全画素がカウントの対象になる
(図3(c) 、垂直シフト差分画素SV1)。次いで、図
3(b) の2〜4行目は、それぞれ上の行と重なっている
ので、全画素がカウントの対象にならない。5行目は右
4画素は上の行と重なりがないのでカウントの対象とな
る(図3(c) 、シフト差分画素SV2)。同様にして垂
直シフト差分画素SV3、SV4が得られることにな
る。
【0047】総合シフト差分画素数計数部406は、上
記垂直シフト差分画素数(前画素行中のランと重なりを
持たないラン部分の画素数)に、さらに、ランの右端
(または左端)の画素が前画素行中のランと重なりを持
つ場合には1を加えた値を算出する。すなわち、上記水
平シフト差分画素と上記垂直シフト差分画素とを重ね合
わせた状態(両者が重複する場合はいずれか一方)の画
素の総数を外接矩形毎に計数する(ステップ206)。
図3(d) の例では総合シフト差分画素SHV1、SHV
5、SHV8の左側の画素、SHV9がそれぞれ図3
(c)の垂直シフト差分画素数SV1、SV2、SV3、
SV4に対応し、また、総合シフト差分画素SHV2、
SHV3、SHV4、SHV6、SHV7、SHV8の
右側の画素、SHV10が垂直シフト差分画素数と重な
らない水平シフト差分画素となり、総計は22となる。
【0048】特徴記憶部407は、上記のようにして得
られた各外接矩形、該各外接矩形単位の総画素数、水平
シフト差分画素数、垂直シフト差分画素数、総合シフト
差分画素数をそれぞれ記憶しておくことになる。
【0049】以上の処理は1画素行ごとに対象外接矩形
を構成する全画素行について行なうことはもちろんであ
る。(ステップ207)。
【0050】上記のようにして得られた外接矩形、各外
接矩形の総画素数、水平シフト差分画素数、垂直シフト
差分画素数、総合シフト差分画素数は特徴抽出部で以下
のように用いられる。該特徴識別部は図1において装置
に組み込まれた状態が示されている。また、図4は該特
徴抽出部5の水平方向周辺分布特徴抽出部6の構成を示
すブロック図であり、図13は該水平方向周辺分布特徴
抽出部6の動作を示すフロー図であり、更に図14は水
平方向周辺分布特徴抽出部6の処理の内容を示す説明図
である。
【0051】水平方向周辺分布特徴抽出部6の重複特徴
判別部601は、上記特徴記憶部407が持つ外接矩形
の中から特定の外接矩形を取り出し、図示しない上位の
制御手段より任意に指定される水平方向の周辺分布特徴
値の抽出対象領域と、当該外接矩形が交わりを持つか否
かを判別する(ステップ301)。例えば、図14の画
像データの例では、抽出対象領域APH1と外接矩形C
1、C2・・・が交わりを持つことが確認される。
【0052】次いで特徴別重複割合算出部602が、当
該外接矩形の垂直方向の辺(画素数)が、抽出対象領域
の垂直方向の高さ(画素数)と重なっている部分の割合
を算出する(ステップ302)。すなわち、図14の例
では外接矩形C1の垂直方向の辺の画素数が4であり、
抽出対象領域の垂直方向の辺の画素数は1であるので、
重複割合は1/4であり、同様に外接矩形C2の重複割
合が1/5であることが算出される。
【0053】特徴別重複画素数算出部603は、当該外
接矩形に対応する総画素数に、上記重複割合を乗じた重
複画素数を算出する(ステップ303)。すなわち、上
記図14の外接矩形C1の例では、総画素数が6である
ので、重複画素数は6×1/4=1.5であり、同様に
して、外接矩形C2の重複画素数は上記10×1/5=
2であることが算出される。
【0054】重複画素数累計部604は、現在までの重
複画素数の累計値に、新たに抽出された重複画素数を加
える(ステップ304)。すなわち、図14の例では、
抽出対象領域APH1の重複画素数の累計値3.5が得
られ、この値が水平方向周辺分布特徴値となる。ここ
で、抽出対象領域APH1の実際の水平方向周辺分布特
徴値すなわちランの長さは4であるが、以下に説明する
ように上記のようにして得られる値を用いても支障がな
く、従って、実際に水平方向周辺分布特徴を画像メモリ
から読み取ることなく、上記線幅特徴抽出部4が抽出し
た外接矩形に基づいた計算によって、近似的に上記水平
方向分布特徴を得ることができることになる。
【0055】ここで、図14の抽出対象領域APH2の
ように、特徴値の抽出対象領域が、外接矩形C1、C2
・・・を包含している場合には、特徴別重複割合算出部
602と、特徴別重複画素数算出部603による重複画
素数の算出を省略し、重複画素数累計部604におい
て、外接矩形C1、C2・・・に対応する総画素数の総
和を算出することで、水平方向周辺分布特徴値が得られ
るため好適である。すなわち、特徴別重複割合は外接矩
形C1、C2とも1となり、従って重複画素数は各外接
矩形C1、C2の画素数と同じになるためである。
【0056】上記特徴抽出部5は垂直方向の周辺分布特
徴を抽出する垂直方向周辺分布特徴抽出部7を備えてい
る。図5はこの垂直方向周辺分布特徴抽出部の構成を示
すものであるが、この動作については、上記水平方向周
辺分布特徴抽出部6の動作と方向が90度異なるだけ
で、基本的に同様である。具体的には、重複割合高さの
算出処理(ステップ302)において、特徴別重複割合
算出部702が、当該外接矩形の水平方向の辺の画素数
が、抽出対象領域の水平方向の辺の数と重なっている部
分の割合を算出する点で異なるだけである。
【0057】次に、上記特徴抽出部5は水平方向の線密
度特徴を抽出する水平方向線密度特徴抽出部8を備えて
いる。図6は該水平方向線密度特徴抽出部8の構成を示
すブロック図であり、図15は水平方向線密度特徴抽出
部8の動作手順を示すフロー図である。
【0058】重複特徴判別部801は、上記重複特徴判
別部601での場合と同様、線幅特徴抽出部4の特徴記
憶部407が持つ外接矩形の中から1つの外接矩形を取
り出し、図示しない上位の制御手段より指定される、水
平方向の線密度特徴値の抽出対象領域と、当該外接矩形
が交わりを持つか否かを判別する(ステップ401)。
すなわち、図16の例では、上記抽出対象領域ADH1
と外接矩形C1、C2・・・が交わりを持つことを、ま
ず確認する。
【0059】特徴別重複割合算出部802は、上記特徴
別重複割合算出部602と同様、当該外接矩形の垂直方
向の辺(画素数)が、抽出対象領域の垂直方向の高さ
(画素数)と重なっている部分の割合を算出する(ステ
ップ402)。従って、図16の例では上記したよう
に、外接矩形C1と抽出対象領域ADH1との重複割合
が1/4であり、外接矩形C2と抽出対象領域ADH1
との重複割合が1/5であることが算出される。
【0060】特徴別重複水平シフト差分画素数算出部8
03は、当該外接矩形に対応する水平シフト差分画素数
に、抽出された抽出対象領域と重なっている部分の上記
割合を、乗じた重複水平シフト差分画素数を算出する
(ステップ403)。ここで図16の例の場合、外接矩
形C1の水平シフト差分画素数は4であるので、重複水
平シフト差分画素数は4×1/4=1、外接矩形C2の
水平シフト差分画素数は5であるので、重複水平シフト
差分画素数は5×1/5=1となる。
【0061】更に、重複水平シフト差分画素数累計部8
04は、現在までの重複水平シフト差分画素数の累計値
に、新たに抽出された重複水平シフト差分画素数を加え
る(ステップ404)。従って、合計2が領域ADH1
の重複水平シフト差分画素数となることが判る。
【0062】以上の重複判定処理(ステップ401)か
ら累計値の更新処理(ステップ404)までを特徴記憶
部407が持つ全ての外接矩形について行なう(ステッ
プ405)。そして、水平方向線密度特徴算出部805
は、抽出された重複水平シフト差分画素数の累計値を、
水平方向の線密度特徴値の抽出対象領域の垂直方向の辺
の長さで割り、その値を水平方向の線密度特徴値とする
(ステップ406)。すなわち、図16の例では上記抽
出対象領域ADH1の垂直方向の辺の長さは1であるの
で上記累計値2を1で割ると、線密度特徴値として2が
得られることになる。
【0063】また、図16において抽出対象領域の高さ
が1画素幅でない(抽出対象領域ADH2)場合を例に
説明する。まず、外接矩形C1、C2・・・が抽出対象
領域ADH2と交わりを持つことが確認され(ステップ
401)、抽出対象領域ADH2と外接矩形C1の重複
割合が2/4であり、外接矩形C2の重複割合が1/5
であることが算出される(ステップ402)。さらに、
外接矩形C1の重複水平シフト差分画素数が4×2/4
=2であり、外接矩形C2の重複水平シフト差分画素数
が5×1/5=1であることが算出される(ステップ4
03)。これにより、抽出対象領域ADH2の重複水平
シフト差分画素数の累計値3が得られ、更に、重複水平
シフト差分画素数の累計値3を、抽出対象領域ADH2
の高さ2で割った結果、1.5が水平方向の線密度特徴
値として抽出される(ステップ404→406)。
【0064】また、図7に示す垂直方向線密度特徴抽出
部9の動作については、水平方向線密度特徴抽出部8の
動作と方向が90度異なるだけで、基本的に同様であ
る。具体的には、図15の重複割合の算出処理(ステッ
プ402)において、特徴別重複割合算出部902が、
当該外接矩形の水平方向の辺が、抽出対象領域と重なっ
ている部分の割合を算出する点と、重複水平シフト差分
画素数の算出処理から累計値の更新処理(ステップ40
3→404)において、水平シフト差分画素数の代わり
に垂直シフト差分画素数が用いられる点と、水平方向線
密度特徴の算出処理(ステップ406)において、垂直
方向線密度特徴算出部905が、外接矩形および抽出対
象領域の垂直方向の辺の長さの代わりに、水平方向の辺
の長さを用いる点で異なるだけである。
【0065】上記特徴値算出部5は線幅概算値抽出部を
備えた構成となっている。図8は、該線幅概算値抽出部
10の構成を示すブロック図であり、図17はその動作
手順を示すフロー図であり、更に、図18は線幅概算値
の内容を示す説明図である。
【0066】線幅概算値抽出部10の対象領域内特徴判
別部101は、特徴記憶部407が持つ外接矩形の中か
ら1つの外接矩形を取り出す。そして、線幅概算値抽出
部10の図示しない制御手段より任意に指定される、線
幅概算値の抽出対象領域の中に、当該外接矩形が入って
いるかを判別する(ステップ501)。例えば図18に
おいて、抽出対象領域ALW内に、外接矩形C1、C2
・・・が存在することを確認する。
【0067】総画素数累計部102は、現在までの総画
素数の累計値に、新たに抽出された当該外接矩形に対応
する総画素数を加える(ステップ502)。すなわち、
図18において外接矩形C1の総画素数6と、外接矩形
C2の総画素数10を、累計した総画素数累計値16が
得られることになる。
【0068】総合シフト差分画素数累計部103は、現
在までの総合シフト差分画素数の累計値に、新たに抽出
された外接矩形に対応する総合シフト差分画素数を加え
る(ステップ503)。図18の例では、図18(a) の
外接矩形C1、C2を構成するランに基づいて総合シフ
ト差分画素をとると、図18(b) のようになる。そこ
で、外接矩形C1の総合シフト差分画素数6と、外接矩
形C2の総合シフト差分画素数7を、累計した総合シフ
ト差分画素数累計値13が得られる。
【0069】以上の抽出対象領域内であるか否かの判断
処理(ステップ501)から総合シフト差分画素数の累
計値の演算処理(ステップ503)は特徴記憶部407
が持つ全ての外接矩形について実行され、線幅概算値算
出部104が、抽出された総画素数の累計値を、抽出さ
れた総合シフト差分画素数の累計値で割り、その値を線
幅概算値とする(ステップ504→505)。
【0070】すなわち、図18の例では総画素数累計値
16を総合シフト差分画素数累計値13で割った値1.
23が線幅概算値として抽出される。
【0071】ところで、上記においては水平方向周辺分
布特徴値、垂直方向周辺分布特徴値、水平方向線密度特
徴値、垂直方向線密度特徴値、線幅概算値を、特徴記憶
部407が持つ全ての外接矩形について処理を行なう例
を示した。しかしながら、上記の記述では外接矩形が抽
出対象内に存在する(あるいは抽出対象領域と交差す
る)か否かを特徴記憶部407の全体に渡って検出する
処理が必要である(図13、ステップ301、図15、
ステップ401、図17、ステップ501参照)。とこ
ろが、特徴記憶部407に記憶されている外接矩形の数
が多いと、この処理にかなりの時間を割かれることにな
り不都合である。そこで、特徴記憶部407が持つ外接
矩形を、画像データを適当な大きさの方眼領域に区切っ
た各領域毎に管理しておき、抽出対象領域と方眼領域の
交わりがある場合のみ、その方眼領域に分類されている
外接矩形と抽出対象領域の関係を調べるというステップ
を設けることも可能である。特に外接矩形の数が多くな
る画像データを対象とする場合には、このように、より
小さな領域毎に処理すると、処理速度が向上して好適で
ある。
【0072】次に、文書ブロック抽出部11の動作につ
いて図19を用いて説明する。図19は文書ブロック抽
出部11の動作を示すフロー図である。
【0073】文書ブロック抽出部11は、画像データ全
体を、あるいは、抽出対象領域が図示しない上位の制御
手段より限定されている場合にはその抽出対象領域を、
初期の(分割対象の)文書ブロックとする(ステップ6
01)。
【0074】そして、上記水平方向周辺分布特徴抽出部
6、および、垂直方向周辺分布特徴抽出部7を用いて、
当該文書ブロックの水平、垂直の周辺分布特徴値を得、
次いで、上記文書ブロックの周辺分布特徴値を基に、文
書ブロックの分割候補位置を抽出する(ステップ602
→603)。さらに、分割候補位置で区切られる複数の
文書ブロック中の領域に対して、水平方向線密度特徴抽
出部8、および、垂直方向線密度特徴抽出部9より、文
書ブロック中の各領域毎の水平、垂直の線密度特徴値を
得る(ステップ604)。
【0075】各領域毎の線密度特徴値を基に、文書ブロ
ックの分割候補位置が適当であるか否かを判定し、適当
である場合には、文書ブロックを当該文書ブロックの分
割候補位置で分割する(ステップ605→606)。
【0076】この判定処理(ステップ605)と分割処
理(ステップ606)は、全ての抽出された分割候補位
置について実行され、また、文書ブロックが分割された
場合、該分割された全てのブロックの対して、上記周辺
分布特徴値の取得処理(ステップ602)から分割処理
(ステップ606)までの工程を改めて行うことになる
(ステップ608)。
【0077】ここで、文書ブロック抽出部11の動作に
おいては、水平、垂直の周辺分布特徴値が水平方向周辺
分布特徴抽出部6、および、垂直方向周辺分布特徴抽出
部7を用いて取得される点と、水平、垂直の線密度特徴
値が水平方向線密度特徴抽出部8、および、垂直方向線
密度特徴抽出部9を用いて取得される点、すなわち、画
像メモリに記憶された画素をスキャンニングすることな
く計算のみによって取得できる点が重要であり、その他
の動作手順については、公知の技術から適当な方法を選
択して用いればよい。もちろん、周辺分布特徴や線密度
特徴を取得する手順や回数が選択された公知の技術に依
存して変わることは言うまでもない。
【0078】さらに、文書ブロック抽出部11におい
て、公知の技術では、多くの場合、周辺分布特徴値や線
密度特徴値の抽出は1画素行(1水平方向行)、あるい
は、1画素列(1垂直方向行)毎に実行される。即ち、
本願発明の領域識別方法および装置に、当該公知の技術
を適用した場合、水平方向周辺分布特徴抽出部6と、垂
直方向周辺分布特徴抽出部7と、水平方向線密度特徴抽
出部8と、垂直方向線密度特徴抽出部9に対して、抽出
対象領域の幅、または、高さとして1が与えられる。例
えば、垂直方向線密度特徴を例に取ると、図20の画像
データIMに対して、図20の垂直方向の1画素幅の抽
出対象領域ADVを、水平方向に並べた形で、垂直方向
線密度特徴抽出部9により線密度特徴値を取得し、図2
0の垂直方向線密度特徴グラフSDVに示すような値を
得る。
【0079】ここで、多くの公知の技術では、垂直方向
線密度特徴グラフSDVより文書ブロックの性質が判断
されるが、その多くは、垂直方向線密度特徴グラフSD
Vを平均値により判断を行なうと考えられる(例えば該
平均値より小さな値を持つ領域を分割領域とする等)。
本願発明の領域識別方法においては、上記したように重
複シフト差分画素数の値を抽出対象領域の高さ(画素
数)で割るようにしているので、線密度として得られる
のは常に抽出対象領域の平均値となり、従って、垂直方
向線密度特徴抽出部9に対して抽出対象領域を、図20
の画像データIMそのものにすれば、垂直方向線密度特
徴グラフSDVを平均化した値を得ることができるため
好適である。
【0080】文字行抽出部12についても上記文書ブロ
ック抽出部11と同様に、いくつかの公知の文字行抽出
方法から適当な方法を選択して用いればよく。当該公知
の技術における周辺分布特徴値の抽出を、水平方向周辺
分布特徴抽出部6、および、垂直方向周辺分布特徴抽出
部7で実行し、また、線密度特徴値の抽出を、水平方向
線密度特徴抽出部8、および、垂直方向線密度特徴抽出
部9で実行することになる。
【0081】次に、図9は見出し抽出部の構成を示すブ
ロック図であり、図21は見出し抽出部13の動作を示
すフロー図であり、更に、図22は見出抽出の内容を説
明する説明図である。
【0082】見出し抽出部13の文字行線幅概算値取得
部131は、線幅概算値抽出部10を使用し、上記文字
行抽出部12で抽出された各文字行の線幅概算値を取得
し、この処理を文字行抽出部12で抽出された全ての文
字行に対して行なう(ステップ701→702)。
【0083】最小見出し線幅抽出部132は、抽出され
た文字行の線幅概算値から統計処理により、見出しとし
て十分大きな線幅の最小値(例えば最大線幅概算値の7
5%)を抽出する(ステップ703)。見出し文字行選
択部133は、文字行の線幅概算値が、上記最小見出し
線幅抽出部132で抽出された見出しとして十分大きな
線幅の最小値を越える当該文字行について、当該文字行
を見出しとして扱うようにし、この処理を全ての文字行
に対して実行する(ステップ704→705→70
6)。
【0084】例えば、図22に示す例について説明する
と、文字行抽出部12により文字行L1、L2・・・が
抽出され、線幅抽出処理により、各行について線幅概算
値LWが抽出される(ステップ701→702)。この
ようにして抽出された線幅に基づいて、最小見出し線幅
の算出処理(ステップ703)において3が抽出され、
更に、この値に基づいて文字行LW4が見出し文字行と
して抽出されることになる(ステップ704→70
5)。
【0085】図10は認識辞書選択部の構成を示すブロ
ック図であり、図23はその動作手順を示すフロー図で
あり、更に、図24は認識辞書選択の具体例を示す説明
図である。
【0086】まず、認識辞書選択部14の文字行線幅概
算値取得部141が、上記線幅概算値抽出部10の抽出
した、文字行の線幅概算値を取得し、次いで、文字サイ
ズ推定部142は文字行中の文字の大きさを取得する。
最後に、認識辞書決定部143は、文字の大きさ線幅の
比率等から、最適な認識辞書を選択する(ステップ80
1→802→803)。尚、文字サイズ推定部142に
よる推定処理は公知の技術であるので、ここでは詳しい
説明を省略するが、例えば、外接矩形の所定方向の平均
値に基づく処理とすることができる。
【0087】例えば、図24の場合を例に説明すると、
文字行L1、L2に対し、上記線幅概算値抽出部10
が、既に説明した方法に基づいて文字行L1の線幅概算
値19と、文字行L2の線幅概算値10を抽出し、次い
で、文字サイズ推定部142が、文字行L1の文字サイ
ズ65と、文字行L2の文字サイズ50を抽出する。そ
して、認識辞書決定部143は、文字サイズに対して線
幅の大きな文字行L1については強調字体用の認識辞書
を、文字サイズに対して通常の大きさの線幅を持つ文字
行L2については通常字体用の認識辞書を選択するよう
になっている。
【0088】ここで、認識辞書選択部14の判定結果に
基づいて明確に特定の辞書が指示される必要はなく、例
えば、特定の辞書を用いたときの正解度を高く、他の辞
書を用いたときの正解度を低くしする等、認識辞書デー
タの正解度の重み付けに用いてもよい。
【0089】ところで、以上の処理によっても、画像デ
ータ中の文字の線幅が部分部分で異なっている場合に
は、見出し抽出部13において、うまく見出しの抽出が
できないことがある。例えば、ある部分では見出しとし
て使用されていた文字の線幅が、別のある部分では、通
常の文字行にその線幅が使用され、見出しには更に太い
線幅が用いられている場合である。このような場合であ
っても、以下の見出し抽出部13の構成を取ることによ
り、部分部分で異なる文字の線幅を用いた画像データか
らも見出しを抽出できる。
【0090】図25は、上記画像データ中の文字の線幅
が部分部分で異なっている場合に対応した、見出し抽出
部13の構成を示し、図26はその動作手順を示すフロ
ー図である。
【0091】見出し抽出部13の文字行線幅概算値取得
部131は、線幅概算値抽出部10より、文字行抽出部
12で抽出された各文字行の線幅概算値を、該文字行抽
出部12で抽出された全ての文字行に対して取得する
(ステップ901→902)。次いで、文字行周辺領域
設定部135が、文字行抽出部12で抽出された特定の
文字行に着目し、該特定の文字行の前後数行を周辺領域
とする(ステップ903)。更に、最小見出し線幅抽出
部132が、当該文字行を除いて設定された周辺領域内
の文字行の、線幅概算値から統計処理により、見出しと
して十分大きな線幅の最小値を抽出する(ステップ90
4)。
【0092】最後に、見出し文字行判定部136が、当
該文字行の線幅概算値が、上記最小見出し線幅抽出部1
32によって抽出された見出しとして十分大きな線幅の
最小値を越える場合のみ、当該文字行を見出しとして扱
うようにする(ステップ905→906)。
【0093】以上の周辺領域の設定から、見出し文字行
への更新処理(ステップ903〜906)を全ての文字
行について行なうことになる(ステップ907)。
【0094】図22を例に具体的に説明すると、文字行
抽出部12より得られた各文字行について、文字行概算
取得部131が文字行L1、L2・・・を抽出し、各行
の線幅概算値LWを取得する(ステップ901→90
2)。ここで、上記周辺領域として着目行に対して、例
えば前後2文字行が設定されていたとすると、文字行周
辺領域設定部135は、該着目行が文字行L3である場
合は、文字行L1、L2、L4、L5を周辺領域に設定
し、また、着目行が文字行L4である場合には、文字行
L2、L3、L5、L6を周辺領域に設定する(ステッ
プ903)。そして、見出し文字行判定部136では、
文字行L3が着目されている場合あるいは、文字行L4
が選択されている場合、上記最小見出し線幅抽出部13
2が、それぞれの見出しとして十分大きな線幅の最小値
を3程度に設定している状態では、文字行L4のみが線
幅概算値が4.01と十分大きいため見出しとして抽出
される(ステップ904→906)。
【0095】ところで、本願発明に係る見出し抽出方法
および装置は、従来技術による見出し抽出結果の確認手
段として使用することも可能である。領域識別部2中の
見出し抽出部13を、図27に示す構成とすることで、
従来技術による見出し抽出方法および装置が利用可能と
なる。
【0096】図27は領域識別部2の中の見出し抽出部
13との置き換え部分を示す構成図である。候補抽出部
16は、公知の技術により見出しの抽出を行ない、抽出
された見出しを、見出し候補とする。見出し確認部17
は、見出し候補抽出部16により抽出された見出し候補
の真偽を以下のように確認する。
【0097】図28は上記見出し確認部17のさらに詳
細な構成を示すブロック図であり、図29はその動作手
順を示すフロ−図であり、更に、図30はその具体例を
示す説明図である。
【0098】見出し確認部17の見出し候補線幅概算値
取得部171は、見出し候補抽出部16で抽出された特
定の見出し候補に着目し、線幅概算値抽出部10より当
該見出し候補の線幅概算値を取得する(ステップ100
1)。一方、見出し候補周辺領域設定部172は、当該
見出し候補の前後数行、または、前後の文書ブロックを
周辺領域として設定する(ステップ1002)。周辺領
域内線幅概算値取得部173は、線幅概算値抽出部10
より、当該見出し候補を除いた、設定された周辺領域内
の文字行と、文書ブロックの線幅概算値を取得する(ス
テップ1003→1004)。最小見出し線幅抽出部1
74は、上記のように周辺領域内線幅概算値取得部17
3が取得した線幅概算値から統計処理により、見出しと
して十分大きな線幅の最小値を抽出する(ステップ10
05)。見出し候補線幅確認部175は、上記見出し候
補線幅概算取得部171より得られる当該見出し候補の
線幅概算値が、上記最小見出し線幅抽出部174より抽
出された見出しとして十分大きな線幅の最小値を越える
場合のみ、当該見出し候補を見出しとして扱うようにし
(ステップ1006y→1007)、それ以外の場合
は、見出し候補を破棄する(ステップ1006n→10
08)。そして、以上の見出し候補の線幅概算取得処理
(ステップ1001)から見出しへの変更処理(破棄処
理)(ステップ1007、1008)を全ての見出し候
補について行なうことになる(ステップ1009)。
【0099】図30を例に具体的に説明すると、上記見
出し候補抽出部16により見出し候補Tが抽出された状
態で、上記見出し候補線幅概算値取得部171が、見出
し候補Tの線幅概算値4.01を抽出する(ステップ1
001)。一方、上記見出し候補周辺領域抽出部172
に、例えば周辺領域として前後3文字行が設定されてい
たとすると、文字行L1、L2、L3と文書ブロックB
が周辺領域として設定される(ステップ1002)。こ
の状態で上記周辺領域内線幅概算値取得部173は上記
文字行L1、L2、L3と文書ブロックBについての線
幅概算値LWを抽出し、最小見出し線幅抽出部174は
上記周辺領域内線幅概算値LWより見出しとして十分大
きな線幅の最小値(ここでは3)を得て設定する(ステ
ップ1003→1004→1005)。
【0100】さらに、上記最小値と見出し候補の線幅概
算値とを比較して見出し候補Tが見出しとして抽出され
る(ステップ1006→1007)。
【0101】ここで、図27に示した見出し候補抽出部
16と見出し確認部17の関係では、見出し候補抽出部
16で抽出された見出し候補が、見出し確認部17で棄
却された場合、当該見出し候補を破棄した時点で見出し
の抽出が完了することになるが、見出し候補抽出部16
が、見出し確認部17の棄却された結果を受けて、再度
新しい見出し候補を生成する構成を持ってもよいことは
言うまでもない。
【0102】また、図9や図25に示した見出し抽出部
13は、線幅概算値の取得を文字行抽出部12で抽出さ
れた文字行から行なうものと記載しているが、見出し確
認部17で見出し候補を処理する場合と同様に、文書ブ
ロックから線幅概算値を取得(図18の抽出対象領域A
LWを文書ブロックに設定する)しても問題なく、見出
し抽出部13に渡される領域を、実施の形態に応じて変
更すればよい。
【0103】ところで、画像データから抽出を行なう文
書ブロック、あるいは、文字行の線幅が既知である場
合、図31のような本願発明に係る領域識別装置である
領域識別部2の構成をとると好適である。
【0104】図31は、既知の線幅を持つ文書ブロック
の抽出を対象とした、領域識別部2の構成を示すブロッ
ク図であり。図32はこの動作手順を示すフロー図であ
る。
【0105】領域識別部2の前処理部3は画像入力部1
から入力された画像データを以降の領域識別が容易な画
像に公知の技術により変換・補正する(ステップ110
1)。線幅特徴抽出部4は、画像データから上記のよう
に外接矩形を抽出し、さらに、その外接矩形毎に総画素
数、総合シフト差分画素数を抽出する(ステップ110
2)。
【0106】線幅特徴選択部18は、上記のようにして
得られた外接矩形に対応する総画素数を、当該外接矩形
に対応する総合シフト差分画素数で割り、外接矩形の線
幅概算値を算出する(ステップ1103)。そして、算
出した線幅概算値が、既知である文書ブロックの線幅に
近い場合には(ステップ1104y)、当該外接矩形に
主要フラグを付与し(ステップ1105)、また、既知
の線幅から離れている場合には(ステップ1104
n)、当該外接矩形に補助フラグを付与する(ステップ
1106)。
【0107】以上の線幅概算値算出処理(ステップ11
03)から主要フラグ(補助フラグ)の付与処理(ステ
ップ1105、1106)を全ての外接矩形対して実行
する(ステップ1107)。そして、文書ブロック抽出
部19は、主要フラグが付与された外接矩形を中心に、
文書ブロックを抽出することになる(ステップ110
8)。
【0108】また、既知である線幅を持つ文字行の抽出
を対象とした、領域識別部2の構成を図33に示す。こ
こでは図31の文書ブロック抽出部19が、図33の文
字行抽出部20に変わるのみである。動作についても同
様であり、主要フラグが付与された外接矩形を中心に文
字行を抽出する。
【0109】図34に基づいて、上記既知線幅の文字行
の抽出処理について具体的に説明する。
【0110】図34(a) に示す画像データから文字行T
Gの線幅が既知であるものとすると、該文字行TGを構
成する外接矩形特徴の線幅概算値を取得した時点で、各
外接矩形の全てに主要フラグが付与される。ついで、文
字行の抽出処理において、上記のように主要フラグが付
与された外接矩形特徴によって構成される文字行TGが
抽出されることになる。
【0111】34(b) に、図34(a) の画像データの
外接矩形を示す。この外接矩形からは、抽出対象である
文字行TGに対応する外接矩形と、その他の外接矩形の
区別は困難である。しかし、上記のように主要フラグが
付与された外接矩形は、文字行TGに対応するもの以
外、枠線上部のわずかに存在するだけであるため、文字
行抽出部20により、抽出対象である文字行TGが確実
に抽出される。
【0112】ところで、上記既知である線幅を持つ文書
ブロックの抽出を対象とした、領域識別部2は、従来技
術による文書ブロックの抽出結果の確認手段として使用
することも可能である。
【0113】図35は、従来技術による文書ブロックの
抽出の確認手段を設けた、領域識別部2の構成を示すブ
ロック図であり、図36はその動作手順を示すフロー図
である。
【0114】領域識別部2の前処理部3が画像入力部1
から入力された画像データを以降の領域識別が容易な画
像に公知の技術により変換・補正し、線幅特徴抽出部4
は、上記入力された画像データから外接矩形を抽出し、
さらに、その外接矩形毎に総画素数、総合シフト差分画
素数を抽出する(ステップ1201→1202)。文書
ブロック候補抽出部211は、公知の技術により、文書
ブロック候補を抽出し、文書ブロック線幅確認部212
は、線幅概算値抽出部10を使用し、上記のように抽出
された文書ブロック候補の線幅概算値を取得する(ステ
ップ1203→1204)。
【0115】ここで、上記のようにして得られた文書ブ
ロック候補の線幅概算値が、既知である抽出対象の文書
ブロックの線幅に近い値を持つ場合のみ、当該文書ブロ
ック候補を文書ブロックとし(ステップ1205y →1
206)、また、既知の線幅から離れている場合には、
当該文書ブロック候補を破棄する(ステップ1205n
→1207)。以上の線幅概算値取得処理(ステップ1
204)から文書ブロックへの変更(破棄)処理(ステ
ップ1206(1207))を全ての文書ブロック候補
に対して実行することになる(ステップ1208)。
【0116】また、従来技術による文字行の抽出に確認
手段を設けた、領域識別部2の構成を図37に示す。上
記図35の文書ブロック抽出部21が、図37の文字行
抽出部22に変わるのみであり、また、動作についても
同様であり、文字行候補の線幅概算値を、既知である文
字行の線幅と比較を行なうことになる。
【0117】ところで、上記従来技術による文書ブロッ
クの抽出に確認手段を設けた、領域識別部2は、画像デ
ータから抽出を行なう文書ブロック間の線幅の比率が既
知である場合、図38のような領域識別部2の構成をと
ると好適である。
【0118】図38は、既知である線幅の比率を持つ文
書ブロックの抽出を対象とした、領域識別部2の構成を
示すブロック図である。
【0119】領域識別部2において、前処理部3は、画
像データを以降の領域識別が容易な画像に公知の技術に
より変換する。線幅特徴抽出部4は、前処理部の変換処
理と並行して、あるいは、後に、以降の領域識別で必要
となる特徴の全て、あるいは、一部を、画像を解析しあ
らかじめ準備しておく。また、線幅概算値抽出部10
は、任意の領域の線幅の概算値を抽出する。
【0120】文書ブロック候補抽出部211は、抽出対
象である文書ブロックの候補を公知の技術により抽出す
る。文書ブロック間線幅比確認部213は、上記線幅概
算値抽出部10を使用し、抽出された文書ブロック候補
の線幅概算値を取得し、文書ブロック候補間の線幅概算
値の比率を算出する。そして、当該線幅概算値の比率が
既知である文書ブロック間の線幅の比率に近い値を持つ
場合のみ、当該文書ブロック候補を文書ブロックとす
る。
【0121】図38に示した、既知である線幅の比率を
持つ文書ブロックの抽出を対象とした、領域識別部2の
動作については、図35に示した、従来技術による文書
ブロックの抽出に確認手段を設けた、領域識別部2の動
作とほぼ同様であり、図35の文書ブロック線幅確認部
212で確認した文書ブロックの線幅が、図38の文書
ブロック間線幅比確認部213で確認する文書ブロック
間の線幅比に変わっただけである。
【0122】また、既知である線幅の比率を持つ文字行
の抽出を対象とした、領域識別部2の構成を図39に示
す。図39は領域抽出部2のブロック図であり、図38
の文書ブロック抽出部21が、図39の文字行抽出部2
2に変わるのみであり、動作も文書ブロック候補の線幅
概算値の代わりに、文字行候補の線幅概算値を使用する
だけである。
【0123】図40に示す画像データを例に、既知であ
る線幅の比率を持つ文字行の抽出について具体的に説明
する。
【0124】図40(a) のような画像データから、図4
0(b) の文字行TG1、TG2、TG3を抽出する場
合、まず、文字候補抽出部221が文字行TG1、TG
2、TG3を文字行候補として抽出し、該文字行TG
1、TG2、TG3を構成する外接矩形の全てに主要フ
ラグが付与される。次いで、文字行TG1、TG2、T
G3の線幅概算値の比率が、既知の線幅の比率に近いこ
とが確認され、文字行として扱われる。ここで、例え
ば、図40(c) に示すように一部の画像の欠けがあっ
て、文字候補抽出部221が文字行TG1’、TG2、
TG3’を文字行候補として抽出した場合、文字行の形
状からでは、抽出対象の文字行であるか否かの判断に迷
うところであるが、線幅概算値の比率が、既知の線幅の
比率に近いため、抽出対象の文字行であるという結論を
容易に導くことができる。
【0125】尚、上記既知の線幅あるいは線幅概算値を
用いる処理において、既知の線幅はいかなる方法で設定
されてもよい。抽出対象の文書ブロックや文字行が1つ
である場合には、既知線幅(あるいは既知線幅概算値)
を線幅特徴選択部18(文書ブロック線幅確認部21
2、文字行線幅確認部222)に設定することで足りる
が、同一文書の複数の抽出対象の文書ブロックや文字行
を判定対象とするときには、上記既知線幅に加えて文書
ブロック(文字行)の位置やサイズを設定しておき、確
認対象の文書ブロック候補(文字行候補)を少なくする
方法を採ってもよい。このことは、上記文書ブロック間
(文字間)線幅比率を用いる場合でも同様である。
【0126】ところで、以上の実施形態では、前処理部
3で画像データの変換・補正(ステップ101)を行な
っているが、特に必要なものではなく、目的に応じて経
験的、または実験的に画像入力部1より得られる画像デ
ータに処理を施すことができる。
【0127】また、文書ブロック抽出部11や、文字行
抽出部12の動作については、1つの公知の技術を示し
ただけであり、周辺分布特徴や線密度特徴を用いる多く
の方法と置き換え可能である。
【0128】さらに、見出し抽出部13は複数の特徴を
加味して抽出を行い、線幅概算値はその内の1つの特徴
として利用する形態でもなんら問題はない。
【0129】
【発明の効果】以上のように、本願発明は、画像データ
から外接矩形特徴と対応する総画素数、水平シフト差分
画素数、垂直シフト差分画素数、総合シフト差分画素数
を抽出し、そして、本文領域、見出し領域、図領域、写
真領域、表領域等の文書ブロックを抽出する段階におい
て必要となる周辺分布特徴値や線密度特徴値を、初期段
階に抽出しておいた外接矩形特徴と対応する総画素数、
水平シフト差分画素数、垂直シフト差分画素数、総合シ
フト差分画素数を基に算出するようになっている。従っ
て、画像データを直接繰り返し参照することなく計算に
よって、周辺分布特徴値や線密度特徴値を抽出可能とな
り、繰り返し抽出を行なっても、より少ない処理時間で
抽出できる。
【0130】さらに、本願発明は、文字行毎に、その文
字行を構成する外接矩形特徴と対応する総画素数、総合
シフト差分画素数に基づき線幅概算値を求めることが可
能であり、この線幅概算値を基に、従来の方法では不可
能であった、文字サイズが同じであるが太字で書かれた
見出し領域を、抽出することができる。
【0131】また、見出しの線幅の基準値を、画像デー
タ中の全ての文字列からではなく、着目している文字行
の前後数文字行から算出することにより、部分部分で異
なる線幅で書かれた見出しを抽出することができる。
【0132】また、本願発明は、文字行、または、文書
ブロックの線幅概算値により最適な文字認識辞書を選択
することが可能であり、文字認識率を向上することがで
きる。
【0133】そして、本願発明は、抽出対象の文書ブロ
ック、あるいは、文字行の線幅が既知である場合、線幅
特徴概算値により、外接矩形特徴をランク付けすること
により、抽出精度の向上や、処理時間の短縮が可能であ
る。
【0134】さらに、従来の方法による見出しの抽出
や、文字行の抽出に、抽出結果の確認手段として利用す
ることも可能である。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一例を示すブロック図
である。
【図2】線幅特徴抽出部の構成を示すブロック図であ
る。
【図3】画像データと外接矩形特徴、ラン、垂直シフト
差分画素列、シフト差分画素列の一例を示す図である。
【図4】水平方向周辺分布特徴抽出部の構成を示すブロ
ック図である。
【図5】垂直方向周辺分布特徴抽出部の構成を示すブロ
ック図である。
【図6】水平方向線密度特徴抽出部の構成を示すブロッ
ク図である。
【図7】垂直方向線密度特徴抽出部の構成を示すブロッ
ク図である。
【図8】線幅概算値抽出部の構成を示すブロック図であ
る。
【図9】見出し抽出部の構成を示すブロック図である。
【図10】認識辞書選択部の構成を示すブロック図であ
る。
【図11】領域識別部の処理を示すフロー図である。
【図12】線幅特徴抽出部の処理を示すフロー図であ
る。
【図13】水平方向周辺分布特徴抽出部の処理を示すフ
ロー図である。
【図14】画像データと水平方向周辺分布特徴抽出対象
領域、外接矩形特徴の一例を示す図である。
【図15】水平方向線密度特徴抽出部の処理を示すフロ
ー図である。
【図16】画像データと水平方向線密度特徴抽出対象領
域、外接矩形特徴の一例を示す図である。
【図17】線幅概算値抽出部の処理を示すフロー図であ
る。
【図18】画像データと線幅概算値抽出対象領域、外接
矩形特徴、シフト差分画素の一例を示す図である。
【図19】文書ブロック抽出部の処理を示すフロー図で
ある。
【図20】画像データと垂直方向線密度特徴抽出対象領
域、垂直方向線密度特徴の一例を示す図である。
【図21】見出し抽出部の処理を示すフロー図である。
【図22】画像データと文字行、線幅概算値の一例を示
す図である。
【図23】認識辞書選択部の処理を示すフロー図であ
る。
【図24】画像データと文字行、線幅概算値、文字サイ
ズの一例を示す図である。
【図25】周辺領域設定を有する見出し抽出部の構成を
示すブロック図である。
【図26】周辺領域設定を有する見出し抽出部の処理を
示すフロー図である。
【図27】見出し抽出部の代替構成を示すブロック図で
ある。
【図28】結果確認処理を有する見出し抽出部の構成を
示すブロック図である。
【図29】結果確認処理を有する見出し抽出部の処理を
示すフロー図である。
【図30】画像データと見出し候補、文字行、文書ブロ
ック、線幅概算値の一例を示す図である。
【図31】既知線幅文書ブロックを対象とした領域識別
部の構成を示すブロック図である。
【図32】既知線幅文書ブロックを対象とした領域識別
部の処理を示すフロー図である。
【図33】既知線幅文字行を対象とした領域識別部の構
成を示すブロック図である。
【図34】画像データと既知線幅文字行、外接矩形特徴
の一例を示す図である。
【図35】結果確認処理を有する既知線幅文書ブロック
を対象とした領域識別部の構成を示すブロック図であ
る。
【図36】結果確認処理を有する既知線幅文書ブロック
を対象とした領域識別部の処理を示すフローチャ−トで
ある。
【図37】結果確認処理を有する既知線幅文字行を対象
とした領域識別部の構成を示すブロック図である。
【図38】結果確認処理を有する既知線幅比文書ブロッ
クを対象とした領域識別部の構成を示すブロック図であ
る。
【図39】結果確認処理を有する既知線幅比文字行を対
象とした領域識別部の構成を示すブロック図である。
【図40】画像データと既知線幅比文字行、抽出対象文
字行の一例を示す図である。
【図41】従来の領域識別の手順を示す説明図である。
【符号の説明】
1 画像入力部 2 領域識別部 3 前処理部 4 線幅特徴抽出部 5 特徴値算出部 6 水平方向周辺分布特徴抽出部 7 垂直方向周辺分布特徴抽出部 8 水平方向線密度特徴抽出部 9 垂直方向線密度特徴抽出部 10 線幅概算値抽出部 11 文書ブロック抽出部 12 文字行抽出部 13 見出し抽出部 14 認識辞書選択部 15 文字認識部 16 見出し候補抽出部 17 見出し確認部 18 線幅特徴選択部 19 文書ブロック抽出部 20 文字行抽出部 21 文書ブロック抽出部 22 文字行抽出部 101 対象領域内特徴判別部 102 総画素数累計部 103 総合シフト差分画素数累計部 104 線幅概算値算出部 131 文字行線幅概算値取得部 132 最小見出し線幅抽出部 133 見出し文字行選択部 134 文字行周辺領域設定部 135 最小見出し線幅抽出部 136 見出し文字行判別部 141 文字行線幅概算値取得部 142 文字サイズ推定部 143 認識辞書決定部 171 見出し候補線幅概算値取得部 172 見出し候補周辺領域設定部 173 周辺領域内線幅概算値取得部 174 最小見出し線幅抽出部 175 見出し候補線幅確認部 211 文書ブロック候補抽出部 212 文書ブロック線幅確認部 213 文書ブロック間線幅比確認部 221 文字行候補抽出部 222 文字行線幅確認部 223 文字行間線幅比確認部 401 行内ラン抽出部 402 外接矩形生成部 403 総画素数計数部 404 水平シフト画素数計数部 405 垂直シフト画素数計数部 406 総合シフト画素数計数部 407 特徴記憶部 601 対象領域重複特徴判別部 602 特徴別重複割合算出部 603 特徴別重複画素数算出部 604 重複画素数累計部 701 重複特徴判別部 702 特徴別重複割合算出部 703 特徴別重複画素数算出部 704 重複画素数累計部 801 重複特徴判別部 802 特徴別重複割合算出部 803 特徴別重複水平シフト差分画素数算出部 804 対象領域重水平シフト差分画素数累計部 805 水平方向線密度特徴算出部 901 対象領域重複特徴判別部 902 特徴別重複割合算出部 903 特徴別重複垂直シフト差分画素数算出部 904 対象領域重垂直シフト差分画素数累計部 905 垂直方向線密度特徴算出部

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 特定方向に所定長さとそれに直交する所
    定高さを持つ抽出対象領域の画像データの画素数に相当
    する周辺分布特徴を使用する文書画像の領域識別方法に
    おいて、 上記画像デ−タの連続する画素の外周を囲む形状であ
    る外接矩形内の総画素数を算出する線幅特徴処理ステッ
    プと、 外接矩形の総画素数に、その外接矩形の上記特定方向に
    直交する方向の高さに対する抽出対象領域の高さの割合
    を乗じた値を、上記抽出対象領域と重なりがある全ての
    外接矩形から取得してその総和を特定方向の周辺分布特
    徴値として求める周辺分布特徴処理ステップを備えたこ
    とを特徴とする文書画像の領域識別方法。
  2. 【請求項2】 特定方向に所定長さとそれに直交する所
    定高さを持つ抽出対象領域の単位高さ当たりの画像デー
    タの線の数に相当する線密度特徴を使用する文書画像の
    領域識別方法において、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る外接矩形内の画素配列を特定の方向に微分したときの
    白から黒もしくは黒から白への変化点に位置する画素の
    数である特定方向毎のシフト差分画素数を、上記方向毎
    に求める線幅特徴処理ステップと、 特定の外接矩形の特定方向のシフト差分画素数に、その
    外接矩形の上記特定方向に直交する方向の高さに対する
    抽出対象領域の高さの割合を乗じた値を、抽出対象領域
    と重なりがある全ての外接矩形から取得するとともに、
    その総和の上記抽出対象領域の単位高さ当たりの画素数
    を特定方向の線密度特徴値として求める線密度特徴処理
    ステップとを備えたことを特徴とする文書画像の領域識
    別方法。
  3. 【請求項3】 特定方向に所定長さとそれに直交する所
    定高さを持つ抽出対象領域の画像データの画素数に相当
    する周辺分布特徴と、上記抽出対象領域の単位高さ当た
    りの画像データの線の数に相当する線密度特徴を使用す
    る文書画像の領域識別方法において、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る外接矩形内の総画素数を算出するとともに、外接矩形
    内の画素配列を上記特定の方向に微分したときの白から
    黒もしくは黒から白への変化点に位置する画素の数であ
    る特定方向毎のシフト差分画素数を、上記方向毎に求め
    る線幅特徴処理ステップと、 外接矩形の総画素数に、その外接矩形の上記特定方向に
    直交する方向の高さに対する抽出対象領域の高さの割合
    を乗じた値を、上記抽出対象領域と重なりがある全ての
    外接矩形から取得してその総和を特定方向の周辺分布特
    徴値として求める周辺分布特徴処理ステップ 特定の外接矩形の特定方向のシフト差分画素数に、その
    外接矩形の上記特定方向に直交する方向の高さに対する
    抽出対象領域の高さの割合を乗じた値を、抽出対象領域
    と重なりがある全ての外接矩形から取得するとともに、
    その総和の上記抽出対象領域の単位高さ当たりの画素数
    を特定方向の線密度特徴値として求める線密度特徴処理
    ステップ、を備えたことを特徴とする文書画像の領域識
    別方法。
  4. 【請求項4】 画像データより抽出される該画像データ
    を構成する文字の線幅に基づいて文書画像の領域識別を
    行う領域識別方法において、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る外接矩形内の総画素数を算出するとともに、外接矩形
    内の画素配列を特定の方向に微分したときの白から黒も
    しくは黒から白への変化点に位置する画素の数である水
    平および垂直方向のシフト差分画素であって、両者に重
    なりがある場合はいずれか一方の画素である総合シフト
    差分画素の総和を求める線幅特徴処理ステップと、 抽出対象領域に属する外接矩形を構成する画素数の総和
    を、上記抽出対象領域に属する外接矩形の総合シフト差
    分画素数の総和で割った線幅概算値を線幅相当値として
    算出する線幅概算値算出ステップからなる、文書画像の
    領域識別方法。
  5. 【請求項5】 文書画像から抽出された文字行より得た
    線幅概算値から、見出しとして十分大きな線幅の最小値
    を抽出する最小見出し線幅を得、該最小見出し線幅を越
    える線幅の文字行を見出しとする見出し文字行選択ステ
    ップを備えた請求項4に記載の文書画像の領域識別方
    法。
  6. 【請求項6】 上記最小見出し線幅の取得を、特定の方
    法で抽出された見出し候補以外の文字行に基づいて実行
    し、上記見出し候補が上記最小見出し線幅を越える場合
    のみ、見出しとする請求項5に記載の文書画像の領域識
    別方法。
  7. 【請求項7】 上記最小見出し線幅の取得を、対象文字
    行の前後の複数行もしくは文書ブロックに基づいて実行
    し、上記対象文字行が上記最小見出し線幅を越える場合
    のみ、見出しとする請求項5に記載の文書画像の領域識
    別方法。
  8. 【請求項8】 上記最小見出し線幅の取得の対象となる
    見出し候補以外の文字行が、見出し候補行の前後の複数
    行、または、前後の文書ブロックである請求項6に記
    載の文書画像の領域識別方法。
  9. 【請求項9】 認識対象である文字行の上記線幅概算値
    と、当該文字行の各文字の大きさに基づいて、当該文字
    行の内容を解読するための認識辞書を選択する請求項4
    に記載の文書画像の領域識別方法。
  10. 【請求項10】 画像データを構成する外接矩形単位の
    線幅概算値が、既知の線幅に近似するときに、該近似す
    る複数行に跨がる外接矩形を1の文書ブロックとする請
    求項4に記載の文書画像の領域識別方法。
  11. 【請求項11】 画像データを構成する外接矩形単位の
    線幅概算値が、既知の線幅に近似するときに、該近似す
    る1行の外接矩形を1文字行とする請求項4に記載の文
    書画像の領域識別方法。
  12. 【請求項12】 既知の方法で抽出された文書ブロック
    候補より取得された上記線幅概算値が、既知の文書ブロ
    ックの線幅に近いときに、上記候補を文書ブロックとす
    る請求項4に記載の文書画像の領域識別方法。
  13. 【請求項13】 既知の方法で抽出された文字行候補よ
    り取得された上記線幅概算値が、既知の文字行の線幅に
    近いときに、上記文字行候補を文字行とする請求項4に
    記載の文書画像の領域識別方法。
  14. 【請求項14】 画像データより抽出される複数の文書
    ロック候補より取得された上記線幅概算値の相互の比率
    が、既知の文書ブロック間の線幅の比に近い値である場
    合に、当該文書ブロック候補を文書ブロックとする請求
    項4に記載の文書画像の領域識別方法。
  15. 【請求項15】 画像データより抽出される複数の文字
    行候補より取得された上記線幅概算値の相互の比率が、
    既知の文字行間の線幅の比に近い値である場合に、当該
    文字行候補を文字行とする請求項4に記載の文書画像の
    領域識別装置。
  16. 【請求項16】 特定方向に所定長さとそれに直交する
    所定高さを持つ抽出対象領域の画像データの画素数に相
    当する周辺分布特徴を使用する文書画像の領域識別装置
    において、 線幅特徴処理部と、周辺分布特徴処理部とよりなり、 上記線幅特徴処理部は、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る 外接矩形を生成する外接矩形生成部と、 上記外接矩形内の総画素数を算出する総画素数計数部と
    よりなり、 上記周辺分布特徴処理部は、 外接矩形の総画素数に、その外接矩形の上記特定方向に
    直交する 方向の高さに対する抽出対象領域の高さの割
    合を乗じた値を、上記抽出対象領域と重なりがある全て
    の外接矩形から取得してその総和を特定方向の周辺分布
    特徴値として求める特定方向の周辺分布特徴処理部と
    よりなる文書画像の領域識別装置。
  17. 【請求項17】 特定方向に所定長さとそれに直交する
    所定高さを持つ抽出対象領域の単位高さ当たりの画像デ
    ータの線の数に相当する線密度特徴を使用する文書画像
    の領域識別装置において、 線幅特徴処理部と、線密度特徴処理部とよりなり、 上記線幅特徴処理部は、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る 外接矩形を抽出する外接矩形生成部と、 外接矩形内の画素配列を特定の方向に微分したときの白
    から黒もしく は黒から白への変化点に位置する画素の
    数である特定方向毎のシフト差分画 素数を求める上記
    特定方向シフト差分画素数計数部とよりなり、 線密度特徴算出部は、 特定の外接矩形の特定方向のシフト差分画素数に、その
    外接矩形 の上記特定方向に直交する方向の高さに対す
    る抽出対象領域の高さの割合を乗じ た値を、抽出対象
    領域と重なりがある全ての外接矩形から取得するととも
    に 、その総和の上記抽出対象領域の単位高さ当たりの
    画素数を特定方向の線密度特徴値として求める特定方向
    の線密度算出部とよりなる文書画像の領域識別装置。
  18. 【請求項18】 特定方向に所定長さとそれに直交する
    所定高さを持つ抽出対象領域の画像データの画素数に相
    当する周辺分布特徴と、上記抽出対象領域の単位高さ当
    たりの画像データの線の数に相当する線密度特徴使用す
    る文書画像の領域識別装置において、 線幅特徴処理部と、周辺分布特徴抽出部と、線密度特徴
    処理部とよりなり、 上記線幅特徴処理部は、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る 外接矩形を生成する外接矩形生成部と、 上記外接矩形内の総画素数を算出する総画素数計数部
    と、 外接矩形内の画素配列を上記特定の方向に微分したとき
    の白から黒もしくは黒から白への変化点に位置する画素
    の数である特定方向毎のシフト差分画素数を求める特定
    方向のシフト差分画素数計数部とよりなり周辺分布特徴
    抽出部は、 外接矩形の総画素数に、その外接矩形の上記特定方向に
    直交する 方向の高さに対する抽出対象領域の高さの割
    合を乗じた値を、上記抽出対象領域と重なりがある全て
    の外接矩形から取得してその総和を特定方向の周辺分布
    特徴値として求める特定方向の周辺分布特徴抽出部より
    なり線密度特徴処理部は、 特定の外接矩形の特定方向のシフト差分画素数に、その
    外接矩形 の上記特定方向に直交する方向の高さに対す
    る抽出対象領域の高さの割合を乗じた値を、抽出対象領
    域と重なりがある全ての外接矩形から取得するととも
    に、 その総和の上記抽出対象領域の単位高さ当たりの画素数
    を特定方向の線密度特徴値として求める特定方向の線密
    度特徴抽出部よりなることを特徴とする線密度特徴処理
    装置。
  19. 【請求項19】 画像データより抽出される該画像デー
    タを構成する文字の線幅に基づいて文書画像の領域識別
    を行う領域識別装置において、 線幅特徴処理部と、線幅概算値算出部とよりなり、 上記線幅特徴処理部は、 上記画像デ−タの連続する黒画素の外周を囲む形状であ
    る 外接矩形を生成する外接矩形生成部と、 上記外接矩形内の総画素数を算出する総画素数計数部
    と、 外接矩形内の画素配列を特定の方向に微分したときの白
    から黒もしくは黒から白への変化点に位置する画素の数
    である水平および垂直方向のシフト差分画素であって、
    両者に重なりがある場合はいずれか一方の画素である総
    合シフト差分画素の総和を求める総合シフト差分画素数
    計数部よりなり、 上記線幅概算値算出部は、抽出対象領域に属する外接矩
    形を構成する画素数の総和を、上記抽出対象領域に属す
    る外接矩形の総合シフト差分画素数の総和で割った線幅
    概算値を線幅相当値として算出することを特徴とする文
    書画像の領域識別装置。
  20. 【請求項20】 文書画像から抽出された文字行より抽
    出された上記線幅概算値に基づいて、見出しとして十分
    大きな線幅の最小値を抽出する最小見出し線幅を得、該
    最小見出し線幅を越える線幅の文字行を見出しとする見
    出し抽出部を備えた請求項19に記載の文書画像の領域
    識別装置
  21. 【請求項21】 上記最小見出し線幅の取得を特定の方
    法で抽出された見出し候補以外の文字行に基づいて実行
    し、上記見出し候補が上記最小見出し線幅を越える場合
    のみ見出しとする見出し抽出部を備えた請求項20に記
    載の文書画像の領域識別装置。
  22. 【請求項22】 上記最小見出し線幅の取得を、対象文
    字行の前後の複数行もしくは文書ブロックに基づいて実
    行し、上記対象文字行が上記最小見出し線幅を越える場
    合のみ見出しとする見出し抽出部を備えた請求項20に
    記載の文書画像の領域識別装置。
  23. 【請求項23】 上記見出し抽出部での上記最小見出し
    線幅の取得の対象となる見出し候補以外の文字行が、見
    出し候補行の前後数行、または、前後の文書ブロックで
    ある請求項21に文書画像の領域識別装置。
  24. 【請求項24】 認識対象である文字行の上記線幅概算
    値と、当該文字行の各文字の大きさから、当該文字行を
    の内容を解読するための認識辞書を選択する認識辞書選
    択部を備えた請求項19に記載の文書画像の領域識別装
    置。
  25. 【請求項25】 画像データを構成する外接矩形単位の
    線幅概算値が、既知の線幅に近似するときに、該近似す
    る複数行に跨がる外接矩形を1の文書ブロックとする文
    書ブロック抽出部を備えた、請求項19に記載の文書画
    像の領域識別装置。
  26. 【請求項26】 画像データを構成する外接矩形単位の
    線幅概算値が、既知の線幅に近似するときに、該近似す
    る1行の外接矩形を1文字行とする文字行抽出部13を
    備えた請求項19に記載の文書画像の領域識別装置。
  27. 【請求項27】 既知の方法で抽出された文書ブロック
    候補より取得された上記線幅概算値が、既知の文書ブロ
    ックの線幅に近いときに、上記候補を文書ブロックとす
    る文書ブロック抽出部を備えた請求項19に記載の文書
    画像の領域識別装置。
  28. 【請求項28】 既知の方法で抽出された文字行候補よ
    り取得された上記線幅概算値が、既知の文字行の線幅に
    近いときに、上記文字行候補を文字行とする文字行抽出
    部を備えた請求項19に記載の文書画像の領域識別装
    置。
  29. 【請求項29】 画像データより抽出される複数の文書
    ロック候補より取得された上記線幅概算値の相互の比率
    が、特定可能な既知の文書ブロック間の線幅の比に近い
    値である場合に、当該文書ブロック候補を文書ブロック
    とする文書ブロック抽出部を備えた請求項19に記載の
    文書画像の領域識別装置
  30. 【請求項30】 画像データより抽出される複数の文字
    行候補より取得された上記線幅概算値の相互の比率が、
    既知の文字行間の線幅の比に近い値である場合に、当該
    文字行候補を文字行とする文字行抽出部を備えた請求項
    19に記載の文書画像の領域識別装置。
JP11056842A 1998-03-06 1999-03-04 文書画像の領域識別方法および装置 Pending JPH11316797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11056842A JPH11316797A (ja) 1998-03-06 1999-03-04 文書画像の領域識別方法および装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-54687 1998-03-06
JP5468798 1998-03-06
JP11056842A JPH11316797A (ja) 1998-03-06 1999-03-04 文書画像の領域識別方法および装置

Publications (1)

Publication Number Publication Date
JPH11316797A true JPH11316797A (ja) 1999-11-16

Family

ID=26395491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11056842A Pending JPH11316797A (ja) 1998-03-06 1999-03-04 文書画像の領域識別方法および装置

Country Status (1)

Country Link
JP (1) JPH11316797A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006120097A (ja) * 2004-10-25 2006-05-11 Ricoh Co Ltd 位置合わせ装置、位置合わせ方法、プログラムおよび記録媒体
JP2009026288A (ja) * 2007-07-23 2009-02-05 Sharp Corp 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
JP2018190248A (ja) * 2017-05-09 2018-11-29 富士通株式会社 画像処理プログラム、画像処理方法及び画像処理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006120097A (ja) * 2004-10-25 2006-05-11 Ricoh Co Ltd 位置合わせ装置、位置合わせ方法、プログラムおよび記録媒体
JP2009026288A (ja) * 2007-07-23 2009-02-05 Sharp Corp 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US8208765B2 (en) 2007-07-23 2012-06-26 Sharp Kabushiki Kaisha Search and retrieval of documents indexed by optical character recognition
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
JP2018190248A (ja) * 2017-05-09 2018-11-29 富士通株式会社 画像処理プログラム、画像処理方法及び画像処理装置

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US4903312A (en) Character recognition with variable subdivisions of a character region
US7519226B2 (en) Form search apparatus and method
JP4806230B2 (ja) 劣化辞書生成プログラム、方法および装置
JP2951814B2 (ja) 画像抽出方式
US7970213B1 (en) Method and system for improving the recognition of text in an image
US20110280481A1 (en) User correction of errors arising in a textual document undergoing optical character recognition (ocr) process
JPH05242292A (ja) 分離方法
US20080069447A1 (en) Character recognition method, character recognition device, and computer product
JP2640673B2 (ja) パターン認識装置
US8472078B2 (en) Image processing apparatus for determining whether a region based on a combined internal region is a table region
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH11316797A (ja) 文書画像の領域識別方法および装置
JP5794154B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
JPWO2010113217A1 (ja) 文字認識装置及び文字認識方法
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3058489B2 (ja) 文字列抽出方法
JP2918666B2 (ja) 文字画像切出し方法
JP4162195B2 (ja) 画像処理装置、及び画像処理プログラム
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP3402755B2 (ja) 領域分割方法
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体