JP3484274B2 - 類似文書の領域分割方法 - Google Patents

類似文書の領域分割方法

Info

Publication number
JP3484274B2
JP3484274B2 JP25846795A JP25846795A JP3484274B2 JP 3484274 B2 JP3484274 B2 JP 3484274B2 JP 25846795 A JP25846795 A JP 25846795A JP 25846795 A JP25846795 A JP 25846795A JP 3484274 B2 JP3484274 B2 JP 3484274B2
Authority
JP
Japan
Prior art keywords
area
region
dividing
dividing line
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25846795A
Other languages
English (en)
Other versions
JPH09102010A (ja
Inventor
達雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP25846795A priority Critical patent/JP3484274B2/ja
Publication of JPH09102010A publication Critical patent/JPH09102010A/ja
Application granted granted Critical
Publication of JP3484274B2 publication Critical patent/JP3484274B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、類似したフォーマ
ットの文書画像を適切に領域分割する類似文書の領域分
割方法に関する。
【0002】
【従来の技術】領域分割が適切に行われると、文字認識
の精度が向上し、また文書構造を適切に設定することが
可能になる。文書画像に対し、適切な領域分割を行うに
は、その文書の構成要素や段落などに関する知識が必要
となる。
【0003】領域分割方法として、本出願人は先に、文
字や文字列の断片のように小さな構成要素を統合して領
域を得る文字領域抽出方法を提案した(特開平5−81
475号公報を参照)。また、入力された文書画像を領
域に分割して、その領域分割結果を表示して修正する文
書画像の領域分割方法において、領域分割結果の修正を
基に、入力された第1の文書のカテゴリを推定して第1
のパラメータを設定し、新たに入力される第2の文書画
像が該推定された文書カテゴリと一致するとき、該第2
の文書画像を該第1のパラメータを用いて領域分割し、
該領域分割結果の修正を基に該推定された文書カテゴリ
を絞り込むようにした文書画像の領域分割方法を提案し
た(特願平7−1635号)。
【0004】さらに、文書画像から文字列を含む、複数
の小領域を抽出し、該複数の小領域から空白部または罫
線を検出し、該検出された空白部または罫線を基に、1
段組、複数段組、自由段組を含む段組種類を判別し、該
段組種類に応じて該空白部を用いて前記小領域を統合
し、前記文書画像を所定の領域に分割する文書画像の領
域分割方法も提案した(特願平7−194399号)。
【0005】この他に、文書画像の木構造を中心とし、
画像解析結果に基づいて自動的に木構造を抽出した後、
ユーザがグラフィカルな修正を施すことにより木構造や
レイアウトモデルを新規に作成する方法もある(特開平
6−68300号公報を参照)。
【0006】
【発明が解決しようとする課題】領域分割を行う際に、
予めあらゆる種類の文書を想定することができないた
め、上記したように(特願平7−1635号)文書の種
類などで分類し、構成要素を想定することによって、で
きるだけ誤った領域分割を少なくする手法が用いられて
いる。しかしながら、文書の種類毎に構成要素や段落が
異なるために、適切な領域分割が困難であるという問題
があった。
【0007】本発明の第1の目的は、ユーザが領域分割
の修正を行うことによって、現在の文書画像に対する適
切な領域分割を行うと同時に、書類の構成要素や段落な
どの特性を抽出し、以降の類似フォーマットの書類の領
域分割に利用するようにした類似文書の領域分割方法を
提供することにある。
【0008】本発明の第2の目的は、書類の構成要素や
段落の特性を抽出するために、任意の領域毎の領域分割
の程度を設定できるようにすることにより、あらゆるフ
ォーマットにも対応できるようにした類似文書の領域分
割方法を提供することにある。
【0009】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像から文書の構成
要素を抽出する処理と、該抽出された要素を基に該文書
画像を所定の領域に分割する処理と、該分割された領域
群に対して領域の修正を行う処理と、該修正結果から領
域分割に利用する分割線抽出位置に関する特徴を抽出す
る処理と、該抽出した分割線抽出位置に関する特徴に基
づいた領域分割結果が得られるように、前記分割線抽出
位置に関する特徴を前記領域分割処理にフィードバック
する学習処理とからなり、該学習した領域分割処理によ
って、前記文書画像に類似したフォーマットの複数の文
書画像を領域分割する際には、学習結果に従って分割線
候補を抽出することを特徴としている。
【0010】請求項2記載の発明では、前記領域分割処
理において、領域分割の程度をパラメータとして設定
し、該パラメータに従って入力文書画像を所定領域に分
割することを特徴としている。
【0011】 請求項3記載の発明では、前記領域分割
処理によって得られた領域と前記領域修正処理によって
得られた領域とをマージした領域から分割線抽出位置に
関する特徴を抽出することを特徴としている。
【0012】 請求項4記載の発明では、前記学習処理
において、後で抽出された優先順位の高い分割線抽出位
置に関する特徴と、先に抽出された分割線抽出位置に関
する特徴とをマージした分割線抽出位置に関する特徴を
生成し、該生成された分割線抽出位置に関する特徴を領
域分割処理に適用することを特徴としている。
【0013】 請求項5記載の発明では、学習後の領域
分割処理において、学習によって得られた分割線抽出位
置に関する特徴が所定の範囲を超えて異なるとき、分割
線抽出位置に関する特徴が更新されるように学習処理す
ることを特徴としている。
【0014】
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。図8は、本発明の処理方法を
実施するための構成を示す。図8の装置は、スキャナな
どの画像入力装置1と、入力画像や処理結果を表示する
ためのディスプレイなどの出力装置2と、処理結果をグ
ラフィカルに編集するためのマウスなどの指示装置3
と、後述する領域分割、特徴抽出などの処理を行う演算
装置4と、データ記憶装置5から構成されている。
【0015】図1は、本発明の処理方法に係るフローチ
ャートである。本発明の入力文書として、論文の1頁目
や、特許公報の1頁目などフォーマットが類似した複数
の書類の場合を例にして、本実施例を説明する。
【0016】画像入力処理(ステップ101)は、次の
ようにして行われる。図2は、ステップ101の詳細な
フローチャートである。入力文書は画像入力装置1を介
して2値画像データとして読み込まれる(ステップ20
1)。これ以降の処理は、画像データに対して行われる
ので、領域分割を行う度に画像を読み込むようにしても
よいし、あるいはまとめて読み込んでデータ記憶装置1
05に蓄積しておいてもよい。
【0017】画像データに対して傾きがあれば補正し
(ステップ202)、画像を圧縮する(ステップ20
3)。例えば、入力画像が400dpi程度の解像度で
ある場合は、1/8に縦横圧縮(つまり、8×8画素の
中に1つでも黒画素があれば圧縮後の画素は黒とする)
することにより、近接した文字は融合され、行間や領域
間は融合されない状態が得られる。
【0018】図1に戻り、次いで、領域分割処理(ステ
ップ102)が行われる。図3は、ステップ102の詳
細なフローチャートである。まず、圧縮画像の黒画素連
結成分を小領域として抽出し(ステップ301)、画像
を水平方向の帯領域に分割する(ステップ302)。こ
のため、圧縮画像から水平方向の長い白ランを求め、そ
れらの間を帯領域とする。近接して多くの白ランが求め
られた場合は、最も白ランの幅の大きいものを選択し、
他の白ランは無視する。次にその帯領域内で垂直方向の
白ランを求め(ステップ303)、垂直白ラン間の小領
域をひとまとめの領域とする(ステップ304)。この
ようにして、画像を幾つかの領域に分割することができ
る。
【0019】このとき、各帯領域の特徴は、帯領域内の
垂直白ランの配置によって表現することができる。図4
は、帯領域の特徴例を示す。例えば、垂直白ランが画像
幅の真中付近にのみあれば、図4の(a)に示すように
2段組の帯領域401であり、画像幅の1/3の位置、
2/3の位置付近にあれば(b)に示すように3段組の
帯領域402となる。また、(c)に示すように垂直白
ランが画像の両端にのみ現れれば段組なしの帯領域40
3となり、その他複雑な段組や図、表などによって垂直
白ランの位置がシフトしている場合も、帯領域内の垂直
白ランの配置によって表現できる。
【0020】また、上記した帯領域を分割する位置(1
/2、1/3など)をパラメータとして設定しておき、
該パラメータに従って類似文書画像の帯領域を分割す
る。
【0021】領域修正処理(ステップ103)は次のよ
うに行われる。まず、入力画像データあるいは圧縮画像
を出力装置2に表示する。図5は、領域修正処理を説明
する図である。(a)は、表示された画像501を示
す。そして、画像501に対応する領域分割の結果が、
該画像に領域の外枠502を重ねることによってユーザ
に示される(b)。ここで、ユーザは、分割された領域
に対して、指示装置3を用いて新たな領域の始点と終点
を選択することで、正しい領域分割の矩形503を作成
することができる(c)。また、画像全体にわたって修
正を加える必要はなく、ユーザが必要とする箇所のみを
修正してもよい。
【0022】次いで、特徴抽出処理(ステップ104)
を行う。図6は、特徴抽出処理を説明する図である。ま
ず、領域修正処理(ステップ103)によってユーザが
指定した矩形が、図5(c)に示す矩形503であると
する。また、図6(a)に示すように領域分割された帯
領域が領域504、505であるとする。そして、ユー
ザが指定した矩形503が、領域分割の帯領域504、
505をまたがっている場合は、帯領域を構成している
水平白ランが間違っているものとして、修正矩形が所属
する帯領域をまとめて、一つの帯領域506とする
(b)。
【0023】その帯領域506において、ユーザが指定
した矩形503とその隣接領域507の中間に垂直白ラ
ン508を見つけ、この白ランの配置が、帯領域506
内の領域の特徴となる(c)。
【0024】類似したフォーマットの書類を連続して処
理する際に、その書類の特徴を完全に把握し、指定する
ことができれば、修正を一度だけ行えばよいが、実際に
はそのようなことはできないし、できたとしても多くの
指定が必要になり、難しい。そこで、本発明では、気が
ついたところだけインタラクティブに部分的に指定しな
がら、特徴を学習する学習処理(ステップ105)を設
けている。
【0025】特徴抽出処理(ステップ104)によって
得られた帯領域毎の特徴(白ランの配置)を領域分割処
理に利用する。まず、領域分割処理において水平方向の
帯領域を見つけるために、水平方向の長い白ランを求め
るが、このときに特徴抽出された帯領域における上下隣
接位置の白ラン509(図6の(c))を優先して求め
るようにする。また垂直白ランを求める場合も、特徴抽
出された白ラン508の配置を優先して見つけるように
する。これによって、類似文書画像においては、ユーザ
が意図した領域分割を優先して処理することが可能にな
る。
【0026】このとき、学習が繰り返されることによっ
て、ある帯領域において、既に学習処理が行われている
場合は、後の抽出結果を優先して求めるようにする。図
7は、学習処理を説明する図である。例えば、図7に示
す帯領域601において、4本の垂直白ランがあった場
合、初めの学習では、内側の2つの垂直白ランの配置が
それぞれ左右均等で領域幅の1/3の位置、2/3の位
置にあったとする。しかし、後の修正による学習では、
帯領域602において1/2の位置と2/3の位置に垂
直白ランがある場合には、垂直白ラン604の内、1/
2位置にある白ランを優先して求めるようにする。また
帯領域が変更されない場合は、過去の学習結果とマージ
して、白ランの配置603を求める。
【0027】ところで、類似フォーマットであっても、
その画像は全く同じではないので、領域分割が必ずしも
適切に行われるものとは限らない。しかしながら、その
度にユーザが介入すると、正確な領域分割ができる代わ
りに手間がかかってしまう。そこで、本発明では、その
手間を軽減するために、学習すべきか否かを自動的に判
断するようにしている。
【0028】すなわち、学習処理(ステップ105)に
おいて、一般に類似書類といっても画素が全く同じにな
ることはなく、従って白ランの配置に誤差が生じる。そ
こで、垂直白ランの配置の変動を吸収するマージンを用
意する。例えばそのマージンを、原画像に対して1c
m、あるいは画像領域の幅の3%などとする。一般に帯
領域は段組幅などに比べて大きく変動するため、5倍程
度垂直マージンよりも大きくとっておく。
【0029】学習した結果の領域分割処理において、白
ランを求める際、上記マージンを超えずに変動した場合
は、学習の許容範囲とみなし、その白ランを領域分割に
用いる。上記マージン内に白ランを見つけることができ
なかった場合は、以前の修正がその文書画像の領域分割
には不十分だったとして、ユーザに対し、領域修正処理
を促すようにして、インクリメンタルな学習を続ける。
そして、上記した各処理を、全ての類似文書に対して行
う(ステップ106)。
【0030】
【発明の効果】以上、説明したように、請求項1記載の
発明によれば、領域分割の結果に修正を加え、その結果
を領域分割に反映することによって、そのときの入力画
像の領域分割が正確に行えるだけでなく、以降の類似フ
ォーマットの入力画像に対し、適切な領域分割を行うこ
とができる。
【0031】請求項2記載の発明によれば、領域分割の
程度をパラメータとして設定し、該パラメータに従って
入力文書画像を所定領域に分割しているので、あらゆる
文書画像においても部分的な領域毎にパラメータを設定
することができ、適切な領域分割を行うことが可能とな
る。
【0032】請求項3記載の発明によれば、領域分割処
理によって得られた領域と領域修正処理によって得られ
た領域とをマージした領域から領域分割の特徴を抽出し
ているので、文書の特徴を最小限に、また部分的に捉え
ることができ、柔軟性の高い領域分割条件を設定するこ
とができる。
【0033】請求項4記載の発明によれば、後で抽出さ
れた優先順位の高い特徴と、先に抽出された特徴とをマ
ージした特徴を生成し、該生成された特徴を領域分割処
理に適用しているので、変更部分を優先しながら領域分
割のインクリメンタルな学習が可能となる。
【0034】請求項5記載の発明によれば、許容範囲を
設定することにより、学習を行うべきタイミングを自動
的に認識することができ、ユーザの負担を軽減すること
ができる。
【図面の簡単な説明】
【図1】本発明の処理方法に係るフローチャートであ
る。
【図2】図1のステップ101の詳細なフローチャート
である。
【図3】図1のステップ102の詳細なフローチャート
である。
【図4】(a)〜(c)は、帯領域の特徴例を示す。
【図5】(a)〜(c)は、領域修正処理を説明する図
である。
【図6】(a)〜(c)は、特徴抽出処理を説明する図
である。
【図7】学習処理を説明する図である。
【図8】本発明の処理方法を実施するための構成を示
す。
【符号の説明】
1 画像入力装置 2 出力装置 3 指示装置 4 演算装置 5 データ記憶装置
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像から文書の構成要素を抽出する処
    理と、該抽出された要素を基に該文書画像を所定の領域
    に分割する処理と、該分割された領域群に対して領域の
    修正を行う処理と、該修正結果から領域分割に利用する
    分割線抽出位置に関する特徴を抽出する処理と、該抽出
    した分割線抽出位置に関する特徴に基づいた領域分割結
    果が得られるように、前記分割線抽出位置に関する特徴
    を前記領域分割処理にフィードバックする学習処理とか
    らなり、該学習した領域分割処理によって、前記文書画
    像に類似したフォーマットの複数の文書画像を領域分割
    する際には、学習結果に従って分割線候補を抽出する
    とを特徴とする類似文書の領域分割方法。
  2. 【請求項2】 前記領域分割処理において、領域分割の
    程度をパラメータとして設定し、該パラメータに従って
    入力文書画像を所定領域に分割することを特徴とする請
    求項1記載の類似文書の領域分割方法。
  3. 【請求項3】前記領域分割処理によって得られた領域と
    前記領域修正処理によって得られた領域とをマージした
    領域から分割線抽出位置に関する特徴を抽出することを
    特徴とする請求項1記載の類似文書の領域分割方法。
  4. 【請求項4】前記学習処理において、後で抽出された優
    先順位の高い分割線抽出位置に関する特徴と、先に抽出
    された分割線抽出位置に関する特徴とをマージした分割
    線抽出位置に関する特徴を生成し、該生成された分割線
    抽出位置に関する特徴を領域分割処理に適用することを
    特徴とする請求項1記載の類似文書の領域分割方法。
  5. 【請求項5】学習後の領域分割処理において、学習によ
    って得られた分割線抽出位置に関する特徴が所定の範囲
    を超えて異なるとき、分割線抽出位置に関する特徴が更
    新されるように学習処理することを特徴とする請求項1
    記載の類似文書の領域分割方法。
JP25846795A 1995-10-05 1995-10-05 類似文書の領域分割方法 Expired - Fee Related JP3484274B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25846795A JP3484274B2 (ja) 1995-10-05 1995-10-05 類似文書の領域分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25846795A JP3484274B2 (ja) 1995-10-05 1995-10-05 類似文書の領域分割方法

Publications (2)

Publication Number Publication Date
JPH09102010A JPH09102010A (ja) 1997-04-15
JP3484274B2 true JP3484274B2 (ja) 2004-01-06

Family

ID=17320640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25846795A Expired - Fee Related JP3484274B2 (ja) 1995-10-05 1995-10-05 類似文書の領域分割方法

Country Status (1)

Country Link
JP (1) JP3484274B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392473B2 (en) * 2005-05-26 2008-06-24 Xerox Corporation Method and apparatus for determining logical document structure

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山下晶夫 天野富夫,モデルに基づいた文書画像のレイアウト理解,電子情報通信学会論文誌,日本,電子情報通信学会,1992年 10月,D−II、Vol.J75−D−II、No.10,1673−1681

Also Published As

Publication number Publication date
JPH09102010A (ja) 1997-04-15

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US7327879B2 (en) Image processing apparatus, image processing method, and medium on which image processing program is recorded
CA2000012C (en) Computer-implemented method for automatic extraction of data from printed forms
JP3278471B2 (ja) 領域分割方法
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
JPH0620092A (ja) 文書画像の領域識別方法
US5509092A (en) Method and apparatus for generating information on recognized characters
JP3484274B2 (ja) 類似文書の領域分割方法
CN116343229A (zh) 挖掘边缘特征的自然场景盲文字符识别方法
JP3604909B2 (ja) 画像間位置合わせ方法
JP3157414B2 (ja) 文書読取装置
JP3187895B2 (ja) 文字領域抽出方法
JP3122476B2 (ja) 自動文書清書装置
JPH0581474A (ja) 文字列抽出方法および文字領域検出方法
JPH09114923A (ja) 領域分割装置
JPH05128302A (ja) 文字認識方法及びその装置
JP2002007958A (ja) 帳票処理方法および記録媒体
JPH117493A (ja) 文字認識処理装置
JP6082306B2 (ja) 光学式文字認識用に画像を前処理するための方法およびシステム
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JPH0660220A (ja) 文書画像の領域抽出方法
JPH0473192B2 (ja)
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JP3157534B2 (ja) 表認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071017

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081017

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081017

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091017

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101017

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees