JP3484274B2 - 類似文書の領域分割方法 - Google Patents
類似文書の領域分割方法Info
- Publication number
- JP3484274B2 JP3484274B2 JP25846795A JP25846795A JP3484274B2 JP 3484274 B2 JP3484274 B2 JP 3484274B2 JP 25846795 A JP25846795 A JP 25846795A JP 25846795 A JP25846795 A JP 25846795A JP 3484274 B2 JP3484274 B2 JP 3484274B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- region
- dividing
- dividing line
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
ットの文書画像を適切に領域分割する類似文書の領域分
割方法に関する。
の精度が向上し、また文書構造を適切に設定することが
可能になる。文書画像に対し、適切な領域分割を行うに
は、その文書の構成要素や段落などに関する知識が必要
となる。
字や文字列の断片のように小さな構成要素を統合して領
域を得る文字領域抽出方法を提案した(特開平5−81
475号公報を参照)。また、入力された文書画像を領
域に分割して、その領域分割結果を表示して修正する文
書画像の領域分割方法において、領域分割結果の修正を
基に、入力された第1の文書のカテゴリを推定して第1
のパラメータを設定し、新たに入力される第2の文書画
像が該推定された文書カテゴリと一致するとき、該第2
の文書画像を該第1のパラメータを用いて領域分割し、
該領域分割結果の修正を基に該推定された文書カテゴリ
を絞り込むようにした文書画像の領域分割方法を提案し
た(特願平7−1635号)。
の小領域を抽出し、該複数の小領域から空白部または罫
線を検出し、該検出された空白部または罫線を基に、1
段組、複数段組、自由段組を含む段組種類を判別し、該
段組種類に応じて該空白部を用いて前記小領域を統合
し、前記文書画像を所定の領域に分割する文書画像の領
域分割方法も提案した(特願平7−194399号)。
画像解析結果に基づいて自動的に木構造を抽出した後、
ユーザがグラフィカルな修正を施すことにより木構造や
レイアウトモデルを新規に作成する方法もある(特開平
6−68300号公報を参照)。
予めあらゆる種類の文書を想定することができないた
め、上記したように(特願平7−1635号)文書の種
類などで分類し、構成要素を想定することによって、で
きるだけ誤った領域分割を少なくする手法が用いられて
いる。しかしながら、文書の種類毎に構成要素や段落が
異なるために、適切な領域分割が困難であるという問題
があった。
の修正を行うことによって、現在の文書画像に対する適
切な領域分割を行うと同時に、書類の構成要素や段落な
どの特性を抽出し、以降の類似フォーマットの書類の領
域分割に利用するようにした類似文書の領域分割方法を
提供することにある。
段落の特性を抽出するために、任意の領域毎の領域分割
の程度を設定できるようにすることにより、あらゆるフ
ォーマットにも対応できるようにした類似文書の領域分
割方法を提供することにある。
に、請求項1記載の発明では、文書画像から文書の構成
要素を抽出する処理と、該抽出された要素を基に該文書
画像を所定の領域に分割する処理と、該分割された領域
群に対して領域の修正を行う処理と、該修正結果から領
域分割に利用する分割線抽出位置に関する特徴を抽出す
る処理と、該抽出した分割線抽出位置に関する特徴に基
づいた領域分割結果が得られるように、前記分割線抽出
位置に関する特徴を前記領域分割処理にフィードバック
する学習処理とからなり、該学習した領域分割処理によ
って、前記文書画像に類似したフォーマットの複数の文
書画像を領域分割する際には、学習結果に従って分割線
候補を抽出することを特徴としている。
理において、領域分割の程度をパラメータとして設定
し、該パラメータに従って入力文書画像を所定領域に分
割することを特徴としている。
処理によって得られた領域と前記領域修正処理によって
得られた領域とをマージした領域から分割線抽出位置に
関する特徴を抽出することを特徴としている。
において、後で抽出された優先順位の高い分割線抽出位
置に関する特徴と、先に抽出された分割線抽出位置に関
する特徴とをマージした分割線抽出位置に関する特徴を
生成し、該生成された分割線抽出位置に関する特徴を領
域分割処理に適用することを特徴としている。
分割処理において、学習によって得られた分割線抽出位
置に関する特徴が所定の範囲を超えて異なるとき、分割
線抽出位置に関する特徴が更新されるように学習処理す
ることを特徴としている。
用いて具体的に説明する。図8は、本発明の処理方法を
実施するための構成を示す。図8の装置は、スキャナな
どの画像入力装置1と、入力画像や処理結果を表示する
ためのディスプレイなどの出力装置2と、処理結果をグ
ラフィカルに編集するためのマウスなどの指示装置3
と、後述する領域分割、特徴抽出などの処理を行う演算
装置4と、データ記憶装置5から構成されている。
ャートである。本発明の入力文書として、論文の1頁目
や、特許公報の1頁目などフォーマットが類似した複数
の書類の場合を例にして、本実施例を説明する。
ようにして行われる。図2は、ステップ101の詳細な
フローチャートである。入力文書は画像入力装置1を介
して2値画像データとして読み込まれる(ステップ20
1)。これ以降の処理は、画像データに対して行われる
ので、領域分割を行う度に画像を読み込むようにしても
よいし、あるいはまとめて読み込んでデータ記憶装置1
05に蓄積しておいてもよい。
(ステップ202)、画像を圧縮する(ステップ20
3)。例えば、入力画像が400dpi程度の解像度で
ある場合は、1/8に縦横圧縮(つまり、8×8画素の
中に1つでも黒画素があれば圧縮後の画素は黒とする)
することにより、近接した文字は融合され、行間や領域
間は融合されない状態が得られる。
ップ102)が行われる。図3は、ステップ102の詳
細なフローチャートである。まず、圧縮画像の黒画素連
結成分を小領域として抽出し(ステップ301)、画像
を水平方向の帯領域に分割する(ステップ302)。こ
のため、圧縮画像から水平方向の長い白ランを求め、そ
れらの間を帯領域とする。近接して多くの白ランが求め
られた場合は、最も白ランの幅の大きいものを選択し、
他の白ランは無視する。次にその帯領域内で垂直方向の
白ランを求め(ステップ303)、垂直白ラン間の小領
域をひとまとめの領域とする(ステップ304)。この
ようにして、画像を幾つかの領域に分割することができ
る。
垂直白ランの配置によって表現することができる。図4
は、帯領域の特徴例を示す。例えば、垂直白ランが画像
幅の真中付近にのみあれば、図4の(a)に示すように
2段組の帯領域401であり、画像幅の1/3の位置、
2/3の位置付近にあれば(b)に示すように3段組の
帯領域402となる。また、(c)に示すように垂直白
ランが画像の両端にのみ現れれば段組なしの帯領域40
3となり、その他複雑な段組や図、表などによって垂直
白ランの位置がシフトしている場合も、帯領域内の垂直
白ランの配置によって表現できる。
/2、1/3など)をパラメータとして設定しておき、
該パラメータに従って類似文書画像の帯領域を分割す
る。
うに行われる。まず、入力画像データあるいは圧縮画像
を出力装置2に表示する。図5は、領域修正処理を説明
する図である。(a)は、表示された画像501を示
す。そして、画像501に対応する領域分割の結果が、
該画像に領域の外枠502を重ねることによってユーザ
に示される(b)。ここで、ユーザは、分割された領域
に対して、指示装置3を用いて新たな領域の始点と終点
を選択することで、正しい領域分割の矩形503を作成
することができる(c)。また、画像全体にわたって修
正を加える必要はなく、ユーザが必要とする箇所のみを
修正してもよい。
を行う。図6は、特徴抽出処理を説明する図である。ま
ず、領域修正処理(ステップ103)によってユーザが
指定した矩形が、図5(c)に示す矩形503であると
する。また、図6(a)に示すように領域分割された帯
領域が領域504、505であるとする。そして、ユー
ザが指定した矩形503が、領域分割の帯領域504、
505をまたがっている場合は、帯領域を構成している
水平白ランが間違っているものとして、修正矩形が所属
する帯領域をまとめて、一つの帯領域506とする
(b)。
した矩形503とその隣接領域507の中間に垂直白ラ
ン508を見つけ、この白ランの配置が、帯領域506
内の領域の特徴となる(c)。
理する際に、その書類の特徴を完全に把握し、指定する
ことができれば、修正を一度だけ行えばよいが、実際に
はそのようなことはできないし、できたとしても多くの
指定が必要になり、難しい。そこで、本発明では、気が
ついたところだけインタラクティブに部分的に指定しな
がら、特徴を学習する学習処理(ステップ105)を設
けている。
得られた帯領域毎の特徴(白ランの配置)を領域分割処
理に利用する。まず、領域分割処理において水平方向の
帯領域を見つけるために、水平方向の長い白ランを求め
るが、このときに特徴抽出された帯領域における上下隣
接位置の白ラン509(図6の(c))を優先して求め
るようにする。また垂直白ランを求める場合も、特徴抽
出された白ラン508の配置を優先して見つけるように
する。これによって、類似文書画像においては、ユーザ
が意図した領域分割を優先して処理することが可能にな
る。
て、ある帯領域において、既に学習処理が行われている
場合は、後の抽出結果を優先して求めるようにする。図
7は、学習処理を説明する図である。例えば、図7に示
す帯領域601において、4本の垂直白ランがあった場
合、初めの学習では、内側の2つの垂直白ランの配置が
それぞれ左右均等で領域幅の1/3の位置、2/3の位
置にあったとする。しかし、後の修正による学習では、
帯領域602において1/2の位置と2/3の位置に垂
直白ランがある場合には、垂直白ラン604の内、1/
2位置にある白ランを優先して求めるようにする。また
帯領域が変更されない場合は、過去の学習結果とマージ
して、白ランの配置603を求める。
その画像は全く同じではないので、領域分割が必ずしも
適切に行われるものとは限らない。しかしながら、その
度にユーザが介入すると、正確な領域分割ができる代わ
りに手間がかかってしまう。そこで、本発明では、その
手間を軽減するために、学習すべきか否かを自動的に判
断するようにしている。
おいて、一般に類似書類といっても画素が全く同じにな
ることはなく、従って白ランの配置に誤差が生じる。そ
こで、垂直白ランの配置の変動を吸収するマージンを用
意する。例えばそのマージンを、原画像に対して1c
m、あるいは画像領域の幅の3%などとする。一般に帯
領域は段組幅などに比べて大きく変動するため、5倍程
度垂直マージンよりも大きくとっておく。
ランを求める際、上記マージンを超えずに変動した場合
は、学習の許容範囲とみなし、その白ランを領域分割に
用いる。上記マージン内に白ランを見つけることができ
なかった場合は、以前の修正がその文書画像の領域分割
には不十分だったとして、ユーザに対し、領域修正処理
を促すようにして、インクリメンタルな学習を続ける。
そして、上記した各処理を、全ての類似文書に対して行
う(ステップ106)。
発明によれば、領域分割の結果に修正を加え、その結果
を領域分割に反映することによって、そのときの入力画
像の領域分割が正確に行えるだけでなく、以降の類似フ
ォーマットの入力画像に対し、適切な領域分割を行うこ
とができる。
程度をパラメータとして設定し、該パラメータに従って
入力文書画像を所定領域に分割しているので、あらゆる
文書画像においても部分的な領域毎にパラメータを設定
することができ、適切な領域分割を行うことが可能とな
る。
理によって得られた領域と領域修正処理によって得られ
た領域とをマージした領域から領域分割の特徴を抽出し
ているので、文書の特徴を最小限に、また部分的に捉え
ることができ、柔軟性の高い領域分割条件を設定するこ
とができる。
れた優先順位の高い特徴と、先に抽出された特徴とをマ
ージした特徴を生成し、該生成された特徴を領域分割処
理に適用しているので、変更部分を優先しながら領域分
割のインクリメンタルな学習が可能となる。
設定することにより、学習を行うべきタイミングを自動
的に認識することができ、ユーザの負担を軽減すること
ができる。
る。
である。
である。
である。
である。
す。
Claims (5)
- 【請求項1】文書画像から文書の構成要素を抽出する処
理と、該抽出された要素を基に該文書画像を所定の領域
に分割する処理と、該分割された領域群に対して領域の
修正を行う処理と、該修正結果から領域分割に利用する
分割線抽出位置に関する特徴を抽出する処理と、該抽出
した分割線抽出位置に関する特徴に基づいた領域分割結
果が得られるように、前記分割線抽出位置に関する特徴
を前記領域分割処理にフィードバックする学習処理とか
らなり、該学習した領域分割処理によって、前記文書画
像に類似したフォーマットの複数の文書画像を領域分割
する際には、学習結果に従って分割線候補を抽出するこ
とを特徴とする類似文書の領域分割方法。 - 【請求項2】 前記領域分割処理において、領域分割の
程度をパラメータとして設定し、該パラメータに従って
入力文書画像を所定領域に分割することを特徴とする請
求項1記載の類似文書の領域分割方法。 - 【請求項3】前記領域分割処理によって得られた領域と
前記領域修正処理によって得られた領域とをマージした
領域から分割線抽出位置に関する特徴を抽出することを
特徴とする請求項1記載の類似文書の領域分割方法。 - 【請求項4】前記学習処理において、後で抽出された優
先順位の高い分割線抽出位置に関する特徴と、先に抽出
された分割線抽出位置に関する特徴とをマージした分割
線抽出位置に関する特徴を生成し、該生成された分割線
抽出位置に関する特徴を領域分割処理に適用することを
特徴とする請求項1記載の類似文書の領域分割方法。 - 【請求項5】学習後の領域分割処理において、学習によ
って得られた分割線抽出位置に関する特徴が所定の範囲
を超えて異なるとき、分割線抽出位置に関する特徴が更
新されるように学習処理することを特徴とする請求項1
記載の類似文書の領域分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25846795A JP3484274B2 (ja) | 1995-10-05 | 1995-10-05 | 類似文書の領域分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25846795A JP3484274B2 (ja) | 1995-10-05 | 1995-10-05 | 類似文書の領域分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09102010A JPH09102010A (ja) | 1997-04-15 |
JP3484274B2 true JP3484274B2 (ja) | 2004-01-06 |
Family
ID=17320640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25846795A Expired - Fee Related JP3484274B2 (ja) | 1995-10-05 | 1995-10-05 | 類似文書の領域分割方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3484274B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7392473B2 (en) * | 2005-05-26 | 2008-06-24 | Xerox Corporation | Method and apparatus for determining logical document structure |
-
1995
- 1995-10-05 JP JP25846795A patent/JP3484274B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
山下晶夫 天野富夫,モデルに基づいた文書画像のレイアウト理解,電子情報通信学会論文誌,日本,電子情報通信学会,1992年 10月,D−II、Vol.J75−D−II、No.10,1673−1681 |
Also Published As
Publication number | Publication date |
---|---|
JPH09102010A (ja) | 1997-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
US7327879B2 (en) | Image processing apparatus, image processing method, and medium on which image processing program is recorded | |
CA2000012C (en) | Computer-implemented method for automatic extraction of data from printed forms | |
JP3278471B2 (ja) | 領域分割方法 | |
US6327384B1 (en) | Character recognition apparatus and method for recognizing characters | |
JP4189506B2 (ja) | 画像処理のための装置、方法及び記録媒体 | |
JPH0620092A (ja) | 文書画像の領域識別方法 | |
US5509092A (en) | Method and apparatus for generating information on recognized characters | |
JP3484274B2 (ja) | 類似文書の領域分割方法 | |
CN116343229A (zh) | 挖掘边缘特征的自然场景盲文字符识别方法 | |
JP3604909B2 (ja) | 画像間位置合わせ方法 | |
JP3157414B2 (ja) | 文書読取装置 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP3122476B2 (ja) | 自動文書清書装置 | |
JPH0581474A (ja) | 文字列抽出方法および文字領域検出方法 | |
JPH09114923A (ja) | 領域分割装置 | |
JPH05128302A (ja) | 文字認識方法及びその装置 | |
JP2002007958A (ja) | 帳票処理方法および記録媒体 | |
JPH117493A (ja) | 文字認識処理装置 | |
JP6082306B2 (ja) | 光学式文字認識用に画像を前処理するための方法およびシステム | |
JPH08321942A (ja) | 画像処理装置及び分割図面の画像接合方法 | |
JPH0660220A (ja) | 文書画像の領域抽出方法 | |
JPH0473192B2 (ja) | ||
JP2683711B2 (ja) | 文字・記号データの認識・修正方法 | |
JP3157534B2 (ja) | 表認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081017 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081017 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091017 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101017 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |