JP3281065B2 - 領域分離方法 - Google Patents
領域分離方法Info
- Publication number
- JP3281065B2 JP3281065B2 JP30093792A JP30093792A JP3281065B2 JP 3281065 B2 JP3281065 B2 JP 3281065B2 JP 30093792 A JP30093792 A JP 30093792A JP 30093792 A JP30093792 A JP 30093792A JP 3281065 B2 JP3281065 B2 JP 3281065B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- image
- character area
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
から文字領域を分離して抽出する領域分離方法に関する
ものである。
などの文章画像から所望とする記事内容を効果的に切抜
き抽出し、これをそのまま、または再編集して表示また
はファイルすることのできる実用性の高い新聞・雑誌な
どの切り出しのための領域分離方法に関するものであ
る。
められた枠組み構成規則に従ってレイアウトして載せら
れている。そして、最近では、これらの中から所望とす
る記事を人間が指定(切抜き)し、再構築してコンピュ
ータシステムにファイリングすることが試みられてい
る。
よるエッジ検出等の方法が研究され、対象文書全体につ
いて演算するためのプログラムが開発されてきた。
ているものの、各種記事は上記紙面サイズを有効に利用
すべく、ある領域に割り付けがなされて組み込まれてい
るため、文字領域,図・表領域,写真領域などが混在し
てあり、単に紙面上の単純な位置・領域を特定するだけ
では所望とする文字領域のみを抽出することができない
という不具合がある。
ァイル化の対象となる記事は多数存在し、その中で種々
の形状に割り付けがなされているある一つの記事だけが
一つの単位記事となるので、例えば一紙面をページなど
とする固定的な単位のみでは扱うことができない。
と異なり、文章画像として入力される情報を取り扱うの
で、必然的に領域の理解・判断という処理が必要となっ
てくる。
蓄積するために、コード化する領域(文字領域)と画像
情報として扱う領域(図・表領域,写真領域)などを適
切に判断することが要求される。
誌などの中から所望とする記事を効果的に抽出して、割
り付け領域を抽出表示したり、あるいはファイル化する
ことのできる実用性の高い文章画像の領域分離方法を提
供することにある。
ラフなどの領域に含まれる文字領域を認識することによ
り、データベースなどに用いることができるよう構成し
た領域分離方法を提供することにある。
た種々の複雑な演算を施し、その結果のデータを記憶
し、さらに定められたデータ処理を行った後、定められ
た手順に従って領域を分けるといった複雑なルーチンを
経て分離が行われるため、正確ではある反面、 (1)演算処理に長い時間を要する。
大な記憶容量が必要になる。
識率70〜80%程度)は、より簡単な方法で領域分離
することが可能であり、文書全体にこのように複雑な演
算処理をするのは無駄が多いことになる。
を短縮すると共に、少ない記憶容量で正確な領域の識別
を可能とした領域分離方法を提供することにある。
めに、請求項1に係る本発明は、文字領域,図表領域,
写真領域のうち少なくともひとつの領域を含む画像情報
を入力する入力ステップと、前記画像情報から領域判別
のための特徴量を抽出する特徴量抽出ステップと、前記
特徴量を入力し、前記領域判別を行うための複数の条件
命題をファジィ集合を用いて設定し、ファジィ推論の結
果に基づいて文字領域,文字以外の領域を判別する判別
ステップと、前記判別ステップによる前記領域判別にお
いて文字領域以外の判別された領域については、当該領
域の内部についてさらに領域分離を行い、当該領域中に
含まれる文字領域を抽出し、表示あるいはファイル化す
るステップとを有する領域分離方法である。また、請求
項2に係る本発明は、入力された画像の中から文字領域
を抽出する領域分離方法において、入力された画像全体
に対して粗い文字領域識別処理を施す第1の識別ステッ
プと、前記第1の識別手段により判別し得なかった残り
の領域については、複雑な文字領域識別処理を施す第2
の識別ステップとを有するものである。
聞や雑誌などの文章画像から領域判別のための特徴量を
抽出し、領域判別のための複数の条件命題をファジィ集
合を用いて設定し、ファジィ推論の結果に基づいて領域
の判別をすることによって、人為的な判断処理を要する
ことなしに実用性の高い領域分離方法を実現することが
できる。
文書全体にファジィ推論などを用いて粗い領域判別を行
い、明確に文字領域と識別される部分と、文字領域か画
像領域かの判別が困難である部分とに分け、この後者の
部分についてのみに先の従来例で示した種々の方法(F
FT法など)を適用することにより、演算時間を短く
し、少ない記憶容量で正確に画像領域分離を行うことが
できる。
細に説明する。なお、以下に述べる実施例では論文誌を
例に挙げて説明するが、一般的な新聞,雑誌,書籍など
も対象となることは言うまでもない。
うに、その紙面にタイトル21、氏名22、所属23、
見出し24、本文25A,25B、図26、表27、写
真28などが所定のレイアウト規則に従って割り付けし
て構成されている。このように、1枚の誌面中に複数の
領域が混在したものとなっている。
では、次のようにして画像入力される論文・新聞・雑誌
などの文章情報から所望とする領域の判定を行ってい
る。
1に示すように、 (1)入力された文章画像の中から、領域に分割する処
理。:S11 (2)文章画像から領域の判別に必要な特徴量を抽出す
る処理。:S12 (3)所定の規則に従い、上記領域の特性を判別する処
理。:S13 (4)領域判別が終了した画像領域を表示する処理また
はファイル化する処理。:S14 に大別される。
いて、具体的に説明する。
境界は、例えば2値化後の画像拡大(deliatio
n)処理や画像融合(fusion)処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。
しきい値処理した後の2値画像に図3に示すような拡大
処理(deliation):F(x,y)を適当な
数;m回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる(図4参照)。
徴量を抽出する。まず、各領域について最小外接矩形を
求める(図5参照)。
(図6参照)。
グした領域の属性を判別する。
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするために、ここではファジィ表現を用いる。
領域の特性を決定するかについて、図7および図8を用
いて説明する。
後を後件部と呼ぶ。
と呼び、各々「短い」、「長い」、「高い」に相当す
る。
i,Liとする。
た場合、ルール1の成立度:α1を求める。
と、 fc=max(f1,f2,…,fn) で表せる。これを非ファジィ化する場合、確定値Ptx
とすると、 Ptx=(積分)fc*x/(積分)fc 文字領域の可能性Ptxが求められる。
は、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域については、そのままの
形でファイル化を行う。
指定された形式で表示を行う。
なかの文字領域と、図・表・グラフ・写真領域の判別を
精度よく行うことができる。
コード化し、その他の領域について画像領域として記録
することにより、文章画像に比べてデータ量の圧縮・デ
ータ転送時間の短縮化・ファイル内容の修正が可能とな
る。
を示すフローチャートである。
9に示すように (1)入力された文章画像の中から、領域に分割する処
理。:S21 (2)文章画像から、領域の判別に必要な特徴量を抽出
する処理。:S22 (3)所定の規則に従い、上記領域の特性を判別する処
理。:S23 (4)文字領域以外と判別された領域について、再度文
字領域の判別を行う。:S24 (5)領域判別が終了した画像領域を表示する処理また
はファイル化する処理。:S25 に大別される。
いて、具体的に説明する。
境界は、例えば2値化後の画像拡大(deliatio
n)処理や画像融合(fusion)処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。
しきい値処理した後の2値画像に図3に示すような拡大
処理(deliation):F(x,y)を適当な
数;m回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる(図4参照)。
徴量を抽出する。まず、各領域について最小外接矩形を
求める(図5参照)。
(図6参照)。
グした領域の属性を判別する。
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするために、ここではファジィ表現を用いる。
領域の特性を決定するかについて、図7および図8を用
いて説明する。
を後件部と呼ぶ。
と呼び、各々「短い」、「長い」、「高い」に相当す
る。
i,Liとする。
た場合、ルール1の成立度:α1を求める。
と、 fc=max(f1,f2,…,fn) で表せる。これを非ファジィ化する場合、確定値Ptx
とすると、 Ptx=(積分)fc*x/(積分)fc 文字領域の可能性をPtxが求められる。
ル、表領域の判別ルールに関して同様の処理を行うこと
により領域の判別を行う。
た領域の中にある領域について、再度特徴量(W,L)
を用いてラベリングした領域の属性を判別する。
YR2)}…領域n{(XLn,YLn),(XRn,
YRn)}が領域1{(XL1,YL1)(XR1,Y
R1)}に内包:XL1≦XLn≦XRn≦XR1かつ
YL1≦YLn≦YRn≦YR1され、しかも領域1が
上記(3)により文字以外の領域として判別され領域
2,領域nが文字領域として判別される。
て、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域についてはそのままの形
でファイル化を行う。
における処理(図1参照)と同じである。
に説明する。
境界は、例えば2値化後の画像拡大(deliatio
n)処理や画像融合(fusion)処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。
しきい値処理した後の2値画像に図3に示すような拡大
処理(deliation):F(x,y)を適当な
数;m回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる(図4参照)。
徴量を抽出する。まず、各領域について最小外接矩形を
求める(図5参照)。
(図11参照)。
てラベリングした領域の属性を判別する。
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするためにここではファジィ表現を用いる。
つ面積比Sa/Sが中くらいの時 その領域が文字領域の可能性が高い。
のようにしてその領域の特性を決定するかについて、図
12および図13を用いて説明する。
後を後件部と呼ぶ。
真理値と呼び、各々「短い」、「長い」、「中くらい」
「高い」に相当する。
i,Li,Sai/Siとする。
た場合、ルール1の成立度:α1を求める。
と α1=min(αW1,αL1,αSa1/S1) ルール1の結論部をfc1とすると f1=α1×fc1 同様にルール2の成立度:α2 α2=min(αW2,αL2,αSa2/S2) ルール2の結論部をfc2とすると f2=α2×fc2 全てのルールに関する結論をファジィ集合fcとする
と、 fc=max(f1,f2,…,fn) で表せる。これを非ファジィ化する場合、確定値Ptx
とすると、 Ptx=(積分)fc*x/(積分)fc 文字領域の可能性Ptxが求められる。
ル、表領域の判別ルールに関して同様の処理を行うこと
により領域の判別を行う。
は、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域については、そのままの
形でファイル化を行う。
て指定された形式で表示を行う。
処理において、ファジィ推論などの粗い識別法を用いて
はっきりそれとわかる領域を分離し、次にFFT法など
複雑であるが精密な識別法を残りの領域に適用すること
により、処理時間や記憶容量についての従来の欠点を補
うものである。
を示したフローチャートである。
って読み込み(ステップS41)、これをファジィ推論
を用いた粗い分離法(例えば、文字列や図表域をブロッ
ク化し、その幅W,長さL,面積Sといった“あいま
い”な特徴量からファジィ推論して領域の分離を行う)
を用いて明確に識別できる領域についてはこれを分離し
ておき(ステップS42)、残った不明確(はっきりど
ちらともいえない)な領域については、従来用いてきた
複雑な演算手法(FFT法など)を用いて何の領域かを
明確化することにより(ステップS43)、簡単である
が粗いファジィ推論による領域分離と、複雑であるが正
確な従来法との欠点を相補う利点が得られる。
おけるハードウェア構成を示す。本図において51は画
像入力部であり、図1に示したステップS11,図9に
示したステップS21,図14に示したステップS41
の内容を実行する。
たステップS12およびS13,図9に示したステップ
S22〜S24,図14に示したステップS42の内容
を実行する。
図1に示したステップS14,図9に示したステップS
25の内容を実行する。
テップS43の内容を実行する。なお、上述した各実施
例は、光学的に原稿画像を読み取る複写機・ファクシミ
リ装置・電子ファイル等にも適用可能である。
画像の領域判別を簡単かつ高認識率で実現でき、データ
ベース化・ファイリング化の自動化が可能となる。
分離と精密な分離を併用することとしているので、 (1)複雑な演算処理をしなければならない領域が大幅
(半分以下)に減る。
る。
である。
字領域が含まれている場合を示す説明図である。
ある。
る。
トである。
示すブロック図である。
Claims (2)
- 【請求項1】 文字領域,図表領域,写真領域のうち少
なくともひとつの領域を含む画像情報を入力する入力ス
テップと、 前記画像情報から領域判別のための特徴量を抽出する特
徴量抽出ステップと、 前記特徴量を入力し、前記領域判別を行うための複数の
条件命題をファジィ集合を用いて設定し、ファジィ推論
の結果に基づいて文字領域,文字以外の領域を判別する
判別ステップと、 前記判別ステップによる前記領域判別において文字領域
以外の判別された領域については、当該領域の内部につ
いてさらに領域分離を行い、当該領域中に含まれる文字
領域を抽出し、表示あるいはファイル化するステップと
を有することを特徴とする領域分離方法。 - 【請求項2】 入力された画像の中から文字領域を抽出
する領域分離方法において、 入力された画像全体に対して粗い文字領域識別処理を施
す第1の識別ステップと、 前記第1の識別手段により判別し得なかった残りの領域
については、複雑な文字領域識別処理を施す第2の識別
ステップとを有することを特徴とする領域分離方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30093792A JP3281065B2 (ja) | 1992-11-11 | 1992-11-11 | 領域分離方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30093792A JP3281065B2 (ja) | 1992-11-11 | 1992-11-11 | 領域分離方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06150057A JPH06150057A (ja) | 1994-05-31 |
JP3281065B2 true JP3281065B2 (ja) | 2002-05-13 |
Family
ID=17890905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30093792A Expired - Fee Related JP3281065B2 (ja) | 1992-11-11 | 1992-11-11 | 領域分離方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3281065B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08265558A (ja) * | 1994-12-26 | 1996-10-11 | Ricoh Co Ltd | 画像形成装置 |
JP4671885B2 (ja) * | 2005-06-01 | 2011-04-20 | 株式会社リコー | 画像処理装置、プログラムおよび画像処理方法 |
JP4766451B2 (ja) * | 2005-12-20 | 2011-09-07 | 富士ゼロックス株式会社 | 符号化装置、画像処理装置、符号化方法及び符号化プログラム |
-
1992
- 1992-11-11 JP JP30093792A patent/JP3281065B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH06150057A (ja) | 1994-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3703157B2 (ja) | フォーム処理方法及び装置 | |
US9639751B2 (en) | Property record document data verification systems and methods | |
EP0202671B1 (en) | Method of storing and retrieving image data | |
JP2890482B2 (ja) | 文書画像再配置ファイリング装置 | |
CN111444795A (zh) | 票据数据识别方法、电子设备、存储介质及装置 | |
CN115828874A (zh) | 基于图像识别技术的行业表格数字化处理方法 | |
CN111859885A (zh) | 一种法律判决书自动生成方法及系统 | |
CN113936764A (zh) | 一种医疗报告单照片中敏感信息脱敏方法及系统 | |
JP3281065B2 (ja) | 領域分離方法 | |
CN112418199B (zh) | 多模态信息提取方法、装置、电子设备及存储介质 | |
Li et al. | A document classification and extraction system with learning ability | |
JP3898645B2 (ja) | 帳票書式編集装置および帳票書式編集プログラム | |
Qin et al. | Laba: Logical layout analysis of book page images in arabic using multiple support vector machines | |
CN113537221A (zh) | 图像识别方法、装置和设备 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP4480109B2 (ja) | 画像管理装置および画像管理方法 | |
JP2003178071A (ja) | 文書管理システム | |
Yin et al. | Automating data extraction and identification on Chinese road maps | |
Hong et al. | Information Extraction and Analysis on Certificates and Medical Receipts | |
JP3768738B2 (ja) | 電子ファイリングシステム,表紙識別処理装置およびそれらのプログラム記録媒体 | |
JPH0757040A (ja) | Ocr付きファイリング装置 | |
JPH0922442A (ja) | イメージ・ドキュメント資料の電子管理システム | |
JPS60123961A (ja) | デ−タ記憶方法 | |
JPH07193710A (ja) | 文章画像処理装置 | |
JP3116453B2 (ja) | 英文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080222 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090222 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100222 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100222 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110222 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120222 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |