JP3281065B2

JP3281065B2 - 領域分離方法

Info

Publication number: JP3281065B2
Application number: JP30093792A
Authority: JP
Inventors: 昌明今泉; 恒典吉成
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1992-11-11
Filing date: 1992-11-11
Publication date: 2002-05-13
Anticipated expiration: 2017-05-13
Also published as: JPH06150057A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、紙面に記載された情報
から文字領域を分離して抽出する領域分離方法に関する
ものである。

【０００２】さらに詳述すれば、本発明は、新聞や雑誌
などの文章画像から所望とする記事内容を効果的に切抜
き抽出し、これをそのまま、または再編集して表示また
はファイルすることのできる実用性の高い新聞・雑誌な
どの切り出しのための領域分離方法に関するものであ
る。

【０００３】

【従来の技術】従来技術１新聞や雑誌などの文章画像には、数多くの記事が予め定
められた枠組み構成規則に従ってレイアウトして載せら
れている。そして、最近では、これらの中から所望とす
る記事を人間が指定（切抜き）し、再構築してコンピュ
ータシステムにファイリングすることが試みられてい
る。

【０００４】従来技術２また従来、この種の画像領域分離には、フーリエ変換に
よるエッジ検出等の方法が研究され、対象文書全体につ
いて演算するためのプログラムが開発されてきた。

【０００５】

【発明が解決しようとする課題】課題１しかしながら、新聞・雑誌などは紙面サイズが決められ
ているものの、各種記事は上記紙面サイズを有効に利用
すべく、ある領域に割り付けがなされて組み込まれてい
るため、文字領域，図・表領域，写真領域などが混在し
てあり、単に紙面上の単純な位置・領域を特定するだけ
では所望とする文字領域のみを抽出することができない
という不具合がある。

【０００６】すなわち、１枚の紙面上で表示あるいはフ
ァイル化の対象となる記事は多数存在し、その中で種々
の形状に割り付けがなされているある一つの記事だけが
一つの単位記事となるので、例えば一紙面をページなど
とする固定的な単位のみでは扱うことができない。

【０００７】また、コード化された文字情報を扱う場合
と異なり、文章画像として入力される情報を取り扱うの
で、必然的に領域の理解・判断という処理が必要となっ
てくる。

【０００８】さらに、新聞・雑誌などの情報を効果的に
蓄積するために、コード化する領域（文字領域）と画像
情報として扱う領域（図・表領域，写真領域）などを適
切に判断することが要求される。

【０００９】よって、本発明の第１の目的は、新聞や雑
誌などの中から所望とする記事を効果的に抽出して、割
り付け領域を抽出表示したり、あるいはファイル化する
ことのできる実用性の高い文章画像の領域分離方法を提
供することにある。

【００１０】また、本発明の第２の目的は、図・表・グ
ラフなどの領域に含まれる文字領域を認識することによ
り、データベースなどに用いることができるよう構成し
た領域分離方法を提供することにある。

【００１１】課題２上述した第２の従来例では、文書全体に対して定められ
た種々の複雑な演算を施し、その結果のデータを記憶
し、さらに定められたデータ処理を行った後、定められ
た手順に従って領域を分けるといった複雑なルーチンを
経て分離が行われるため、正確ではある反面、（１）演算処理に長い時間を要する。

【００１２】（２）演算結果などのデータを格納する膨
大な記憶容量が必要になる。

【００１３】という欠点があった。

【００１４】ところが実際の文書は、ある程度まで（認
識率７０〜８０％程度）は、より簡単な方法で領域分離
することが可能であり、文書全体にこのように複雑な演
算処理をするのは無駄が多いことになる。

【００１５】よって、本発明の第３の目的は、演算時間
を短縮すると共に、少ない記憶容量で正確な領域の識別
を可能とした領域分離方法を提供することにある。

【００１６】

【課題を解決するための手段】上記の目的を達成するた
めに、請求項１に係る本発明は、文字領域，図表領域，
写真領域のうち少なくともひとつの領域を含む画像情報
を入力する入力ステップと、前記画像情報から領域判別
のための特徴量を抽出する特徴量抽出ステップと、前記
特徴量を入力し、前記領域判別を行うための複数の条件
命題をファジィ集合を用いて設定し、ファジィ推論の結
果に基づいて文字領域，文字以外の領域を判別する判別
ステップと、前記判別ステップによる前記領域判別にお
いて文字領域以外の判別された領域については、当該領
域の内部についてさらに領域分離を行い、当該領域中に
含まれる文字領域を抽出し、表示あるいはファイル化す
るステップとを有する領域分離方法である。また、請求
項２に係る本発明は、入力された画像の中から文字領域
を抽出する領域分離方法において、入力された画像全体
に対して粗い文字領域識別処理を施す第１の識別ステッ
プと、前記第１の識別手段により判別し得なかった残り
の領域については、複雑な文字領域識別処理を施す第２
の識別ステップとを有するものである。

【００１７】

【００１８】

【００１９】

【作用】本発明によれば、文章画像として入力される新
聞や雑誌などの文章画像から領域判別のための特徴量を
抽出し、領域判別のための複数の条件命題をファジィ集
合を用いて設定し、ファジィ推論の結果に基づいて領域
の判別をすることによって、人為的な判断処理を要する
ことなしに実用性の高い領域分離方法を実現することが
できる。

【００２０】さらに、その他の本発明によれば、まず、
文書全体にファジィ推論などを用いて粗い領域判別を行
い、明確に文字領域と識別される部分と、文字領域か画
像領域かの判別が困難である部分とに分け、この後者の
部分についてのみに先の従来例で示した種々の方法（Ｆ
ＦＴ法など）を適用することにより、演算時間を短く
し、少ない記憶容量で正確に画像領域分離を行うことが
できる。

【００２１】

【実施例】以下、図面を参照して本発明の各実施例を詳
細に説明する。なお、以下に述べる実施例では論文誌を
例に挙げて説明するが、一般的な新聞，雑誌，書籍など
も対象となることは言うまでもない。

【００２２】実施例１領域判別の対象となる論文誌は、図２に模式的に示すよ
うに、その紙面にタイトル２１、氏名２２、所属２３、
見出し２４、本文２５Ａ，２５Ｂ、図２６、表２７、写
真２８などが所定のレイアウト規則に従って割り付けし
て構成されている。このように、１枚の誌面中に複数の
領域が混在したものとなっている。

【００２３】本発明の一実施例による領域分離システム
では、次のようにして画像入力される論文・新聞・雑誌
などの文章情報から所望とする領域の判定を行ってい
る。

【００２４】本システムにおける処理は基本的には、図
１に示すように、（１）入力された文章画像の中から、領域に分割する処
理。：Ｓ１１（２）文章画像から領域の判別に必要な特徴量を抽出す
る処理。：Ｓ１２（３）所定の規則に従い、上記領域の特性を判別する処
理。：Ｓ１３（４）領域判別が終了した画像領域を表示する処理また
はファイル化する処理。：Ｓ１４に大別される。

【００２５】次に、それぞれの処理Ｓ１１〜Ｓ１４につ
いて、具体的に説明する。

【００２６】（１）文章画像の文字領域・図表・写真の
境界は、例えば２値化後の画像拡大（ｄｅｌｉａｔｉｏ
ｎ）処理や画像融合（ｆｕｓｉｏｎ）処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。

【００２７】具体的には、多値画像の入力画像を適当な
しきい値処理した後の２値画像に図３に示すような拡大
処理（ｄｅｌｉａｔｉｏｎ）：Ｆ（ｘ，ｙ）を適当な
数；ｍ回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる（図４参照）。

【００２８】（２）次に、画像から領域判別に必要な特
徴量を抽出する。まず、各領域について最小外接矩形を
求める（図５参照）。

【００２９】そして、その外接矩形のＷ，Ｌを求める
（図６参照）。

【００３０】（３）特徴量（Ｗ，Ｌ）を用いてラベリン
グした領域の属性を判別する。

【００３１】領域の判別にあたり、判別関数が複雑にな
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするために、ここではファジィ表現を用いる。

【００３２】具体的な例を以下に示す。

【００３３】文字領域の判別としてルール１ファジィ表現領域の幅；Ｗが短くかつ領域の長さ；Ｌが長い時その領域が文字領域の可能性が高い。

【００３４】−−−−（ルール１）と言うように表現する。

【００３５】次に特徴量Ｗ，Ｌからどのようにしてその
領域の特性を決定するかについて、図７および図８を用
いて説明する。

【００３６】ルール１をｉｆ｛Ｗ（ｗｉｄｔｈ）ｉｓＳＨ（ｓｈｏｒｔ）｝ａｎｄ｛Ｌ（ｌｅｎｇｔｈ）ｉｓＬＮ（ｌｏｎｇ）｝ｔｈｅｎＰｔｘ（Ｐｏｓｓｉｂｉｌｉｔｙｏｆｔｅｘｔ）ｉｓＨＧ（ｈｉｇｈ）ルール２をｉｆ｛Ｗ（ｗｉｄｔｈ）ｉｓＶＳ（ｖｅｒｙｓｈｏｒｔ）｝ａｎｄ｛Ｌ（ｌｅｎｇｔｈ）ｉｓＭＤ（ｍｉｄｄｌｅ）｝ｔｈｅｎＰｔｘ（Ｐｏｓｓｉｂｉｌｉｔｙｏｆｔｅｘｔ）ｉｓＵＫ（ｕｎｋｎｏｗｎ）

【００３７】ここでｉｆから後を前件部、ｔｈｅｎから
後を後件部と呼ぶ。

【００３８】そしてＳＨ，ＬＮ，ＨＧを各々言語真理値
と呼び、各々「短い」、「長い」、「高い」に相当す
る。

【００３９】図８に戻って、領域ｉ番目の特徴量をＷ
ｉ，Ｌｉとする。

【００４０】文字領域の判別に関するルールがｎ個あっ
た場合、ルール１の成立度：α１を求める。

【００４１】ＷｉｓＳＨの成立度をαＷ１ＬｉｓＬＮの成立度をαＬ１とすると α１＝ｍｉｎ（αＷ１，αＬ１）ルール１の結論部をｆｃ１とするとｆ１＝α１×ｆｃ１同様にルール２の成立度：α２ α２＝ｍｉｎ（αＷ２，αＬ２）ルール２の結論部をｆｃ２とするとｆ２＝α２×ｆｃ２全てのルールに関する結論をファジィ集合ｆｃとする
と、ｆｃ＝ｍａｘ（ｆ１，ｆ２，…，ｆｎ）で表せる。これを非ファジィ化する場合、確定値Ｐｔｘ
とすると、Ｐｔｘ＝（積分）ｆｃ＊ｘ／（積分）ｆｃ文字領域の可能性Ｐｔｘが求められる。

【００４２】

【００４３】（４）領域の判別が終了した領域について
は、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域については、そのままの
形でファイル化を行う。

【００４４】さらに、文字領域／その他の領域について
指定された形式で表示を行う。

【００４５】本発明の上記実施例によれば、文章画像の
なかの文字領域と、図・表・グラフ・写真領域の判別を
精度よく行うことができる。

【００４６】そして文字領域に関しては文字認識を行い
コード化し、その他の領域について画像領域として記録
することにより、文章画像に比べてデータ量の圧縮・デ
ータ転送時間の短縮化・ファイル内容の修正が可能とな
る。

【００４７】実施例２図９は、本発明の第２の実施例による領域分離システム
を示すフローチャートである。

【００４８】本システムにおける処理は基本的には、図
９に示すように（１）入力された文章画像の中から、領域に分割する処
理。：Ｓ２１（２）文章画像から、領域の判別に必要な特徴量を抽出
する処理。：Ｓ２２（３）所定の規則に従い、上記領域の特性を判別する処
理。：Ｓ２３（４）文字領域以外と判別された領域について、再度文
字領域の判別を行う。：Ｓ２４（５）領域判別が終了した画像領域を表示する処理また
はファイル化する処理。：Ｓ２５に大別される。

【００４９】次に、それぞれの処理Ｓ２１〜Ｓ２５につ
いて、具体的に説明する。

【００５０】（１）文章画像の文字領域・図表・写真の
境界は、例えば２値化後の画像拡大（ｄｅｌｉａｔｉｏ
ｎ）処理や画像融合（ｆｕｓｉｏｎ）処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。

【００５１】具体的には、多値画像の入力画像を適当な
しきい値処理した後の２値画像に図３に示すような拡大
処理（ｄｅｌｉａｔｉｏｎ）：Ｆ（ｘ，ｙ）を適当な
数；ｍ回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる（図４参照）。

【００５２】（２）次に、画像から領域判別に必要な特
徴量を抽出する。まず、各領域について最小外接矩形を
求める（図５参照）。

【００５３】そして、その外接矩形のＷ，Ｌを求める
（図６参照）。

【００５４】（３）特徴量（Ｗ，Ｌ）を用いてラベリン
グした領域の属性を判別する。

【００５５】領域の判別にあたり、判別関数が複雑にな
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするために、ここではファジィ表現を用いる。

【００５６】具体的な例を以下に示す。

【００５７】文字領域の判別としてルール１ファジィ表現領域の幅；Ｗが短くかつ領域の長さ；Ｌが長い時その領域が文字領域の可能性が高い。

【００５８】−−−−（ルール１）と言うように表現する。

【００５９】次に特徴量Ｗ，Ｌからどのようにしてその
領域の特性を決定するかについて、図７および図８を用
いて説明する。

【００６０】ルール１をｉｆ｛Ｗ（ｗｉｄｔｈ）ｉｓＳＨ（ｓｈｏｒｔ）｝ａｎｄ｛Ｌ（ｌｅｎｇｔｈ）ｉｓＬＮ（ｌｏｎｇ）｝ｔｈｅｎＰｔｘ（Ｐｏｓｓｉｂｉｌｉｔｙｏｆｔｅｘｔ）ｉｓＨＧ（ｈｉｇｈ）ルール２をｉｆ｛Ｗ（ｗｉｄｔｈ）ｉｓＶＳ（ｖｅｒｙｓｈｏｒｔ）｝ａｎｄ｛Ｌ（ｌｅｎｇｔｈ）ｉｓＭＤ（ｍｉｄｄｌｅ）｝ｔｈｅｎＰｔｘ（Ｐｏｓｓｉｂｉｌｉｔｙｏｆｔｅｘｔ）ｉｓＵＫ（ｕｎｋｎｏｗｎ）

【００６１】ここｉｆから後を前件部、ｔｈｅｎから後
を後件部と呼ぶ。

【００６２】そしてＳＨ，ＬＮ，ＨＧを各々言語真理値
と呼び、各々「短い」、「長い」、「高い」に相当す
る。

【００６３】図８に戻って、領域ｉ番目の特徴量をＷ
ｉ，Ｌｉとする。

【００６４】文字領域の判別に関するルールがｎ個あっ
た場合、ルール１の成立度：α１を求める。

【００６５】ＷｉｓＳＨの成立度をαＷ１ＬｉｓＬＮの成立度をαＬ１とすると α１＝ｍｉｎ（αＷ１，αＬ１）ルール１の結論部をｆｃ１とするとｆ１＝α１×ｆｃ１同様にルール２の成立度：α２ α２＝ｍｉｎ（αＷ２，αＬ２）ルール２の結論部をｆｃ２とするとｆ２＝α２×ｆｃ２全てのルールに関する結論をファジィ集合ｆｃとする
と、ｆｃ＝ｍａｘ（ｆ１，ｆ２，…，ｆｎ）で表せる。これを非ファジィ化する場合、確定値Ｐｔｘ
とすると、Ｐｔｘ＝（積分）ｆｃ＊ｘ／（積分）ｆｃ文字領域の可能性をＰｔｘが求められる。

【００６６】写真領域の判別ルール、図領域の判別ルー
ル、表領域の判別ルールに関して同様の処理を行うこと
により領域の判別を行う。

【００６７】（４）上記判別で文字領域以外と判別され
た領域の中にある領域について、再度特徴量（Ｗ，Ｌ）
を用いてラベリングした領域の属性を判別する。

【００６８】これを、図１０を用いて説明する。

【００６９】領域２｛（ＸＬ２，ＹＬ２）、（ＸＲ２，
ＹＲ２）｝…領域ｎ｛（ＸＬｎ，ＹＬｎ），（ＸＲｎ，
ＹＲｎ）｝が領域１｛（ＸＬ１，ＹＬ１）（ＸＲ１，Ｙ
Ｒ１）｝に内包：ＸＬ１≦ＸＬｎ≦ＸＲｎ≦ＸＲ１かつ
ＹＬ１≦ＹＬｎ≦ＹＲｎ≦ＹＲ１され、しかも領域１が
上記（３）により文字以外の領域として判別され領域
２，領域ｎが文字領域として判別される。

【００７０】（５）領域の判別が終了した領域につい
て、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域についてはそのままの形
でファイル化を行う。

【００７１】

【００７２】実施例３第３の実施例における処理は、基本的には第１の実施例
における処理（図１参照）と同じである。

【００７３】そこで、本実施例における各処理を具体的
に説明する。

【００７４】（１）文章画像の文字領域・図表・写真の
境界は、例えば２値化後の画像拡大（ｄｅｌｉａｔｉｏ
ｎ）処理や画像融合（ｆｕｓｉｏｎ）処理を用いたり、
画像の白黒反転を適宜用い、領域をラベリングすること
により実施できる。

【００７５】具体的には、多値画像の入力画像を適当な
しきい値処理した後の２値画像に図３に示すような拡大
処理（ｄｅｌｉａｔｉｏｎ）：Ｆ（ｘ，ｙ）を適当な
数；ｍ回を繰り返した後、ラベリング処理することによ
り各々の領域を作ることができる（図４参照）。

【００７６】（２）次に、画像から領域判別に必要な特
徴量を抽出する。まず、各領域について最小外接矩形を
求める（図５参照）。

【００７７】そして、その外接矩形のＷ，Ｌを求める
（図１１参照）。

【００７８】（３）特徴量（Ｗ，Ｌ，Ｓａ／Ｓ）を用い
てラベリングした領域の属性を判別する。

【００７９】領域の判別にあたり、判別関数が複雑にな
ることが多い。そこで、認識率を高め判別関数の表現を
簡単にするためにここではファジィ表現を用いる。

【００８０】具体的な例を以下に示す。

【００８１】文字領域の判別としてルール１ファジィ表現領域の幅；Ｗが短くかつ領域の長さ；Ｌが長くか
つ面積比Ｓａ／Ｓが中くらいの時その領域が文字領域の可能性が高い。

【００８２】−−−−（ルール１）と言うように表現する。特徴量Ｗ，Ｌ，Ｓａ／Ｓからど
のようにしてその領域の特性を決定するかについて、図
１２および図１３を用いて説明する。

【００８３】ルール１をｉｆ｛Ｗ（ｗｉｄｔｈ）ｉｓＳＨ（ｓｈｏｒｔ）｝ａｎｄ｛Ｌ（ｌｅｎｇｔｈ）ｉｓＬＮ（ｌｏｎｇ）｝ａｎｄ｛Ｓａ／ＳｉｓＭＤ（ｍｉｄｄｌｅ）｝ｔｈｅｎＰｔｘ（Ｐｏｓｓｉｂｉｌｉｔｙｏｆｔｅｘｔ）ｉｓＨＧ（ｈｉｇｈ）ルール２をｉｆ｛Ｗ（ｗｉｄｔｈ）ｉｓＶＳ（ｖｅｒｙｓｈｏｒｔ）｝ａｎｄ｛Ｌ（ｌｅｎｇｔｈ）ｉｓＭＤ（ｍｉｄｄｌｅ）｝ａｎｄ｛Ｓａ／ＳｉｓＭＤ（ｍｉｄｄｌｅ）｝ｔｈｅｎＰｔｘ（Ｐｏｓｓｉｂｉｌｉｔｙｏｆｔｅｘｔ）ｉｓＵＫ（ｕｎｋｎｏｗｎ）

【００８４】ここでｉｆから後を前件部、ｔｈｅｎから
後を後件部と呼ぶ。

【００８５】そしてＳＨ，ＬＮ，ＭＤ，ＨＧを各々言語
真理値と呼び、各々「短い」、「長い」、「中くらい」
「高い」に相当する。

【００８６】図１３に戻って、領域ｉ番目の特徴量をＷ
ｉ，Ｌｉ，Ｓａｉ／Ｓｉとする。

【００８７】文字領域の判別に関するルールがｎ個あっ
た場合、ルール１の成立度：α１を求める。

【００８８】ＷｉｓＳＨの成立度をαＷ１ＬｉｓＬＮの成立度をαＬ１Ｓａ／ＳｉｓＭＤの成立度をαＳａ１／Ｓ１とする
と α１＝ｍｉｎ（αＷ１，αＬ１，αＳａ１／Ｓ１）ルール１の結論部をｆｃ１とするとｆ１＝α１×ｆｃ１同様にルール２の成立度：α２ α２＝ｍｉｎ（αＷ２，αＬ２，αＳａ２／Ｓ２）ルール２の結論部をｆｃ２とするとｆ２＝α２×ｆｃ２全てのルールに関する結論をファジィ集合ｆｃとする
と、ｆｃ＝ｍａｘ（ｆ１，ｆ２，…，ｆｎ）で表せる。これを非ファジィ化する場合、確定値Ｐｔｘ
とすると、Ｐｔｘ＝（積分）ｆｃ＊ｘ／（積分）ｆｃ文字領域の可能性Ｐｔｘが求められる。

【００８９】写真領域の判別ルール、図領域の判別ルー
ル、表領域の判別ルールに関して同様の処理を行うこと
により領域の判別を行う。

【００９０】（４）領域の判別が終了した領域について
は、例えば文字領域は文字領域としてファイル化を行
う。また、文字領域以外の領域については、そのままの
形でファイル化を行う。

【００９１】さらには、文字領域／その他の領域につい
て指定された形式で表示を行う。

【００９２】実施例４以下に詳述する第４の実施例では、文書画像の領域分離
処理において、ファジィ推論などの粗い識別法を用いて
はっきりそれとわかる領域を分離し、次にＦＦＴ法など
複雑であるが精密な識別法を残りの領域に適用すること
により、処理時間や記憶容量についての従来の欠点を補
うものである。

【００９３】図１４は、第４の実施例における処理手順
を示したフローチャートである。

【００９４】まず、文書全体の画素をスキャナー等によ
って読み込み（ステップＳ４１）、これをファジィ推論
を用いた粗い分離法（例えば、文字列や図表域をブロッ
ク化し、その幅Ｗ，長さＬ，面積Ｓといった“あいま
い”な特徴量からファジィ推論して領域の分離を行う）
を用いて明確に識別できる領域についてはこれを分離し
ておき（ステップＳ４２）、残った不明確（はっきりど
ちらともいえない）な領域については、従来用いてきた
複雑な演算手法（ＦＦＴ法など）を用いて何の領域かを
明確化することにより（ステップＳ４３）、簡単である
が粗いファジィ推論による領域分離と、複雑であるが正
確な従来法との欠点を相補う利点が得られる。

【００９５】

【００９６】図１５は、上述した実施例１〜実施例４に
おけるハードウェア構成を示す。本図において５１は画
像入力部であり、図１に示したステップＳ１１，図９に
示したステップＳ２１，図１４に示したステップＳ４１
の内容を実行する。

【００９７】５２はファジィ推論部であり、図１に示し
たステップＳ１２およびＳ１３，図９に示したステップ
Ｓ２２〜Ｓ２４，図１４に示したステップＳ４２の内容
を実行する。

【００９８】５３は表示部、５４はファイル部であり、
図１に示したステップＳ１４，図９に示したステップＳ
２５の内容を実行する。

【００９９】５５はＦＦＴ部であり、図１４に示したス
テップＳ４３の内容を実行する。なお、上述した各実施
例は、光学的に原稿画像を読み取る複写機・ファクシミ
リ装置・電子ファイル等にも適用可能である。

【０１００】

【発明の効果】効果１以上説明したとおり、本発明（手段１）によれば、文章
画像の領域判別を簡単かつ高認識率で実現でき、データ
ベース化・ファイリング化の自動化が可能となる。

【０１０１】効果２本発明（手段２）では、画像領域を分離する際に、粗い
分離と精密な分離を併用することとしているので、（１）複雑な演算処理をしなければならない領域が大幅
（半分以下）に減る。

【０１０２】（２）必要な記憶容量が大幅に減る。

【０１０３】（３）処理時間が短縮される。

【０１０４】といった効果が得られる。

【０１０５】

【図面の簡単な説明】

【図１】本発明の一実施例を示すフローチャートであ
る。

【図２】文章画像の一例を示す模式図である。

【図３】拡大処理の説明図である。

【図４】領域分離した結果を例示した図である。

【図５】最小外接矩形の説明図である。

【図６】特徴量を説明するための模式図である。

【図７】メンバーシップ関数の一例を示す図である。

【図８】ファジィ判別処理の一例を示す図である。

【図９】本発明のその他の実施例を示すフローチャート
である。

【図１０】文字領域以外（図・表・グラフ）の領域に文
字領域が含まれている場合を示す説明図である。

【図１１】特徴量を説明するための模式図である。

【図１２】メンバーシップ関数のその他の例を示す図で
ある。

【図１３】ファジィ判別処理のその他の例を示す図であ
る。

【図１４】本発明のその他の実施例を示すフローチャー
トである。

【図１５】本発明を実施するためのハードウェア構成を
示すブロック図である。

【符号の説明】

５１画像入力部５２ファジィ推論部５３表示部５４ファイル部５５ＦＦＴ部

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/20 H04N 1/40

Claims

(57)【特許請求の範囲】

【請求項１】文字領域，図表領域，写真領域のうち少
なくともひとつの領域を含む画像情報を入力する入力ス
テップと、前記画像情報から領域判別のための特徴量を抽出する特
徴量抽出ステップと、前記特徴量を入力し、前記領域判別を行うための複数の
条件命題をファジィ集合を用いて設定し、ファジィ推論
の結果に基づいて文字領域，文字以外の領域を判別する
判別ステップと、前記判別ステップによる前記領域判別において文字領域
以外の判別された領域については、当該領域の内部につ
いてさらに領域分離を行い、当該領域中に含まれる文字
領域を抽出し、表示あるいはファイル化するステップと
を有することを特徴とする領域分離方法。
【請求項２】入力された画像の中から文字領域を抽出
する領域分離方法において、入力された画像全体に対して粗い文字領域識別処理を施
す第１の識別ステップと、前記第１の識別手段により判別し得なかった残りの領域
については、複雑な文字領域識別処理を施す第２の識別
ステップとを有することを特徴とする領域分離方法。