JPH04105186A

JPH04105186A - 自動文書入力装置

Info

Publication number: JPH04105186A
Application number: JP2224015A
Authority: JP
Inventors: Yasushi Ishizuka; 康司石塚
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1990-08-24
Filing date: 1990-08-24
Publication date: 1992-04-07

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【産業上の利用分野】

この発明は、読み取つ１こ文書画像領域を分割して得ら
れた各小領域の属性を識別し、各小領域における画像情
報に対して属性に応しｆコ処理を行って外部装置へ入力
する自動文書入力装置に関する。

【従来の技術】

文書に記載された内容をコンピュータに入力する際に、
上記文書から得られた文書画像中における文字の画像と
写真および線図形等の画像とを識別する必要かある。す
なわち、文字の画像であると識別した場合には、入力さ
れた文字に係る画像情報に基づいて文字認識を実行し、
得られた文字認識結果（文字コード）をコンピュータに
入力する。一方、写真および線図形等の画像であると識別した場合
には、入力された写真および線図形等の画像情報を圧縮
してコンピュータに入力する。こうして、コンピュータ
に対して効率的に文書画像情報を入力するのである。従来、上述のような文書入力処理を実施するものとして
第８図に示すような自動文書入力装置がある。画像入力部ｌは例えばスキャナ等から成り、文書紙面に
記載された文字、写真および線図形等を読み取って文書
画像情報に変換して人力する。領域分割部２は、画像入
力部１からの文書画像情報に基づいて複数種の画像特徴
量を抽出する。そして、抽出された画像特徴量に基づい
て、文書画像領域をある一つの属性（例えば、文字領域
および写真領域等）を有すると推定される小領域に分割
する。領域識別部３は、領域分割部２によって分割され
た小領域における画像情報からその小領域の属性を識別
するための特徴量を抽出し、この特徴量に基づいて小領
域の属性を識別する。上記領域分割部２によって分割された小領域の属性が傾
城識別部３によって“文字領域”であると識別された場
合には、その小領域の画像情報を文字認識部４に送出す
る。そうすると、文字認識部４は、入力された上記小領
域における画像情報を１文字単位に切り出し、この切り
出されｆこ１文字単位の文字画像情報に基ついて文字認
識を実行して個々の文字を認識する。一方、領域分割部
２によって分割された小領域の属性が領域識別部３によ
って例えば写真領域であると識別された場合には、その
小領域の画像情報を画像処理部５に送出する。そうする
と、画像処理部５は、入力された上記小領域の画像情報
の圧縮等の処理を実施する。統合部６は、上記文字認識部４から出力される文字コー
ド列からなる本文情報と上記画像処理部５から出力され
る圧縮された画像情報とを、位置情報等に基づいて原文
書に再現可能なように統合して、文書フォーマットに編
集する。こうして、原文書の文書フォーマットに編集さ
れた文書画像情報は記憶部７に格納され、必要に応して
コンピュータ等に入力される。上記領域分割部２によって文書画像情報に基づいて複数
種の画像特徴量を抽出して小領域に分割する方法として
、画像特徴量としてヒストグラム（周辺分布特徴量）を
用いる方法かある。この方法こおいては、文書画像領域
にお１する黒情報の縦方向および横方向のヒストクラム
を求める。そして、例えば縦方向のヒストクラムに所定
の閾値よりも大きな幅の谷を示している箇所があれば、
その箇所を小領域に分割する際の分割候補位置であると
推定してその箇所で文書画像領域を小領域に分割する。また、小領域に分割する他の方法として一旦小さな領域
に分割し、同し属性を何すると推定される上記傾城同士
を統合して小領域を生成する方法がある。この方法には
ラベリング法と矩形抽出法とがある。上記ラベリング法においては、文書画像領域の画像情報
における一つの集団を形成する黒画素に同し番号を付加
（ラベリング）し、ラベリングされた画像情報に基つい
て最小矩形（同し番号が付加された黒画素を囲む長方形
の領域）を特徴量として抽出し、抽出された複数の最小
矩形のうち所定値以内のマージンを有する最小矩形同士
を一つの属性を有する小領域に属する最小矩形であると
推定して統合する。また、矩形抽出法において：ｉ、文
書画像領域の画像情報における図杉の外接矩形を抽出し
、抽出され１−複数の外接矩形のらち所定値以内のマー
ノンを有する外接矩形同士を一つの属性を有する小領域
に属する外接矩形であると推定して統合するのである。

【発明か解決しようとする課題】

しかしながら、上記従来の自動文書入力装置における領
域分割部２によって実行される小領域への分割方法には
、次のような問題かある。すなわち、特１！３１としてヒストクラムを用いる方法
においては、上述のように、ヒストクラム上において所
定の閾値よりも大きな幅の谷を示している箇所で領域を
分割するようにしている。その際に、ヒストグラム上に
おける谷部を識別するために用いる閾値の大きさは経験
的に設定している。ところが、入力される文書は多種（すなわち、種々の文
字の大きさ１文字列の配列方向１文字間隔文字佃域と図
形佃域との配置等）に渡っている。また、」二記画像入力部１におし）で文書紙面の文字写
真および線図形等を読み取る際に、文書画像の傾きの度
合いによっては、文字の大きさ、文字列の配列方向１文
字間隔等が変化する。したがって、ヒストグラム上の谷部を識別する際の閾値
を予め一定値に設定しておくと、実際に入力される文書
画像を常に正確に領域を分割できない場合か生ずるとい
う問題がある。さらに、上述のようにして抽出された特徴量を用いて文
書画像領域を小領域へ分割する際に、文書画像領域を一
旦幾つかの領域に予備分割し、その予備分割された領域
内の画像情報に応じて上記抽出された特徴量を正規化し
て用いる方法がある。しかしながら、この方法でも、特徴量を正規化する場合
には、文字や写真の多い文書と文字が少なく文字間が大
きく空いている文書とが混在している領域であっても、
その領域内における一箇所の画像情報のみに注目して正
規化するたぬに、その領域全体の特徴量としてふされし
い値への正規化が実行されないという問題がある。一方、上記ラベリング法においては、上記画像入力部ｌ
から人力された文書画像情報に対するラベリングと、ラ
ベリングされた画像情報に基づく最小矩形の抽出とを行
わなければならない。また、上記矩形抽出法においては
外接矩形の抽出を行わなければならない。ところか、こ
のラベリング時および抽出時における演算には逐次処理
を行なうアルゴリズムを用いるため、夫々の処理におい
て並列処理ができない。したがって、処理に時間か掛か
って高速化が困難であるという問題かある。さらに、上記ラベリング法や矩形抽出法においては、抽
出された上記最小矩形や外接矩形を上述のようにして同
じ属性を有する小領域（たとえば、文字領域や線図形領
域等）に統合するか、あるいは、後に統合可能なように
同じ属性を有する最小矩形や外接矩形にはその旨を表示
する必要がある。こうすることによって、例えば上記最小矩形や外接矩形
が文字領域である場合に、文字認識部４によって認識し
て得られた文字コードの位置や配列順序が不明になって
しまい、原文に再現できなくなることか防止できるので
ある。ところか、」二連の最小矩形や外接矩形の統合処
理の際にも、総ての最小矩形や外接矩形について平行処
理かできケ、統合の方法ら複雑であるため、処理に時間
か掛かるという問題かある。そこで、この発明の目的は、人力された文書画像領域を
小領域に分割する領域分割処理を、複数の小領域の境界
となる区域を精度良くかつ高速に識別して正確に効率良
く実行できる自動文書入力装置を提供することにある。

【課題を解決するための手段】

上記目的を達成するため、第１の発明は、入力された文
書画像領域を一つの属性を有するような小領域に領域分
割部によって分割し、この領域分割部によって得られた
小領域の属性を領域識別部によって識別し、上記小領域
における画像情報に対して上記識別の結果に応した処理
を実施した後にこの処理後の画像情報を外部装置に入力
する自動文書入力装置において、上記領域分割部は、上
記文書画像領域における特徴量を抽出する範囲を指定干
ろ窓を」−記文方向像領域上に設定−」−ると共に、上
記窓を所定；・手順によ−て所定３つ・方向に移動ミ什
て上記文書画像領域３つ総てを上記窓にょ−て走査する
窓設定部と、上記窓設定部によって上記文書画像領域上
を移動される窓内の画像情報の特徴量を所定○手順によ
って抽出才ろ特徴量抽出部と、上記特徴量抽出部によっ
て抽出されｆ二上記窓内の画像情報の特徴量に基づし）
で、」１記窓内に設けられた判定区域は上記文書画像領
域を小領域に分割する際における領域分割候補区域であ
るが否かを識別して上記文書画像領域を分割する領域分
割ニューラルネットワークと、上記領域分割ニューラル
ネットワークによって識別された領域分割候補区域で囲
まれた領域を一つの小領域として確定する小領域確定部
を備えたことを特徴としている。また、第２の発明は、第１の発明の自動文書入力装置に
おいて、上記窓設定部、特徴量抽出部および領域分割ニ
ューラルネットワークを互いに対応付けて複数組設ける
と共に、複数の領域分割ニューラルネットワークによる
識別結果を一つに統合する領域分割候補区域統合部を備
えて、夫々の窓設定部によって上記文書画像領域上に設
定された窓内の画像情報から各窓設定部に対応付けられ
た特徴量抽出部によって個別に抽出された各恵与の特徴
量に基づいて、各窓内に設けられた判定区域が領域分割
候補区域であるか否かを各特徴量抽出部に対応付けられ
た領域分割ニューラルネットワークによって個別に識別
し、上記小領域確定部は、上記領域分割候補区域統合部
によって一つに統合された識別結果に基づいて上記小領
域を確定することを特徴としている。また、第３の発明は、第２の発明の自動文書入力装置に
おいて、上記複数の窓設定部は、夫々文書画像の特性に
応じた形状の窓を上記文書画像領域上に設定すると共に
、この設定した窓を上記特性が上記特徴量に良く表れる
ような方向へ走査することを特徴としている。また、第４の発明は、第１の発明乃至第３の発明のいず
れかの発明の自動文書入力装置において、上記領域分割
ニューラルネットワークにおける出力層の各ノードから
の出力値を遅延素子を介して自ノードにフィードバック
するように成したことを特徴としている。

【作用】

第１の発明では、入力された文書画像領域における画像
情報の特徴量を抽出する範囲を指定する窓が窓設定手段
によって上記文書画像領域上に設定されると共に、上記
窓が所定の手順によって所定の方向に移動される。そし
て、上記窓設定手段によって文書画像領域上を移動され
る窓内の画像情報の特徴量が特徴量抽出部によって所定
の手順によって抽出される。そうすると、上記特徴量抽
出部によって抽出された上記窓内の画像情報の特徴量に
基づいて、上記窓内に設けられた判定区域は上記文書画
像領域を小領域に分割する際における領域分割候補区域
であるか否かが領域分割ニクーラルネットワークによっ
て識別され、上記文書画像領域か分割される。こうして、上記領域分割ニューラルネットワーりによる
文書画像領域・つ分割か終了すると、領域分割ニューラ
ルネットワークによって識別されｒ二領域分割候補区域
で囲まれに領域か小領域確定部によって一つの小領域と
して確定される。すなわち、上記文書画像領域を小領域に分割する際に、
上記窓内に設けられに判定区域か上記領域分割候補区域
であるか否かか、この判定区域よりも広く設定された窓
に係る特徴量に基ついて大局的に識別される。こうする
ことによって、小額域の境界候補となる領域分割候補区
域が精度良く識別される。以後、こうして分割された小領域の属性か領域識別部に
よって識別され、上記小領域にお７する画像情報に対し
て上記識別の結果に応じ１こ処理か実施された後にこの
処理後の画像情報が外部装置に入力される。まに、第２の発明では、複数の窓設定部によって上記文
書画像領域上に設定された複数の窓内に設定された判定
区域が領域分割候補区域であるか否かか、各窓設定部に
対応付けられた特徴量抽出部によって抽出されに特徴量
に括りＬ）で各特徴量抽出部に対応付（→られＬ領域分
割部、−ラル不ノトワークによって個別に識別される。そして、上記複数の領域分割ニューラルネットワークか
らの識別結果が領域分割候補区域統合部によって一つに
統合され、この一つに統合されに識別結果に基づいて小
領域確定部によって小領域か確定さメ−る。したかって、上記文書画像領域上に設定され１こ複数の
窓内の画像情報から平行処理によって多数の特徴量が抽
出され、」１記領域分割候補区域かさらに精度良くかつ
高速に識別される。また、第３の発明では、上記文書画像領域上に複数の窓
設定部によって文書画像の特性に応じ１こ形状に設定さ
れた複数の窓が、夫々上記特性が」二記特微量に良く表
れるような方向へ走査される。そのため、各特徴量抽出部によって抽出される上記各窓
内の画像情報の特徴量は文書画像の特性を良く表すこと
になる。したがって、上記領域分割候補区域が上記文書
画像の特性に応して更に精度良く識別される。まＬ、第４の発明では、上記領域分割ニューラルネット
ワークにおける出力層の各ノードがらの出力値は遅延素
子によって遅延されて、次の識別時に自ノードにフィー
ドバックされる。したがって、萌回の識別結果が”領域
分割候補区域”である場合には次の出力値が高められて
、一方向に連なって存在する領域分割候補区域がより適
確に識別される。

【実施例］以下、この発明を図示の実施例により詳細ｊこ説明する
。以下に述べる各実施例は、入力された文字、写真１図形
等を表す文書画像情報から成る文書画像領域を、ニュー
ラルネットワークを用いて、例えば文字領域、写真領域
および線図形領域等の複数の小領域に分割するものであ
る。第１実施例本実施例においては、縦長のＡ４サイズの入力文書を３
００ｄｐｉの解像度で２値化して入力する場合を考える
。その際の入力画像の大きさは、入力の余裕を見て少し
大きめに３５８４画素×２５６０画素となるようにする
。第１図は第１実施例に係る自動文書入力装置の一例を示
すブロック図である。この自動文書人力装置は画像入力
部１１．領域分割部１２．領域識別部１３．文字認識部
＋４．画像処理部１５および統合部１６から概略構成さ
れている。ここで、上記画像入力部１１．領域識別部１
３１文字認識部１４画像処理部１５および統合部１６の
処理動作は、第８図に示す自動文書入力装置における画
像入力部！、領領域識別３１文字認識部４１画像処理部
５および統合部６と同じ処理動作であるから説明を省略
する。本実施例における上記領域分割部Ｉ２は、窓設定部２１
．特徴量抽出部２２．領域分割ニューラルネットワーク
２３．バッファ２４および小領域確定部２５によって概
略構成されている。上記窓設定部２１は、第２図に示すように、入力された
文書画像領域２６を小領域に分割する際に用いられる画
像枠微量を抽出する範囲を指定するｆコぬの窓２７を設
定し、設定した窓２７を文書画像領域２６上で移動させ
る。その際に、上記８２７を、２８８画素×２８８画素の大
きさに設定する。そして、窓２７を文書画像領域２６に
おける図中左上の位置２７ａから右下の位置２７ｄまて
３２画素すつ水平方向に移動させて全文書画像領域２６
上を走査するのである。上記窓２７の中央には、後に詳
述するようにして窓２７内の画像情報から抽出された画
像枠微量に基ついて領域分割候補となる区域であるか否
かが判定される３２画素×３２画素の区域（以下、単に
判定区域と言う）２８を設定しておく。ここで、上記領域分割候補区域とは各小領域の境界区域
の候補であり、いずれの属性をも有さないような区域の
ことである。その際に、上記窓２７の走査開始位置は、第２図に示す
ように、判定区域２８の位置が文書画像領域２６の左上
隅を完全に含む位置２８ａになるような位置２７ａにす
ればよい。同様に、窓２７の走査終了位置は、判定区域
２８の位置が文書画像領域２６３）右下隅を完全に含乙
゛位置２８（Ｉにするよ一′１な位置２７ｄにオイ−ば
よい。上記特徴量抽出部２２は、上記窓設定部２Ｉによ−、て
設定されに窓２７内にお（）る画像情報から、ヒストグ
ラム特微量と線衝度特微量と９２種類の画像枠微量を抽
出する。上記ヒストグラム特微量は次のようにして抽出する。す
なわち、ある位置にお（Ｊる窓２７内の画像情報（白黒
画素列）を縦方向および横方向に走査して黒画素数のヒ
ストクラムを算出する。そして、得ら君ｆ二黒画素数分
布曲線を１６６画素つ１８等分し、得られた１８個の区
間毎に平均濃度を算出する。こうして得られた２走査方
向×１８個の平均濃度値をヒストクラム特ａｔとオろの
である。まｆこ、上記線密度特徴量は次のようにして抽出する。すなわち、当該位置における窓２７内の画像情報を縦方
向および横方向に走査して白画素から黒画素に反転する
回数のヒストグラムを算出する。そして、得られた反転
回数分布曲線を１６６画素つ１８等分し、得られ？１８
個の区間毎に平均反転回数を算出する。こうして得られ
ｆコ２走査方向ｘ１８個の平均反転回数値を線密度特徴
量とするのである。ここで、上記ヒストグラム特微量と線密度特徴量との差
異は次のよってある。例えば、市松模様の画像情報から
特徴量を抽出する場合、ヒストグラム特微量では市松模
様を構成するメツツユの大きさの差異を抽出てきない。これに対して、線密度特徴量では、メツツユの大きさか
大きい場合には線密度特徴量の値は小さい値を示す一方
、メツツユの大きさが小さい場合には線密度特徴量の値
は大きい値を示すのでメツツユの大きさの差異を抽出で
きる。つまり、線密度特徴量は、ある領域内の画像の図
形の複雑さを抽出する特徴量であると言える。すなわち、ヒストグラム特微量を用いることによって、
文字領域内の文字列は周期的な配列を示すという性質を
利用して属性“文字領域”を識別する。また、線密度特
徴量を用いることによって、文字の線密度は図形の線密
度に比べて小さいという性質を利用して周期的な配列を
有するような図形であってもその属性を正しく“図形領
域”であると識別するのである。こうして、画像枠微量
として２種の特徴量を用いて、判定区域２８か領域分割
候補区域であるか否かを精度良く識別するのである。その際に、上記窓２７か第２図における位置２７ａ（あ
るいは位置２７ｄ）にある場合には、窓２７におし）で
文書画像領域２６に掛からない領域２９ａ（あるいは２
９ｄ）が存在する。そのような場合には、文書画像領域
２６に掛からない領域２９ａ（あるいは２９ｄ）におけ
る画像情報は、文書画像領域２６における背景と同じ画
像情報とするのである。上述のようにして抽出された２×１８次元のヒストグラ
ム特微量と２×１８次元の線密度特徴量とから成る合計
７２次元の画像枠微量の値を、領域分割ニューラルネッ
トワーク２３の入力データとするのである。上記領域分割ニューラルネットワーク２３は、上記特徴
量抽出部２２によって抽出された当該位置にわ、する窓
２７内・つ画象特微量に括ついて、窓２７内の判定区域
２８にお１する画像情報か属イ”る力子ゴリか”領域分
割候補区域”であるか”非領域分割候補区域”であるか
を識別する。そして、窓２７を３２画素ずつ移動させる
ことによって上記判定区域２８て文書画像情報２６上に
区分されて行く個々の判定区域を“領域分割候補区域”
と“Ｊｌ−領域分割候補区域”とに識別する二とによっ
て文書画像領域２６を小領域に分割するのである。第３区は上記領域分割ニューラルネットワーク２３の構
造概念の一例を示す。この領域分割ニューラルネットワ
ーク２３は、入力層３１．中間層３２および出力層３３
の３層から成る３層バーセプトロン型ニューラルネット
ワークである。上記入力層３Ｉは７２個のノードを有し
、中間層３２は１００個のノードを有し、出力層３３は
４個のノードを有する。上記入力層３１における各ノー
ド；よ中間層３２の全７ノードと結合され、中間層３２
の各ノードは出力層３３、）全ノードと結合されて０る
。上記出力層３３にｔ〕ける！−ド３４には、上記窓２
７にお：廿る判定区域２８を、１分割してｉＩＩらｉ−
、ｒンｔつＱつ小区域３０ａ、３０ｂ、３０ｃ、３　ｏ
ａ＝−。うち、小区域３０ａを割り付ける。同様に、ノード３５
には小区域３０ｂを割り付（＋、ソノ−’　３６には小
区域３０ｃを割り付け、ノード３７には小区域３０ｄを
割り付（する。上記構造の領域分割ニューラルネットワーツフ２３は、
次のような学習データを用いて誤差逆伝播学習間によっ
て学習する。すなわち、種々の文書画像情報から得られ
１こ文書画像情報（学習サンプル）に基づいて、上記窓
設定部２Ｉによって上述のように窓２７を学習サンプル
に係る文書画像領域２６の左上の位置２７ａから右下の
位置２７ｄへ３２画素ずつ移動しながら、上記特徴抽出
部２２によって２×１８次元のヒストクラム特微量と２
×１８次元の線密度特徴量とを抽出する。そして、この
２×１８次元のヒストグラム特微量と２ＸＩ３次元の線
密度特徴量とから成る７２次元のデータを学習データと
するのである。その際に、Ｆ記学習サンプルは多種に渡
った（すなわち、種々の文字の大きさ９文字列の配列方
向１文字間隔１文字領域と図形領域との配置、写真や線
図形の種類等を存する）学習サンプルを用いて学習する
ことによって、より領域分割能力の高い領域分割ニュー
ラルネットワーク２３を構築できるのである。」二記種々の学習サンプルに係る学習データを用いて、
次のようにして領域分割ニューラルネットワーク２３の
学習を実行する。まず、上記位置２７ａにおける窓２７
内の画像情報から得られた７２次元の学習データの各要
素値を領域分割ニューラルネットワーク２３の入力層３
１における対応するノードに入力する。一方、領域分割
ニューラルネットワーク２３の出力層３３における各ノ
ー１”３４．３５，３６．３７へは、割り付けられた当
該位置２７ａにおける窓２７内の小区域における学習サ
ンプルの画像情報が上記領域分割候補区域を表す（すな
わち、いずれの属性をも有しない背景画素からなる）場
合には入力値が“じであり、非領域分割候補区域を表す
場合には入力値か“０”である教師データを入力する。そうすると、出力層３３の各ノーｔ”３４，３５３６．
３７に入力された教師データの要素値と学習データを入
力しｆこ際に実際に得られた出力層３３の各ノード３４
．３５，３６．３７からの出力値との誤差の値か“０”
に近付くように、出力層３３および中間層３２の全ノー
ドは各ノード間の結合に付加された結合の強さを表すウ
ェイトの値を更新する。こうして学習か繰り返され、出
力層３３の各ノード３４．３５，３６．３７における入
力された教師データの要素値と上記実際の出力値との誤
差の二乗和の値か、予め設定された閾値（本実施例にお
いては、経験的に求めた値“０３”を用いる）より小さ
くなると、その学習データに基つく学習を終了する。次に、上記窓２７の位置を位置２７ａから３２画素だけ
右方へ移動後の位置における学習データと教師データを
用いて学習を実行する。こうして、次々に窓２７の位置
を移動しながら領域分割ニューラルネットワーク２３の
学習を行うのである。このようにして、種々の学習サンプルから得られｆ学習
データによって学習さワｆ二領域分割ニューラル不ント
ワーク２３は、ある位置における窓２６内の各小区域３
０ａ、３０ｂ、３０ｃ、３０ｄの画像情報が属するカテ
ゴリか既知の学習データを入力すると、出力層３３にお
ける各ノード３４，３５．３６，３７からは割Ｃ）付け
られた夫々の小区域の画像情報が属するカテゴリか”領
域分割候補区域”である場合には“ビか出力され、“非
領域分割候補区域”である場合には“０”が出力される
ように、各ウェイトの値が設定されるのである。−上記
学習済みの領域分割ニューラルネットワーク２３は、文
書画像領域２６上に窓設定部２Ｉによって設定された窓
２７内の各小区域３０ａ、３０ｂ　３０ｃ、３０ｄに係
る画像情報が属するカテゴリを次のようにして識別して
、上記文書画像領域２６を小領域に分割する。すなわち
、上記特徴量抽出部２２から出力されたある位置におけ
る窓２７に係る上記７２次元の入力データを領域分割ニ
ューラルネットワーク２３の入力層３１に入力する。そうすると、各ノードは学習によって設定されたウェイ
ト、つ値に基つく出力値を結合さ、ｔ′、、・口上層、
゛・・°−トに出力オる、その結果、出力層３１’）、
４−ト３４．３５，３６，３７７）ｓらは当該位置にお
、埼る窓２７内の各小区域３０ａ、３０ｂ、３　（１ｃ
、３０Ｊに係る画像情報が属するカテゴリの識別結果を
表す出力値か出力されるのである。ここで、ニューラルネットワークによる識別とよ、上述
のような学習において、入力された学習データに基づい
て得られた出力データの内容か教師データと同しにする
ように各２ノ一ト間の結合の重みを自ら設定することに
よって構築されｆ、：識別ルールに基づいて、入力デー
タか属するカテゴを識別するものである。その際に、上
記識別ルールは、カテゴリ識別の対象となる判定区域２
８における局所的な特徴に囚われず判定区域２８の周辺
領域を含めたより広い窓２７内から得られた学習データ
における大局的な特徴に基づいて構築されるのである。したがって、ニューラルネットワークを用いた領域分割
によれば、今まで困難であった特定の部分にノイズがあ
るような文書画像領域の小領域への分割を高精度で実施
できるのである。また、上記領域分割ニューラルネットワーク２３を学習
する際には、窓設定部２１によって文書画像領域２６上
を走査される所定の大きさの窓２７内の画像情報から得
られた学習データに基づいて、自ら識別ルールを構築す
るようにしている。つまり、走査に連れて、例えば文字の大小や文字間隔等
か種々変化する窓２７内の画像情報に応して、ダイナミ
ックな識別ルールが構築される。したがって、一定の閾
値によって領域分割候補区域を判定する場合のような微
妙な閾値の設定を必要とせず、精度の高い領域分割が可
能となる。さらに、その際に、中間層３２あるいは出力層３３内の
各ノードにおける処理は平行に処理される。したがって
、領域分割ニューラルネットワーク２３によれば小領域
への分割の高速処理が可能となり、文書入力時間を大幅
に短縮できるのである。こうして文書画像領域２６上を窓２７が走査されて、窓
２７の中央に位置する各小区域３０ａ、３Ｏｂ、３０ｃ
、３０ｄか領域識別候補区域であるが否かを表す“ビま
たは“０”を表す識別信号か領域分割ニューラルネット
ワーク２３の出力層３３から出力される。そして、この
領域分割ニューラルネットワーク２３から出力された上
記識別信号の内容（識別情報）が上記バッファ２４に格
納されるのである。第４図はある英語文書に基つく文書画像情報から、窓設
定部２＋、特徴量抽出部２２および領域分割ニューラル
ネットワーク２３によって、上述のようにして得られて
バッファ２４に格納された上記識別情報の一例を示す。図中数字が書き込まれている一つ一つの区域が窓２８内
の小区域３０の箇所に対応し、“ビはその小区域が領域
分割候補区域であることを表す一方、“０”は非領域分
割候補区域であることを表す。すなわち、第４図において数字“０′の小区域から成る
領域は何等かの属性（例えば、文字領域や線図形領域等
）を有する小領域を表し、数字“ビの小区域から成る領
域は属性を有しない小領域（すなわち、背景）を表すこ
とになる。Ｌｆ二かつて、領域分割ニューラルネットワ
ーク２３によ、て文書画像領域を各小区域単位に領域識
別候補区域であるか否かを識別して識別情報をバッファ
２４に書き込むことか、取りも直さす文書画像領域２６
をある何等か、７）属性を有すると推定される小領域に
分割オろ二とにするＤであろ１なお、数字か書き込まれ
て１，１ろ互いに隣接する４）の区域か上記判定区域２
８の箇所に対応するのである。Ｌ記小領域確定部２５は、Ｌ述のようにしてバッファ２
４に書き込まれた識別情報（すなわち、領域分割候補区
域か否かを表す“０′あるいは”ビのラベル）１２−基
づいて、領域分割候補区域（すなわち、ラベル“ビ）ご
囲まれた領域を独存した小領域として確定するのである
。以後、二・５　＋、、て分割された小領域の属性か領域
識別部１３が識別され、その識別結果に応じて属性′文
字領域”の小領域に対１−では文字認識部１４ご文字認
識処理が実行され乙一方、属性°図形領域゛等Ｊ）“文
字領域”以７ｔ、′）小領域し対しては画像処理部１５
て画像情報、−）圧縮か実行３２−るのてめ′８５このよつに、本実施例におし）て：ま、自動文書人力装
置の領域分別部Ｉ２を、窓設定部２＋、特徴量抽出部２
２．領域分が１ニユーラルネツト・−２１−り２３、バ
ッファ２・１および小領域（ｉｉ、ｉ、’部２，３で構
成する。そして、上記窓設定部２１にお０て：ま、２８
８画素×２８８画素の犬きざ一窓２″７文書画像領域２
６上を走査し、特微量抽田部２２においては、上記走査
される窓２７内の画像情報に基づいて、上述のようにし
てヒストクラム特微量と線密度特徴量とを順次求める。そして、このヒストグラム特微量と線密度特徴量とから
成る７２次元の特徴量を領域分割二１−ラルネ：ｌ　ｈ
　’−，’−り２３の入力データとする上記領域分割ニューラルネットワーク２，３は、入力さ
れた７２次元の人力データに基づいて、前位置における
窓２７内の各小区域３０ａ、３０ｂ、３０ｃ、３０ｄは
領域分割候補区域か否かを識別ｊ７、識別情報をバッフ
ァ２４に格納する。、こうしこ、文書画像領域２６：）
小領域・＼の分割を終γする。そうすると、上記小領域確定部２５は、５＼ゾフア２４
に格納された各小区域か領域分割候補区域か否かを表す
“０”あるいは“ビのラベルに基づいて、領域分割候補
区域で囲まれた領域を独立した小領域として確定するの
である。したがって、本実施例によれば、窓設定部２１によって
走査される窓２７内の画像情報の変化に応じて領域分割
ニューラルネットワーク２３によってダイナミックに構
築される識別ルールに基づいて、文書画像領域が精度良
く小領域へ分割される。また、上記領域分割ニューラルネットワーク２３によっ
て、カテゴリ識別の対象となる判定区域２８における局
所的な画像特徴量に囚われず、周辺領域を含めたより広
い窓２７から得られた大局的な画像特徴量に基づいて、
文書画像領域が容易にかつ正しく小領域に分割されるの
である。さらに、上記文書画像領域の分割処理は領域分割ニュー
ラルネットワーク２３内において平行に処理される。し
たがって、本実施例によれば精度の高し・分割処理を高
速に実行できるのである。つまり、本実施例によれば、文書画像領域をある一つの
属性を有すると推定される小領域に正確にかつ効率良く
分割できるのである。上記実施例においては、窓設定部２Ｉによる窓２７の移
動方法は、文書画像領域２６における左上の位置２７ａ
から右下の位置２７ｄまて水平方向に移動するようにし
ている。しかしながら、この発明における窓２７の移動
方向はこれに限定されるものではない。要は、文書画像
領域２６上を窓２７によって満遍なく走査できれば良い
のである。第２実施外本実施例は、文書画像領域から画像特徴量を抽出する範
囲を指定する窓を文書画像の特性に応して２個設け、夫
々上記特性か画像特徴量に良く表れる方向へ走査される
窓内の画像情報から抽出された異なる画像情報に基づい
てニューラルネットワークによって小領域への分割を実
施するものである。本実施例においては、第１実施例の場合と同様に、縦長
の、へ４＋イズの入力文書を３００ｄｐｉの解像度で２
値化して入力する場合を考える。その際の人力画像の大
きさは３５８４画素ｘ２Ｓ６０画素である。第５図は第２実施例に係る自動文書入力装置の一例を示
すブロック図である。本実施例における画像入力部１１
．領域識別部１３１文字認識部１４画像処理部１５およ
び統合部１６の処理動作は、第１実施例の場合と同しで
ある。以下、主に領域分割部４０について詳細に説明す
る。本実施例における領域分割部４０は、第１窓設定部４１
．第２窓設定部４２．第１特徴量抽出部４３、第２特徴
量抽出部４４．第１領域分割ニューラルネットワーク４
５．第２領域分割ニューラルネットワーク４６．第１バ
ッファ４７．第２バツフア４８、領域分割候補区域統合
部４９および小領域確定部５０によって概略構成されて
いる。本実施例における窓は上記２つの窓設定部４Ｉ４２によ
って２つ設け、夫々別々に走査させるようにしている。そして、こうして走査される２つの窓内における画像情
報から両持微量抽出部４３４４で抽出さメ′、に画像特
徴量１こ基っし）で、文書画１ｇ！領域を小領域に分割
するのである、上記第１窓設定部４１は、第６図に示す
ように、第１窓５２を文書画像領域５Ｉ、）縦方向全幅
、′こ渡る３５８４画素×９６画素のスリット状に設定
する。そして、この第１窓５２を文書画像領域５１にお
ける左端の位置から右端の位置まて３２画素すつ水平方
向にに移動させて文書画像領域５１上を走査するのであ
る。その際に、第１窓５２の幅方向中央には、全長に渡
って幅３２画素の第１判定区域５３を設定しておく。そ
して、上記第１窓５２の走査開始位置は、第１判定区域
５３の位置が文書画像領域５Ｉの左端部を完全に含むよ
うな位置にする。同様に、第１窓５２の走査終了位置は
、第１判定区域５３の位置が文書画像領域５１の右端部
を完全に含む位置にするのである。一方、上記第２窓設定部４２は、第６図に示すように、
第２窓５４を文書画像領域５１の横方向全幅に渡る９６
画素Ｘ２５６０画素のスワン）・状に設定する。また、
第２窓５４の幅方向中央には、全長に渡って幅３２画素
の第２判定区域５５を設定しておく。そして、上記第２
窓５４の走査開始位置は、第２判定区域５５の位置か文
書画像領域５１の上端部を完全に含むような位置にする
。同様に、第２窓５４の走査終了位置は、第２判定区域
５５の位置が文書画像領域５１の下端部を完全に含む位
置にするのである。文書画像には縦書きと横書きとの２つの特性がある。こ
のことは、各小領域の境界領域は縦方向あるいは横方向
にスリット状に延在することを意味する。そこで、本実
施例においては、文書画像領域５Ｉの縦方向全幅に渡っ
てスリット状Ｉこ設定した第１窓５２を横方向へ走査す
るのである。こうすることによって、第１窓５２が移動
しても、第１窓５２と略直行して横方向に延在する境界
領域は第１窓５２における同じ箇所で捕らえることがで
きる。その結果、境界領域が横方向に連なるという横書
き文書の特性が第１窓５２に係る画像特徴量によって良
く表されることになるのである。二のことは、文書画像領域５１の横方向全幅に渡ってス
リット状に設定されて縦方向へ走査される第２窓５４に
ついてら言える。つまり、横方向に連なる領域分割候補
区域を第１窓５２て適確に識別する一方、縦方向に連な
る領域分割候補区域を第２窓５４て適確に識別するので
ある。上記第１特徴量抽出部４３は、上記第１窓設定部４１に
よって設定されｆこ第１窓５２における画像情報から、
ヒストグラム特微量とメツツユ特微量との２種類の画像
特徴量を抽出する。上記ヒストグラム特微量は次のようにして抽出する。す
なわち、ある位置における第１窓５２内の画像情報を水
平方向に走査して黒画素数のヒストグラムを算出する。そして、得られた黒画素数分布曲線を垂直方向に３２画
素ずつ１１２等分し、得られた１１２個の区間毎に平均
濃度を算出する。こうして得られた１１２個の平均濃度値をヒストグラム
特微量とするのである。また、上記メツツユ特微量は次のようにして抽出する。すなわち、当該位置における第１窓５２にお（する画像
情報を３２画素×３２画素のメツツユ状に分割し、得ら
れにｌ１２ｘ３個のメツシュ内の黒画素数を求める。こ
うして求められ？ｌ１２×３個の黒画素数をメノンユ特
微量とするのである。その際に、上記第１窓５２および
第２窓５４か、文書画像領域の周端部の位置にある場合
には、両窓５２．５４内の領域のうち文書画像領域５１
に掛からない領域における画像情報は、文書画像領域５
１における背景と同じ画像情報とする。上述のようにして抽出された１１２次元のヒストグラム
特微量と１Ｉ２ｘ３次元のメツシュ特微量とから成る合
計４４８次元の画像枠微量の値を、第１領域分割ニュー
ラルネットワーク４５の入力データとするのである。一方、上記第２特徴量抽出部４４は、上記第２窓設定部
４２によって設定された第２窓５４における画像情報か
ら、線密度特徴量とメツンユ特微量との２種類の画像枠
微量を抽出する。上記線密度特徴量は次のようにして抽出する。すなわち、ある位置における第２窓５４内の画像情報を
垂直方向に走査して白画素から黒画素に反転する回数の
ヒストクラムを算出する。そして、得られ１こ反転回数
分布曲線を水平方向に３２画素ずつ８０等分し、得られ
？＝８０個の区間毎に平均反転回数を算出する。こうし
て得られｆ二８０個の平均反転回数を線密度特徴量とす
るのである。また、上記メツツユ特微量は上述と同様にして、当該位
置における第２窓５４における画像情報を３２画素×３
２画素のメツツユ状に分割し、得られｒコ８０　ｘ　３
個の黒画素数をメソツユ特微量とするのである。こうして抽出された８０次元の線密度特徴量と８０×３
次元のメツツユ特微量とから成る合計３２０次元の画像
枠微量の値を、第２領域分割ニューラルネットワーク４
６の入力データとするのである。このように、第１窓５２と第２窓５４の２つの窓を用い
て、文書画像領域５１から画像枠微量としてヒストグラ
ム特徴量、線密度特微量および２つのメツシュ特微量の
合計４種の特ｍｆ４を抽出することによって、多くの画
像枠微量に基づいてより精度良く領域分割候補区域を識
別できるのである。また、その際における総ての画像時
ａｍは２つの窓５２．５４内の画像情報から同時に抽出
されるのて、多くの画像枠微量を効率良く抽出できる。上記両領域分割ニューラルネットワーク４５５６は、夫
々対応する第１特徴量抽出部４３あるいは第２特徴量抽
出部４４によって抽出された画像枠微量に基づいて、当
該位置における第１窓５２内の第１判定区域５３の画像
情報が属するカテゴリあるいは第２窓５４内の第２判定
区域５５の画像情報が属するカテゴリが“領域分割候補
区域”であるか否かを識別する。この両領域分割ニュー
ラルネットワーク４５．４６の構造は第１実施例におけ
る領域分割ニューラルネットワーク２３と大略同じであ
り、３層パーセブトロン型ニューラルネットワークによ
って構成されている。但し、以下に述べる点において、
第１実施例における領域分割ニューラルネットワーク２
３の構造とは異なるのである。第７図は第１領域分割ニューラルネットワーク４５の構
造概念図である。この第１領域分割ニューラルネットワ
ーク４５の入力層５６は４４８個のノードを有し、中間
層５７は２００個のノードを存し、出力層５８は１１２
個のノードを有する。上記出力層５８における１１２個の夫々のノードには、
上記第１窓５２内の第１判定区域５３における上記メソ
ツユ特微量を抽出した際におけるｌ１２個のメッツユの
いずれかを割り付ける。また、上記出力層５８の各ノー
ドにおいては、夫々のノードの出力側を同じノードの入
力側と遅延素子５９を介して結合（以下、このような結
合をフィードバック結合と言う）するようにしている。このフィードバック結合の重みの値は経験により“０２
″とする。上記第１領域分割ニューラルネットワーク４５は、次の
ような学習データを用いて誤差逆伝播学習量によって学
習する。種々の学習サンプルに基づいて、上記第１窓設
定部４１によって第１窓５２を文書画像領域５１上で走
査しながら、上記第１特徴量抽出部４３によって１１２
次元のヒズトダラム特微量と１１２ｘ３次元のメソツユ
特微量とを抽出する。そして、このｌ１２次元のヒスト
クラム特微量とｌｌ２Ｘ３次元のメッンユ特微量七から
成る４４８次元の画像特徴量を学習データとずろ。一方
、出力層５８における夫々：）、／　−トに割り付けら
れた第１判定区域５３の各メッンクにおけろ学習サンプ
ルの画像情報が属するカテゴリが領域分割候補区域の場
合にはそのノードへの人力値が“ビであり、非領域分割
候補区域の場合にはそのノードへの入力値が“０”であ
るような要素値から成る１１２次元のデータを教師デー
タとする。こうして、第１窓５２を順次移動して得られ
た半合データと教師データとに基づいて、第１領域分割
ニューラルネットワーク４５の学習が第１実施例と同様
にして実行される。こうして種々の学習サンプルによって学習され１こ第１
領域分割ニューラルネットワーク４５は、ある位置にお
ける第１判定区域５３内の各メツツユの画像情報の属す
るカテゴリか既知の学習データを入力すると、出力層５
８の各ノードからは、割り付けられに夫々Ｃ）メツツユ
の画像情報か属するカテゴリか“領域分割候補区域”で
ある場合には“ビか出力され、”非領域分割候補区域”
である場合には”０”が出力されるように、各ウェイト
の値か設定されるのである。第２領域分割ニューラルネットワーク４６は第１領域分
割ニューラルネットワーク４５と大略同じ構造を有する
。但し、各層のノード数や入力データの内容において第
１領域分割ニューラルネットワーク４５とは異なる。すなわち、第２領域分割ニューラルネットワーク４６の
入力層は３２０個のノードを有し、中間層は１６０個の
ノードを有し、出力層は８０個のノードを有する。そし
て、この出力層における８０個の夫々のノードには、上
記第２窓５４内の第２判定区域５５における８０個のメ
ツツユのいずれかを割り付けるのである。また、第２領
域分割ニューラルネットワーク４６の学習の際に用いる
学習データは、種々の学習サンプルから上記第２特徴量
抽出部４４によって抽出された８０次元の線密度特徴量
と８０×３次元のメッンユ特微量とから成る３２０次元
の画像特徴量である。上記学習済みの第１領域分割ニューラルネットワーク４
５および第２領域分割ニューラルネットワーク４６は、
次のようにして文書画像領域５１を小領域に分割する。すなわち、第１領域分割ニューラルネットワーク４５に
おいては、文書画像領域５Ｉ上のある位置における第１
窓５２に係る上記４４８次元の入力データを入力層５６
に入力する。そうすると、出力層５８の各ノードからは
当該位置における第１判定区域５３の各メツシュに係る
画像情報が属するカテゴリの識別結果を表す出力値を出
力して、文書画像領域５１を小領域に分割する。そして
、上記出力層５Ｂからの出力値が上記第１実施例の場合
と同様に第１識別情報として上記第１バツフア４７に格
納される。一方、第２領域分割ニューラルネットワーク
４６においては、文書画像領域５１上をのある位置にお
ける第２窓５４に係る上記３２０次元の入力データを入
力層に入力する。そうすると、出力層の各ノードからは
当該位置における第２判定区域５５の各メツツユに係る
画像情報が属するカテゴリの識別結果を表す出力値を出
力して、文書画像領域５１を小領域に分割する。そして、上記出力層からの出力値が第２識別情報として
上記第２バツフア４８に格納される。その際に、上記両領域分割ニューラルネットワーク４５
．４６における夫々の出力層における各ノードは、中間
層の総てのノードからの出力値と上記遅延素子５９に保
持された前回の識別時における自ノードからの出力値と
に基づいて出力値を算出するようにしている。つまり、
前の判定区域に係る識別結果が“領域分割候補区域”で
あれば次の判定区域に係る出力値を大きくするのである
。換言すれば、過去の履歴を識別に反映するのである。このように過去の履歴を識別に反映させるのは次の理由
による。すなわち、上述のように、上記第１窓５２は文
書画像領域５１の縦方向全幅に渡ってスリット状に設定
されて横方向へ走査されるので、小領域の境界領域のう
ち横方向に延在する境界領域の画像情報は第１窓５２の
走査に伴って第１判定区域５３の同しメソツユによって
走査されることになる。しｆ二かって、−旦第１窓５２
内の第１判定区域５３のあるメツツユに係る識別結果が
“領域分割候補区域“となると、そのメソツユに係る識
別結果が連続して“領域分割候補区域”となる場合が多
い。そこで、前の判定区域に係る識別結果が“領域分割
候補区域”であれば次の判定区域に係る識別結果が確実
に“領域分割候補区域″となるように出力値を大きくす
る。こうして、横方向に延在する境界領域を識別し易く
するのである。ここて、上記遅延素子５９に保持された前回の識別結果
の内容は、画像入力部＋１によって次の文書画像情報が
入力されるとクリアされるのである。上記領域分割候補区域統合部４９は、次のようにして上
記第１バツフア５７に書き込まれた第１識別情報と第２
バツフア５８に書き込まれ１こ第２識別情報とを統合す
る。すなわち、上記第１バツフア４７に書き込まれ１こ
第１識別情報および第２バツフア４８に書き込まれた第
２識別情報における同しメソツユに係る識別情報を読み
出す。そして、両識別情報のうち少なくともし・すれか
一方が“１”であればそのメソツユに係る識別情報は“
ドとして、当該文書画像領域５１における総てのメツシ
ュに係る識別情報を再設定する。そして、上記小領域確
定部５０は、こうして統合された識別情報に基づいて、
領域分割候補区域で囲まれた領域を独立した小領域とし
て確定するのである。このように、本実施例においては、自動文章入力装置の
領域分割部４０を、第１．第２窓設定部４１．４２、第
１．第２特徴量抽出部４３．４４、第１．第２領域分割
ニューラルネントワーク４５４６、第１．第２バッファ
４７．４８、領域分割候補区域統合部４９および小領域
確定部５０て構成する。そして、上記第１窓設定部４１
によって文書画像領域５１の縦方向全幅に渡ってスリッ
ト状に設けられた第１窓５２を横方向に走査する一方、
上記第２窓設定部４２によって文書画像領域５１の横方
向全幅に渡ってスリット状に設けられた第２窓５４を縦
方向に走査する。そして、第１特徴量抽出部４３で第１
窓５２内の画像情報から抽出した１１２次元のヒストグ
ラム特微量と１１２×３次元のメツシュ特徴景から成る
４４８次元の画像特徴量を第１領域分割ニューラルネッ
トワーク４５に入力する。一方、第２特徴量抽出部４４
で第２窓５４内の画像情報から抽出した８０次元の線密
度特徴量と８０×３次元のメツツユ特微量から成る３２
０次元の画像特徴量を第２領域分割ニューラルネットワ
ーク４６に入力する。そうすると、上記第１領域分割ニューラルネットワーク
４５は、第１窓５２における第１判定区域５゛３を構成
する各メツシュ内の画像情報が属するカテゴリが“領域
分割候補区域“であるか否かを識別し、第１識別情報を
第１バツフア４７に格納する。同様に、第２領域分割ニ
ューラルネットワーク４６は、第２窓５４における第２
判定区域５５を構成する各メソツユ内の画像情報が属す
るカテゴリが“領域分割候補区域”であるか否かを識別
し、第２識別情報を第２バツフア４８に格納する。こうして、文書画像領域５１の小領域への分割が終了す
る。そうすると、領域分割候補区域統合部４９は、第１
バツフア４７に格納された第１識別情報と第２バツフア
４８に格納された第２識別情報とを統合する。そして、
統合された識別情報に基づいて、小領域確定部５０によ
って領域分割候補区域で囲まれた領域を独立した小領域
として確定するのである。このように、本実施例によれば、文書画像には縦書きと
横書きとの２つの特性があることに注目して、文書画像
の特性に応じた形状を有すると共に上記特性が画像特徴
量に良く表されるような方向に走査される第１窓５２と
第２窓５４の２つの窓を設定する。そして、第１窓５２
で横方向に連なる領域分割候補区域を適確に識別する一
方、第２窓５４で縦方向に連なる領域分割候補区域を適
確に識別するようにしているので、文書画像領域５１、
ｈに存在する領域分割候補区域を適確に識別できる。まｆこ、本実施例におし）ては、ヒストグラム特徴量、
線密度特微量および２つのメノンユ特微量の合計４種の
特徴量に基ついて領域分割候補区域であるか否かの識別
を実施するので、多くの特徴量に基づいてより正確に領
域分割候補区域を識別できる。その際に、上記ヒストグ
ラム特徴量、線密度特微量およびメツツユ特微量は、２
つの窓５２５４内の画像情報から別々の特徴量抽出部４
３４４による平行処理によって抽出されるので、つの文
書画像領域５１から多数の特ａｔを抽出する場合であっ
ても短時間に効率良く処理できるのである。また、上述のように、第１領域分割ニューラルネットワ
ーク４５および第２領域分割ニューラルネットワーク４
６は、評価時においては、出力層の各ノードは前回の識
別結果が領域分割候補区域である場合にはその程度に応
して出力値を高めるようにしている。したがって、一方
向に連続する領域分割候補区域をより適確に識別できる
のである。上記実施例においては、文書画像領域５１の縦方向全幅
に渡ってスリット状の形状を有する筆意５２と、文書画
像領域５Ｉの横方向全幅に渡ってスリット状の形状を有
する第２窓５４とから成る２つの窓を設定し、第１窓５
２は水平方向へ走査する一方、第２窓５４は垂直方向へ
走査するようにしている。しかしながら、この発明にお
１子る窓の数や形状およびその走査方向はこれに唱定さ
れるものではない。要は、文書画像の特性に応した形状
の窓を、その特性が画像特徴量に良く表れるような方向
へ走査すればよいのである。上記実施例においては、第１窓設定部４１と第２窓設定
部４２によって設定される２つの窓５２５４からの特徴
量に基つく領域分割候補区域の識別と、第１．第２領域
分割ニューラルネソ）・ワーク４５．４６におけるフィ
ードバック結合よる出力値の活性化とを同時に実施して
いる。しかしながら、この発明においては、複数窓によ
る領域分割候補区域の識別と、領域分割ニューラルネッ
トワークにおけるフィードバック結合による出力値の活
性化を別々に実施しても何等差し支えない。上記各実施例においては、領域分割ニューラルネットワ
ークを３層バーセプトロン型ニューラルネゾトワークで
構成しているが、この発明はこれに限定されるものでは
ない。上記各実施例における画像特徴量の種類や文書画像領域
および窓の大きさはあくまでも一例であり、本発明にお
いてはこれらに限定されるものではない。この発明の自動文書人力装置における特１ｋｌ抽出部の
構成は上記各実施例に限定されるものではない。例えば
、自己組織化ニューラルネットワークによって抽出され
る非解析的かつ広範囲な画像特徴量に基づいて領域分割
候補区域を識別するようにしてもよい。【発明の効果】以上より明らかなように、第１の発明の自動文書入力装
置は、領域分割部を、窓設定部、特徴量抽出部、領域分
割ニューラルネットワークおよび小領域確定部によって
構成し、入力された文書画像領域上を上記窓設定部によ
って設定された窓で走査し、この走査される窓内の画像
情輯がら抽出された特徴量に基づいて上記窓内に設けら
れた判定区域が領域分割候補区域であるが否かの識別を
上記領域分割ニューラルネットワークによって実施して
上記文書画像領域を分割し、上記領域分割ニューラルネ
ットワークによって識別された領域分割候補区域で囲ま
れた領域を小領域として確定するようにしたので、上記
判定区域が領域分割候補区域であるか否かの識別を、そ
の周辺領域を含めたより広い窓から得られる画像特徴量
に基づいて大局的に実施できる。したがって、画像情報
の局所的な特徴に囚われず正しく領域分割候補区域を識
別できる。その際に、上記識別を平行処理可能なニューラルネット
ワークを用いて実施するので、領域分割候補区域の識別
を高速にできる。また、上記窓の走査によって、上記領域分割ニュラルネ
ノトワークには窓の走査に基つく画像情報の変゛化に応
して識別ルールがグイナミソクに構築される。し１ニか
って、文書画像情報における文字の大きさ９文字間隔１
文字の配列方向９文字と線図形との配置等が変化しても
、領域分割処理区域を精度良く識別できる。すなわち、この発明によれば、精度の高い領域分割処理
を効率良く実行できる。また、第２の発明の自動文書入力装置は、第１の発明に
おける窓設定部、特徴量抽出部および領域分割ニューラ
ルネットワークを互いに対応付けて複数組設けているの
で、複数の窓内の画像情報から多くの特徴量を平行処理
によって抽出できる。したかって、この発明によれば、多くの特徴量に基つく
更に精度の高い領域分割処理を効率良く実行できる。また、第３の発明の自動文書入力装置は、第２の発明に
おける複数の窓を夫々文書画像の特性に応した形状に成
すと共に、その特性が上記特徴量に良く表れる方向へ走
査するので、窓内の画像情報に拮つし）で抽出される特
徴量、′よ文書画像の特性を良く表すことになる。しｆ
二かへて、領域分割候補区域の識別を文書画像の特性に
応して適確にできる。ま１こ、第４の発明の自動文書入力装置は、第１の発明
乃至第３の発明における領域分割ニューラルネットワー
クを、その出力層からの出力値を遅延素子を介して自ノ
ードにフィードバックするようにしたので、上記領域分
割ニューラルネットワークによる前回の識別結果が“領
域分割候補区域”である場合には次の出力値を高めて、
一方向に連なって存在する領域分割候補区域を適確に識
別できる。したがって、この発明によれば、更に精度の
高い領域分割処理を実行できる。

【図面の簡単な説明】

第１図はこの発明の自動入力装置における一実施例のブ
ロック図、第２図は第１図における窓設定部によって実
施される窓の設定と移動の説明図、第３図は第１図にお
ける領域分割ニューラルネットワークの構造概念図、第
４図は第１図におけるバッファに格納された識別情報の
一例を示す図、第５図は上記実施例とは異なる他の実施
例のブロック図、第６図は第５図における第１窓設定部
によって設定される第１窓および第２窓設定部によって
設定される第２窓の説明図、第７図は第５図における第
１領域分割ニューラルネットワークの構造型合図、第８
図は従来の自動入力装置のブロック図である。＋１・・画像入力部、　　Ｉ　２，４０・・・領域分割
部、１３　・領域識別部、　　′　　１４　・文字認識
部、１５　・画像処理部、　　　　　１６・・・統合部
、２１．４１．４２・−窓設定部、２２．４３．４４・・特徴量抽出部領域分割ニューラルネットワーク、２４．４７．４８・・バッファ、２５．５０・・小領域確定部、２７．５２，５４・窓２８．５３．５５・・・判定区域３０・小区域、　　　　　　３１．５６・・入力層、３
２．５７・中間層、　　　３３．５８・・出力層、４９
　領域分割候補区域統合部、５９・遅延素子。

Claims

【特許請求の範囲】

（１）入力された文書画像領域を一つの属性を有するよ
うな小領域に領域分割部によって分割し、この領域分割
部によって得られた小領域の属性を領域識別部によって
識別し、上記小領域における画像情報に対して上記識別
の結果に応じた処理を実施した後にこの処理後の画像情
報を外部装置に入力する自動文書入力装置において、上
記領域分割部は、上記文書画像領域における特徴量を抽出する範囲を指定
する窓を上記文書画像領域上に設定すると共に、上記窓
を所定の手順によって所定の方向に移動させて上記文書
画像領域の総てを上記窓によって走査する窓設定部と、上記窓設定部によって上記文書画像領域上を移動される
窓内の画像情報の特徴量を所定の手順によって抽出する
特徴量抽出部と、上記特徴量抽出部によって抽出された上記窓内の画像情
報の特徴量に基づいて、上記窓内に設けられた判定区域
は上記文書画像領域を小領域に分割する際における領域
分割候補区域であるか否かを識別して、上記文書画像領
域を分割する領域分割ニューラルネットワークと、上記領域分割ニューラルネットワークによって識別され
た領域分割候補区域で囲まれた領域を一つの小領域とし
て確定する小領域確定部を備えたことを特徴とする自動
文書入力装置。
（２）請求項１に記載の自動文書入力装置において、上記窓設定部、特徴量抽出部および領域分割ニューラル
ネットワークを互いに対応付けて複数組設けると共に、複数の領域分割ニューラルネットワークによる識別結果
を一つに統合する領域分割候補区域統合部を備えて、夫々の窓設定部によって上記文書画像領域上に設定され
た窓内の画像情報から各窓設定部に対応付けられた特徴
量抽出部によって個別に抽出された各窓毎の特徴量に基
づいて、各窓内に設けられた判定区域が領域分割候補区
域であるか否かを各特徴量抽出部に対応付けられた領域
分割ニューラルネットワークによって個別に識別し、上記小領域確定部は、上記領域分割候補区域統合部によ
って一つに統合された識別結果に基づいて上記小領域を
確定することを特徴とする自動文書入力装置。
（３）請求項２に記載の自動文書入力装置において、上記複数の窓設定部は、夫々文書画像の特性に応じた形
状の窓を上記文書画像領域上に設定すると共に、この設
定した窓を上記特性が上記特徴量に良く表れるような方
向へ走査することを特徴とする自動文書入力装置。
（４）請求項１乃至請求項３のいずれかに記載の自動文
書入力装置において、上記領域分割ニューラルネットワークにおける出力層の
各ノードからの出力値を遅延素子を介して自ノードにフ
ィートバックするように成したことを特徴とする自動文
書入力装置。