JPH0528301A

JPH0528301A - 文書認識装置

Info

Publication number: JPH0528301A
Application number: JP3205597A
Authority: JP
Inventors: Noboru Shimizu; 昇清水
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1991-07-23
Filing date: 1991-07-23
Publication date: 1993-02-05

Abstract

(57)【要約】【目的】文字の種類を誤りなく自動的に認識し、文字
認識の際に操作者が文字の種類を切り分ける負荷を軽減
すると共に、無駄な動作をさせないようにした。【構成】文書画像を認識する文書認識装置におけるマ
ーク取り出し手段は、文書画像内の文字行に対して、連
結した黒画素塊を取り出し、マーク解析手段により前記
黒画素塊の最下辺の座標における黒画素塊の分布を解析
する。そして、文字識別手段は、前記マーク解析手段に
より解析された黒画素塊の分布に基づいて文字の種類を
識別する。また、マークの解析は、黒画素塊の外接矩形
間の接触関係を取り出し、その接触関係にある個数を計
数したり、あるいは黒画素塊の外接矩形の縦方向または
横方向のマークの個数を計数することによって行える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、紙に印刷された文書に
異なった文字の種類（たとえば、「アルファベット」と
「日本文字」、「英文字以外の国の文字」と「日本文
字」、「漢字」と「平仮名」、「漢字」と「片仮名」、
「漢字」と「数字」等）が混在している場合、文字の種
類を認識する文書認識装置に関するものである。なお、
本明細書では、上記「アルファベット」、「日本文
字」、「英文字以外の国の文字」、「漢字」、「平仮
名」、「片仮名」、「数字」等を「文字の種類」という

【０００２】

【従来の技術】近年、紙に印刷されている文書中の文字
や図形を認識し、これらをワープロ等の文書編集装置等
に入力できる文書認識装置に関する研究が行われてい
る。文字認識技術は、その中の１要素技術であり、古く
から研究が行われている。英文のみを対象とした英文用
文字認識装置と、英文字と日本文字との両方を認識対象
としている和文用文字認識装置とを比較した場合、英文
字のみの認識を対象とすれば、明らかに英文用文字認識
装置の方が認識率が優れている。これには、次のような
理由が上げられる。すなわち、英文字は、文字種が
少ない、日本文字のように左右に分離した要素で構
成されている文字（たとえば、日本文字の「化」は、
「イ」と「ヒ」の要素で構成されている。）がなく、文
字切り出しに誤りがない（たとえば、日本文字の「化」
は、「イ」と「ヒ」とを区別して切り出される恐れがあ
る。）。また、「ＲｅｃｏｇｎｉｔｉｏｎＰｒｏｃｅ
ｓｓｉｎｇｆｏｒＭｕｌｔｉｌｉｎｇｕａｌＤｏ
ｃｕｍｅｎｔｓＡ．ＬａｗｒｅｎｃｅＳｐｉｔｚ
ＥＰ９０」によると、黒画素塊の分布特徴により英／日
文字の識別を行っているが、この処理は複雑で効率が悪
く、規則正しく並んでいる英文字を日本文字と誤って判
別する場合がある。

【０００３】

【発明が解決しようとする課題】しかし、実際の文書に
おいて、英文字と日本文字とが混在しており、このよう
な場合、文書認識装置を操作する操作者が文書内を英文
字と日本文字とに切り分けて、英文字を英文用文字認識
装置で、日本文字を和文用文字認識装置でそれぞれ認識
することはたいへん煩雑である。また、英文字および日
本文字の全てを和文用文字認識装置で認識することは、
英文字の箇所を認識する際に、良い認識率を得ることが
できない。そこで、英文字および日本文字が混在してい
る１つの対象文書を、英文用および和文用認識装置を用
いて、認識の確からしさの高い方を採用することは容易
に考えられる。この方法は常に２つの文字認識装置の結
果のうち１つを使用せず、その使用していない認識文字
を出力している文字認識装置は、無駄に作動しているこ
とになる。

【０００４】本発明は、以上のような問題を解決するた
めのもので、文字の種類を誤りなく認識し、文字認識の
際に操作者が文字の種類を切り分ける負荷を軽減すると
共に、無駄な動作をさせないようにした文書認識装置を
提供することを目的とするものである。

【０００５】

【課題を解決するための手段】

（第１発明）前記目的を達成するために、本発明の文書
画像を認識する文書認識装置は、文書画像内の文字行に
対して、連結した黒画素塊を取り出すマーク取り出し手
段（図１の４１）と、当該マーク取り出し手段（４１）
によって取り出された黒画素塊の最下辺の座標を取り出
し、その最下辺の座標における黒画素塊の分布を解析す
るマーク解析手段（図１の４２）と、当該マーク解析手
段（４２）により解析された黒画素塊の分布に基づいて
文字の種類を識別する文字種識別手段（図１の４３）と
から構成される。

【０００６】（第２発明）また、本発明の文書画像を認
識する文書認識装置は、文書画像内の文字行に対して、
連結した黒画素塊を取り出すマーク取り出し手段（図７
の４１）と、当該マーク取り出し手段（４１）によって
取り出された黒画素塊の外接矩形間の接触関係を取り出
し、その接触関係にある個数を計数するマーク接触解析
手段（図７の４２′）と、当該マーク接触解析手段（４
２′）により取り出された接触関係を持つ黒画素塊の個
数に基づいて文字の種類を識別する文字種識別手段（図
７の４３）とから構成される。

【０００７】（第３発明）また、本発明の文書画像を認
識する文書認識装置は、文書画像内の文字行に対して、
連結した黒画素塊を取り出すマーク取り出し手段（図１
１および図１２の４１）と、当該マーク取り出し手段
（４１）によって取り出された黒画素塊の外接矩形の縦
方向または横方向のマークの個数を計数するマーク周辺
分布計数手段（図１１の４２″、および図１２の４２
１、４２２）と、当該マーク周辺分布計数手段（４
２″、４２１、４２２）によって計数されたマークの個
数に基づいて文字の種類を識別する文字種識別手段（図
１１の４３、および図１２の４３１、４３２）とから構
成される。

【０００８】（第４発明）さらに、本発明は、上記構成
の文書認識装置に加えて、前記文字種識別手段（図１、
図７、図１１の４３、および図１２の４３１、４３２）
によって識別された文字行に対して、判別不可能および
誤判別された文字行を、その文字行の位置関係から文字
の種類を識別する文書解析手段（図１の５）を有するよ
うに構成されている。

【０００９】

【作用】

（第１発明）マーク取り出し手段では、文書画像におけ
る文字を認識する対象の文字行から連結した黒画素塊が
取り出される。マーク解析手段では、前記取り出された
黒画素塊の最下辺の座標における黒画素塊の分布を解析
する。この黒画素塊の分布を解析した結果に基づいて、
文字種識別手段では、文字の種類、たとえば、英文字と
日本文字、の特徴から文字の種類を識別する。

【００１０】（第２発明）マーク接触解析手段では、前
記マーク取り出し手段により取り出された黒画素塊の外
接矩形間の接触関係を調べ、その接触している個数を計
数することにより、文字の種類を識別する。たとえば、
英文字と日本文字に対する外接矩形を調べ、一つの文字
で外接矩形が接触している黒画素塊の個数を計数する。
英文字と日本文字との特徴の相違から前記黒画素塊の接
触する個数を計数することによって文字の種類が識別で
きる。

【００１１】（第３発明）マーク周辺分布計数手段で
は、前記マーク取り出し手段により取り出された黒画素
塊の外接矩形の縦方向または横方向のマークの個数を計
数することにより、文字の種類を識別する。たとえば、
英文字と日本文字に対する外接矩形を調べ、Ｘ軸上およ
びＹ軸上のマークの個数を計数する。英文字と日本文字
との特徴の相違から前記黒画素塊の個数を計数すること
によって文字の種類が識別できる。

【００１２】（第４発明）また、前記文字種識別手段で
文字の種類が判別不可能となった行、あるいは誤判別さ
れた行は、文書解析手段により文字行の位置関係、たと
えば文字行の前後関係を調べることによって修正するこ
とが可能である。

【００１３】以上のように、本発明によれば、文字の種
類が混在した文書でも、文字認識の対象となる文字の種
類を自動的に識別できるので、それぞれの文字に合った
文字認識装置で文字の種類認識率を高くすると共に、文
字認識装置を操作する際に、操作者が文字の種類に対す
る切り分けを行う負担を軽減する。

【００１４】

【実施例】本発明の一実施例として、日本文字と英文字
とが混在する文書において、文字認識の対象となる文字
行が日本文字であるか英文字であるかを自動的に判定す
る場合を説明する。図１は本発明の一実施例における文
書認識装置の主要部のブロック構成図である。図２は本
発明の一実施例における文書認識装置のブロック構成図
である。図１において、符号４は後述する文字認識装置
における英／日判定部、５は文書解析部である。英／日
判定部４は、文書画像内の文字行に対して、連結した黒
画素塊を取り出すマーク取り出し部４１と、当該マーク
取り出し部４１によって取り出された黒画素塊の最下辺
の座標を取り出し、その座標における黒画素塊の分布を
解析するマーク解析部４２と、当該マーク解析部４２で
解析された黒画素塊の分布に基づいて英文字あるいは日
本文字であることを識別する英／日識別部４３とから構
成される。

【００１５】図２に示す文書認識装置は、紙に印刷され
た文書を画像データとして読み取る、たとえば、イメー
ジスキャナのような画像入力部１と、当該画像入力部１
で入力した画像データを処理するために一時格納するイ
メージメモリ２と、当該イメージメモリ２に格納されて
いる文書の画像データから所定の文字行を抽出する文字
行抽出部３と、当該文字行抽出部３によって抽出された
文字行が英文字であるかあるいは日本文字であるかを判
定する英／日判定部４と、当該英／日判定部４によって
判定されなかった英文字または日本文字を解析する文書
解析部５と、文字行抽出部３、英／日判定部４、あるい
は文書解析部５等の処理結果を格納する認識結果格納メ
モリ６と、英文字を認識する英文文字認識部（ＯＣＲ：
ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅａｄｅｒ）
７と、日本文字を認識する和文文字認識部（ＯＣＲ）８
と、前記英文または和文文字認識部７、８で認識された
文字行を一時格納する格納部９と、当該格納部９に格納
された文字行を文書ファイルとして格納する文書ファイ
ル格納装置１０と、前記各部を制御する制御／操作部１
１と、文字行あるいは文書ファイル等を表示する表示装
置１１１と、文字認識装置に文字あるいは図形を入力す
るキーボード１１２と、同じくマウス等のポインティン
グデバイス１１３とから構成される。

【００１６】図３および図４を参照しつつ本発明におけ
る文字行の抽出について説明する。図３は本発明の一実
施例における文字行抽出部を説明するための図である。
図４は本発明の一実施例における認識結果格納表の構成
を説明するための図である。紙に印刷された文書は、た
とえば、図示されていないイメージスキャナにより、画
像入力部１からディジタルで入力され、原画像の画像デ
ータがイメージメモリ２に格納される。また、この際に
原画像は、制御／操作部１１によって、表示装置１１１
に表示される。文字認識装置の操作者は、表示装置１１
１における表示を見て、正規の入力画像であるか否かの
確認を行うと共に、正規の入力画像でない場合には、再
入力することも可能である。画像入力部１によって入力
された文書画像の中の文字行が文字行抽出部３により抽
出される。文字行抽出部３では、イメージメモリ２内に
格納されている画像の横軸方向（つまり、文字の並んで
いる行方向）で、図３に示すごとく、黒画素の存在する
頻度を取ったヒストグラムが作成される。なお、図３で
は文字を黒く塗り潰した■形で表されているが、文字に
よって黒画素の密度が異っているものである。このヒス
トグラムにおいて、黒画素が多く集中している山の部分
における上端のＹ座標と幅とは、文字行の上端のＹ座標
と高さに一致する。この文字行が含まれている範囲内の
最も左端と右端に位置する黒画素のＸ座標を取り出すこ
とによって、文字行の左端のＸ座標と幅を決定する。こ
れらの処理によって、文字行のＸ座標、Ｙ座標、幅、高
さが計算される。文字行抽出の結果は、認識結果格納メ
モリ６内の認識結果格納表６１に格納される。すなわ
ち、当該認識結果格納表６１に格納される情報は、文字
行の左上のＸ座標、Ｙ座標、幅、高さであり、それぞれ
の表内の第１、２、３、４列（ｘ、ｙ、ｗ、ｈ）に対応
している。また、この際に文字行を抽出した結果（たと
えば、文字行の矩形枠を原画像上に描画した結果）を制
御／操作部１１を通して、表示装置１１１に表示し、操
作者に対して確認を求め、キーボード１１２やポインテ
ィングデバイス１１３を用いて修正することも可能であ
る。抽出された各々の文字行が英文字（つまり、アルフ
ァベットや数字のみで書かれている行）、または日本文
字（つまり、漢字、ひらがな、カタカナを含んだ行であ
り、英数字を含む場合もある）の行であるかを英／日判
定部４により判定する。

【００１７】図６は本発明の一実施例における英／日本
文字を判定するための処理を行うフローチャートであ
る。図６のフローチャートに従って、英／日判定部４の
処理を説明する。マーク取り出し部４１では、先ず、英
／日文字の判定を行うために十分な文字数があるか否か
を判断するために、文字行の幅が閾値「ａ」（たとえ
ば、全文字行の幅の平均値における８０％以上の長さ）
以上であるか否かを調べる（ステップ６０１）。文字の
幅が閾値「ａ」未満の場合は、対象となっている文字行
の直前に文字行があるか否かを調べる（ステップ６０
２）。対象となっている文字行の直前に文字行がある場
合、直前の文字行の種類を認識結果格納表６１の英／日
欄から調べ、その直前の文字行の文字の種類（英／日）
と同一にする（ステップ６０３）。認識結果格納表６１
における英／日欄の記載事項が英／日判定部４の判定結
果となっている。また、文字認識の対象となる文字行が
先頭で、その直前に文字行がない場合、または段落のよ
うに先頭の文字と直前の文字行とが離れている場合は、
認識結果格納表６１の英／日欄に「？」（英／日判別不
可能）記号を記載しておく（ステップ６０４）。なお、
この英／日文字判別不可能の文字行は、次の文書解析部
５によって、英／日文字の決定が行われる。

【００１８】ステップ６０１において、文字認識の対象
となる文字行の幅が閾値「ａ」以上ある場合は、次のよ
うな処理を行う。文字行抽出部３によって抽出された文
字行からマークを取り出すための処理が行われる（ステ
ップ６０５）。マークを取り出す方法は、原画像の１文
字行の範囲内でラベル付け（「ディジタル画像処理」
Ｒｏｓｅｎｆｅｌｄ、Ｋａｋ著、長尾真監訳第３６０
〜３６１頁に記載されている方法を用いる）を行うこと
であり、その結果によってマークの左上座標、幅、高さ
が得られる。次に、マーク解析部４２では、個々のマー
クの最も下に位置する黒画素のＹ座標を求める（ステッ
プ６０６）。そして、マークのＹ座標の分布を求める
（ステップ６０７）。図５は本発明の一実施例における
日本語と英語の文字行内のマークの最下辺のＹ座標の分
布の例を示す図である。英／日識別部４３では、文字行
における最下位に位置する黒画素のＹ座標の分布で、一
番高い山となっている部分、すなわち、黒画素数が一番
多い箇所を求める（ステップ６０８）。そして、この山
になっている部分に含まれているマークの度数が文字行
内の全てのマークの数に対する割合として閾値「ｂ」以
上であるか否かを調べる（ステップ６０９）。上記マー
クの度数の割合が閾値「ｂ」以上であれば、英文字行で
あると識別し（ステップ６１０）、上記マークの度数の
割合が閾値「ｂ」未満であれば、日本文字行であると識
別する（ステップ６１１）。日本文字は、分離した複数
のマークから一つの文字を構成する場合が多く、マーク
の最下辺に位置するＹ座標は、広い範囲で分布してい
る。これに対して、英文字は、分離した複数のマークか
ら一つの文字を構成する場合（たとえば、「ｉ」、
「ｊ」）が少なく、マークの最下辺に位置するＹ座標
は、狭い範囲に集中している。英／日識別部４３は、上
記のような英文字と日本文字との特徴の差を利用してい
る。そして、それぞれの文字行に対する英／日識別結果
は、認識結果格納表６１内の英／日欄に「Ｅ」（英
語）、「Ｊ」（日本語）の記号が記入される。

【００１９】文書解析部５では、英／日判別不可能行と
誤って判別された行の修正を行う。認識結果格納表６１
内の英／日欄内で「？」記号が記入されている行を検索
する。そして、文字認識の対象としている文字行の種類
をその直後の文字行の種類（英／日）と同一にする。次
に、対象としている前後の文字行は、同一種類の文字で
あるが、この文字行が違う場合（誤って判別している場
合が多い）は、その前後の文字行と同一の文字種類にす
る。認識結果格納表６１の情報に従って、イメージメモ
リ２内に入力されていた原画像の英文字行は、英文文字
認識部７で認識され、日本文字行は和文文字認識部８で
認識される。そして、これらの認識結果は、認識結果格
納表６１内の該当する文字行の認識結果欄に格納され
る。格納部９では、認識結果格納表６１内の認識結果を
利用して文書が作成され、その結果作成された文書ファ
イルは、文書ファイル格納装置１０に格納される。

【００２０】上記に本発明の一実施例を示したが、次の
ような処理に変更することも可能である。すなわち、（１）上記実施例の英／日識別部４３では、マーク頻度
の最も多い山を抽出しているが、隣の座標におけるマー
ク頻度を互いに引算して、その差の一番大きい所、すな
わち、先鋭度の最も高い山を抽出するように変更するこ
とによって、英／日文字を識別することができる。（２）認識結果格納表６１に、マークの分布内で最も高
い山に含まれている度数と全体におけるマーク分布の平
均度数との比率を格納できる欄を設け、文書解析部５の
処理の際に、この比率を利用して修正を行うようにする
ことができる。たとえば、文字認識の対象となる文字行
の前後は、同一種類の文字であるが、その対象となる文
字行の文字の種類が違うと判定された場合、無条件に対
象となる文字行の文字の種類（英／日）を変更せずに、
前記比率がある閾値より低い場合のみ、対象となる文字
行の文字の種類を変更するようにする。（３）英／日文字の識別条件を文字行の下辺におけるマ
ーク分布とマーク頻度の一番高い山の位置が一致するか
否かで識別することができる。英／日識別部４３におい
て、一致すると判断した場合は日本文字行であり、一致
しないと判断した場合は英文字行である。これは、日本
文字の場合、文字の下辺と文字行の下辺とが一致するの
に対して、英文字の場合、「ｇ」、「ｊ」、「ｐ」、
「ｑ」、「ｙ」のように文字の下辺と文字行の下辺とが
一致しないからである。また、実施例とこの方法とを組
み合わせた識別方法なども実施できる。

【００２１】次に、本発明における他の実施例を説明す
る。図７は本発明の他の実施例における文書認識装置の
主要部のブロック構成図である。図８は本発明の他の実
施例における英文字行内におけるマークの外接矩形間の
接触関係を示す図である。図９は本発明の他の実施例に
おける日本文字行内におけるマークの外接矩形間の接触
関係を示す図である。図７と図１に示された英／日判定
部４の相違は、マーク解析部４２の代わりにマーク接触
解析部４２′とした点にある。すなわち、マーク接触解
析部４２′では、マークの外接矩形間の接触関係を求
め、その接触している個数を計数する。たとえば、図８
および図９に示すマークの外接矩形の接触関係におい
て、「１」は接触関係にあることを表し、「０」は接触
関係にないことを表している。マークの外接矩形間の接
触関係は、１つのマークたとえば、図８および図９にお
けるマーク「Ａ」に注目し、その左上座標、幅、高さか
ら形成される矩形領域（外接矩形）Ｂ内に位置するもの
と、他のマークたとえば、「Ｃ」の外接矩形Ｄ内に位置
するものとを、次のような突き合わせを行うことによっ
て求めることができる。（１）外接矩形Ｄの左上座標が外接矩形Ｂの領域内にあ
れば、マーク「Ａ」とマーク「Ｃ」とは接触している。（２）外接矩形Ｄの右上座標（左上座標と幅から計算す
る）が外接矩形Ｂの領域内にあれば、マーク「Ａ」とマ
ーク「Ｃ」とは接触している。（３）外接矩形Ｄの左下座標（左上座標と高さから計算
する）が外接矩形Ｂの領域内にあれば、マーク「Ａ」と
「Ｃ」とは接触している。（４）外接矩形Ｄの右下座標（左上座標と幅と高さから
計算する）が外接矩形Ｂの内にあれば、マーク「Ａ」と
マーク「Ｃ」とは接触している。上記の処理は、マーク「Ａ」とその他全てのマークとの
間でそれぞれ行われる。そして、マーク間に接触関係の
あることが判明した時点で、マーク「Ａ」との処理は終
了する。また、マーク「Ｃ」は、マーク「Ａ」と接触関
係があると既に判定されている場合、以後のマーク
「Ｃ」との接触判断処理を行わないようにする。全ての
マークに対して接触判断処理が終了した時点で、外接矩
形間で接触関係を持っているマークの個数を計数する。
たとえば、図８における英文字では、「ｉ」だけがマー
ク個数が「２」である。しかし、接触関係にあるマーク
は無く、マークの接触関係は「０」が示されている。こ
れに対して、図９における日本文字では、「包」はマー
ク個数が「２」である。そして、互いに接触関係がある
ため、マークの接触関係は両方のマーク共「１」が示さ
れている。同じく「含」は、マーク個数が「１」で、接
触関係が「０」、「関」はマーク個数が「３」で、接触
関係が「１」であることを示している。

【００２２】図１０は本発明の他の実施例における英／
日本文字を判定するための処理を行うフローチャートで
ある。図１０におけるフローチャートにおいて、ステッ
プ７０１のマーク取り出しまで、図６におけるステップ
６０１と同じであるから、その説明は省略する。マーク
取り出し部４１により取り出されたマークから、マーク
接触解析部４２′により、マーク間の接触関係を抽出し
（ステップ７０２）、マークの接触関係にある個数が計
数され、その計数された個数が閾値「ｂ」個以上である
か否かを調べる（ステップ７０３）。マークの接触関係
にある個数が閾値「ｂ」以上であれば、日本文字の行で
あると識別し、図４に示す認識結果格納表６１内の英／
日欄に「Ｊ」（日本語）の記号を記入する。マークの接
触関係にある個数が閾値「ｂ」個未満の場合、文字行の
幅が閾値「ａ」（たとえば、全文文字行の幅平均値の８
０％以上の長さ）以上であるか否かを調べる（ステップ
７０５）。文字行の幅が前記閾値「ａ」以上の場合は、
英文字行であると識別し、図４に示す認識結果格納表６
１内の英／日欄に「Ｅ」（英語）の記号を記入する。ス
テップ７０５において、文字行の幅が前記閾値「ａ」未
満の場合、当該文字行の直前に文字行があるか否かを調
べる（ステップ７０７）。当該文字行の直前に文字行が
ある場合、当該文字行の種類は、その直前にある文字行
の種類（英／日）と同一にする（ステップ７０８）。そ
して、当該文字行の直前にある文字行の種類は、図４に
示す認識結果格納表６１における直前の文字行英／日欄
に記入されている事項をコピーする。当該文字行の直前
に文字行がない場合（すなわち、先頭の文字行の場
合）、または当該文字行の直前に文字行が離れて存在す
る場合（段落の先頭の場合）は、図４に示す認識結果格
納表６１内の英／日欄に「？」（英／日判別不可能）の
記号を記入しておく（ステップ７０９）。この英／日文
字の判別不可能な文字行は、次の文書解析部５によっ
て、英／日文字の決定が行われる。

【００２３】上記のように接触関係にあるマークの個数
によって英／日文字の識別を行っているのは、日本文字
の場合、分離した複数のマークから一つの文字が構成さ
れる。また、日本文字におけるマークの外接矩形は、他
のマークと接触関係にある場合が多い。たとえば、
「で」という文字は、「て」というマークが濁点である
２つのマーク「、」を包含している。すなわち、「て」
というマークの外接矩形の中に濁点というマークが全て
入る。これに対して、英文字の場合、分離されたマーク
から構成されていることは少ない。分離されたマークと
して存在するのは、「ｉ」、「ｊ」だけである。また、
英文字は、マークの外接矩形間の接触関係も少ない。本
発明は、英文字と日本文字との相違点に着目したもので
ある。

【００２４】上記の本発明の他の実施例を示したが、次
のような処理に変更することも可能である。すなわち、（１）上記マーク接触解析部４２′では、全てのマーク
の外接矩形間の接触関係を調べているが、閾値「ｂ」以
上の接触関係にある個数を計数した時点で接触関係の調
査を止めるようにすることは可能である。（２）また、上記マーク接触解析部４２′では、マーク
の外接矩形に接触関係が「ある／なし」の１または０と
して計数しているが、これを接触しているマーク個数と
することも可能である。（３）上記の英／日識別部４３では、外接矩形が接触し
ているマークの個数のみで英／日の識別をしているが、
１行内に含まれる全てのマークの個数と外接矩形が接触
しているマークの個数との比率によって英／日文字の識
別をすることも可能である。

【００２５】さらに、本発明における他の実施例を説明
する。図１１および図１２は本発明の他の実施例におけ
る文書認識装置のブロック構成図である。図１１および
図１２と図１に示す英／日判定部４と相違するところ
は、図１に示すマーク解析部４２の代わりに図１１に示
すマーク周辺分布計数部４２″、および図１２に示すＸ
座標周辺分布計数部４２１とＹ座標周辺分布計数部４２
２とを設けた点にある。また、図１１と図１２との相違
点は、図１１のマーク周辺分布計数部４２″は、Ｘ座標
あるいはＹ座標のいずれか一方であるのに対して、図１
２は上記両者を採用している点である。したがって、図
１２について説明すれば図１１の説明は省略できる。す
なわち、英／日判定部４は、マークを取り出すマーク取
り出し部４１と、マークの外接矩形のＸ座標上の周辺分
布を求めるＸ座標周辺分布計数部４２１と、当該Ｘ座標
周辺分布計数部４２１によって求まったＸ座標の周辺分
布の結果より英／日文字の識別を行う英／日識別部４３
１と、Ｙ座標上の周辺分布を求めるＹ座標周辺分布計数
部４２２と、当該Ｙ座標周辺分布計数部４２２によって
求まったＹ座標の周辺分布の結果より英／日文字の識別
を行う英／日識別部４３２とから構成される。

【００２６】次に、上記実施例における英／日判定部４
の処理を図１２ないし図１５を参照しつつ説明する。図
１３は本発明の他の実施例における英文字行内における
マークのＸ、Ｙ座標軸上の分布の例を示す図である。図
１４は本発明の他の実施例における日本文字行内におけ
るマークのＸ、Ｙ座標軸上の分布の例を示している図で
ある。図１５は本発明の他の実施例における英／日本文
字を判定するための処理を行うフローチャートである。
ステップ８０１におけるマーク取り出しに関しては、前
記各実施例と同じであるから説明を省略する。Ｘ座標周
辺分布計数部４２１では、マークの外接矩形のＸ座標上
での個数（縦に重なっているマークの数）を求め、Ｘ座
標軸上の周辺分布図を作成する（ステップ８０２）。た
とえば、Ｘ軸上の一定間隔毎の位置において、図１３お
よび図１４に示す文字を構成している各マークを囲んで
いる外接矩形（「言」、「語」は外接矩形と黒画素塊が
一致している）の個数を計数して、Ｘ軸上のマークの外
接矩形の周辺分布図を作成する。英／日識別部４３１の
処理では、Ｘ座標周辺分布計数部４２１に計数されたマ
ークの外接矩形のＸ座標上の個数が閾値「ｂ」個以上の
領域があるか否かを調べる（ステップ８０３）。マーク
の外接矩形の個数がＸ軸上に閾値「ｂ」個以上の領域が
あれば、日本文字であると識別し、認識結果格納表６１
（図４参照）内の英／日欄に「Ｊ」（日本語）の記号を
記入する（ステップ８０４）。前記閾値「ｂ」の値とし
て、たとえば、「３」を用いている。図１４に示す
「言」のマーク個数は「５」で、英文字のマーク個数は
最大、「ｉ」または「ｊ」の「２」である。したがっ
て、前記閾値を「３」にしている。

【００２７】ステップ８０３において、マークの個数が
Ｘ軸上に閾値「ｂ」個未満の場合、文字行の幅が閾値
「ａ」（たとえば、全文字行の幅の平均値における８０
％以上の長さ）以上であるか否かを調べる（ステップ８
０５）。文字行の幅が閾値「ａ」以上の場合は、Ｙ座標
周辺分布計数部４２２において、Ｘ座標周辺分布計数部
４２１の処理と同様にＹ軸上のマークの外接矩形の個数
（横に重なっているマークの数）を求め、周辺分布図を
作成する（ステップ８０６）。この周辺分布図からマー
ク個数のピーク数を計数する。たとえば、隣接するマー
クの個数どうしの差が正から負、または負から正に変化
する点を計数する。図１３に示す英文字のピーク数は
「１」であり、図１４に示す日本文字のピーク数は
「５」である。そこで、ピーク数がある閾値「ｃ」未満
であるか否かを調べる（ステップ８０７）。ピーク数が
前記閾値「ｃ」未満であるならば、英文字であると識別
し、認識結果格納表６１（図４参照）内の英／日欄に
「Ｅ」（英語）の記号を記入する（ステップ８０８）。
マーク個数のピーク数が閾値「ｃ」以上の場合は、日本
文字であると識別し、認識結果格納表６１内の英／日欄
に「Ｊ」（日本語）の記号を記入する（ステップ８０
９）。日本文字は、多くのマークから構成されているた
め、細かいピークが多く現れるのに対して、英文字の多
くは、１つのマークで構成されているため、ピークが少
ない。

【００２８】ステップ８０５において、文字行の幅が閾
値「ａ」未満の場合、直前に文字行があるか否かを調べ
る（ステップ８１０）。ステップ８１０ないしステップ
８１２の処理は、図１０におけるステップ７０７ないし
ステップ７０９の処理と同じであるから説明を省略す
る。

【００２９】上記に本発明の他の実施例を示したが、次
のような処理に変更することも可能である。（１）本実施例のＹ座標周辺分布計数部４２２では、ピ
ークの個数を計数しているが、ピークの代わりに分布の
平らなところ（隣との差が０である箇所）の幅を取り出
すことにより、英／日文字を識別することも可能であ
る。（２）本実施例では、Ｘ座標周辺分布とＹ座標周辺分布
とを利用しているがどちらか片方のみで、英／日文字を
識別することも可能である。（３）本実施例のＸ座標周辺分布を利用する英／日識別
部４３１では、分布のピーク時のマーク数のみを特徴と
して取り出しているが、マーク数の最大値や平均値また
は分散を特徴として取り出すことも可能である。また、実施例においては、英／日文字の識別について記
述したが、各々異なる文字どうしが各々異なる特徴量を
持つものならば、それらの異なる文字どうしも識別可能
であることはいうまでもない。

【００３０】

【発明の効果】以上述べたように、本発明によれば、文
字行に対して自動的に文字の種類を識別できるので、そ
れぞれ専用の文字認識装置で処理することができ、総合
的な認識率を向上させることができる。そして、文字認
識装置を操作する際に、操作者が文字の種類を切り分け
る必要がないので、そのための負担を軽減できる。ま
た、文書解析手段により、文字の種類が判別不可能とな
った行や誤判別された行を修正することができるので、
より認識率を向上させることができる。

【図面の簡単な説明】

【図１】本発明の一実施例における文書認識装置の主
要部のブロック構成図である。

【図２】本発明の一実施例における文書認識装置のブ
ロック構成図である。

【図３】本発明の一実施例における文字行抽出部を説
明するための図である。

【図４】本発明の一実施例における認識結果格納表の
構成を説明するための図である。

【図５】本発明の一実施例における日本語と英語の文
字行内のマークの最下辺のＹ座標の分布の例を示す図で
ある。

【図６】本発明の一実施例における英／日本文字を判
定するための処理を行うフローチャートである。

【図７】本発明の他の実施例における文書認識装置の
主要部のブロック構成図である。

【図８】本発明の他の実施例における英文字行内にお
けるマークの外接矩形間の接触関係を示す図である。

【図９】本発明の他の実施例における日本文字行内に
おけるマークの外接矩形間の接触関係を示す図である。

【図１０】本発明の他の実施例における英／日本文字
を判定するための処理を行うフローチャートである。

【図１１】本発明の他の実施例における文書認識装置
のブロック構成図である。

【図１２】本発明の他の実施例における文書認識装置
のブロック構成図である。

【図１３】本発明の他の実施例における英文字行内に
おけるマークのＸ、Ｙ座標軸上の分布の例を示す図であ
る。

【図１４】本発明の他の実施例における日本文字行内
におけるマークのＸ、Ｙ座標軸上の分布の例を示してい
る図である。

【図１５】本発明の他の実施例における英／日本文字
を判定するための処理を行うフローチャートである。

【符号の説明】

１・・・画像入力部、２・・・イメージメモリ、３・・
・文字行抽出部、４・・・英／日判定部、５・・・文書
解析部、６・・・認識結果格納メモリ、７・・・英文文
字認識部、８・・・和文文字認識部、９・・・格納部、
１０・・・文書ファイル格納装置、１１・・・制御／操
作部、４１・・・マーク取り出し部、４２・・・マーク
解析部、４２′・・・マーク接触解析部、４２″・・・
マーク周辺分布計数部、４３・・・英／日識別部、４２
１・・・Ｘ座標周辺分布計数部４３１・・・英／日識別部、４２２・・・Ｙ座標周辺分
布計数部、４３２・・・英／日識別部、

Claims

【特許請求の範囲】

【請求項１】文書画像を認識する文書認識装置におい
て、文書画像内の文字行に対して、連結した黒画素塊を取り
出すマーク取り出し手段と、当該マーク取り出し手段によって取り出された黒画素塊
の最下辺の座標を取り出し、その最下辺の座標における
黒画素塊の分布を解析するマーク解析手段と、当該マーク解析部手段により解析された黒画素塊の分布
に基づいて文字の種類を識別する文字種識別手段と、を備えていることを特徴とする文書認識装置。
【請求項２】文書画像を認識する文書認識装置におい
て、文書画像内の文字行に対して、連結した黒画素塊を取り
出すマーク取り出し手段と、当該マーク取り出し手段によって取り出された黒画素塊
の外接矩形間の接触関係を取り出し、その接触関係にあ
る個数を計数するマーク接触解析手段と、当該マーク接触解析手段により取り出された接触関係を
持つ黒画素塊の個数に基づいて文字の種類を識別する文
字種識別手段と、を備えていることを特徴とする文書認識装置。
【請求項３】文書画像を認識する文書認識装置におい
て、文書画像内の文字行に対して、連結した黒画素塊を取り
出すマーク取り出し手段と、当該マーク取り出し手段によって取り出された黒画素塊
の外接矩形の縦方向または横方向のマークの個数を計数
するマーク周辺分布計数手段と、当該マーク周辺分布計数手段によって計数されたマーク
の個数に基づいて文字の種類を識別する文字種識別手段
と、を備えていることを特徴とする文書認識装置。
【請求項４】前記文字種識別手段によって識別された
文字行に対して、判別不可能および誤判別された文字行
を、その文字行の位置関係から文字の種類を識別する文
書解析手段を備えていることを特徴とする請求項１ない
し請求項３の文書認識装置。