JPH0528301A - 文書認識装置 - Google Patents

文書認識装置

Info

Publication number
JPH0528301A
JPH0528301A JP3205597A JP20559791A JPH0528301A JP H0528301 A JPH0528301 A JP H0528301A JP 3205597 A JP3205597 A JP 3205597A JP 20559791 A JP20559791 A JP 20559791A JP H0528301 A JPH0528301 A JP H0528301A
Authority
JP
Japan
Prior art keywords
character
mark
english
japanese
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3205597A
Other languages
English (en)
Inventor
Noboru Shimizu
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3205597A priority Critical patent/JPH0528301A/ja
Publication of JPH0528301A publication Critical patent/JPH0528301A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 文字の種類を誤りなく自動的に認識し、文字
認識の際に操作者が文字の種類を切り分ける負荷を軽減
すると共に、無駄な動作をさせないようにした。 【構成】 文書画像を認識する文書認識装置におけるマ
ーク取り出し手段は、文書画像内の文字行に対して、連
結した黒画素塊を取り出し、マーク解析手段により前記
黒画素塊の最下辺の座標における黒画素塊の分布を解析
する。そして、文字識別手段は、前記マーク解析手段に
より解析された黒画素塊の分布に基づいて文字の種類を
識別する。また、マークの解析は、黒画素塊の外接矩形
間の接触関係を取り出し、その接触関係にある個数を計
数したり、あるいは黒画素塊の外接矩形の縦方向または
横方向のマークの個数を計数することによって行える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙に印刷された文書に
異なった文字の種類(たとえば、「アルファベット」と
「日本文字」、「英文字以外の国の文字」と「日本文
字」、「漢字」と「平仮名」、「漢字」と「片仮名」、
「漢字」と「数字」等)が混在している場合、文字の種
類を認識する文書認識装置に関するものである。なお、
本明細書では、上記「アルファベット」、「日本文
字」、「英文字以外の国の文字」、「漢字」、「平仮
名」、「片仮名」、「数字」等を「文字の種類」という
【0002】
【従来の技術】近年、紙に印刷されている文書中の文字
や図形を認識し、これらをワープロ等の文書編集装置等
に入力できる文書認識装置に関する研究が行われてい
る。文字認識技術は、その中の1要素技術であり、古く
から研究が行われている。英文のみを対象とした英文用
文字認識装置と、英文字と日本文字との両方を認識対象
としている和文用文字認識装置とを比較した場合、英文
字のみの認識を対象とすれば、明らかに英文用文字認識
装置の方が認識率が優れている。これには、次のような
理由が上げられる。すなわち、英文字は、 文字種が
少ない、 日本文字のように左右に分離した要素で構
成されている文字(たとえば、日本文字の「化」は、
「イ」と「ヒ」の要素で構成されている。)がなく、文
字切り出しに誤りがない(たとえば、日本文字の「化」
は、「イ」と「ヒ」とを区別して切り出される恐れがあ
る。)。また、「Recognition Proce
ssing for Multilingual Do
cuments A.Lawrence Spitz
EP90」によると、黒画素塊の分布特徴により英/日
文字の識別を行っているが、この処理は複雑で効率が悪
く、規則正しく並んでいる英文字を日本文字と誤って判
別する場合がある。
【0003】
【発明が解決しようとする課題】しかし、実際の文書に
おいて、英文字と日本文字とが混在しており、このよう
な場合、文書認識装置を操作する操作者が文書内を英文
字と日本文字とに切り分けて、英文字を英文用文字認識
装置で、日本文字を和文用文字認識装置でそれぞれ認識
することはたいへん煩雑である。また、英文字および日
本文字の全てを和文用文字認識装置で認識することは、
英文字の箇所を認識する際に、良い認識率を得ることが
できない。そこで、英文字および日本文字が混在してい
る1つの対象文書を、英文用および和文用認識装置を用
いて、認識の確からしさの高い方を採用することは容易
に考えられる。この方法は常に2つの文字認識装置の結
果のうち1つを使用せず、その使用していない認識文字
を出力している文字認識装置は、無駄に作動しているこ
とになる。
【0004】本発明は、以上のような問題を解決するた
めのもので、文字の種類を誤りなく認識し、文字認識の
際に操作者が文字の種類を切り分ける負荷を軽減すると
共に、無駄な動作をさせないようにした文書認識装置を
提供することを目的とするものである。
【0005】
【課題を解決するための手段】
(第1発明)前記目的を達成するために、本発明の文書
画像を認識する文書認識装置は、文書画像内の文字行に
対して、連結した黒画素塊を取り出すマーク取り出し手
段(図1の41)と、当該マーク取り出し手段(41)
によって取り出された黒画素塊の最下辺の座標を取り出
し、その最下辺の座標における黒画素塊の分布を解析す
るマーク解析手段(図1の42)と、当該マーク解析手
段(42)により解析された黒画素塊の分布に基づいて
文字の種類を識別する文字種識別手段(図1の43)と
から構成される。
【0006】(第2発明)また、本発明の文書画像を認
識する文書認識装置は、文書画像内の文字行に対して、
連結した黒画素塊を取り出すマーク取り出し手段(図7
の41)と、当該マーク取り出し手段(41)によって
取り出された黒画素塊の外接矩形間の接触関係を取り出
し、その接触関係にある個数を計数するマーク接触解析
手段(図7の42′)と、当該マーク接触解析手段(4
2′)により取り出された接触関係を持つ黒画素塊の個
数に基づいて文字の種類を識別する文字種識別手段(図
7の43)とから構成される。
【0007】(第3発明)また、本発明の文書画像を認
識する文書認識装置は、文書画像内の文字行に対して、
連結した黒画素塊を取り出すマーク取り出し手段(図1
1および図12の41)と、当該マーク取り出し手段
(41)によって取り出された黒画素塊の外接矩形の縦
方向または横方向のマークの個数を計数するマーク周辺
分布計数手段(図11の42″、および図12の42
1、422)と、当該マーク周辺分布計数手段(4
2″、421、422)によって計数されたマークの個
数に基づいて文字の種類を識別する文字種識別手段(図
11の43、および図12の431、432)とから構
成される。
【0008】(第4発明)さらに、本発明は、上記構成
の文書認識装置に加えて、前記文字種識別手段(図1、
図7、図11の43、および図12の431、432)
によって識別された文字行に対して、判別不可能および
誤判別された文字行を、その文字行の位置関係から文字
の種類を識別する文書解析手段(図1の5)を有するよ
うに構成されている。
【0009】
【作 用】
(第1発明)マーク取り出し手段では、文書画像におけ
る文字を認識する対象の文字行から連結した黒画素塊が
取り出される。マーク解析手段では、前記取り出された
黒画素塊の最下辺の座標における黒画素塊の分布を解析
する。この黒画素塊の分布を解析した結果に基づいて、
文字種識別手段では、文字の種類、たとえば、英文字と
日本文字、の特徴から文字の種類を識別する。
【0010】(第2発明)マーク接触解析手段では、前
記マーク取り出し手段により取り出された黒画素塊の外
接矩形間の接触関係を調べ、その接触している個数を計
数することにより、文字の種類を識別する。たとえば、
英文字と日本文字に対する外接矩形を調べ、一つの文字
で外接矩形が接触している黒画素塊の個数を計数する。
英文字と日本文字との特徴の相違から前記黒画素塊の接
触する個数を計数することによって文字の種類が識別で
きる。
【0011】(第3発明)マーク周辺分布計数手段で
は、前記マーク取り出し手段により取り出された黒画素
塊の外接矩形の縦方向または横方向のマークの個数を計
数することにより、文字の種類を識別する。たとえば、
英文字と日本文字に対する外接矩形を調べ、X軸上およ
びY軸上のマークの個数を計数する。英文字と日本文字
との特徴の相違から前記黒画素塊の個数を計数すること
によって文字の種類が識別できる。
【0012】(第4発明)また、前記文字種識別手段で
文字の種類が判別不可能となった行、あるいは誤判別さ
れた行は、文書解析手段により文字行の位置関係、たと
えば文字行の前後関係を調べることによって修正するこ
とが可能である。
【0013】以上のように、本発明によれば、文字の種
類が混在した文書でも、文字認識の対象となる文字の種
類を自動的に識別できるので、それぞれの文字に合った
文字認識装置で文字の種類認識率を高くすると共に、文
字認識装置を操作する際に、操作者が文字の種類に対す
る切り分けを行う負担を軽減する。
【0014】
【実施例】本発明の一実施例として、日本文字と英文字
とが混在する文書において、文字認識の対象となる文字
行が日本文字であるか英文字であるかを自動的に判定す
る場合を説明する。図1は本発明の一実施例における文
書認識装置の主要部のブロック構成図である。図2は本
発明の一実施例における文書認識装置のブロック構成図
である。図1において、符号4は後述する文字認識装置
における英/日判定部、5は文書解析部である。英/日
判定部4は、文書画像内の文字行に対して、連結した黒
画素塊を取り出すマーク取り出し部41と、当該マーク
取り出し部41によって取り出された黒画素塊の最下辺
の座標を取り出し、その座標における黒画素塊の分布を
解析するマーク解析部42と、当該マーク解析部42で
解析された黒画素塊の分布に基づいて英文字あるいは日
本文字であることを識別する英/日識別部43とから構
成される。
【0015】図2に示す文書認識装置は、紙に印刷され
た文書を画像データとして読み取る、たとえば、イメー
ジスキャナのような画像入力部1と、当該画像入力部1
で入力した画像データを処理するために一時格納するイ
メージメモリ2と、当該イメージメモリ2に格納されて
いる文書の画像データから所定の文字行を抽出する文字
行抽出部3と、当該文字行抽出部3によって抽出された
文字行が英文字であるかあるいは日本文字であるかを判
定する英/日判定部4と、当該英/日判定部4によって
判定されなかった英文字または日本文字を解析する文書
解析部5と、文字行抽出部3、英/日判定部4、あるい
は文書解析部5等の処理結果を格納する認識結果格納メ
モリ6と、英文字を認識する英文文字認識部(OCR:
Optical Character Reader)
7と、日本文字を認識する和文文字認識部(OCR)8
と、前記英文または和文文字認識部7、8で認識された
文字行を一時格納する格納部9と、当該格納部9に格納
された文字行を文書ファイルとして格納する文書ファイ
ル格納装置10と、前記各部を制御する制御/操作部1
1と、文字行あるいは文書ファイル等を表示する表示装
置111と、文字認識装置に文字あるいは図形を入力す
るキーボード112と、同じくマウス等のポインティン
グデバイス113とから構成される。
【0016】図3および図4を参照しつつ本発明におけ
る文字行の抽出について説明する。図3は本発明の一実
施例における文字行抽出部を説明するための図である。
図4は本発明の一実施例における認識結果格納表の構成
を説明するための図である。紙に印刷された文書は、た
とえば、図示されていないイメージスキャナにより、画
像入力部1からディジタルで入力され、原画像の画像デ
ータがイメージメモリ2に格納される。また、この際に
原画像は、制御/操作部11によって、表示装置111
に表示される。文字認識装置の操作者は、表示装置11
1における表示を見て、正規の入力画像であるか否かの
確認を行うと共に、正規の入力画像でない場合には、再
入力することも可能である。画像入力部1によって入力
された文書画像の中の文字行が文字行抽出部3により抽
出される。文字行抽出部3では、イメージメモリ2内に
格納されている画像の横軸方向(つまり、文字の並んで
いる行方向)で、図3に示すごとく、黒画素の存在する
頻度を取ったヒストグラムが作成される。なお、図3で
は文字を黒く塗り潰した■形で表されているが、文字に
よって黒画素の密度が異っているものである。このヒス
トグラムにおいて、黒画素が多く集中している山の部分
における上端のY座標と幅とは、文字行の上端のY座標
と高さに一致する。この文字行が含まれている範囲内の
最も左端と右端に位置する黒画素のX座標を取り出すこ
とによって、文字行の左端のX座標と幅を決定する。こ
れらの処理によって、文字行のX座標、Y座標、幅、高
さが計算される。文字行抽出の結果は、認識結果格納メ
モリ6内の認識結果格納表61に格納される。すなわ
ち、当該認識結果格納表61に格納される情報は、文字
行の左上のX座標、Y座標、幅、高さであり、それぞれ
の表内の第1、2、3、4列(x、y、w、h)に対応
している。また、この際に文字行を抽出した結果(たと
えば、文字行の矩形枠を原画像上に描画した結果)を制
御/操作部11を通して、表示装置111に表示し、操
作者に対して確認を求め、キーボード112やポインテ
ィングデバイス113を用いて修正することも可能であ
る。抽出された各々の文字行が英文字(つまり、アルフ
ァベットや数字のみで書かれている行)、または日本文
字(つまり、漢字、ひらがな、カタカナを含んだ行であ
り、英数字を含む場合もある)の行であるかを英/日判
定部4により判定する。
【0017】図6は本発明の一実施例における英/日本
文字を判定するための処理を行うフローチャートであ
る。図6のフローチャートに従って、英/日判定部4の
処理を説明する。マーク取り出し部41では、先ず、英
/日文字の判定を行うために十分な文字数があるか否か
を判断するために、文字行の幅が閾値「a」(たとえ
ば、全文字行の幅の平均値における80%以上の長さ)
以上であるか否かを調べる(ステップ601)。文字の
幅が閾値「a」未満の場合は、対象となっている文字行
の直前に文字行があるか否かを調べる(ステップ60
2)。対象となっている文字行の直前に文字行がある場
合、直前の文字行の種類を認識結果格納表61の英/日
欄から調べ、その直前の文字行の文字の種類(英/日)
と同一にする(ステップ603)。認識結果格納表61
における英/日欄の記載事項が英/日判定部4の判定結
果となっている。また、文字認識の対象となる文字行が
先頭で、その直前に文字行がない場合、または段落のよ
うに先頭の文字と直前の文字行とが離れている場合は、
認識結果格納表61の英/日欄に「?」(英/日判別不
可能)記号を記載しておく(ステップ604)。なお、
この英/日文字判別不可能の文字行は、次の文書解析部
5によって、英/日文字の決定が行われる。
【0018】ステップ601において、文字認識の対象
となる文字行の幅が閾値「a」以上ある場合は、次のよ
うな処理を行う。文字行抽出部3によって抽出された文
字行からマークを取り出すための処理が行われる(ステ
ップ605)。マークを取り出す方法は、原画像の1文
字行の範囲内でラベル付け(「ディジタル画像処理」
Rosenfeld、Kak著、長尾真監訳 第360
〜361頁に記載されている方法を用いる)を行うこと
であり、その結果によってマークの左上座標、幅、高さ
が得られる。次に、マーク解析部42では、個々のマー
クの最も下に位置する黒画素のY座標を求める(ステッ
プ606)。そして、マークのY座標の分布を求める
(ステップ607)。図5は本発明の一実施例における
日本語と英語の文字行内のマークの最下辺のY座標の分
布の例を示す図である。英/日識別部43では、文字行
における最下位に位置する黒画素のY座標の分布で、一
番高い山となっている部分、すなわち、黒画素数が一番
多い箇所を求める(ステップ608)。そして、この山
になっている部分に含まれているマークの度数が文字行
内の全てのマークの数に対する割合として閾値「b」以
上であるか否かを調べる(ステップ609)。上記マー
クの度数の割合が閾値「b」以上であれば、英文字行で
あると識別し(ステップ610)、上記マークの度数の
割合が閾値「b」未満であれば、日本文字行であると識
別する(ステップ611)。日本文字は、分離した複数
のマークから一つの文字を構成する場合が多く、マーク
の最下辺に位置するY座標は、広い範囲で分布してい
る。これに対して、英文字は、分離した複数のマークか
ら一つの文字を構成する場合(たとえば、「i」、
「j」)が少なく、マークの最下辺に位置するY座標
は、狭い範囲に集中している。英/日識別部43は、上
記のような英文字と日本文字との特徴の差を利用してい
る。そして、それぞれの文字行に対する英/日識別結果
は、認識結果格納表61内の英/日欄に「E」(英
語)、「J」(日本語)の記号が記入される。
【0019】文書解析部5では、英/日判別不可能行と
誤って判別された行の修正を行う。認識結果格納表61
内の英/日欄内で「?」記号が記入されている行を検索
する。そして、文字認識の対象としている文字行の種類
をその直後の文字行の種類(英/日)と同一にする。次
に、対象としている前後の文字行は、同一種類の文字で
あるが、この文字行が違う場合(誤って判別している場
合が多い)は、その前後の文字行と同一の文字種類にす
る。認識結果格納表61の情報に従って、イメージメモ
リ2内に入力されていた原画像の英文字行は、英文文字
認識部7で認識され、日本文字行は和文文字認識部8で
認識される。そして、これらの認識結果は、認識結果格
納表61内の該当する文字行の認識結果欄に格納され
る。格納部9では、認識結果格納表61内の認識結果を
利用して文書が作成され、その結果作成された文書ファ
イルは、文書ファイル格納装置10に格納される。
【0020】上記に本発明の一実施例を示したが、次の
ような処理に変更することも可能である。すなわち、 (1)上記実施例の英/日識別部43では、マーク頻度
の最も多い山を抽出しているが、隣の座標におけるマー
ク頻度を互いに引算して、その差の一番大きい所、すな
わち、先鋭度の最も高い山を抽出するように変更するこ
とによって、英/日文字を識別することができる。 (2)認識結果格納表61に、マークの分布内で最も高
い山に含まれている度数と全体におけるマーク分布の平
均度数との比率を格納できる欄を設け、文書解析部5の
処理の際に、この比率を利用して修正を行うようにする
ことができる。たとえば、文字認識の対象となる文字行
の前後は、同一種類の文字であるが、その対象となる文
字行の文字の種類が違うと判定された場合、無条件に対
象となる文字行の文字の種類(英/日)を変更せずに、
前記比率がある閾値より低い場合のみ、対象となる文字
行の文字の種類を変更するようにする。 (3)英/日文字の識別条件を文字行の下辺におけるマ
ーク分布とマーク頻度の一番高い山の位置が一致するか
否かで識別することができる。英/日識別部43におい
て、一致すると判断した場合は日本文字行であり、一致
しないと判断した場合は英文字行である。これは、日本
文字の場合、文字の下辺と文字行の下辺とが一致するの
に対して、英文字の場合、「g」、「j」、「p」、
「q」、「y」のように文字の下辺と文字行の下辺とが
一致しないからである。また、実施例とこの方法とを組
み合わせた識別方法なども実施できる。
【0021】次に、本発明における他の実施例を説明す
る。図7は本発明の他の実施例における文書認識装置の
主要部のブロック構成図である。図8は本発明の他の実
施例における英文字行内におけるマークの外接矩形間の
接触関係を示す図である。図9は本発明の他の実施例に
おける日本文字行内におけるマークの外接矩形間の接触
関係を示す図である。図7と図1に示された英/日判定
部4の相違は、マーク解析部42の代わりにマーク接触
解析部42′とした点にある。すなわち、マーク接触解
析部42′では、マークの外接矩形間の接触関係を求
め、その接触している個数を計数する。たとえば、図8
および図9に示すマークの外接矩形の接触関係におい
て、「1」は接触関係にあることを表し、「0」は接触
関係にないことを表している。マークの外接矩形間の接
触関係は、1つのマークたとえば、図8および図9にお
けるマーク「A」に注目し、その左上座標、幅、高さか
ら形成される矩形領域(外接矩形)B内に位置するもの
と、他のマークたとえば、「C」の外接矩形D内に位置
するものとを、次のような突き合わせを行うことによっ
て求めることができる。 (1)外接矩形Dの左上座標が外接矩形Bの領域内にあ
れば、マーク「A」とマーク「C」とは接触している。 (2)外接矩形Dの右上座標(左上座標と幅から計算す
る)が外接矩形Bの領域内にあれば、マーク「A」とマ
ーク「C」とは接触している。 (3)外接矩形Dの左下座標(左上座標と高さから計算
する)が外接矩形Bの領域内にあれば、マーク「A」と
「C」とは接触している。 (4)外接矩形Dの右下座標(左上座標と幅と高さから
計算する)が外接矩形Bの内にあれば、マーク「A」と
マーク「C」とは接触している。 上記の処理は、マーク「A」とその他全てのマークとの
間でそれぞれ行われる。そして、マーク間に接触関係の
あることが判明した時点で、マーク「A」との処理は終
了する。また、マーク「C」は、マーク「A」と接触関
係があると既に判定されている場合、以後のマーク
「C」との接触判断処理を行わないようにする。全ての
マークに対して接触判断処理が終了した時点で、外接矩
形間で接触関係を持っているマークの個数を計数する。
たとえば、図8における英文字では、「i」だけがマー
ク個数が「2」である。しかし、接触関係にあるマーク
は無く、マークの接触関係は「0」が示されている。こ
れに対して、図9における日本文字では、「包」はマー
ク個数が「2」である。そして、互いに接触関係がある
ため、マークの接触関係は両方のマーク共「1」が示さ
れている。同じく「含」は、マーク個数が「1」で、接
触関係が「0」、「関」はマーク個数が「3」で、接触
関係が「1」であることを示している。
【0022】図10は本発明の他の実施例における英/
日本文字を判定するための処理を行うフローチャートで
ある。図10におけるフローチャートにおいて、ステッ
プ701のマーク取り出しまで、図6におけるステップ
601と同じであるから、その説明は省略する。マーク
取り出し部41により取り出されたマークから、マーク
接触解析部42′により、マーク間の接触関係を抽出し
(ステップ702)、マークの接触関係にある個数が計
数され、その計数された個数が閾値「b」個以上である
か否かを調べる(ステップ703)。マークの接触関係
にある個数が閾値「b」以上であれば、日本文字の行で
あると識別し、図4に示す認識結果格納表61内の英/
日欄に「J」(日本語)の記号を記入する。マークの接
触関係にある個数が閾値「b」個未満の場合、文字行の
幅が閾値「a」(たとえば、全文文字行の幅平均値の8
0%以上の長さ)以上であるか否かを調べる(ステップ
705)。文字行の幅が前記閾値「a」以上の場合は、
英文字行であると識別し、図4に示す認識結果格納表6
1内の英/日欄に「E」(英語)の記号を記入する。ス
テップ705において、文字行の幅が前記閾値「a」未
満の場合、当該文字行の直前に文字行があるか否かを調
べる(ステップ707)。当該文字行の直前に文字行が
ある場合、当該文字行の種類は、その直前にある文字行
の種類(英/日)と同一にする(ステップ708)。そ
して、当該文字行の直前にある文字行の種類は、図4に
示す認識結果格納表61における直前の文字行英/日欄
に記入されている事項をコピーする。当該文字行の直前
に文字行がない場合(すなわち、先頭の文字行の場
合)、または当該文字行の直前に文字行が離れて存在す
る場合(段落の先頭の場合)は、図4に示す認識結果格
納表61内の英/日欄に「?」(英/日判別不可能)の
記号を記入しておく(ステップ709)。この英/日文
字の判別不可能な文字行は、次の文書解析部5によっ
て、英/日文字の決定が行われる。
【0023】上記のように接触関係にあるマークの個数
によって英/日文字の識別を行っているのは、日本文字
の場合、分離した複数のマークから一つの文字が構成さ
れる。また、日本文字におけるマークの外接矩形は、他
のマークと接触関係にある場合が多い。たとえば、
「で」という文字は、「て」というマークが濁点である
2つのマーク「、」を包含している。すなわち、「て」
というマークの外接矩形の中に濁点というマークが全て
入る。これに対して、英文字の場合、分離されたマーク
から構成されていることは少ない。分離されたマークと
して存在するのは、「i」、「j」だけである。また、
英文字は、マークの外接矩形間の接触関係も少ない。本
発明は、英文字と日本文字との相違点に着目したもので
ある。
【0024】上記の本発明の他の実施例を示したが、次
のような処理に変更することも可能である。すなわち、 (1)上記マーク接触解析部42′では、全てのマーク
の外接矩形間の接触関係を調べているが、閾値「b」以
上の接触関係にある個数を計数した時点で接触関係の調
査を止めるようにすることは可能である。 (2)また、上記マーク接触解析部42′では、マーク
の外接矩形に接触関係が「ある/なし」の1または0と
して計数しているが、これを接触しているマーク個数と
することも可能である。 (3)上記の英/日識別部43では、外接矩形が接触し
ているマークの個数のみで英/日の識別をしているが、
1行内に含まれる全てのマークの個数と外接矩形が接触
しているマークの個数との比率によって英/日文字の識
別をすることも可能である。
【0025】さらに、本発明における他の実施例を説明
する。図11および図12は本発明の他の実施例におけ
る文書認識装置のブロック構成図である。図11および
図12と図1に示す英/日判定部4と相違するところ
は、図1に示すマーク解析部42の代わりに図11に示
すマーク周辺分布計数部42″、および図12に示すX
座標周辺分布計数部421とY座標周辺分布計数部42
2とを設けた点にある。また、図11と図12との相違
点は、図11のマーク周辺分布計数部42″は、X座標
あるいはY座標のいずれか一方であるのに対して、図1
2は上記両者を採用している点である。したがって、図
12について説明すれば図11の説明は省略できる。す
なわち、英/日判定部4は、マークを取り出すマーク取
り出し部41と、マークの外接矩形のX座標上の周辺分
布を求めるX座標周辺分布計数部421と、当該X座標
周辺分布計数部421によって求まったX座標の周辺分
布の結果より英/日文字の識別を行う英/日識別部43
1と、Y座標上の周辺分布を求めるY座標周辺分布計数
部422と、当該Y座標周辺分布計数部422によって
求まったY座標の周辺分布の結果より英/日文字の識別
を行う英/日識別部432とから構成される。
【0026】次に、上記実施例における英/日判定部4
の処理を図12ないし図15を参照しつつ説明する。図
13は本発明の他の実施例における英文字行内における
マークのX、Y座標軸上の分布の例を示す図である。図
14は本発明の他の実施例における日本文字行内におけ
るマークのX、Y座標軸上の分布の例を示している図で
ある。図15は本発明の他の実施例における英/日本文
字を判定するための処理を行うフローチャートである。
ステップ801におけるマーク取り出しに関しては、前
記各実施例と同じであるから説明を省略する。X座標周
辺分布計数部421では、マークの外接矩形のX座標上
での個数(縦に重なっているマークの数)を求め、X座
標軸上の周辺分布図を作成する(ステップ802)。た
とえば、X軸上の一定間隔毎の位置において、図13お
よび図14に示す文字を構成している各マークを囲んで
いる外接矩形(「言」、「語」は外接矩形と黒画素塊が
一致している)の個数を計数して、X軸上のマークの外
接矩形の周辺分布図を作成する。英/日識別部431の
処理では、X座標周辺分布計数部421に計数されたマ
ークの外接矩形のX座標上の個数が閾値「b」個以上の
領域があるか否かを調べる(ステップ803)。マーク
の外接矩形の個数がX軸上に閾値「b」個以上の領域が
あれば、日本文字であると識別し、認識結果格納表61
(図4参照)内の英/日欄に「J」(日本語)の記号を
記入する(ステップ804)。前記閾値「b」の値とし
て、たとえば、「3」を用いている。図14に示す
「言」のマーク個数は「5」で、英文字のマーク個数は
最大、「i」または「j」の「2」である。したがっ
て、前記閾値を「3」にしている。
【0027】ステップ803において、マークの個数が
X軸上に閾値「b」個未満の場合、文字行の幅が閾値
「a」(たとえば、全文字行の幅の平均値における80
%以上の長さ)以上であるか否かを調べる(ステップ8
05)。文字行の幅が閾値「a」以上の場合は、Y座標
周辺分布計数部422において、X座標周辺分布計数部
421の処理と同様にY軸上のマークの外接矩形の個数
(横に重なっているマークの数)を求め、周辺分布図を
作成する(ステップ806)。この周辺分布図からマー
ク個数のピーク数を計数する。たとえば、隣接するマー
クの個数どうしの差が正から負、または負から正に変化
する点を計数する。図13に示す英文字のピーク数は
「1」であり、図14に示す日本文字のピーク数は
「5」である。そこで、ピーク数がある閾値「c」未満
であるか否かを調べる(ステップ807)。ピーク数が
前記閾値「c」未満であるならば、英文字であると識別
し、認識結果格納表61(図4参照)内の英/日欄に
「E」(英語)の記号を記入する(ステップ808)。
マーク個数のピーク数が閾値「c」以上の場合は、日本
文字であると識別し、認識結果格納表61内の英/日欄
に「J」(日本語)の記号を記入する(ステップ80
9)。日本文字は、多くのマークから構成されているた
め、細かいピークが多く現れるのに対して、英文字の多
くは、1つのマークで構成されているため、ピークが少
ない。
【0028】ステップ805において、文字行の幅が閾
値「a」未満の場合、直前に文字行があるか否かを調べ
る(ステップ810)。ステップ810ないしステップ
812の処理は、図10におけるステップ707ないし
ステップ709の処理と同じであるから説明を省略す
る。
【0029】上記に本発明の他の実施例を示したが、次
のような処理に変更することも可能である。 (1)本実施例のY座標周辺分布計数部422では、ピ
ークの個数を計数しているが、ピークの代わりに分布の
平らなところ(隣との差が0である箇所)の幅を取り出
すことにより、英/日文字を識別することも可能であ
る。 (2)本実施例では、X座標周辺分布とY座標周辺分布
とを利用しているがどちらか片方のみで、英/日文字を
識別することも可能である。 (3)本実施例のX座標周辺分布を利用する英/日識別
部431では、分布のピーク時のマーク数のみを特徴と
して取り出しているが、マーク数の最大値や平均値また
は分散を特徴として取り出すことも可能である。 また、実施例においては、英/日文字の識別について記
述したが、各々異なる文字どうしが各々異なる特徴量を
持つものならば、それらの異なる文字どうしも識別可能
であることはいうまでもない。
【0030】
【発明の効果】以上述べたように、本発明によれば、文
字行に対して自動的に文字の種類を識別できるので、そ
れぞれ専用の文字認識装置で処理することができ、総合
的な認識率を向上させることができる。そして、文字認
識装置を操作する際に、操作者が文字の種類を切り分け
る必要がないので、そのための負担を軽減できる。ま
た、文書解析手段により、文字の種類が判別不可能とな
った行や誤判別された行を修正することができるので、
より認識率を向上させることができる。
【図面の簡単な説明】
【図1】 本発明の一実施例における文書認識装置の主
要部のブロック構成図である。
【図2】 本発明の一実施例における文書認識装置のブ
ロック構成図である。
【図3】 本発明の一実施例における文字行抽出部を説
明するための図である。
【図4】 本発明の一実施例における認識結果格納表の
構成を説明するための図である。
【図5】 本発明の一実施例における日本語と英語の文
字行内のマークの最下辺のY座標の分布の例を示す図で
ある。
【図6】 本発明の一実施例における英/日本文字を判
定するための処理を行うフローチャートである。
【図7】 本発明の他の実施例における文書認識装置の
主要部のブロック構成図である。
【図8】 本発明の他の実施例における英文字行内にお
けるマークの外接矩形間の接触関係を示す図である。
【図9】 本発明の他の実施例における日本文字行内に
おけるマークの外接矩形間の接触関係を示す図である。
【図10】 本発明の他の実施例における英/日本文字
を判定するための処理を行うフローチャートである。
【図11】 本発明の他の実施例における文書認識装置
のブロック構成図である。
【図12】 本発明の他の実施例における文書認識装置
のブロック構成図である。
【図13】 本発明の他の実施例における英文字行内に
おけるマークのX、Y座標軸上の分布の例を示す図であ
る。
【図14】 本発明の他の実施例における日本文字行内
におけるマークのX、Y座標軸上の分布の例を示してい
る図である。
【図15】 本発明の他の実施例における英/日本文字
を判定するための処理を行うフローチャートである。
【符号の説明】
1・・・画像入力部、2・・・イメージメモリ、3・・
・文字行抽出部、4・・・英/日判定部、5・・・文書
解析部、6・・・認識結果格納メモリ、7・・・英文文
字認識部、8・・・和文文字認識部、9・・・格納部、
10・・・文書ファイル格納装置、11・・・制御/操
作部、41・・・マーク取り出し部、42・・・マーク
解析部、42′・・・マーク接触解析部、42″・・・
マーク周辺分布計数部、43・・・英/日識別部、42
1・・・X座標周辺分布計数部 431・・・英/日識別部、422・・・Y座標周辺分
布計数部、432・・・英/日識別部、

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を認識する文書認識装置におい
    て、 文書画像内の文字行に対して、連結した黒画素塊を取り
    出すマーク取り出し手段と、 当該マーク取り出し手段によって取り出された黒画素塊
    の最下辺の座標を取り出し、その最下辺の座標における
    黒画素塊の分布を解析するマーク解析手段と、 当該マーク解析部手段により解析された黒画素塊の分布
    に基づいて文字の種類を識別する文字種識別手段と、 を備えていることを特徴とする文書認識装置。
  2. 【請求項2】 文書画像を認識する文書認識装置におい
    て、 文書画像内の文字行に対して、連結した黒画素塊を取り
    出すマーク取り出し手段と、 当該マーク取り出し手段によって取り出された黒画素塊
    の外接矩形間の接触関係を取り出し、その接触関係にあ
    る個数を計数するマーク接触解析手段と、 当該マーク接触解析手段により取り出された接触関係を
    持つ黒画素塊の個数に基づいて文字の種類を識別する文
    字種識別手段と、 を備えていることを特徴とする文書認識装置。
  3. 【請求項3】 文書画像を認識する文書認識装置におい
    て、 文書画像内の文字行に対して、連結した黒画素塊を取り
    出すマーク取り出し手段と、 当該マーク取り出し手段によって取り出された黒画素塊
    の外接矩形の縦方向または横方向のマークの個数を計数
    するマーク周辺分布計数手段と、 当該マーク周辺分布計数手段によって計数されたマーク
    の個数に基づいて文字の種類を識別する文字種識別手段
    と、 を備えていることを特徴とする文書認識装置。
  4. 【請求項4】 前記文字種識別手段によって識別された
    文字行に対して、判別不可能および誤判別された文字行
    を、その文字行の位置関係から文字の種類を識別する文
    書解析手段を備えていることを特徴とする請求項1ない
    し請求項3の文書認識装置。
JP3205597A 1991-07-23 1991-07-23 文書認識装置 Pending JPH0528301A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3205597A JPH0528301A (ja) 1991-07-23 1991-07-23 文書認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3205597A JPH0528301A (ja) 1991-07-23 1991-07-23 文書認識装置

Publications (1)

Publication Number Publication Date
JPH0528301A true JPH0528301A (ja) 1993-02-05

Family

ID=16509514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3205597A Pending JPH0528301A (ja) 1991-07-23 1991-07-23 文書認識装置

Country Status (1)

Country Link
JP (1) JPH0528301A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image

Similar Documents

Publication Publication Date Title
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
CA2116600C (en) Methods and apparatus for inferring orientation of lines of text
US6970601B1 (en) Form search apparatus and method
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
CN109409180B (zh) 图像分析装置和图像分析方法
JPH0528301A (ja) 文書認識装置
JPH0410087A (ja) 基本ライン抽出方法
JPH06180771A (ja) 英文字認識装置
JP2917427B2 (ja) 図面読取装置
JP2581353B2 (ja) グラフ画像登録システム
JP3064508B2 (ja) 文書認識装置
JP2887823B2 (ja) 文書認識装置
JP2728086B2 (ja) 文字切り出し方法
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JPH05174185A (ja) 日本語文字認識装置
JP3428504B2 (ja) 文字認識装置
JP2728085B2 (ja) 文字切り出し方法
JPH04211884A (ja) 文字切り出し方法
JP3243389B2 (ja) 文書識別方法
JPH08293002A (ja) 文字認識装置及び文字認識方法
Haralick et al. Document structural decomposition
JPH08161430A (ja) 文字種識別方法
JPH09231317A (ja) 文書認識装置
JPH10143606A (ja) 文字認識装置および文字認識方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20080615

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20090615

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20090615

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 9

Free format text: PAYMENT UNTIL: 20100615

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100615

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 10

Free format text: PAYMENT UNTIL: 20110615

LAPS Cancellation because of no payment of annual fees