JP2565150B2

JP2565150B2 - 文字切り出し方法

Info

Publication number: JP2565150B2
Application number: JP7109774A
Authority: JP
Inventors: 三喜男青木
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1988-04-28
Filing date: 1995-05-08
Publication date: 1996-12-18
Anticipated expiration: 2011-12-18
Also published as: JPH07319998A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、紙面上に書かれた文宇
を画像として入力することにより、文字画像から文字領
域を捜し出し、コード番号に変換する文字認識装置の文
字切り出し方法に関する。

【０００２】

【従来の技術】近年、文字認識装置の急激なる進歩によ
り、さまざまな文書画像から文字領域を自動的に抽出
し、さらに一つ一つの文字を切り出し、認識し、自動的
に文字ファイルが作成できるようになってきており、文
字の切り出し方法はさまざまな方法が考え出されてきて
いる。

【０００３】例えば一般に多く用いられている方法に抽
出文字行の縦方向の周辺分布を計数する方法がある。

【０００４】例えば、図４（ａ）に示す様な抽出文字行
の縦方向の周辺分布を計数すると図４（ｂ）に示すよう
な分布を得る。（図４（ｂ）は、文字画像の存在か否か
のみを示す）該分布の値により、文字の存在位置を知る
ことが可能となり、一文字一文字の文字の切り出しを行
っていた。また、抽出文字行が図４（ｃ）に示す様な周
辺分布の重なった文字においては、複数文字と判断した
場合に文字ピッチにより文字の切れ目を推定して、強制
的に文字の切り出しを行っていた。

【０００５】

【発明が解決しようとする課題】しかしながら、この様
な方法で文字の切り出しを行う場合、対象文字画像が、
図４（ａ）に示す様な定ピッチの文字画像においては正
確に文字の切り出しが可能であるが、図４（Ｃ）に示し
た様な文字画像、図５（ａ）に示した様な文字画像、図
ｌ１（ａ）に示した様な文字画像においては、正確な文
字の切り出しは不可能である。図４（Ｃ）の文字画像、
図５（ａ）の文字画像、図ｌ１（ａ）の文字画像、どれ
も文字ピッチ不定のプロポーシヨナル文字である。従っ
て、従来の方法の様に単に縦方向の周辺分布より文字位
置及び文字ピッチを推定することができない。

【０００６】図４（Ｃ）により従来の方法にて文字の切
り出しを行おうとした場合について述べる。図４（Ｃ）
は、図４（ａ）と同ーフォントの文字画像である。図４
（ａ）が文字ピッチー定なのに対し、図４（ｃ）は文字
ピッチ不定のプロポーシヨナル文字である。既文字画像
の縦方向の周辺分布図４（ｄ）に着目すると、殆どの部
分で図４（ａ）の周辺分布図４（ｂ）とほぼ同じである
が、ＹＯの周辺分布に相当する部分が異なる。図４
（ｄ）は、Ｙの周辺分布と０の周辺分布が重なってしま
っている。従って該周辺分布からは、Ｙと０を一つの文
字として判断してしまうか、あるいは実際と異った場所
で切り離してしまう。今、仮に二つの文字と判断して強
制的に二つの文字に分けようとした場合、文字ピッチに
着目すると、図１２に示す１２０１で文字画像を分離
し、周辺分布の形状に着目すると、１２０２で文字画像
を分離してしまう。１２０１、１２０２どちらの位置で
文字画像を分離しても、Ｙか０の文字の途中で切れ、別
の文字と一緒に抽出されてしまい、正確な文字の抽出は
不可能である。

【０００７】次に図５（ａ）に示した文字画像より、従
来の方法により文字の切り出しを行う場合について述べ
る。図５（ａ）はｍｉｌｌｉｏｎという７つの文字によ
り構成される単語である。該単語の縦方向の周辺分布を
計数すると図５（ｂ）に示す様に、ｍ，ｉ，ｌ，ｌ，ｉ
の５つの文字の周辺分布５０１、５０２、５０３、５０
４、５０５は連なって一つの周辺分の固まりとなってい
る。従って、該周辺分布からは簡単に文字の切れ目を推
定することは不可能である。文字ピッチにより文字の切
り離しを行おうとすると、ｉ，ｌ等の文字は標準文字幅
の半分の大きさであるので、二つの文字で一つの文字と
判断して一緒に切り出される可能性が大きい。また、周
辺分布の形状で判断して切り離すと、ｉ，ｌ等の文字は
うまく切り離せるかもしれないが、文字ｍを分解する可
能性が大であり、文字の切り出しの信頼性が極めて小さ
い。

【０００８】また、図１１（ａ）に示した文字画像の場
合も、図５の場合と同様に周辺分布の形状のみからは文
字の正確な切り出しは不可能である。

【０００９】そこで本発明は、以上のような課題を解決
するもので、その目的とするところは、紙面等に書かれ
た欧米文字画像において、隣どうしの文字が接触した文
字画像、周辺分布が重なった文字画像、文字ピッチが一
定でない文字画像から一つ一つの文字を切り出す方法を
提供することにある。

【００１０】

【課題を解決するための手段】本発明は、光学的画像入
力手段により紙面等に書かれた欧米文字画像を読み取
り、入力された画像データ中の文字を認識する文字認識
装置の文字切り出し方法において、行方向の周辺分布よ
り無視する線幅の値を決定し、前記行方向と垂直な方向
の周辺分布と前記無視する線幅の値とにより標準文字幅
及び文字切り出し候補位置を推定し、文字の切り出し
は、連結成分の輪郭を抽出するとともに、文字幅を抽出
し、抽出した文字幅と前記標準文字幅とを比較して、前
記文字幅が許容できる大きさの場合は一文字と判断し、
前記輪郭に囲まれた領域の内側のみを抽出することによ
り文字切り出しを行ない、前記抽出した文字幅と前記標
準文字幅とを比較して、前記文字幅が許容できない大き
さの場合は、前記文字切り出し候補位置が存在するかど
うかを確認し、文字切り出し候補位置が存在する場合
は、文字切り出し候補位置の範囲内にて再度輪郭の抽出
を行ない、再度抽出した輪郭に囲まれた領域の内側のみ
を抽出することにより文字切り出しを行ない、前記抽出
した文字幅と前記標準文字幅とを比較して、前記文字幅
が許容できない大きさの場合であって、前記文字切り出
し候補位置が存在しない場合は、行方向と垂直な方向の
前記周辺分布の極小値の位置と前記標準文字幅とにより
文字切り出し範囲を決め、その範囲で再度輪郭の抽出を
行ない、再度抽出した輪郭に囲まれた領域の内側のみを
抽出することにより文字切り出しを行なうことを特徴と
するものである。

【００１１】

【００１２】

【００１３】

【００１４】

【００１５】

【００１６】

【００１７】

【００１８】

【００１９】

【００２０】

【００２１】

【実施例】以下本発明について実施例に基づいて詳細に
説明する。

【００２２】本発明の文字切り出し手段が構成要素とな
る文字認識装置は、図１のプロック図に示す様に、ＣＰ
Ｕ１０１、画像入力装置１０２、認識文字表示装置１０
３、ＲＯＭ１０４、ＲＡＭ１０５により横成されてい
る。

【００２３】以下、画像入力装置ｌ０２によりＲＡＭｌ
０５に読み込まれた文字画像中よリーつ一つの文字を切
り出す本発明の文字切り出し方法を図２に示すフローチ
ャー卜に基づいて詳細に説明する。

【００２４】画像入力装置１０２によりＲＡＭ１０５に
読み込まれた文字画像を図３（ａ）とする。本発明にお
いては、まず最初に行方向の周辺分布を計数する。文字
画像図３（ａ）の行方向の周辺分布を計数すると、図３
（ｂ）の３０１の様な形状の周辺分布を得る。欧米文字
は、図３（ａ）のｄに相当する文字高の大きな文字、ｅ
に相当する文字高の小さな文字、ｙに相当する文字高は
大きいが文字位置が低い文字の３種類の文字から構成さ
れている。従って、該３種類の文字から構成されている
文字画像の行方向の周辺分布を計数すると、通常図３
（ｂ）に示す３０１の様な周辺分布となる。該周辺分布
３０１は、３１１，３１２，３１３の３つの領域が合わ
さってできており、文字画像によっては、３１２の領域
あるいは３１３の領域が存在しない場合がある。しかし
ながら、３１１の領域は常に存在をし、該領域の幅３０
４は、文字高の小さな文字の高さ（以下、標準文字高と
呼ぶ）に相当する。従って、行方向の周辺分布の形状に
着目することにより標準文字高３０４を知ることが可能
になる。例えば、普通の印刷欧米活字では、標準文字高
と文字線の太さとの間に、通常標準文字高：文字線の太さ≧１６：１の関係が成り立つ。従って、普通の印刷欧米活字による
文字では、文字画像の垂直方向の周辺分布に着目した場
合、周辺分布の値が文字高の１／１６より低い値の部分
は、文字のひげ部分であり、あるいは、文字が接触して
いる部分であると判断できる。この部分を無視すること
により、後述するように、文字のひげ部分や、文字が接
触している部分を除外できる。このように、普通の欧米
活字による文字では、判断の基準となる標準文字高の１
／１６を最低線幅とし、無視する値として求めておく。
この無視する値は、フォントに応じて決まるもので、必
ずしも、１／１６に限られるものではない。

【００２５】次の段階として、文字行の垂直方向の周辺
分布により標準文字間隔、単語間隔及び標準文字幅を求
める。まず最初に、文字行と垂直な方向に投影した場
合、文字画像が存在するか否かのデータを求める。文字
画像を図４（ａ）とした場合、文字画像が存在するか否
かのデータすなわち文字画像と垂直の方向に投影したデ
ータは図４（ｂ）である。領域４０１は文字画像が存在
する部分、領域４０２は文字画像が存在しない部分、す
なわち文字間隔に相当する部分である。該文字が存在し
ない部分４０２の統計をとると図６（ａ）の様になる。
同様に、文字画像図４（ｃ）の投影したデータ図４
（ｄ）の文字画像が存在しない部分４０２の統計をとる
と図６（ｂ）の様になる。図６（ａ）、図６（ｂ）の実
線で示されたデータは、図４（ｂ）、図４（ｄ）のデー
タをそれぞれ示すが、一般に文字間隔のヒストグラムは
図６（ａ）、図６（ｂ）に示した点線で示される傾向に
なる。該２つのヒストグラムは、それぞれ２つの固まり
に分けることが可能である。該固まりは一つは文字間隔
の固まり、もう一つは単語間隔の固まりと判断すること
ができる。従って、文字間隔の統計により標準文字間隔
及び単語間隔を推定することが可能となる。一般に文字
間隔のヒストグラムは図６の様なヒストグラムになるが
時として図８の様なヒス卜グラムを得ることがある。該
ヒス卜グラムにはデータの固まりがいくつもある。この
様に固まりが多く存在する場合には、次の方法にて固ま
りを分類する。印刷欧米文字は通常規則正しく並んで印
刷されている。

【００２６】したがって、文字間隔はほぼ等しいはずで
あるが時として文字の形により文字間隔が異なる場合が
生じる。しかしながらその問隔は、標準文字高に比例し
たある値以上にちらばることは無い。したがって、本発
明では、標準文字高の１／１６を固まりと固まりの距離
のしきい値８０５とした。該しきい値８０５と、固まり
８１１、８１２、８１３、８１４、８１５の間隔８０
１、８０２、８０３、８０４とを比較することにより、
固まり８１１と８ｌ２は同一の固まり、固まり８１３と
８１４と８ｌ５は同一の固まりと判断でき、標準文字問
隔及び単語間隔の推定が可能となる。

【００２７】次に文字画像の標準文字幅を推定する。標
準文字幅を推定できれば、文字の切り出し時において連
結文字かの判断及び、切り出し候補位置を推定する手掛
りとなる。標準文字幅の推定は、標準文字間隔及び単語
間隔の推定と同様に文字領域の統計をとる。仮に文字画
像が図４（ａ）及び図４（Ｃ）の場合、文字幅の統計は
図７（ａ）及び図７（ｂ）の実線の様になり、一般的に
点線で示した傾向のデー夕を得る。図７（ａ）に示した
データは固まりが一つであるため該固まりの最大値を標
準文字幅とすることができる。図７（ｂ）に示したデー
タにおいては、固まり７０２と固まり７０３の２つの固
まりが存在する。通常印刷欧米文字は標準文字幅は標準
文字高に非常に近い値であるので、標準文字高７０１の
付近の固まり７０２の最大値を標準文字幅とすることが
可能となる。また文字間隔の推定時と同様に時としてヒ
ス卜グラムが多くの固まりからなる場合図９において
は、固まりと固まりの距離９０１、９０２、９０３とし
きい値９０４とを比較することにより固まり９ｌｌ、固
まり９１２及び固まり９１３は同一の固まりと判断する
ことが可能である。さらに、固まりと固まりの間のしき
い値でもって多くの固まりを分類しても、図１０の様な
３つの固まりになることがある。統計の結果が図１０の
様になるのは、文字画像中にｉやｌ等の文字が含まれて
いるからである。そこで、本発明では、ｉやｌ等の固ま
り１００１の最大値を標準文字幅と判断しない様に、標
準文字幅の７５％の位置１００４よりも大きい領域にお
いて固まりの最大値を捜す。こうすることにより標準文
字幅の約半分の大きさのｉやｌの固まりを除外し、正確
に標準文字幅を推定することを可能にした。以上の様に
して通常の文字画像の文字幅の推定は可能となるが、文
字画像の中には図５（ａ）に示した様な文字画像が存在
する。該文字画像は、ｍ，ｉ，ｌ，ｌ，ｉ，Ｏ，ｎの７
つの文字より横成されており、そのうちｍ，ｉ，ｌ，
ｌ，ｉの５の文字が接触している。従って、標準文字幅
の推定のために縦方向の周辺分布を計数しても、標準文
字幅の推定は不可能である。そこで本発明では、印刷欧
米文字において、文字線幅は標準文字高に比例したある
値以上の太さを持ち、図５（ａ）に見られる底辺部のひ
げの部分は該ある値よりも細い線であることに着目し、
縦方向の周辺分布図５（ｂ）を計数した後、標準文字高
に比例したある値５０８でもって周辺分布を切り捨てる
過程を設ける。該過程により、ある値５０８よりも周辺
分布の値が大きくなる部分のみを文字領域と判断して、
文字領域を表示すると図５（ｃ）に示す様になる。５１
１、５１２、５１３、５１４、５１５、５ｌ６、５ｌ７
はそれぞれｍ，ｉ，ｌ，ｌ，ｉ，ｏ，ｎの文字位置及び
文字幅を示す。５ｌ１〜５ｌ７の７つのデータは、実際
の文字幅よりも多少小さめではあるが、文字として必要
な情報の部分は必ず含んでおり、これらの領域を文字領
域と判断することが可能となる。従って、該データ図５
（ｃ）の文字領域の統計をとることにより、標準文字幅
の推定が可能となる。

【００２８】次に文字画像より単語の抽出を行う。単語
の抽出は前記標準文字間隔及び単語間隔と、文字行の垂
直方向の周辺分布とを比較する（文字画像が図４（ａ）
の場合周辺分布は図４（ｂ）ｒすることにより、その文
字の存在していない部分の大きさから単語間隔を見つけ
ることが可能となり、文字画像中からの単語の抽出が可
能となる。

【００２９】次に該抽出単語から一文字一文字の抽出を
連結成分を抽出することにより行うわけであるが、ここ
でまた一つ問題がある。今仮に抽出単語が図５（ａ）の
様な文字画像であるとする。この場合、連結成分の抽出
を行うとｍｉｌｌｉの５つの文字を抽出してしまう。該
抽出文字はその文字幅から連結文字と判断し、途中で強
制的に切り離さなければならない。該切り離し位置は、
通常、標準文字幅付近の周辺分布の値の小さいところで
行われる。ところが、図５（ａ）の場合、ｍやｉ，ｌと
いった文字が含まれている。この様な文字においては、
ｉやｌの文字は標準文字幅の半分の幅であるため、二文
字連なると一文字分の幅となり二文字一緒に切り出され
てしまい、またｍの場合、標準文字幅の付近において一
度周辺分布の値がかなり小さくなっているため文字の切
れ目と判断され途中で切り離されてしまう可能性が非常
に大きい。そこで本発明は、図５（ｂ）の周辺分布で標
準文字高に比例したある値５０８以上の領域図５（ｃ）
の文字位置５１１一５ｌ７の文字と文字の中間点５２１
〜５２６を求める。切り出し候補位置とする。該切り出
し候補位置５２１〜５２６は図５からも明らかな様に文
字と文字の境を表わしている。従って、文字の切り出し
時において、文字の大きさが標準文字幅から許容できる
大きさよりも大きい場合には該位置を用いることにより
文字の切り出しが可能となり、間違った位置での文字の
切り出しが極めて滅少する。

【００３０】次に一文字一文字の文字の抽出を行う。本
発明においては、文字の抽出は連結成分を抽出すること
によって行っている。欧米文字は、殆どの文字が一つの
連結成分であり、連結成分が一つでない文字において
も、主な連結成分のみでたいていの文字は判断できるた
め該方法は効果的である。連結成分の抽出は、最初に連
結成分の輪郭を抽出する。輪郭を抽出することにより、
文字の位置及び大きさの情報が得られる。輪郭の抽出が
行われると既に求められた標準文字幅と、該抽出文字幅
とを比較する。抽出文字幅が標準文字幅より許容できる
大きさである場合には、該抽出文字を一文字と判断１文
字を抽出する。抽出文字幅が標準文字幅より許容できな
い大きさの場合には、先ず、該抽出領域中に切り出し候
補位置が存在するか否かを調べる。もし、切り出し候補
位置が存在していれば、該位置において文字を切り出す
のが最も適切であるため該位置の範囲内において再度連
結成分の文字の輪郭の抽出を行う。また、文字画像が図
１１（ａ）の様な文字画像であった場合、（この文字画
像においては、標準文字高に対する一定の大きさｌｌ１
０よりも周辺分布の小さい領域の中問点は１１２１〜１
１２５の５箇所しか存在しない。しかしながら、文字は
９文字存在する。）文字画像ｌ１５２の輪郭抽出を行う
と、標準文字幅より許容できない文字幅と判断される。
そこで、切り出し候補位置の存在を確認する。しかし文
字画像１１５２の周辺分布１１４２は最低線幅１１１０
よりも小さくなる値を文字の途中にもっていないので切
り出し候補位置は存在しない。この場合、抽出文字の周
辺分布ｌ１４２の標準文字幅付近の値に着目する。それ
により、文字ｐとｒの接触部分１１３１を捜すことが可
能となリー文字一文字の文字の切り出しが可能となる。
同様に切り出しを繰り返して図１１においては、ｌ１２
１〜１ｌ２５の５箇所の切り出し候補位置の他に、１１
３１〜１１３３の３箇所の切り出し位置を抽出し、９つ
の文字を正確に切り出すことが可能となる。また本発明
は、文字の連結成分の輪郭を抽出した後、抽出文字幅が
一文字幅である場合には文字の抽出を行う方法であるの
で、例えば図ｌ２（ａ）の様な文字画像においても何の
問題も無く文字の抽出を行える。該文字画像はＹ，ｏ，
ｕという３つの無接触の文字である。しかしながら周辺
分布図１２（ｂ）においては、Ｙと０の周辺分布が重な
って１つの周辺分布１２０３を形成している。ここで従
来の様に該周辺分布ｌ２０３の形状から文字を強制的に
切り離そうとするとｌ２０２の位置で切り離すことにな
り、また、周辺分布の大きさにより切り離そうとすると
ｌ２０１の位置で切り離すことになってしまう。いずれ
の位置にせよ、文字を不適切な位置で切り離してしまう
結果になるが、本発明において全く問題は生じない。

【００３１】文字の連結成分の輪郭抽出が適当な大きさ
で行われた後は、文字の連結成分の抽出を行う。本発明
においては、字画像と同じ大きさの領域をもう一つ設け
てある，図１３（ａ）の文字画像１３０１よりＰという
文字を抽出するにあたって先ず図１３（ａ）のＰという
文字の輪郭を別の領域１３０２に描く。次に該輪郭によ
って囲まれた領域をぬりつぶし、図１３（ｂ）を得る。
この後、原画像図１３（ａ）と抽出文字領域の現像図１
３（ｂ）との共通部分を抽出することにより図１３
（Ｃ）に示した画像を得る。該画像図１３（Ｃ）を見て
わかる様に、位置的に重なっているＰとｅの画像から、
Ｐの画像のみをきれいに抽出することが可能となってい
る。

【００３２】以上述べたように、本発明によれば、行方
向の周辺分布により標準文字高の値及び無視する線幅の
値を求め、これらの値を参考にして、行方向と垂直な方
向の周辺分布より文字切り出し候補位置を求めるので、
ひげ部分により繋がった文字において、ひげ部分に影響
を受けることなく、文字切り出し候補位置を求めること
ができる。さらに、文字の切り出しにおいて、連結成分
の輪郭に囲まれた領域の画像を抽出するので、周辺分布
は重なって切り出し位置がわからない文字画像からで
も、一文字のみを抽出することが可能となった。

【００３３】以上のように本発明により、今まで困難と
されていた一文字一文字の文字の切り出しをより正確に
行うことを可能にしたので、該方法を構成要素に用いる
文字認識装置の信頼性を大幅に向上させることが可能と
なった。

【００３４】また本発明は、標準文字高及び文字の連結
成分の抽出を用いているので、特に印刷欧米文字等に適
したものである。

【００３５】

【発明の効果】以上述べた様に本発明は次にあげる多く
の効果を有し、文字認識装置の信頼性を多いに向上させ
るものである。

【００３６】行方向の周辺分布を計数し、該周辺分布の
形状より標準文字高及び無視する線幅の値を得ることに
より、行方向と垂直な方向の文字領域をより正確に求め
ることを可能にし、文字切り出し候補位置を求めること
を可能とした。また、標準文字間隔及び単語間隔、標準
文字長を求めることを可能とした。

【００３７】行方向と垂直な方向の周辺分布で文字の存
在しない部分の統計をとることにより正確な標準文字間
隔及び単語間隔が求まりその結果正確な単語の抽出を可
能にした。

【００３８】行方向と垂直な方向の周辺分布で、標準文
字高に比例したある大きさ以下の領域の統計をとること
により正確な標準文字長が求まり、また該領域の中心を
切り出し候補位置とすることにより、正確な位置での文
字の切り離しを可能にした。

【００３９】標準文字幅の推定時においては、標準文字
高の７５％より大きい領域の固まりの最大値を求めるこ
とによって、文字幅が半分の文字の固まりを誤って選ぶ
可能性を無くし、また、固まりと固まりとの間隔が標準
文字高に比例したある値以下であれば同一の固まりとみ
なすので正確に固まりの分類ができ、その結果正確に標
準文字幅、標準文字間隔及び単語間隔が推定できる。

【００４０】文字の切り出しは、文字の輪郭の内側の領
域のみを抽出するので、縦方向の周辺分布においては切
り出し位置のわからない文字画像であっても正確に対象
の文字のみを抽出することが可能である。

【００４１】文字抽出時において、抽出文字幅が標準文
字幅の許容できる大きさを越えている場合、先ず切り出
し候捕位置を確認し、切り出し候補位置が存在しない場
合のみ周辺分布の値より切り出し位置を求めているの
で、周辺分布の値のみでは間違った位置で切り離してし
まう文字画像においても、より正確な文字の抽出が可能
となった。

【００４２】以上述べた様に本発明は、隣どおしの文字
が接触した文字画像、周辺分布が重なった文字画像、文
字ピッチが一定でない文字画像から一つ一つの文字を正
確に切り出すことを可能にした。その結果、該文字切り
出し方法を構成要素とする文字認識装置の信頼性を大き
く向上させるという効果を有している。

【図面の簡単な説明】

【図１】本発明の文字切り出し手段の用いられる文字認
識装置のブロック図。

【図２】本発明の文字切り出し手段のフローチャートを
示す。

【図３】（ａ）、（ｂ）は本発明の標準文字高の抽捧方
法を説明した図。

【図４】（ａ）〜（ｄ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図５】（ａ）〜（ｃ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図６】（ａ）、（ｂ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図７】（ａ）、（ｂ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図８】本発明の標準文字間隔及び単語間隔、標準文字
長、切り出し候補位置の推定の様子を説明した図。

【図９】本発明の標準文字間隔及び単語間隔、標準文字
長、切り出し候補位置の推定の様子を説明した図。

【図１０】本発明の標準文字間隔及び単語間隔、標準文
字長、切り出し候補位置の推定の様子を説明した図。

【図１１】（ａ）、（ｂ）本発明の文字抽出の様子を説
明した図。

【図１２】（ａ）、（ｂ）本発明の文字抽出の様子を説
明した図。

【図１３】（ａ）〜（Ｃ）本発明の文字抽出の様子を説
明した図。

【符号の説明】

１０１・・・・・・ＣＰＵ１０２・・・・・・画像人力装置１０３・・・・・・認識文字表示装置１０４・・・・・・ＲＯＭｌ０５・・・・・・ＲＡＭ３０１・・・・・・行方向周辺分布３０４・・・・・・標準文字高４０１・・・・・・文字領域４０２・・・・・・文字間隔５０ｌ〜５０７・・文字周辺分布５ｌ１〜５１７・・文字領域５２１〜５２６・・文字切り出し候補位置５０８・・・・・・最低文字線幅７０ｌ・・・・・・標準文字高８０ｌ〜８０４・・固まりの間隔８０５・・・・・・固まりの間隔のしきい値９０ｌ〜９０３・・固まりの問隔９０４・・・・・・固まりの問隔のしきい値１００４・・・・・標準文字高の７５％１ｌ１０・・・・・最低文字線幅１１３１〜１ｌ３３・・・文字切り出し位置１２０ｌ〜１２０２・・・文字切り出し位置

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭62−74184（ＪＰ，Ａ) 特開昭61−196381（ＪＰ，Ａ) 特開昭58−1274（ＪＰ，Ａ) 特開昭58−78267（ＪＰ，Ａ) 特開昭61−201384（ＪＰ，Ａ) 特開昭60−132281（ＪＰ，Ａ) 特開昭62−187987（ＪＰ，Ａ) 特開昭57−62466（ＪＰ，Ａ) 特開昭59−121589（ＪＰ，Ａ) 特開昭62−133585（ＪＰ，Ａ) 特開昭60−48582（ＪＰ，Ａ) 電子通信学会技術研究報告「文字分離」ＰＲＬ83−66Ｐ．１−８ 1984年２月

Claims

(57)【特許請求の範囲】

【請求項１】光学的画像入力手段により紙面等に書か
れた欧米文字画像を読み取り、入力された画像データ中
の文字を認識する文字認識装置の文字切り出し方法にお
いて、行方向の周辺分布より無視する線幅の値を決定し、前記行方向と垂直な方向の周辺分布と前記無視する線幅
の値とにより標準文字幅及び文字切り出し候補位置を推
定し、文字の切り出しは、連結成分の輪郭を抽出するととも
に、文字幅を抽出し、抽出した文字幅と前記標準文字幅
とを比較して、前記文字幅が許容できる大きさの場合は
一文字と判断し、前記輪郭に囲まれた領域の内側のみを
抽出することにより文字切り出しを行ない、前記抽出した文字幅と前記標準文字幅とを比較して、前
記文字幅が許容できない大きさの場合は、前記文字切り
出し候補位置が存在するかどうかを確認し、文字切り出し候補位置が存在する場合は、文字切り出し
候補位置の範囲内にて再度輪郭の抽出を行ない、再度抽
出した輪郭に囲まれた領域の内側のみを抽出することに
より文字切り出しを行ない、前記抽出した文字幅と前記標準文字幅とを比較して、前
記文字幅が許容できない大きさの場合であって、前記文
字切り出し候補位置が存在しない場合は、行方向と垂直
な方向の前記周辺分布の極小値の位置と前記標準文字幅
とにより文字切り出し範囲を決め、その範囲で再度輪郭
の抽出を行ない、再度抽出した輪郭に囲まれた領域の内
側のみを抽出することにより文字切り出しを行なうこと
を特徴とする文字切り出し方法。