JP2728086B2

JP2728086B2 - 文字切り出し方法

Info

Publication number: JP2728086B2
Application number: JP8136479A
Authority: JP
Inventors: 三喜男青木
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1988-04-28
Filing date: 1996-05-30
Publication date: 1998-03-18
Anticipated expiration: 2016-05-30
Also published as: JPH096916A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、紙面上に書かれた
文宇を画像として入力することにより、文字画像から文
字領域を捜し出し、コード番号に変換する文字認識装置
に用いられる文字切り出し方法に関する。

【０００２】

【従来の技術】近年、文字認識装置の急激なる進歩によ
り、さまざまな文書画像から文字領域を自動的に抽出
し、さらに１つ１つの文字を切り出し、認識し、自動的
に文字ファイルが作成できるようになってきており、文
字の切り出し方法はさまざまな方法が考え出されてきて
いる。

【０００３】例えば、一般に多く用いられている方法に
抽出文字行の行方向と垂直な方向の周辺分布を計数する
方法がある。

【０００４】例えば、図４（Ａ）に示すような抽出文字
行の行方向と垂直な方向の周辺分布を計数する。この計
数において、計数値があった否か、すなわち、文字画像
が存在するか否かのみを図に示すと、図４（Ｂ）に示す
ような周辺分布が得られ、この周辺分布の値により、文
字の存在位置を知ることが可能となり、一文字一文字の
文字の切り出しを行なうことができる。しかしながら、
抽出文字行が図４（Ｃ）に示すように、周辺分布の重な
った文字においては、「Ｙ］と「ｏ」のように、重なっ
た文字の部分は文字幅が大きくなる。そこで、複数文字
と判断した場合には、文字ピッチにより文字の切れ目を
推定して、強制的に文字の切り出しを行なっていた。

【０００５】

【発明が解決しようとする課題】しかしながら、このよ
うな方法で文字の切り出しを行なう場合、対象文字画像
が、図４（Ａ）に示すような定ピッチの文字画像におい
ては、正確に文字の切り出しが可能であるが、図４
（Ｃ）に示した様な文字画像、図５（Ａ）に示したよう
な文字画像、図ｌ１（Ａ）に示したような文字画像にお
いては、正確な文字の切り出しは不可能である。図４
（Ｃ）の文字画像、図５（Ａ）の文字画像、図ｌ１
（Ａ）の文字画像は、どれも文字ピッチ不定のプロポー
シヨナル文字である。したがって、従来の方法のよう
に、単に行方向と垂直な方向の周辺分布によるだけで
は、文字位置および文字ピッチを推定することができな
い。

【０００６】図４（Ｃ）のような文字について、従来の
方法にて文字の切り出しを行なう場合について述べる。
図４（Ｃ）は、図４（Ａ）と同ーのフォントの文字画像
である。図４（Ａ）が文字ピッチがー定であるのに対
し、図４（Ｃ）は文字ピッチ不定のプロポーショナル文
字である。図４（Ｃ）の文字画像の行方向と垂直な方向
の周辺分布を示した図４（Ｄ）に着目すると、ほとんど
の部分で図４（Ａ）の周辺分布である図４（Ｂ）とほぼ
同じであるが、「Ｙｏ」の周辺分布に相当する部分が異
なる。図４（Ｄ）は、「Ｙ」の周辺分布と「ｏ」の周辺
分布が重なってしまっている。したがってこのような周
辺分布からは、「Ｙ」と「ｏ」を１つの文字として判断
してしまうか、あるいは、実際と異った場所で切り離し
てしまう。今、仮に２つの文字と判断して強制的に２つ
の文字に分けようとした場合、文字ピッチに着目する
と、図１２に示す１２０１で文字画像を分離し、周辺分
布の形状に着目すると、１２０２で文字画像を分離して
しまう。１２０１，１２０２のどちらの位置で文字画像
を分離しても、「Ｙ」か「ｏ」の文字の途中で切れ、別
の文字と一緒に抽出されてしまい、正確な文字の抽出は
不可能である。

【０００７】次に、図５（Ａ）に示した文字画像より、
従来の方法により文字の切り出しを行なう場合について
述べる。図５（Ａ）は「ｍｉｌｌｉｏｎ」という７つの
文字により構成される単語である。この単語の行方向と
垂直な方向の周辺分布を計数して計数値を図示すると図
５（Ｂ）に示すように、「ｍ」，「ｉ」，「ｌ」，
「ｌ」，「ｉ」の５つの文字の周辺分布５０１，５０
２，５０３，５０４，５０５は連なって一つの周辺分布
の固まりとなっている。したがって、この周辺分布から
は簡単に文字の切れ目を推定することは不可能である。
文字ピッチにより文字の切り離しを行なうようにする
と、「ｉ」，「ｌ」等の文字は標準文字幅の半分の大き
さであるので、２つの文字で１つの文字と判断してしま
い、一緒に切り出される可能性が大きい。また、周辺分
布の形状で判断して切り離すと、「ｉ」，「ｌ」等の文
字はうまく切り離せるかもしれないが、「ｍ」を分解す
る可能性が大であり、文字の切り出しの信頼性が極めて
小さい。

【０００８】また、図１１（Ａ）に示した文字画像の場
合も、図５の場合と同様に周辺分布の形状のみからは文
字の正確な切り出しは不可能である。

【０００９】本発明は、上述したような問題を解決する
もので、その目的とするところは、隣同士の文字が接触
した文字画像から１つ１つの文字を正確に切り出す方法
を提供することにある。

【００１０】

【課題を解決するための手段】請求項１に記載の発明
は、光学的画像入力手段により紙面等に書かれた欧米文
字画像を読み取り、入力された画像データ中の文字を認
識する文字認識装置の文字切り出し方法において、行方
向の周辺分布より無視する線幅の値を決定し、前記行方
向と垂直な方向の周辺分布で、該周辺分布の値が前記無
視する線幅の値より小さい部分の各々の中間部分を文字
切り出し候補位置とすることを特徴とするものである。

【００１１】

【発明の実施の形態】以下、本発明について実施の形態
に基づいて詳細に説明する。

【００１２】文字切り出しの全体プロセスの概要の一例
は、光学的画像入力手段により紙面等に書かれた文字画
像を読み取り、入力された画像デー夕中の文字を認識し
てコード番号に置き換える文字認識装置に用いられるも
のであり、行方向の周辺分布より文字の標準文字高を推定し、無
視する線の太さ決める。行方向と垂直な方向の周辺
分布より、標準文字間隔、単語間隔および標準文字幅を
推定し、単語の抽出を行ない、前記周辺分布より文字切り出し候補位置を推定し、前記抽出単語中の文字の切り出しは文字の連結成分の
輪郭を抽出するとともに、文字高および文字幅を抽出
し、文字幅が標準文字幅から許容できる大きさを越える場
合には、前記文字切り出し候補位置の範囲内にて再度輪
郭の抽出を行ない、前記文字切り出し候補位置が存在しない場合いには、
行方向と垂直な方向の周辺分布により文字切り出しの範
囲を決め再度輪郭の抽出を行ない、該輪郭に囲まれた領域の内側のみを抽出することによ
り文字の切り出しを行なう。

【００１３】文字の標準文字高は、行方向の周辺分布の
形に着目し、周辺分布が急激に変化して大きくなってい
る部の幅を標準文字高とし、該標準文字高の大きさよ
り、文字線の最低線幅を推定することができる。

【００１４】行方向と垂直な方向の周辺分布で文字の存
在しない部分の大きさの統計をとることにより、標準文
字間隔および単語間隔を推定することができる。

【００１５】行方向と垂直な方向の周辺分布で、周辺分
布の値が前記最低線幅より大きい部分の大きさの統計を
とることにより、標準文字幅を推定することができる。

【００１６】標準文字幅の惟定は、前記統計で、標準文
字高の７５％よりも大きい領域において、標準文字高に
最も近い固まりの最大値とすることができる。

【００１７】前記統計中の固まりの分類は、固まりと固
まりとの距離が、標準文字高に比例したある値以下であ
れば同一の固まりとみなすことができる。

【００１８】前記標準文字間隔および単語間隔と、行方
向と垂直な方向の周辺分布とを比較することにより単語
の位置の抽出を行なうことができる。

【００１９】行方向と垂直な方向の周辺分布で、周辺分
布の値が前記最低線幅より小さい部分の、各々の中間部
分を文字切り出し候補位置とすることができる。

【００２０】抽出文字幅より連結文字と判断した場合、
前記文字切り出し候補位置を優先に切り出すことができ
る。

【００２１】周辺分布の値より文字切り出し位置を推定
する場合、１／２文字幅付近およびｌ文字幅付近で最も
周辺分布の値の小さいところを求めることができる。

【００２２】文字の輪郭に囲まれた領域の抽出は、原画
像と同じ大きさの画像領域を設け、該画像領域に文字の
輪郭を描き、輪郭の内側を塗りつぶした後に原画像との
共通部分をとることにより、対象文字のみを抽出するが
できる。

【００２３】文字切り出し手段が構成要素となる文字認
識装置は、図１のブロック図に示すように、ＣＰＵ１０
１、画像入力装置１０２、認識文字表示装置１０３、Ｒ
ＯＭ１０４、ＲＡＭ１０５により横成されている。

【００２４】以下、画像入力装置ｌ０２によりＲＡＭｌ
０５に読み込まれた文字画像中よリ１つ１つの文字を切
り出す文字切り出し方法を、図２に示すフローチャー卜
に基づいて詳細に説明する。

【００２５】画像入力装置１０２によりＲＡＭ１０５に
読み込まれた文字画像を図３（Ａ）とする。まず最初
に、行方向の周辺分布を計数する。文字画像図３（Ａ）
の行方向の周辺分布を計数すると、図３（Ｂ）の３０１
のような形状の周辺分布を得る。欧米文字は、図３
（Ａ）の「ｄ」に相当する文字高の大きな文字、「ｅ」
に相当する文字高の小さな文字、「ｙ」に相当する文字
高は大きいが文字位置が低い文字の３種類の文字から構
成されている。したがって、この３種類の文字から構成
されている文字画像の行方向の周辺分布を計数すると、
通常図３（Ｂ）に示す３０１の様な形状の周辺分布とな
る。周辺分布３０１は、３１１，３１２，３ｌ３の３つ
の領域が合わさってできており、文字画像によっては、
３１２の領域あるいは３１３の領域が存在しない場合が
ある。しかしながら、３１１の領域は常に存在し、この
領域の上限３０２と下限３０３との間の幅３０４は、文
字高の小さな文字の高さ（以下、「標準文字高」と呼
ぶ。）に相当する。したがって、行方向の周辺分布の形
状に着目することにより、標準文字高を知ることが可能
となる。

【００２６】また、印刷欧米活字は、標準文字高と文字
線の太さとの間に、通常、標準文字高：文字線の太さ≧１６：１の関係が成り立つ。したがって、文字画像の垂直方向の
周辺分布に着目した場合、周辺分布の値が標準文字高の
１／１６よりも低い値の部分は文字のひげ部分であり、
あるいは、文字が接触している部分であると判断でき
る。ここで、判断の基準となる標準文字高の１／１６の
値を無視する線幅として求めておく。

【００２７】次の段階として、文字行の垂直方向の周辺
分布により標準文字間隔、単語間隔および標準文字幅を
求める。まず最初に、文字行と垂直な方向に投影した場
合、文字画像が存在するか否かのデータを求める。文字
画像を図４（Ａ）とした場合、文字画像が存在するか否
かのデータすなわち文字画像と垂直の方向に投影したデ
ータは図４（Ｂ）である。領域４０１は文字画像が存在
する部分、領域４０２は文字画像が存在しない部分、す
なわち文字間隔に相当する部分である。文字が存在しな
い部分４０２の統計をとると、図６（Ａ）のようにな
る。同様に、文字画像を図４（Ｃ）とした場合の投影し
たデータ図４（Ｄ）の文字画像が存在しない部分４０２
の統計をとると、図６（Ｂ）のようになる。図６
（Ａ）、図６（Ｂ）の実線で示されたデータは、図４
（Ｂ）、図４（Ｄ）のデータをそれぞれ示すが、一般に
文字間隔のヒストグラムは、図６（Ａ）、図６（Ｂ）に
示した点線で示される傾向になる。この２つのヒストグ
ラムは、それぞれ２つの固まりに分けることが可能であ
る。この固まりは、１つは文字間隔の固まり、もう１つ
は単語間隔の固まりと判断することができる。したがっ
て、文字間隔の統計により標準文字間隔および単語間隔
を推定することが可能となる。一般に文字間隔のヒスト
グラムは、図６のようなヒストグラムになるが、時とし
て図８のようなヒス卜グラムを得ることがある。ヒス卜
グラムには、データの固まりがいくつもある。このよう
に固まりが多く存在する場合には、次の方法にて固まり
を分類する。印刷欧米文字は通常規則正しく並んで印刷
されている。

【００２８】したがって、文字間隔はほぼ等しい筈であ
るが、時として文字の形により文字間隔が異なる場合が
生じる。しかしながら、その問隔は、標準文字高に比例
したある値以上にちらばることはない。したがって、標
準文字高の１／１６を固まりと固まりの距離のしきい値
８０５とした。しきい値８０５と、固まり８１１，８１
２，８１３，８１４，８１５の間隔８０１，８０２，８
０３，８０４とを比較することにより、固まり８１１と
８ｌ２は同一の固まり、固まり８１３と８１４と８ｌ５
は同一の固まりと判断でき、標準文字問隔および単語間
隔の推定が可能となる。

【００２９】次に、文字画像の標準文字幅を推定する。
標準文字幅を推定できれば、文字の切り出し時において
１文字か連結文字かの判断、および、切り出し候補位置
を推定する手掛りとなる。標準文字幅の推定は、標準文
字間隔および単語間隔の推定と同様に文字領域の統計を
とる。仮に、文字画像が図４（Ａ）および図４（Ｃ）の
場合、文字幅の統計は図７（Ａ）および図７（Ｂ）の実
線のようになり、一般的に点線で示した傾向のデー夕を
得る。図７（Ａ）に示したデータは、固まりが１つであ
るため、この固まりの最大値を標準文字幅とすることが
できる。図７（Ｂ）に示したデータにおいては、固まり
７０２と固まり７０３の２つの固まりが存在する。通
常、印刷欧米文字は、標準文字幅が標準文字高に非常に
近い値であるので、標準文字高７０１の付近の固まり７
０２の最大値を標準文字幅とすることが可能となる。ま
た、文字間隔の推定時と同様に、時としてヒス卜グラム
が多くの固まりからなる場合、図９においては、固まり
と固まりの距離９０１，９０２，９０３としきい値９０
４とを比較することによって、固まり９ｌｌ，固まり９
１２および固まり９１３は同一の固まりと判断すること
が可能である。さらに、固まりと固まりの間のしきい値
でもって多くの固まりを分類しても、図１０の様な３つ
の固まりになることがある。統計の結果が図１０のよう
になるのは、文字画像中に「ｉ」や「ｌ」等の文字が含
まれているからである。

【００３０】そこで、「ｉ」や「ｌ」等の固まり１００
１の最大値を標準文字幅と判断しないように、標準文字
幅の７５％の位置１００４よりも大きい領域において固
まりの最大値を探す。こうすることにより、標準文字幅
の約半分の幅の「ｉ」や「ｌ」の固まりを除外し、正確
に標準文字幅を推定することを可能にした。以上のよう
にして、通常の文字画像の文字幅の推定は可能となる
が、文字画像の中には図５（Ａ）に示したような文字画
像が存在する。この文字画像は、「ｍ」，「ｉ」，
「ｌ」，「ｌ」，「ｉ」，「ｏ」，「ｎ」の７つの文字
より横成されており、そのうち「ｍ」，「ｉ」，
「ｌ」，「ｌ」，「ｉ」の５の文字が接触している。し
たがって、標準文字幅の推定のために行方向と垂直な方
向の周辺分布を計数しても、標準文字幅の推定は不可能
である。

【００３１】そこで本発明では、印刷欧米文字におい
て、文字線幅は標準文字高に比例したある値以上の太さ
を持ち、図５（Ａ）に見られる底辺部のひげの部分は、
ある値よりも細い線であることに着目し、行方向と垂直
な方向の周辺分布図５（Ｂ）を計数した後、標準文字高
に比例したある値５０８でもって無視する線幅を決め
て、周辺分布を切り捨てる過程を設ける。この過程によ
り、ある値５０８よりも周辺分布の値が大きくなる部分
のみを文字領域と判断して、文字領域を表示すると、図
５（Ｃ）に示すようになる。５１１，５１２，５１３，
５１４，５１５，５ｌ６，５ｌ７はそれぞれ「ｍ」，
「ｉ」，「ｌ」，「ｌ」，「ｉ」，「ｏ」，「ｎ」の文
字位置および文字幅を示す。５ｌ１〜５ｌ７の７つのデ
ータは、実際の文字幅よりも多少小さめではあるが、文
字として必要な情報の部分は必ず含んでおり、これらの
領域を文字領域と判断することが可能となる。したがっ
て、このデータ図５（Ｃ）の文字領域の統計をとること
により、標準文字幅の推定が可能となる。

【００３２】次に、文字画像より単語の抽出を行なう。
単語の抽出は、前記標準文字間隔および単語間隔と、文
字行の垂直方向の周辺分布とを比較する。文字画像が図
４（Ａ）の場合、周辺分布は図４（Ｂ）であることによ
り、その文字の存在していない部分の大きさから単語間
隔を見つけることが可能となり、文字画像中からの単語
の抽出が可能となる。

【００３３】次に、抽出単語から１文字ごとの抽出を連
結成分を抽出することにより行なうわけであるが、ここ
でまた問題がある。今仮に、抽出単語が図５（Ａ）のよ
うな文字画像であるとする。この場合、連結成分の抽出
を行なうと「ｍｉｌｌｉ」の５つの文字を１文字として
抽出してしまう。この抽出文字はその文字幅から連結文
字と判断し、途中で強制的に切り離さなければならな
い。切り離し位置は、通常、標準文字幅付近の周辺分布
の値の小さいところで行なわれる。ところが、図５
（Ａ）の場合、「ｍ」や「ｉ」，「ｌ」といった文字が
含まれている。このような文字においては、「ｉ」や
「ｌ」の文字は標準文字幅の半分の幅であるため、２文
字連なると１文字分の幅となり２文字が一緒に切り出さ
れてしまい、また「ｍ」の場合、標準文字幅の付近にお
いて一度周辺分布の値がかなり小さくなっているため文
字の切れ目と判断され、途中で切り離されてしまう可能
性が非常に大きい。

【００３４】そこで、図５（Ｂ）の周辺分布で標準文字
高に比例したある値５０８以上の領域図５（Ｃ）の文字
位置５１１〜５ｌ７の文字と文字の中間点５２１〜５２
６を求めて切り出し候補位置とする。この切り出し候補
位置５２１〜５２６は図５からも明らかなように文字と
文字の境を表わしている。したがって、文字の切り出し
時において、文字の大きさが標準文字幅から許容できる
大きさよりも大きい場合にはこのような切り出し位置を
用いることにより文字の切り出しが可能となり、間違っ
た位置での文字の切り出しが極めて滅少する。

【００３５】次に、一文字一文字の文字の抽出を行な
う。文字の抽出は、連結成分を抽出することによって行
なっている。欧米文字は、殆どの文字が１つの連結成分
であり、連結成分が１つでない文字においても、主な連
結成分のみでたいていの文字は判断できるため、この方
法は効果的である。連結成分の抽出は、最初に連結成分
の輪郭を抽出する。輪郭を抽出することにより、文字の
位置および大きさの情報が得られる。輪郭の抽出が行な
われると、すでに求められた標準文字幅と、抽出した文
字幅とを比較する。

【００３６】抽出した文字幅が標準文字幅より許容でき
る大きさである場合には、抽出した文字を１文字と判断
して１文字を抽出する。抽出した文字幅が標準文字幅よ
り許容できない大きさの場合には、先ず、抽出領域中に
切り出し候補位置が存在するか否かを調べる。もし、切
り出し候補位置が存在していれば、その位置において文
字を切り出すのが最も適切であるためその位置の範囲内
において再度連結成分の文字の輪郭の抽出を行なう。

【００３７】また、文字画像が図１１（Ａ）のような文
字画像であった場合（この文字画像においては、標準文
字高に対する一定の大きさｌｌ１０よりも周辺分布の小
さい領域の中問点は１１２１〜１１２５の５箇所しか存
在しない。しかしながら、文字は９文字存在する。）、
文字画像ｌ１５２の輪郭抽出を行なうと、標準文字幅よ
り許容できない文字幅と判断される。そこで、切り出し
候補位置の存在を確認する。しかし文字画像１１５２の
周辺分布１１４２は無視する線幅１１１０よりも小さく
なる値を文字の途中にもっていないので切り出し候補位
置は存在しない。この場合、抽出文字の周辺分布ｌ１４
２の標準文字幅付近の値に着目する。それにより、文字
「ａ」と「ｒ」の接触部分１１３１を探すことが可能と
なり、一文字一文字の文字の切り出しが可能となる。同
様に切り出しを繰り返して、図１１においては、ｌ１２
１〜１ｌ２５の５箇所の切り出し候補位置の他に、１１
３１〜１１３３の３箇所の切り出し位置を抽出し、９つ
の文字を正確に切り出すことが可能となる。

【００３８】また、文字の連結成分の輪郭を抽出した
後、抽出した文字幅が１文字幅である場合には文字の抽
出を行なう方法であるので、例えば図ｌ２（Ａ）のよう
な文字画像においても何の問題も無く文字の抽出を行な
える。この文字画像は「Ｙ」，「ｏ」，「ｕ」という３
つの無接触の文字である。しかしながら、周辺分布図１
２（Ｂ）においては、「Ｙ」と「ｏ」の周辺分布が重な
って１つの周辺分布１２０３を形成している。ここで従
来のように周辺分布ｌ２０３の形状から文字を強制的に
切り離そうとすると、ｌ２０２の位置で切り離すことに
なる。また、周辺分布の大きさにより切り離そうとする
と、ｌ２０１の位置で切り離すことになってしまう。い
ずれの位置にせよ、文字を不適切な位置で切り離してし
まう結果になるが、この方法によれば、全く問題は生じ
ない。

【００３９】文字の連結成分の輪郭抽出が適当な大きさ
で行なわれた後は、文字の連結成分の抽出を行なう。文
字画像と同じ大きさの領域をもう１つ設けてある。図１
３（Ａ）の文字画像１３０１より「Ｐ」という文字を抽
出するにあたって、先ず図１３（Ａ）の「Ｐ」という文
字の輪郭を別の領域１３０２に描く。次に、この輪郭に
よって囲まれた領域を塗りつぶし、図１３（Ｂ）を得
る。この後、原画像図１３（Ａ）と抽出文字領域の画像
図１３（Ｂ）との共通部分を抽出することにより、図１
３（Ｃ）に示した画像を得る。この画像図１３（Ｃ）を
見てわかるように、位置的に重なっている「Ｐ」と
「ｅ」の画像から、「Ｐ」の画像のみをきれいに抽出す
ることが可能となっている。

【００４０】以上述べたように、本発明によれば、行方
向の周辺分布により標準文字高および無視する線幅を求
め、この値を参考に標準字間隔および単語間隔、標準文
字幅を求めるので、正確な標準文字間隔および単語間
隔、標準文字幅が求まる。その結果、正確な単語切り出
しが可能となる。また、文字切り出し時においては、標
準文字幅と比較しながら、切り出し候補位置および周辺
分布を参考に文字の切り出しを行なうので、正確な位置
での文字の切り出しが可能となった。さらに、文字の切
り出しは、文字の連結成分の輪郭に囲まれた領域の画像
を抽出するので、周辺分布では重なって切り出し位置が
わからない文字画像からでも正確に１文字のみを抽出す
ることが可能となった。

【００４１】以上のように本発明により、今まで困難と
されていた一文字一文字の文字の切り出しをより正確に
行なうことを可能にしたので、この方法を構成要素に用
いる文字認識装置の信頼性を大幅に向上させることが可
能となった。

【００４２】また本発明は、標準文字高および文字の連
結成分の抽出を用いているので、特に印刷欧米文字等に
適したものである。

【００４３】

【発明の効果】以上述べたように、本発明によれば、行
方向の周辺分布より無視する線幅の値を決定し、前記行
方向と垂直な方向の周辺分布で、該周辺分布の値が前記
無視する線幅の値より小さい部分の各々の中間部分を文
字切り出し候補位置とすることによって、ひげ部分でつ
ながった文字も分離でき、より正確な位置での文字の切
り離しを可能にし、文字認識装置の信頼性を大きく向上
させるという効果を有している。

【図面の簡単な説明】

【図１】本発明の文字切り出し手段の用いられる文字
認識装置のブロック図である。

【図２】本発明の文字切り出し手段のフローチャート
を示す。

【図３】（Ａ），（Ｂ）は、本発明の標準文字高の抽
出方法を説明した図である。

【図４】（Ａ）〜（Ｄ）は、本発明の標準文字間隔お
よび単語間隔、標準文字幅、切り出し候補位置の推定の
様子を説明した図である。

【図５】（Ａ）〜（Ｃ）は、本発明の標準文字間隔お
よび単語間隔、標準文字幅、切り出し候補位置の推定の
様子を説明した図である。

【図６】（Ａ），（Ｂ）は、本発明の標準文字間隔お
よび単語間隔、標準文字幅、切り出し候補位置の推定の
様子を説明した図である。

【図７】（Ａ），（Ｂ）は、本発明の標準文字間隔お
よび単語間隔、標準文字幅、切り出し候補位置の推定の
様子を説明した図である。

【図８】本発明の標準文字間隔および単語間隔、標準
文字幅、切り出し候補位置の推定の様子を説明した図で
ある。

【図９】本発明の標準文字間隔および単語間隔、標準
文字幅、切り出し候補位置の推定の様子を説明した図で
ある。

【図１０】本発明の標準文字間隔および単語間隔、標
準文字幅、切り出し候補位置の推定の様子を説明した図
である。

【図１１】（Ａ），（Ｂ）は、本発明の文字抽出の様
子を説明した図である。

【図１２】（Ａ），（Ｂ）は、本発明の文字抽出の様
子を説明した図である。

【図１３】（Ａ）〜（Ｃ）は、本発明の文字抽出の様
子を説明した図である。

【符号の説明】

１０１…ＣＰＵ、１０２…画像人力装置、１０３…認識
文字表示装置、１０４…ＲＯＭ、ｌ０５…ＲＡＭ、３０
１…行方向周辺分布、３０４…標準文字高、４０１…文
字領域、４０２…文字間隔、５０ｌ〜５０７…文字周辺
分布、５ｌ１〜５１７…文字領域、５２１〜５２６…文
字切り出し候補位置、５０８…最低文字線幅、７０ｌ…
標準文字高、８０ｌ〜８０４…固まりの間隔、８０５…
固まりの間隔のしきい値、９０ｌ〜９０３…固まりの問
隔、９０４…固まりの問隔のしきい値、１００４…標準
文字高の７５％、１ｌ１０…最低文字線幅、１１３１〜
１ｌ３３…文字切り出し位置、１２０ｌ〜１２０２…文
字切り出し位置。

Claims

(57)【特許請求の範囲】

【請求項１】光学的画像入力手段により紙面等に書か
れた欧米文字画像を読み取り、入力された画像データ中
の文字を認識する文字認識装置の文字切り出し方法にお
いて、行方向の周辺分布より無視する線幅の値を決定
し、前記行方向と垂直な方向の周辺分布で、該周辺分布
の値が前記無視する線幅の値より小さい部分の各々の中
間部分を文字切り出し候補位置とすることを特徴とする
文字切り出し方法。