JPH0731714B2

JPH0731714B2 - 文字成分切出し方法

Info

Publication number: JPH0731714B2
Application number: JP61122414A
Authority: JP
Inventors: 真加藤; 弘晏高橋
Original assignee: インタ−ナショナルビジネスマシ−ンズコ−ポレ−ション
Priority date: 1986-05-29
Filing date: 1986-05-29
Publication date: 1995-04-10
Anticipated expiration: 2010-04-10
Also published as: EP0248262A2; JPS62281085A; US4776024A; DE3787206T2; EP0248262A3; DE3787206D1; EP0248262B1

Description

【発明の詳細な説明】 A.産業上の利用分野本発明は、汎用的なプロセツサ及びメモリを有するハー
ドウエア機構において、走査した文書の量子化画像から
高速に且つ効果的に文字及び文字行を切出す方法に係
る。

B.従来技術とその問題点印刷文字OCRは機械で印刷された大量の文字を読取るこ
とが目的とされるが、印刷文書は手書き文字帳票と異な
り、特定のドロツプアウトカラーで印刷された文字枠内
にきちんと印刷されるという形態をとらない。文字は印
刷機側で独自に設定される文字ピツチに従つて帳票上に
印刷される。またOCRに読取らせるべき帳票は、印刷さ
れたままの高品質なオリジナル帳票ばかりでなく、それ
らのコピーされたものであつたりする。こういつたコピ
ー原稿には、ノイズ成分の混入を避けることができず、
走査されたイメージからノイズの影響を除き、有効な文
字部分のみを検出する必要がある。

OCRによる文字の読取りでは、上述のようなノイズに加
えて、原稿のスキユーも問題である。例えば原稿フイー
ドタイプのスキヤナではフイード時にスキユーが生じる
ことがあり、フラツトベツドタイプのスキヤナでは、読
取り台に置いた原稿が傾いていることがある。またコピ
ー原稿の場合には、既に原稿が傾いたままでコピーされ
てしまつていることもある。

従来のOCRは、通常、投影等によりまず１行分の文字領
域を切出し、次に確定した１行の領域から１文字毎の領
域を切出すという手法をとつている。しかし、原稿がス
キユーしていて、文字行と投影方向が平行になつていな
いと、最初の文字行切出しが困難になる。この問題は、
特開昭58−106665号公報、特開昭58−123169号公報、特
開昭58−146973号公報、及びJ.Kim“BASELINE DRIFT CO
RRECTION OF HANDWRITTEN TEXT"IBM Technical Disclos
ure Bulletin Vol.25、No.10（1983年３月）5111〜5114
頁に記載されているように、文字行を幾つかのブロツク
に分割して、ブロツク毎に投影をとるという手法で解決
することができる。しかし、これらの文献は具体的に黒
地部分即ち文字成分をどのようにして検出するかという
ことについては言及していない。一般に、１ドツトだけ
黒となつているパターンをもつて文字成分が検出された
と判定するのはノイズに対し敏感になり過ぎるため好ま
しくない。一方、画像処理でよく行われるように、３ド
ツト×３ドツト程度のマスクを用意し、このマスク内に
現われる黒ドツト数が一定値以上なら文字成分を検出し
たと判定する方法は、その実現のために特別な回路を必
要とし、またソフトウエアで同等な機能を実現しようと
なると、ビツト処理が必要なため処理速度が遅くなる。

確定した文字行から個々の文字を切出す場合は、原稿の
スキユーはそれ程問題ではないが、例えば横書き文書の
場合には文字間が行間に比べて狭いため、文字間にノイ
ズがあると、隣接する２文字が連結してしまうため、強
制切出しを行う必要がある。米国特許第3629826号は、
このような連結文字あるいは接触文字を分離するための
手法を開示している。それによれば、文字の量子化され
たビデオ情報からリーデイングストローク端及びラツギ
ングストローク端を示すパラメータを検出して重み付け
し、次いで重み付けられたパラメータ間の差に基いて分
離のためのゲート信号を発生する。これはハード、ソフ
ト共にかなり複雑であり、もつと簡単な文字切出し手法
が望まれる。

文字及び文字行の切出しで一般的に行われているのは、
黒ドツトのヒストグラムを作成してそれを所定の閾値と
比較することによつて行間及び文字間を決めるものであ
ろう。しかしヒストグラムを作成するためには、量子化
画像全体に対して黒ドツト数の加算を行なう必要があ
り、これは一般のマイクロプロセツサにとつては負荷の
大きな処理であるため、専用の回路を準備しない場合に
は、切出し処理全体の処理速度の低下を招き、専用の回
路を準備するとその分だけコスト高になる。従つて本発
明の目的は、特別な専用回路の付加なしに、簡単な手順
で文字成分を切出す方法を提供することにある。

C.問題を解決するための手段本発明の文字成分切出し方法は、文書を走査し、それに
よつて得た画像情報を２レベルで量子化し、量子化画像
の第１の方向に並んだビットに対しｍビット目毎のORを
とることにより第１の方向の各ビット列毎にｍビットの
ORグループを生成し（ｍは２以上の整数）、各ORグルー
プにおいて黒ビットを計数し、それによって得た計数値
を第１の方向と直角の第２の方向に沿って１つずつずら
しながら連続するｎ個の計数値の和を順次に計算し（ｎ
は２以上の整数）、これらの和を所定の閾値と比較して
閾値未満から閾値以上に変わった点を文字領域開始点と
して登録し、閾値以上から閾値未満に変わる前の点を文
字領域終了点として登録することにより文字成分を切出
すことを特徴にしている。この方法は、通常のマイクロ
プロセツサが備えているOR命令を利用して簡単に実行で
き、その正確さはｍ×ｎのマスクを用いる従来の手法と
変わらない。

D.実施例の説明以下で説明する実施例では横書きの文書を想定し、文字
行の方向とスキヤナの主走査方向とを一致させている。
また、文字行の傾きに対処するため、前述の従来技術と
同様のブロツク化手法を採用する。しかし、本発明の方
法自体は縦書きの文書にも、ブロツク化を行わない場合
にも等しく適用できるものである。文書は印刷文書でも
手書き文書でもかまわない。

Ｄ−1.原理本発明は、原理的には、ｍ×ｎのマスクを縦、横に各々
１ドツトずつずらせながら、マスク内に存在する黒ドツ
トを計数し、その値が所定値以上の場合に有効な黒成分
を検出したと判定する従来の手法に似ている。しかし、
この従来手法ではマスクをすべてのドツトに対して作用
させなければならないが、本発明の方法は、マスクとの
関連で云えばｍドツト又はｎドツトずつの移動に相当
し、しかも文字成分切出しの精度は１ドツトずつ移動さ
せた場合とほぼ同じである。

本発明に従う文字成分切出し方法の流れを第１図に示
す。スキヤナにより文書を走査するステツプ１及び走査
した情報を２レベルで量子化（各画素を１ビツトで表わ
す）してメモリに記憶するステツプ２については周知の
技術であるから、別段の説明を要しないであろう。ステ
ツプ３では、量子化画像の第１の方向、即ち投影方向と
平行な切出し方向において順次にｍビツト目毎のORをと
ることにより、最終的にｍビツトのORグループを生成す
る。ｍビット目毎のORをとるとは、第１ビットから始め
ると、第１ビット、第ｍ＋１ビット、第2m＋１ビット、
第3m＋１ビット・・・第nm＋１ビットのOR操作になり、
第２ビットから始めると、第２ビット、第ｍ＋２ビッ
ト、第2m＋２ビット、第3m＋２ビット・・・第nm＋２ビ
ットのOR操作になり、以下同様に、第ｍビットから始め
ると、第ｍビット、第2mビット、第3mビット・・・第nm
ビットのOR操作になる。簡単のため、各OR操作の最初の
２ビットに着目すると、第１ビットと第ｍ＋１ビット、
第２ビットと第ｍ＋２ビット、第３ビットと第ｍ＋３ビ
ット以下同様に第ｍビットと第2mビットをそれぞれORす
ることになり、これは第１ビットから第ｍビットまでの
連続するｍビットと、その次の第ｍ＋１ビットから第2m
ビットまでの連続するｍビットとをビット対応にORする
ことに相当する。従ってステップ３は、例えば横方向の
文字行を切出す場合は、量子化画像の各走査ラインのビ
ット列を主走査方向（横方向）に沿ってｍビットずつの
グループに分け、それぞれの走査ラインで全ｍビットグ
ループ（例えば各走査ラインを1728ビットとし、ｍを４
とすると、432個の４ビットグループができる）のORを
とることにより達成される。ただし、あとで説明するよ
うに、プロセツサのアーキテクチヤによつてはこのOR操
作をもつと効率よく行える。ステツプ３のOR操作の結果
生成されるｍビツトグループの数は、量子化画像の第２
の方向、即ち切出し方向と直角の方向に沿つたドツトの
数に等しい。ステツプ４では、これらのｍビツトグルー
プにおける黒ビツト（例えば２進‘1'）をグループ毎に
計数する。これらの計数値は第２の方向に沿つて並べら
れる。ステツプ５では、黒ビツト計数値を第２の方向に
沿つて１つずつずらしながら連続するｎ個分の和を計算
する。具体的に云うと、まず第２の方向に沿つた最初の
計数値からｎ番目の計数値までの和を計算し、次に２番
目の計数値から（ｎ＋１）番目の計数値までの和を計算
し、以下同様にして最終的には、ｉ番目の計数値から
（ｎ＋ｉ−１）番目即ち最後の計数値までの和を計算す
る。詳細については後述するが、このステップ５はノイ
ズと有効文字成分を判別するために行われる。最後のス
テツプ６では、それぞれの加算結果を所定の閾値と比較
することによつて文字成分を切出す。なお、ｍ及びｎは
２以上の整数値であるが、使用するスキヤナの解像度や
処理単位によつて異なり、一般には従来のマスクと同様
に３又は４で十分である。

Ｄ−2.システム構成本発明の方法は第２図に示したような文字認識システム
で利用できる。このシステムは、全体の制御を受持つ制
御装置10、印刷文書又は手書き文書を走査して２レベル
の量子化を行うスキヤナ12、スキヤナ12からの量子化画
像が書込まれるメモリ14、量子化画像を走査して文字領
域を切出す切出し論理16、及び切出された文字領域内の
文字を認識する認識論理18から成つている。制御装置10
としては、例えばインテル社の8086のような16ビツトの
マイクロプロセツサを用いることができる。切出し論理
16以外の部分は従来のもので十分である。制御装置10
は、スキヤナ12からの量子化画像をメモリ14に書込んだ
後、切出し論理16を起動して文字行及び文字の切出しを
行わせる。本実施例では16ビツトのマイクロプロセツサ
を使うので、メモリ14の読出し及び書込みは16ビツトの
ワードを単位として行われる。

次に、制御装置10の制御のもとに切出し論理16で実行さ
れる文字行及び文字の切出しについて説明する。

Ｄ−3.文字行切出し文字行切出し処理は、スキヤナ12で読取つた量子化画像
の中から各文字行を個別に抽出する処理である。しか
し、文書が多数の文字行を含んでいて、スキヤナ12によ
る読取りの際に傾いていたとすると、メモリ14には傾い
た状態のままで量子化画像が書込まれてしまう。このよ
うな量子化画像に対し横方向の投影によつて文字行を切
出そうとすると、隣接する幾つかの文字行の成分が重な
り合つてしまうため個々の切出しが困難になる。第３図
（ａ）の例で説明すると、メモリ14に書込まれている量
子化画像20において文字行22、24及び26が傾いていた場
合は、右側に示した太い実線部分28が１つの文字行とし
て検出されてしまう。しかし、従来技術のところでも述
べたように、画像20を投影方向（横方向）と直角に複数
（第３図（ａ）の例では４つ）のブロツクに等分割し、
それぞれのブロツクで個別に投影を行うと、第３図
（ｂ）に示したように、文字行成分をうまく抽出するこ
とができる。本実施例でもこのようなブロツク化を行う
ものとする。第３図（ａ）の例において、画像20の幅を
1728ビツト（108ワード）とすると、各ブロツクの幅は4
32ビツト（27ワード）になる。勿論、文書のスキユーが
問題にならないのであれば、ブロツク化は不要である。

スキヤナ12からの量子化画像は、スキヤナ12の主走査方
向に沿つて１ワードずつ順次にメモリ14に書込まれ、１
ライン分（上述の例では108ワード）の書込みが終了す
ると、副走査方向に１ライン進んだ画像データが次に書
込まれる。このようにして量子化画像全体の書込みが完
了すると、切出し論理16は前述の原理に従つてブロツク
毎に文字行の切出しを行う。この様子を第４図及び第５
図に示す。

第４図中の30は、第３図の（ｂ）の如き１ブロツクにお
ける特定ラインのデータを表わし、本実施例では27ワー
ド（432ビツト）ある。このように、各ブロツクの幅は
マイクロプロセツサのバス幅（ここでは16ビツト）の整
数倍であることが好ましいが、そうでない場合は不要な
ビツトをマスクする必要がある。前にも述べたように、
従来はライン全体の黒ビツトを計数していたが、これは
マイクロプロセツサにとつては効率が悪い。そこで代替
として、本発明ではｍビツト（第４図の場合は４ビツ
ト）のグループのORをとる。ただし、16ビツトのマイク
ロプロセツサでラインデータを４ビツトずつORしていく
のは得策ではないので、第４図の例ではワード単位で最
初のOR操作32を実行し、その結果34を上位バイトと下位
バイトに分けて次のOR操作36を実行し、１バイトのOR結
果38を同様に上位ニブルと下位ニブルに分けて最後のOR
操作40を実行する。かくして、最終的に４ビツトに集約
されたORパターン42が得られる。ラインデータ30を４ビ
ツトずつに分けてそれらのORをとつても同じ結果になる
が、第４図の方が効率がよい。一般に、マイクロプロセ
ツサの処理単位あるいはバス幅をＭビツトとすると、ｍ
＝M/2^p（ｐは整数）の関係にあれば第４図の方法を実行
できる。云い換えれば、ｍをそのように選べばよい。

OR操作32、36及び40はマイクロプロセツサのOR命令で実
現できる。最初のOR操作32は、第１オペランドを特定の
汎用レジスタ（全ゼロに初期設定しておく）にし、第２
オペランドをメモリ14における各ワード０〜26のアドレ
スにして、結果を第１オペランドの汎用レジスタに書戻
すようにすればよい。そうすると27回のメモリアクセス
で１ワードのOR結果34が得られる。汎用レジスタでバイ
ト単位のアクセスが可能であれば、１ワードのOR結果34
を容易に上位バイト及び下位バイトに分けてそれらのOR
をとることができる。しかしバイトアクセスができない
場合は、シフト命令によつて上位バイト及び下位バイト
を分ける必要がある。１バイトのOR結果38から４ビツト
のOR結果42を得る場合も同じことが云える。

第４図の動作はブロツク中の全ラインについて繰返さ
れ、これにより、第５図の“OR結果”のところに示した
ような４ビツトのパターンが得られる。各４ビツトパタ
ーンの黒ビツト数をテーブルにより、又は直接計数する
ことで、０〜４の範囲の黒ビツト出現頻度が得られる。
次に、これらの出現頻度から有効な行成分を検出する手
法を概念的に説明する。

第３図の斜線部分22、24及び26が行切出しの対象となる
部分である。この部分は十分黒ビツトが連続しているは
ずであるから、そこを横切る走査ラインにおいては、黒
ビツトの頻度が４になることが予想される、また縦方向
にも連続して頻度４のラインが続くことも予想される。
一方、散発的に発生するノイズの場合は、黒ビツトの出
現頻度が４で、且つそれが数ライン続けて発生すること
は極めて稀であると考えられる。従つて、第５図の“頻
度”のところに示した頻度分布を縦方向に考察して、あ
る面積内での頻度の合計値をとれば、ノイズと有効文字
成分を区別することができる。具体的には、注目する面
積の高さをｎとすると、隣接するｎ本の走査ラインの頻
度値を合計し、この操作を走査ラインを１本ずつずらし
ながら繰返す。そうすると、第５図の“合計値”のとこ
ろに示したような一連の合計値がライン毎に得られる。
第５図の例ではｎ＝３になつており、各ラインの頻度値
をその上下１本ずつのラインの頻度値に加算することに
より、当該ラインに対応する頻度合計値が得られる。た
だしライン０の場合は、その上のラインがないのでこの
ような加算を行えず、合計値のところが空白になつてい
る（一番下のラインも同様である）。頻度が０の仮想ラ
インを設定すれば加算は可能である。

合計値の範囲は０から12までである。有効行成分領域
は、これらの合計値を所定の閾値と比較することにより
検出される。その場合、合計値が閾値以上であれば、行
成分となるべき黒成分が存在しているものとし、閾値未
満であれば、そのような黒成分が存在していないものと
する。そして合計値を上から順に見ていつたときに、閾
値未満から閾値以上に変つた走査ラインの番号を文字領
域開始点s_iとして登録し、閾値以上から閾値未満に変わ
る１つ手前の走査ラインの番号を文字領域終了点e_iとし
て登録する（第３図（ｂ）参照）。第５図は閾値を７に
した例を示しており、ライン番号５及び12がそれぞれ文
字領域開始点及び文字領域終了点として登録される。開
始点から終了点までのライン数（今の場合は８）が有効
行成分の高さを表わす。（実際にはこれよりもつと高
い。）第４図及び第５図に示したｍ＝４、ｎ＝３及び閾値＝７
の例は、３×４のマスクを用いて量子化画像全体を走査
し、マスク内に存在する黒ドツトの数を数えて黒成分を
検出する従来の手法とほぼ同等の効果を持つにもかかわ
らず、専用のハードウエアを必要とせず、高速に処理で
きるという利点がある。ｍ、ｎ及び閾値の各値は、フオ
ントサイズ、スキヤナの解像度、マイクロプロセツサの
アーキテクチヤ等に応じて適宜選択されるものである。
ｍ及びｎは２以上の整数であるが、一般には３又は４で
十分であろう。閾値は、頻度合計値の範囲の中間値（上
の例では６）より大きい値が望ましい。上述の例でｍを
３ではなくて４にしたのは、マイクロプロセッサ内にお
いては処理単位を２のべきにするのが好ましいからであ
り、この制限がなくてもよいのであればｍ＝３でもかま
わない。

また、例えば16ドツト/mm程度の高解像度スキヤナを用
いた場合には、副走査方向（縦方向）のサンプリングを
１走査ラインおきに行つてもよい。理由は、この程度の
高解像度になると、ノイズ以外の有効な黒成分は必らず
２走査ライン以上にまたがるので１ラインおきにサンプ
リングしても十分なためと、画像データ量が増えるので
全ラインのサンプリングを行うと、本発明の高速である
という利点が失われるからである。

第４図及び第５図に示した方法による文字成分即ち文字
行の成分の切出しは十分に正確であるが、原文書が印刷
文書の場合は、システム又はユーザから与えられる行ピ
ツチ情報及びフオントサイズ情報を用いることによつ
て、切出しをより確かなものにすることができる。第３
図（ｂ）の例で説明すると、まず（e₁−s₁）がフオント
サイズ（高さ）に関して所定の範囲内、例えばフオント
高さの0.8倍から1.2倍の間、にあれば、s₁及びe₁によつ
て囲まれる部分（太線部分）を第１行の成分として確定
できる。次は、確定した第１行成分の中心座標に行ピツ
チを加えたところを第２行成分の予測中心座標とし、そ
の上下で例えばフオント高さの0.6倍程度の範囲を調べ
て、s_iとe_i（ｉ＝２、３、・・・）によつて囲まれる部
分がこの範囲と重なりをもち且つ（e_i−s_i）がフオント
高さの0.8倍から1.2倍の間にあれば、s_i及びe_iによつて
囲まれる部分を第２行の成分として確定できる。以下、
同様の計算を最後の行成分確定まで繰返せばよい。量子
化画像を複数のブロツクに分けた場合は、各ブロツクで
同じ計算を行うことになる。

（e_i−s_i）がフオント高さの1.2倍以上であれば、当該
ブロツクを更に細分化して第４図及び第５図の方法を再
び実行すればよい。（e_i−s_i）がフオント高さの0.8倍
以下であれば、e_i+1、e_i+2等とs_iとの差を調べ、（e_i+j
−s_i）が上記の範囲に入れば、s_iからe_i+jまでを１つの
行成分とする。なお、第１行成分が確定できなかつた場
合には、行成分予想位置に行ピツチを加えた位置を中心
として第２行成分を検出し、後から第１行成分の存在域
を算定すればよい。

Ｄ−4.文字切出し理論的には、第４図及び第５図の方法で切出した各文字
行成分を90度回転して、第４図及び第５図の方法を適用
すると、単一文字の領域を個別に切出すことができる。
しかし、通常のマイクロプロセツサで画像を回転させる
のは大きな負担となり、またメモリ14に書込まれている
量子化画像を縦方向にも読出そうとするとアクセス回路
が複雑になるので、ここでは通常のマイクロプロセツサ
で容易に実施できる方法を説明する。

原理のところで説明したように、本発明は切出し方向即
ち投影方向に沿つてｍビツトのORをとることを基本にし
ている。従つて文字切出しの場合は、文字切出し方向と
直角の主走査方向に沿った連続するｍ本の走査ラインで
対応する位置にあるｍ個のビツトが１グループを作るこ
とになる。本実施例では、このようなグループを１回の
アクセスでメモリ14から読出して他のグループとORする
代りに、前に切出した所定数のビット（ブロック化を行
った場合は432ビット）からなる文字行成分と同じ長さ
を持つたｍ個のレジスタを用意し又は仮想的に同レジス
タ用の領域をメモリ中に用意し、その中にｍ本目毎の走
査ラインのOR結果を書込む。そうすると、最終的にはｍ
個のレジスタの対応する位置にあるｍビツトのグループ
が原理のところで説明したOR結果を含むことにする。例
えば、第４図及び第５図の方法により、ｉ番目からｋ番
目までの走査ラインが有効行成分として切出されたとす
ると、ｍ個のレジスタR₁〜R_mには次のようなOR結果が書
込まれる。

R₁＝〔ｉ〕＋〔ｉ＋ｍ〕＋〔ｉ＋2m〕＋・・・＋〔ｉ＋
k₁ｍ〕（ｉ＋k₁ｍ≦ｋ） R₂＝〔ｉ＋１〕＋〔ｉ＋１＋ｍ〕＋・・・＋〔ｉ＋１＋
k₂ｍ〕（ｉ＋１＋k₂ｍ≦ｋ） R_m＝〔ｉ＋ｍ−１〕＋〔ｉ＋ｍ−１＋ｍ〕＋・・・＋
〔ｉ＋ｍ−１＋k_mｍ〕（ｉ＋ｍ−１＋k_mｍ≦ｋ）上式において、それぞれの大括弧〔〕は、大括弧内の
番号を持つた走査ラインのデータ（長さは、切出した有
効行成分と同じ）を表わし、“＋”はビツト毎のOR演算
を表わす。これらのOR演算は、各レジスタR₁〜R_mを第１
オペランドとし、走査ラインデータを第２オペランドと
して、演算結果を第１オペランドレジスタに書込むOR命
令を用いて容易に実行できる。なお、切出した行成分の
長さが１ワード（16ビツト）よりも長い場合には、ワー
ド毎に上述の演算が必要である。あとは文字行切出しの
ときと同じく、切出し方向（今の場合は副走査方向）に
沿つたOR結果の黒ドツト数を係数して、それと直角方向
即ち主走査方向に頻度分布を作成し、その中で頻度値を
１つずつずらして連続するｎ個の頻度値の合計を計算す
る。頻度合計値が所定の閾値以上であれば対応する部分
を文字成分存在域とみなす。

ｍ及びｎの値は、使用するスキヤナの解像度やフオント
サイズにもよるが、通常であればノイズ以外の有効文字
成分は３ドツト以上連続しているので、ｍ及びｎを３に
しておけばよい。そうすると、頻度合計値は０〜９まで
の値をとることになり、従つて閾値としては中間値より
も大きい５を選ぶことができる。これは、３×３のマス
クを用いて量子化画像全体を１ドツトずつ走査する従来
の手法とほぼ同様の効果がある。ｍとｎを３にして文字
を切出す例を第６図に示す。第６図は、第５図を90度回
転してその中のOR結果を３ビツトにしたものに相当して
いる。第６図の例では、ビツト位置５〜11、17、18等が
有効文字成分を含むものとみなされる。

次に、システム又はユーザから与えられる文字ピツチ情
報及びフオントサイズ情報（幅）を用いて個々の文字を
切出す方法を説明する。まず、第６図の合計値の部分を
左端から順に閾値以上かどうかを調べ、閾値以上の連続
する長さがフオント幅Ｗの例えば0.8倍から1.2倍の範囲
であれば、その部分を最初の文字領域として確定する。
確定した文字領域のＸ方向（副走査方向）中心座標を
X₁、文字ピツチをＰとすると、次文字のＸ方向中心座標
X₂は次式で表わされる。

X₂＝X₁＋Ｐ従つて、 X₂＋（P/2）±（Ｐ−Ｗ）/2 の範囲で頻度合計値が閾値未満の部分（０のところが好
ましい）を検出すれば、そこが次の文字の予想文字枠の
右端となる。この範囲内に閾値未満の部分がなければ、
隣接する２文字が接触していると考えられる。このよう
な場合には、予想範囲内で頻度分布が極小のところを切
出し点に選ぶことができる。左端も同様にして求めるこ
とができる。予想文字枠の右端及び左端が決まると（当
該文字を含む行領域の上端及び下端は文字行切出しのと
きに既に求められている）、その範囲内で再度横の投影
を行うことにより当該文字の上下端を検出し、文字に外
接する矩形を確定する。この外接矩形のＸ方向中心座標
を新たにX₂と定義する。以下同様のプロセスを繰返せ
ば、各文字行における個々の文字をすべて切出すことが
できる。

E.発明の効果本発明によれば、通常のマイクロプロセツサを用いて高
速且つ効果的に文字成分を切出すことができる。

【図面の簡単な説明】

第１図は本発明の方法を示す流れ図。第２図は本発明を実施し得る文字認識システムの一例を
示すブロツク図。第３図は文書の傾きに対処するためのブロツク化手法を
示す図。第４図は文字行切出しのためのOR操作を示す図。第５図は第４図でのOR結果から有効行成分を確定する様
子を示す図。第６図は第５図と同様にして文字成分を確定する様子を
示す図。

Claims

【特許請求の範囲】

【請求項１】文書を走査し、前記走査によって得た画像情報を２レベルで量子化し、量子化画像の第１の方向において、第１乃至第ｍビット
の各々とそれらのビットからｍ番目、2m番目、3m番目・
・・のビットとのORをとることにより前記第１の方向の
各ビット列毎にｍビットのORグループを生成し（ｍは２
以上の整数）、前記第１の方向と直角の第２の方向に存在する、前記OR
グループの各々において黒ビットを計数し計数値を得、前記第２の方向に沿って連続するｎ個の前記計数値の和
を（ｎは２以上の整数）、前記第２の方向に１つずつず
らしながら順次計算し、前記和を所定の閾値と比較して閾値未満から閾値以上に
変わった点を文字領域開始点として登録し、閾値以上か
ら閾値未満に変わる前の点を文字領域終了点として登録
することにより文字成分を切出す、ことを特徴とする文字成分切出し方法。
【請求項２】前記量子化画像のビットを前記第１の方向
に沿ってＭビットずつグループ化し（Ｍ＝2^pm;pは整
数）、各グループのORをとることによりＭビットのORグ
ループを生成し、該ORグループを半分に分けてそれらの
ORをとることによりM/2ビットのORグループを生成し、
以下同様にして最終的にｍビットのORグループを生成す
る特許請求の範囲第１項に記載の方法。