JPH0731714B2 - 文字成分切出し方法 - Google Patents

文字成分切出し方法

Info

Publication number
JPH0731714B2
JPH0731714B2 JP61122414A JP12241486A JPH0731714B2 JP H0731714 B2 JPH0731714 B2 JP H0731714B2 JP 61122414 A JP61122414 A JP 61122414A JP 12241486 A JP12241486 A JP 12241486A JP H0731714 B2 JPH0731714 B2 JP H0731714B2
Authority
JP
Japan
Prior art keywords
bit
character
bits
threshold value
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61122414A
Other languages
English (en)
Other versions
JPS62281085A (ja
Inventor
真 加藤
弘晏 高橋
Original Assignee
インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション filed Critical インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション
Priority to JP61122414A priority Critical patent/JPH0731714B2/ja
Priority to DE87107234T priority patent/DE3787206T2/de
Priority to EP87107234A priority patent/EP0248262B1/en
Priority to US07/052,814 priority patent/US4776024A/en
Publication of JPS62281085A publication Critical patent/JPS62281085A/ja
Publication of JPH0731714B2 publication Critical patent/JPH0731714B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 A.産業上の利用分野 本発明は、汎用的なプロセツサ及びメモリを有するハー
ドウエア機構において、走査した文書の量子化画像から
高速に且つ効果的に文字及び文字行を切出す方法に係
る。
B.従来技術とその問題点 印刷文字OCRは機械で印刷された大量の文字を読取るこ
とが目的とされるが、印刷文書は手書き文字帳票と異な
り、特定のドロツプアウトカラーで印刷された文字枠内
にきちんと印刷されるという形態をとらない。文字は印
刷機側で独自に設定される文字ピツチに従つて帳票上に
印刷される。またOCRに読取らせるべき帳票は、印刷さ
れたままの高品質なオリジナル帳票ばかりでなく、それ
らのコピーされたものであつたりする。こういつたコピ
ー原稿には、ノイズ成分の混入を避けることができず、
走査されたイメージからノイズの影響を除き、有効な文
字部分のみを検出する必要がある。
OCRによる文字の読取りでは、上述のようなノイズに加
えて、原稿のスキユーも問題である。例えば原稿フイー
ドタイプのスキヤナではフイード時にスキユーが生じる
ことがあり、フラツトベツドタイプのスキヤナでは、読
取り台に置いた原稿が傾いていることがある。またコピ
ー原稿の場合には、既に原稿が傾いたままでコピーされ
てしまつていることもある。
従来のOCRは、通常、投影等によりまず1行分の文字領
域を切出し、次に確定した1行の領域から1文字毎の領
域を切出すという手法をとつている。しかし、原稿がス
キユーしていて、文字行と投影方向が平行になつていな
いと、最初の文字行切出しが困難になる。この問題は、
特開昭58−106665号公報、特開昭58−123169号公報、特
開昭58−146973号公報、及びJ.Kim“BASELINE DRIFT CO
RRECTION OF HANDWRITTEN TEXT"IBM Technical Disclos
ure Bulletin Vol.25、No.10(1983年3月)5111〜5114
頁に記載されているように、文字行を幾つかのブロツク
に分割して、ブロツク毎に投影をとるという手法で解決
することができる。しかし、これらの文献は具体的に黒
地部分即ち文字成分をどのようにして検出するかという
ことについては言及していない。一般に、1ドツトだけ
黒となつているパターンをもつて文字成分が検出された
と判定するのはノイズに対し敏感になり過ぎるため好ま
しくない。一方、画像処理でよく行われるように、3ド
ツト×3ドツト程度のマスクを用意し、このマスク内に
現われる黒ドツト数が一定値以上なら文字成分を検出し
たと判定する方法は、その実現のために特別な回路を必
要とし、またソフトウエアで同等な機能を実現しようと
なると、ビツト処理が必要なため処理速度が遅くなる。
確定した文字行から個々の文字を切出す場合は、原稿の
スキユーはそれ程問題ではないが、例えば横書き文書の
場合には文字間が行間に比べて狭いため、文字間にノイ
ズがあると、隣接する2文字が連結してしまうため、強
制切出しを行う必要がある。米国特許第3629826号は、
このような連結文字あるいは接触文字を分離するための
手法を開示している。それによれば、文字の量子化され
たビデオ情報からリーデイングストローク端及びラツギ
ングストローク端を示すパラメータを検出して重み付け
し、次いで重み付けられたパラメータ間の差に基いて分
離のためのゲート信号を発生する。これはハード、ソフ
ト共にかなり複雑であり、もつと簡単な文字切出し手法
が望まれる。
文字及び文字行の切出しで一般的に行われているのは、
黒ドツトのヒストグラムを作成してそれを所定の閾値と
比較することによつて行間及び文字間を決めるものであ
ろう。しかしヒストグラムを作成するためには、量子化
画像全体に対して黒ドツト数の加算を行なう必要があ
り、これは一般のマイクロプロセツサにとつては負荷の
大きな処理であるため、専用の回路を準備しない場合に
は、切出し処理全体の処理速度の低下を招き、専用の回
路を準備するとその分だけコスト高になる。従つて本発
明の目的は、特別な専用回路の付加なしに、簡単な手順
で文字成分を切出す方法を提供することにある。
C.問題を解決するための手段 本発明の文字成分切出し方法は、文書を走査し、それに
よつて得た画像情報を2レベルで量子化し、量子化画像
の第1の方向に並んだビットに対しmビット目毎のORを
とることにより第1の方向の各ビット列毎にmビットの
ORグループを生成し(mは2以上の整数)、各ORグルー
プにおいて黒ビットを計数し、それによって得た計数値
を第1の方向と直角の第2の方向に沿って1つずつずら
しながら連続するn個の計数値の和を順次に計算し(n
は2以上の整数)、これらの和を所定の閾値と比較して
閾値未満から閾値以上に変わった点を文字領域開始点と
して登録し、閾値以上から閾値未満に変わる前の点を文
字領域終了点として登録することにより文字成分を切出
すことを特徴にしている。この方法は、通常のマイクロ
プロセツサが備えているOR命令を利用して簡単に実行で
き、その正確さはm×nのマスクを用いる従来の手法と
変わらない。
D.実施例の説明 以下で説明する実施例では横書きの文書を想定し、文字
行の方向とスキヤナの主走査方向とを一致させている。
また、文字行の傾きに対処するため、前述の従来技術と
同様のブロツク化手法を採用する。しかし、本発明の方
法自体は縦書きの文書にも、ブロツク化を行わない場合
にも等しく適用できるものである。文書は印刷文書でも
手書き文書でもかまわない。
D−1.原理 本発明は、原理的には、m×nのマスクを縦、横に各々
1ドツトずつずらせながら、マスク内に存在する黒ドツ
トを計数し、その値が所定値以上の場合に有効な黒成分
を検出したと判定する従来の手法に似ている。しかし、
この従来手法ではマスクをすべてのドツトに対して作用
させなければならないが、本発明の方法は、マスクとの
関連で云えばmドツト又はnドツトずつの移動に相当
し、しかも文字成分切出しの精度は1ドツトずつ移動さ
せた場合とほぼ同じである。
本発明に従う文字成分切出し方法の流れを第1図に示
す。スキヤナにより文書を走査するステツプ1及び走査
した情報を2レベルで量子化(各画素を1ビツトで表わ
す)してメモリに記憶するステツプ2については周知の
技術であるから、別段の説明を要しないであろう。ステ
ツプ3では、量子化画像の第1の方向、即ち投影方向と
平行な切出し方向において順次にmビツト目毎のORをと
ることにより、最終的にmビツトのORグループを生成す
る。mビット目毎のORをとるとは、第1ビットから始め
ると、第1ビット、第m+1ビット、第2m+1ビット、
第3m+1ビット・・・第nm+1ビットのOR操作になり、
第2ビットから始めると、第2ビット、第m+2ビッ
ト、第2m+2ビット、第3m+2ビット・・・第nm+2ビ
ットのOR操作になり、以下同様に、第mビットから始め
ると、第mビット、第2mビット、第3mビット・・・第nm
ビットのOR操作になる。簡単のため、各OR操作の最初の
2ビットに着目すると、第1ビットと第m+1ビット、
第2ビットと第m+2ビット、第3ビットと第m+3ビ
ット以下同様に第mビットと第2mビットをそれぞれORす
ることになり、これは第1ビットから第mビットまでの
連続するmビットと、その次の第m+1ビットから第2m
ビットまでの連続するmビットとをビット対応にORする
ことに相当する。従ってステップ3は、例えば横方向の
文字行を切出す場合は、量子化画像の各走査ラインのビ
ット列を主走査方向(横方向)に沿ってmビットずつの
グループに分け、それぞれの走査ラインで全mビットグ
ループ(例えば各走査ラインを1728ビットとし、mを4
とすると、432個の4ビットグループができる)のORを
とることにより達成される。ただし、あとで説明するよ
うに、プロセツサのアーキテクチヤによつてはこのOR操
作をもつと効率よく行える。ステツプ3のOR操作の結果
生成されるmビツトグループの数は、量子化画像の第2
の方向、即ち切出し方向と直角の方向に沿つたドツトの
数に等しい。ステツプ4では、これらのmビツトグルー
プにおける黒ビツト(例えば2進‘1')をグループ毎に
計数する。これらの計数値は第2の方向に沿つて並べら
れる。ステツプ5では、黒ビツト計数値を第2の方向に
沿つて1つずつずらしながら連続するn個分の和を計算
する。具体的に云うと、まず第2の方向に沿つた最初の
計数値からn番目の計数値までの和を計算し、次に2番
目の計数値から(n+1)番目の計数値までの和を計算
し、以下同様にして最終的には、i番目の計数値から
(n+i−1)番目即ち最後の計数値までの和を計算す
る。詳細については後述するが、このステップ5はノイ
ズと有効文字成分を判別するために行われる。最後のス
テツプ6では、それぞれの加算結果を所定の閾値と比較
することによつて文字成分を切出す。なお、m及びnは
2以上の整数値であるが、使用するスキヤナの解像度や
処理単位によつて異なり、一般には従来のマスクと同様
に3又は4で十分である。
D−2.システム構成 本発明の方法は第2図に示したような文字認識システム
で利用できる。このシステムは、全体の制御を受持つ制
御装置10、印刷文書又は手書き文書を走査して2レベル
の量子化を行うスキヤナ12、スキヤナ12からの量子化画
像が書込まれるメモリ14、量子化画像を走査して文字領
域を切出す切出し論理16、及び切出された文字領域内の
文字を認識する認識論理18から成つている。制御装置10
としては、例えばインテル社の8086のような16ビツトの
マイクロプロセツサを用いることができる。切出し論理
16以外の部分は従来のもので十分である。制御装置10
は、スキヤナ12からの量子化画像をメモリ14に書込んだ
後、切出し論理16を起動して文字行及び文字の切出しを
行わせる。本実施例では16ビツトのマイクロプロセツサ
を使うので、メモリ14の読出し及び書込みは16ビツトの
ワードを単位として行われる。
次に、制御装置10の制御のもとに切出し論理16で実行さ
れる文字行及び文字の切出しについて説明する。
D−3.文字行切出し 文字行切出し処理は、スキヤナ12で読取つた量子化画像
の中から各文字行を個別に抽出する処理である。しか
し、文書が多数の文字行を含んでいて、スキヤナ12によ
る読取りの際に傾いていたとすると、メモリ14には傾い
た状態のままで量子化画像が書込まれてしまう。このよ
うな量子化画像に対し横方向の投影によつて文字行を切
出そうとすると、隣接する幾つかの文字行の成分が重な
り合つてしまうため個々の切出しが困難になる。第3図
(a)の例で説明すると、メモリ14に書込まれている量
子化画像20において文字行22、24及び26が傾いていた場
合は、右側に示した太い実線部分28が1つの文字行とし
て検出されてしまう。しかし、従来技術のところでも述
べたように、画像20を投影方向(横方向)と直角に複数
(第3図(a)の例では4つ)のブロツクに等分割し、
それぞれのブロツクで個別に投影を行うと、第3図
(b)に示したように、文字行成分をうまく抽出するこ
とができる。本実施例でもこのようなブロツク化を行う
ものとする。第3図(a)の例において、画像20の幅を
1728ビツト(108ワード)とすると、各ブロツクの幅は4
32ビツト(27ワード)になる。勿論、文書のスキユーが
問題にならないのであれば、ブロツク化は不要である。
スキヤナ12からの量子化画像は、スキヤナ12の主走査方
向に沿つて1ワードずつ順次にメモリ14に書込まれ、1
ライン分(上述の例では108ワード)の書込みが終了す
ると、副走査方向に1ライン進んだ画像データが次に書
込まれる。このようにして量子化画像全体の書込みが完
了すると、切出し論理16は前述の原理に従つてブロツク
毎に文字行の切出しを行う。この様子を第4図及び第5
図に示す。
第4図中の30は、第3図の(b)の如き1ブロツクにお
ける特定ラインのデータを表わし、本実施例では27ワー
ド(432ビツト)ある。このように、各ブロツクの幅は
マイクロプロセツサのバス幅(ここでは16ビツト)の整
数倍であることが好ましいが、そうでない場合は不要な
ビツトをマスクする必要がある。前にも述べたように、
従来はライン全体の黒ビツトを計数していたが、これは
マイクロプロセツサにとつては効率が悪い。そこで代替
として、本発明ではmビツト(第4図の場合は4ビツ
ト)のグループのORをとる。ただし、16ビツトのマイク
ロプロセツサでラインデータを4ビツトずつORしていく
のは得策ではないので、第4図の例ではワード単位で最
初のOR操作32を実行し、その結果34を上位バイトと下位
バイトに分けて次のOR操作36を実行し、1バイトのOR結
果38を同様に上位ニブルと下位ニブルに分けて最後のOR
操作40を実行する。かくして、最終的に4ビツトに集約
されたORパターン42が得られる。ラインデータ30を4ビ
ツトずつに分けてそれらのORをとつても同じ結果になる
が、第4図の方が効率がよい。一般に、マイクロプロセ
ツサの処理単位あるいはバス幅をMビツトとすると、m
=M/2p(pは整数)の関係にあれば第4図の方法を実行
できる。云い換えれば、mをそのように選べばよい。
OR操作32、36及び40はマイクロプロセツサのOR命令で実
現できる。最初のOR操作32は、第1オペランドを特定の
汎用レジスタ(全ゼロに初期設定しておく)にし、第2
オペランドをメモリ14における各ワード0〜26のアドレ
スにして、結果を第1オペランドの汎用レジスタに書戻
すようにすればよい。そうすると27回のメモリアクセス
で1ワードのOR結果34が得られる。汎用レジスタでバイ
ト単位のアクセスが可能であれば、1ワードのOR結果34
を容易に上位バイト及び下位バイトに分けてそれらのOR
をとることができる。しかしバイトアクセスができない
場合は、シフト命令によつて上位バイト及び下位バイト
を分ける必要がある。1バイトのOR結果38から4ビツト
のOR結果42を得る場合も同じことが云える。
第4図の動作はブロツク中の全ラインについて繰返さ
れ、これにより、第5図の“OR結果”のところに示した
ような4ビツトのパターンが得られる。各4ビツトパタ
ーンの黒ビツト数をテーブルにより、又は直接計数する
ことで、0〜4の範囲の黒ビツト出現頻度が得られる。
次に、これらの出現頻度から有効な行成分を検出する手
法を概念的に説明する。
第3図の斜線部分22、24及び26が行切出しの対象となる
部分である。この部分は十分黒ビツトが連続しているは
ずであるから、そこを横切る走査ラインにおいては、黒
ビツトの頻度が4になることが予想される、また縦方向
にも連続して頻度4のラインが続くことも予想される。
一方、散発的に発生するノイズの場合は、黒ビツトの出
現頻度が4で、且つそれが数ライン続けて発生すること
は極めて稀であると考えられる。従つて、第5図の“頻
度”のところに示した頻度分布を縦方向に考察して、あ
る面積内での頻度の合計値をとれば、ノイズと有効文字
成分を区別することができる。具体的には、注目する面
積の高さをnとすると、隣接するn本の走査ラインの頻
度値を合計し、この操作を走査ラインを1本ずつずらし
ながら繰返す。そうすると、第5図の“合計値”のとこ
ろに示したような一連の合計値がライン毎に得られる。
第5図の例ではn=3になつており、各ラインの頻度値
をその上下1本ずつのラインの頻度値に加算することに
より、当該ラインに対応する頻度合計値が得られる。た
だしライン0の場合は、その上のラインがないのでこの
ような加算を行えず、合計値のところが空白になつてい
る(一番下のラインも同様である)。頻度が0の仮想ラ
インを設定すれば加算は可能である。
合計値の範囲は0から12までである。有効行成分領域
は、これらの合計値を所定の閾値と比較することにより
検出される。その場合、合計値が閾値以上であれば、行
成分となるべき黒成分が存在しているものとし、閾値未
満であれば、そのような黒成分が存在していないものと
する。そして合計値を上から順に見ていつたときに、閾
値未満から閾値以上に変つた走査ラインの番号を文字領
域開始点siとして登録し、閾値以上から閾値未満に変わ
る1つ手前の走査ラインの番号を文字領域終了点eiとし
て登録する(第3図(b)参照)。第5図は閾値を7に
した例を示しており、ライン番号5及び12がそれぞれ文
字領域開始点及び文字領域終了点として登録される。開
始点から終了点までのライン数(今の場合は8)が有効
行成分の高さを表わす。(実際にはこれよりもつと高
い。) 第4図及び第5図に示したm=4、n=3及び閾値=7
の例は、3×4のマスクを用いて量子化画像全体を走査
し、マスク内に存在する黒ドツトの数を数えて黒成分を
検出する従来の手法とほぼ同等の効果を持つにもかかわ
らず、専用のハードウエアを必要とせず、高速に処理で
きるという利点がある。m、n及び閾値の各値は、フオ
ントサイズ、スキヤナの解像度、マイクロプロセツサの
アーキテクチヤ等に応じて適宜選択されるものである。
m及びnは2以上の整数であるが、一般には3又は4で
十分であろう。閾値は、頻度合計値の範囲の中間値(上
の例では6)より大きい値が望ましい。上述の例でmを
3ではなくて4にしたのは、マイクロプロセッサ内にお
いては処理単位を2のべきにするのが好ましいからであ
り、この制限がなくてもよいのであればm=3でもかま
わない。
また、例えば16ドツト/mm程度の高解像度スキヤナを用
いた場合には、副走査方向(縦方向)のサンプリングを
1走査ラインおきに行つてもよい。理由は、この程度の
高解像度になると、ノイズ以外の有効な黒成分は必らず
2走査ライン以上にまたがるので1ラインおきにサンプ
リングしても十分なためと、画像データ量が増えるので
全ラインのサンプリングを行うと、本発明の高速である
という利点が失われるからである。
第4図及び第5図に示した方法による文字成分即ち文字
行の成分の切出しは十分に正確であるが、原文書が印刷
文書の場合は、システム又はユーザから与えられる行ピ
ツチ情報及びフオントサイズ情報を用いることによつ
て、切出しをより確かなものにすることができる。第3
図(b)の例で説明すると、まず(e1−s1)がフオント
サイズ(高さ)に関して所定の範囲内、例えばフオント
高さの0.8倍から1.2倍の間、にあれば、s1及びe1によつ
て囲まれる部分(太線部分)を第1行の成分として確定
できる。次は、確定した第1行成分の中心座標に行ピツ
チを加えたところを第2行成分の予測中心座標とし、そ
の上下で例えばフオント高さの0.6倍程度の範囲を調べ
て、siとei(i=2、3、・・・)によつて囲まれる部
分がこの範囲と重なりをもち且つ(ei−si)がフオント
高さの0.8倍から1.2倍の間にあれば、si及びeiによつて
囲まれる部分を第2行の成分として確定できる。以下、
同様の計算を最後の行成分確定まで繰返せばよい。量子
化画像を複数のブロツクに分けた場合は、各ブロツクで
同じ計算を行うことになる。
(ei−si)がフオント高さの1.2倍以上であれば、当該
ブロツクを更に細分化して第4図及び第5図の方法を再
び実行すればよい。(ei−si)がフオント高さの0.8倍
以下であれば、ei+1、ei+2等とsiとの差を調べ、(ei+j
−si)が上記の範囲に入れば、siからei+jまでを1つの
行成分とする。なお、第1行成分が確定できなかつた場
合には、行成分予想位置に行ピツチを加えた位置を中心
として第2行成分を検出し、後から第1行成分の存在域
を算定すればよい。
D−4.文字切出し 理論的には、第4図及び第5図の方法で切出した各文字
行成分を90度回転して、第4図及び第5図の方法を適用
すると、単一文字の領域を個別に切出すことができる。
しかし、通常のマイクロプロセツサで画像を回転させる
のは大きな負担となり、またメモリ14に書込まれている
量子化画像を縦方向にも読出そうとするとアクセス回路
が複雑になるので、ここでは通常のマイクロプロセツサ
で容易に実施できる方法を説明する。
原理のところで説明したように、本発明は切出し方向即
ち投影方向に沿つてmビツトのORをとることを基本にし
ている。従つて文字切出しの場合は、文字切出し方向と
直角の主走査方向に沿った連続するm本の走査ラインで
対応する位置にあるm個のビツトが1グループを作るこ
とになる。本実施例では、このようなグループを1回の
アクセスでメモリ14から読出して他のグループとORする
代りに、前に切出した所定数のビット(ブロック化を行
った場合は432ビット)からなる文字行成分と同じ長さ
を持つたm個のレジスタを用意し又は仮想的に同レジス
タ用の領域をメモリ中に用意し、その中にm本目毎の走
査ラインのOR結果を書込む。そうすると、最終的にはm
個のレジスタの対応する位置にあるmビツトのグループ
が原理のところで説明したOR結果を含むことにする。例
えば、第4図及び第5図の方法により、i番目からk番
目までの走査ラインが有効行成分として切出されたとす
ると、m個のレジスタR1〜Rmには次のようなOR結果が書
込まれる。
R1=〔i〕+〔i+m〕+〔i+2m〕+・・・+〔i+
k1m〕(i+k1m≦k) R2=〔i+1〕+〔i+1+m〕+・・・+〔i+1+
k2m〕(i+1+k2m≦k) Rm=〔i+m−1〕+〔i+m−1+m〕+・・・+
〔i+m−1+kmm〕(i+m−1+kmm≦k) 上式において、それぞれの大括弧〔 〕は、大括弧内の
番号を持つた走査ラインのデータ(長さは、切出した有
効行成分と同じ)を表わし、“+”はビツト毎のOR演算
を表わす。これらのOR演算は、各レジスタR1〜Rmを第1
オペランドとし、走査ラインデータを第2オペランドと
して、演算結果を第1オペランドレジスタに書込むOR命
令を用いて容易に実行できる。なお、切出した行成分の
長さが1ワード(16ビツト)よりも長い場合には、ワー
ド毎に上述の演算が必要である。あとは文字行切出しの
ときと同じく、切出し方向(今の場合は副走査方向)に
沿つたOR結果の黒ドツト数を係数して、それと直角方向
即ち主走査方向に頻度分布を作成し、その中で頻度値を
1つずつずらして連続するn個の頻度値の合計を計算す
る。頻度合計値が所定の閾値以上であれば対応する部分
を文字成分存在域とみなす。
m及びnの値は、使用するスキヤナの解像度やフオント
サイズにもよるが、通常であればノイズ以外の有効文字
成分は3ドツト以上連続しているので、m及びnを3に
しておけばよい。そうすると、頻度合計値は0〜9まで
の値をとることになり、従つて閾値としては中間値より
も大きい5を選ぶことができる。これは、3×3のマス
クを用いて量子化画像全体を1ドツトずつ走査する従来
の手法とほぼ同様の効果がある。mとnを3にして文字
を切出す例を第6図に示す。第6図は、第5図を90度回
転してその中のOR結果を3ビツトにしたものに相当して
いる。第6図の例では、ビツト位置5〜11、17、18等が
有効文字成分を含むものとみなされる。
次に、システム又はユーザから与えられる文字ピツチ情
報及びフオントサイズ情報(幅)を用いて個々の文字を
切出す方法を説明する。まず、第6図の合計値の部分を
左端から順に閾値以上かどうかを調べ、閾値以上の連続
する長さがフオント幅Wの例えば0.8倍から1.2倍の範囲
であれば、その部分を最初の文字領域として確定する。
確定した文字領域のX方向(副走査方向)中心座標を
X1、文字ピツチをPとすると、次文字のX方向中心座標
X2は次式で表わされる。
X2=X1+P 従つて、 X2+(P/2)±(P−W)/2 の範囲で頻度合計値が閾値未満の部分(0のところが好
ましい)を検出すれば、そこが次の文字の予想文字枠の
右端となる。この範囲内に閾値未満の部分がなければ、
隣接する2文字が接触していると考えられる。このよう
な場合には、予想範囲内で頻度分布が極小のところを切
出し点に選ぶことができる。左端も同様にして求めるこ
とができる。予想文字枠の右端及び左端が決まると(当
該文字を含む行領域の上端及び下端は文字行切出しのと
きに既に求められている)、その範囲内で再度横の投影
を行うことにより当該文字の上下端を検出し、文字に外
接する矩形を確定する。この外接矩形のX方向中心座標
を新たにX2と定義する。以下同様のプロセスを繰返せ
ば、各文字行における個々の文字をすべて切出すことが
できる。
E.発明の効果 本発明によれば、通常のマイクロプロセツサを用いて高
速且つ効果的に文字成分を切出すことができる。
【図面の簡単な説明】
第1図は本発明の方法を示す流れ図。 第2図は本発明を実施し得る文字認識システムの一例を
示すブロツク図。 第3図は文書の傾きに対処するためのブロツク化手法を
示す図。 第4図は文字行切出しのためのOR操作を示す図。 第5図は第4図でのOR結果から有効行成分を確定する様
子を示す図。 第6図は第5図と同様にして文字成分を確定する様子を
示す図。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文書を走査し、 前記走査によって得た画像情報を2レベルで量子化し、 量子化画像の第1の方向において、第1乃至第mビット
    の各々とそれらのビットからm番目、2m番目、3m番目・
    ・・のビットとのORをとることにより前記第1の方向の
    各ビット列毎にmビットのORグループを生成し(mは2
    以上の整数)、 前記第1の方向と直角の第2の方向に存在する、前記OR
    グループの各々において黒ビットを計数し計数値を得、 前記第2の方向に沿って連続するn個の前記計数値の和
    を(nは2以上の整数)、前記第2の方向に1つずつず
    らしながら順次計算し、 前記和を所定の閾値と比較して閾値未満から閾値以上に
    変わった点を文字領域開始点として登録し、閾値以上か
    ら閾値未満に変わる前の点を文字領域終了点として登録
    することにより文字成分を切出す、 ことを特徴とする文字成分切出し方法。
  2. 【請求項2】前記量子化画像のビットを前記第1の方向
    に沿ってMビットずつグループ化し(M=2pm;pは整
    数)、各グループのORをとることによりMビットのORグ
    ループを生成し、該ORグループを半分に分けてそれらの
    ORをとることによりM/2ビットのORグループを生成し、
    以下同様にして最終的にmビットのORグループを生成す
    る特許請求の範囲第1項に記載の方法。
JP61122414A 1986-05-29 1986-05-29 文字成分切出し方法 Expired - Fee Related JPH0731714B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP61122414A JPH0731714B2 (ja) 1986-05-29 1986-05-29 文字成分切出し方法
DE87107234T DE3787206T2 (de) 1986-05-29 1987-05-19 Gerät und Verfahren zur Ermittlung von Zeichenteilen auf einem gedruckten Dokument.
EP87107234A EP0248262B1 (en) 1986-05-29 1987-05-19 Apparatus and method for detecting character components on a printed document
US07/052,814 US4776024A (en) 1986-05-29 1987-05-21 System for segmenting character components

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61122414A JPH0731714B2 (ja) 1986-05-29 1986-05-29 文字成分切出し方法

Publications (2)

Publication Number Publication Date
JPS62281085A JPS62281085A (ja) 1987-12-05
JPH0731714B2 true JPH0731714B2 (ja) 1995-04-10

Family

ID=14835224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61122414A Expired - Fee Related JPH0731714B2 (ja) 1986-05-29 1986-05-29 文字成分切出し方法

Country Status (4)

Country Link
US (1) US4776024A (ja)
EP (1) EP0248262B1 (ja)
JP (1) JPH0731714B2 (ja)
DE (1) DE3787206T2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
US4901365A (en) * 1988-12-19 1990-02-13 Ncr Corporation Method of searching binary images to find search regions in which straight lines may be found
US5073857A (en) * 1989-06-01 1991-12-17 Accuron Corporation Method and apparatus for cell analysis
US5077806A (en) * 1989-06-01 1991-12-31 Accuron Corporation Machine vision analysis apparatus
US4963719A (en) * 1989-11-01 1990-10-16 Spectra-Physics Bar code scanner and method of scanning
EP0447751B1 (en) * 1990-01-19 1999-06-09 Fujitsu Limited Image processing system
US4992650A (en) * 1990-03-29 1991-02-12 International Business Machines Corporation Method and apparatus for barcode recognition in a digital image
CA2049866C (en) * 1990-12-28 1998-06-30 Raymond L. Higgins System and method for optical recognition of bar-coded characters
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5633957A (en) * 1994-09-16 1997-05-27 Compaq Computer Corporation Method and apparatus for determining positional guidelines of handwritten data
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US10846553B2 (en) * 2019-03-20 2020-11-24 Sap Se Recognizing typewritten and handwritten characters using end-to-end deep learning

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1524407C3 (de) * 1966-06-15 1975-07-03 Ibm Deutschland Gmbh, 7000 Stuttgart Verfahren zur maschinellen Zeichenerkennung mittels Lichtpunktabtastung
US3432673A (en) * 1967-10-06 1969-03-11 Control Data Corp Line tracking reading machine having means to positionally normalize the character-video signals
US3629826A (en) * 1970-01-02 1971-12-21 Ibm Sectioning apparatus and method for character recognition systems
SE422714B (sv) * 1979-01-16 1982-03-22 Ibm Svenska Ab Anordning med styrdator for optisk teckenlosning, vilken styrdator bl a bereknar startpunkter for identifiering av ett tecken
JPS6043555B2 (ja) * 1980-02-26 1985-09-28 株式会社トキメック 印字文字切出し装置
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
NL183790C (nl) * 1980-11-21 1989-01-16 Nederlanden Staat Werkwijze voor karaktersegmentatie.

Also Published As

Publication number Publication date
EP0248262A2 (en) 1987-12-09
JPS62281085A (ja) 1987-12-05
US4776024A (en) 1988-10-04
DE3787206T2 (de) 1994-04-21
EP0248262A3 (en) 1990-08-22
DE3787206D1 (de) 1993-10-07
EP0248262B1 (en) 1993-09-01

Similar Documents

Publication Publication Date Title
EP0227848B1 (en) Image preprocessing procedure for noise removal
CA1160347A (en) Method for recognizing a machine encoded character
US6091860A (en) System and method for processing pixels for displaying and storing
US5568571A (en) Image enhancement system
US4608489A (en) Method and apparatus for dynamically segmenting a bar code
JPH0731714B2 (ja) 文字成分切出し方法
JPH0652354A (ja) スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置
JPH04225485A (ja) バーコードを認識する方法
US4528692A (en) Character segmenting apparatus for optical character recognition
EP0127441A2 (en) Character recognition apparatus
JPH05500129A (ja) 光学式文字認識のための行ごとのセグメント化及びしきい値設定
AU688453B2 (en) Automatic determination of blank pages and bounding boxes for binary images
US7151859B2 (en) Method and system for correcting direction or orientation of document image
US5357582A (en) Character boundary identification method and system
CA1316605C (en) Method of searching binary images to find search regions in which straight lines may be found
WO1982001433A1 (en) Segmentation system and method for optical character scanning
JPH0430070B2 (ja)
US3990044A (en) Symbol recognition enhancing apparatus
EP0433359A1 (en) Image recognition
JPS6325391B2 (ja)
AU688456B2 (en) Automatic determination of landscape scan in binary images
Beran et al. Recognition of printed music score
JP2582611B2 (ja) マルチフオント辞書の作成法
JPH0214392A (ja) 文書領域解析装置
JPH0433074B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees