JPH02255996A - 文字切出し方法 - Google Patents

文字切出し方法

Info

Publication number
JPH02255996A
JPH02255996A JP1157268A JP15726889A JPH02255996A JP H02255996 A JPH02255996 A JP H02255996A JP 1157268 A JP1157268 A JP 1157268A JP 15726889 A JP15726889 A JP 15726889A JP H02255996 A JPH02255996 A JP H02255996A
Authority
JP
Japan
Prior art keywords
character
segmentation
width
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1157268A
Other languages
English (en)
Inventor
Hiroshi Nakayama
寛 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH02255996A publication Critical patent/JPH02255996A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置における文字切出しに係り、特
に接続文字の切出しに効果的な文字切出し方法に関する
9 〔従来の技術〕 文字認識装置においては、文字認識の前処理として、入
力原稿の文字を切出す必要がある。一般に、行の垂直方
向の射影が一定の閾値を賊える部分を文字部として切出
すが、欧文文書などにおいては、しばしば、2以上の接
続した文字(接続文字)が一つの文字部として切出され
る。
このような接続文字は1文字ずつ切り離す必要がある。
このような接続文字の切出しに関しては、文字部の端よ
り文字の大きさによって決まる区間を切出し、その周辺
分布と予め用意された周辺分布のパターンとの照合の結
果により切出し位置を決定する方法(中村、井沢、南;
″欧文接触文字の分離・抽出″4世子通信学会論文誌’
 85 / 7Vo1.J68−D Na’l、142
5頁から1426頁)や、続開的手法によって文字ピッ
チを推定すると\・もに動的計画法を適用して文字切出
し位置を決定する方法(辻、浅井;″分離最小基準に基
づく適応型文字分離方式I+ 、 ガ家子通信学会論文
誌’85/8 Vol、、 J 68−−D k8.第
1497頁から第1504頁)が知られている。
〔発明が解決し7ようとする課題〕 しかし、Jユ記従来方法は処理内容が複雑でに速処理が
難しいなどの問題があり、しかも達成できる切出し精度
にも限界がある。
本発明の目的は、比較的簡単な処理により接続文字など
も高精度に分離できる文字切出し方法を提供することに
ある。
〔課題を解決するための手段および作用〕文字切出し処
理のアルゴリズムの工夫のみで切出し精度を改善しよう
としても、文字により幅が異なる英文文書などにおける
切出しエラーを完全に排除することは極めて困難であり
、また処理アルゴリズムの複雑化により高速処理が難し
くなってしまう。また、文字切出しは文字認識の前処理
であり、文字切出しのエラーは文字認識が失敗して初め
て判明するものである。
本発明は、このような観点から、文字認識結果を文字切
出しにフィードバックすることにより切出しエラーを救
済し、文字切出し処理アルゴリズムを複雑化することな
く文字切出し精度を上げようとするものである。
すなわち、本発明によれば、文字を切出す行の垂直射影
が閾値を越える文字部について、1文字分ずつ切出し位
置を変えながら文字切出しと認識の処理が繰返され、認
識に成功した場合(当然、切出しは成功)は文字部の残
りの部分が改めて文字部として同様に処理される。
〔実施例〕
第1図は本発明の一実施例に係る文字認識装置のハード
ウェア構成図であり、第2図は処理のフローチャートで
ある。
第1図において、1は処理対象の文書(英文文書など)
を2値イメージとして読取るスキャナー2はその2値イ
メージを記憶するためのイメージメモリである。3は行
切出し、文字切出し、文字認識などの処理を実行するC
PUである。4はこのような処理のプログラムおよびパ
ラメータ類を格納したROM、5は処理によって得られ
るデータを記憶するためのRAM、6は文字認識のため
のテンプレートを格納した辞書である。
処理の概略は次の通りである。イメージメモリ2内の2
値イメージより、行方向(水平方向)の射影が一定の閾
値を越える範囲を行として切出す。
次に、行の垂直方向の射影(黒画素数)を求め、垂直射
影が閾値を越える文字部を検出する。
検出した文字部の幅(水平方向の長さ)を予め設定され
た標準文字幅で割り算することにより、推定文字数を求
める。
推定文字数が3以上の場合の処理は次の通りである。
まず、ルーズ切出しく後述)によって文字部の左端より
1文字分を切出しく1回目の切出し)、切出した部分を
文字認識する。認識に成功すれば、認識結果を保存し、
文字部の残りの部分を改めて文字部とし、推定文字数の
計算より同様の処理を行う。
1回目の切出し後の文字認識の結果が好ましくないとき
、すなわち距離計算を行う認識方法であれば、距離が一
定の閾値を越えるとき、あるいはりジェクトのとき(以
下、両方の場合をまとめて「リジェクトの場合」と呼ぶ
)、タイト切出しく後述)によって文字の左端より1文
字分を切出しく2回目の切出し)、切出した部分を文字
認識する。これがリジェクトでなければ、切出しは成功
であるので、その認識結果を保存し、文字部の残りの部
分を改めて文字部として推定文字数を計算し直し、同様
の処理を行う。
2回目の切出し後の文字認識の結果がリジェクトの場合
、その文字部についてリジェクト処理を行う。
文字部(垂直射影より抽出された文字部、または切出し
・認識が成功した部分を除いた残りの部分)の推定文字
数が2以下の場合、1文字である可能性があるので、ま
ず文字認識を行う。そして。
その結果がリジェクトの場合は、推定文字数が3以上の
場合と同様にルーズ切出しから始まる処理を行う。
第3図はルーズ切出しとタイト切出しを説明する図であ
る。ルーズ切出しとタイト切出しとの違いは、切出し位
置が異なることである。すなわち、文字部の推定文字数
で、文字部の幅を割り算することによって1文字幅を推
定する。ルーズ切出しでは、文字部の左端より推定1文
字幅のl 、 5 fH’、1だけ離れた位置を中心と
して、その前後の推定1文字幅の4分の1の範囲内(第
3図にaで示す)で垂直射影が最小の位置を切出し位置
に選ぶ。他方、タイト切出しにおいては、文字部の左端
より推定1文字幅だけ離れた位置を中心とし、その前後
の推定1文字幅の4分の1の範囲内(第3図にbで示す
)で垂直射影が最小の位置を文字切出し位置に選ぶ。
次に、第2図のフローチャートに従って処理の詳細を説
明する。なお、処理に使用される変数は次の通りである
stx:処理中の文字部の開始位置 enx:処理中の文字部の終了位置 N:推定文字数 pitch:推定1文字幅 stdw:標準文字幅 sx:認識対象となる1文字の開始位置ex:認識対象
となる1文字の終了位置flag:切出し状態(1はル
ーズ切出し、2はタイト切出し)なお、各位!if<は
行左端を基準として水平位置である。
まず、現在処理中の行より未処理の文字部(行の垂直射
影が一定の閾値を滅えた部分)を一つ探し、見つかった
ときは、5x4−stx、flag←0の設定を行い、
その文字部の処理に進む(ステップ■)。なお、未処理
の文字部が見つからないときは、次の行の処理に進む。
文字部の処理はステップ■より始まる。二\では次の代
入操作または演算が行わ扛る。
ex ← e n x W←ax−sx+1 N←(w+stdw/2)/stdw p i t c h4−w/N ただし、N=O,lならば。
pitch←w/2 flag←1 とする。これは、N≦1つまり1−文字と推定される場
合、普通に考えればそれ以上処理する必要がないが、例
えば” Q Q ’のように幅の狭い文字が連続してい
ることが考えられるため、j−度だ番ブ2文字としてタ
イト切出しをするためである(ステップ■→@→o)。
次に推定文字数Nが3以上であるが否かを調べる(ステ
ップ■)。
以下、第4図の(a)に示すような3文字が接続した文
字部10が検出されたものとして説明する。
N22であるとすると、ステップ■、■をスキップしス
テップ■に進む、初めはflag=oであるから、fl
ag←1としくステップqΦ)、ルーズ切出しを行う(
ステップ■)。
すなわち、sx+pitch+pj、cth/2の位置
を中心としで、その前後にpitch/4の幅の範囲で
垂直射影が最小となる位置を求め、これをezに代入し
、sxがらexまでの範囲を1文字として切出す。
この切出した部分について文字LHaを行う(ステップ
■)。認識結果が好ましい結果であれば、すなわちリジ
ェクトの場合でなければ、ステップ■よりステップ■に
分岐し、認識お果を保存する。
すなわち、文字部10の先頭の文字Aの部分が正しく切
出されて認識されたということであり、残りの部分を改
めて文字部としてステップ■以降の処理を開始する。
他方、ルーズ切出し後の認識結果がリジェクトの場合、
ルーズ切出しが不成功であったということである。二\
ではf ]、 a g = 1であるのでステップ0に
進み、flag←2とした後、タイト切出しを行う(ス
テップ■)。こ5では5.ルーズ切出しと違ってsx+
pitchの位置を中心とし、前後のp i t ch
 / 4の幅の範囲で垂直射影が最小の位置を求め、こ
れをe)cに代入し、sxからe Xの範囲を1文字と
して切出し、その部分について文字認識(ステップ■)
を行う。
この認識結果が良好であれば、文字部】−0の先頭の文
字Aの部分の切出し、認識に成功したということである
ので、認識結果を保存し、第4図の(b)に示す部分1
0aを改めて文字部として同様の処理を開始する。なお
、タイ1−切出し後の文字認識の結果がリジェクトの場
合、切出し不可能であるのでリジェクト処理を行い、ス
テップ■に戻って次の文字部の処理に進む。
文字部10aがN=2であったとすると、まず、そのま
ま文字認識(ステップ■)を行う。この結果が良好な場
合は文字部終了(ステップ■)なので、ステップ■に戻
り、次の文字部を探す、リジェクトの場合はルーズ切出
しを行い(ステップ■)、再び文字認識(ステップ■)
を行うことになる。
この結果がリジェクトの場合、タイト切出しくステップ
0)の後、文字認識(ステップ■)を行う。
ルーズ切出しまたはタイト切出しにより良好な文字認識
結果が得られたとすると、2番目の文字Bの部分の切出
し、認識が成功したということであるので、第4図の(
c)に示す部分10bを改めて文字部とし、同様の処理
を行う。
この文字部10bがN=0,1となれば、ステップ■で
flagが1にセットされる。そして。
まずそのまま文字認識を行う(ステップ■)。この結果
が良好な場合は文字部終了(ステップ■)なのでステッ
プ■に戻り次の文字部を探す。結果がリジェクトの場合
は、flagが1なので、タイト切出しくステップ0)
の後に再び文字認識(ステップ■)が行われる。良好な
文字認識結果が得られたとすると、残りの部分を文字部
として同様の処理を行う。
第5図に具体例を示す。これは、(a)の文字列につい
て、はじめ(b)のルーズ切出しを行い、認識の結果、
リジェクトとなり、次に(c)のタイト切出しを行い、
これが認識され、(d)の文字列が残ったことを示して
いる。従って、次に(d)の文字列に対して同様の処理
が繰り返されることになる。
以上説明したように、行の垂直射影以外の特別な補助デ
ータの生成を必要とせず、簡単な処理によって接続文字
の切出しも可能である。ルーズ切出しとタイト切出しを
使い分けることにより、文字毎の幅の違いに細かく対応
できるので、英文文書などの文字切出し精度を大幅に改
善できる61文字と推定される文字についても、認識で
きなけれは一度だけ文字切出しくタイト切出し)を行う
ので、接続した幅の小さい文字の切出し、認識が可能で
ある。
なお、文字部の推定文字数を算出するための標準文字間
stdwは、予め設定してもよいが、行毎に適応制御を
行ってもよい。
例えば、行の高さと標準文字幅の関係を予め与えておき
、この関係より処理すべき行の幅に応じた標準文字幅を
算出すると、行毎に文字サイズが変化する文書の文字切
出しの精度が向上する。
あるいは、各行の垂直射影の最大値から行毎に標準文字
幅を推定すると1文字切出し精度をさらに向上できる。
なぜならば、同じ文字セットでも、背の低い文字(a、
Q、8など)や下に足のでている文字(yyjなど)が
あるので、行の高さはバラツキが大きいが、垂直射影の
最大値は一般に行の高さに比ベバラツキが小さく安定し
ているからである。
〔発明の効果〕
以上、詳細に説明したように1本発明によれば、文字毎
に幅が変動し接続文字も発生しやすい英文文書などに対
しても高精度の文字切出しが可能であり、また処理内容
も比較的単純であるため高速処理が可能である。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識装置のハード
ウェア構成図、第2図は処理のフローチャート、第3図
はルーズ切出し、タイト切出しの説明図、第4図は処理
の一般的説明図、第5図は処理の具体例を示す図である
。 1・・・スキャナー、  2・−イメージメモリ、3・
・・CPU、  4・・・ROM、  5・・・RAM
、6・・・辞書。 第 図 第3図 第4 図 5神当 型炉μ (C)

Claims (1)

    【特許請求の範囲】
  1. (1)入力文書のイメージにより行を切出し、行より文
    字を切出して認識する文字認識装置において、文字を切
    出す行の垂直射影が所定閾値を超える文字部について、
    1文字分ずつ切出し位置を変えながら文字切出しと認識
    の処理を繰返し、認識に成功した場合は文字部の残りの
    部分を改めて文字部として扱い同様に処理することを特
    徴とする文字切出し方法。
JP1157268A 1988-12-09 1989-06-20 文字切出し方法 Pending JPH02255996A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP31242888 1988-12-09
JP63-312428 1988-12-09

Publications (1)

Publication Number Publication Date
JPH02255996A true JPH02255996A (ja) 1990-10-16

Family

ID=18029092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1157268A Pending JPH02255996A (ja) 1988-12-09 1989-06-20 文字切出し方法

Country Status (1)

Country Link
JP (1) JPH02255996A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160809A (ja) * 1993-12-08 1995-06-23 Nec Corp Ocr装置
JP2002007965A (ja) * 2000-05-12 2002-01-11 Xerox Corp テキスト行イメージデコーディングのためのスキップモードによるダイナミックプログラミングオペレーション
JP2002007966A (ja) * 2000-05-12 2002-01-11 Xerox Corp 文書画像復号方法
JP2016021086A (ja) * 2014-07-11 2016-02-04 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160809A (ja) * 1993-12-08 1995-06-23 Nec Corp Ocr装置
JP2002007965A (ja) * 2000-05-12 2002-01-11 Xerox Corp テキスト行イメージデコーディングのためのスキップモードによるダイナミックプログラミングオペレーション
JP2002007966A (ja) * 2000-05-12 2002-01-11 Xerox Corp 文書画像復号方法
JP4624592B2 (ja) * 2000-05-12 2011-02-02 ゼロックス コーポレイション テキスト行イメージデコーディングのためのスキップモードによるダイナミックプログラミングオペレーション
JP2016021086A (ja) * 2014-07-11 2016-02-04 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム
CN105320933B (zh) * 2014-07-11 2019-01-25 柯尼卡美能达株式会社 电子文档生成系统以及电子文档生成装置

Similar Documents

Publication Publication Date Title
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
JPH01112388A (ja) 文字認識処理方法
US7903876B2 (en) Distortion correction of a captured image
EP0457534A2 (en) Image processing method and apparatus
JPH02255996A (ja) 文字切出し方法
CN111079756B (zh) 一种单据图像中的表格提取与重建方法和设备
JP2675303B2 (ja) 文字認識方法
JP2004094952A (ja) スキュー検知
CN114757161B (zh) 基于动态规划的漫画自适应排版方法及装置
JPH0528260A (ja) 輪郭ベクトル抽出方式
JP2821303B2 (ja) 掠れ文字結合方式
JPH0331981A (ja) 文字認識装置
JP2922949B2 (ja) 文字認識の後処理方法
JPH04335487A (ja) 文字認識装置の文字切り出し方法
JP3033904B2 (ja) 文字認識後処理方法
JP2844728B2 (ja) 文書読取装置
JP3400154B2 (ja) 文書画像の領域抽出方法および装置
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JP3149069B2 (ja) 関心領域の自動設定方法
JPH04130979A (ja) 文字画像切出し方法
JPH02125389A (ja) スペース検出方法
JPH07160820A (ja) 文字認識方法
JPH09319830A (ja) フォント識別方法
JP2008257684A (ja) 画像処理装置、画像処理方法およびプログラム
Goto et al. A framework for detecting and selecting text line candidates of correct orientation