JPH0417086A - 文字切り出し方法 - Google Patents

文字切り出し方法

Info

Publication number
JPH0417086A
JPH0417086A JP2120680A JP12068090A JPH0417086A JP H0417086 A JPH0417086 A JP H0417086A JP 2120680 A JP2120680 A JP 2120680A JP 12068090 A JP12068090 A JP 12068090A JP H0417086 A JPH0417086 A JP H0417086A
Authority
JP
Japan
Prior art keywords
character
data
rectangles
memory
grapheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2120680A
Other languages
English (en)
Other versions
JP2977230B2 (ja
Inventor
Akiko Suzuki
明子 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2120680A priority Critical patent/JP2977230B2/ja
Publication of JPH0417086A publication Critical patent/JPH0417086A/ja
Application granted granted Critical
Publication of JP2977230B2 publication Critical patent/JP2977230B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ピッ1〜データとして入力された文書画像中
の文字画像を切り出す文字切り出し方法に関する。
〔従来の技術〕
文字認識システムしこおいて、スキャナ等によって入力
された文書画像の行を切り出すとともに、各行毎に文字
画像を切り出す。
この文字切り出しの方法として、特開平1−11499
2号公報に記載されているように、行画像の垂直射影を
とることによって文字存在部分の矩形領域を切り出し、
この矩形領域を予め設定された標準文字サイズをもとに
統合または分離することによって、個々の文字の矩形を
生成する方法がある。
〔発明が解決しようとする課題〕
しかし、矩形領域の統合、分離のためのパラメータとし
て予め設定された標準文字サイズを用いるため、標準パ
ターンと異なる大きさの文字や文字ピッチの変化に順応
しないことがあり、文字のサイズやピッチが様々な文書
を処理する場合、正確な文字切り出しを期待できないと
いう問題があった・ 本発明の目的は、文字のサイズやピッチの変化に順応で
き、さらにはスキューやかすれ等にも強い文字切り出し
方法を提供することにある。
〔課題を解決するための手段〕
本発明の文字切り出し方法は、文書・画像上の連結した
黒画素の外接矩形を文字素矩形として、1行を構成する
文字素矩形のデータを抽出し文字素データメモリに格納
する処理と、前記文字素データメモリ内のデータに基づ
き文字素矩形の統合のためのパラメータを設定しパラメ
ータメモリに格納する処理と、前記パラメータメモリ内
のパラメータを用い、前記文字素データメモリ内のデー
タによって表される文字素矩形を統合して前記文字素デ
ータメモリ内のデータを修正する複数回の統合処理と、
前記統合処理が1回終わるたびに前記文字素データメモ
リ内のデータに基づき前記パラメータメモリ内のパラメ
ータを修正する処理とによって、文書画像上の文字の外
接矩形を生成することを特徴とする。
〔イ乍 川〕
ドラ1ヘデータとして取り込んだ文書画像」二の連結し
た黒画素の塊は、文字の構成要素(文字素)である。一
つの文字は1個の文字素または複数個の文字素の集まり
である。したがって、連結黒画素の外接矩形を文字素の
矩形として抽出し、その文字素矩形を適切に統合するこ
とによって文字の外接矩形を生成し、文書画像中より文
字画像を切り出すことができる。
本発明によれば、文字素矩形の統合処理を複数回繰り返
し、初回の統合処理のためのパラメータは、文書画像よ
り抽出した1行を構成する文字素矩形のデータに基づき
設定するが、2回目以降の統合処理では、曲回の処理結
果に基づき修正したパラメータを用いる。したがって、
文字のサイズやピッチが様々であっても、パラメータは
徐々に適切なものに更新されるため、正確な文字切り出
しが可能である。また、連結黒画素の外接矩形で一 ある文字素矩形な統合する方法であるため、基本的に文
書のスキューや文字のかすれ等にも強い。
〔実施例〕
第1図は本発明の一実施例に係る文字認識システムのブ
ロック図である。
処理対象の文書画像は、スキャナ等からピッ1〜データ
として入力され原画像メモリ1に記憶されている。文字
画像切り出し処理部2は、この原画像メモリ1内の文書
画像の文字画像を切り出す処理を行い、切り出した文字
画像を文字画像メモリ3に格納する。文字認識処理部4
は、その文字画像の特徴ベクトルを生成し、辞店・どの
パターンマツチングによって文字を認識し、認識結果を
認識結果メモリ5に格納する。
文字睡像切り出し処理部2において、行切り出し部11
は文書画像より1行を単位として文字素データを抽出し
、文字素データメモリ12に格納する。具体的な処理内
容は次の通りである。
文書画像上の黒画素の連結を探索し、連結した黒画素の
塊を文字素(文字または文字の一部を構成する黒画素群
)として抽出し、各文字素すなわち各連結黒画素の外接
矩形の座標(対角頂点の位置)を文字素データとして抽
出する。また、文字素矩形の間の水平及び垂直方向の距
離を求め、両方向の距離がある閾値より小さい文字素矩
形の集まりを1行として切り出す。つまり、文字素デー
タ抽出と行切り出しが行われる。
このような黒画素連結矩形による行切り出し及び文字素
データ抽出は、水平または垂直射影による切り出し方法
等に比べ文書のスキュー等に強い。
パラメータ設定部13は、文字素データメモリ12内の
1行の文字素データ全体を見渡し、文字切り出しく文字
素統合及び文字パターン合成)に用いるための相対的な
パラメータを設定し、パラメータメモリ14に格納する
。文字素データ12内に文字素データは、文字素統合処
理により修正されるが、パラメータ設定部13は文字素
統合処理の過程で文字素データメモリ12内の修正され
た文字素データに基づきパラメータを再設定(修正)す
る。設定するパラメータは次の通りである。
行高さ二行を構成する文字矩形の最大高さで、他のパラ
メータを設定する際の基準になる。
標準文字幅二行の高さより少し大きな値であり、例えば
、[行高さ]+1(ドツト)に決める。
これは文字素統合の判定条件に用いられる。
最小文字間隔:隣合う文字素矩形の最小間隔であり、文
字素矩形の統合の判定条件に用いられる。ただし、ある
幅、例えは[標準文字幅]の半分以上の幅を持つ文字素
矩形だけを対象として決定する。
なお、行の処理の初めは文字素データが必要以上に多く
発生しているので、次の初期値に設定する。
[初期値]=−[行高さコ/30 (負の値は、文字素矩形が重なっていることを意味する
) 最大文字幅二行を構成する文字素矩形の最大の幅であり
、文字パターン合成の際に用いられる。
文字素統合部15は、パラメータメモリ14に格納され
たパラメータを用いた条件判定により、同一の文字の一
部であるとみなされる文字素矩形を統合し、文字素デー
タメモリ12内の文字素データを修正する。統合条件は
次の通りである。
1)隣合う二つの文字素矩形a、bが条件式■■を同時
に満たす場合、一つの文字素矩形に統合する(第2図参
照)。
Wab≦[標準文字幅]       条件式■(Wa
bはa、bの統合矩形の文字幅)Xsb−Xea<[最
小文字間隔]  条件式■(Xsbはbの始点X座標、
Xeaはaの終点X座標) 条件式■は統合後の文字素矩形の幅Wabが[標準文字
幅]を越えないことを示し、条件式■はa、bの間隔G
abが[最小文字間隔コ未漢であることを示している。
ただし、条件式■に当てはまる場合には、標準文字幅を
越えても統合する。
Xeb(Xea            条件式■(X
ebはbの終点X座標である。ただし、a。
bの位置関係はaが左側、bが右側であるとする) すなわち、第3図に示すようにDab<Oとなる完全に
重なった二つの文字素矩形a、bは、W a b≧[標
準文字幅コでも統合する。
2)荊記1)において条件式■を満たすが条件式■に当
てはまらない場合、右側の文字素矩形(bとする)が次
の条件式■■■■をすべで満たすときは、濁点もしくは
半濁点の文字素矩形であるとみなし、例外的に統合する
(第4図参照)。
wb≦fth             条件式■Hb
≦fth             条件式〇(Hbは
bの高さ) Yeb−Ysa≦fth        条件式■(Y
ebはbの終点y座標、Ysaはaの始点y座標) X s b −X e a < [最小文字間隔コ+α
条件式■ ただし、fth (閾値)=[行高さ]/βである。α
及びβは経験値であり、例えばα=2゜β=3に選ばれ
る。
3)前記1)において、条件式■■を満たしているもの
の、右側の文字素矩形(bとする)が次の条件式〇〇[
相]に該当する場合は、句読点であるとみなして例外的
に統合しない(第5図参照)。
wb≦fth             条件式■I−
I b≦fth             条件式■b
ase−Yeb≦f t h/y     条件式[相
]ただし、baseはベースラインのy座標、γは経験
値であり例えばγ=4に選ばれる。
以上の如き統合処理が1行の文字素データ全部について
1回終了するたびに、パラメータ設定部13は修正後の
文字素データより前述の如きパラメータを再設定しパラ
メータメモリ14を店き換える。
ただし、ワープロ原稿を対象とする場合、その再設定前
の[標準文字幅]の例えば2倍近い幅の文字素矩形があ
る程度、例えはその時点の文字素数の3割以上、存在す
るときは、処理中の行を倍釣行と判断し、[標準文字幅
]を現在の2倍の幅に再設定する。逆に、[最大文字幅
]が[標準文字幅コの例えば半分以下になった場合、そ
の行を半釣行をみなし、口標準文字幅]を現在の例えば
半分の幅に再設定する。
文字素統合部15は、再設定されたパラメータを用い、
前述の如き文字素統合処理を再度実行し、文字素データ
を修正する。
このように、パラメータをダイナミックに修正しつつ文
字素統合処理を繰り返す。この繰り返しは、例えはパラ
メータが変化しなくなったとき、もしくはパラメータの
変化量がある閾値以下となったときに終了す・る。
第6図は文字素統合の例を示す図である。(a)に示す
行画像に対し、行切り出し部11によって例えば(b)
に示すような文字素矩形が抽出される。この文字素は、
1回目の文字素統合処理によって(c)に示すように統
合され、2回目の文字素統合処理によって(d)に示す
ように統合される。
(d)に示すように、統合処理が完了した段階の文字素
は殆どが行画像中の−っの文字に対応する。すなわち、
殆どの文字の外接矩形が生成される。しかし、この例に
おける文字小″のように統合すべき文字素が分離したま
ま残ることもある。
このような統合未完の文字素が残る可能性があるので、
文字パターン合成部16は、単純に各文字素矩形を文字
枠として原画像より文字画像を切り出すのではなく、連
続した文字素枠を[最大文字幅コ (パラメータメモリ
」−4に記憶されているもの)を越えない程度に組合せ
、組合せた矩形(1個の文字素矩形も含まれる)それぞ
れを文字枠の候補とし、原画像メモリ1より各文字枠候
補内の画像を文字画像候補として切り出し、文字画像メ
モリ3に出力する。
文字認識処理部4においては、文字画像メモリ3に格納
された文字画像候補について文字認識を行う。ただし、
文字素が重複した文字画像候補については、認識結果を
評価し、最も文字としての確からしさが高い文字画像候
補を選択しくすなわち認識結果により文字切り出しを確
定し)、その認識結果だけを認識結果メモリ5に出力す
る。
なお、このような文字素を組合せて認識し、認識結果に
より文字切り出しを確定する方法については、同一出願
人による特許出願(特願昭63133424号)の明細
書及び図面に詳述されている。
〔発明の効果〕
以上説明した如く、本発明によれば、文字の大きさやピ
ッチの変化、さらにスキューや、かすれ等の印字条件に
順応し、正確な文字切り出しが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識システムのブ
ロック図、第2図乃至第5図は文字素統合条件の説明図
、第6図は文字素統合の例を示す図である。 1・・原画像メモリ、 2・・・文字画像切り出し処理部、 3・・文字画像メモリ、 4・文字認識処理部、5・・
・認識結果メモリ、  11・・・行切り出し部、12
・・・文字素データメモリ、 13・・・パラメータ設定部、 14・・パラメータメモリ、 15・・・文字素統合部、 16・・・文字パターン合成部。 本 一口

Claims (1)

    【特許請求の範囲】
  1. (1)文書画像上の連結した黒画素の外接矩形を文字素
    矩形として、1行を構成する文字素矩形のデータを抽出
    し文字素データメモリに格納する処理と、前記文字素デ
    ータメモリ内のデータに基づき文字素矩形統合のための
    パラメータを設定しパラメータメモリに格納する処理と
    、前記パラメータメモリ内のパラメータを用い、前記文
    字素データメモリ内のデータによって表される文字素矩
    形を統合して前記文字素データメモリ内のデータを修正
    する複数回の統合処理と、前記統合処理が1回終わるた
    びに前記文字素データメモリ内のデータに基づき前記パ
    ラメータメモリ内のパラメータを修正する処理とによっ
    て、文書画像の文字の外接矩形を生成することを特徴と
    する文字切り出し方法。
JP2120680A 1990-05-10 1990-05-10 文字切り出し方法 Expired - Fee Related JP2977230B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2120680A JP2977230B2 (ja) 1990-05-10 1990-05-10 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2120680A JP2977230B2 (ja) 1990-05-10 1990-05-10 文字切り出し方法

Publications (2)

Publication Number Publication Date
JPH0417086A true JPH0417086A (ja) 1992-01-21
JP2977230B2 JP2977230B2 (ja) 1999-11-15

Family

ID=14792289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2120680A Expired - Fee Related JP2977230B2 (ja) 1990-05-10 1990-05-10 文字切り出し方法

Country Status (1)

Country Link
JP (1) JP2977230B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06111064A (ja) * 1992-09-29 1994-04-22 N T T Data Tsushin Kk 文字切出し方法
JP2009026287A (ja) * 2007-07-23 2009-02-05 Sharp Corp 文字画像抽出装置および文字画像抽出方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06111064A (ja) * 1992-09-29 1994-04-22 N T T Data Tsushin Kk 文字切出し方法
JP2576079B2 (ja) * 1992-09-29 1997-01-29 エヌ・ティ・ティ・データ通信株式会社 文字切出し方法
JP2009026287A (ja) * 2007-07-23 2009-02-05 Sharp Corp 文字画像抽出装置および文字画像抽出方法
US8750616B2 (en) 2007-07-23 2014-06-10 Sharp Kabushiki Kaisha Character image extracting apparatus and character image extracting method

Also Published As

Publication number Publication date
JP2977230B2 (ja) 1999-11-15

Similar Documents

Publication Publication Date Title
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
JP2940936B2 (ja) 表領域識別方法
JPH03122773A (ja) 画像形成装置
JPH0417086A (ja) 文字切り出し方法
JPH08320914A (ja) 表認識方法および装置
JP2868134B2 (ja) 画像処理方法及び装置
JP3058489B2 (ja) 文字列抽出方法
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2000090194A (ja) 画像処理方法および画像処理装置
Ye et al. Document image matching and annotation lifting
JP2918666B2 (ja) 文字画像切出し方法
JPS61117670A (ja) 文字切り出し処理方式
JP2000040122A (ja) 文字切り出し方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP4310943B2 (ja) 文字認識装置、文字認識プログラム、文字認識方法
JPH05159062A (ja) 文書認識装置
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP2899356B2 (ja) 文字認識装置
JP3157534B2 (ja) 表認識方法
JPH04342089A (ja) 文字入力処理方法
JP2002032713A (ja) 文字認識処理方法
JPH0934992A (ja) オンライン手書き文字列切り出し装置
JPH05128305A (ja) 領域分割方法
JPH0343879A (ja) 文字認識装置およびその文字領域分離方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees