JPH04112283A - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JPH04112283A
JPH04112283A JP2230600A JP23060090A JPH04112283A JP H04112283 A JPH04112283 A JP H04112283A JP 2230600 A JP2230600 A JP 2230600A JP 23060090 A JP23060090 A JP 23060090A JP H04112283 A JPH04112283 A JP H04112283A
Authority
JP
Japan
Prior art keywords
character
distribution
pattern
characters
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2230600A
Other languages
English (en)
Other versions
JP2868134B2 (ja
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2230600A priority Critical patent/JP2868134B2/ja
Priority to DE69125777T priority patent/DE69125777T2/de
Priority to EP91307988A priority patent/EP0476873B1/en
Publication of JPH04112283A publication Critical patent/JPH04112283A/ja
Priority to US08/203,483 priority patent/US5535287A/en
Application granted granted Critical
Publication of JP2868134B2 publication Critical patent/JP2868134B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は、光学的文字認識装置において、接触文字を切
断できる文字分離方式に関するものである。
[従来の技術] 近年、イメージスキャナ等の光学的手法を利用して、文
字情報を直接入力する装置が提案されている。この方法
によれば、手書き文字あるいは印刷文字等から直接文字
情報を入力できるので多くの効果が期待できるが、現状
のイメージスキャナの解像度の制限や、印刷時の汚れ等
により、読み込んだ文字イメージの隣接する文字同士が
誤って接触してしまうことがあり、文字判読能力を向上
させる上で、大きな障害になっている。
従来一般に、接触文字を分離する方法として文字列方向
への射影のヒストグラムを利用する方法が主流である。
第7図、第8図を用いて従来の文字分離方法を説明する
。まず、入力文字raJとrcJが接触を起こし、第7
図のような画像として取り込まれたとする。外接矩形2
01の縦横比が一定値以下(横長)であれば、文字の分
離を行う必要があると判定し、外接矩形の情報から分離
を行うべき範囲202を求める。次に文字を構成してい
る黒画素のX座標(文字列の方向)への射影をとり、第
8図に示す黒画素発生頻度を表わすヒストグラム203
を得る。そして、分離を行う範囲202内で、ヒストグ
ラムd (x)の値が予め定められた閾値d0以下の値
をもつX座標XCを求める。
尚、この条件を満たすX座標が複数ある場合は、それら
の平均をXCとする。
以上の手続きによって求められたXcで文字の分離を行
う、つまり、外接矩形の縦横比が一定値以下であれば、
隣接文字同士の接触があるものとみなし、互いの文字を
分割するおおよその範囲202を設定する。その後、ヒ
ストグラムにより分割可能範囲202内で最も黒画素発
生頻度の低いところ、即ち相互の結合が最も弱いところ
を探して、そこを分割箇所にするものである。
[発明が解決しようとしている課題] しかし、上記従来例では、黒画素のヒストグラムに基づ
いて分離する位置を決定するため、ノイズの影響を受け
やすいという欠点があった。
例えば、第9図のように紙面の汚れ204や、読み込み
時に上の行の文字が侵入してきた場合、ヒストグラムは
第10図のようになる。
この時、従来と同じ方法によると、汚れ204の影響に
より、しきい値d0以下のxcが出現しなくなり、結果
として文字の分割ができなくなった。即ち、文字の分離
ができなければ、文字の判読もできなくなるので、文字
判別能力が低下する欠点があった。
本発明はかかる従来技術に鑑みなされたものであり、良
好に文字の分離を行なうことを可能ならしめる文字分離
方式を提供しようとするものである。
[課題を解決するための手段] この課題を解決するため、本発明の文字分離方式は以下
に示す構成を備える。すなわち、文字認識処理のために
、入力した原稿画像中の1文字分のパターンを隣接する
文字パターンより分離させる文字分離方式において、注
目パターンの輪郭を追跡し、輪郭上の座標位置を検出す
る輪郭追跡手段と、該輪郭追跡手段より得られた座標情
報に基づいて、注目パターンを文字の並び方向に対して
垂直方向からみたときの最も近い座標点と最も遠い座標
点との距離の分布を検出する分布検出手段と、該分布検
出手段で得られた分布により前記注目パターンの分離位
置を検出する分離位置検出手段とを備える。
[作用コ かかる本発明の構成において、輪郭追跡手段によって得
られた座標データに基づき、その注目文字パターンの文
字の並び方向に対して垂直方向からみたときの最も近い
座標点と最も遠い座標点の距離の分布を検出する。そし
て、その分布から最も距離の短い位置を分離位置として
処理する。
[実施例] 以下、添付図面に従って本発明に係る実施例を詳細に説
明する。
第1図に実施例における文字認識装置のブロック構成図
を示す。
図中、100が本装置であり、装置全体を制御するCP
U 1をはじめ、以下に示す構成を備える。2はCPU
1の動作処理手順(後述する第2図、又は第5図或いは
第6図のフローチャート)を記憶しているROM、3は
CPU1がワークエリアとして利用するRAM、4は原
稿画像を読取るイメージリーダ、5読み込んだ画像を展
開する画像メモリである。また、6は画像メモリ5に展
開されたイメージデータ中より切り出された1文字分の
パターンを認識する認識部、7は認識部6がその認識処
理において参照する辞書部、8は認識した結果を出力す
る出力部である。
上述した構成からなる実施例の処理の流れを第2図を参
照して説明する。
第2図は本実施例の処理の流れを示すフローチャートで
ある。尚、以下の説明では、既に原稿画像はイメージリ
ーダ4によって読取られ、その2値画像は画像メモリ5
に展開されているものとする。
先ず、ステップS1で画像メモリ4に格納された文字画
像を受取る。次に、ステップS2で公知の技術を利用し
て文字の輪郭線追跡を行う。一般に、1画素ずつ輪郭を
追跡していく技術が用いられる。第3図は追跡された輪
郭を表す図で、追跡開始点101から追跡を始め、10
1に戻ってくるまで輪郭103を求めてい(1本実施例
では、文字の内部の輪郭104は抽出する必要がない。
(第4図(A)は文字の輪郭だけを示した図である。) ステップS2で得られた輪郭線の情報に基づいて、ステ
ップS3では、文字に外接する矩形102を求める。ス
テップS4では外接矩形102の縦横比Rが予め定めら
れた閾値R0以下、すなわち隣接する文字が接触してい
ると思われる程度に横長であるか否かの判定を行う。R
>ROならば、文字の接触が無いと判断できるので、ス
テップS5に進み分離を行わずに認識部6にそのデータ
を渡す。また、R≦R0以下ならば、文字が接触してい
ると考えられるので、処理はステップS6へ進み、文字
分離を行う範囲を求める。これは、第3図のように文字
列方向にX座標をとり、原点を外接矩形の左端としたと
き、 x c = ’A w X、   =XC−α X、=XC十α α=γ・h という関係から、分離を行う範囲105の左端x1と右
端X、を求める。ただし、w、hはそれぞれ外接矩形の
幅及び高さで、γは予め定められた定数である。
先に求めた輪郭線は、X軸方向から見た場合、上側の輪
郭線y2と下側の輪郭線ylが存在することになる0次
のステップS7では、この輪郭線yz、y+において、
座標Xに対応する輪郭線yt(x)、y+(x)を求め
る。
そして、ステップS8において、それぞれのXに対する
上端座標と下端座標の差S (x)を、S  (x)=
y*(x)−y+(x)として計算する。
そして、ステップS9で、領域105(第3図参照)の
文字分離を行なう範囲内で、算出されたS (x)と予
め定められた閾値S0とを比較し、5(x)<Soとな
るS (x)を捜し、そのときの値Xを分離すべき座標
xcとする。この条件を満たす値Xが複数存在するとき
は、その平均値をXCとする。第4図(B)はこの時の
ヒストグラムを示す。
尚、S (x)<SoとなるXが存在しない場合は、分
離不可能であるとしてステップ510に進み、注目文字
パターン全体を認識部6に渡す(或いは、認識不可とし
て処理を行っても良い)。
また、分離するXcが求まった場合は、処理はステップ
Sllへ進み、X:XCの画素をすべて白画素にするこ
とにより、その右側を1文字、左側を1文字として分離
し、ステップS12でそれぞれを認識部6に渡す。
〈第2の実施例の説明〉 第2の実施例を第5図に示すフローチャートに従って説
明する。本第2の実施例では、輪郭線を求める過程で、
同時に輪郭線の上端座標と下端座標を求めるものである
先ず、初期値として、全ての文字の上端座標y*(x)
に十分率さい値をセットし、且つ全ての下端座標y+(
x)に十分大きい値を設定しておく。但し、Xは“0,
1,2.・・・w(=矩形領域の右端座標)”の値を取
る。
ステップS22では、文字の輪郭線のx+ X座標を1
画素分得るごとに、それまでに格納されているyi(x
)及びy+(x)と比較する。そして、y>y’a(x
)”ならyz(x)の値を得られたyの値で置き換える
。また、y<y+(x)ならy+(x)の値を、得られ
たyの値で置き換える。
以上の手続きにより、輪郭線追跡が終わった時点で、各
Xの値に対するyζ(X)及びy z (’x )の値
が求められていることになる。
第11図を用いてより詳細を説明する。
文字の外側の輪郭50を追跡していく最中には、同じX
座標値であっても図示の如く2点ではなく、複数の点(
図示では4点)が存在する場合がある。実施例において
は、このような場合、点A1を上端座標、点A4を下端
座標として採用し、同図のパターン51として捕らえる
。従って、輪郭上の座標x、yを検出したときに、それ
以前の同じX座標の上端座標yz(x)と比較し、y 
> y 2 (x )のときにyz(x)をyで置き換
える。このようにすることで、図示では点A1のyの値
が上端座標yg(x)として採用される。下端座標y+
(x)も同様である。
尚、第5図においてステップS23以降の説明は先に説
明した第1の実施例と重複するので割愛する。
く第3の実施例〉 第3の実施例として、S (x)の閾値S。を変えてX
eを求める方法を説明する。
第6図は本第3の実施例の処理を表すフローチャートで
、第1の実施例(第2図)の39−312に相当する部
分だけを図示している。それ以外の処理は第1の実施例
に同じであるので説明を省略する。本第3の実施例では
、第1の実施例において、S (x)≦60の存在が認
められなかった場合、文字分離が不可能であるとして、
単純に認識不可通知する代りに、閾値S0と分割範囲X
c±αを変更することにより、再度文字分割を試みるこ
とができるようにしたものである。
まず、ステップS41で制御変数iを1にセットする。
ステップS42では、So及びαにそれぞれSl、α、
をセットする。本実施例においてはi=1.’ 2.3
−?’L、複数の閾値の組(Sl。
α、)、 (S *、α、)、 (S 、、α3)を予
め定めておく。ただし、S l< S’i < S s
かつ、α1〉α2〉α。
である。
ステップ343で、 XI  =xc  −α 皿 X*=Xc十αl で定まる範囲[X r 、 X * ]で、S(×)≦
S。
を満たすXを捜し、存在すればその値をXcとしてステ
ップS44へ進み、X:Xcで文字を分離し、2文字分
の文字画像としてステップS45で認識処理に移る。条
件を満足するXが存在しな−ければステップS46へ進
む。このステップS46ではiの値を1つ増やす。ステ
ップS47ではiの値を調べi>3ならばステップS4
8へ進み、分離不可のままのイメージデータな認識処理
部6に渡す。また、i≦3のときはステップS42に戻
り、処理を繰り返す。
本実施例によれば、広い範囲でわずかな接触部分を探し
、それが存在しないならば、狭い範囲で少々強い接触で
あっても強制的に分離するという文字難処理が可能であ
る。
尚、実施例においては、イメージリーダ4より読み込ん
だ文章中の各文字を認識し、その結果を外部装置に出力
する装置を例にして説明したが、これによって本発明が
限定されるものではない。
例えば、文字を認識しそしてそれを表示し、更には編集
等を行なうことが可能な装置に組み込んでも全(構わな
いからである。
また、実施例では入力した文字の並びが、横方向である
場合を説明したが、縦方向であっても良いことは勿論で
ある。但し、この場合、並び方向が縦であるので、それ
を横方向から見たときの輪郭上の最も近い座標と最も遠
い座標との分布に基づいて分離する位置を判断する。
[発明の効果〕 以上説明したように、本発明によれば、ノイズや他の行
の文字の侵入が存在する場合でも、従来例のように、単
純な黒画素出現率による判断ではなく、輪郭線の上端座
標と下端座標の距離の分布を用いているので、連続した
輪郭線から離れたところにある黒画素を判断基準から除
外できることになる。即ち、ノイズ(汚れ)や他の行の
文字の侵入を結果的に除外できるので、より高い確率と
信頼性で、接触文字の分離を行なうことができ、文字の
判読能力を大幅に向上することが可能になる。
【図面の簡単な説明】
第1図は実施例における文字認識装置のブロック構成図
、 第2図は第1の実施例における文字分離処理手順を示す
フローチャート、 第3図は文字どうしが接触した状態の入力画像を示す図
、 第4図(A)は輪郭線の上端座標及び下端座標によって
表わされる輪郭を示す図、 第4図(B)は第4(A)における上端座標と下端座標
との差の分布を示す図、 第5図は第2の実施例における文字分離処理手順を示す
フローチャート、 第6図は第3の実施例における文字分離処理手順を示す
フローチャート、 第7図〜第10図は従来技術における文字分離処理の概
要を説明するための図、 第11図は第2の実施例における動作原理を説明するた
めの図である。 図中、l・・・cpu、2・・・ROM、3・・・RA
M、4・・・イメージリーダ、5・・・画像メモリ、6
・・・認識部、7・・・辞書部、8・・・出力部である
。 −−−−−−−−−−−−−−−−−−−−−−−−−
−−−−−−−−−l−100第1図 □105 第 図 第 図(A) 第 図(B) 第 図 d (x) 第11 図 第 図

Claims (1)

  1. 【特許請求の範囲】 (1)文字認識処理のために、入力した原稿画像中の1
    文字分のパターンを隣接する文字パターンより分離させ
    る文字分離方式において、 注目パターンの輪郭を追跡し、輪郭上の座標位置を検出
    する輪郭追跡手段と、 該輪郭追跡手段より得られた座標情報に基づいて、注目
    パターンを文字の並び方向に対して垂直方向からみたと
    きの最も近い座標点と最も遠い座標点との距離の分布を
    検出する分布検出手段と、該分布検出手段で得られた分
    布により前記注目パターンの分離位置を検出する分離位
    置検出手段とを備えることを特徴とする文字分離方式。 (2)更に、注目パターンの外接矩形の縦横比に基づい
    て当該注目パターンが分離すべきか否かを判定する判定
    手段を備え、前記分布検出手段及び前記分離位置検出手
    段は前記判定手段で分離すべきであると判定されたとき
    に付勢されることを特徴とする請求項第1項に記載の文
    字分離方式(3)更に、注目パターンの外接矩形の縦横
    比に基づいて、当該注目パターンの分離可能範囲を算出
    する算出手段を備え、前記分離位置検出手段は前記算出
    手段で算出された分離可能範囲内で分離位置を検出する
    ことを特徴とする請求項第1項に記載の文字分離方式 (4)前記分離位置検出手段は、前記分布検出手段で得
    られた距離分布が所定閾値以下となつている位置を分離
    位置とすることを特徴とする請求項第1項に記載の文字
    分離方式。 (5)前記分離位置検出手段は、前記分布検出手段で得
    られた距離分布が所定閾値以下となつている位置の存在
    を検出できなかつたときには、前記閾値を変更して再度
    検出処理を行うことを特徴とする請求項第4項に記載の
    文字分離方式。
JP2230600A 1990-09-03 1990-09-03 画像処理方法及び装置 Expired - Fee Related JP2868134B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2230600A JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置
DE69125777T DE69125777T2 (de) 1990-09-03 1991-08-30 Verfahren und Gerät zur Trennung von Bildbereichen
EP91307988A EP0476873B1 (en) 1990-09-03 1991-08-30 Method of and apparatus for separating image regions
US08/203,483 US5535287A (en) 1990-09-03 1994-02-28 Method of and apparatus for separating image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2230600A JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH04112283A true JPH04112283A (ja) 1992-04-14
JP2868134B2 JP2868134B2 (ja) 1999-03-10

Family

ID=16910286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2230600A Expired - Fee Related JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置

Country Status (4)

Country Link
US (1) US5535287A (ja)
EP (1) EP0476873B1 (ja)
JP (1) JP2868134B2 (ja)
DE (1) DE69125777T2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69329380T2 (de) * 1993-06-30 2001-03-01 Ibm Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
JP3155499B2 (ja) * 1997-11-26 2001-04-09 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 光ディスクのビット変換の方法、復調方法および装置
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
JP3880044B2 (ja) * 2002-02-22 2007-02-14 富士通株式会社 手書き文字入力支援装置及び方法
JP2004038321A (ja) * 2002-06-28 2004-02-05 Fujitsu Ltd 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS59158479A (ja) * 1983-03-01 1984-09-07 Nec Corp 文字分離装置
JPS61105680A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 光学文字読取装置の文字切出し方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4769849A (en) * 1985-12-19 1988-09-06 The Palantir Corporation Method and apparatus for separating overlapping patterns
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS59158479A (ja) * 1983-03-01 1984-09-07 Nec Corp 文字分離装置
JPS61105680A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 光学文字読取装置の文字切出し方法

Also Published As

Publication number Publication date
US5535287A (en) 1996-07-09
EP0476873A3 (en) 1993-10-13
EP0476873B1 (en) 1997-04-23
EP0476873A2 (en) 1992-03-25
DE69125777T2 (de) 1997-10-09
DE69125777D1 (de) 1997-05-28
JP2868134B2 (ja) 1999-03-10

Similar Documents

Publication Publication Date Title
WO1990001198A1 (en) Character recognition apparatus
JP3411472B2 (ja) パターン抽出装置
JP3574584B2 (ja) 表画像処理装置及びそのプログラム記憶媒体
JPH04112283A (ja) 画像処理方法及び装置
JPH06187489A (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP3348224B2 (ja) 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP3113217B2 (ja) 破線認識方法
JP2000193420A (ja) 眼の位置検出装置
JPH11232382A (ja) 罫線抽出方法及び罫線除去方法
JP2957729B2 (ja) 行方向判定装置
JP2982221B2 (ja) 文字読み取り装置
JP2004158041A (ja) 表画像処理装置及びそのプログラム記憶媒体
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
JP3190794B2 (ja) 文字切り出し装置
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH05128305A (ja) 領域分割方法
JP3334369B2 (ja) 選択項目認識装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JPH07118016B2 (ja) 図形認識装置
JP3027232B2 (ja) 文字認識装置
JPH0524555B2 (ja)
JPH08171609A (ja) 文字列高速抽出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091225

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees