JP2868134B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JP2868134B2
JP2868134B2 JP2230600A JP23060090A JP2868134B2 JP 2868134 B2 JP2868134 B2 JP 2868134B2 JP 2230600 A JP2230600 A JP 2230600A JP 23060090 A JP23060090 A JP 23060090A JP 2868134 B2 JP2868134 B2 JP 2868134B2
Authority
JP
Japan
Prior art keywords
character
image
determined
displacement axis
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2230600A
Other languages
English (en)
Other versions
JPH04112283A (ja
Inventor
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2230600A priority Critical patent/JP2868134B2/ja
Priority to EP91307988A priority patent/EP0476873B1/en
Priority to DE69125777T priority patent/DE69125777T2/de
Publication of JPH04112283A publication Critical patent/JPH04112283A/ja
Priority to US08/203,483 priority patent/US5535287A/en
Application granted granted Critical
Publication of JP2868134B2 publication Critical patent/JP2868134B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識等の為に入力画像中の文字画像の分
離位置を決定する画像処理方法及び装置に関するもので
ある。
[従来の技術] 近年、イメージスキャナ等の光学的手法を利用して、
文字情報を直接入力する装置が提案されている。この方
法によれば、手書き文字あるいは印刷文字等から直接文
字情報を入力できるので多くの効果が期待できるが、現
状のイメージスキャナの解像度の制限や、印刷時の汚れ
等により、読み込んだ文字イメージの隣接する文字同士
が誤って接触してしまうことがあり、文字判読能力を向
上させる上で、大きな障害になっている。
従来一般に、接触文字を分離する方法として文字列方
向への射影のヒストグラムを利用する方法が主流であ
る。
第7図,第8図を用いて従来の文字分離方法を説明す
る。まず、入力文字「a」と「c」が接触を起こし、第
7図のような画像として取り込まれたとする。外接矩形
201の縦横比が一定値以下(横長)であれば、文字の分
離を行う必要があると判定し、外接矩形の情報から分離
を行うべき範囲202を求める。次に文字を構成している
黒画素のx座標(文字列の方向)への射影をとり、第8
図に示す黒画素発生頻度を表わすヒストグラム203を得
る。そして、分離を行う範囲202内で、ヒストグラムd
(x)の値が予め定められた閾値d0以下の値をもつx座
標xcを求める。尚、この条件を満たすx座標が複数ある
場合は、それらの平均をxcとする。
以上の手続きによつて求められたxcで文字の分離を行
う。つまり、外接矩形の縦横比が一定値以下であれば、
隣接文字同士の接触があるものとみなし、互いの文字を
分割するおおよその範囲202を設定する。その後、ヒス
トグラムにより分割可能範囲202内で最も黒画素発生頻
度の低いところ、即ち相互の結合が最も弱いところを探
して、そこを分割箇所にするものである。
[発明が解決しようとしている課題] しかし、上記従来例では、黒画素のヒストグラムに基
づいて分離する位置を決定するため、ノイズの影響を受
けやすいという欠点があつた。
例えば、第9図のように紙面の汚れ204や、読み込み
時に上の行の文字が侵入してきた場合、ヒストグラムは
第10図のようになる。
この時、従来と同じ方法によると、汚れ204の影響に
より、しきい値d0以下のxcが出現しなくなり、結果とし
て文字の分割ができなくなった。即ち、文字の分離がで
きなければ、文字の判読もできなくなるので、文字判別
能力が低下する欠点があった。
本発明はかかる問題点に鑑みなされたものであり、文
字列画像の文字列の方向を変位軸とし、その変位軸に垂
直に横切った文字画像の輪郭点間の最大になる2つの輪
郭点の分布でもって文字画像の分離位置を決定すること
で、より高い確率と信頼性で文字画像の分離位置を決定
することができる画像処置方法及び装置を提供しようと
するものである。
[課題を解決するための手段] この課題を解決するため、例えば本発明の画像処理方
法は以下の工程を備える。すなわち、 文字列方向を変位軸とし、当該変位軸に垂直な方向で
当該文字列の文字画像を横切った場合に当該横切った線
上にある複数の文字画像輪郭点から、点間の距離が最大
となる2つの輪郭点を選択し、 前記変位軸に沿った各変位点で選択される2つの輪郭
点間の距離の分布を求め、 求められた文字列方向の変位軸に対する距離の分布に
基づいて、前記文字画像の分離位置を決定することを特
徴とする。
[実施例] 以下、添付図面に従つて本発明に係る実施例を詳細に
説明する。
第1図に実施例における文字認識装置のブロツク構成
図を示す。
図中、100が本装置であり、装置全体を制御するCPU1
をはじめ、以下に示す構成を備える。2はCPU1の動作処
理手順(後述する第2図、又は第5図或いは第6図のフ
ローチヤート)を記憶しているROM、3はCPU1がワーク
エリアとして利用するRAM、4は原稿画像を読取るイメ
ージリーダ、5は読み込んだ画像を展開する画像メモリ
である。また、6は画像メモリ5に展開されたイメージ
データ中より切り出された1文字分のパターンを認識す
る認識部、7は認識部6がその認識処理において参照す
る辞書部、8は認識した結果を出力する出力部である。
上述した構成からなる実施例の処理の流れを第2図を
参照して説明する。
第2図は本実施例の処理の流れを示すフローチヤート
である。尚、以下の説明では、既に原稿画像はイメージ
リーダ4によつて読取られ、その2値画像は画像メモリ
5に展開されているものとする。
先ず、ステップS1で画像メモリ4に格納された文字画
像を受取る。次に、ステツプS2で公知の技術を利用して
文字の輪郭線追跡を行う。一般に、1画像ずつ輪郭を追
跡していく技術が用いられる。第3図は追跡された輪郭
を表す図で、追跡開始点101から追跡を始め、101に戻つ
てくるまで輪郭103を求めていく。本実施例では、文字
の内部の輪郭104は抽出する必要がない。(第4図
(A)は文字の輪郭だけを示した図である。) ステツプS2で得られた輪郭線の情報に基づいて、ステ
ツプS3では、文字に外接する矩形102を求める。ステツ
プS4では外接矩形102の縦横比Rが予め定められた閾値R
0以下、すなわち隣接する文字が接触していると思われ
る程度に横長であるか否かの判定を行う。R>R0なら
ば、文字の接触が無いと判断できるので、ステツプS5に
進み分離を行わずに認識部6にそのデータを渡す。ま
た、R≦R0と判定されるならば、文字が接触していると
考えられるので、処理はステツプS6へ進み、文字分離を
行う範囲を求める。これは、第3図のように文字列方向
にx座標をとり、原点を外接矩形の左端としたとき、 xc1/2w x1=xc−a x2=xc+a a=γ・h という関係から、分離を行う範囲105の左端x1と右端x2
を求める。ただし、w,hはそれぞれ外接矩形の幅及び高
さで、γは予め定められた定数である。
先に求めた輪郭線は、X軸方向から見た場合、上側の
輪郭線y2と下側の輪郭線y1が存在することになる。次の
ステツプS7では、この輪郭線y2,y1において、座標xに
対応する輪郭線y2(x),y1(x)を求める。
そして、ステツプS8において、それぞれのxに対する
上端座標と下端座標の差S(x)を、 S(x)=y2(x)−y1(x) として計算する。
そして、ステツプS9で、領域105(第3図参照)の文
字分離を行なう範囲内で、算出されたS(x)と予め定
められた閾値S0とを比較し、S(x)<S0となるS
(x)を捜し、そのときの値xを分離すべき座標xcとす
る。この条件を満たす値xが複数存在するときは、その
平均値をxcとする。第4図(B)はこの時のヒストグラ
ムを示す。
尚、S(x)<S0となるxが存在しない場合は、分離
不可能であるとしてステツプS10に進み、注目文字パタ
ーン全体を認識部6に渡す(或いは、認識不可として処
理を行つても良い)。
また、分離するxcが求まつた場合は、処理はステツプ
S11へ進み、x=xcの画素をすべて白画素にすることに
より、その右側を1文字、左側を1文字として分離し、
ステツプS12でそれぞれを認識部6に渡す。
〈第2の実施例の説明〉 第2の実施例を第5図に示すフローチヤートに従つて
説明する。本第2の実施例では、輪郭線を求める過程
で、同時に輪郭線の上端座標と下端座標を求めるもので
ある。
先ず、初期値として、全ての文字の上端座標y2(x)に
十分小さい値をセツトし、且つ全ての下端座標y1(x)に
十分大きい値を設定しておく。但し、xは“0,1,2,…w
(=矩形領域の右端座標)”の値を取る。
ステツプS22では、文字の輪郭線のx,y座標を1画素分
得るごとに、それまでに格納されているy2(x)及びy1(x)
と比較する。そして、“y>y2(x)”ならy2(x)の値を得
られたyの値で置き換える。また、y<y1(x)ならy1(x)
の値を、得られたyの値で置き換える。
以上の手続きにより、輪郭線追跡が終わつた時点で、
各xの値に対するy1(x)及びy2(x)の値が求められている
ことになる。
第11図を用いてより詳細を説明する。
文字の外側の輪郭50を追跡していく最中には、同じx
座標値であつても図示の如く2点ではなく、複数の点
(図示では4点)が存在する場合がある。実施例におい
ては、このような場合、点A1を上端座標、点A4を下端座
標として採用し、同図のパターン51として捕らえる。従
つて、輪郭上の座標x,yを検出したときに、それ以前の
同じx座標の上端座標y2(x)と比較し、y>y2(x)のとき
にy2(x)をyで置き換える。このようにすることで、図
示では点A1のyの値が上端座標y2(x)として採用され
る。下端座標y1(x)も同様である。
尚、第5図においてステツプS23以降の説明は先に説
明した第1の実施例と重複するので割愛する。
〈第3の実施例〉 第3の実施例として、S(x)の閾値S0を変えてxc
求める方法を説明する。
第6図は本第3の実施例の処理を表すフローチヤート
で、第1の実施例(第2図)のS9-S12に相当する部分だ
けを図示している。それ以外の処理は第1の実施例に同
じであるので説明を省略する。本第3の実施例では、第
1の実施例において、S(x)≦S0の存在が認められな
かった場合、文字分離が不可能であるとして、単純に認
識不可通知する代りに、閾値S0と分割範囲xc±aを変更
することにより、再度文字分割を試みることができるよ
うにしたものである。
まず、ステツプS41で制御変数iを1にセツトする。
ステツプS42では、S0及びaにそれぞれSi,aiをセツトす
る。本実施例においてはi=1,2,3とし、複数の閾値の
組(S1,a1),(S2,a2),(S3,a3)を予め定めてお
く。ただし、S1<S2<S3かつ、a1>a2>a3である。
ステツプS43で、 x1=xc−ai x2=xc+ai で定まる範囲[x1,x2]で、S(x)≦Siを満たすxを
捜し、存在すればその値をxcとしてステツプS44へ進
み、x=xcで文字を分離し、2文字分の文字画像として
ステツプS45で認識処理に移る。条件を満足するxが存
在しなければステツプS46へ進む。このステツプS46では
iの値を1つ増やす。ステツプS47ではiの値を調べi
>3ならばステツプS48へ進み、分離不可のままのイメ
ージデータを認識処理部6に渡す。また、i≦3のとき
はステツプS42に戻り、処理を繰り返す。
本実施例によれば、広い範囲でわずかな接触部分を探
し、それが存在しないならば、狭い範囲で少々強い接触
であつても強制的に分離するという文字分離処理が可能
である。
尚、実施例においては、イメージリーダ4より読み込
んだ文章中の各文字を認識し、その結果を外部装置に出
力する装置を例にして説明したが、これによつて本発明
が限定されるものではない。例えば、文字を認識しそし
てそれを表示し、更には編集等を行なうことが可能な装
置に組み込んでも全く構わないからである。
また、実施例では入力した文字の並びが、横方向であ
る場合を説明したが、縦方向であつても良いことは勿論
である。但し、この場合、並び方向が縦であるので、そ
れを横方向から見たときの輪郭上の最も近い座標と最も
遠い座標との分布に基づいて分離する位置を判断する。
[発明の効果] 以上説明したように本発明によれば、文字列画像の文
字列の方向を変位軸とし、その変位軸に垂直に横切った
文字画像の輪郭点間の最大になる2つの輪郭点の分布で
もって文字画像の分離位置を決定するので、より高い確
率と信頼性で文字画像の分離位置を決定することができ
る。
従って、文字認識する場合には、正しい位置で文字画
像の分離が行えるので、文字認識率を向上させることが
できる。
【図面の簡単な説明】
第1図は実施例における文字認識装置のブロツク構成
図、 第2図は第1の実施例における文字分離処理手順を示す
フローチヤート、 第3図は文字どうしが接触した状態の入力画像を示す
図、 第4図(A)は輪郭線の上端座標及び下端座標によつて
表わされる輪郭を示す図、 第4図(B)は第4(A)における上端座標と下端座標
との差の分布を示す図、 第5図は第2の実施例における文字分離処理手順を示す
フローチヤート、 第6図は第3の実施例における文字分離処理手順を示す
フローチヤート、 第7図〜第10図は従来技術における文字分離処理の概要
を説明するための図、 第11図は第2の実施例における動作原理を説明するため
の図である。 図中、1……CPU、2……ROM、3……RAM、4……イメ
ージリーダ、5……画像メモリ、6……認識部、7……
辞書部、8……出力部である。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列方向を変位軸とし、当該変位軸に垂
    直な方向で当該文字列の文字画像を横切った場合に当該
    横切った線上にある複数の文字画像輪郭点から、点間の
    距離が最大となる2つの輪郭点を選択し、 前記変位軸に沿った各変位点で選択される2つの輪郭点
    間の距離の分布を求め、 求められた文字列方向の変位軸に対する距離の分布に基
    づいて、前記文字画像の分離位置を決定する ことを特徴とする画像処理方法。
  2. 【請求項2】前記決定された分離位置で分離された画像
    を文字認識することを特徴とする請求項第1項に記載の
    画像処理方法。
  3. 【請求項3】文字列方向を変位軸とし、当該変位軸に垂
    直な方向で当該文字列の文字画像を横切った場合に当該
    横切った線上にある複数の文字画像輪郭点から、点間の
    距離が最大となる2つの輪郭点を選択する輪郭点選択手
    段と、 前記変位軸に沿った各変位点で選択される2つの輪郭点
    間の距離の分布を求める距離分布導出手段と、 求められた文字列方向の変位軸に対する距離の分布に基
    づいて、前記文字画像の分離位置を決定する分離位置決
    定手段と を備えることを特徴とする画像処理装置。
  4. 【請求項4】前記分離位置決定手段で決定された分離位
    置で分離された画像を文字認識することを特徴とする請
    求項第3項に記載の画像処理装置。
JP2230600A 1990-09-03 1990-09-03 画像処理方法及び装置 Expired - Fee Related JP2868134B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2230600A JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置
EP91307988A EP0476873B1 (en) 1990-09-03 1991-08-30 Method of and apparatus for separating image regions
DE69125777T DE69125777T2 (de) 1990-09-03 1991-08-30 Verfahren und Gerät zur Trennung von Bildbereichen
US08/203,483 US5535287A (en) 1990-09-03 1994-02-28 Method of and apparatus for separating image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2230600A JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH04112283A JPH04112283A (ja) 1992-04-14
JP2868134B2 true JP2868134B2 (ja) 1999-03-10

Family

ID=16910286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2230600A Expired - Fee Related JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置

Country Status (4)

Country Link
US (1) US5535287A (ja)
EP (1) EP0476873B1 (ja)
JP (1) JP2868134B2 (ja)
DE (1) DE69125777T2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0632402B1 (en) * 1993-06-30 2000-09-06 International Business Machines Corporation Method for image segmentation and classification of image elements for document processing
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
JP3155499B2 (ja) * 1997-11-26 2001-04-09 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 光ディスクのビット変換の方法、復調方法および装置
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
JP3880044B2 (ja) * 2002-02-22 2007-02-14 富士通株式会社 手書き文字入力支援装置及び方法
JP2004038321A (ja) * 2002-06-28 2004-02-05 Fujitsu Ltd 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS59158479A (ja) * 1983-03-01 1984-09-07 Nec Corp 文字分離装置
JPS61105680A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 光学文字読取装置の文字切出し方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4769849A (en) * 1985-12-19 1988-09-06 The Palantir Corporation Method and apparatus for separating overlapping patterns
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS59158479A (ja) * 1983-03-01 1984-09-07 Nec Corp 文字分離装置
JPS61105680A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 光学文字読取装置の文字切出し方法

Also Published As

Publication number Publication date
EP0476873B1 (en) 1997-04-23
US5535287A (en) 1996-07-09
DE69125777D1 (de) 1997-05-28
DE69125777T2 (de) 1997-10-09
EP0476873A3 (en) 1993-10-13
EP0476873A2 (en) 1992-03-25
JPH04112283A (ja) 1992-04-14

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US5896464A (en) Ruled line elimination apparatus and method
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
JP3411472B2 (ja) パターン抽出装置
JP2868134B2 (ja) 画像処理方法及び装置
JP3006466B2 (ja) 文字入力装置
KR102239564B1 (ko) 행정구역별 오브젝트 인식방법 및 그 시스템
JP3095470B2 (ja) 文字認識装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JPH06187489A (ja) 文字認識装置
JP2778437B2 (ja) 文書画像傾き検出装置
JP3019897B2 (ja) 行切出し方法
JPH09305707A (ja) 画像抽出方式
JP2003317107A (ja) 罫線抽出方法及び装置
JP2957729B2 (ja) 行方向判定装置
JPH02273884A (ja) 文書画像の歪検出補正方法
JP2963508B2 (ja) 文字切出し装置
JPH07141465A (ja) 文書画像の傾き検出方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP3142950B2 (ja) 線分認識方式
JP3084833B2 (ja) 特徴抽出装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
JPH07118016B2 (ja) 図形認識装置
JPH04130979A (ja) 文字画像切出し方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091225

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees