JP2925303B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JP2925303B2
JP2925303B2 JP2314956A JP31495690A JP2925303B2 JP 2925303 B2 JP2925303 B2 JP 2925303B2 JP 2314956 A JP2314956 A JP 2314956A JP 31495690 A JP31495690 A JP 31495690A JP 2925303 B2 JP2925303 B2 JP 2925303B2
Authority
JP
Japan
Prior art keywords
character
image data
loop
character image
cutting position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2314956A
Other languages
English (en)
Other versions
JPH04184584A (ja
Inventor
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2314956A priority Critical patent/JP2925303B2/ja
Publication of JPH04184584A publication Critical patent/JPH04184584A/ja
Application granted granted Critical
Publication of JP2925303B2 publication Critical patent/JP2925303B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字画像の切り出しを正しく行なう為の画
像処理方法及び装置に関するものである。
〔従来の技術〕
活字を認識する文字認識装置は、一般に第5図のよう
に構成されている。501は文字画像をアナログ電気信号
に変換するスキヤナ、502はスキヤナからのアナログ信
号を2値化する2値化手段、503は2値化された画像デ
ータを記憶しておく画像メモリ、504は画像メモリ上の
文字列に対して1文字ごとに文字領域を取り出す文字切
り出し手段、505は予め定められたアルゴリズムに従っ
て文字固有の特徴を抽出する特徴抽出手段、507は505と
同じ特徴抽出処理を学習用でデータに対して行った結果
得られる平均値や分散等の統計量を格納しておく認識辞
書、506は入力文字画像から得られた特徴量を認識辞書
の内容と比較し、最も距離の近い候補文字を認識結果と
して選び出す照合手段、507は認識結果として候補文字
のコードをデイスプレイや外部装置へ転送する出力手段
である。
〔発明が解決しようとしている課題〕
上記従来技術では、1行中の隣り合う文字が接触して
いる時には、複数文字を1文字として認識してしまい、
文字の切り出し正しく行われず、そのまま処理を進めて
しまうので適当な候補文字がみつからない為、認識が行
えずにリジエクトとなってしまっていた。
例えば、第3図に示すように「OOC」という文字の場
合「O」と「O」、「O」と「C」が接触してしまう為
に、輪郭線追跡で文字の切り出しを行うと「OOC」が1
文字と認識され、外接矩形は第3図中の301のように処
理されてしまう。このように、従来の技術では接触文字
「OOCを3文字として正しく認識できないという欠点が
あった。
[課題を解決するための手段] 上記課題を解決する為に、本発明は、入力した文字画
像データから閉領域を抽出し、前記抽出された閉領域の
中心から所定距離以上離れた範囲で、前記文字画像デー
タの切断位置を導出する画像処理方法及び装置を提供す
る。
上記課題を解決する為に、本発明は、好ましくは前記
入力した文字画像データを認識し、前記認識結果の類似
度が所定値である場合に、前記切断位置の導出を行なう
よう制御する。
上記課題を解決する為に、本発明は、好ましくは前記
文字画像データの切断位置と導出を、前記抽出された閉
領域の中心から逆方向に所定距離以上離れた2箇所の範
囲で行なう。
〔実施例〕
第1図(B)は本発明の第1の実施例を表す構成図
で、101〜108は第5図の従来例のそれぞれ501〜508に同
じである。109は照合手段で得られた距離に基づいて認
識結果が妥当かどうか判定する判定手段、110は文字の
外接矩形の内部と外接矩形のすぐ上に設定された特定領
域内でループを探索するループ探索手段、111はループ
の座標から切断すべき座標を計算する座標計算手段、11
2は前記位置で文字線の切断を行なう切断手段である。
第1図(A)は本実施例の構成を示すブロック図であ
る。
第1図(A)において、1は第2図に示したフローチ
ヤートのような処理の流れを制御するCPUであり、本実
施例におけるスキヤナ101から読みとった画像情報を2
値化する2値化手段102、照合結果の距離の大きさを判
定する判定手段109、ヘツダが発見された時に切断すべ
き座標を計算する座標計算手段111、計算された切断す
べき座標の画素を白画素として1文字ごとに切断する切
断手段112の処理を行う。2はキーボード(K.B.)、3
はポインテイング・デバイス(P.D.)であり、共に文字
・記号等の入力や、誤認識した時の修正等を行う際の指
示を行う時に用いる。4は文字を認識する際の認識辞書
107を記憶し、また、第2図に示したフローチヤートの
ような処理の流れを制御する為のプログラムを記憶して
いるリードオンリーメモリ(ROM)である。5はメモリ
であり、例えばスキヤナ9より読みとったデータを記憶
する画像メモリ103の役割をする。6はスキヤナ9より
読みとったデータから候補となる単語をみつけ、各々の
相違度も計算する識別計算部であり、本実施例における
画像情報から文字の切り出しを行う文字切り出し手段10
4、切り出されたデータから特徴抽出を行う特徴抽出手
段105、抽出された特徴を認識辞書のデータと照合する
照合手段106、切り出されたデータからループを検索す
るループ検索手段110の処理も行う。7はCRTであり、読
みとった画像情報や認識結果の文字情報を表示する出力
手段108である。8は画像情報を読みとるスキヤナ(SCA
N)であり第1図(B)にはスキヤナ101として示してい
る。9はスキヤナ8のインターフエイス(SCAN I/F)で
ある。
次に第2図のフローチヤートに従って本実施例の処理
の流れについて説明する。スキヤナ101から文字画像を
入力しアナログ電気信号に変換する(S1)。S2では2値
化手段102によってスキヤナ101より入力アナログ信号の
2値化を行い、文字画像2値のデータとして画像メモリ
103に格納する。入力された画像情報の白画素には0
を、黒画素には1を対応させて2値化を行う。次にS3
で、文字切り出し手段104により画像メモリ上の2値化
された画像情報に対して1文字ごとに文字を切り出し、
外接矩形を求める。本実施例では輪郭線追跡を行うこと
によって文字の切り出しを行っている。
S3で文字切り出し手段104によって切り出された外接
矩形の領域内で予め定められたアルゴリズムに従って特
徴抽出手段105による1文字ずつ特徴抽出を行い、特徴
ベクトルx(x1、…、xn)(nは特徴ベクトルの次元
数)を得る。本実施例では領域内のすべての輪郭線を追
跡し文字線の局所的な傾きを特徴としている。矩形内の
すべての輪郭線を追跡する方法は公知の技術を用いて行
う。S5では、認識辞書107に格納された、字種ごとの平
均ベクトルと認識対象文字の特徴ベクトルxを比較し距
離を計算する。この距離の小さいものほど認識結果とし
て適当だと言える。候補字種k(1≦k≦K;Kは前候補
字種数)に対する距離d(k)を d(k)=|xi−mi(k)|/σ(k) で計算する。ただし、mi(k)、σ(k)(1≦i≦
n)はそれぞれ候補字種kの平均値、標準偏差である。
そして、すべての候補字種に対する距離を求め、最も小
さい距離d1を与える字種を認識結果とする。S6では認識
結果が妥当かどうかの判定を判定手段109において行
う。この判定にはd1及び2番目に小さい距離d2を用い
る。すなわち、 d1>Dまたはd2−d1<D のときに認識結果が妥当でないと判定する。ただしD、
D′は統計処理によって予め定めたしきい値である。
英字のうちA、B、D、O、P、Q、R、a、b、
d、e、g、o、p、qは字形として固有の閉領域を持
っている。これらの閉領域をループと呼ぶことにする。
ループは横方向に見て文字のほぼ中央に位置し、しかも
1文字中に複数のループが存在する場合でも横に並ぶよ
うなものはない。したがって、ループを発見し、その位
置情報に基づいで接触文字を切断することが可能であ
る。S6において照合結果の距離が大きくなく、認識結果
が妥当と判定された場合はS7へ進みそのまま認識結果を
出力手段108より出力するが、S6において照合結果の距
離が大きく、認識結果が妥当でないと判断された場合は
S8へ進み外接矩形内にループが存在するか否かループ探
索手段により探索を行う。本実施例ではS4での特徴抽出
過程で輪郭線追跡を行っており、得たデータはメモリ5
に格納してあるので外接矩形301内の輪郭線に関して改
めて輪郭線追跡を行う必要はない。
第3図は接触文字の外接矩形内にループが含まれてい
る例で、矩形の左下隅を原点、右方向をx軸、上方向を
y軸とする。
外接矩形内のすべての輪郭線に対して次の2つの条件
を満たすものをループであると判定する。
(1)閉領域(インナーループ)である。
(2)輪郭線の長さaが L1<a を満たす。
条件(2)はノイズをループと間違わないためであ
る。L1は外接矩形の高さy0から予め定めた関係式で決ま
る値である。本実施例では、 L1=0.8y0 としている。
ループが発見された場合、S10へ進み、切断すべき座
標を求める。1つの外接矩形からループが複数発見され
た場合は、ループの長さ(輪郭線長)の最も長いループ
ぽ選択する。発見されたループの左端のx座標と右端の
x座標の平均xcをループの中心座標とし、それに基づい
て切断すべき位置の候補x1、x2を計算する。すなわち、 x1=xc−a x2=xc+a とする。ただし、aは外接矩形の高さy0から定まる値で
ある。本実施例では、 a=0.4y0 とする。x1、x2は大まかな位置を表すだけなので、この
付近で文字の厚みのうすいところを捜して切断すること
を試みる。外接矩形の輪郭線の上端の座標をyh(x)、
下端の座標をy1(x)としたとき、文字と厚さd(x)
を d(x)=yh(x)−y1(x) で定義する。
ループの左端x1に対して、x1を中心とした一定の幅内
におけるd(x)の最小値 dmin=min(d(x))(x1−δ1<x<x1−δ2) が dmin<D″ を満たすとき、このdminを与えるxを切断すべきである
位置x1′とする。ただし、x1′が十分小さい場合、すな
わち x1′<W のときはx1の側には文字がないものと判断し、切断位置
x1′は設定されない。ここでδ、δ、D″、Wも外
接矩形の高さy0から予め定めた関係式で決まる値であ
る。
x2の側についても同様な判定を行い、 dmin=min(d(x))(x2+δ1<x<x2+δ2) が dmin<D を満たし、かつ x0−x2′≧W のときには、dminを与えるxを切断すべき位置x2′とし
て設定する。x0は外接矩形の幅である。S10において、x
1′またはx2′或はその両方を与えるようなループが発
見された場合S11へ進む。S11ではx座標がx1′またはx
2′の画像をすべて白画素にし、S3からの、切り出し・
特徴抽出・照合の処理をやり直す。
第3図の例ではx1′およびx2′が設定されるが、第4
図ような場合x1′が設定されず、切断すべき場所が1か
所だけになる。
またこれまでは、輪郭線追跡によってループを発見し
ている方法について述べたが、例えば任意の白画素から
複数方向に腕を伸ばしてすべて文字線にぶつかればルー
プであるといった発見方法もある。図形の閉包部分を発
見する方法種々提案されており公知の技術である。
また1つの外接矩形内で複数のループが発見された場
合、ループ長の最も長いループを選択する方法の他に次
のようなるループを選択する方法がある。
1.ループ長が最も短いループ 2.ループの座標が外接矩形内で最も左にあるループ 3.ループの座標が外接矩形の中心に近いループ字体によ
っては文字接触によって擬似的ループが発生することが
あるので認識対象物によって最適なループ選択方法を採
用するばよい。
また認識結果が妥当かどうかの判定手段としてd1とd2
を用いた例について説明したが、d1だけ、あるいはd1、
d2、d3(3番目に小さい距離)を用いることも可能であ
る。
また文字認識をする対象は、英文字に限らず、各々の
文字が独占しており、隣り合う複数の文字を1文字とし
て誤って切り出してしまう可能性がある文字な関して応
用できることの勿論である。
以上述べたように、本発明によれば、認識結果が予め
定められた妥当であるという基準を満たさないと判断さ
れた時には、接触した複数の文字を1文字として切り出
してしまったと判断し、例えば「0」の閉領域(ルー
プ)を探索してループの存在位置から「0」な存在する
座標を導出して接触した文字を1文字ずつ正しい位置で
切り離すことにより、接触文字の認識も正しく行なわ
れ、全体の認識率も高まることが可能となる。
[発明の効果] 以上説明したように、本発明によれば、入力した文字
画像データから閉領域を抽出し、前記抽出された閉領域
の中心から所定距離以上離れた範囲で、前記文字画像デ
ータの切断位置を導出することにより、閉領域を有する
文字とその他の文字とが接触した文字画像データの切断
位置を、一つの文字の形状に含まれる閉領域より外側の
位置で正しく導出することができる。
以上説明したように、本発明によれば、前記入力した
文字画像データを認識し、前記認識結果の類似度が所定
値以下である場合に、前記切断位置の導出を行なうよう
制御することにより、切断位置の導出の処理を必要に応
じて選択的に行なうので、処理を効率化できる。
以上説明したように、本発明によれば、前記文字画像
データの切断位置の導出を、前記抽出された閉領域の中
心から逆方向に所定距離以上離れた2箇所の範囲行なう
ことにより、形状に閉領域を含む文字がどちら方向で他
の文字と接触しているかに関わらず、切断位置を正しく
導出することができる。
【図面の簡単な説明】
第1図(A)は本発明の実施例を表すブロツク図、 第1図(B)は本発明の第1の実施例を表す構成図、 第2図は第1の実施例のフローチヤート、 第3図はループをもつ英文が含まれる接触文字の第1の
例示図、 第4図はループをもつ英字が含まれる接触文字の第二の
例示図、 第5図は従来の文字認識装置の構成を表す図。

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した文字画像データから閉領域を抽出
    し、 前記抽出された閉領域の中心から所定距離以上離れた範
    囲で、前記文字画像データの切断位置を導出することを
    特徴とする画像処理方法。
  2. 【請求項2】前記入力した文字画像データを認識し、 前記認識結果の類似度が所定値以下である場合に、前記
    切断位置の導出を行なうよう制御することを特徴とする
    請求項1に記載の画像処理方法。
  3. 【請求項3】前記文字画像データの切断位置の導出を、
    前記抽出された閉領域の中心から逆方向に所定距離以上
    離れた2箇所の範囲で行なうことを特徴とする請求項1
    に記載の画像処理方法。
  4. 【請求項4】入力した文字画像データから閉領域を抽出
    する閉領域抽出手段と、 前記抽出された閉領域の中心から所定距離以上離れた範
    囲で、前記文字画像データの切断位置を導出する切断位
    置導出手段とを有することを特徴とする画像処理装置。
  5. 【請求項5】前記入力した文字画像データを認識手段
    と、 前記認識結果の類似度が所定値以下であるか否かを判断
    する判断手段と、 前記判断手段により前記認識結果の類似度が所定値以下
    であると判断される場合に、前記切断位置の導出を行な
    うよう制御する制御手段とを有することを特徴とする請
    求項4に記載の画像処理装置。
  6. 【請求項6】前記切断位置導出手段は、前記抽出された
    閉領域の中心から逆方向に所定距離以上離れた2箇所の
    範囲で文字画像データの切断位置を導出することを特徴
    とする請求項4に記載の画像処理装置。
JP2314956A 1990-11-19 1990-11-19 画像処理方法及び装置 Expired - Fee Related JP2925303B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2314956A JP2925303B2 (ja) 1990-11-19 1990-11-19 画像処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2314956A JP2925303B2 (ja) 1990-11-19 1990-11-19 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH04184584A JPH04184584A (ja) 1992-07-01
JP2925303B2 true JP2925303B2 (ja) 1999-07-28

Family

ID=18059691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2314956A Expired - Fee Related JP2925303B2 (ja) 1990-11-19 1990-11-19 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP2925303B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712190B2 (en) 2008-10-10 2014-04-29 Nec Corporation Collating device, collating method, and program

Also Published As

Publication number Publication date
JPH04184584A (ja) 1992-07-01

Similar Documents

Publication Publication Date Title
US5799115A (en) Image filing apparatus and method
US5410611A (en) Method for identifying word bounding boxes in text
US5907631A (en) Document image processing method and system having function of determining body text region reading order
JP3099797B2 (ja) 文字認識装置
JP2925303B2 (ja) 画像処理方法及び装置
CN110334560B (zh) 一种二维码定位方法和装置
JP2974396B2 (ja) 画像処理方法及び装置
JP2812391B2 (ja) パターン処理方法
JPH0728935A (ja) 文書画像処理装置
JPH09274645A (ja) 文字認識方法および装置
JPH07319880A (ja) キーワード抽出・検索装置
JP3164962B2 (ja) 文字認識辞書作成方法および装置
JPH05114048A (ja) 文字認識方法及びその装置
JPH09138838A (ja) 文字認識方法およびその装置
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP2851865B2 (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JPH03126188A (ja) 文字認識装置
CN114943973A (zh) 一种文本校正方法、装置、计算机设备及存储介质
JP3033904B2 (ja) 文字認識後処理方法
JP2001060250A (ja) 文字認識方法および装置
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JPH01124082A (ja) 文字認識装置
JPH03269691A (ja) 光学式文字認識システム
JP2785438B2 (ja) 文字認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090507

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100507

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees