JP2974396B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JP2974396B2
JP2974396B2 JP2312075A JP31207590A JP2974396B2 JP 2974396 B2 JP2974396 B2 JP 2974396B2 JP 2312075 A JP2312075 A JP 2312075A JP 31207590 A JP31207590 A JP 31207590A JP 2974396 B2 JP2974396 B2 JP 2974396B2
Authority
JP
Japan
Prior art keywords
image
header
character
image information
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2312075A
Other languages
English (en)
Other versions
JPH04182787A (ja
Inventor
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2312075A priority Critical patent/JP2974396B2/ja
Publication of JPH04182787A publication Critical patent/JPH04182787A/ja
Application granted granted Critical
Publication of JP2974396B2 publication Critical patent/JP2974396B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字画像の切り出しを正しく行なう為の画
像処理方法及び装置に関するものである。
[従来の技術] 従来の文字認識装置は、一般に第5図のように構成さ
れている。501は文字画像をアナログ電気信号に変換す
るスキヤナ、502はスキヤナからのアナログ信号を2値
化する2値化手段、503は2値化された画像データを記
憶しておく画像メモリ、504は画像メモリ上の文字列に
対して1文字ごとに文字領域を切り出す文字切り出し手
段、505は予め定められたアルゴリズムに従って文字固
有の特徴を抽出する特徴抽出手段、508は505と同じ特徴
抽出処理を学習用データに対して行なった結果得られる
平均値や分散等の統計量を格納しておく認識辞書、506
は入力文字画像から得られた特徴量を認識辞書の内容と
比較し、最も距離の近い候補字種を認識結果として選び
出す照合手段、508は認識結果として候補字種のコード
をデイスプレイや外部装置へ転送する出力手段である。
[発明が解決しようとしている課題] 上記従来技術では、1行中の隣り合う文字が接触して
いる時には、複数文字を1文字として認識してしまい、
文字の切り出しが正しく行なわれず、そのまま処理を進
めてしまうので認識が行なえずにリジエクトとなってし
まっていた。例えば、第3図に示すように、「1in」と
いう文字の場合、「1」と「i」、「i」と「n」が接
触している為に、輪郭線追跡で文字の切り出しを行なう
と「1in」が1文字と認識され、外接矩形は第3図中の3
01のように認識されてしまう。このように、従来の技術
では接触文字「1in」を3文字として正しく認識できな
いという欠点があった。
[課題を解決する為の手段] 上記課題を解決する為に、本発明は、入力した文字画
像データからヘッダ画像を抽出し、前記抽出されたヘッ
ダ画像の左右端を基準位置にして、当該基準位置よりヘ
ッダ画像の外側において前記文字画像データの切断位置
を導出する画像処理方法及び装置を提供する。
上記課題を解決する為に、本発明は、好ましくは前記
文字画像データから、画像情報の輪郭線の長さが所定値
以内であり、かつ当該画像情報の最下端が、当該画像情
報を含む文字画像矩形の下端より所定距離以上離れてい
る場合に、該画像情報をヘッダ画像と判断する。
上記課題を解決する為に、本発明は、好ましくは前記
入力した文字画像データを認識し、前記認識結果の類似
度が所定値以下である場合に、前記切断位置の導出を行
なうよう制御することを特徴とする請求項1に記載の画
像処理方法。
上記課題を解決する為に、本発明は、好ましくは前記
ヘッダ画像は、画像情報の輪郭線の長さが所定値以内で
あり、かつ当該画像情報の最下端座標が所定値以上の画
像とすることを特徴とする。
[実施例] 第1図(B)は本発明の第1の実施例を表わす構成図
で101〜108は第5図の従来例のそれぞれ501〜508に同じ
である。109は照合手段106で得られた距離に基づいて認
識結果が妥当かどうか判定する判定手段、110は文字の
外接矩形の内部と外接矩形のすぐ上に設定された特定領
域内でヘツダを探索するヘツダ探索手段、111はヘツダ
の座標から切断すべき座標を計算する座標計算手段、11
2は前記位置で文字線の切断を行なう切断手段である。
第1図(A)は本実施例の構成を示すブロツク図であ
る。
第1図(A)において、1は第2図に示したフローチ
ヤートのような処理の流れを制御するCPUであり、本実
施例におけるスキヤナ101から読み取った画像情報を2
値化する2値化手段102、照合結果の距離の大きさを判
定する判定手段109、ヘツダが発見された時に切断すべ
き座標を計算する座標計算手段111、計算された切断す
べき座標の画素を白画素として1文字ごとに切断する切
断手段112の処理を行なう。2はキーボード(K.B.)、
3はポインテイング.デバイス(P.D.)であり、共に文
字、記号等の入力や、誤認識した時の修正等を行なう際
の指示を行なう時に用いる。4は文字を認識する際の認
識辞書107を記憶し、また、第2図に示したフローチヤ
ートのような処理の流れを制御する為のプログラムを記
憶しているリードオンリーメモリ(ROM)である。5は
メモリであり、例えばスキヤナ9より読み取ったデータ
を記憶する画像メモリ103の役割りをする。6はスキヤ
ナ9より読み取ったデータから候補となる単語を見つ
け、各々の相違度も計算する識別計算部であり、本実施
例における画像情報から文字の切り出しを行なう文字切
り出し手段104、切り出されたデータから特徴抽出を行
なう特徴抽出手段105、抽出された特徴を認識辞書のデ
ータと照合する照合手段106、切り出されたデータから
ヘツダを探索するヘツダ探索手段110の処理も行なう。
7はCRTであり、読み取った画像情報や、認識結果の文
字情報を表示する出力手段108である。8は画像情報を
読み取るスキヤナ(SCAN)であり、第1図(B)にはス
キヤナ101として示している。9はスキヤナ8のインタ
ーフエイス(SCANI/F)である。
次に第2図のフローチヤートに従って本実施例の処理
の流れについて説明する。スキヤナ101から文字画像を
入力しアナログ電気信号に変換する(S1)。S2では2値
化手段102によってスキヤナ101より入力したアナログ信
号の2値化を行ない、文字画像を2値のデータとして画
像メモリ103に格納する。入力された画像情報の白画素
には0を、黒画素には1を対応させて2値化を行なう。
次にS3で、文字切り出し手段104により画像メモリ上の
2値化された画像情報に対して1文字ごとに文字を切り
出し、外接矩形を求める。本実施例では輪郭線追跡を行
なうことによって文字の切り出しを行なっている。
S3で文字切り出し手段104によって切り出された外接
矩形の領域内で予め定められたアルゴリズムに従って特
徴抽出手段105による1文字ずつの特徴抽出を行ない、
特徴ベクトルx(x1、‥、xn)(nは特徴ベクトルの次
元数)を得る。本実施例では領域内のすべての輪郭線を
追跡し文字線の局所的な傾きを特徴としている。矩形内
の全ての輪郭線を追跡する方法は公知の技術を用いて行
なう。S5では、認識辞書107に格納された、字種ごとの
平均ベクトルと認識対象文字の特徴ベクトルxを比較し
距離を計算する。この距離の小さいものほど認識結果と
して適当だと言える。候補字種k(1≦k≦K;Kは全候
補字種数)に対する距離d(k)を d(k)=|xi−mi(k)|/σ(k) で計算する。ただし、mi(k)、σ(k)(1≦i≦
n)はそれぞれ候補字種kの平均値、標準偏差である。
そして、すべての候補字種に対する距離を求め、最も小
さい距離d1を与える字種を認識結果とする。S6では認識
結果が妥当かどうかの判定を判定手段109において行な
う。この判定にはd1及び2番目に小さい距離d2を用い
る。すなわち、 d1>D または d2−d1<D′ のときに認識結果が妥当でないと判定する。ただし、D,
D′は統計処理によって予め定めたしきい値である。
S6で認識結果が妥当と判定された場合はS7へ進みその
まま認識結果を出力手段108から出力するが、認識結果
が妥当ではないと判定された場合はS8へ進みヘツダ探索
手段110により、S3で求めた外接矩形内でヘツダの探索
を行なう。第3図は外接矩形内にヘツダが含まれている
例である。外接矩形の左下隅を原点とし、右方向をx
軸、上方向をy軸として説明する。
本実施例では特徴抽出過程で輪郭線追跡を行なってい
るので外接矩形301内の輪郭線に関しては改めて輪郭線
追跡を行なう必要はない。そのためヘツダ探索のために
設定する特定領域を外接矩形の内部と外部で分けてい
る。
ヘツダ探索のためには、外接矩形内のすべての輪郭線
を取り出し、輪郭線の長さaが、 L1<a<L2 を満たし、且つ、輪郭線の最下端のy座標y1が Y1<y1 を満たすとき、この輪郭線は「i」のヘツダを表わして
いると判定する。最後の条件により、特定領域は外接矩
形のY1以上の部分になる。輪郭線が複数個存在してもこ
の条件がみたされない場合はノイズと考えられる。ただ
し、L1,L2,Y1は統計的操作によって予め定めておいたし
きい値で、外接矩形の高さy0の関数である。本実施例で
はそれぞれ、 L1=0.3y0 L2=0.5y0 Y1=0.6y0 としている。
ヘツダが発見された場合、S10へ進み座標計算手段111
により切断すべき座標を求める。ヘツダの左端の座標x1
と右端の座標x2に対して、それぞれその少し外側の座標
が切断可能な位置の候補となる。この位置付近で文字の
厚みのうすいところで切断することを試みる。外接矩形
内のあるx座標における輪郭線の上端の座標をyh
(x)、下端の座標をy1(x)としたとき、文字の厚さ
d(x)を d(x)=yh(x)−y1(x) で定義する。
ヘツダの左端の座標x1に対してx1を中心とした一定の
幅δ内におけるd(x)の最少 dmin=min(d(x))(x1−δ<x<x1) が dmin<D″ を満たすとき、このdminを与えるxを切断すべき位置x
1′とする。ただし、x1が十分小さい場合、すなわち x1′<W のときは、x1の側には文字がないものと判断し、切断位
置x1′は設定されない。ここで、δ、D″、Wは予め定
めたしきい値でやはり外接矩形の高さy0の関数である。
x2の側についても同様な判定を行ない、 dmin=min(d(x))(x2<x<x2+δ) が dmin<D″ を満たし、かつ x0−x2′≧W のときには、dminを与えるxを切断すべき位置x2′とし
て設定する。S10でx1′またはx2′あるいはその両方を
与えるようなヘツダが発見された場合はS11で分岐しS12
へ進み、切断手段112によって1文字ごとの切断を行な
う。S12ではx座標がx1′またはx2′の画素をすべて白
画素にし、S3は進んで切断された新たな1文字ずつのデ
ータで切り出し、特徴抽出及び照合の処理をやり直す。
S8で外接矩形内にヘツダが存在しない場合はS9へ進み
外接矩形の上側に特定領域を設定しヘツダの探索を行な
う。第4図が外接矩形外にヘツダが含まれている例で、
座標のとり方は第3図と同じである。輪郭線追跡によっ
て得られた外接矩形401(上端はy0)に対して幅は同じ
で、そのすぐ上に接する矩形領域を特定領域として設定
する。特定領域の上端座標ysはy0の関数として求まる。
本実施例では、 ys=1.4y0 としている。この特定領域内でS8と同様なヘツダ探索を
行なう。この特定領域内では特徴抽出処理が行なわれて
おらず、したがって輪郭線追跡も行なわれていないので
改めて領域内ですべての輪郭線を取り出す処理を行な
う。
ヘツダの条件は、輪郭線の長さaが L1<a<L2 を満たし、かつ、輪郭線が特定領域からはみ出ないこと
である。後者の条件により、注目文字のすぐ上の行の一
部が特定領域に侵入したとしてもヘツダと間違える事は
ない。これらの条件が満たされたとき、ヘツダが存在し
たと判定しS10へ進み、そうでない場合はS7へ進む。
S10またはS7へ進んだ後の処理はすでに説明したとお
りである。
なお、ヘツダを探索する特定領域としては、外接矩形
の内部と外部で分ける方法に限ることなく、必ずしも特
定領域を分ける必要はない。
また、認識結果が妥当かどうかの判定手段はd1とd2を
用いているがd1だけ、あるいはd1,d2,d3(3番目に小さ
い距離)を用いることも可能である。
また、ここでは英文字を例にとって「i」のヘツダを
見つけて接触文字から「i」を分離する方法について説
明したが、同じ英文字でも「j」は「i」と同じくヘツ
ダがあるので、「i」と同じ方法で隣りの文字から分離
させることも可能である。
また、文字認識をする対象は、英文字に限らず、各々
の文字が独立しており、隣り合う複数の文字を1文字と
して誤って切り出してしまう可能性がある文字に関して
応用できることは勿論である。
以上述べたように、本発明によれば、認識結果が予め
定められた妥当であるという基準を満たさないと判断し
た時には、接触した複数の文字を1文字として切り出し
てしまったと判断し、例えば英小文字「i」の点(ヘッ
ダ)を探索して、ヘッダの存在位置から「i」の存在す
る座標を導出して接触した文字を1文字ずつ正しい位置
で切り離すことにより、接触文字の認識も正しく行なわ
れ、全体の認識率も高めることが可能となる。
[発明の効果] 以上説明したように、本発明によれば、入力した文字
画像データからヘッダ画像を抽出し、前記抽出されたヘ
ッダ画像の左右端を基準位置にして、当該基準位置より
ヘッダ画像の外側において前記文字画像データの切断位
置を導出することにより、不適切な位置での文字画像の
切断を防止でき、文字画像の切断位置を適切な位置で導
出することができる。
上記説明したように、本発明によれば、前記文字画像
データから、画像情報の輪郭線の長さが所定値以内であ
り、かつ当該画像情報の最下端が、当該画像情報を含む
文字画像矩形の下端より所定距離以上離れている場合
に、該画像情報をヘッダ画像と判断することにより、文
字画像データの切断位置を判断する基準となるヘッダ画
像の判断を適切に行なうことができる。
以上説明したように、本発明によれば、前記入力した
文字画像データを認識し、前記認識結果の類似度が所定
値以下である場合に、前記切断位置の導出を行なうよう
制御することにより、切断位置の導出の処理を必要に応
じて選択的に行なうので、処理を効率化できる。
【図面の簡単な説明】
第1図(A)は本発明の実施例を表わすブロツク図、 第1図(B)は本発明の第1の実施例を表わす構成図、 第2図は第1の実施例のフローチヤート、 第3図は外接矩形の内部にヘツダが存在する例、 第4図は外接矩形の外部にヘツダが存在する例、 第5図は従来の文字認識装置の構成を表わす図。

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した文字画像データからヘッダ画像を
    抽出し、 前記抽出されたヘッダ画像の左右端を基準位置にして、
    当該基準位置よりヘッダ画像の外側において前記文字画
    像データの切断位置を導出することを特徴とする画像処
    理方法。
  2. 【請求項2】画像情報の輪郭線の長さが所定値以内であ
    り、かつ当該画像情報の最下端が、当該画像情報を含む
    文字画像矩形の下端より所定距離以上離れている場合
    に、該画像情報をヘッダ画像と判断することを特徴とす
    る請求項1に記載の画像処理方法。
  3. 【請求項3】前記入力した文字画像データを認識し、 前記認識結果の類似度が所定値以下である場合に、前記
    切断位置の導出を行なうよう制御することを特徴とする
    請求項1に記載の画像処理方法。
  4. 【請求項4】入力した文字画像データからヘッダ画像を
    抽出するヘッダ画像抽出手段と、 前記抽出されたヘッダ画像の左右端を基準位置にして、
    当該基準位置よりヘッダ画像の外側において前記文字画
    像データの切断位置を導出する切断位置導出手段とを有
    することを特徴とする画像処理装置。
  5. 【請求項5】前記ヘッダ画像抽出手段は、前記文字画像
    データから、画像情報の輪郭線の長さが所定値以内であ
    り、かつ当該画像情報の最下端が当該画像情報を含む文
    字画像矩形の下端より所定距離以上離れている画像情報
    をヘッダ画像と判断することを特徴とする請求項4に記
    載の画像処理装置。
  6. 【請求項6】前記入力した文字画像データを認識し、 前記認識結果の類似度が所定値以下であるか否かを判断
    する判断手段と、 前記判断手段により前記認識結果の類似度が所定値以下
    であると判断される場合に、前記切断位置の導出を行な
    うよう制御する制御手段とを有することを特徴とする請
    求項4に記載の画像処理装置。
JP2312075A 1990-11-17 1990-11-17 画像処理方法及び装置 Expired - Fee Related JP2974396B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2312075A JP2974396B2 (ja) 1990-11-17 1990-11-17 画像処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2312075A JP2974396B2 (ja) 1990-11-17 1990-11-17 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH04182787A JPH04182787A (ja) 1992-06-30
JP2974396B2 true JP2974396B2 (ja) 1999-11-10

Family

ID=18024934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2312075A Expired - Fee Related JP2974396B2 (ja) 1990-11-17 1990-11-17 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP2974396B2 (ja)

Also Published As

Publication number Publication date
JPH04182787A (ja) 1992-06-30

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
JP3099797B2 (ja) 文字認識装置
JP2974396B2 (ja) 画像処理方法及び装置
JP2925303B2 (ja) 画像処理方法及び装置
JP2917427B2 (ja) 図面読取装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JP2812391B2 (ja) パターン処理方法
JP2675303B2 (ja) 文字認識方法
EP0476852B1 (en) Image processing method and apparatus
JP3115139B2 (ja) 文字切り出し方法
JP2974145B2 (ja) 文字認識結果の修正方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
JPH01124082A (ja) 文字認識装置
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JP3428504B2 (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JP2851865B2 (ja) 文字認識装置
JP2001060250A (ja) 文字認識方法および装置
JPH08202822A (ja) 文字切り出し装置、及び文字切り出し方法
JPH05242294A (ja) 図面読取装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JPH09138838A (ja) 文字認識方法およびその装置
JPH06187506A (ja) 文字認識装置
JPH05298494A (ja) 文字認識方法及び装置
JPH06231306A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees