JPH0799532B2 - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JPH0799532B2
JPH0799532B2 JP61281650A JP28165086A JPH0799532B2 JP H0799532 B2 JPH0799532 B2 JP H0799532B2 JP 61281650 A JP61281650 A JP 61281650A JP 28165086 A JP28165086 A JP 28165086A JP H0799532 B2 JPH0799532 B2 JP H0799532B2
Authority
JP
Japan
Prior art keywords
character
area
window
value
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61281650A
Other languages
English (en)
Other versions
JPS63136179A (ja
Inventor
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP61281650A priority Critical patent/JPH0799532B2/ja
Publication of JPS63136179A publication Critical patent/JPS63136179A/ja
Publication of JPH0799532B2 publication Critical patent/JPH0799532B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文字の外形特徴(文字サイズが一定)に基
づいて作成した文字切出し用ウインドウを使用して、文
書中に配列されている文字列から文字を1個ずつ抽出す
るための文字切出し装置に関する。
〔従来の技術〕
一般に、この種の文字切出し方式として、投影(プロジ
エクシヨン)を利用する方法が知られている。
〔発明が解決しようとする問題点〕
しかしながら、この方式では、1行分の投影データをと
る場合、文書の傾きが大きいと、文字と文字の間のすき
間がなくなり、文字が切出せないという難点がある。こ
のため、文字列の傾きを検出し、傾きに応じた回転変換
をする方法も考えられるが、構成が複雑で高価になると
云う問題がある。
したがつて、この発明は文書が傾いて入力された場合で
も、文字を正確に抽出することが可能な、文字切出し装
置を提供することを目的とする。
〔問題点を解決するための手段〕
文字列を撮像し画素単位で2値化して得られる2値化画
像に対し、文字パターンの最小値に基づいて文字の中心
部に設定される中心領域,該中心領域の外側で、文字パ
ターンの最大値に基づいて設定された外接枠にて取り囲
まれた外接枠領域、該外接枠領域の外側で、文字パター
ンの最大値と文字間スペースとに基づいて設定された枠
にて取り囲まれた背景領域からなる3種類の文字切出し
用ウインドウを、その中心位置を順次移動させながら生
成するウインドウ生成手段と、背景領域および外接枠領
域についてその領域内の文字パターン面積を計算する面
積計算手段と、中心領域について文字パターンの投影長
を計算する投影長計算手段と、これら面積値および投影
長計算値をそれぞれ所定の設定値と比較,判定する判定
手段とを設け、各計算値がその設定値に対してそれぞれ
所定の関係を満たすときの文字切出しウインドウの中心
位置をもつて文字の切出し位置を決定する。
〔作用〕
文書中の文字サイズに対応した文字切出し用ウインドウ
を作成して、そのウインドウ内の文字パターンに対する
以下の特徴量を演算し、文字パターンがウインドウと正
確に重なることを判定して、文字の切出し位置を決定す
る。
(1)文字周囲部の背景にある文字パターン面積 :ABA (2)文字四辺部の文字パターン面積 :AT,AB,AL,AR (3)文字枠内投影長(横および縦) :LPW,LPH すなわち、ウインドウと文字パターンが正しく重なる
と、背景面積ABAはゼロ、四辺面積AT(上),A
B(下),AL(左),AR(右)はゼロではない所定値と
なり、また横および縦の投影長LPW,LPHはそれぞれ文字
幅W0と高さH0とに一致する筈であるから、このような条
件を満たすか否かによつて文字の切出し位置を求めるも
のである。
つまり、次の条件により文字パターンの位置が判定でき
る。
(a)背景面積:ABA≒0 (b)四辺面積:min{AT,AB,AL,AR}≧ALOWER (c)投影長:LPW≒W0,LPH≒H0 そこで、文書の2値データ上を文字切出し用ウインドウ
を順次移動させて、文字パターンの判定条件を満たす位
置を捜す。これにより、所定サイズの文字パターンの位
置を検出することができる。ここで、切出し用ウインド
ウを移動させる方法としては、例えば四辺面積と投影長
がゼロのときには半文字分だけスキツプさせ、また文字
が切出されたときには、1文字分だけウインドウをスキ
ツプさせることにより、移動を速めるようにする。
要するに、切出し用ウインドウにより孤立した文字パタ
ーンの位置を計測するようにしているので、文字配列が
傾いていても正しく切出すことができるわけてある。
〔実施例〕
第1図はこの発明の実施例を示す構成図である。同図に
おいて、1は文書、2はテレビカメラの如きイメージス
キヤナ、3はイメージメモリ、4は縮小回路4A,縮小メ
モリ4B,文字検出部4C,切出しウインドウ用アドレス発生
部4D,文字位置メモリ(ラツチ回路)4Eおよび文字サイ
ズ設定部4F等からなる文字切出し回路である。
文書1はイメージスキヤナ2により2値画像に変換され
て、イメージメモリ3に記憶される。原画像データは文
字切出しを行なうには大容量であるので、こゝでは適当
な大きさに縮小する。つまり、縮小回路4Aにより原デー
タは縮小され、縮小メモリ4Bに記憶される。勿論、その
必要がなければ、これらの回路は省略可能である。文書
中の文字サイズ(幅W0画素,高さH0画素)は予め既知と
し、例えばOCR(光学式文字読取装置)のような外部機
器から文字サイズ設定部4Fへ設定することができる。文
字サイズ設定部4Fでは設定された文字サイズに基づき、
切出しウインドウのアドレス発生部4Dに対して、切出し
用ウインドウのサイズを指定する。切出し用ウインドウ
は縮小メモリ4B上の縮小画像上を移動して、文字パター
ンと正確に重なつているかどうかを文字検出部4Cで判定
する。もし、ウインドウと文字とが同じ位置にあれば、
その位置座標を文字位置メモリ4Eに記憶する。外部機器
はその文字位置情報に基づいて、イメージメモリ3上の
文字パターンのデータを1文字ずつ切出し、処理を行
う。
すなわち、イメージスキヤナ2により入力した文書1
は、例えば第2図に示すように、2値データとしてイメ
ージメモリ3に格納される。このとき、文書中の文字サ
イズは、いくつかの種類に限定される。また、イメージ
メモリ3のままではサイズが大きいときは、例えば第3
図(イ)に示すような2次元局部メモリ5と、第3図
(ロ)に示すような論理和回路6とを用いて、3×3画
素を1画素に縮小する。
文字サイズ(W0×H0:第2図参照)から決定される文字
切出し用ウインドウWの形状を、第4図に示す。ウイン
ドウの中心座標(XC,YC)は、ウインドウの移動ととも
に変わる。切出しウインドウWは、こゝでは3つの矩形
領域から構成されている。つまり、幅WC×高さHCの中心
領域A1と、中心領域A1を取り囲む幅WS×高さHSの外接枠
領域A2と、外接枠領域A2を取り囲む幅WB×高さHBの背景
領域A3がそれである。こゝに、中心領域A1は矩形である
が、外接枠領域A2と背景領域A3は帯状の領域である。各
領域のサイズは、文字サイズ(W0×H0:第2図参照)か
ら決定し、外接枠領域A2は文字パターンの最大および最
小値から、次のように決定する。
WS=max{W},WC=min{W} HS=max{H},HC=min{H} ただし、WとHとは同一文字サイズの文字パターンにつ
いて実測した幅と高さとを意味する。また、背景領域A3
のサイズは、文字間スペースS0(S0W,S0H)から決定す
る。
WB=WS+S0W HB=HS+S0H つまり、文字の周囲で文字パターンが存在し得ない領域
を、背景領域A3として導入する。さらに、文字パターン
の中心領域A1はその中に文字パターンが存在するので、
その投影長がそのまま中心領域の幅WCと高さHCとなる。
以上の如き切出しウインドウWにより、文字パターンの
位置を次のように検出する。
第5図に文字検出部4Cの具体例を示す。文字切出し用ウ
インドウWを生成するアドレス発生部4Dは、第4図の如
きウインドウ(左頂点(XS,YS)と右底点(XE,YE)とで
定義される)の領域のアドレス(X,Y)と、領域信号(A
1,A2,A3)とを出力する。アドレス発生部4Dのアドレス
(X,Y)から縮小メモリ4B内の2値データC0を読み出し
て、背景領域信号III,外接枠領域信号II,中心領域信号
Iにより、それぞれ背景面積カウンタ回路41、四辺面積
カウンタ回路42、投影長計数回路43をそれぞれセレクト
する。背景面積カウンタ回路41は、背景領域内の文字パ
ターン面積値ABAを計数する。四辺面積カウンタ回路42
は、外接枠内の四辺領域について、それぞれ文字パター
ン面積を計数する。四辺領域(外接枠領域)とは上辺,
底辺,左辺,右辺の4領域であり、各領域は4隅でそれ
ぞれ重複している。四辺領域の面積をそれぞれAT,AB,
AL,ARで表わす。ここで、四辺領域信号としてはIIT,I
IB,IIL,IIRの4つが、アドレス発生部4Dから出力され
る。また、投影回路43は中心領域内でXおよびY方向に
それぞれ文字パターンのプロジエクシヨンをとつて、各
方向の投影長LPW,LPHを計数する。
こうして得られる各計数値のうち、まず背景面積A
BAは、設定器47からの許容背景面積値(上限値)ABU
コンパレータ44で比較される。そして、その比較結果J1
を次式の如く表現する。
また、四辺面積AT,AB,AL,ARは、設定器48からの許容四
辺面積値(下限値)ATL,ABL,ALL,ARLとコンパレータ45
で比較される。比較結果J2を次式で表わす。
さらに、投影長LPW,LPHは、設定器49からの許容投影長L
WL,LHLと比較される。比較結果J3を次式の如く表現す
る。
これらの比較結果J1,J2,J3は論理積回路40に与えられ、
こゝで文字パターンがあるか否かを判定し、もし一致条
件を満足したら、文字切出しウインドウの中心位置のア
ドレス(XC,YC)をメモリ4Eに格納する。こうして得ら
れるXC,YCにより、文字の左上,右下のアドレスは次式
により求めることができる。
(XS,YS)=(XC−(W0/2),YC−(H0/2)) (XE,YE)=(XC+(W0/2),YC+(H0/2)) 以上のように文字切出しウインドウを定義して、3つの
条件から文字位置検出を判定するようにしたので、文書
の傾きに関係なく文字パターンを検出することができ
る。
〔発明の効果〕
この発明によれば、文字切出し用ウインドウを背景領
域,外接枠領域および中心領域の3種類の領域で構成し
て各種特徴量を抽出するようにしたので、孤立した文字
パターンが検出できるだけでなく、文書に傾き(スキユ
ー)がある場合でも、個々に文字を切出すことができる
利点がもたらされる。
【図面の簡単な説明】 第1図はこの発明の実施例を示す構成図、第2図はイメ
ージメモリに格納された2値画像データの一例を説明す
るための説明図、第3図は縮小回路の具体例を説明する
ための説明図、第4図はこの発明で用いられる文字切出
し用ウインドウを説明するための説明図、第5図は第1
図の文字検出部の具体例を示す構成図である。 符号説明 1……文書、2……イメージスキヤナ、3……イメージ
メモリ、4……文字切出し回路、5……2次元局部メモ
リ、6……論理和回路、4A……縮小回路、4B……縮小メ
モリ、4C……文字検出部、4D……アドレス発生部、4E…
…文字位置メモリ(ラツチ回路)、40……論理積回路、
41……背景領域用面積カウンタ回路、42……四辺領域用
面積カウンタ回路、43……投影回路、44〜46……コンパ
レータ、47〜49……設定器、W……ウインドウ、A1……
中心領域、A2……外接枠領域、A3……背景領域。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文書に記録されている文字列から文字を1
    つずつ抽出するための文字切出し装置であって、 文字列を撮像し2値化して得られる2値化画像に対し、
    文字パターンの最小値に基づいて文字の中心部に設定さ
    れる中心領域,該中心領域の外側で、文字パターンの最
    大値に基づいて設定された外接枠にて取り囲まれた外接
    枠領域、該外接枠領域の外側で、文字パターンの最大値
    と文字間スペースとに基づいて設定された枠にて取り囲
    まれた背景領域からなる3種類の文字切出しウインドウ
    を、その中心位置を移動させながら生成するウインドウ
    生成手段と、 前記背景領域および外接枠領域について各々の領域内の
    文字パターン面積をそれぞれ計算する面積計算手段と、 前記中心領域について文字パターンの投影長を計算する
    投影長計算手段と、 該面積計算値および投影長計算値をそれぞれ所定の設定
    値と比較,判定する判定手段と、 を備え、これら計算値がその各設定値に対しそれぞれ所
    定の関係を満たすときの前記文字切出しウインドウの中
    心位置を使用して、文字切出し位置を求めることを特徴
    とする文字切出し装置。
JP61281650A 1986-11-28 1986-11-28 文字切出し装置 Expired - Lifetime JPH0799532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61281650A JPH0799532B2 (ja) 1986-11-28 1986-11-28 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61281650A JPH0799532B2 (ja) 1986-11-28 1986-11-28 文字切出し装置

Publications (2)

Publication Number Publication Date
JPS63136179A JPS63136179A (ja) 1988-06-08
JPH0799532B2 true JPH0799532B2 (ja) 1995-10-25

Family

ID=17642055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61281650A Expired - Lifetime JPH0799532B2 (ja) 1986-11-28 1986-11-28 文字切出し装置

Country Status (1)

Country Link
JP (1) JPH0799532B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5624671B2 (ja) * 2011-03-04 2014-11-12 グローリー株式会社 文字列切出方法及び文字列切出装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0245891A (ja) * 1988-08-08 1990-02-15 Nippon Avionics Co Ltd 文字認識方法
JP4813186B2 (ja) * 2006-01-17 2011-11-09 株式会社Lixil 蝶番を用いたキャビネット
JP7127365B2 (ja) * 2018-05-30 2022-08-30 大日本印刷株式会社 文字切り出し装置、文字切り出し方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5624671B2 (ja) * 2011-03-04 2014-11-12 グローリー株式会社 文字列切出方法及び文字列切出装置
US9008431B2 (en) 2011-03-04 2015-04-14 Glory Ltd. Character string extraction method and character string extraction device

Also Published As

Publication number Publication date
JPS63136179A (ja) 1988-06-08

Similar Documents

Publication Publication Date Title
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
US6839466B2 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
US5974199A (en) Method for scanning and detecting multiple photographs and removing edge artifacts
JP2835274B2 (ja) 画像認識装置
US5892854A (en) Automatic image registration using binary moments
EP1081648B1 (en) Method for processing a digital image
JPS60262284A (ja) イメ−ジ処理方法
JP2007081458A (ja) 画像処理装置および画像処理装置の制御方法
US4901365A (en) Method of searching binary images to find search regions in which straight lines may be found
JPH0418351B2 (ja)
JPH0799532B2 (ja) 文字切出し装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2851348B2 (ja) ナンバープレート読み取り装置
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2778437B2 (ja) 文書画像傾き検出装置
JP4242962B2 (ja) 文字切出装置
JP3019897B2 (ja) 行切出し方法
US11983916B2 (en) Relocation method, mobile machine using the same, and computer readable storage medium
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JP3341097B2 (ja) 光学文字読取装置
JP2003317107A (ja) 罫線抽出方法及び装置
JPH0969162A (ja) 車載用画像処理装置
JPH07141465A (ja) 文書画像の傾き検出方法
JP2697085B2 (ja) 画信号処理装置