JP2872768B2 - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JP2872768B2
JP2872768B2 JP2181822A JP18182290A JP2872768B2 JP 2872768 B2 JP2872768 B2 JP 2872768B2 JP 2181822 A JP2181822 A JP 2181822A JP 18182290 A JP18182290 A JP 18182290A JP 2872768 B2 JP2872768 B2 JP 2872768B2
Authority
JP
Japan
Prior art keywords
character
path
pixel
search
start point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2181822A
Other languages
English (en)
Other versions
JPH0468481A (ja
Inventor
孔司 桜田
晃治 伊東
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2181822A priority Critical patent/JP2872768B2/ja
Publication of JPH0468481A publication Critical patent/JPH0468481A/ja
Application granted granted Critical
Publication of JP2872768B2 publication Critical patent/JP2872768B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、活字または手書き文字で構成される文書
等の文字行画像から文字パタンを1文字単位に切り出す
ための文字切出し装置に関するものである。
(従来の技術) 光学式文字読取装置(OCR)における文字認識では、
被認識文書から文字行画像を得、この文字行画像から1
文字単位に文字パタンを切り出し、この文字パタンを辞
書と照合して文字を認識する。従って、文字認識の精度
を確保するためには、文字パタンの切り出し処理が非常
に重要になる。
文字行画像から文字パタンを切り出すに当たり、文字
枠を有する媒体に書かれた文書からの文字パタンの切り
出しは、文字枠位置を書式情報に加えておきこの情報を
利用して行えるので、比較的簡単である。しかし、文字
枠を有していない媒体に書かれた文書からの文字パタン
の切り出しは、文字パタン間の境界の判別が必要になる
ので、文字枠を有する場合に比べ大変である。特に、隣
接文字同士が重なり合っていたり(第5図中のQの部分
或いは第2図中のQの部分の状態)接触したり(第2図
中のRの部分の状態)している場合に不用意に(例えば
文字幅によって強制的に)文字パタン切り出しを行う
と、隣接文字パタンの一部を含んだ文字パタンや対象文
字の一部が欠落した文字パタンが切り出され、文字認識
精度を低下させてしまう。
そこで、隣接文字が重なっている部分を含む文字行画
像からでも所望の文字パタンを切り出せる従来技術とし
て、例えば、特開昭63−313287号公報に開示の「食い込
み文字切り出し方式」があった。
この公報に開示の方式では、詳細は後述するが、入力
文字行画像について文字幅と予め定めた分散範囲とから
切出し領域が設定され、次に、切出し領域が垂直方向で
二分され、これら分割された領域内に垂直の白線分が存
在するか否かが検出される。白線分が検出されない領域
についてはその領域がさらに二分され、それぞれの領域
について上述と同様に白線分の検出が行われる。全ての
分割された領域について白線分が検出されたならば、切
出し領域の上側より順に白線分が最短の水平線分によっ
て連結され、これら連結された垂直及び水平白線分が文
字間の境界とされて文字パタンが切り出される。
以下、具体例により上述の公報に開示の従来の文字切
出し方式の説明を行う。第5図は、その説明に供する図
であり、「東」及び「京」という2文字間で重なり部分
Qがある「東京」という文字パタンを含む入力文字を示
した図である。第5図中、ハッチングを付した部分中の
1つの四角形11は文字パタンの1つの黒画素を示す。
この従来の文字切出し方式では、先ず文字行画像につ
いて文字幅と、予め定めた分散範囲とから切出し領域13
が設定される。次に、切出し領域13を垂直方向において
二分して分割領域T1−1及びT1−2が設定される。次
に、これら分割領域ついて白線分の検出が行われる。こ
の際、この例では、分割領域T1−2については、垂直の
白線分Aが検出される。しかし、分割領域T1−1につい
てはこの領域内に垂直の白線分が存在しないので、この
領域T1−1はさらに分割領域T2−1及びT2−2に二分さ
れる。次に、これら分割領域T2−1,T2−2について垂直
の白線分の検出が行われる。これにより、分割領域T2−
1からは垂直の白線分Bが、分割領域T2−2からは垂直
の白線分B,C,D及びEがそれぞれ検出される。全ての分
割領域で垂直の白線分が検出されたので、次に、切出し
領域13の上側より順に垂直の白線分が最短の水平線分
(図示例ではZで示す部分)によって連結される。そし
て、連結された垂直及び水平線分の経路B→Z→F→A
が文字間境界とされ、この情報に基づいて文字パタンが
入力文字行画像から切出される。
(発明が解決しようとする課題) しかしながら、隣接文字同士が接触している入力文字
行画像(例えば第2図に示すように接触部分Rを有する
入力文字画像)の場合は切出し領域内に垂直の白線分が
存在しない部分が必す残る。従って、上述の従来の文字
切出し方式では、このような入力文字行画像から白線分
の連結を抽出することが出来ないため文字パタンを正し
く切出すことが出来ないという問題点があった。
この発明は、このような点に鑑みなされたものであ
り、従ってこの発明の目的は、隣接文字同士が重なり合
ったり接触している入力文字行画像から正しく文字パタ
ンを切出すことが出来る文字切出し装置を提供すること
にある。
(課題を解決するための手段) この目的の達成を図るため、この発明によれば、入力
文字行画像から1文字ずつ文字パタンを切り出す文字切
出し装置において、 文字パタン間境界を探索するための探索始点、探索終
点及びこれら2点を含む探索領域を設定する探索領域設
定部と、 前述の探索領域内の各画素の濃度値を、各画素を通過
する前述の探索始点から前述の探索終点に向かう経路の
各画素における向きに応じて予め定めた係数でそれぞれ
重み付けし、該重み付けした濃度値の累積値が最小にな
る経路を決定する経路決定部と、 該決定された経路を前述の文字パタン境界として前述
の文字行画像から文字パタンを切り出す切出し部とを具
えたこと を特徴とする。
(作用) この発明の構成によれば、探索領域内の画素濃度値が
低いところを経由する経路であって然も探索始点及び探
索終点を結ぶ線分からのずれが小さい経路が文字パタン
間境界とされる。従って、入力文字行画像の隣接文字パ
タン同士が重なり合っている部分(例えば第2図のQ部
分)では、隣接文字パタン間の背景部を縫う経路のうち
の、探索始点及び探索終点を結ぶ線分からのずれが小さ
い経路が文字パタン間境界とされ、隣接文字パタン同士
が接触している部分(例えば第2図のR部分)では、接
触箇所を含む文字構成画素の塊において、探索始点及び
探索終点を結ぶ線分からのずれが小さい経路であって画
素濃度値が低いところを経由する経路が文字パタン境界
とされる。
また、入力文字行画像を1ブロックがM×N(M,Nは
正の整数)個の画素で構成される複数のブロックに分割
して該1ブロックを1つの画素とみなしてこの発明の経
路決定処理を行う構成の場合、局所的にかすれていたり
画素濃度値が高い画素を含んでいる入力文字画像からこ
れらの影響を除去したパタンが得られ、このパタンから
文字パタン間境界としての経路が決定出来る。このた
め、局所的にかすれていたり画素濃度値が高い画素を含
んでいる入力文字画像であっても適切な経路決定が期待
出来る。また、M×N個の画素を1つの画素とみなすこ
とから、経路決定処理での処理画素数が少くなるので、
その分処理時間を短く出来る。
また、探索始点及び探索終点を結ぶ線分を対称軸とし
かつこれら探索始点及び探索終点を頂点とする多角形を
探索領域とする構成の場合、探索始点及び終点が特定さ
れるので、経路決定処理が容易に行える。
(実施例) 以下、第1図〜第4図を参照してこの発明の文字切出
し装置の実施例について説明する。
構成説明 第1図は、活字及び又は手書きで記載された文書等の
情報媒体(図示せず)から文字行画像を得るための文字
行画像入力部20と、実施例の文字切出し装置30とを併せ
て示したブロック図である。
文字行画像入力部20は、情報媒体の所定の読取範囲を
光学的に走査して光信号Sを入力し、さらにこの光信号
Sを光電変換し、さらにこの光信号Sを量子化例えば文
字線部は黒、背景部は白というように2値化し、読取範
囲の画像パタン(電気信号)得、さらに、この画像パタ
ンから文字行画像を抽出してこれを文字切出し装置30に
出力する構成としてある。
なお、画像パタンからの文字行画像の抽出は、従来公
知の方法、例えば、画像パタンから周辺分布を求めて文
字行画像部分と文字行間部分とを区別し文字行画像を抽
出する方法等、で行うことが出来る。
また、実施例の文字切出し装置30は、探索領域設定部
31と、経路決定部33と、切出し部35とを具えた構成とし
てある。
ここで、探索領域設定部31は、文字行画像入力部20か
ら入力される文字行画像について文字パタン間境界を探
索するための探索始点、探索終点及びこれら2点を含む
探索領域を設定するものである。この実施例の探索領域
設定部31は、上述の探索始点及び探索終点を結ぶ線分を
対称軸とする六角形の領域であってこれら探索始点及び
探索終点を六角形の2つの頂点とする六角形の領域を探
索領域として設定する構成としてある。
また、経路決定部33は、詳細は動作説明の項で説明す
るが、探索領域設定部31で設定された探索領域内の各画
素の濃度値を、各画素を通過する前記探索始点から前記
探索終点に向かう経路の各画素における向きに応じて予
め定めた係数でそれぞれ重み付けし、該重み付けされた
濃度値の累積値が最小になる経路を決定するものであ
る。この実施例の経路決定部33は、経路方向データ算出
部33aと、経路算出部33bとで構成してある。
また、切出し部35は、経路決定部33で決定された経路
を文字パタン境界とし文字行画像から文字パタンを切り
出すものである。
切出し部35の出力端子は、例えば文字認識装置の認識
部(図示せず)等に接続出来る。
動作説明 次に、実施例の文字切出し装置30の理解を深めるため
に、この装置の動作説明を行う。なお、この説明を、文
字行画像入力部20は文字切出し装置30に対し、第2図に
示すような、隣接文字パタン同士が一部分Qで重なりあ
い他の一部分Rで接触している「東京」の文字パタンを
含む入力文字画像41を出力した例により行う。なお、第
2図中、ハッチングを付した部分中の1つの四角形11は
第5図同様文字パタンの1つの黒画素を示す。また、入
力文字行画像41において文字パタンの並び方向をx座標
とし、この方向と垂直な方向をY座標として説明する。
<探索領域の設定> 探索領域設定部31は、文字行画像入力部20より入力文
字行画像41を入力すると、入力文字行画像41の文字パタ
ン間境界を探索するための探索始点43及び探索終点45の
位置を設定する。
これら探索始点及び終点43,45は、あくまで文字パタ
ン間境界の探索のための始点及び終点であるので、その
位置は厳密である必要はない。そこで、これら2点のX
方向の位置は、従来公知の文字切出し方法を利用して決
定する。例えば入力文字行画像41の中の黒画素の塊を検
出し該塊の位置に基づいて文字ピッチを推定し該文字ピ
ッチに基づいて決定すれば良い。このように決定した場
合は、探索始点及び終点43,45各々のX座標は同じにな
る。或いは、オペレータがこれら2点のX座標を指定す
るようにしても良い。一方、探索始点43のY方向の位置
は、この実施例では、入力文字行画像41の上端よりA画
素だけ上方の座標で示される位置に、探索終点45のy方
向の位置は入力文字行画像41の下端よりA画素だけ下方
の座標で示される位置としている。ここで、Aは設計に
応じ変更出来るが、この実施例では文字行画像41の高さ
の0.2倍程度の値としている。なお、このように決定さ
れた探索始点の座標を(X0,YS)、探索終点の座標座標
を(X0,XE)で示すことにする。
次に、探索領域設定部31は、探索始点及び終点43,45
間を結ぶ線分Vを対称軸としかつこれら探索始点及び探
索終点43,45を2つの頂点とする六角形の探索領域47を
設定する。このように決定された、探索領域47は、その
中心部分の幅が(2A+1)画素の六角形の領域となる。
探索領域設定部31は、決定した探索領域47を示す情報
(以下、探索領域設定データと称する。)を経路決定部
33の経路方向データ算出部33aに出力する。
<経路方向データの算出> 経路方向データ算出部33aは、探索領域設定部31より
探索領域設定データを入力すると、探索領域47の各画素
(X,Y)の画素濃度値f(X,Y)に対応した経路方向デー
タd(X,Y)と、該経路方向データd(X,Y)を算出する
ための経路方向評価値データd(X,Y)を以下に説明す
る手順で作成する。但し、この実施例においては、画素
濃度値f(X,Y)は、白画素(背景部)において10、黒
画素(文字線部)において100とする。
先ず、経路方向データ算出部33aは、探索始点43にお
ける経路方向データd(X0,YS)及び経路方向評価値デ
ータg(X,YS)を以下の及び式のように初期化す
る。
d(X0,YS)=1 …… g(X0,YS)=0 …… 次に、経路方向データ算出部33aは、X方向を主走査
方向、Y方向を副走査方向、画素(X0−1,YS+1)を走
査開始位置、画素(X0,YE)を走査終了位置として探索
領域47内を走査し、各画素(X,Y)毎に経路方向データ
d(X,Y)及び経路方向評価値データg(X,Y)下記
式、式に従い算出する。
g(X,Y)=min(G0,G1,G2) …… 但し、G0は下記式、G1は下記式、G2は下記式に
よりそれぞれ与えられるものとする。
G0=g(X−1,Y−1)+K0f(X,Y) …… G1=g(X,Y−1)+K1f(X,Y) …… G2=g(X+1,Y−1)+K2f(X,Y) …… 但し、式において、g(X−1,Y−1)が探索領域4
7の外に存在する場合は、g(X−1,Y−1)=∞として
扱う。式のg(X,Y−1)、式のg(X+1,Y−1)
についても同様に扱う。
また、上記K0,K1,K2は、第3図に示すように、注目画
素P(X,Y)に対し前走査線(Y−1)上において注目
画素Pに隣接する3つの画素P0(X−1,Y−1)、P
1(X,Y−1)、P2(X+1,Y−1)各々から画素Pを通
過する経路を想定した場合に各経路の向きに応じ予め定
めた係数であり、それぞれ下記の係数としてある。
従って、式で与えられるG0は、注目画素Pに隣接す
る画素P0の経路評価値データに、P0から注目画素Pを通
過する経路の向きに応じて定めた係数K0で重み付けした
画素Pの濃度値を加算した値を表わしている。また、G1
は、画素P1の経路評価値データに、P1から注目画素Pを
通過する経路の向きに応じて定めた係数K1で重み付けし
た画素Pの濃度値を加算した値を表わし、G2は、画素P2
の経路評価値データに、P2から注目画素Pを通過する経
路の向きに応じて定めた係数K2で重み付けした画素Pの
濃度値を加算した値を表わしている。
さらに、G0〜G2がこのような値を表わすものであるか
ら、上記式で与えられる経路方向評価値データg(X,
Y)は、探索始点(X0,YS)から画素(X,Y)へ至る任意
の経路上の各画素の濃度値を該画素における経路の向き
に応じて定めた係数で重み付けした値の累積値が最小と
なる累積値を表わすデータになる。
さらに、式で与えられる経路方向データd(X,Y)
は、画素(X,Y)において前記最小累積値が得られる場
合の前走査線(Y−1)からの経路方向を示すデータで
あって、その経路がP0、P1、P2いずれの画素から注目画
素Pにきているかによって、0,1,2のいずれかの値にさ
れる。
経路評価値データをg(X,Y)と、経路方向データd
(X,Y)各々の求め方を、具体的に説明する。
例えば探索始点直下の位置の画素(X0,YS+1)につ
いて考えると、この画素は背景部の画素(第2図参照)
であるからその濃度値f(X,Y)=10である。また、
〜式に従いG0〜G2を求めるに当たり、g(X0−1,YS
及びg(X0+1,YS)は各々探索領域47より外にある(第
2図参照)のでこれらの値は∞である。また、g(X0,Y
S)=0に初期化されている。従って、G0〜G2は、 G0=∞+10=∞ G1=o+10=10 G2=∞+10=∞ となる。よって、画素(X0,Y+1)の経路方向評価値デ
ータg(X,Y+1)は、式に従いG0〜G2中の最小値で
ある10とされる。さらに、画素(X0,Y+1)の経路方向
値データd(X,Y+1)は、式に従い(g(X,Y)=G1
の場合に相当するので)、1とされる。
このようにして探索領域47中の全画素の経路方向評価
値データg(X,Y)を求めた結果を別表1に示し、経路
方向データd(X,Y)を別表2に示した。
<経路の決定> 経路算出部33bは、経路方向データ算出部33aより探索
領域内の各画素に対応した経路方向データd(X,Y)を
入力すると、探索始点(X0,YS)から探索終点(X0,YE
へ至る任意の経路のうちの、経路上の各画素の濃度値を
各画素での経路の向きに応じて予め定めた係数で重み付
けした値の累積値が最小となる経路を以下の手順で決定
する。
まず、Y=YEとし副走査位置Yにおける経路のX座標
DX(Y)を、DX(Y)=X0とする(探索終点45(第2図
参照)が経路決定の出発点とされる)。
次に、Yを1減算し、さらに、副走査Y+1の位置
(Yを1減算する前の位置)での経路方向データd(DX
(Y+1),Y+1)を参照し、 …d(DX(Y+1),Y+1)が0であれば、DX(Y)
=DX(Y+1)−1。
…d(DX(Y+1),Y+1)が1であれば、DX(Y)
=DX(Y+1)。
…d(DX(Y+1),Y+1)が2であれば、DX(Y)
=DX(Y+1)+1。
とすることにより当該副走査位置Yにおける経路のX座
標DX(Y)を決定する。この操作をY=YSになるまで繰
り返す。
このように求めた座標(DX(Y),Y)の組み(但し、
Y=YS〜YE)を文字パタン間境界としての経路として決
定する。別表2中に*印を付した画素のつながりが決定
された経路である。
既に説明したように、経路決定に用いた経路方向デー
タd(X,Y)は、探索始点(X0,YS)から画素(X,Y)へ
至る任意の経路のうち、該経路上の各画素の画素濃度値
を該画素での経路の向きに応じて予め定めた係数で重み
付けした値の累積値が最小となる前走査線(Y−1)か
らの経路方向を示すデータである。従って、上述の如く
求めた経路(別表2の*でつながる経路)は、探索終点
(X0,YE)から探索始点(X0,YS)に至る最適な経路とい
える。
<文字パタンの切出し> 次に、切出し部35は、1つの探索領域47について経路
算出部33bで算出された経路に対応する座標群のデータ
を入力し、該経路を文字パタン間境界として入力文字行
画像41から1文字に対応した文字パタンを切出す。或い
は、切出し部35は、経路算出部33bより入力文字行画像4
1上の全ての探索領域毎の探索始点から探索終点へ至る
最適経路に対応する座標群のデータをそれぞれ入力し、
これらデータに基づき入力文字行画像41から1文字ずつ
順次に文字パタンを切出す。
第4図は、切出し部35が経路算出部33bより入力した
データに基づいて入力文字行画像41の一部「東京」に対
する文字切出し結果を示した図(「東」及び「京」の各
文字パタン間境界を示した図)である。図中黒○印を付
した画素のつながりが「東」及び「京」の文字パタン間
境界である。第4図からも明らかなように、「東」及び
「京」の各文字パタンは、他方の文字パタンの一部を含
んだりまたはその文字パタン自身の一部が欠落すること
なく、正しく切出されることが分る。
<変形例> 上述においては、この発明の文字切出し装置の実施例
について説明したが、この発明は上述の実施例のみに限
られるものではなく、以下に説明するような種々の変更
を加えることが出来る。
例えば、上述の実施例では、K0=K2=1.4142,K1=1
としていたが、これら値は入力文字行の特徴に応じて適
正な値に変更出来ることは明らかである。例えば、隣接
文字同士の大幅な重なりや接触が存在しにくい文字行
(例えば活字の文字行)で構成される入力文字行画像に
対しては、K0及びK2をK1よりも大きくかつK1との差が実
施例の場合より大きい値とすることにより、探索始点と
探索終点とを結ぶ線分からのずれがよい小さい領域から
経路を決定出来る。また、隣接文字同士の大幅な重なり
や接触が存在する確率が高い文字行(例えば手書きの文
字行)で構成される入力文字行画像に対しては、K0及び
K2をK1よりも大きくかつK1との差が実施例の場合より小
さい値とすることにより、探索始点と探索終点とを結ぶ
線分からのずれがより大きい領域から経路を決定出来
る。
また、探索領域の位置及び形状は実施例のものに限ら
れるものではなく適宜変更出来る。例えば、探索領域の
幅は、隣接文字同士の大幅な重なりや接触が存在しにく
い文字行(例えば活字の文字行)で構成される入力文字
行画像に対してはより狭く設定し、逆に、隣接文字同士
の大幅な重なりや接触が存在する確率が高い文字行(例
えば手書きの文字行)で構成される入力文字行画像に対
してはより広く設定するようにするのが好適である。ま
た、探索領域の形状は、切出し対象文字の文字種の特徴
に応じて六角形以外の形状例えば四角形、八角形、楕円
形等にすることが出来る。また、上述の実施例では、探
索始点及び探索終点を入力文字行画像の領域外に設定し
たが、必要に応じてこれら点を入力文字行画像の領域内
に設定しても良い。
また、上述の実施例では、経路方向評価値データg
(X,Y)算出のために注目画素(X,Y)に対し3つの画素
(X−1,Y−1),(X,Y−1),(X+1,Y−1)にお
ける経路方向評価値データg(X−1,Y−1),g(X,Y−
1),g(X+1,Y−1)を参照していたが、必要に応じ
ては参照する画素数は増減しても良い。例えば、g(X,
Y)算出のために、5つの画素(X−2,Y−1),(X−
1,Y−1),(X,Y−1),(X+1,Y−!),(X+2,Y
−1)における経路方向評価値データを参照すれば、実
施例に比べ、より入り込んだ重なり文字、接触文字を含
む入力文字行画像から正しく文字パタンを切出せること
が期待出来る。
また、上述の実施例では、探索始点のX座標と探索終
点のX座標とが等しくなるようにこれら2点を設定して
いたが、2点のX座標は対象入力文字行画像の特徴に応
じては異ならせるのが良い。例えば、入力文字行画像を
構成する各文字パタンが斜めに傾いている場合、例えば
イタリック体で書かれた英字文字行に対しては、探索始
点及び探索終点をY軸に対し斜めの直線上に設定し、こ
の直線を対称軸とした探索領域を設定して実施例の如く
経路決定処理を行うのが良い。この場合には、経路方向
評価値データg(X,Y)算出に用いる係数K0,K1,……,K
m-1(但し、mはg(X,y)算出のため参照する画素数)
のうちの、上述の斜めの直線の方向に最も近い方向の係
数を他の係数より小さい値とすれば良い。
また、上述の実施例では、白画素の濃度値を10、黒画
素の濃度値100としていたが、これら濃度値は、この発
明を説明するための一例であり、他の値に変更出来るこ
とは明らかである。
また、上述の実施例では、入力文字行画像が白黒2値
のデータで表わされるものとして説明したが、この発明
は入力文字行画像が多値データで表わされるものである
場合にも適用出来ることは明らかである。
また、上述の実施例出えは、入力文字行画像の各画素
濃度値に基づいて文字パタン間境界として適切な経路を
決定していたが、入力文字行画像に何等かの処理を行っ
て得られる出力画像の濃度値に基づいて経路決定を行っ
ても良い。例えば、入力文字行画像を1ブロックがM×
N(M,Nは正の整数)個の画素で構成される複数のブロ
ックに分割して1つのブロックを1つの画素とした2値
又は多値の縮少パタンを作成し、このパタンの画素濃度
値に基づいて実施例の如く経路決定を行っても良い。こ
の場合のブロックの大きさ(M,Nの値)は、例えば、入
力文字行画像の高さや平均線幅等に基づいて定めるのが
良い。また、各ブロックの画素濃度値は、ブロックを構
成するM×N個の画素の濃度値の平均値や中央値(メジ
アン)を用いることが出来る。このように、1ブロック
を1画素として扱う場合、入力文字行が局所的にかすれ
ていたり画素濃度値が高くなっている場合でもこれらの
影響が軽減された縮少パタンに対し経路決定処理が行わ
れるので、経路決定の誤りを回避出来ることが期待出来
る。また、M×N個の画素が1つの画素として扱われる
ので、経路決定の処理の際の処理画素数が低減され、そ
の分処理速度が高まることが期待出来る。
(発明の効果) 上述した説明からも明らかなように、この発明の文字
切出し装置によれば、入力文字行画像について文字パタ
ン境界探索のための探索始点、探索終点及び探索領域を
設定し、この探索領域内の各画素の濃度値を、各画素を
通過する前述の探索始点から探索終点に向かう経路の各
画素における向きに応じて予め定めた係数でそれぞれ重
み付けし、該重み付けした濃度値の累積値が最小になる
経路を文字パタン間境界とする。このため、文字パタン
間境界が文字構成画素(画素濃度値の高い画素)を横切
る割合を非常に小さく出来、さらに、探索始点及び探索
終点を結ぶ線分からのずれが小さい領域に文字パタン間
境界が設定出来る。
従って、入力文字行画像の隣接文字パタン同士が重な
り合っている部分(例えば第2図のQ部分)では、隣接
文字パタン間の背景部を縫う経路のうちの、探索始点及
び探索終点を結ぶ線分からのずれが小さい経路が文字パ
タン間境界とされ、隣接文字パタン同士が接触している
部分(例えば第2図のR部分)では、接触箇所を含む文
字構成画素の塊において、探索始点及び探索終点を結ぶ
線分からのずれが小さい経路であって画素濃度値が低い
ところを経由する経路が文字パタン境界とされる。
これがため、従来に比べ文字切出し精度が向上するの
で、文字認識の際の文字切出しの良否に起因する文字認
識率低下を回避することが出来る。
【図面の簡単な説明】
第1図は、実施例の文字切出し装置の構成説明に供する
図、 第2図は、入力文字行画像、探索始点、探索終点及び探
索領域の説明に供する図、 第3図は、注目画素(X,Y)に隣接する3画素の説明に
供する図、 第4図は、実施例による文字パタンの切出し結果を示す
図、 第5図は、従来技術の説明に供する図である。 11……黒画素、20……文字行画像入力部 30……文字切出し装置、31……探索領域設定部 33……経路決定部 33a……経路方向データ算出部 33b……経路算出部、35……切出し部 S……光信号、41……入力文字行画像 43……探索始点、45……探索終点 47……探索領域 Q……隣接文字パタンが重なっている部分 R……隣接文字パタンが接触している部分 V……探索始点及び終点を結ぶ線分。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字行画像から1文字ずつ文字パタン
    を切り出す文字切出し装置において、 文字パタン間境界を探索するための探索始点、探索終点
    及びこれら2点を含む探索領域を設定する探索領域設定
    部と、 前記探索領域内の各画素の濃度値を、各画素を通過する
    前記探索始点から前記探索終点に向かう経路の各画素に
    おける向きに応じて予め定めた係数でそれぞれ重み付け
    し、該重み付けした濃度値の累積値が最小になる経路を
    決定する経路決定部と、 該決定された経路を前記文字パタン境界として前記文字
    行画像から文字パタンを切り出す切出し部とを具えたこ
    と を特徴とする文字切出し装置。
  2. 【請求項2】請求項1に記載の文字切出し装置におい
    て、 前記経路決定部を、 前記各画素毎に、注目画素の濃度値f(X,Y)と、該
    注目画素に対し前記探索始点側で隣接する3つの画素
    (X−1,Y−1)、(X,Y−1)、(X+1,Y−1)各々
    の経路方向評価値データg(X−1,Y−1)、g(X,Y−
    1)、g(X+1,Y−1)とを用い下式に従いG0、G1
    びG2を算出し(但し、式中K0、K1、K2は前記3画素から
    該注目画素をそれぞれ通過する経路を想定した場合の各
    経路毎に対応させて予め定めた係数である。)、算出し
    たG0、G1及びG2のうち最小値を当該注目画素の経路方向
    評価値データg(X,Y)とし、 G0=g(X−1,Y−1)+K0f(X,Y) G1=g(X,Y−1)+K1f(X,Y) G2=g(X+1,Y−1)+K2f(X,Y) 該経路方向評価値データg(X,Y)に基づいて当該注目
    画素の経路方向のデータd(X,Y)を下式に従い算出す
    る経路方向データ算出部と、 …各画素の経路方向のデータd(X,Y)に基づいて前
    記文字パタン境界としての経路を算出する経路算出部と で構成したことを特徴とする文字切出し装置。
  3. 【請求項3】請求項1又は2に記載の文字切出し装置に
    おいて、 前記経路決定部を、前記入力文字行画像を1ブロックが
    M×N(M,Nは正の整数)個の画素で構成される複数の
    ブロックに分割して該1ブロックを1つの画素とみなし
    て前記経路決定処理を行う構成としたこと を特徴とする文字切出し装置。
  4. 【請求項4】請求項1に記載の文字切出し装置におい
    て、 前記探索領域設定部を、前記探索始点及び探索終点を結
    ぶ線分を対称軸としかつこれら探索始点及び探索終点を
    頂点とする多角形を前記探索領域として設定する構成と
    したことを特徴とする文字切出し装置。
JP2181822A 1990-07-10 1990-07-10 文字切出し装置 Expired - Fee Related JP2872768B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2181822A JP2872768B2 (ja) 1990-07-10 1990-07-10 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2181822A JP2872768B2 (ja) 1990-07-10 1990-07-10 文字切出し装置

Publications (2)

Publication Number Publication Date
JPH0468481A JPH0468481A (ja) 1992-03-04
JP2872768B2 true JP2872768B2 (ja) 1999-03-24

Family

ID=16107426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2181822A Expired - Fee Related JP2872768B2 (ja) 1990-07-10 1990-07-10 文字切出し装置

Country Status (1)

Country Link
JP (1) JP2872768B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036463B2 (en) 2006-09-13 2011-10-11 Keyence Corporation Character extracting apparatus, method, and program
US8139861B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program
US8139862B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5636691B2 (ja) * 2010-02-26 2014-12-10 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6003705B2 (ja) 2013-02-14 2016-10-05 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036463B2 (en) 2006-09-13 2011-10-11 Keyence Corporation Character extracting apparatus, method, and program
US8139861B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program
US8139862B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program

Also Published As

Publication number Publication date
JPH0468481A (ja) 1992-03-04

Similar Documents

Publication Publication Date Title
JP2872768B2 (ja) 文字切出し装置
US20020006224A1 (en) Computer automated process for vectorization of raster images
JPH0418351B2 (ja)
US5822455A (en) Linear line detection apparatus using projection image of character string including linear line
US5982952A (en) Optical character reader with tangent detection for detecting tilt of image data
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP2963508B2 (ja) 文字切出し装置
JP2899383B2 (ja) 文字切出し装置
JP3187895B2 (ja) 文字領域抽出方法
JPH10261047A (ja) 文字認識装置
JP3972546B2 (ja) 画像処理装置および画像処理方法
JP2003208568A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
JP3462960B2 (ja) 画像処理方法
JP3586911B2 (ja) 枠線認識装置
JP3622347B2 (ja) 帳票認識装置
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JP2581809B2 (ja) 文字切出し装置
JPH0581477A (ja) 文字切出し方法
JPH05258111A (ja) 文字認識装置
JPS6361382A (ja) 線画像からの文字成分除去方法
JP2633552B2 (ja) 画像処理方法
JPH02166583A (ja) 文字認識装置
JPH10187878A (ja) 表処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees