JPH0468481A - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JPH0468481A
JPH0468481A JP2181822A JP18182290A JPH0468481A JP H0468481 A JPH0468481 A JP H0468481A JP 2181822 A JP2181822 A JP 2181822A JP 18182290 A JP18182290 A JP 18182290A JP H0468481 A JPH0468481 A JP H0468481A
Authority
JP
Japan
Prior art keywords
character
search
route
pixel
cutting device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2181822A
Other languages
English (en)
Other versions
JP2872768B2 (ja
Inventor
Koshi Sakurada
桜田 孔司
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2181822A priority Critical patent/JP2872768B2/ja
Publication of JPH0468481A publication Critical patent/JPH0468481A/ja
Application granted granted Critical
Publication of JP2872768B2 publication Critical patent/JP2872768B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、活字または手書き文字で構成される文M等
の文字行画像から文字パタンそ1文字車位に切り出すた
めの文字切出し装置に関するものである。
(従来の技術) 光学式文字読取装MC0C日)における文字認識では、
被認識文書から文字行画像を得、この文字行画像から1
文字車位に文字パタンを切り出し、この文字パタンを辞
書と照合して文字を認識する。従って、文字認識の精度
を確保するためには、文字パタンの切り出し処理が非常
に重要になる。
文字行画像から文字パタンを切り出すに当たり、文字枠
を有する媒体に書かれた文書からの文字パタンの切り出
しは、文字枠位置ヲ書式情報に加えであきこの情報を利
用しで行えるので、比較的簡単である。しかし、文字枠
を有していない媒体に書かれた文書からの文字パタンの
切り出しは、文字パタン間の境界の判別が必要になるの
で、文字枠を有する場合に比べ大変である。特に、Fa
接文字同士か重なり合っていたり(第5図中のQの部分
或いは第2図中のQの部分の状態)接触したり(第2図
中の日の部分の状態)している場合に不用意に(例えば
文字幅によって強制的に)文字パタン切り出しを行うと
、1lsi1投文字パタンの一部を含んた文字パタンヤ
対象文字の一部が欠落した文字パタンか切り出され、文
字認識精度を低下させてしまう。
そこて、vaWZ文字が重なっている部分を含む文字行
画像からでも所望の文字パタンを切り出せる従来技術と
して、例えば、特開昭63−313287号公報に開示
の「食い込み文字切り出し方式」かあった。
この公報に開示の方式では、詳細は後述するか、入力文
字行画像についで文字幅と予め定めた分故節囲とから切
出し領域が設定され、次に、切出し領域か垂直方向で部
分され、これら分割された領域内に垂直の白線分か存在
するか否かか検出される。白線分か検出されない領域に
ついてはその領域かさらに部分され、それぞれの領域に
ついて上述と同様に白線分の検出が行われる。全ての分
割された領域について白線分が検出されたならば、切出
し領域の上側より順に白線分が最短の水平線分によって
連結され、これら連結された垂直及び水平白線分が文字
間の境界とされて文字パタンか切り出される。
以下、具体例により上述の公報に開示の従来の文字切出
し方式の説明を行う。第5図は、その説明に供する図で
あり、「東」及び「京」という2文字間で重なり部分Q
がある「東京」という文字パタンを含む入力文字行を示
した図である。第5図中、ハツチングを付した部分中の
1つの四角形]]は文字パタンの1つの黒画素を示す。
この従来の文字切出し方式では、先ず文字行画像につい
て文字幅と、予め定めた分散配回とから切出し領域13
が設定される0次に、切出し領域]3を垂直方向におい
て部分して分割領域T11及びT1−2か設定される。
次に、これら分割領域ついて白線分の枝比か行われる。
この際、この例では、分割領域T]−2については、垂
直の白線分へか検出される。しかし、分割領域T]]に
ついてはこの領域内に垂直の白線分が存在しないので、
この領域T1−1はさらに分割領域T2−1及びT2−
2に部分される。次に、これら分割領域T2−1.T2
−2についで垂直の白線分の検出か行われる。これによ
り、分割領tliT2−1からは垂直の白線分Bが、分
割領域T2−2からは垂直の白線分S、C,O及びEが
それぞれ検出される。全ての分割領域で垂直の白線分が
検出されたので、次に、切出し領域13の上側より順に
垂直の白線分が最短の水平線分(図示例ではZで示す部
分)によって連結される。そして、連結された垂直及び
水平線分の経路B+7−+F−+Aが文字量境界とされ
、この情報1こ基づいて文字パタンか入力文字行画像が
ら切出される。
(発明が解決しようとする課題) しかしながら、両投文字同士か接触している入力文字行
画像(例えば第2図に示すように接触部分R8有する入
力文字画像)の場合は切出し争域内に垂直の白線分か存
在しない部分が必す残る。
従って、上述の従来の文字切出し方式では、このような
入力文字行画像から白線分の連結を抽出することが出来
ないため文字パタンを正しく切出すことが出来ないとい
う問題点があった。
この発明は、このような点に鑑みなされたものてあり、
従ってこの発明の目的は、gA接文字同士か重なり合っ
たり接触しでいる入力文字行画像から正しく文字パタン
を切出すことが出来る文字切出し装Mを提供することに
ある。
(課題を解決するための手段) この目的の達成を図るため、この発明によれば、入力文
字行画像から1文字ずつ文字パタンを切り出す文字切出
し装百においで、 文字パタン周境界を探索するための探索始点、探索終点
及びこれら2点を含む探索領域を設定する探索領域設定
部と、 前述の探索領域内の各画素の濃度値を、各画素を通過す
る前述の探索始点から前述の探索終点に向かう経路の各
画素における向きに応じて予め定めた係数でそれぞれ重
み付けし、該重み付けした濃度値の累積値が最小になる
経路を決定する経路決定部と、 該決定された経路を前述の文字パタン境界として前述の
文字行画像から文字パタンを切り出す切出し部とを具え
たこと を特徴とする。
(作用) この発明の構成によれば、探索領域内の画素濃度値が低
いところを経由する経路であって然も探索始点及び探索
終点を結ぶ線分からのずれか小さい経路か文字パタン間
境界とされる。従って、入力文字行画像のwA接文字パ
タン同士が重なり合っている部分(例えば第2図のQ部
分)では、wA接接文字パタン間背景部を縫う経路のう
ちの、探索始点及び探索終点を結ぶ線分からのずれか小
ざい経路か文字パタン間境界とされ、llal交接パタ
ン同士が接触している部分(例えば第2図の8部分)で
は、接触箇所を含む文字構成画素の塊において、探索始
点及び探索終点を結ぶ線分からのずれか小ざい経路であ
って画素濃度値か低いところを経由する経路が文字パタ
ン境界とされる。
また、入力文字行画像を1ブロツクかMxN(M、Nは
正の整数)個の画素で構成される複数のブロックに分割
して該]ブロックを1つの画素とみなしでこの発明の経
路決定処理を行う構成の場合、局所的にかすれていたり
画素濃度値か高い画素を含んでいる入力文字画像からこ
れらの影響を除去したパタンか得られ、このパタンかう
文字パタン間境界としての経路が決定出来る。このため
、局所的にかすれでいたり画素濃度値が高い画素を含ん
でいる入力文字画像であっても適切な経路決定か期待出
来る。また、MXN個の画素を1つの画素とみなすこと
から、経路決定処理での処理画素数が少くなるので、そ
の分処理時間を短く出来る。
また、探索始点及び探索終点を結ぶ線分を対称軸としか
つこれら探索始点及び探索終点を頂点とする多角形を探
索領域とする構成の場合、探索始点及び終点が特定され
るので、経路決定処理が容易に行える。
(実施例) 以下、第1図〜第4図を参照してこの発明の文字切出し
製画の実施例について説明する。
徂掲dえ明 第1図は、活字及び又は手書きで記載された文書等の情
報媒体(図示せず)から文字行画像を得るための文字行
画像入力部2oと、実施例の文字切出し製雪30とを併
せて示したブロック図である。
文字行画像入力部20は、情報媒体の所定の読取節回を
光学的に走査して光信号Sを入力し、ざらにこの光信号
Sを光電変換し、さらにこの光信号Sを量子化例えば文
字線部は黒、背景部は白というように2値化し、読取節
回の画像パタン(電気信号)1F!:得、ざらに、この
画像パタンかう文字行画像を抽出してこれを文字切出し
装M30に出力する構成としである。
なあ、画像パタンからの文字行画像の抽出は、従来公知
の方法、例えば、画像パタンから周辺分布を求めて文字
行画像部分と文字行間部分とを区別し文字行画像を抽出
する方法等、で行うことが出来る。
また、実施例の文字切出し装[30は、探索領域設定部
31と、経路決定部33と、切出し部35とを具えた構
成としである。
ここで、探索領域設定部31は、文字行画像入力部20
から入力される文字行画像についで文字パタン間境界8
探索するための探索始点、探索終点及びこれら2点を含
む探索領域を設定するものである。この実施例の探索領
域設定部3]は、上述の探索始点及び探索終点を結ぶ線
分を対称軸とする六角形の領域であってこれら探索始点
及び探索終点を六角形の2つの頂点とする六角形の領域
を探索領域として設定する構成としである。
また、経路決定部33は、詳細は動作説明の項で説明す
るか、探索領域設定部31で設定された探索領域内の各
画素の濃度値を、各画素を通過する前記探索始点から前
記探索終点に向かう経路の各画素における向きに応じて
予め定めた係数でそれぞれ重み付けし、該重み付けされ
た濃度値の累積値か最小になる経路を決定するものであ
る。この実施例の経路決定部33は、経路方向データ算
出部33aと、経路算出部33bとで構成しである。
また、切出し部35は、経路決定部33で決定された経
路を文字パタン境界とし文字行画像から文字パタンを切
り出すものである。
切出し部35の出力端子は、例えば文字認識装言の認識
部(図示せず)等に接続出来る。
動1」え明 次に、実施例の文字切出し装M30の理解を深めるため
に、この製画の動作説明を行う、なお、この説明を、文
字行画像入力部20は文字切出し製雪30に対し、第2
図に示すような、隣接文字パタン同士が一部分Qで重な
りあい他の一部分Rで接触しでいる「東京」の文字パタ
ンを含む入力文字画像41を出力した例により行う、な
お、第2図中、ハツチングを付した部分中の1つの四角
形11は第5図同様文字パタンの1つの黒画素を示す。
また、入力文字行画像41において文字パタンの並び方
向7tx座標とし、この方向と垂直な方向をY座標とし
て説明する。
〈探索領域の設定〉 探索領域設定部33は、文字行画像入力部20より入力
文字行画像41を入力すると、入力文字行画像41の文
字パラン間境界を探索するための探索始点43及び探索
終点45の位Nを設定する。
これら探索始点及び終点43.45は、あくまで文字パ
ラン間境界の探索のための始点及び終点であるので、そ
の位冨はMeである必要はない。
そこで、これら2点のX方向の位置は、従来公知の文字
切出し方法を利用して決定する。例えば入力文字行画像
41中の黒画素の塊を検出し該塊の位置に基づいて文字
ピッチを推定し該文字ピッチに基づいて決定すれば良い
。このように決定した場合は、探索始点及び終点43.
45各々のX座標は同しになる。或いは、オペレータか
これら2点のX座標を指定するようにしても良い。一方
、探索始点43のY方向の位置は、この実施例では、入
力文字行画像41の上端よりA画素たけ上方の座標で示
される位置に、探索終点45のX方向の位置は入力文字
行画像4]の下端よりA画素たけ下方の座標で示される
位置としている。ここで、Aは設計に応じ変更出来るが
、この実施例では文字行画像41の高さの0.2倍程度
の値としている。なお、このように決定された探索始点
の座標を(XO,YS)、探索終点の座標座標を(XO
,XE)で示すことにする。
次に、探索領域設定部33は、探索始点及び終点43.
45間を結ぶ線分Vを対称軸としかっこれら探索始点及
び探索終点43.45を2つの頂点とする六角形の探索
領域47を設定する。このように決定された、探索領域
47は、その中心部分の幅か(2A+1)画素の六角形
の領域となる。
探索領域設定部33は、決定した探索領域47を示す情
報(以下、探索領域設定データと称する。)を経路決定
部33の経路方向データ算出部33a(こ出力する。
く経路方向データの算出〉 経路方向データ算出部33aは、探索領域設定部31よ
り探索領域設定データを入力すると、探索領域47の各
画素(X、Y)の画素濃度値fCX、Y)に対応した経
路方向データd (X。
Y)と、該経路方向データd (X、Y)を算出するた
めの経路方向評価値データq (X、Y)を以下に説明
する手順で作成する。但し、この実施例においては、画
素濃度値f (X、Y)は、白画素(背景部)において
10、黒画素(文字線部)において]G0とする。
先す、経路方向データ算出部33aは、探索始点43に
おける経路方向データci(xo、Ys)及び経路方向
評価値データg(X、Y5)’#以下の■及び0式のよ
うに初期化する。
d(XO9Ys)”1   ・・・■ 9(Xo、Ys)=O・・・0 次に、経路方向データ算出部33aは、X方向を主走査
方向、Y方向を副走査方向、画素(XO−1,YS +
1)を走査開始位置、画素(XO。
YE)を走査開始位置として探索領域47内を走査し、
各画素(X、Y)毎に経路方向データd(X、Y)及び
経路方向評価値データ9(X。
Y)%下記■式、■式に従い算出する。
g  (X、  Y)=min  (Go  、G+ 
 、G2  )・・・■ ・・・■ 但し、Goは下記0式、G、は下記0式、G2は下記0
式によりそれぞれ与えられるものとする。
Go=(] (]X−1.Y−1+Ko f (X、Y
)・・・■ G、−9(X、Y−1)+K、f (X、Y)・・・■ G2 ”9 cx+ 1.Y  1 )+K2 f (
X、Y)・・・■ 但し、■式においで、CI (X−1,Y−1)が探索
領域47の外に存在する場合は、9(×−1、Y−1)
=(1)として扱う。0式の9(X、Y−1)、■式の
9 (X+1.Y−1)についても同様に扱う。
また、上記K。、に1.に2は、第3図に示すように、
注目画素P(X、Y)に対し前走査線(Y−1)上にお
いて注目画素Pに隣接する3つの画素P。(X−1,Y
−1)、P、(X、Y−1)、P2  (X+1.Y−
1)各々から画素Pを通過する経路を想定した場合に各
経路の向きに応し予め定めた係数であり、それぞれ下記
の係数としである。
にo =J2″1. 4142 に、=1 に2  =−’2#1.41 42 従って、0式て与えられるGoは、注目画素Pに隣接す
る画素P。の経路評価値データに、P。
かう注目画素Pを通過する経路の向きに応しで定めた係
数K。て重み付けした画素Pの濃度値を加算した値を表
わしている。また、G、は、画素P、の経路評価値デー
タに、P、から注目画素Pを通過する経路の向きに応し
で定めた係数に1で重み付けした画素Pの濃度値を加算
した値を表わし、G2は、画素P2の経路評価値データ
に、P2から注目画素Pを通過する経路の向きに応して
定めた係数に2で重み付けした画素Pの濃度値を加算し
た値を表わしている。
さらに、Go=G2かこのような値を表わすものである
から、上記■式で与えられる経路方向評価値データ9 
(X、Y)は、探索始点(XO。
Y5)から画素(X、Y)へ至る任意の経路上の各画素
の濃度値を該画素における経路の向きに応して定めた係
数で重み付けした値の累積値が最小となる累積値を表わ
すデータになる。
ざらに、■式で与えられる経路方向データd(X、’Y
)は、画素(X、Y)においで前記最小累積値が得られ
る場合の前走査線(Y−1)からの経路方向を示すデー
タであって、その経路がPa 、P+ 、P2いずれの
画素から注目画素Pにきでいるかによって、0,1.2
のいずれかの値にされる。
経路評価値データをq (X、Y)と、経路方向データ
d (x、 Y)各々の求め方を、具体的に説明する。
例えば探索始点直下の位置の画素(Xo、Ys+1)に
ついて考えると、この画素は背景部の画素(第2図参照
)であるがらその濃度値f (X。
Y)=10である。また、0〜0式に従いG。〜G2を
求めるに当たり、9(Xo  1.Ys)及び9 (x
o +1. vs )は各々探索領域47より外にある
(第2図参照)のでこれらの値は(1)である。また、
9(XO,YS)=○に初期化されている。従って、G
o−G2は、 Go=■+10−■ G+ =o+10=10 G2−■+10=ω となる。よって、画素(XO,Y+1)の経路方向評価
値データ9 (X、Y+1)は、■式に従いGO”G2
中の最小値である]Oとされる。さらに、画素(XO,
Y+1)の経路方向値データd(X、Y+1)は、■式
に従い(9(X、Y)=G1の場合に相当するので)、
1とされる。
このようにして探索領域47中の全画素の経路方向デー
タデータ9 (X、Y)を求めた結果を別表1に示し、
経路方向データd (X、Y)を別表2に示した。
く経路の決定〉 経路算出部33bは、経路方向データ算出部33aより
探索領域内の各画素に対応した経路方向データd (X
、Y)を入力すると、探索始点(Xo、Ys)から探索
終点(XO,YE)へ至る任意の経路のうちの、経路上
の各画素の濃度値を各画素での経路の向きに応して予め
定めた係数で重み付けした値の累積値が最小となる経路
を以下の手順で決定する。
ます、Y=Y、とし副走査位MYにあける経路のX座標
DX(Y)!、DX (Y)=Xoとする(探索終点4
5(第2図参照)か経路決定の出発点とされる。)。
次に、Yを1減算し、ざらに、副走査Y+1の位置(Y
を1減算する前の位=)での経路方向データd (DX
 (Y+1)、Y+1)を参照し、■・・・d  (D
X れば、DX ■・・・d (DX れば、DX ■・・・d (DX れば、DX (Y+1)、Y+1)がOてあ (Y)=DX  (Y+ 1)−1゜ (Y+1)、Y+1)か1であ (Y)=DX  (Y+ 1)。
(Y+1)、Y+1)が2であ (Y)=DX (Y+ 1)+ 1゜ とすることにより当該副走査位1tYにおける経路のX
座標DX (Y)を決定する。この操作をY;Ysにな
るまで繰り返す。
このように求めた座標(DX (Y)、Y)の組み(但
し、’/=Y、〜Yt)@文字パタン間境界としての経
路として決定する。別表2中に*印を付した画素のつな
がりが決定された経路である。
既に説明したように、経路決定に用いた経路方向データ
d (X、Y)は、探索始点(Xo。
YS)から画素(X、Y)へ至る任意の経路のうち、該
経路上の各画素の画素濃度値を該画素での経路の向きに
応じて予め定めた係数で重み付けした値の累積値が最小
となる前走査線(Y−1)からの経路方向を示すデータ
である。・従って、上述の如く求めた経路(別表2の*
でつながる経路)は、探索終点(XO,YE)から探索
始点(Xo、Ys)に至る最適な経路といえる。
く文字パタンの切出し〉 次に、切出し部35は、1つの探索領域47について経
路算出部33bて算出された経路に対応する座標群のデ
ータを入力し、該経路を文字パタン間境界として入力文
字行画像41から1文字に対応した文字パタンを切出す
、或いは、切出し部35は、経路算出部33bより入力
文字行画像41上の全ての探索領域毎の探索始点から探
索終点へ至る最適経路に対応する座標群のデータをそれ
ぞれ入力し、これらデータに基づき入力文字行画像41
から1文字ずつ順次に文字パタンを切出す。
第4図は、切出し部35が経路算出部33bより入力し
たデータに基づいて入力文字行画像4]の一部「東京」
に対する文字切出し結果を示した図(「東」及び「京)
の各文字パタン間境界を示した図)である。図中黒○印
を付した画素のつながりが「東」及び「京」の文字パタ
ン問境界である。第4図からも明らかなように、「東」
及び「京」の各文字パタンは、他方の文字パタンの一部
を含んだりまたはその文字パタン自身の一部が欠落する
ことなく、正しく切出されることが分る。
〈変形例〉 上述においては、この発明の文字切出し装置の実施例に
ついて説明したが、この発明は上述の実施例のみに限ら
れるものではなく、以下に説明するようRfm々の変更
を加えることか出来る。
例えば、上述の実施例では、Ko ”K2 = 1゜4
142、に、=1としていたが、これら偵は入力文字行
の特徴に応して適正な値に変更出来ることは明らかであ
る。例えば、隣接文字同士の大幅な重なりや接触が存在
し1こくい文字行(例えば活字の文字行)で構成される
入力文字行画像に対しては、Ko及びに2MK+よりも
大きくかつに+との差が実施例の場合より大きい値とす
ることにより、探索始点と探索終点とを結ぶ線分からの
ずれがより小さい領域から経路を決定出来る。また、隣
接文字同士の大幅な重なりや接触が存在する確率が高い
文字行(例えば手書きの文字行)で構成される入力文字
行画像1こ対しては、Ko及びK 2 % K +より
も大きくかつに、との差が実施例の場合より小さい値と
することにより、探索始点と探索!4i点とを結ぶ線分
からのずれかより大きい領域から経路を決定出来る。
また、探索領域の6位苫及び形状は実施例のものに限ら
れるものではなく適宜変更出来る。例えば、探索領域の
幅は、階梯文字同士の大幅な重なりや接触が存在しにく
い文字行(例えば活字の文字行)で構成される入力文字
行画像に対してはより狭く設定し、逆に、w4接文字同
士の大幅な重なりや接触が存在する確率が高い文字行(
例えば手書きの文字行)で構成される入力文字行画像に
対してはより広く設定するようにするのが好適である。
また、探索領域の形状は、切出し対象文字の文字種の特
徴に応して六角形以外の形状例えば四角形、六角形、楕
円形等にすることが出来る。また、上述の実施例では、
探索始点及び探索終点を入力文字行画像の領域外に設定
したが、必要に応じてこれら点を入力文字行画像の領域
内に設定しでも良い。
また、上述の実施例では、経路方向評価値ブタ9 (X
、Y)算出のために注目画素(X、Y)に対し3つの画
素(X−1,Y−1)、(X、Y−1)、(X+1.Y
−1)における経路方向評価値データ9(X−1,Y−
1)、9 (X、Y−1)、9 (X+1.Y−1)を
参照していたが、必要に応しでは参照する画素数は増減
しても良い。例えば、9(X、Y)jE出のために、5
つの画素(X−2,Y−1)、(X−1,Y−1)。
(X、Y−1)、(X+1.Y−1)、(X+2、Y−
1)における経路方向評価値データを参照すれば、実施
例に比べ、より入り込んた重なり文字、接触文字を含む
入力文字行画像から正しく文字パタンを切出せることが
期待出来る。
また、上述の実施例では、探索始点のX座標と探索終点
のX座標とか等しくなるようこれら2点を設定していた
が、2点のX座標は対象入力文字行画像の特徴に応して
は異ならせるのが良い。例えば、入力文字行画像を構成
する各文字パタンか斜めに傾いている場合、例えばイタ
リック体で係れた英字文字行に対しでは、探索始点及び
探索終点%Y軸に対し斜めの直線上に設定し、この直線
を対象軸とした探索領域を設定して実施例の如く経路決
定処理を行うのが良い。この場合には、経路方向評価値
データ9 (X、Y)算出に用いる係数KO、K + 
、 −−、K−+  (但し、mは9(X、y)算出の
ため参照する画素数)のうちの、上述の斜めの直線の方
向に最も近い方向の係数を他の係数より小さい値とすれ
ば良い。
また、上述の実施例では、白画素の濃度値を10、黒画
素の濃度値!100としていたか、これら濃度値は、こ
の発明を説明するための一例であり、他の値に変更出来
ることは明らかである。
また、上述の実施例では、入力文字行画像か白黒2値の
データで表わされるものとしで説明したが、この発明は
入力文字行画像が多値データで表わされるものである場
合にも適用出来ることは明らかである。
また、上述の実施例では、入力文字行画像の各画素濃度
値に基づいて文字パタン間境界として適切な経路を決定
していたが、入力文字行画像に何等かの処理を行って得
られる出力画像の濃度値に基づいて経路決定を行っても
良い。例えば、入力文字行画像を1ブロツクがMxN 
(M、Nは正の整数)個の画素で構成される複数のブロ
ックに分割して1つのブロックを1つの画素とした2値
又は多値の縮少パタンを作成し、このパタンの画素J度
値に基づいて実施例の如く経路決定を行っても良い。こ
の場合のブロックの太き2(M、Nの値)は、例えば、
入力文字行画像の高さや平均線幅等に基づいて定めるの
が良い、また、各ブロックの画素濃度値は、ブロックを
構成するMXN個の画素の濃度値の平均値や中央値(メ
ジアン)を用いることが出来る。このように、1ブロツ
クを1画素として扱う場合、入力文字行が局所的にかす
れていたり画素濃度値が高くなっている場合てもこれら
の影響が軽減された縮少パタンに対し経路決定処理が行
われるので、経路決定の誤りを回避出来ることが期待出
来る。また、MxN個の画素が1つの画素として扱われ
るので、経路決定の処理の際の処理画素数が低減され、
その分処理速度が高まることが期待出来る。
(発明の効果) 上述した説明からも明らかなように、この発明の文字切
出し装置によれば、入力文字行画像について文字パタン
境界探索のための探索始点、探索終点及び探索領域を設
定し、この探索領域内の各画素の濃度@を、各画素を通
過する前述の探索始点から探索終点に向かう経路の各画
素における向きに応して予め定めた係数でそれぞれ重み
付けし、該重み付けした濃度値の累積値が最小になる経
路を文字パタン間境界とする。このため、文字パタン間
境界が文字構成画素(画素濃度値の高い画素)を横切る
割合を非常に小さく出来、さらに、探索始点及び探索終
点を結zく線分からのずれが小ざい領域に文字パタン間
境界が設定出来る。
従って、入力文字行画像の111s文字パタン同士が重
なり合っている部分(例えば第2図のQ部分)では、l
a接文字パタン門の背景部′lFr縫う経路のうちの、
探索始点及び探索終点を結ぶ線分からのすれか小ざい経
路が文字パタン間境界とされ、隣接文字パタン同士が接
触している部分(例えば藁2図の8部分)では、接触箇
所を含む文字構成画素の塊において、探索始点及び探索
終点を結ぶ線分からのすれが小さい経路であって画素濃
度値か低いところを経由する経路が文字パタン境界とさ
れる。
これがため、従来に比べ文字切出し精度か向上するので
、文字認識の際の文字切出しの良否に起因する文字認識
率低下を回避することか出来る。
【図面の簡単な説明】
第1図は、実施例の文字切出し装置の構成説明に供する
図、 第2図は、入力文字行画像、探索始点、探索終点及び探
索領域の説明に供する図、 第3図は、注目画素(X、Y)に隣接する3画素の説明
に供する図、 第4図は、実施例による文字パタンの切出し結果を示す
図、 第5図は、従来技術の説明に供する図である。 R・・・隣接文字パタンか接触している部分V・・・探
索始点及び終点を結ぶ線分。 沖電気工業株式会社 11・・・黒画素、    20・・・文字行画像入力
部30・・・文字切出し装置、31・・・探索領域設定
部33・・・経路決定部 33a・・・経路方向データ算出部 33b・・・経路算出部、 35−・・切出し部S・・
・光信号、     41・・・入力文字行画像43・
・・探索始点、   45・・・探索終点47・・・探
索領域 Q・・・1lsIl梯文字パタンが重なっている部分X X+1 KO−に3 :経路の方向により予め定めた係数 し主目画素(×、 Y)に隣接する3画素の説明に供する口笛3 図

Claims (1)

  1. 【特許請求の範囲】 [1]入力文字行画像から1文字ずつ文字パタンを切り
    出す文字切出し装置において、 文字パタン間境界を探索するための探索始点、探索終点
    及びこれら2点を含む探索領域を設定する探索領域設定
    部と、 前記探索領域内の各画素の濃度値を、各画素を通過する
    前記探索始点から前記探索終点に向かう経路の各画素に
    おける向きに応じて予め定めた係数でそれぞれ重み付け
    し、該重み付けした濃度値の累積値が最小になる経路を
    決定する経路決定部と、 該決定された経路を前記文字パタン境界として前記文字
    行画像から文字パタンを切り出す切出し部とを具えたこ
    と を特徴とする文字切出し装置。 [2]請求項1に記載の文字切出し装置において、前記
    経路決定部を、 (1)前記各画素毎に、注目画素の濃度値f(X、Y)
    と、該注目画素に対し前記探索始点側で隣接する3つの
    画素(X−1、Y−1)、(X、Y−1)、(X+1、
    Y−1)各々の経路方向評価値データg(X−1、Y−
    1)、g(X、Y−1)、g(X+1、Y−1)とを用
    い下式に従いG_0、G_1及びG_2を算出し(但し
    、式中K_0、K_1、K_2は前記3画素から該注目
    画素をそれぞれ通過する経路を想定した場合の各経路毎
    に対応させて予め定めた係数である。)、算出したG_
    0、G_1及びG_2のうちの最小値を当該注目画素の
    経路方向評価値データg(X、Y)とし、G_0=g(
    X−1、Y−1)+K_0f(X、Y)G_1=g(X
    、Y−1)+K_1f(X、Y)G_2=g(X+1、
    Y−1)+K_2f(X、Y)該経路方向評価値データ
    g(X、Y)に基づいて当該注目画素の経路方向データ
    d(X、Y)を下式に従い算出する経路方向データ算出
    部と、0(g(X、Y)=G_0) d(X、Y)= 1(g(X、Y)=G_1) 2(g(X、Y)=G_2) (2)・・・各画素の経路方向データd(X、Y)に基
    づいて前記文字パタン境界としての経路を算出する経路
    算出部と で構成したことを特徴とする文字切出し装置。 [3]請求項1又は2に記載の文字切出し装置において
    、 前記経路決定部を、前記入力文字行画像を1ブロックが
    M×N(M、Nは正の整数)個の画素で構成される複数
    のブロックに分割して該1ブロックを1つの画素とみな
    して前記経路決定処理を行う構成としたこと を特徴とする文字切出し装置。 [4]請求項1に記載の文字切出し装置において、前記
    探索領域設定部を、前記探索始点及び探索終点を結ぶ線
    分を対称軸としかつこれら探索始点及び探索終点を頂点
    とする多角形を前記探索領域として設定する構成とした
    ことを特徴とする文字切出し装置。
JP2181822A 1990-07-10 1990-07-10 文字切出し装置 Expired - Fee Related JP2872768B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2181822A JP2872768B2 (ja) 1990-07-10 1990-07-10 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2181822A JP2872768B2 (ja) 1990-07-10 1990-07-10 文字切出し装置

Publications (2)

Publication Number Publication Date
JPH0468481A true JPH0468481A (ja) 1992-03-04
JP2872768B2 JP2872768B2 (ja) 1999-03-24

Family

ID=16107426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2181822A Expired - Fee Related JP2872768B2 (ja) 1990-07-10 1990-07-10 文字切出し装置

Country Status (1)

Country Link
JP (1) JP2872768B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011180666A (ja) * 2010-02-26 2011-09-15 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4860574B2 (ja) 2006-09-13 2012-01-25 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP4909216B2 (ja) 2006-09-13 2012-04-04 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP4774390B2 (ja) 2006-09-13 2011-09-14 株式会社キーエンス 文字切り出し装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011180666A (ja) * 2010-02-26 2011-09-15 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Also Published As

Publication number Publication date
JP2872768B2 (ja) 1999-03-24

Similar Documents

Publication Publication Date Title
US6411733B1 (en) Method and apparatus for separating document image object types
JP2933801B2 (ja) 文字の切り出し方法及びその装置
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
CN114863492B (zh) 一种低质量指纹图像的修复方法及修复装置
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
JP2000181992A (ja) カラー文書画像認識装置
Valy et al. Line segmentation for grayscale text images of khmer palm leaf manuscripts
GB2366108A (en) Vectorization of raster images
JPH0468481A (ja) 文字切出し装置
JP2871601B2 (ja) 文字列検出装置及び方法
KR100194583B1 (ko) 얼굴 구성요소 추출시스템 및 그 추출방법
JP2899383B2 (ja) 文字切出し装置
JP4164166B2 (ja) 照射領域抽出装置、照射領域抽出方法及びコンピュータ読み取り可能な記憶媒体
JP2963508B2 (ja) 文字切出し装置
JPH10261047A (ja) 文字認識装置
JPH07182459A (ja) 表構造抽出装置
JP2003208568A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
JP3972546B2 (ja) 画像処理装置および画像処理方法
JP2789622B2 (ja) 文字/図形領域判定装置
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP3285837B2 (ja) 文字列の切り出し装置および方法
JPH096909A (ja) 文字読取装置
JPH0573718A (ja) 領域属性識別方式
CN117853860A (zh) 一种基于语义分割的表结构识别单元格还原方法
JPH05274472A (ja) 画像認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees