JP2963508B2 - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JP2963508B2
JP2963508B2 JP2218365A JP21836590A JP2963508B2 JP 2963508 B2 JP2963508 B2 JP 2963508B2 JP 2218365 A JP2218365 A JP 2218365A JP 21836590 A JP21836590 A JP 21836590A JP 2963508 B2 JP2963508 B2 JP 2963508B2
Authority
JP
Japan
Prior art keywords
character
area
search
path
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2218365A
Other languages
English (en)
Other versions
JPH04100189A (ja
Inventor
孔司 桜田
晃治 伊東
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2218365A priority Critical patent/JP2963508B2/ja
Publication of JPH04100189A publication Critical patent/JPH04100189A/ja
Application granted granted Critical
Publication of JP2963508B2 publication Critical patent/JP2963508B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、用紙等の媒体上に記録された文字列画像か
ら1文字ずつ高精度に文字パタンを切出す文字切出し装
置に関するものである。
(従来の技術) 一般に文字枠を備えない活字や手書きの文書を対象と
した文字認識装置においては、1行分の文字列画像を1
文字毎の文字パタンに切出して認識を行う。この文字切
出しは、例えば文字列画像を行方向と垂直な方向に投影
して得られる周辺分布に基づいて行われる。
従来、この種の文字切出し装置としては、特開昭63−
16391号公報等に記載されるものがあった。
この文献に開示された文字切出し装置は、文字列画像
より前記周辺分布を検出して、その周辺分布値が1以上
となる連続領域のパタンであるサブ文字パタンを抽出
し、サブ文字パタンの幅と隣接するサブ文字パタン間の
距離とに基づき、サブ文字パタンの結合を行って文字パ
タンを決定する。
(発明が解決しようとする課題) しかしながら、上記構成の文字切出し装置では、互い
に隣接する文字が接触している場合や重なり合う場合
に、複数文字を含むサブ文字パタンが抽出されるので、
その結果、文字パタンを正確に切出すことができないと
いう問題があった。
本発明は前記従来技術の持っていた課題として、正確
に文字パタンを切出すことができないという点について
解決した文字切出し装置を提供するものである。
(課題を解決するための手段) 本発明は、前記課題を解決するために、文字列方向に
対して垂直方向に文字列画像を走査して周辺分布データ
を作成し、該周辺分布データに基づき文字部分パタンか
らなるブロック領域を検出するブロック検出部を備え、
前記ブロック領域に基づき前記文字列画像中の文字パタ
ンの切出し処理を行う文字切出し装置において、次のよ
うな手段を講じたものである。
前記ブロック領域に対応する前記周辺分布データに基
づき、隣接する前記文字部分パタン間に境界線を設定す
るための候補領域を設定する探索候補設定部と、前記候
補領域より前記境界線の探索始点及び探索終点を選択
し、該検索始点と探索終点とを結ぶ線分を軸とした探索
領域を設定する探索領域設定部と、前記探索始点から前
記探索終点へ向かう前記探索領域中の経路のうち、該経
路上の各座標の画素濃度値に対して所定の係数で重み付
けし、その重み付け結果の累積値が最小となる経路を検
出する経路検出部と、前記経路検出部により検出された
経路の位置データ及び該経路の近傍領域の画素濃度値に
基づき、該経路における前記境界線としての有効性を判
定する経路有効性判定部と、前記経路有効性判定部によ
り有効と判定されたとき、前記経路検出部により検出さ
れた経路を前記境界線として決定する境界線決定部と、
前記境界線の位置データ及び前記ブロック領域の位置デ
ータに基づき、前記文字パタンの切出しを行う文字パタ
ン切出し部とを、備えたものである。
また、前記探索候補設定部は、前記ブロック領域に対
応する前記周辺分布データが所定値以下で、かつ所定幅
以上の連続領域を前記候補領域として設定する構成にし
てもよいし、さらに前記探索候補設定部は、前記ブロッ
ク領域に対応する前記周辺分布データの波形形状が所定
幅以上連続した凹形状となる領域を前記候補領域として
設定する構成にしてもよい。
また、前記経路検出部は、前記各座標における経路の
向きに応じて設定した所定係数で前記画素濃度値を重み
付けし、その重み付け結果の累積値が最小となる経路を
検出する構成としてもよいし、前記探索領域は、前記線
分を軸として対称で、かつ前記探索始点及び探索終点を
頂点とする凸多角形の形状を有する領域としてもよい。
(作用) 本発明は、以上のように文字切出し装置を構成したの
で、文字列画像の周辺分布データに基づき、ブロック領
域を検出し、該ブロック領域内より隣接文字部分パタン
間の境界線を検出して該境界線の位置データとブロック
位置データとに基づき文字パタンの切出しを行う。前記
境界線を検出する際に、ブロック領域内に候補領域を設
定し、その候補領域内に探索領域を設定する。そして、
その探索領域内の経路において経路上の各座標の画素濃
度値をその座標での経路の向きに応じて定めた所定の係
数で重み付けし、その累積値が最小とするように前記経
路を検出する。検出された経路と近傍領域の画素濃度値
とに基づいて該経路の有効性を判定し、有効と認められ
る場合にその経路を境界線として検出する。これによ
り、文字パタンを正確に切出すことができる。従って、
前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示す文字切出し装置の機
能ブロック図である。
この文字切出し装置10の入力側には、1個または複数
個の文字列が記載された情報媒体上を光学的に走査して
光電変換し、2値化された電気信号(文字画像パタン)
を記憶するイメージスキャナ等の文字列画像入力部10a
が接続されている。さらに、文字列画像入力部10aは、
前記画像パタンに含まれる文字列画像を切出してその文
字列画像データD1を文字切出し装置10へ出力する機能を
有している。
文字切出し装置10は、文字列方向に対して垂直方向に
文字列画像を走査して周辺分布データを作成し、該周辺
分布データに基づき文字部分パタンからなるブロック領
域(黒ブロック)を検出するブロック検出部11を有して
いる。このブロック検出部の出力側には、探索候補設定
部12と探索領域設定部13とが順次接続されている。探索
候補設定部12は、前記黒ブロックの領域に対応する周辺
分布データが所定値以下で、かつ所定幅以上の連続領域
を候補領域とし、隣接する文字部分パタン間に境界線を
設定するための候補領域を設定する機能を有し、探索領
域設定部13は、前記候補領域により前記境界線の探索始
点及び探索終点を選択し、該探索始点と探索終点とを結
ぶ線分を軸とした探索領域を設定する機能を有してい
る。ここで、探索領域は、前記線分を軸として対称で、
かつ前記探索始点及び探索終点を頂点とする凸多角形の
形状を有する領域として設定される。そして、探索領域
設定部13の出力側には、経路検出部14が接続されてい
る。
経路検出部14は、探索領域内の画素濃度値に基づき該
探索領域の各画素に対応した経路方向データを算出する
経路方向データ算出部14aと、経路方向データに基づき
経路を算出する経路算出部14bとで、構成されている。
この経路検出部14は、探索始点から探索終点へ向かう探
索領域中の経路のうち、該経路上の各座標の画素濃度値
に対して、各座標における経路の向きに応じて設定した
所定の係数で重み付けし、その重み付け結果の累積値が
最小となる経路を検出する機能を有している。そして、
経路検出部14の出力側には境界線検出部15と文字パタン
切出し部16とが接続されている。
境界線検出部15は、経路検出部14により検出された経
路の位置データ及び該経路の近傍領域の画素濃度値に基
づき、該経路における前記境界線としての有効性を判定
する経路有効性判定部15aと、経路有効性判定部15aによ
り有効と判定されたとき、経路検出部14により検出され
た経路を境界線として決定する境界線決定部15bとで、
構成されている。文字パタン切出し部16は、境界線の位
置データ及び黒ブロック領域の位置データに基づき、文
字パタンの切出しを行う機能を有している。
第2図は第1図の動作フローチャート、及び第3図は
本実施例の動作説明図である。これらの図を参照しつ
つ、上記のように構成された文字切出し装置の動作を説
明する。なお、説明を簡潔にするために、第2図のステ
ップ21〜ステップ30の処理順毎に説明する。
(A) 周辺分布の作成(ステップ21) ブロック検出部11が文字列画像入力部10aより文字列
画像データを入力すると、その文字列画像データを保存
すると共に、文字列画像データからなる例えば第3図に
示す文字列画像パタン41を行方向Xと垂直な方向Yに投
影して、周辺分布データ42を作成し保存する。
(B) ブロックの検出(ステップ22) ブロック検出部11は、保存された前記周辺分布データ
に基づき、黒ブロックの位置(左端座標及び右端座標)
を検出し保存する。本実施例では周辺分布データが1以
上となる各連続領域を黒ブロックとする。第3図の周辺
分布データに対しては、2つの黒ブロック領域B1,B2が
図中の43に示すように検出される。
(C) 候補領域の設定(ステップ23) 探索候補設定部12は、ブロック検出部11より黒ブロッ
ク位置及び周辺分布データを入力する。黒ブロック位置
に対応する周辺分布データに基づき、隣接する部分パタ
ン間に境界線を設定するための探索始点及び探索終点の
候補領域を設定する。本実施例では、黒ブロックの領域
に対応する周辺分布データが所定位置、例えば文字列画
像パタンの高さの約1/6程度より小さくなる所定幅以上
の各連続領域を候補領域とみなして、その候補領域の位
置(左端座標及び右端座標)を保存する。
第3図においては、周辺分布データ42を閾値THと比較
することにより、黒ブロックB1に対しては領域KH1〜KH3
が、黒ブロックB2に対しては領域KH4が得られるが、領
域KH3,KH4はいずれも領域幅が狭いので、結果的にKH1,K
H2が候補領域として検出される。
(D) 探索領域設定の可能性の判定(ステップ24) 探索領域設定部13が以下の3つの状態〜のいずれ
かを検知すると、各々の場合に応じて探索領域を設定可
能か否かを判定する。
ステップ23の実行終了の場合 探索領域設定部13は、候補領域番号KHに設定し、探索
候補設定部12より候補領域KHの位置を読出す。そして、
該候補領域KHが存在しない場合には探索領域を設定不可
能と判定し、該候補領域KHが存在する場合には、探索領
域を設定可能と判定すると共に、探索領域左端位置Xsを
候補領域KHの左端位置と等しく設定する。
ステップ28の実行終了の場合 探索領域設定部13は、探索領域左端位置Xsを行方向に
所定値だけシフトし、その結果得られる位置Xsが候補領
域KH内に含まれる場合には探索領域を設定可能とする。
位置Xsが候補領域KH内に含まれない場合には、候補領域
番号KHを1加算して、探索候補設定部12より候補領域KH
の位置を読出す。その結果、該候補領域KHが存在しない
場合には探索領域を設定不可能と判定し、該候補領域KH
が存在する場合には、探索領域を設定可能と判定する。
そして、探索領域左端位置Xsを候補領域KHの左端位置と
等しく設定する。
ステップ29の実行終了の場合 探索領域設定部13は境界線検出部15より境界線の位置
情報を入力する。その後、該境界線を構成する座標の最
も後方の位置を検出し、その検出された位置を探索領域
左端位置Xsに設定する。位置Xsが候補領域KH内に含まれ
る場合には探索領域を設定可能と判定する。
位置Xsが候補領域KH内に含まれない場合には、候補領
域番号KHを1+加算して探索候補設定部12より候補領域
KHの位置を読出し、該候補領域KHが存在しない場合に探
索領域を設定不可能と判定する。存在する場合には、探
索領域を設定可能と判定し、探索領域左端位置Xsを候補
領域KHの左端位置と等しく設定する。
本ステップにより探索領域が設定可能と判定された場
合は、次にステップ25が実行され、設定不可能と判定さ
れた場合にはステップ30が実行される。
(E) 探索領域の設定(ステップ25) 探索領域設定部13は、保存された候補領域KHの位置及
び探索領域左端位置Xsに基づいて、探索領域の位置を設
定する。
第4図は、本実施例における探索領域の一例を示す図
である。図中の領域51は文字列画像パタンを表し、領域
51aは文字列画像パタンに含まれる黒画素を表す。行方
向をX及び行方向に垂直な方向をYで表現すると、探索
領域は、X座標がXs+Aであり、かつ文字列上端よりA
画素分上方の画素52を探索始点とし、X座標がXs+Aで
あり、かつ文字列下端よりA画素分下方の画素53を探索
終点とし、該探索始点52と探索終点53とを結ぶ線分を軸
として、幅2A+1を持つ六角形の領域54で表される(図
中ではA=4)。
なお、位置Xsより候補領域KHの右端位置までの距離D
が2A+1より小さい場合には、A=D/2として前述と同
様に探索領域54を設定する。
(F) 経路方向評価値データ及び経路方向データ算出
(ステップ26) 経路方向データ算出部14aは、探索領域設定部13より
探索領域の位置情報を入力する。この位置情報に基づ
き、ブロック検出部11より前記探索領域に対応する画像
データを入力し、該探索領域の画素(X,Y)の画素濃度
値f(X,Y)に対応した経路方向データd(X,Y)とこの
経路方向データを算出するための経路方向評価値データ
g(X,Y)とを、以下のように作成する。但し、本実施
例では、画素濃度値f(X,Y)は白画素(背景部)にお
いて「10」、黒画素(文字部)において「100」とす
る。また、探索始点及び探索終点の座標を(Xo,Ys)及
び(Xo,YE)とする。
まず、探索始点における経路方向データd(X,Y)及
び経路方向評価値データg(Xo,Ys)に初期値を設定す
る。
d(Xo,Ys)=1 ……(1) g(Xo,Ys)=0 ……(2) 続いて、X方向を主査方向、Y方向を副走査方向、画
素(Xo−1,Ys+1)を主査開始位置、画素(Xo,YE)を
走査終了位置として探索領域54内を走査し、各画素(X,
Y)毎に経路方向データd(X,Y)及び経路方向評価値デ
ータg(Xo,Y)を次式により計算する。
g(X,Y)=min(G0,G1,G2) ……(3) d(X,Y)=0(g(X,Y)=G0の時) 1(g(X,Y)=G1の時) 2(g(X,Y)=G2の時) ……(4) 但し、 G0=g(X−1,Y−1)+K0f(X,Y) G1=g(X,Y−1)+K1f(X,Y) G2=g(X+1,Y−1)+K2f(X,Y) ……(5) なお、上記(5)式においてg(X−1,Y−1)が探
索領域54の外に存在する場合には、g(X−1,Y−1)
=∞として取り扱う。上記(5)式のg(X,Y−1)及
びg(X+1,Y−1)についても同様に扱う。
第5図は、画素P(X,Y)と隣接する3画素P0(X−
1,Y−1)、P1(X,Y−1)、P2(X+1,Y−1)を示す
図である。この図を参照しつつ経路方向データ算出部14
aのより詳細な説明をする。
上記(5)式は、注目画素Pに対し、隣接する3画素
P0、P1、P2の各々から画素Pを通過する経路を想定した
場合に、前記隣接画素P0、P1、P2の各々の経路方向評価
値データに画素Pの画素濃度値を前記経路の向きに応じ
て定めた係数K0,K1,K2の各々で重み付けした値を加算
し、その加算結果の値を示すものである。
従って、(3)式で示される経路方向評価値データg
(X,Y)は、画素(Xo,Ys)から画素(X,Y)へ至る任意
の経路のうち、該経路上の各画素の画素濃度値を各画素
での経路の向きに応じて定めた所定の係数で重み付けし
た値の累積値が最小となる場合の最小累積値である。
さらに、上記(4)式で示される経路方向データd
(X,Y)は、画素(X,Y)において前記最小累積値が得ら
れる場合の前走査線(Y−1)からの経路方向を示すデ
ータであって、画素P0、P1、P2をへた経路において前記
最小累積値が得られる場合に各々0,1,2が得られる。
このようにして算出された第4図中の探索領域54に対
する経路方向評価値データg(X,Y)及び経路方向デー
タd(X,Y)の計算結果がそれぞれ第6図及び第7図に
示されている。
(G) 経路の検出(ステップ27) 経路算出部14bが、経路方向データ算出部14aより各画
素に対応した経路方向データd(X,Y)を入力すると、
画素(Xo,Ys)から画素(Xo,YE)へ至る任意の経路の
うち、該経路上の各画素の画素濃度値を該画素での経路
の向きに応じて定めた所定の係数で重み付けした値の累
積値が最小となる場合の前記経路を以下の手順で決定す
る。
まず、Y=YEとして、副走査位置Yにおける経路の
X座標をDX(Y)=Xoとする。次に、Yを1減算して、
さらに、 d(DX(Y+1),Y+1)が0であれば、 DX(Y)=DX(Y+1)−1 d(DX(Y+1),Y+1)が1であれば、 DX(Y)=DX(Y+1) d(DX(Y+1),Y+1)が2であれば、 DX(Y)=DX(Y+1)+1 として、YがYsに等しくなるまで繰り返す。
そして、座標(DX(Y),Y)(Y=Ys〜YE)の組を
経路として決定する。
第7図中の丸印を付した画素が本ステップにより得ら
れた経路上の座標を示すものである。また、第8図は、
経路検出部14による経路の検出例を示す図であり、第7
図の経路方向データd(X,Y)に対する本ステップの結
果を第4図の文字列画像パタンに対応付したものであ
る。なお、この第8図の黒丸印で示される画素は検出さ
れた経路上の画素を表すものである。
既に前述したように、経路方向データd(X,Y)は、
画素(Xo,Ys)から画素(X,Y)へ至る任意の経路のう
ち、該経路上の各画素の画素濃度値を各画素での経路の
向きに応じて定めた所定の係数で重み付けした値の累積
値が最小となる場合の前走査線(Y−1)からの経路方
向を示すデータである。従って、ステップ27において、
Y−YEより順次Yを1ずつ減算しながら前記経路方向
に対応した座標を求めることによって、画素(Xo,YE)
から画素(Xo,Ys)に至る最適な経路を決定することが
できる。
(H) 経路の有効性判定(ステップ28) 境界線検出部15は、経路算出部14bより経路を形成す
る画素群の位置データを入力し、さらにブロック検出部
11より該経路の近傍領域の画素濃度値を読出し、隣接す
る部分パタン間の境界線としての該経路の有効性を判定
する。
この経路の有効性判定は、隣接する部分パタン間の
境界線の長さが短い、該境界線上の黒画素数が少な
い、隣接する境界線間に含まれる黒画素数が多い、等
の前記境界線に関する一般的な傾向に基づいて行うが、
例えば、本実施例では以下の3つの条件を全て満足した
場合に、経路算出部14bより得られた経路を有効と判定
する。
(条件1) L<K1×H (前記の性能に対応) ……(7) (条件2) B1<K2×H×LW (前記の性質に対応)……(8) (条件3) B2>K3×H×LW (前記の性質に対応)……(9) 但し、Lは経路長、B1は経路上の黒画素数、B2は隣接
する各境界線間に含まれる黒画素数、Hは文字列画像パ
タンの行方向に垂直な方向についての大きさ(高さ)、
LWは文字列画像パタンに含まれる文字パタンの平均線
幅、K1,K2,K3は経験的に定めた所定の定数(例えば、K1
=1.5、K2=0.1、K3=0.4程度の数値を設定する)であ
る。前記文字パタンの平均線幅は、従来公知の方法によ
り容易に検出できる。なお、ステップ23の実行終了時に
おいては、各黒ブロックの先頭位置に仮想的に境界線が
設定されているものとする。
本ステップにおいて経路の有効性が認められた場合は
ステップ29が実行され、有効性が認められない場合は、
ステップ24が実行される。
(I) 境界線の決定(ステップ29) 境界線検出部15は、有効と判定された経路を隣接する
部分パタン間の境界線として決定し、該境界線を形成す
る画素群の位置データを保存する。ステップ29が終了す
ると、次の探索領域を設定するためにステップ24が実行
される。ステップ24〜29における境界線の検出過程の一
例が第3図の44,45,46に示されている。
第3図において、探索候補設定部12は、候補領域KH1,
KH2を検出すると(ステップ23)、候補領域KH1の先頭側
に探索領域44を設定する(ステップ24,25)。この場合
には、候補領域KH1の幅が2A+1より大きいので、探索
領域44の幅は2A+1となる。
次に、経路検出部14が経路44aを検出し(ステップ26,
27)、境界線検出部15は該経路44aを有効と判定し(ス
テップ28)、該経路を境界線として決定する(ステップ
29)。続いて、探索領域設定部13が該境界線の右端を基
準として次の探索領域45を設定する(ステップ24,2
5)。この場合には、境界線44aの右端より候補領域KH1
の右端までの距離が2A+1より小さいので、探索領域45
の幅は2A+1より小さく、その右端位置は候補領域KH1
の右端位置に等しい。
さらに、経路検出部14は経路45aを検出し(ステップ2
6,27)、境界線検出部15が上記(9)式の条件が満足さ
れていないことを検知し、該経路45aを無効とみなす
(ステップ28)。続いて、探索領域設定部13が候補領域
KH2の先頭側に探索領域46を設定する(ステップ24,2
5)。この場合には、候補領域KH2の幅が2A+1より小さ
いので、探索領域46の幅は候補領域KH2の幅と等しくな
る。その後、経路検出部14が経路46aを検出し(ステッ
プ26,27)、境界線検出部15が経路46aを有効と判定して
(ステップ28)、該経路46aを境界線として決定する
(ステップ29)。
次に、探索領域設定部13が設定すべき探索領域が存在
しないことを検知すると、ステップ30が実行される。
(J) 文字パタンの切出し(ステップ30) 文字パタン切出し部16は、境界線検出部15より部分パ
タン間の境界線の位置データを入力すると共に、ブロッ
ク検出部11より黒ブロックの位置データを入力する。こ
れら両位置データに基づき、ブロック検出部11に保存さ
れた文字列画像パタンより1文字ずつの文字パタンを切
出し、切出された文字パタンに対応する文字パタンデー
タOUTを出力することで、文字切出し装置の動作を終了
する。
一般に、文字切出し装置は文字パタンを構成する個々
の文字部分パタンの位置やパタンデータに基づいて切出
し位置を決定するので、本ステップに用いる文字切出し
方法は従来公知の多くの方法(周辺分布法や輪郭追跡法
等)を適用することができる。特に、本実施例では、前
記境界線の位置及び黒ブロックの位置に基づいて文字部
分パタンを抽出し、文字部分パタンと文字部分パタンと
の組合せによる統合パタンの各々を文字候補パタンと
し、文字候補パタン毎に幾何学的文字評価値を検出す
る。そして、その幾何学的文字評価値に基づいて最適な
文字候補パタン列を求め、この文字候補パタン列を文字
切出し結果とする。なお、前記統合パタンの設定に当た
っては、統合パタン幅が所定の閾値、例えば文字列画像
パタンの高さの1.5倍を越えない範囲で設定を行う。ま
た、文字候補パタンiに対する前記幾何学的文字評価値
Viとしては、例えば(10)式を用い、その値が小さい
程、文字らしいことを示すものとする。
Vi=|Wi−H|/H ……(10) 但し、Wi;文字候補パタンiのパタン幅 H;文字列画像パタンの高さ また、前記最適な文字候補パタン列の検出に当たって
は、次の(11)式で表される文字候補パタン に対する統合評価値 が最小となる場合の文字候補パタン列を文字切出し結果
とする。
但し、ni;文字候補パタンiを構成する文字部分パタ
ン数 第3図の文字部分パタン分離例47は、文字列画像41に
対して得られる2本の境界線l1,l2と黒ブロックの右端
位置を示す2本の直線l3,l4とを示しており、これらの
直線間に挟まれた領域P1,P2,P3,P4が個々の文字部分パ
タンを表している。
第9図は、第3図の文字部分パタン分離例47に対する
幾何学的文字評価値を示す図であり、この図に基づいて
上記(11)式が最小となる場合の文字候補パタン列を求
めると、「東」(P1),「京」(P2),「都」(P3+P
4)が文字切出し結果として得られる。この時、(11)
式は最小値 となる。
本実施例は次のような利点を有している。
本実施例では、文字列画像の周辺分布データに基づ
き、黒ブロック領域を検出し、該黒ブロック領域内より
隣接文字部分パタン間の境界線を検出して該境界線の位
置データと黒ブロック位置データとに基づき文字パタン
の切出しを行うようにした。さらに、前記境界線を検出
する際には、黒ブロック領域内に候補領域を設定し、そ
の候補領域内に探索領域を設定する。そして、その探索
領域内の経路において経路上の各座標の画素濃度値をそ
の座標での経路の向きに応じて定めた所定の係数で重み
付けし、その累積値が最小となるように前記経路を検出
する。検出された経路と近傍領域の画素濃度値とに基づ
いて該経路の有効性を判定し、有効と認められる場合に
その経路を境界線として検出する。これにより、経路
は、経路が横切る文字構成画素(画素濃度値の高い画
素)の割合が小さい、経路の探索始点と探索終点とを結
ぶ線分からのずれが小さい、といった性質を有すること
になる。従って、本実施例では、文字列画像の隣接文字
どおしがオーバーラップする場合には、隣接文字間の背
景領域中から探索始点と探索終点とを結ぶ線分からのず
れが小さい経路を境界線として決定するので、隣接文字
の各々の文字パターンを正しく切出すことができる。
また、隣接文字どおしが接触する場合には、接触箇所
を含む文字構成画素の塊内において、探索始点と探索終
点とを結ぶ線分からのずれが小さく、かつ通過距離の小
さい経路を境界線として決定するので、隣接文字の各々
の文字パタンを高精度に切出すことができる。
さらに、境界線の検出は、黒ブロック領域内に設定し
た候補領域のみを対象として行われるので、高速処理が
可能である。
従って、従来に比べ、処理速度の低下を最小限に抑え
て文字切出しの精度を向上できるので、文字認識装置に
おける文字切出しエラーに基づく認識率の低下を効率よ
く回避できる。
なお、本発明は、図示の実施例に限定されず、種々の
変形が可能である。例えば、その変形例として次のよう
なものがある。
(I) 上記実施例においては、経路方向評価値データ
g(X,Y)を算出するために、パラメータK0,K1,K2の各
々を上記(6)式のように定めたが、対象とする文字列
パタンの特徴に応じて設定してもよい。大幅な重なりや
接触が存在しない文字で構成される文字列画像、例えば
活字の文字列に対しては、パラメータK1よりも大きく、
かつパラメータK1との差がより大きいパラメータK0,K2
を設定することにより、探索始点と探索終点とを結ぶ線
分からのずれがより小さい領域から経路が決定される。
また、大幅な重なりや接触が存在する文字で構成される
文字列画像、例えば手書きの文字列に対しては、パラメ
ータK1よりも大きく、かつパラメータK1との差がより小
さいK0,K2を設定することにより、探索始点と探索終点
を結ぶ線分からのずれがより大きい領域から経路が決定
される。
(II) 上記実施例では、探索領域の位置及び形状を第
4図の54のように設定したが、これに限定されず、適宜
変更してもよい。例えば、活字の文字列等の大幅な重な
りや接触が存在しない文字で構成される文字列画像に対
しては、より幅の狭い探索領域を設定し、逆に、手書き
の文字列等の大幅な重なりや接触が存在する文字で構成
される文字列画像に対しては、より幅の広い探索領域を
設定すればよい。さらに、対象とする文字種の特徴に応
じて探索領域の形状、四角形、八角形や楕円形等の六角
形以外の形状にしてもよい。
(III) 探索始点及び探索終点を文字列画像の領域以
外に設定したが、必要に応じて文字列画像の領域内に探
索始点及び探索終点を設定してもよい。
(IV) 経路方向評価値データg(X,Y)を算出するた
めに、注目画素(X,Y)に対し、3つの画素(X−1,Y−
1),(X,Y−1),(X+1,Y−1)における経路方向
評価値データg(X−1,Y−1),g(X,Y−1),g(X+
1,Y−1)を参照するように文字切出し装置を構成した
が、必要に応じて参照する画素数を増減してもよい。例
えば、経路方向評価値データg(X,Y)の算出のため
に、5つの画素(X−2,Y−1),(X−1,Y−1),
(X,Y−1),(X+1,Y−1),(X+2,Y−1)を参
照すれば、上記実施例に比べ、より入り込んだ重なり文
字及び接触文字に対しても正しく文字部分パタン間の境
界線を検出することができる。
(V) 探索始点のX座標と探索終点のX座標を等しく
設定したが、対象とする文字列画像の特徴に応じて適宜
変更してもよい。例えば、イタリック体で記載された英
文文字列に対しては、探索始点及び探索終点を文字列画
像の文字列と垂直な方向に対して斜めの直線上に設定
し、該探索始点と探索終点とを結ぶ線分を軸とした適当
な探索領域を設定して文字パタンの処理を行ってもよ
い。この場合、経路方向評価値データg(X,Y)の算出
のためのパラメータK0,K1,…,Km-1(m;g(X,Y)算出の
ための参照画素数)を、前記斜めの直線の方向により近
い方向に対応する前記パラメータの値をより小さく設定
すればよい。
(VI) 白画素に対応する画素濃度値を10として、黒画
素に対応する画素濃度値を100として説明したが、これ
らの数値に限定されず、適宜変更してもよい。
(VII) 上記実施例では、入力文字列画像が白黒2値
のデータである場合につき説明したが、これに限定され
ず、入力文字列画像が多値データである場合に対して
も、そのまま適用可能である。
(VIII) 上記実施例では、入力文字列画像の画素濃度
値に基づいて経路を決定する場合につき説明したが、前
記入力文字列画像に何等かの処理を行って得られる出力
画像の画素濃度値に基づいて、経路を決定してもよい。
例えば、入力文字列画像を該文字列画像の高さや平均線
幅に基づいて定められるM×N画素(M,N;正の整数)の
大きさのブロックに分割して各ブロックを1画素とした
2値または多値の縮小パタンを作成し、該縮小パタンの
画素濃度値に基づいて経路を決定することが可能であ
る。この場合、入力文字列画像が局所的にかすれていた
り、画素濃度値が高くなっている場合に、これらの影響
を除去した縮小パタンが作成できるので、経路の誤った
決定を回避できることが期待できる。
(IX) 探索候補設定部12について、黒ブロック領域に
対応する周辺分布データが所定値以下となる所定幅以上
の連続領域を候補領域として設定するように構成した
が、一般に、文字接触やオーバーラップが発生する箇所
においては、対応する周辺分布データが谷の形状となり
やすいという特徴を鑑みれば、探索候補設定部12の他の
構成例として、黒ブロック領域に対応する周辺分布デー
タが谷の形状を有する所定幅以上の連続領域を検出して
該領域を候補領域として設定するように構成することも
できる。
(X) 上記実施例では、白地に黒の文字を切出し対象
とし、ブロック領域を黒ブロック領域としたが、黒字に
白文字の白抜き文字を切出し対象としてブロック領域を
白ブロック領域としてもよい。
(発明の効果) 以上詳細に説明したように、本発明によれば、文字列
画像の周辺分布データに基づき、黒ブロック領域を検出
し、さらに該黒ブロック領域内より隣接文字部分パタン
間の境界線を検出する。そして、該境界線の位置データ
と黒ブロック位置データとに基づき文字パタンの切出し
を行うようにしたので、互いに隣接する文字が接触して
いる場合や重なり合う場合でも、文字パタンを正確に切
出すことができる。
【図面の簡単な説明】
第1図は本発明の実施例を示す文字切出し装置の機能ブ
ロック図、第2図は第1図の動作フローチャート、第3
図は第1図の動作説明図、第4図は探索領域の一例を示
す図、第5図は画素P(X,Y)と隣接する3画素を示す
図、第6図は経路方向評価値データの一例を示す図、第
7図は経路方向データの一例を示す図、第8図は経路検
出部14による経路の検出例を示す図、第9図は第3図の
文字部分パタン分離例に対する幾何学的文字評価値を示
す図である。 11……ブロック検出部、12……探索候補設定部、13……
探索領域設定部、14……経路検出部、15……境界線検出
部、15a……経路有効性判定部、15b……境界線決定部、
16……文字パタン切出し部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/34

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列方向に対して垂直方向に文字列画像
    を走査して周辺分布データを作成し、該周辺分布データ
    に基づき文字部分パタンからなるブロック領域を検出す
    るブロック検出部を備え、 前記ブロック領域に基づき前記文字列画像中の文字パタ
    ンの切出し処理を行う文字切出し装置において、 前記ブロック領域に対応する前記周辺分布データに基づ
    き、隣接する前記文字部分パタン間に境界線を設定する
    ための候補領域を設定する探索候補設定部と、 前記候補領域により前記境界線の探索始点及び探索終点
    を選択し、該検索始点と探索終点とを結ぶ線分を軸とし
    た探索領域を設定する探索領域設定部と、 前記探索始点から前記探索終点へ向かう前記探索領域中
    の経路のうち、該経路上の各座標の画素濃度値に対して
    所定の係数で重み付けし、その重み付け結果の累積値が
    最小となる経路を検出する経路検出部と、 前記経路検出部により検出された経路の位置データ及び
    該経路の近傍領域の画素濃度値に基づき、該経路におけ
    る前記境界線としての有効性を判定する経路有効性判定
    部と、 前記経路有効性判定部により有効と判定されたとき、前
    記経路検出部により検出された経路を前記境界線として
    決定する境界線決定部と、 前記境界線の位置データ及び前記ブロック領域の位置デ
    ータに基づき、前記文字パタンの切出しを行う文字パタ
    ン切出し部とを、備えたことを特徴とする文字切出し装
    置。
  2. 【請求項2】請求項1記載の文字切出し装置において、 前記探索候補設定部は、前記ブロック領域に対応する前
    記周辺分布データが所定値以下で、かつ所定幅以上の連
    続領域を前記候補領域として設定する構成にした文字切
    出し装置。
  3. 【請求項3】請求項1記載の文字切出し装置において、 前記探索候補設定部は、前記ブロック領域に対応する前
    記周辺分布データの波形形状が所定幅以上連続した凹形
    状となる領域を前記候補領域として設定する構成にした
    文字切出し装置。
  4. 【請求項4】請求項1記載の文字切出し装置において、 前記経路検出部は、前記各座標における経路の向きに応
    じて設定した所定係数で前記画素濃度値を重み付けし、
    その重み付け結果の累積値が最小となる経路を検出する
    構成とした文字切出し装置。
  5. 【請求項5】請求項1記載の文字切出し装置において、 前記探索領域は、前記線分を軸として対称で、かつ前記
    探索始点及び探索終点を頂点とする凸多角形の形状を有
    する領域とした文字切出し装置。
JP2218365A 1990-08-20 1990-08-20 文字切出し装置 Expired - Fee Related JP2963508B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2218365A JP2963508B2 (ja) 1990-08-20 1990-08-20 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2218365A JP2963508B2 (ja) 1990-08-20 1990-08-20 文字切出し装置

Publications (2)

Publication Number Publication Date
JPH04100189A JPH04100189A (ja) 1992-04-02
JP2963508B2 true JP2963508B2 (ja) 1999-10-18

Family

ID=16718751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2218365A Expired - Fee Related JP2963508B2 (ja) 1990-08-20 1990-08-20 文字切出し装置

Country Status (1)

Country Link
JP (1) JP2963508B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5636691B2 (ja) 2010-02-26 2014-12-10 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6003705B2 (ja) 2013-02-14 2016-10-05 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
JPH04100189A (ja) 1992-04-02

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JP2951814B2 (ja) 画像抽出方式
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
JP4403513B2 (ja) 指紋隆線認識装置、指紋隆線認識方法、及びプログラム
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3615333B2 (ja) 罫線消去装置
JP4132766B2 (ja) 画像処理装置および方法
JP2963508B2 (ja) 文字切出し装置
JP2899383B2 (ja) 文字切出し装置
JP2871601B2 (ja) 文字列検出装置及び方法
JP2868134B2 (ja) 画像処理方法及び装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2872768B2 (ja) 文字切出し装置
JP2871590B2 (ja) 画像抽出方式
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JP3187895B2 (ja) 文字領域抽出方法
JP3019897B2 (ja) 行切出し方法
JP3883993B2 (ja) 画像処理装置、方法およびプログラム
JP4282467B2 (ja) 像域分離方法
JP2003208568A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
JP3030814B2 (ja) ノイズ成分除去方法及びノイズ成分除去プログラムを記録した記録媒体
JPH10233930A (ja) 画像処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees