JPH0492992A - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JPH0492992A
JPH0492992A JP2207844A JP20784490A JPH0492992A JP H0492992 A JPH0492992 A JP H0492992A JP 2207844 A JP2207844 A JP 2207844A JP 20784490 A JP20784490 A JP 20784490A JP H0492992 A JPH0492992 A JP H0492992A
Authority
JP
Japan
Prior art keywords
route
character
search
boundary line
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2207844A
Other languages
English (en)
Other versions
JP2899383B2 (ja
Inventor
Koshi Sakurada
桜田 孔司
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2207844A priority Critical patent/JP2899383B2/ja
Publication of JPH0492992A publication Critical patent/JPH0492992A/ja
Application granted granted Critical
Publication of JP2899383B2 publication Critical patent/JP2899383B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文書を認識する文字認識装置等において、用
紙等の媒体上に記録された文字列画像から文字パタンを
切出す文字切出し装置に関するものである。
(従来の技術) 従来、文字切出し装置により文字パタンを切出し、その
切出した文字パタンを認識する文字認識装置に関する技
術としては、例えば特開昭63−16391、号公報に
記載されるものがあった。
一般に、文字枠を備えない活字や、手書きの文書を対象
とした文字認識装置においては、文字切出し装置を用い
て、例えば1行分の文字列画像を1文字毎の文字パタン
に切出して認識を行なう。
前記文献に記載された文字切出し装置では、文字列画像
を文字列方向(行方向)と垂直な方向に投影して得られ
る周辺分布に基づいて文字の切出しを行なっている。即
ち、文字列画像より周辺分布を検出し、該周辺分布値が
1以上となる連続領域のパタン(サブ文字パタン)を抽
出し、そのサブ文字パタンの幅と隣接するサブ文字パタ
ン間の距離とに基づき、該サブ文字パタンの結合を行な
って文字パタンを決定している。
(発明が解決しようとする課題) しかしながら、上記構成の装置では、文字枠を備えない
活字や、手書きの文書等において、隣接する文字同士が
接触している場合や、オーバーラツプしている場合に、
複数文字を含むサブ文字パタンか抽出されるので、その
結果、文字パタンを正しく切出すことができない。その
ため、切出された文字パタンを用いて、例えば文字認識
を行なうと、認識精度が低くなるという問題を生じ、そ
れを解決することが困難であった。
本発明は前記従来技術が持っていた課題として、文字列
画像中に他の文字パタンと接触したり、オーバーラツプ
する文字パタンか存在する場合、文字パタンを正しく切
出すことができないという点について解決した文字切出
し装置を提供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、入力媒体上の文字
列より得られる文字列画像データから、文字パタンを切
出す文字切出し装置において、探索領域設定部、経路検
出部、境界線検出部、及び文字パタン切出し部を備えて
いる。
ここで、探索領域設定部は、文字列画像データ中の隣接
する部分パタン間に境界線を設定するための探索始点と
探索終点と該探索始点及び探索終点間を結ぶ線分を軸と
した探索領域とを設定すると共に、前記経路検出部より
得られた経路と前記境界線検出部より得られた該経路の
有効性とに基づいて前記探索始点及び探索終点を更新す
る機能を有している。経路検出部は、前記探索始点から
探索終点へ向かう探索領域内の経路において、該経路上
の各座標の画素濃度値を該座標での経路の向きに応じて
定めた所定の係数で重み付けし、その累積値が最小とな
るよう該経路を検出するものである。境界線検出部は、
前記経路検出部で検出された経路とその経路の近傍領域
の画素濃度値とに基づいて該経路の有効性を判定し、有
効であると認められる場合に該経路を隣接する部分パタ
ン間の境界線であると判定するものである。さらに、文
字パタン切出し部は、前記隣接する部分パタン間の境界
線の位置に基づいて前記文字列画像データから文字パタ
ンの切出しを行なう機能を有している。
前記探索領域は、前記探索始点と探索終点とを結ぶ線分
について対称でかつ該探索始点及び探索終点を頂点とす
る凸多角形の形状としてもよい。
(作用) 本発明によれば、以上のように文字切出し装置を構成し
たので、文字列画像データが探索領域設定部に入力され
ると、該探索領域設定部は、探索始点と、探索終点と、
探索始点及び探索終点間を結ぶ線分を軸とした探索領域
とを設定し、その設定値を経路検出部、境界線検出部、
及び文字パタン切出し部に与える。経路検出部では、入
力された探索領域に基づき、最適な経路を検出し、その
検出結果を境界線検出部へ送る。境界線検出部は、前記
経路と近傍領域の画素濃度値とに基づいて該経路の有効
性を判定し、有効と認められる場合に該経路を隣接する
部分パタン間の境界線として設定し、その設定結果を文
字パタン切出し部へ与える。すると、文字パタン切出し
部は、隣接する部分パタン間の境界線の位置に基づき、
文字列画像から文字パタンの切出しを行なう。これによ
り、隣接する文字同士が接触している場合や、オーバー
ラツプしている場合にも、各文字パタンを精度良く切出
せる。
また、探索領域を凸多角形とした場合には、少ない演算
量で、的確な経路の検出が行なえる。
従って、前記課題を解決できるのである。
(実施例) 第1図は、本発明の一実施例を示す文字切出し装置の機
能ブロック図である。
第1図において、入力媒体上の文字列を読み取って文字
列画像データを出力する文字列画像入力部1が設けられ
、その出力側には、該文字列画像データから1文字ずつ
文字パタンを切出す文字切出し装置10が接続されてい
る。
文字列画像入力部1は、例えば1個または複数個の文字
列が記載された情報媒体上を光学的に走査し、その走査
結果を光電変換して2値化された電気信号(画像パタン
)を記憶し、さらにその画像パタンに含まれる文字列画
像を切出してその文字列画像データを文字切出し装置1
0へ出力する機能を有している0画像パタンから文字列
画像を切出すためには、ヒストグラム法等といった種々
の文字列切出し方法を用いることができる。
文字切出し装置10は、文字列画像入力部1より入力さ
れた文字列画像データ中の隣接する部分パタン間に境界
線を設定するための探索始点と、探索終点と、探索始点
及び探索終点間を結ぶ線分を軸とした探索領域とを、設
定する探索領域設定部11を備えている。ここで、部分
パタンとは、例えば文字列画像中の個々の黒画素の塊で
ある。
この探索領域設定部11の出力側には、経路検出部12
、境界線検出部13、及び文字パタン切出し部14が接
続されている。
経路検出部12は、探索始点から探索終点へ向かう探索
領域内の経路において、経路上の各座標の画素濃度値を
該座標での経路の向きに応じて定めた所定の係数で重み
付けし、その累積値が最小となるよう該経路を検出する
機能を有している。
この経路検出部12は、探索領域内の画素濃度値に基づ
き該探索領域の各画素に対応した経路方向データを算出
する経路方向データ算出部12aと、該経路方向データ
に基づき経路を算出する経路算出部12bとで、構成さ
れ、その出力側に境界線検出部13が接続されている。
境界線検出部13は、検出された経路と近傍領域の画素
濃度値とに基づいて該経路の有効性を判定し、有効であ
ると認められる場合に、該経路を隣接する部分パタン間
の境界線であると判定する機能を有し、その出力側に、
文字パタン切出し部14が接続されている。文字パタン
切出し部14は、隣接する部分パタン間の境界線の位置
に基づき、文字列画像データから文字パタンの切出しを
行なうものである。
第2図は、第1図の動作フローチャートであり、この図
を参照しつつ、文字列画像入力部1より文字列画像デー
タが入力されてから、文字パタンOUTが出力されるま
での文字切出し動作(1)〜(6)を以下説明する。
(1) 探索領域設定(ステップSL>ステップS1に
おいて、探索領域設定部11は、次の3つの状態(al
)〜(a3)のいずれかを検知すると、各々の場合に応
じて探索領域の設定を行ない、対応する画像データを経
路検出部103へ出力し、ステップS2へ進む。
(al) 文字列画像入力部1より文字列画像データを
入力した場合 探索領域設定部11は、文字列画像データを保存すると
共に、文字列画像データのパタンの先頭側に探索領域を
設定する。
(a2) 境界線検出部13において、有効な境界線か
検出されなかった場合 既に設定された探索領域を、文字列方向(例えば、行方
向)に所定値だけシフト〜した領域を、新たな探索領域
として設定する。
シフト値は、例えば探索領域幅の1/2とする。
(a3) 境界線検出部13において有効な境界線が検
出された場合 境界線位置に基づいて新たな探索領域を設定する。例え
ば、文字列画像データからなるパタン上の境界線を構成
する座標の最も後方位置に、探索領域の先頭側の端を合
わせて、該探索領域を設定する。
第3図は、探索領域の例を示す図である。図中、点線で
囲まれた領域20は、文字列画像データからなる画像パ
タン、ハツチングを付した四角形は、文字列画像データ
からなる画像パタンに含まれる黒画素を表わす。例えば
、行方向をX、行方向に垂直な方向をYで表現すると、
探索領域21は、文字行上端よりA画索分上方の画素2
1aを探索始点とし、文字行下端よりA画素分下方であ
ってかつX座標が画素21aと等しい画素、即ち画素2
1bを探索終点として、該探索始点21.aと探索終点
21bとを結ぶ線分を軸として幅2A+1を持つ六角形
の領域で表わされる。
(2) 経路方向評価値データg (X、Y)及び経路
方向データd (X、Y)算出(ステップS2>ステッ
プS2において、経路方向データ算出部12aは、探索
領域設定部11より探索領域の画像データを入力し、該
探索領域の画素(X、Y)の画素濃度値f (X、Y)
に対応した経路方向データd (X、Y)と、その経路
方向データd (X。
Y〉を算出するための経路方向評価値データg(X、Y
)とを、次の2つのステップ52−1及び52−2によ
り生成する。
ここで、例えば、画素濃度値f (X、Y)は白画素(
背景部)において10、黒画素(文字部)において10
0とする。また探索始点及び探索終点の座標を(x o
 、 Y、3 )及び(Xo、 YTE、)とする。
(2)  に>  ステップ52−1 探索始点における経路方向データd (Xo、Y8)及
び経路方向評価値データg(Xo1Y8)に初期値を設
定する。
d(X□、Y3>=1    、 −・−・−(1)g
 (X()、 Ys ) =O”” (2)(2)(i
i)  ステップS2−2 X方向を主走査方向、Y方向を副走査方向、画素(X 
 −1,Y8+1)を走査開始位置、画素○ (xo、y、)を走査終了位置として探索領域21内を
走査し、各画素(x、y)毎に経路方向データd (X
、Y)及び経路方向評価値データg(X、Y)を次式(
3)により計算する。
g (X、 Y) =min(Go、 G1. G2)
−(3)但し、 Go=g (X−1,Y−1)+Kof (X、 Y)
G  =g (X、 Y−1>+に1f (X、 Y)
G  =g (x+ 1 、 Y  1 ) +に2 
f (X、 Y)・・・・・・(5) 係数に□=J=1.4142 係数に1=1 係数に2=J−:1.4142 ・・・・・・(6) なお、(5)式においてg (X−1,Y−1)が探索
領域21の外に存在する場合には、g(X−1,Y−1
)=oo(無限大)として扱う。(5)式のg(X、Y
−1)及びg (X+1.Y−1>についても同様に扱
う。
第4図は、画素P (X、Y)と隣接する3画素P  
(X−1,Y−1>、Pl(χ、Y−1>P2(X+1
.Y−1>を示す図である。この図を用いて経路方向デ
ータ算出部12aのより詳細な説明を行なう。
(5)式は、注目画素Pに対し、隣接する3画素Po、
Pl、P2の各々から画素Pを通過する経路を想定した
場合に、前記隣接画素P。、Pl。
P2の各々の経路方向評価値データに、画素Pの画素濃
度値を前記経路の向きに応じて定めた係数Ko、に工、
に2の各々で重み付けした値を加算した値を示すもので
ある。従って、(3)式で示されるg (X、Y)は、
画素(Xo、Y8)から画素(X、Y)へ至る任意の経
路のうち、該経路上の各画素の画素濃度値を該画素での
経路の向きに応じて定めた所定の係数で重み付けした値
の累積値が最小となる場合の最小累積値である。
さらに(4)式で示されるd (X、Y)は、画素(X
、Y)において前記最小累積値が得られる場合の前走査
線(Y−1>からの経路方向を示すデータであって、画
素Po、P工、P2を経た経路において前記最小累積値
が得られる場合に各々0.1.2なる値が得られる。
第5図及び第6図は、第3図の探索領域21に対する経
路方向評価値データg (X、Y)及び経路方向データ
d (X、Y)の例を示す図である。
このステップS2の処理が終わると、ステップS3へ進
む。
(3) 経路検出(ステップS3) ステップS3において、経路算出部12bは、経路方向
データ算出部12aより各画素に対応した経路方向デー
タd (X、Y)を入力すると、画素(Xo、Y8)か
ら画素(Xo、YF、)へ至る任意の経路の内、該経路
上の各画素の画素濃度値を該画素での経路の向きに応じ
て定めた所定の係数で重み付けした値の累積値が最小と
なる場合の経路を、次のステップ83〜1〜53−3の
手順で決定し、該経路を形成する画素群の位置データを
境界線検出部13へ出力する。
(3)(i>  ステップ53−1 Y=YEとして、副走査位置Yにおける経路のX座標D
X (Y)をDX(Y)=Xoとする。
(3)  (ii)  ステップS3−2Yを1減算し
て、さらに、 d (I)x  Y+1>、y+1>がOであればDX
  Y)=DX (Y+1>−1 d (DX  Y+1>、Y+1>が1て′あればDX
  Y>=DX(Y+1) d (DX  Y+1>、Y+1)が2て′あればDX
  Y>=DX(Y+1>+1 として、YがY8に等しくなるまでこのステップ53−
2を繰り返す。
(3)(iii)  ステップ53−3座標(DX (
Y)、Y)(Y=Y8〜YB)の組を、経路として決定
する。
前述したように、d (X、Y)は、画素(Xo。
Y8)から画素(x、y)へ至る任意の経路の内、該経
路上の各画素の画素濃度値を該画素での経路の向きに応
じて定めた所定の係数で重み付けした値の累積値が最小
となる場合の、前走査線(Y−1)からの経路方向を示
すデータであるから、ステップ53−1〜53−3に基
づき、Y=YEより順次Yを1ずつ減算しながら前記経
路方向に対応した座標を求めることによって、(Xo、
YE)〜(Xo、Y8)に至る最適な経路を決定するこ
とができる。
第6図において、丸印を付した画素は、このステップ5
3−3により得られた経路上の座標を示す。また、第7
図は、第6図の経路方向データd(X、Y)に対するス
テップ53−3の結果を第3図の文字列画像パタンと対
応付けた図であり、図中黒丸印で示される画素は検出さ
れた経路上の画素を表わす。
このステップS3が終了すると、ステップ84〜S6へ
と進む。
(4) 境界線検出(ステップ84〜36)ステップS
4において、境界線検出部13は、経路算出部12bよ
り経路を形成する画素群の位置データを入力し、さらに
探索領域設定部11より該経路の近傍領域の画像濃度値
を読み出して、該経路の隣接する部分パタン間の境界線
としての有効性を判定する。
この判定は、(bl〉隣接する部分パタン間の境界線の
長さが短い、(B2)該境界線上の黒画素数が少ない、
(B3)隣接する境界線間に含まれる黒画素数が多い、
等の境界線に関する一般的な傾向に基づいて行なう。例
えば、次の3つの条件を共に満足した場合に、経路算出
部12bより得られた経路を、有効と判定する。
条件L  L<KlxH ;前記(bl)の性質に対応 条件2 B1くに2×HXLW :前記(B2)の性質に対応 ・・・・・・(8) 条件3 B2〉K3×HXLW ;前記(B3)の性質に対応 ・・・・・・(9〉 但し、L、B工、B2は、各々経路長、経路上の黒画素
数、隣接する境界線との間に含まれる黒画素数である。
Hは文字列画像データの行方向に垂直な方向についての
大きさ(高さ)である。LWは、文字列画像データに含
まれる文字パタンの平均線幅である。平均線幅は、所定
の定数を該平均線幅として設定する等、種々の方法で検
出できる。また、K工、 K 2 、 K 3は経験的
に定めた所定の定数であり、例えばに1=1.5.に2
=0゜1、に3=0.4程度の数値を設定する。
なお、本文字切出し装置10の動作初期時においては、
文字列画像データの先頭位置に、仮想的に境界線が設定
されているものとする。
このステップS4において、経路の有効性が認められな
い場合、次の探索領域を設定するために、境界線検出部
13が探索領域設定部11に指示を送り、ステップS1
へ戻る。
経路の有効性が確認された場合には、ステップS5にお
いて、境界線検出部13が、該経路を隣接する部分パタ
ン間の境界線として決定し、該境界線を形成する画素群
の位置データを保存する。
そしてステップS6において、境界線検出部13は、境
界線の検出処理を終了するか否かを判定する。検出処理
を終了しない場合には、次の探索領域を設定するために
探索領域設定部11がステップS1を実行する。これに
対し、検出処理を終了する場合には、文字パタン切出し
部14がステップS7を実行する。
境界線の検出処理を終了するか否かの判定に当っては、
文字列画像データ中の境界線より後方の領域に、黒画素
が存在するか否かを検出し、存在する場合には検出処理
を終了しないと判定し、存在しない場合には検出処理を
終了すると判定する。
(5) 探索領域設定から境界線検出までの総括(ステ
ップ81〜S6) 第8図は、ステップ81〜S6による部分パタン間の境
界線の検出例を示す図である。図中、30は文字列画像
データからなるパタンの例を表わし、行方向をX行方向
に垂直な方向をYで示しである。
探索領域設定部11が文字列画像パタン30を入力する
と、探索領域31が設定され、経路検出部12が点線で
示す経路を検出する。境界線検出部13は(9)式の条
件が満足されていないことを検知して、該経路を無効と
みなし、次に探索領域設定部11が探索領域32を設定
する。探索領域32については、経路検出部12が点線
で示す経路を検出するが、境界線検出部13が、(8)
式の条件が満足されていないことを検知して、該経路を
無効とみなし、次に探索領域設定部11が探索領域33
を設定する。
探索領域33については、経路検出部12が点線で示す
経路を検出し、境界線検出部13が該経路を有効と判定
して該経路の位置データを保存し、次に探索領域設定部
11が探索領域34を設定する。以下同様の処理を繰り
返すことにより、領域35に示すごとく、点線で示され
た4組の境界線が得られる。境界線検出部13は、最終
的に4組の境界線の位置情報を保存する。その結果、実
質的に4個の部分パタンP1〜P4が得られる。
(6) 文字パタン切出しくステップS7)ステップS
7において、文字パタン切出し部14は、部分パタン間
の境界線の位置データを境界線検出部13より読み出し
、該境界線の位置に基づき、探索領域設定部11に保存
された文字列画像データより、1文字ずつの文字パタン
を切出し、対応する文字パタンOUTのデータを出力し
て文字切出し装置10の動作を終了する。
即ち、文字切出し処理では、文字パタンを構成する個々
の部分パタンの位置やパタンデータに基づいて切出し位
置を決定することが必要となる。
そこで本実施例の文字切出し方法では、前記境界線の位
置に基づいて部分パタンを抽出し、該部分パタン及び該
部分パタンの組合わせによる統合パタンの各々を文字候
補パタンとして、文字候補パタン毎に幾何学的文字評価
値を検出する。そして該幾何学的文字評価値に基づき、
最適な文字候補パタン並びを求めてこれを文字切出し結
果としている。
ここで、統合パタンの設定に当っては、統合パタン幅が
所定の閾値(例えば、文字列画像パタンの高さの1.5
倍)を越えない範囲で設定を行なう。文字候補パタンi
に対する幾何学的文字評価値Viとしては、例えば次式
(10)を用い、値が小さい程文字らしいことを示すも
のとする。
但し、Wi;文字候補パタンiのパタン幅H;文字列画
像パタン高さ また、最適な文字候補パタン並びの検出に当っては、次
式(11)で表わされる文字候補パタン並びにに対する
総合評価値UKが、最小となる場合の文字候補パタン並
びを文字切出し結果とする。
但し、ni:文字候補パタンiを構成する部分パタン数 第9図は、第8図の境界線検出例(領域35)に対する
幾何学的文字評価値例を示す藺である。
この図に基づき、(11)式が最小となる場合の文字候
補パタン並びを求めると、[東J  (PL>。
[京J  (P2>、’都J  (P3+P4)が文字
切出し結果として得られる。
従って、本実施例では、次のような利点を有している。
(i)  経路検出部12は、探索始点から探索終点へ
向かう探索領域内の経路において、その経路上の各座標
の画素濃度値を該座標での経路の向きに応して定めた所
定の係数で重み付けし、その累積値が最小となるよう境
界線検出用の経路を検出する。そのため、次の2つの性
質(i−1>。
(i−2>を有する経路を得ることができる。
(i−1>  経路が横切る文字構成画素(画素濃度値
の高い画素)の割合が小さい。
(i−2>  探索始点と探索終点とを結ぶ線分からの
経路のずれが小さい。
このように、本実施例では、入力文字列画像の隣接文字
同士が重なり合う場合、隣接文字間の背景領域(白画素
領域)中から探索始点と探索終点とを結ぶ線分からのず
れが小さい経路を、隣接する部分パタン間の境界線とし
て決定するので、隣接文字の各々の文字パタンOUTを
正しく切出すことができる。また、隣接文字同士が接触
する場合には、接触箇所を含む文字構成画素の坑内にお
いて、探索始点と探索終点とを結ぶ線分からのずれが小
さい経路であってしかも通過距離の小さい経路を、隣接
する部分パタン間の境界線として決定するので、隣接文
字の各々の文字パタンOUTを高精度に切出すことがで
きる。これにより、従来に比べ文字切出しの精度が向上
するので、例えば文字認識装置における文字切出しエラ
ーに基づく認識率の低下を回避でき、高精度な文字認識
装置を実現できる。
なお、本発明は上記実施例に限定されず、種々の変形が
可能である。その変形例としては、例えば次のようなも
のがある。
(1) 経路方向評価値データg (X、Y>を算出す
るために、パラメータK o 、 K 1 、 K 2
の各々を(6〉式のように定めたが、対象とする文字列
パタンの特徴に応じてK。、に工、に2を設定するのが
よい。
例えば、大幅な重なりや接触が存在しない文字で構成さ
れる文字列画像(例えば、活字の文字列)の場合、K 
よりも大きくかつに1との差がより大きいK 及びに2
を設定すれば、探索始点と探索終点とを結ぶ線分からの
ずれがより小さい領域から経路が決定される。
(2) 第3図では、探索領域21の位置及び形状を、
幅2A+1を持つ六角形に設定したが、この探索領域2
1の位置及び形状を適宜変更してもよい。
例えば、大幅な重なりや接触が存在しない文字で構成さ
れる文字列画像(例えば、活字の文字列)の場合、より
幅の狭い探索領域を設定し、逆に大幅な重なりや接触が
存在する文字で構成される文字列画像(例えば、手書き
の文字列)の場合、より幅の広い探索領域を設定すれば
よい。さらに、対象とする文字種の特徴に応じて探索領
域21の形状を六角形以外の四角形、六角形、楕円形等
にしてもよい。
また、上記実施例では探索始点及び探索終点を文字列画
像の領域外に設定したが、必要に応じて文字列画像の領
域内に探索始点及び探索終点を設定してもよい。
(3) 経路方向評価値データg (X、Y)算出のた
めに注目画素(X、Y)に対し、3つの画素(X−1,
Y−1>、(X、y−1>、(X+1゜Y−1)におけ
る経路方向評価値データg(X−1、Y−1>、g (
X、Y−1>、g (X+1゜Y−1)を参照するよう
文字切出し装置10を構成したが、必要に応じて参照す
る画素数を増減してもよい。例えば、g (X、Y)算
出のために、5つの画素(X−2,Y−1>、(X−1
,Y−1)、(X、Y−1>、(X+1.Y−1>。
(X+2.Y−1>を参照すれば、上記実施例に比べ、
より入り込んだ重なり文字及び接触文字に対しても、正
しく部分パタン間の境界線を検出できる。
(4) 探索始点のX座標と探索終点のX座標を等しく
設定したが、対象とする文字列画像の特徴に応じて適宜
変更するのが良い。例えば、文字列を構成する各文字が
斜めに傾いている場合(例えば、イタリック体で記載さ
れた英文文字列の場合)、探索始点及び探索終点を文字
行画像の文字並びと垂直な方向に対し斜めの直線上に設
定し、該探索始点と探索終点とを結ぶ線分を軸とした適
当な探索領域を設定して文字パタン切出しのための処理
を行なうのがよい。この場合には、経路方向評価値デー
タg (X、Y)算出のためのパラメータKK   ・
・・、K    (但し、mはg (X。
0・  1′    m−1 Y)算出のための参照画素数)を、前記斜めの直線の方
向により近い方向に対応する前記パラメータの値をより
小さく設定すれば良い。
(5) 白画素に対応する画素濃度値を10、黒画素に
対応する画素濃度値を100として説明したが、これら
の数値は適宜変更してよい。
(6) 入力文字列画像が白黒2値のデータである場合
につき説明したが、この入力文字列画像が多値データで
ある場合に対してもそのまま適用可能である。
(7) 入力文字列画像の画素濃度値に基づいて経路を
決定する場合につき説明したが、この入力文字列画像に
何らかの処理を行なって得られる出力画像の画素濃度値
に基づき経路を決定しても良い。例えば、入力文字列画
像を該文字列画像の高さや、平均線幅等に基づいて定め
られるMXN画素(但し、M、Nは正の整数)の大きさ
のブロックに分割する。そして分割した各ブロックを1
画素とした2値または多値の縮小パタンを作成し、該縮
小パタンの画素濃度値に基づいて経路を決定することも
可能である。この際、入力文字列画像が局所的にかすれ
ていたり、画素濃度値が高くなっている場合に、これら
の影響を除去した縮小パタンか作成できるので、経路の
誤った決定を回避できる。
(8) 第1図の文字切出し装置10内の各ブロックは
、集積回路等を用いた個別回路で構成したリ、あるいは
マイクロコンピュータ等を用いたプログラム制御により
実行する構成にしても良い。
(発明の効果) 以上詳細に説明したように、本発明によれば、探索領域
設定部が文字列画像の探索領域を設定し、その探索領域
に基づき経路検出部が最適な経路を検出し、境界線検出
部が前記経路と近傍領域の画素濃度値とに基づいて部分
パタン間の境界線を設定し、さらに、その境界線に基づ
き文字パタン切出し部が文字パタンの切出しを行なうよ
うにしている。そのため、経路検出部により、次の2つ
の性質(i)、  (ii)を有する経路を得ることが
できる。
(i) 経路が横切る文字構成画素(画素濃度値の高い
画素)の割合が小さい。
(ii)  経路の探索始点と探索終点とを結ぶ線分の
ずれが小さい。
これにより、入力文字列画像の隣接文字同士が重なり合
う場合には、隣接文字間の背景領域中から探索始点と探
索終点とを結ぶ線分からのずれが小さい経路を、隣接す
る部分パタン間の境界線として決定するので、隣接文字
の各々の文字パタンを正しく切出すことができる。また
、隣接文字同士が接触する場合には、接触箇所を含む文
字構成画素の境内において、探索始点と探索終点とを結
ぶ線分からのずれが小さい経路であってしかも通過距離
の小さい経路を、隣接する部分パタン間の境界線として
決定するので、隣接文字の各々の文字パタンを高精度に
切出すことができる。
従って、従来に比べ文字切出しの精度が向上するので、
例えば文字認識装置における文字切出しエラーに基づく
認識率の低下を回避でき、高精度な文字認識装置を実現
できる。
また、探索領域を凸多角形の形状にした場合には、少な
い演算量で、精度の良い、経路の検出が可能となる。
【図面の簡単な説明】 第1図は本発明の実施例を示す文字切出し装置の機能ブ
ロック図、第2図は第1図の動作フローチャー1へ、第
3図は探索領域の例を示す図、第4図は画素(X、Y)
と隣接する3画素を示す図、第5図は経路方向評価値デ
ータg (X、Y)の例を示す図、第6図は経路方向デ
ータd (X、Y)の例を示す図、第7図は経路検出部
12による経路の検出例を示す図、第8図は境界線の検
出例を示す図、第9図は幾何学的文字評価値の例を示す
図である。 1゛・・・・・・文字列画像入力部、10・・・・・・
文字切出し装置、11・・・・・・探索領域設定部、1
2・・・・・・経路検出部、12a・・・・・・経路方
向データ算出部、12b・・・・・・経路算出部、13
・・・・・・境界線検出部、14・・・・・・文字パタ
ン切出し部。

Claims (1)

  1. 【特許請求の範囲】 1、入力媒体上の文字列より得られる文字列画像データ
    を入力し、該文字列画像データ中の隣接する部分パタン
    間に境界線を設定するための探索始点と探索終点と該探
    索始点及び探索終点間を結ぶ線分を軸とした探索領域と
    を設定する探索領域設定部と、 前記探索始点から探索終点へ向かう探索領域内の経路に
    おいて、該経路上の各座標の画素濃度値を該座標での経
    路の向きに応じて定めた所定の係数で重み付けし、その
    累積値が最小となるよう該経路を検出する経路検出部と
    、 前記経路検出部で検出された経路とその経路の近傍領域
    の画素濃度値とに基づいて該経路の有効性を判定し、有
    効であると認められる場合に該経路を隣接する部分パタ
    ン間の境界線であると判定する境界線検出部と、 前記隣接する部分パタン間の境界線の位置に基づいて前
    記文字列画像データから文字パタンの切出しを行なう文
    字パタン切出し部とを備え、前記探索領域設定部は、前
    記経路検出部より得られた経路と前記境界線検出部より
    得られた該経路の有効性とに基づいて前記探索始点及び
    探索終点を更新する構成にした、 ことを特徴とする文字切出し装置。 2、請求項1記載の文字切出し装置において、前記探索
    領域は、 前記探索始点と探索終点とを結ぶ線分について対称でか
    つ該探索始点及び探索終点を頂点とする凸多角形の形状
    とした文字切出し装置。
JP2207844A 1990-08-06 1990-08-06 文字切出し装置 Expired - Fee Related JP2899383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2207844A JP2899383B2 (ja) 1990-08-06 1990-08-06 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2207844A JP2899383B2 (ja) 1990-08-06 1990-08-06 文字切出し装置

Publications (2)

Publication Number Publication Date
JPH0492992A true JPH0492992A (ja) 1992-03-25
JP2899383B2 JP2899383B2 (ja) 1999-06-02

Family

ID=16546467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2207844A Expired - Fee Related JP2899383B2 (ja) 1990-08-06 1990-08-06 文字切出し装置

Country Status (1)

Country Link
JP (1) JP2899383B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012037926A (ja) * 2010-08-03 2012-02-23 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2012048321A (ja) * 2010-08-24 2012-03-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012037926A (ja) * 2010-08-03 2012-02-23 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2012048321A (ja) * 2010-08-24 2012-03-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Also Published As

Publication number Publication date
JP2899383B2 (ja) 1999-06-02

Similar Documents

Publication Publication Date Title
CN103198468B (zh) 图像处理装置、图像处理方法和图像处理系统
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP3943638B2 (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
JPH0418351B2 (ja)
JPH0492992A (ja) 文字切出し装置
JP2006309402A (ja) 文字列認識方法、ナンバープレート認識方法、及び装置
JP2007141167A (ja) 車線検出装置、車線検出方法、及び車線検出プログラム
JP3096481B2 (ja) 帳票類の種類判別方法
CN103067643A (zh) 图像处理装置、图像处理方法和图像处理系统
JPH0468481A (ja) 文字切出し装置
JPH04100189A (ja) 文字切出し装置
JPH07182459A (ja) 表構造抽出装置
JP4282467B2 (ja) 像域分離方法
JP3551004B2 (ja) 罫線抽出方法および装置
JPS63136179A (ja) 文字切出し装置
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JP2005039620A (ja) 画像読取装置
JP2000070243A (ja) 照射領域抽出装置、照射領域抽出方法及びコンピュータ読み取り可能な記憶媒体
JPH1040333A (ja) 帳票認識装置
JPH05114048A (ja) 文字認識方法及びその装置
JPH1097589A (ja) 枠線位置検出方法とそれを用いた光学式文字読取装置
JPH1021332A (ja) 非線形正規化方法
JPH10254994A (ja) サイズ識別方法および記憶媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees