JP3058489B2 - 文字列抽出方法 - Google Patents

文字列抽出方法

Info

Publication number
JP3058489B2
JP3058489B2 JP3241486A JP24148691A JP3058489B2 JP 3058489 B2 JP3058489 B2 JP 3058489B2 JP 3241486 A JP3241486 A JP 3241486A JP 24148691 A JP24148691 A JP 24148691A JP 3058489 B2 JP3058489 B2 JP 3058489B2
Authority
JP
Japan
Prior art keywords
character
elements
image
connection
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3241486A
Other languages
English (en)
Other versions
JPH0581474A (ja
Inventor
尚史 斎鹿
義弘 北村
安久 中村
みな子 桑田
和宏 竹原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3241486A priority Critical patent/JP3058489B2/ja
Publication of JPH0581474A publication Critical patent/JPH0581474A/ja
Application granted granted Critical
Publication of JP3058489B2 publication Critical patent/JP3058489B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像から文字を認識す
る方法に関し、特に、入力画像から個別の文字領域およ
び文字列を抽出するための方法に関する。
【0002】
【従来の技術】従来の文字抽出方法において、スキャナ
などの手段を用いて入力された画像(以下「原画像」と
称する)から、以下のように文字を取出している。ま
ず、原画像における水平方向または鉛直方向のうち、実
際の文字列の進む方向により近い方向(以下「文字列方
向」と呼ぶ)に、画像の黒点の累積をとる。黒点とは、
文字領域を構成する点のことである。そして、累積値の
小さな部分を文字列と文字列との間の空白部分として、
また累積値の大きな部分を文字列の存在する領域として
文字列の位置を決定する。このようにして得られた文字
列を分割することにより、文字を取出す。
【0003】しかし、このような手法では、原画像の文
字列の傾きが大きい場合、黒点の累積値の大小の差が水
平方向と鉛直方向とであまり大きくならない。そのため
文字列を正確に抽出することは容易ではなく、個別の文
字を正確に取出すことも困難である。
【0004】これに対し、個々の文字を構成すると見ら
れる文字の要素領域(以下「文字要素」と呼ぶ)を予め
抽出し、それらを統合することによって文字または文字
列を抽出する方法が考えられる。この方法においては、
文字を抽出する前段階として、個々の文字を構成すると
見られる文字要素を予め抽出する必要がある。
【0005】文字要素として、黒点の連結領域を用いる
例が見られる。連結領域とは、画像の黒点の集合からな
る領域であって、その領域内のいかなる2点も、その領
域内のみを通る曲線によって接続され得るような黒点の
集合の領域をいう。このような場合、従来は連結領域を
画像から抽出してから、それに外接する長方形の座標を
求め、それによって文字要素を検出してきた。このよう
な従来の方法によれば、処理の途中において、画像中の
各黒点が、どの連結領域に属するかという情報を保持し
ておく必要がある。そのため、このような方法を用いる
と大容量のメモリが必要とされた。この処理を行なうた
めの専用のハードウェアも存在しているが、全体のシス
テムとしては高価なものになってしまう。
【0006】また、このような手法では、文字要素の統
合が不十分であれば、単一の文字または文字列が分離さ
れてしまい、また統合が過剰であれば、異なる文字また
は文字列が単一の文字または文字列に誤って統合されて
しまうおそれがある。そのため最適な統合を行なうこと
は容易ではない。
【0007】
【発明が解決しようとする課題】それゆえにこの発明の
目的は、原画像の傾きによる影響を可能な限り小さく
し、かつ安定した処理結果を得ることができる文字列抽
方法を提供することである。
【0008】
【課題を解決するための手段】請求項1に記載の文字列
抽出方法は、画像を読取り、連続する複数本のデジタル
走査線信号に変換するステップと、順次与えられる前記
デジタル走査線信号を順次分析し、先行する第1のデジ
タル走査線信号より以前の前記デジタル走査線信号によ
り表現される連結領域に外接する、外接枠の形状を特定
するための外接枠情報を得て、前記外接枠情報を保持す
るステップと、第1のデジタル走査線信号の直後に後続
する第2のデジタル走査線信号に含まれる連結線分領域
を検出し、前記連結線分領域と連結関係にある前記連結
領域の前記外接枠情報を更新するとともに、前記連結線
分領域のいずれとも連結関係にない前記連結領域の存在
を検出するたびに、その前記外接枠情報を逐次出力する
ステップと、前記画像の終了を検出して、保持されてい
る残りの前記外接枠情報を出力するステップと、任意の
2つの前記外接枠情報の間に、予め定める同値関係が成
立するか否かを調べることにより、各前記外接枠情報に
内接する前記連結領域を同値類に分類するステップと、
同一の同値類に属する前記連結領域を1つの文字列の構
成要素として抽出するステップとを含み、前記分類する
ステップは、前記連結領域に対応した要素を含む配列を
準備し、各前記要素に互いに異なる値を記憶させるステ
ップと、二つの前記要素の組合わせの全てに対して、前
記二つの要素に対応の前記連結領域が文字列方向と垂直
方向とで異なる基準で定義された互いに近いという関係
を満足するか否かを前記外接枠情報に基づいて判定し、
前記関係が満足されたときには所定の規則にしたがって
前記二つの要素の値が等しくなるように更新する処理を
繰り返すステップと、前記更新が全て終了したことに応
答して、その時点での対応の前記要素の値に基づいて、
前記連結領域を同値類に分類するステップとを含む。
【0009】請求項2に記載の文字列抽出方法は、画像
から文字要素を抽出するステップと、抽出された各前記
文字要素に外接する、外接枠の形状を特定するための外
接枠情報の間に、予め定める同値関係が成立するか否か
を調べることにより前記文字要素を同値類に分類するス
テップと、同一の同値類に属する前記文字要素を1つの
文字列の構成要素として抽出するステップとを含み、前
記分類するステップは、前記文字要素に対応した要素を
含む配列を準備し、各前記要素に互いに異なる値を記憶
させるステップと、二つの前記要素の組合わせの全てに
対して、前記二つの要素に対応の前記文字要素が文字列
方向と垂直方向とで異なる基準で定義された互いに近い
という関係を満足するか否かを前記外接枠情報に基づい
判定し、前記関係が満足されたときには所定の規則に
したがって前記二つの要素の値が等しくなるように更新
する処理を繰り返すステップと、前記更新が全て終了し
たことに応答して、その時点での対応の前記要素の値に
基づいて、前記文字要素を同値類に分類するステップと
を含む。
【0010】
【0011】
【作用】請求項1に記載の文字列抽出方法によれば、連
結領域の外接枠情報を得るためには、隣接する2つの
ジタル走査線信号の間で、連結線分領域の連結関係を調
べれば十分である。すべての画像について、各画素の属
する連結領域の情報を保持する必要がない。また、この
ようにして得られた外接枠情報を、数学的に同値類分解
と呼ばれる手法でコンピュータの配列処理を利用して分
類して各文字列の構成要素を抽出する。予め定める同値
関係が成立するか否かは、原画像の傾きからの影響をそ
れほど受けずに定められる。原画像が傾いていたとして
も、この同値関係により同値類に分類する手法によれ
ば、同一の行に存在する連結領域は同じ同値類に分類さ
れ、異なる行に属する連結領域は異なる同値類に分類さ
れる。また、各文字要素の間で同値関係を調べるため、
その結果は処理順序に依存しない。
【0012】請求項2に記載の文字列抽出方法において
は、抽出された文字要素の間に同値関係が成立するか否
かを調べることにより、文字要素が同値類分解と呼ばれ
る手法によってコンピュータの配列処理を利用して分類
され各文字列の構成要素として抽出される。同値関係
は、原画像の傾きに関係なくその成否を調べることがで
きる。原画像が傾いていたとしても、この同値関係によ
り同値類に分類する手法によれば、同一の行に存在する
文字要素は同じ同値類に分類され、異なる行に属する文
字要素は異なる同値類に分類される。また、同値類分解
による処理結果は、処理順序に依存しない。
【0013】
【0014】
【実施例】図13は、本発明を実施するための文字認識
装置のブロック図である。図13を参照して、この文字
認識装置は、画像を走査して連続する複数本のデジタル
走査線信号に変換するための画像入力部1と、画像入力
部1により入力された画像から文字要素を抽出するため
の文字要素抽出部2と、抽出された各文字要素を分析
し、文字列を抽出するための文字列抽出部3と、抽出さ
れた文字列を個別の文字に分離することにより個別の文
字を抽出するための個別文字抽出部4と、予め用意され
た文字標準パターン8と、抽出された個別文字と文字標
準パターン8とをマッチングすることにより、入力され
た画像に含まれる個別の文字を認識するための文字マッ
チング部5と、文字マッチングにより得られた文字の認
識結果に対し、必要な修正や整形を加えるための認識結
果後処理部6と、後処理がされた認識結果を、使用者が
可読な形に変換して出力するための最終結果出力部7と
を含む。
【0015】この文字認識装置は、コンピュータにより
実現される。そして、画像入力部1はスキャナにより、
最終結果出力部7はディスプレイにより、文字要素抽出
部2と文字列抽出部3と個別文字抽出部4と文字マッチ
ング部5と文字標準パターン8と認識結果後処理部6と
はすべて中央処理装置で実行されるプログラムにより実
現される。
【0016】図14を参照して、文字要素抽出部2は、
画像入力部1から入力される少なくとも1ライン分の画
像を記憶するための画像メモリ21と、画像メモリ21
に記憶された現在処理中のライン上の連結領域を検出
し、現ライン上の連結領域に関する情報を出力するため
の現ライン連結領域抽出部22と、現ライン連結領域抽
出部22により抽出された情報を格納し、次のラインに
対する処理のために一時記憶しておくための前ライン連
結領域メモリ24と、現ライン連結領域抽出部22によ
り抽出された現ライン上の連結領域に関する情報と、前
ライン連結領域メモリ24に格納された1行前のライン
上の連結領域に関する情報に基づき、前ラインと現ライ
ンとの間の連結領域の連結関係をチェックし、互いに連
結関係にある、ライン上の連結領域に外接する長方形を
統合する処理を行なうための、連結関係チェック部23
と、連結関係チェック部23によって検出された、画像
上の連結領域に外接する長方形を特定するための座標を
記憶するとともに、処理途中で、それ以上他の領域と連
結することがないと判断された連結領域を表わす情報を
文字要素として出力するための外接長方形座標メモリ2
5とを含む。
【0017】文字列抽出部3は、外接長方形座標メモリ
25から与えられる文字要素の情報を順次記憶するため
の文字要素メモリ31と、文字要素メモリ31に記憶さ
れた文字要素の数と等しい数の要素を有する整数配列を
準備可能なラベルメモリ35と、文字要素メモリ31に
格納された文字要素の数に応じて、ラベルメモリ35内
の整数配列{Sn}の値を初期化するためのラベル初期
化部33と、文字要素メモリ31に格納された文字要素
情報の任意の2つの組合せを取出し、各文字要素間に予
め定める同値関係が成り立つか否かを検査するための同
値関係検査部32と、同値関係検査部32によって同値
関係が成り立つと判断された文字要素間について、ラベ
ルメモリ35に格納された、各文字要素に対応するラベ
ルの値を予め定める方法に従って更新するためのラベル
更新部36と、文字要素メモリ31に格納された文字要
素のすべての対に対して、同値関係検査が行なわれた
後、ラベルメモリ35内において同じ値のラベルを有す
るような文字要素を同じ文字列に属する文字要素と判断
して文字要素メモリ31から抽出するための同値ラベル
文字要素抽出部34とを含む。
【0018】図13〜図15に示される装置は原理的に
以下のように動作する。画像入力部1は、入力される画
像をスキャンし、複数本の走査線からなる画像信号に変
換して画像メモリ21に順次与える。画像メモリ21は
入力される画像信号のうち少なくとも1走査線分の信号
を順次格納する。現ライン連結領域抽出部22は、画像
メモリ21に格納された1ラインの画像データに基づ
き、処理中のライン上の連結領域を抽出し、抽出された
連結領域を表わす情報を連結関係チェック部23と前ラ
イン連結領域メモリ24とに与える。前ライン連結領域
メモリ24には、1ライン前の連結領域を表わす情報が
格納されている。
【0019】連結関係チェック部23は、現ライン連結
領域抽出部22から与えられる現ライン上の連結領域を
表わす情報と、前ライン連結領域メモリ24に格納され
ている1ライン前の連結領域を表わす情報とに基づき、
現ラインと前ラインとに含まれる連結領域の間に連結関
係があるか否かをチェックする。チェックの結果連結関
係があると判断された場合には、外接長方形座標メモリ
25に格納されている、前ラインの連結領域に外接する
長方形の座標に所定の処理を施し、現ライン連結領域を
前ラインまでの連結領域と統合する。この統合処理の詳
細については後述する。処理の途中で、外接長方形座標
メモリ25に格納されている、前ラインまでの連結領域
のうち現ライン上の連結領域のいずれとも連結関係にな
いものについては、外接長方形座標メモリ25はこれを
1つの文字要素としてその情報を文字要素装置31に与
える。すべての画像に対する読込と以上の処理が終了し
たときには、外接長方形座標メモリ25は、その時点で
格納されている残りの外接長方形座標を文字要素情報と
して出力する。
【0020】文字要素メモリ31は、外接長方形座標メ
モリ25から与えられる文字要素情報を順次記憶する。
ラベル初期化部33は、文字列抽出処理に先立って、ラ
ベルメモリ35に準備された整数配列の値を、後述する
ような方法で初期化する。同値関係検査部32は、文字
要素メモリ31に格納された文字要素のすべての対につ
いて、各文字要素間に予め定める同値関係が成立するか
否かを調べる。同値関係が成立した場合には、ラベル更
新部36は、互いに同値関係にある文字要素に対応して
準備された、ラベルメモリ35内のラベルの値を、所定
の方法によって書換える。この方法については後に詳述
する。
【0021】文字要素メモリ31に格納された文字要素
のすべての対について、互いの間に同値関係が成立する
か否かの判断が終わった後、同値ラベル文字要素抽出部
34は、ラベルメモリ35に格納された各ラベルのう
ち、同一の値を有するラベルに対応する文字要素を、同
一の文字列に属する文字要素であると判断し、文字要素
メモリ31から対応する文字要素を抽出し個別文字抽出
部4に与える。
【0022】個別文字抽出部4は、与えられた文字列領
域を適宜分割して個々の文字を取出し、文字マッチング
部5に与える。文字マッチング部5は、文字標準パター
ン8に予め準備されている標準パターンと、処理対象と
なる文字との間の類似関係をマッチングによりチェック
し、最も類似度の高い標準パターンを、入力された文字
として認識する。認識結果後処理部6は、認識された結
果に対し、必要な修正や成形を加えて最終結果出力部7
に与える。最終結果出力部7は、認識された文字を使用
者に可読な形で出力する。
【0023】本発明にかかる文字列抽出方法は文字列抽
出部3により、文字領域検出方法は文字要素抽出部2に
よりそれぞれ行なわれる。
【0024】文字要素抽出部2、文字列抽出部3は前述
のようにそれぞれコンピュータプログラムによって実現
される。図1は文字列抽出方法を実現するためのプログ
ラムのフローチャートである。図2は、図1に示される
プログラムのうち、画像中の文字要素を取出すための処
理のフローチャートである。
【0025】図1を参照して、ステップS1において、
原画像の原稿スキャンが行なわれる。制御はステップS
2に進む。
【0026】ステップS2においては、入力された原画
像中の文字要素を取出す処理が行なわれる。この処理
は、図2に示されるようなプログラムにより実現され
る。
【0027】図2を参照して、画像中の文字要素を取出
す処理のためのプログラムは、以下のような制御の構造
を有する。以下の説明において、入力画像は横mピクセ
ル、縦nピクセルからなる長方形の画像であるものとす
る。横方向にx軸、縦方向にy軸をとる。以下、この画
像中に認識される、1対の辺がx軸に、他の1対の辺が
y軸に平行な長方形の座標を、(最小のx座標、最小の
y座標)、(最大のx座標、最大のy座標)の2点の組
で表わす。以下、この座標をそれぞれ(sx、sy)、
(ex、ey)と書くものとする。この場合各座標は、
1ピクセルのx軸方向およびy軸方向の各辺の長さを1
としてとったものとする。
【0028】上述の画像中において、2点(0、i)
(m−1、i)を結ぶ、x軸に平行な1ピクセル幅の直
線を考える。この直線をラインiと呼ぶことにする。
【0029】ラインi上の連結領域を、ラインiに含ま
れる隣あった黒点を結んだものと定義する。特許請求の
範囲においては、ラインi上の連結領域を「連結線分領
域」と表現している。また、以下の説明において画像中
の連結領域とは、前述のように画像に含まれる黒点の集
合からなる領域であって、領域に含まれるいかなる2つ
の黒点も、その領域に含まれる他の黒点をたどっていく
ことにより互いに接続されるような領域をいうものと規
約する。
【0030】(1) 図2を参照して、ステップS11
において、画像のライン0上の各連結領域(CL0 j
する)を抽出する。ライン0上の連結領域CL0 j に外
接し、1対の辺がx軸に、他の1対の辺がy軸に平行な
長方形を、連結領域CL0 j が属する長方形とし、その
座標を所定の記憶領域に記憶する。すなわち、 sx=CL0 j の始点x座標 ex=CLo j の終点x座標 sy=CLo j の始点y座標(=0) ey=CL0 j の終点y座標(=0) とする。制御はステップS12に進む。
【0031】(2) ステップS12において、以下の
繰返しを制御するための変数iに初期値「1」がセット
される。制御はS13に進む。
【0032】以下、ステップS13〜S17の処理が、
1≦i≦−1となるiについて順次行なわれる。
【0033】(3) ステップS13において、ライン
i上の各連結領域(CLi j とする)を抽出する。そし
てこの連結領域CLi j を、連結領域CLi j が属する
長方形とする。すなわち、この長方形を特定するための
座標は以下のようになる。
【0034】sx=CLi j の始点x座標 ex=CLi j の終点x座標 sy=CLi j の始点y座標(=i) ey=CLi j の終点y座標(=i) 制御はステップS14に進む。
【0035】(4) ライン(i−1)上の連結領域と
ラインi上の連結領域とについて、互いの連結関係を検
査する。連結関係が成立するか否かの判断は以下のよう
にして行なわれる。ライン(i−1)上の連結領域CL
0の始点、終点の座標をそれぞれ(x00,i−1)、
(x01,i−1)、ラインi上の連結領域CL1の始
点、終点の座標をそれぞれ(x10,i)、(x11,
i)とする。この場合、以下の関係が成り立つ場合に連
結領域CL0とCL1とが連結であると判断すればよ
い。
【0036】x00≦x11かつx10≦x01 ただし、上述の式は、1つの画素と連結関係になること
ができる画素が、その画素の上下および左右の画素のみ
に限られる、いわゆる「4連結」の場合に適用すべき式
である。もしも1つの画素に斜めに隣接する画素もこの
画素と連結になれるものとする、いわゆる「8連結」の
場合には、以下の式による必要がある。
【0037】 x00≦x11+1かつx10≦x01+1 要するに、一方のライン上の連結領域の始点のx座標
が、もう一方のライン上の連係領域の終点のx座標より
も大きくならないという条件が成り立てばよい。この条
件が成り立てば2つの連結領域が互いに連結関係にあ
り、この条件が成り立たない場合にはこれらは連結関係
にはないと判断される。検査の結果互いに連結なライン
(i−1)、ラインi上の連結領域がある場合について
は、その属する長方形を統合する。複数の長方形を統合
する処理とは、以下のようにして新たな長方形の形状を
特定するための座標を定める処理をいう。
【0038】sx=min{統合する長方形のsx} sy=min{統合する長方形のsy} ex=max{統合する長方形のex} ey=max{統合する長方形のey} 上述のように定められる座標を有する(sx、sy)、
(ex、ey)により特定される長方形Rをもって、統
合された長方形とする。そして、これらの連結領域はこ
のようにして得られた共通の長方形Rに属するものとす
る。制御はステップS15に進む。
【0039】(5) ステップS15において、ライン
(i−1)上の各連結領域が属する長方形であって、か
つステップS14の処理の前後を通じて変化しなかった
ものを検出する。このような長方形が存在する場合、こ
の長方形が外接する画像中の連結領域は、ラインiで途
切れていることになる。これ以降の処理でこの連結領域
に連結される他のライン上の連結領域は出現し得ない。
したがってこの長方形を特定するための座標は以降の処
理で変化することはない。そのためこの座標を最終結果
として出力することができる。出力時に、この連結領域
のy方向の境界座標eyに値i−1を代入してもよい。
仮に現在処理中のラインiに黒点が1つも存在しないと
きには、ライン(i−1 )上の各連結領域が属する長方
形はすべて上述の条件に該当し、その座標を出力するこ
とができる。そしてそれ以降、連結領域に外接する長方
形を求めるための処理において、これら長方形を特定す
るための座標を記憶しておく必要はまったくない。制御
はステップS16に進む。
【0040】ステップS16において、変数iの内容が
1インクリメントされる。制御はステップS17に進
む。
【0041】ステップS17において、変数iの値が、
縦方向のピクセル数(総ライン数)と等しいか否かの
判断が行なわれる。判断の答がYESであれば制御はス
テップS18に進むが、それ以外の場合には制御はS1
3に進む。そして、前述のように(3)〜(5)の処理
が該当する変数iについて繰返される。
【0042】(6) ステップS18において、処理の
最後として、ライン(−1)上の黒点が属する長方形
の座標を出力する。この場合、この長方形の座標値ey
の値は−1となる。
【0043】以上のように図2に示されるようなフロー
に従って動作するプログラムを用いることにより、画像
中の各連結領域に外接する長方形の形状を特定するため
の座標を求めることができる。この場合、処理のために
必要な画像情報は、現在着目しているラインおよびその
1つ前のラインに含まれる各点についての情報のみであ
る。そして、2つ前のライン以前のラインに含まれる画
像中の点についての情報は一切不要である。そのため、
この方法によれば文字領域を検出する際に必要な記憶容
量を、従来のようにすべての画像についての情報を記録
する場合と比較してはるかに少なくすることができる。
また、最終結果として得られる外接長方形座標が処理途
中で順次出力されていく。そのため、この最終結果を入
力とする他の処理をこの処理と平行して行なうことが可
能となり、処理全体の速度を向上することも可能であ
る。
【0044】図4〜図6は、図2に示される処理の途中
経過を示す、画像の模式図である。図4を参照して、ラ
イン(i−1)上には、ライン(i−1)上の連結領域
(連結線分領域)A、Bが存在する。一方、ラインi上
には、ラインi上の連結領域(連結線分領域)C、D、
Eが存在する。連結領域の定義によれば、連結(線分)
領域A、Cは互いに連結である。また、連結(線分)領
域B、D、Eも互いに連結である。
【0045】図5および図6は、ライン(i−1)上
の、互いに別々の連結領域が属する長方形が、ラインi
に対する処理において統合される様子を示す。図5を参
照して、ライン(i−1)上の連結領域A、Bは共通の
長方形R1に属する。またライン(i−1)上の連結領
域Cは、長方形R1と異なる長方形R2に属する。
【0046】図6を参照して、ラインi上に連結(線
分)領域Dが存在するものとする。連結(線分)領域D
は、ライン(i−1)上の連結(線分)領域B、Cと連
結である。またこの場合、連結(線分)領域Dが属する
長方形自身は、連結領域Dそれ自身と同じ形である。前
述の処理に従って、ライン(i−1)上の連結領域B、
Cが属する長方形R1、R2と、ラインi上の連結領域
Dが属する長方形(D自身)とを統合することにより、
図6に示される長方形R0が得られる。前述のようにラ
イン(i−1)上の連結領域A、Bは共通の長方形R1
に属するため、連結領域Aも長方形R0に属することに
なる。
【0047】このようにして順次各ライン上の連結領域
と、1ライン前の連結領域との連結関係を調べ、互いの
属する長方形を順次統合していくことにより、画像上の
文字要素が属する領域が分離・結合されていく。したが
って、各連結領域が、その属する長方形に従って分離・
結合されていくことになる。
【0048】図7は、このようにして文字画像を、文字
要素である各連結領域に分離・結合した結果を示す。図
7に示されるように、文字画像「システ」が、その各文
字要素に分割されていく。
【0049】再び図1を参照して、ステップS3〜S5
においては、この発明にかかる文字列抽出方法に従って
文字列を抽出する処理が行なわれる。この処理において
は、ステップS2において取出された各文字要素を、数
学的に「同値類分解」と呼ばれる方法で複数個の同値類
に分類する処理が行なわれる。同値類分解のために、本
実施例の場合には、2つの文字要素について、「互いに
近い」という関係を以下のように定義しておく。ただ
し、この「互いに近い」という関係自身は、必ずしも同
値関係にならない。
【0050】2つの文字要素にそれぞれ長方形a、bが
外接しているものとする。2つの長方形a、bの文字列
方向の中心点間の文字方向の距離をL、長方形a、bの
文字列方向の長さをsa 、sb とする。また、長方形
a、b間の、文字列方向と垂直の方向の中心点間の、文
字列方向と垂直方向における距離をH、長方形a、b
の、文字列方向と垂直方向の長さをそれぞれha 、hb
とする。この場合、2つの文字要素は、以下の式が同時
に成り立つときに、「互いに近い」と定義する。
【0051】L≦max{sa 、sb }*c0 H≦max{ha 、hb }*c1 ただし、c0、c1はそれぞれ定数である。本実施例の
場合、定数c0としては「4」程度、定数c1としては
「0.5」程度を用いた。ただしこの値はあくまで一例
である。
【0052】ステップS3において、整数配列{Sn}
を用意しておく。この整数配列{Sn}の要素の数は、
文字要素の数と同じである。そして、整数配列{Sn}
の各要素の値を、それぞれ互いに異なるように、すなわ
ちi≠jならSi ≠Sj となるように初期化しておく。
たとえば、i番目の要素Siの値をi(i=0、1、
2、…、n)とすればよい。制御はステップS4に進
む。
【0053】ステップS4においては、図3のフローチ
ャートに示す処理が行なわれる。ステップS4Aにおい
て、画像中の、ステップS2によって取出された文字要
素から、2つの、互いに異なる文字要素の組合せを1回
ずつ取出す。i番目の文字要素をCiと表わすことにす
れば、2つの文字要素の組合せは(Ci、Cj)(i、
j=0、1、2、…、n、ただしi≠j)と表わされ
る。ステップS4Bにおいて、この組合せ(Ci、C
j)が、前述の「互いに近い」という関係を満たすか否
かが判断される。判断の答がYESならば制御はステッ
プS4に、それ以外のときはステップS4にそれぞ
れ進む。ステップS4においては、文字要素Ci、C
jに対応する整数配列の要素Si、Sjの値を次のよう
に書換える。
【0054】(a) Si<Sjであれば、整数配列
{Sn}の要素のうち、値がSjの値に等しいものの値
をSiの値に書換える。この場合、Sjの値もSiに書
換える。
【0055】(b) Si>Sjであれば、整数配列
{Sn}の要素のうち、値がSiに等しい要素の値を、
Sjの値に書換える。この場合、Si自身の値もSjに
書換える。
【0056】(c)Si=Sjであれば、何も行なわな
い。続いてステップS4Dにおいて、すべての文字要素
の組合せ(Ci、Cj)について処理が終わったか否か
の判断が行なわれる。判断の答がNOであれば制御は再
びステップS4Aに戻り、さもなければこの部分の処理
は終了し、図1のステップS5の処理に進む。
【0057】ステップS4においては、上述のような場
合分けに従った処理が、すべての文字要素の組合せ
(対)について行なわれる。すべての文字要素の組合せ
について処理をし終わった時点で、整数配列{Sn}の
要素のうち、その値が共通な要素に対応する文字要素
は、同じ文字列に属すると判断してよい。したがって、
ステップS5において、整数配列{Sn}の要素のうち
同じ値を有する要素に対応する文字要素を集めることに
より、文字列を抽出できる。
【0058】上述の関係について若干の説明を付け加え
ておく。2つの文字要素Ci、Cjが「互いに近い」こ
とをCi〜Cjと表わす。ある整数の組n1、n2、
…、nkおよびm1、m2について、次の式に示される
関係が成り立つものとする。
【0059】Cm1〜Cn1〜Cn2〜…〜Cnk〜C
m2 これは、文字要素Cm1とCm2とは必ずしも直接には
「互いに近い」という関係にはないが、一方から、それ
と「互いに近い」という関係にある文字要素を順次辿っ
ていくことによって、他方に到達できることを表わす。
もちろん、Cm1〜Cm2である場合もこれに含まれ
る。このような関係にあるCm1、Cm2を「同じラベ
ルを持つ」と呼ぶものとする。
【0060】定義により、このときCm1からCm2へ
の経路に現われるCn1、Cn2、差Cnkのうちのい
かなる2つの文字要素の組合せもやはり「同じラベルを
持つ」という関係にあることになる。
【0061】文字要素Cm1とCm2とが「同じラベル
を持つ」という関係は、上記の説明中においては、ステ
ップS4における処理が終了したとき、整数配列{S
n}の要素のうち、文字要素Cm1とCm2とに対応す
る要素Sm1、Sm2の値が共通であるということによ
り表わされている。
【0062】また、整数の組i1、i2、…、im、j
1、j2、…、jn、およびi、jについて、以下の2
つの関係が成り立っているものとする。
【0063】Ci1〜Ci2〜…〜Cim〜Ci Cj〜Cj1〜Cj2〜…〜Cjm このことは、ステップS4の処理途中において、Ci
1、Ci2、…、Cimに対応する整数配列{Sn}の
要素の値がCiに対応する要素Siの値に等しく、Cj
1,Cj2、…、Cjmに対応する要素の値がCjに対
応する要素Sjの値に等しいという状態に対応する。
【0064】このとき、Ci〜Cjがわかったとする
と、次の関係が得られる。 Ci1〜Ci2〜…〜Cim〜Ci〜Cj〜Cj1〜C
j2〜…〜Cjm このことは、ステップS4C(図3参照)において、2
つの文字要素Ci、Cjが「互いに近い」という関係を
満たすとき、それらに対応する整数配列{Sn}のう
ち、Si<SjであればSjと同じ値の強さの値をSi
の値に書換え、Si>Sjであれば、Siと同じ値を持
つ要素の値をSjの値に書換えることで表わされてい
る。
【0065】すでに述べたように、「互いに近い」とい
う関係は必ずしも数学的には同値関係ではないが、それ
を用いて定義した「同じラベルを持つ」という関係は同
値関係の一種である。
【0066】上述のように定義した「同じラベルを持
つ」という関係は、数学的には同値関係の一種である。
文字要素を、互いの間でこの同値関係が成り立つか否か
によって分類していく方法は、数学でいう同値類分解と
呼ばれる作業である。同値類分解においては、処理結果
が処理順序によらないという著しい特徴がある。上述の
実施例の場合には、画像中の文字要素が「互いに近い」
かどうかを判定するために、2つの文字要素を取出す順
序がどのようなものであれ、得られる結果は同一であ
る。
【0067】続いてステップS6において、ステップS
5までの処理で抽出された文字列は、文字列方向に適宜
分割することにより、個別の文字を取出す処理が行なわ
れる。制御はステップS7に進む。
【0068】ステップS7においては、ステップS6で
得られた個別の文字と、予め準備されていた文字標準パ
ターン(図3参照)とをマッチングし、処理対象となる
文字と最も類似している文字標準パターンを認識結果と
して得る処理が行なわれる。制御はステップS8に進
む。
【0069】ステップS8においては、ステップS7に
おいて認識された文字に対し、必要な修正や整形を行な
う認識結果後処理が行なわれる。制御はステップS9に
進む。
【0070】ステップS9においては、ステップS8に
よって得られた最終認識結果を、使用者に可読な形、た
とえば印刷文字あるいはディスプレイ表示のような形で
出力する処理が行なわれる。そしてすべての文字につい
てステップS9までの処理が行なわれてこのプログラム
が終了する。
【0071】図8〜図12は、文字要素として画像中の
連結領域をとった場合に、本発明に従った方法によりど
のように文字列が抽出されるかを示す模式図である。以
下の説明中においては、文字要素Ciに対応する、整数
配列{Sn}の要素をSiと表現する。
【0072】図8を参照して、画像中の各文字要素(連
結領域)に与えられるSiが、それぞれ異なった値に初
期化される。この処理はステップS3において行なわれ
る。図8においては、全部で12個の連結領域に0〜1
1という値がそれぞれ割り当てられる。
【0073】図9を参照して、文字要素C0、C3は互
いに近いという関係を満たす。確認のために述べておく
と、前述の定義による「互いに近い」という関係は、画
像上においては、2つの連結領域が属する長方形の間の
距離が所定の値よりも小さい場合に成り立つと考えられ
る。文字要素C0、C3が互いに近いため、図1のステ
ップS4の処理に従い、S0、S3の値が比較される。
この場合はS0<S3が成り立つ。すなわち、前述の条
件でいえば(a)が成立する。そのため、S3と共通の
値を持つSiの値をすべてS0の値に書換える。この場
合、S3に等しい値を持つようなSiは、S3の他には
存在しない。そのため、S0の値(0)に書換えられる
のは、S3のみである。書換えの結果が図9に示されて
いる。
【0074】図10は、引続き行なわれる処理の途中状
態を示す図である。図10の状態となる以前に、文字要
素C0、C1、C3、C4が「互いに近い」という関係
にあることが確認され、それにしたがってSiが書換え
られている。さらに、図10に示されるように、文字要
素C4、C8が「互いに近い」という関係を満たすこと
が確認されたものとする。このとき、S4=0、S8=
7であって、S4<S8が成立する。前述の条件(a)
に従って、S8(=7)に等しい値を持つSiを、すべ
てS4の値で書換える。その結果、図11に示されるよ
うに、画像中の文字列「システム」に含まれる各文字要
素のすべてには、対応する整数として0が割り当てられ
る。
【0075】図12を参照して、画像中の「システム」
という文字列中の文字要素と、「メニュー」という文字
列中の文字要素とのいずれの間にも、「互いに近い」と
いう関係が成立しない。したがって、この画像中の任意
の2つの文字要素のすべての組合せについて上述の処理
を行なうことにより、最終結果として図12に示される
ようなSiの値を得ることができる。画像中のすべての
文字要素は、前述のようにその文字要素に対応付けられ
ている整数の値によって分類される。図8〜図12に示
される例では、各文字要素は対応する整数として0を持
つものと2を持つものとに分類され、それぞれ「システ
ム」、「メニュー」という文字列となる。
【0076】ステップS6以下においては、図12に得
られた結果の文字列から、その文字列を適宜分割するこ
とによって個別の文字を取出し、それぞれの文字をマッ
チングによって認識するという処理が行なわれる。
【0077】以上述べたようにこの発明にかかる文字列
抽出方法においては、同値類分解という手法によって文
字列の抽出が行なわれた。同値類分解による処理結果は
その処理順序には依存せず、安定した処理結果を得るこ
とができる。また、隣接する文字要素の間では、前述の
「互いに近い」という関係に対して、画像の傾きが与え
る影響はごく微小である。画像の傾きが上述の文字列抽
出に対して与える影響は小さい。したがって、従来技術
による方法よりも、入力画像の傾きの広い範囲に対し
て、適性な文字列抽出が行なえるという効果がある。
【0078】なお、この発明が上述の実施例に基づいて
説明されたが、この発明は必ずしも上述の実施例に限定
されるわけではない。たとえば、「互いに近い」という
関係の定義は、上述の説明中に挙げたものに限らず、2
つの文字要素が異なる文字列に属するときには一般に成
り立たず、2つの文字要素が同一の文字列に属しており
かつ隣合っているときに一般に成り立つようものであ
ればどのように定めてもよい。
【0079】また、上述の整数配列の要素の値の書換え
方法も、説明したような場合分け(a)〜(c)に挙げ
られたもののみに限らない。たとえば、(a)〜(c)
に挙げられた式中において、記号「>」と「<」とを入
れ換えても差し支えない。
【0080】以上この発明を実施例に基づいて詳細に説
明したが、この発明は上述の実施例には限定されず、こ
れ以外にも様々な変形を加えて実施可能であることはい
うまでもない。
【0081】
【発明の効果】以上のように請求項1に記載の文字列抽
出方法によれば、画像中の連結領域に外接する枠を特定
するための情報が、隣接する2つの走査線信号に含まれ
る連結線分領域の連結関係を調べることによって得られ
る。従来のように画像上のすべての画素につきどの連結
領域に属するかを記憶しておく必要がなく、必要な記憶
容量を大幅に減少することができる。また、得られた外
接枠情報の間に同値関係を成立するか否かをコンピュー
タの配列処理を用いて調べることにより、画像に含まれ
る連結領域が同値類に分類され、同一の同値類に属する
連結領域が1つの文字列を構成する要素として抽出され
る。この分類過程は処理順序に関係なく一定の結果が得
られ、原画像が傾いていても安定した処理結果を得るこ
とができる。その結果、少ない記憶容量で、安定した処
理結果を得ることができる、文字列抽出方法を提供する
ことができる。
【0082】請求項2に記載の文字列抽出方法によれ
ば、抽出された文字要素の間に、予め定める同値関係が
成立するか否かをコンピュータの配列処理を用いて調べ
ることにより、文字要素を同値類に分類する処理が行な
われる。そして、同一の同値類に属する文字要素が、1
つの文字列を構成する要素として抽出される。同値関係
の正否に基づいて同値類に分類する処理は、その処理順
序に依存せず、原画像が傾いていても安定した処理結果
を得ることができる。
【0083】
【図面の簡単な説明】
【図1】図1は、本発明にかかる文字列抽出方法を行な
うためのプログラムのフローチャートである。
【図2】図2は、図1に示される、画像中の文字要素を
取出す処理を実現するためのプログラムのフローチャー
トである。
【図3】図3は、図1に示される文字列を取出す処理を
実現するためのプログラムのフローチャートである。
【図4】図4は、画像中の2つの走査線に含まれるライ
ン上の連結領域間の連結関係を示す模式図である。
【図5】図5は、異なる連結領域に含まれる、ライン上
の連結領域およびそれら連結領域が属する長方形を示す
模式図である。
【図6】図6は、図5に示される2つの連結領域の属す
る長方形が、ラインi上の連結領域Dの存在によって互
いに長方形R0に融合される状態を示す模式図である。
【図7】図7は、画像から抽出される連結領域を示す模
式図である。
【図8】図8は、画像上の各連結領域に割り当てられる
整数値が初期化された状態を示す模式図である。
【図9】図9は、文字要素C0、C3の間に「互いに近
い」という関係が成り立つ場合の、文字列抽出の途中経
過を示す模式図である。
【図10】図10は、文字要素C4、C8が「互いに近
い」という関係を満たす場合の、画像の模式図である。
【図11】図11は、文字要素C4、C8に「互いに近
い」という関係が成り立った場合に、各文字要素に割り
当てられている整数値を更新した後の状態を示す模式図
である。
【図12】図12は、本発明にかかる文字列抽出方法に
より、文字列が抽出された結果を示す模式図である。
【図13】図13は、本発明にかかる文字列抽出方法を
適用した、文字認識装置のブロック図である。
【図14】図14は、文字要素抽出部2のより詳細な模
式的ブロック図である。
【図15】図15は、文字列抽出部3の、より詳細な模
式的ブロック図である。
【符号の説明】
1 画像入力部 2 文字要素抽出部 3 文字列抽出部 4 個別文字抽出部 5 文字マッチング部 6 認識結果後処理部 7 最終結果出力部 8 文字標準パターン
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中村 安久 大阪市阿倍野区長池町22番22号 シャー プ株式会社内 (72)発明者 桑田 みな子 大阪市阿倍野区長池町22番22号 シャー プ株式会社内 (72)発明者 竹原 和宏 大阪市阿倍野区長池町22番22号 シャー プ株式会社内 (56)参考文献 特開 平3−198177(JP,A) 特開 昭63−37489(JP,A) 特開 平3−144873(JP,A) 特開 昭63−204479(JP,A) 特開 平3−150675(JP,A)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像を読取り、連続する複数本のデジタ
    ル走査線信号に変換するステップと、 順次与えられる前記デジタル走査線信号を順次分析し、
    先行する第1のデジタル走査線信号より以前の前記デジ
    タル走査線信号により表現される連結領域に外接する、
    外接枠の形状を特定するための外接枠情報を得て、前記
    外接枠情報を保持するステップと、 第1のデジタル走査線信号の直後に後続する第2のデジ
    タル走査線信号に含まれる連結線分領域を検出し、前記
    連結線分領域と連結関係にある前記連結領域の前記外接
    枠情報を更新するとともに、前記連結線分領域のいずれ
    とも連結関係にない前記連結領域の存在を検出するたび
    に、その前記外接枠情報を逐次出力するステップと、 前記画像の終了を検出して、保持されている残りの前記
    外接枠情報を出力するステップと、 任意の2つの前記外接枠情報の間に、予め定める同値関
    係が成立するか否かを調べることにより、各前記外接枠
    情報に内接する前記連結領域を同値類に分類するステッ
    プと、 同一の同値類に属する前記連結領域を1つの文字列の構
    成要素として抽出するステップとを含み、 前記分類するステップは、 前記連結領域に対応した要素を含む配列を準備し、各前
    記要素に互いに異なる値を記憶させるステップと、 二つの前記要素の組合わせの全てに対して、前記二つの
    要素に対応の前記連結領域が文字列方向と垂直方向とで
    異なる基準で定義された互いに近いという関係を満足す
    るか否かを前記外接枠情報に基づいて判定し、前記関係
    が満足されたときには所定の規則にしたがって前記二つ
    の要素の値が等しくなるように更新する処理を繰り返す
    ステップと、 前記更新が全て終了したことに応答して、その時点での
    対応の前記要素の値に基づいて、前記連結領域を同値類
    に分類するステップとを含む、文字列抽出方法。
  2. 【請求項2】 画像から文字要素を抽出するステップ
    と、 抽出された各前記文字要素に外接する、外接枠の形状を
    特定するための外接枠情報の間に、予め定める同値関係
    が成立するか否かを調べることにより前記文字要素を同
    値類に分類するステップと、 同一の同値類に属する前記文字要素を1つの文字列の構
    成要素として抽出するステップとを含み、 前記分類するステップは、 前記文字要素に対応した要素を含む配列を準備し、各前
    記要素に互いに異なる値を記憶させるステップと、 二つの前記要素の組合わせの全てに対して、前記二つの
    要素に対応の前記文字要素が文字列方向と垂直方向とで
    異なる基準で定義された互いに近いという関係を満足す
    るか否かを前記外接枠情報に基づいて判定し、前記関係
    が満足されたときには所定の規則にしたがって前記二つ
    の要素の値が等しくなるように更新する処理を繰り返す
    ステップと、 前記更新が全て終了したことに応答して、その時点での
    対応の前記要素の値に基づいて、前記文字要素を同値類
    に分類するステップとを含む、文字列抽出方法。
JP3241486A 1991-09-20 1991-09-20 文字列抽出方法 Expired - Fee Related JP3058489B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3241486A JP3058489B2 (ja) 1991-09-20 1991-09-20 文字列抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3241486A JP3058489B2 (ja) 1991-09-20 1991-09-20 文字列抽出方法

Publications (2)

Publication Number Publication Date
JPH0581474A JPH0581474A (ja) 1993-04-02
JP3058489B2 true JP3058489B2 (ja) 2000-07-04

Family

ID=17075034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3241486A Expired - Fee Related JP3058489B2 (ja) 1991-09-20 1991-09-20 文字列抽出方法

Country Status (1)

Country Link
JP (1) JP3058489B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3471578B2 (ja) 1997-08-29 2003-12-02 シャープ株式会社 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム

Also Published As

Publication number Publication date
JPH0581474A (ja) 1993-04-02

Similar Documents

Publication Publication Date Title
US20200151444A1 (en) Table Layout Determination Using A Machine Learning System
CN110942074B (zh) 字符切分识别方法、装置、电子设备、存储介质
EP0543593B1 (en) Method for determining boundaries of words in text
JP5355621B2 (ja) 光学式文字認識用に画像を前処理するための方法およびシステム
RU2621601C1 (ru) Устранение искривлений изображения документа
US11915465B2 (en) Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks
JPH1196301A (ja) 文字認識装置
JP3058489B2 (ja) 文字列抽出方法
CN113065404B (zh) 基于等宽文字片段的火车票内容检测方法与系统
JPH08320914A (ja) 表認識方法および装置
US11270146B2 (en) Text location method and apparatus
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及系统
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2918666B2 (ja) 文字画像切出し方法
JPH09305707A (ja) 画像抽出方式
JP3972546B2 (ja) 画像処理装置および画像処理方法
JP3020662B2 (ja) 文字行切り出し装置及び文字認識装置
JP2977230B2 (ja) 文字切り出し方法
JPH11316797A (ja) 文書画像の領域識別方法および装置
JPS6343788B2 (ja)
JP2899356B2 (ja) 文字認識装置
JP2613211B2 (ja) 画像入力装置
JP4869364B2 (ja) 画像処理装置および画像処理方法
JPH05233791A (ja) 画像形成装置用のテンプレート自動作成装置及びそれを用いた画質改善装置
JP3226355B2 (ja) 認識結果評価方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080421

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees