JPS62173578A - 情景画像中の文字認識方式 - Google Patents
情景画像中の文字認識方式Info
- Publication number
- JPS62173578A JPS62173578A JP61013906A JP1390686A JPS62173578A JP S62173578 A JPS62173578 A JP S62173578A JP 61013906 A JP61013906 A JP 61013906A JP 1390686 A JP1390686 A JP 1390686A JP S62173578 A JPS62173578 A JP S62173578A
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- character candidate
- candidate area
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 abstract description 19
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、光文字認識装置(以下OC1’Lという:
0pHcal Character 几eade
r ) ic関するもので、現状の紙上の文字だけを読
み取り対象としていたものを、看板等の3次元空間中の
文字で読み増り対象を拡張する情景画像中の文字認識方
式に関するものである。
0pHcal Character 几eade
r ) ic関するもので、現状の紙上の文字だけを読
み取り対象としていたものを、看板等の3次元空間中の
文字で読み増り対象を拡張する情景画像中の文字認識方
式に関するものである。
この発明以前に存在する最も近い技術としては昭和58
年度電子通信学会総合全国大会p 5−23゜1152
、 ″′複雑背景からの特定文字領域の抽出法”記載
の技術がある。この従来技術では、まず文字を含む情景
の濃淡画像に対して、二次微分フィルタを作用させ、固
定しきい値で2値化する。
年度電子通信学会総合全国大会p 5−23゜1152
、 ″′複雑背景からの特定文字領域の抽出法”記載
の技術がある。この従来技術では、まず文字を含む情景
の濃淡画像に対して、二次微分フィルタを作用させ、固
定しきい値で2値化する。
次に、2値化により得られる連続した白画素または黒画
素から領域を形成し、各領域の寸法と面積をチェックし
て特定の文字らしい領域゛を求めた後に、それらの並び
方を調べて特定文字列らしい列を求めるものである。こ
の従来技術では、二次微分フィルタを作用させているた
めk、ノイズを強調し易いという欠点があった。また二
次微分フィルタを作用させた後、固定のしきい値で2値
化を行っているために、領域が必要以上に増加したり、
必要な情報の欠落を招くといった不安定性の欠点があっ
た。また領域の寸法や面積で文字らしい領域を選んでい
るため1文字の大きさや出現する文字種類に関する知識
がない場合には適用困難であった。また個別の文字を切
り出て方法に関しての記載がなかった。
素から領域を形成し、各領域の寸法と面積をチェックし
て特定の文字らしい領域゛を求めた後に、それらの並び
方を調べて特定文字列らしい列を求めるものである。こ
の従来技術では、二次微分フィルタを作用させているた
めk、ノイズを強調し易いという欠点があった。また二
次微分フィルタを作用させた後、固定のしきい値で2値
化を行っているために、領域が必要以上に増加したり、
必要な情報の欠落を招くといった不安定性の欠点があっ
た。また領域の寸法や面積で文字らしい領域を選んでい
るため1文字の大きさや出現する文字種類に関する知識
がない場合には適用困難であった。また個別の文字を切
り出て方法に関しての記載がなかった。
一方、個別の文字を切り出す方法に関しては、従来の紙
上の文字を読み取り対象としたOCRへの適用を目指し
て、いくつかの従来技術があるが、(例えば、信学論V
ol J 、68−DA611 、 P 1899−
1909(1985,11)の「横書き日本文書におけ
る個別文字の抽出」がある)いずれも新聞や書籍等のよ
うに白地に黒い文字が存在していて、文字は文字列を構
成していることを前提としている。すなわち、黒画素だ
けに注目し文字列をまず検出して文字列間のピッチを求
め、このピッチに基づいて文字サイズを推定して個別に
文字を切り出す、というものであった〇 〔発明が解決しようとする問題点〕 このような従来の技術では、情景中の文字のように、文
字が白地に黒で書かれていなかったり、文字列を構成し
ていなかりたり、文字サイズが不定で変動が大である対
象には対応できないという問題点があった。
上の文字を読み取り対象としたOCRへの適用を目指し
て、いくつかの従来技術があるが、(例えば、信学論V
ol J 、68−DA611 、 P 1899−
1909(1985,11)の「横書き日本文書におけ
る個別文字の抽出」がある)いずれも新聞や書籍等のよ
うに白地に黒い文字が存在していて、文字は文字列を構
成していることを前提としている。すなわち、黒画素だ
けに注目し文字列をまず検出して文字列間のピッチを求
め、このピッチに基づいて文字サイズを推定して個別に
文字を切り出す、というものであった〇 〔発明が解決しようとする問題点〕 このような従来の技術では、情景中の文字のように、文
字が白地に黒で書かれていなかったり、文字列を構成し
ていなかりたり、文字サイズが不定で変動が大である対
象には対応できないという問題点があった。
この発明の目的は、情景画像中の文字線に対応する箇所
を領域として安定に検出するとともに、文字の濃度2文
字列や文字サイズ等の知識がない場合でも前述の領域に
基づき文字を切り出し、認識を行う方式を提供すること
にある。
を領域として安定に検出するとともに、文字の濃度2文
字列や文字サイズ等の知識がない場合でも前述の領域に
基づき文字を切り出し、認識を行う方式を提供すること
にある。
この発明にかかる情景画像中の文字認識方式は、対象と
する画像中の文字線に対応する箇所を検出するために、
画像を複数個のブロックに分割し、各グミツク毎釦2値
化のしきい値を決定し、各フロック間でしきい値の補間
を行った後に画素毎のしきい値を求めてから2値化を行
い、連続した白画素または黒画素に識別番号を付与して
識別領域を形成する。さらに各識別領域の包含関係、背
景や穴候補であるか否か等のトポロジカルな特性に基づ
いて、切り出し順序を決め、この順序に従って領域の近
傍を調べ、注目している領域に近い濃度をもつ領域を求
め、得られた領域群の全ての組合せについてそれらの外
接矩形枠形状により文字ら乙さを評価し、文字らしい領
域群をOCRの文字認識アルゴリズムにかげ、正読可能
か否かで、文字か否かの判定を行うとともに1文字認識
結果を得るようにしたものである。
する画像中の文字線に対応する箇所を検出するために、
画像を複数個のブロックに分割し、各グミツク毎釦2値
化のしきい値を決定し、各フロック間でしきい値の補間
を行った後に画素毎のしきい値を求めてから2値化を行
い、連続した白画素または黒画素に識別番号を付与して
識別領域を形成する。さらに各識別領域の包含関係、背
景や穴候補であるか否か等のトポロジカルな特性に基づ
いて、切り出し順序を決め、この順序に従って領域の近
傍を調べ、注目している領域に近い濃度をもつ領域を求
め、得られた領域群の全ての組合せについてそれらの外
接矩形枠形状により文字ら乙さを評価し、文字らしい領
域群をOCRの文字認識アルゴリズムにかげ、正読可能
か否かで、文字か否かの判定を行うとともに1文字認識
結果を得るようにしたものである。
この発明においては、画像を複数個のブロックに分割し
て画像の局所情報に基づき適応的に2値化を行い、さら
に各領域のトポロジカル的特性に基づいて切り出しの順
序を決定し、近傍に存在する同じような濃度の領域から
外接矩形枠の形状枠情報に基づき文字候補を切り出し、
0CRKよって最終的判定を行う。
て画像の局所情報に基づき適応的に2値化を行い、さら
に各領域のトポロジカル的特性に基づいて切り出しの順
序を決定し、近傍に存在する同じような濃度の領域から
外接矩形枠の形状枠情報に基づき文字候補を切り出し、
0CRKよって最終的判定を行う。
第1図はこの発明の一実施例を示す図であり、1はテレ
ビカメラ等の入力部、2は画像格納用メモリ、3は2値
化回路、4はしきい値および2値画偉格納用メモリ、5
はしきい値補開演算回路、6は領域番号決定回路、7は
領域番号格納用メモリ、8はコントラスト評価回路、9
は領域特性計算回路、10は領域特性格納用メモリ、1
1は文字切出し回路、12は文字候補用バッファ、13
は文字認識部(OCR)、14は出力部である。
ビカメラ等の入力部、2は画像格納用メモリ、3は2値
化回路、4はしきい値および2値画偉格納用メモリ、5
はしきい値補開演算回路、6は領域番号決定回路、7は
領域番号格納用メモリ、8はコントラスト評価回路、9
は領域特性計算回路、10は領域特性格納用メモリ、1
1は文字切出し回路、12は文字候補用バッファ、13
は文字認識部(OCR)、14は出力部である。
なお、2,4,7.10等は単にメモリという。
この動作は、まず入力部1から文字を含む情景を濃淡画
*(濃度は8 bit =256レベル程度)として入
力し、メモリ2に格納する。メモリ2はMXN画素(M
、Nは512画素程度)から構成される。次に2値化回
路3およびしきい値補開演算回路5により2値化を行う
。
*(濃度は8 bit =256レベル程度)として入
力し、メモリ2に格納する。メモリ2はMXN画素(M
、Nは512画素程度)から構成される。次に2値化回
路3およびしきい値補開演算回路5により2値化を行う
。
第2図はこの発明における2値化法を説明する図で、2
1は原画、22は固定しきい値による2値化結果、23
はブロック分割、24はしきい値の補間なしの2値化結
果、25はしきい値のブロック間補間、26はこの発明
の2値化結果を示す。
1は原画、22は固定しきい値による2値化結果、23
はブロック分割、24はしきい値の補間なしの2値化結
果、25はしきい値のブロック間補間、26はこの発明
の2値化結果を示す。
第2図で、原画21に照明条件の影響等により画像全体
に濃度ムラや勾配があると、固定しきい値で2値化する
と2値化結果22のように正確に文字線を抽出できない
。そこでフロック分割23を行い、m X n (m<
M、 n <N )画素のプe17りに原画21を分
割し、各ブロック毎にしきい値を決定する。各しきい値
は白、黒2つのクラスに分離する2クラスの問題として
とらえ最もクラス間分散が大となる濃度をしきい値とす
る判別分析法が良好な結果を与える。各ブロックのしき
い値でそのまま2値化を行うと、2値化結果24のよう
にブロック境界で不連続がおこるので、しきい値のブロ
ック間補間25を行い画素毎にしきい値を決定すれば滑
らかな2値化結果26が得られる。
に濃度ムラや勾配があると、固定しきい値で2値化する
と2値化結果22のように正確に文字線を抽出できない
。そこでフロック分割23を行い、m X n (m<
M、 n <N )画素のプe17りに原画21を分
割し、各ブロック毎にしきい値を決定する。各しきい値
は白、黒2つのクラスに分離する2クラスの問題として
とらえ最もクラス間分散が大となる濃度をしきい値とす
る判別分析法が良好な結果を与える。各ブロックのしき
い値でそのまま2値化を行うと、2値化結果24のよう
にブロック境界で不連続がおこるので、しきい値のブロ
ック間補間25を行い画素毎にしきい値を決定すれば滑
らかな2値化結果26が得られる。
ブロック間補間25は線形補間で十分良い結果を与える
。
。
ブロック分割23の中心の濃度をθ28.θ1.・・・
・・・θ1ff1+・・・・・・Q+ll+・・・・・
・Qnmとし、中心間で線形補間を行う。第2図は一番
上の列と、下の列の線形補間の一部を示している。
・・・θ1ff1+・・・・・・Q+ll+・・・・・
・Qnmとし、中心間で線形補間を行う。第2図は一番
上の列と、下の列の線形補間の一部を示している。
92図で説明した2値化のしきい値を求めしきい値をメ
モリ4に格納し、メモリ2の対応する原画21の画素の
濃度と比較して2値化を行いメモリ4に格納する◎ 次に、領域番号決定回路6により、第3図に示す左側の
画像に連続した白画素または黒画素に画像の左上からラ
スク方式に#&別番号を付与していき、結果として右側
に示す画像の領域分割結果つまり、識別番号1〜5のう
ち同じものが付された領域をそれぞれ識別領域としてメ
モ’)TK格納する。このようにして得られた領域分割
結果には、第2図のブロック分割23により原1[1i
i21の濃度が一様の部分も強制的にしきい値を定めて
いるために、ノイズ状の微小領域が一般には多数混在し
ている。
モリ4に格納し、メモリ2の対応する原画21の画素の
濃度と比較して2値化を行いメモリ4に格納する◎ 次に、領域番号決定回路6により、第3図に示す左側の
画像に連続した白画素または黒画素に画像の左上からラ
スク方式に#&別番号を付与していき、結果として右側
に示す画像の領域分割結果つまり、識別番号1〜5のう
ち同じものが付された領域をそれぞれ識別領域としてメ
モ’)TK格納する。このようにして得られた領域分割
結果には、第2図のブロック分割23により原1[1i
i21の濃度が一様の部分も強制的にしきい値を定めて
いるために、ノイズ状の微小領域が一般には多数混在し
ている。
このため、コントラスト評価回路8により、第4図のよ
うにコントラストの評価を行い、ノイズ領域を除去する
。
うにコントラストの評価を行い、ノイズ領域を除去する
。
第4図で、31は注目領域、32は前記注目領域31の
外接矩形枠、33は前記注目領域31を囲む領域のうち
外接矩形枠32に含まれる範囲である。コントラストの
評価は、注目領域31と範囲33のそれぞれ平均濃度L
H* L2を求め、ΔL”lL+−Ltlで定義される
フントラストΔLがΔしくθL(θ、はしきい値)を充
せば、ノイズ領域と判定することKより行う。θ、は人
間がほとんど識別不能のレベル差に設定する。コントラ
スト評価回路8でノイズと判定された領域は、メモリ4
中の対応する画素の値を反転(白ならば黒、黒ならば白
に対応する値に変換する)する。このようにすれば結果
としてノイズ領域の除去が行える。
外接矩形枠、33は前記注目領域31を囲む領域のうち
外接矩形枠32に含まれる範囲である。コントラストの
評価は、注目領域31と範囲33のそれぞれ平均濃度L
H* L2を求め、ΔL”lL+−Ltlで定義される
フントラストΔLがΔしくθL(θ、はしきい値)を充
せば、ノイズ領域と判定することKより行う。θ、は人
間がほとんど識別不能のレベル差に設定する。コントラ
スト評価回路8でノイズと判定された領域は、メモリ4
中の対応する画素の値を反転(白ならば黒、黒ならば白
に対応する値に変換する)する。このようにすれば結果
としてノイズ領域の除去が行える。
画像の縁に接していない全ての領域に対して本評価を行
りた後、領域番号決定回路6で再び領域番号を付与し、
メモ!17に格納する。次に、領域特性計算回路9で文
字切り出しに必要な情報を求め。
りた後、領域番号決定回路6で再び領域番号を付与し、
メモ!17に格納する。次に、領域特性計算回路9で文
字切り出しに必要な情報を求め。
メモリ10に格納する。
第5図に示すように、メモリ10の構成は2次元の配列
状になっており、41は領域番号、42〜45は各々領
域の上・下・左・右端の座標、46は背景か否かの判定
、41はトポロジカル的特性、48は深さの格納を行う
それぞれの場所であり、49はその領域を包含している
領域番号の格納場所である。
状になっており、41は領域番号、42〜45は各々領
域の上・下・左・右端の座標、46は背景か否かの判定
、41はトポロジカル的特性、48は深さの格納を行う
それぞれの場所であり、49はその領域を包含している
領域番号の格納場所である。
まず、第4図に示すように、全領域の外接矩形枠32の
上・下・左・右端の画像中の座標(上。
上・下・左・右端の画像中の座標(上。
下端はY、左、右端はX座標)を求め、メモリ10の場
所42〜45に格納する。次に、場所42〜451C格
納された上・下・左・右端のいずれかが画像の縁と一致
している場合には背景と判定しく仮に文字の一部が画像
中に現われていても認識は不可能である)、メモリ10
の場所46に背景を示す値(例えば1)を格納し、一致
しない場合は文字候補を示す値(例えばO)を格納する
。
所42〜45に格納する。次に、場所42〜451C格
納された上・下・左・右端のいずれかが画像の縁と一致
している場合には背景と判定しく仮に文字の一部が画像
中に現われていても認識は不可能である)、メモリ10
の場所46に背景を示す値(例えば1)を格納し、一致
しない場合は文字候補を示す値(例えばO)を格納する
。
文字の切り出しは、文字の濃度情報や文字列情報が使用
できない条件が一般的であるので、各文字候補領域(場
所46の値がOの領域)のトポロジカル的特性を用いて
切出しの順序を定め、OCRにデータとしてわたす。領
域のトポロジカル的特性を考える必要のある例を、第6
図に示す。
できない条件が一般的であるので、各文字候補領域(場
所46の値がOの領域)のトポロジカル的特性を用いて
切出しの順序を定め、OCRにデータとしてわたす。領
域のトポロジカル的特性を考える必要のある例を、第6
図に示す。
第6図(a) 、 (b)で、51は注目領域、52
は前記注目領域51の外接矩形枠、53は外接範囲(第
4図の33と同じ定義)、54は穴、55は前記注目領
域51を囲む領域、56は前記領域55の外接矩形枠、
5Tは前記領域55の外接範囲である。
は前記注目領域51の外接矩形枠、53は外接範囲(第
4図の33と同じ定義)、54は穴、55は前記注目領
域51を囲む領域、56は前記領域55の外接矩形枠、
5Tは前記領域55の外接範囲である。
第6図<a)で、穴54は外接範囲53とほぼ同じ濃度
をもつので、注目領域51が文字線に対応していると考
えられるが、同じ推論を同図(b) K適用すると、注
目領域51と外接範囲51が同じ濃度をもつと、本来文
字線に対応している注目領域51・が穴と判定されてし
まう。そこで領域のトポロジカル関係を考え、それによ
り切り出て順序(プライオリティ)を決定する。すなわ
ち、領域の包含関係および穴候補か否か(第6図で説明
した定義)により、■他の文字候補領域の真部分集合に
なっていない、■真部分集合罠なっているが穴候補でな
い、■真部分集合で穴候補でもある、03段階を導入し
、■から■の屓で文字を切り出し、OC几13にかける
。ところで、■と■に関しては第6図(b)の注目領域
51と領域55の関係のように、同じ■でも領域55の
方が包含されている集合の数(深さ)が1少ない。
をもつので、注目領域51が文字線に対応していると考
えられるが、同じ推論を同図(b) K適用すると、注
目領域51と外接範囲51が同じ濃度をもつと、本来文
字線に対応している注目領域51・が穴と判定されてし
まう。そこで領域のトポロジカル関係を考え、それによ
り切り出て順序(プライオリティ)を決定する。すなわ
ち、領域の包含関係および穴候補か否か(第6図で説明
した定義)により、■他の文字候補領域の真部分集合に
なっていない、■真部分集合罠なっているが穴候補でな
い、■真部分集合で穴候補でもある、03段階を導入し
、■から■の屓で文字を切り出し、OC几13にかける
。ところで、■と■に関しては第6図(b)の注目領域
51と領域55の関係のように、同じ■でも領域55の
方が包含されている集合の数(深さ)が1少ない。
このように、■と■でけ、領域が何重に包含されている
かKより深さを定義し、深さが浅い程、切り出し順序の
プライオリティを高くする。例えば第6図(b)で外接
範囲57が■とすると、領域55の深さはl、注目領域
51は2であり、領域55の方を先に切り出]°。
かKより深さを定義し、深さが浅い程、切り出し順序の
プライオリティを高くする。例えば第6図(b)で外接
範囲57が■とすると、領域55の深さはl、注目領域
51は2であり、領域55の方を先に切り出]°。
このようにして、領域の切り出し順序が与えられるが、
文字には単一の領域から構成されるものだけでなく、複
数の領域から構成される。いわゆる分離文字が存在する
。従って、近傍にほぼ同じ濃度をもつ領域の組み合せを
考えなければならない。その例を第7図に示す。
文字には単一の領域から構成されるものだけでなく、複
数の領域から構成される。いわゆる分離文字が存在する
。従って、近傍にほぼ同じ濃度をもつ領域の組み合せを
考えなければならない。その例を第7図に示す。
第7図で、61は文字「い」、62は文字「;す」、6
3.64は前記文字61を構成する領域、65゜66は
前記文字62を構成する領域、61は前記領域63の外
接矩形枠、68は組み合せ領域探索範囲、69〜15は
文字候補切り出し結果である。
3.64は前記文字61を構成する領域、65゜66は
前記文字62を構成する領域、61は前記領域63の外
接矩形枠、68は組み合せ領域探索範囲、69〜15は
文字候補切り出し結果である。
いま、領域63に注目しているとすると、外接矩形枠6
7に基づき組み合せ領域探索範囲68を定める。組み合
せ領域探索範囲68は外接矩形枠6Tの中心(対角線の
交点)を中心とし、外接矩形枠67の長辺の長さaのP
倍のPaを一辺とする正方形に定めるとよい。Pは3〜
1o程度の値を目的や出現字種に応じて選択する。組み
合せ領域探索範囲68の中について領域63の平均濃度
L0忙対し、平均濃度りがILLO+≦00を充丁領域
を探す。ここで探す領域は、前述の切り出しプライオリ
ティが領域63のそれ以下のものを対象とする。またθ
0はしきい値である。このようにして第7図のように領
域64と66が得られたとする。一般ICK個の領域が
抽出されると、KC1+よC1+・・・・・・+tCt
通りの組み合せが考えられ、第7図の場合はに=3なの
でsC,+3C,十、C,=7通りの組合せがある。
7に基づき組み合せ領域探索範囲68を定める。組み合
せ領域探索範囲68は外接矩形枠6Tの中心(対角線の
交点)を中心とし、外接矩形枠67の長辺の長さaのP
倍のPaを一辺とする正方形に定めるとよい。Pは3〜
1o程度の値を目的や出現字種に応じて選択する。組み
合せ領域探索範囲68の中について領域63の平均濃度
L0忙対し、平均濃度りがILLO+≦00を充丁領域
を探す。ここで探す領域は、前述の切り出しプライオリ
ティが領域63のそれ以下のものを対象とする。またθ
0はしきい値である。このようにして第7図のように領
域64と66が得られたとする。一般ICK個の領域が
抽出されると、KC1+よC1+・・・・・・+tCt
通りの組み合せが考えられ、第7図の場合はに=3なの
でsC,+3C,十、C,=7通りの組合せがある。
次に1文字であるならば組み合せてできる領域の外接矩
形枠の縦横比rはθt<、rくθhの範囲にある。θ1
.θhは縦横比の下限、上限値であり、字種1字形等に
より定まる値である。この式を満しているか否かを判定
すると、切り出し結果74とT5はかなり横長であり、
文字候補でないと判定される。切り出し結果69〜73
をOC几13にかけると、切り出し結果73以上は文字
ではないので読むことができず、切り出し結果T3だけ
が正、読できる。従って、領域63と64から文字が構
成されていて、その文字は「い」であることがわかる。
形枠の縦横比rはθt<、rくθhの範囲にある。θ1
.θhは縦横比の下限、上限値であり、字種1字形等に
より定まる値である。この式を満しているか否かを判定
すると、切り出し結果74とT5はかなり横長であり、
文字候補でないと判定される。切り出し結果69〜73
をOC几13にかけると、切り出し結果73以上は文字
ではないので読むことができず、切り出し結果T3だけ
が正、読できる。従って、領域63と64から文字が構
成されていて、その文字は「い」であることがわかる。
以上のようにして文字を読あるが、いずれも読めないと
きには、プライオリティの低い領域について同様に調べ
る。全てのプライオリティを調べて、いずれも読めない
とぎは、その領域は文字ではなかったとい5判定結果に
なる。
きには、プライオリティの低い領域について同様に調べ
る。全てのプライオリティを調べて、いずれも読めない
とぎは、その領域は文字ではなかったとい5判定結果に
なる。
以上のような文字切り出し処理を行うためK。
領域特性計算回路9はメモリ10の場所46(第5図)
の値が0の領域について、その包含関係を調べ、前述の
■〜■に対応するl〜3の値を場所47に格納し、場所
47に2か3が格納された領域については、その領域を
包含する領域の場所47の値を調べてこれが1の領域に
到達するまで繰り返しその回数により深さが求まるので
、格納場所48に格納するとともK、その領域を包含し
ている領域の番号を格納場所49に格納する。次に文字
切出し回路11で場所47の値がIの領域から順にメモ
リ7上で、前述の探索を行い、文字候補領域の切り出し
を行い、文字候補用バッファ12に格納する。これをO
C几13で読み、正読か否かの判定結果を文字切出し回
路11に返し、正読の場合は認識結果を出力部14に出
力する。出力部14はディスプレイ、プリンタ等である
。正読でないときは、文字切出し回路11は文字候補用
バッファ12の次の候補をOCI’L13にわたし、全
て候補がな(なればその次の領域は文字でない旨を出力
部14に出力する。
の値が0の領域について、その包含関係を調べ、前述の
■〜■に対応するl〜3の値を場所47に格納し、場所
47に2か3が格納された領域については、その領域を
包含する領域の場所47の値を調べてこれが1の領域に
到達するまで繰り返しその回数により深さが求まるので
、格納場所48に格納するとともK、その領域を包含し
ている領域の番号を格納場所49に格納する。次に文字
切出し回路11で場所47の値がIの領域から順にメモ
リ7上で、前述の探索を行い、文字候補領域の切り出し
を行い、文字候補用バッファ12に格納する。これをO
C几13で読み、正読か否かの判定結果を文字切出し回
路11に返し、正読の場合は認識結果を出力部14に出
力する。出力部14はディスプレイ、プリンタ等である
。正読でないときは、文字切出し回路11は文字候補用
バッファ12の次の候補をOCI’L13にわたし、全
て候補がな(なればその次の領域は文字でない旨を出力
部14に出力する。
文字切出し回路11では場所47の値が3で、格納場所
48の値が最大(最下位のプライオリティ)の領域を調
べ終るまで同様の処理を繰り返す。
48の値が最大(最下位のプライオリティ)の領域を調
べ終るまで同様の処理を繰り返す。
以上のようにして、文字の濃度が予め与えられておらず
、文字列を構成していない情景画像中の文字を読むこと
ができる。
、文字列を構成していない情景画像中の文字を読むこと
ができる。
なお、この発明は3次元空間中に存在する文字の認識の
みならず2次元面の文字のgRをも行うことができるの
は云うまでもない。
みならず2次元面の文字のgRをも行うことができるの
は云うまでもない。
以上説明したようにこの発明は、対象とする画像中の文
字線に対応する箇所を検出するためK。
字線に対応する箇所を検出するためK。
画像を複数個のブロックに分割し、各ブロック毎に適応
的に2値化を行うので、文字線のよ5に背景に対してコ
ントラストが高い個所を領域として確実に抽出でき、ま
た領域のトポロジカル的特性から切り出し頭序を決め、
近傍に存在する同じような濃度の領域を組み合わせて外
接矩形枠の形状を評価して文字候補を切り出し、文字認
識アルゴリズムを適用しているので、文字が存在すれば
必ず正読に達し、文字以上のものは正読できないことか
ら、文字以外と判定できるという利点がある。
的に2値化を行うので、文字線のよ5に背景に対してコ
ントラストが高い個所を領域として確実に抽出でき、ま
た領域のトポロジカル的特性から切り出し頭序を決め、
近傍に存在する同じような濃度の領域を組み合わせて外
接矩形枠の形状を評価して文字候補を切り出し、文字認
識アルゴリズムを適用しているので、文字が存在すれば
必ず正読に達し、文字以上のものは正読できないことか
ら、文字以外と判定できるという利点がある。
応用分野としては、車のナンバープレートの文字、数字
の認識、名札などにより個人名を認識するパトロールロ
ボット、従来のOCRでは取り扱えなかったブック形式
等の文書に書かれた文字認識等に、この発明は広く適用
できるものである。
の認識、名札などにより個人名を認識するパトロールロ
ボット、従来のOCRでは取り扱えなかったブック形式
等の文書に書かれた文字認識等に、この発明は広く適用
できるものである。
第1図はこの発明の一実施例を示すブロック図、第2図
はこの発明で用いる2値化の原理説明図、第3図はこの
発明で用いる領域分割処理の説明図、第4図は領域のフ
ントラストの評価法の説明図、第5図は領域・特性格納
用メモリの構成例の説明図、第6図(a) 、 (b
)は領域のトポロジカル的関係の説明図、第7図は文字
候補の切り出し法の原理説明図である。 図中、1は入力部、2は画像格納用メモリ、3は2値化
回路、4はしきい値および2値画像格納用メモリ、5は
しきい値補間演算回路、6は領域番号決定回路、7は領
域番号格納用メモリ、8はコントラスト評価回路、9は
領域特性計算回路、10は領域特性格納用メモリ、11
は文字切出し回路、12は文字候補用バッファ、13は
文字認識部、14は出力部である。 第1図 第2図 第3図
はこの発明で用いる2値化の原理説明図、第3図はこの
発明で用いる領域分割処理の説明図、第4図は領域のフ
ントラストの評価法の説明図、第5図は領域・特性格納
用メモリの構成例の説明図、第6図(a) 、 (b
)は領域のトポロジカル的関係の説明図、第7図は文字
候補の切り出し法の原理説明図である。 図中、1は入力部、2は画像格納用メモリ、3は2値化
回路、4はしきい値および2値画像格納用メモリ、5は
しきい値補間演算回路、6は領域番号決定回路、7は領
域番号格納用メモリ、8はコントラスト評価回路、9は
領域特性計算回路、10は領域特性格納用メモリ、11
は文字切出し回路、12は文字候補用バッファ、13は
文字認識部、14は出力部である。 第1図 第2図 第3図
Claims (1)
- 2次元面または3次元空間中に存在する文字を認識する
方式において、前記文字を含む情景を濃淡画像として入
力し対象画像を複数個のブロックに分割して各々のブロ
ックにおいて2値化のしきい値を決定し、前記各ブロッ
ク間でしきい値の補間を行い画素毎のしきい値を計算し
た後2値化を行い連続した白画素または黒画素に識別番
号を付与していき結果として識別領域を得、これら各識
別領域の平均濃度と、前記領域を囲む領域で前記識別領
域の外接矩形枠に含まれる外接範囲の平均濃度との差の
絶対値が設定しきい値より小であれば前記外接範囲にそ
の識別領域を統合し、全領域の外接矩形枠の上・下・左
・右端の座標を求め、いずれかが画像の縁と一致すれば
背景、一致しなければ文字候補領域と判定し、前記文字
候補領域について、他の文字候補領域に包含されている
か否かおよび前記文字候補領域を包含している領域の外
接範囲の平均濃度との差が小さい穴候補であるか否かで
包含されていない、包含されているが穴でない、包含さ
れていて穴であるという順に切り出し、プライオリティ
を前記文字候補領域に与え、他の文字候補領域に包含さ
れているかでさらに切り出しプライオリティを与え、こ
の切り出しプライオリティに従いプライオリティの高い
ものから前記文字候補領域の近傍の探索を行い、前記文
字候補領域の切り出しプライオリティ以下の領域でその
領域とほぼ等しい濃度をもつ領域を抽出し、全ての組み
合せについて外接矩形枠の形状により文字候補を選択し
、文字認識アルコリズムにより正読できればその結果を
出力し、正読できなければ他の文字候補領域を読み、文
字候補領域の全てを正読できない場合は、文字以外のも
のに対応していると判定することを特徴とする情景画像
中の文字認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61013906A JPS62173578A (ja) | 1986-01-27 | 1986-01-27 | 情景画像中の文字認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61013906A JPS62173578A (ja) | 1986-01-27 | 1986-01-27 | 情景画像中の文字認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62173578A true JPS62173578A (ja) | 1987-07-30 |
Family
ID=11846214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61013906A Pending JPS62173578A (ja) | 1986-01-27 | 1986-01-27 | 情景画像中の文字認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62173578A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02188891A (ja) * | 1989-01-17 | 1990-07-24 | Daihatsu Motor Co Ltd | 車台刻印番号認識装置における分割2値化処理方法 |
JPH03204791A (ja) * | 1990-01-05 | 1991-09-06 | Nippon Steel Corp | 打刻印の検出方法及び装置 |
-
1986
- 1986-01-27 JP JP61013906A patent/JPS62173578A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02188891A (ja) * | 1989-01-17 | 1990-07-24 | Daihatsu Motor Co Ltd | 車台刻印番号認識装置における分割2値化処理方法 |
JPH03204791A (ja) * | 1990-01-05 | 1991-09-06 | Nippon Steel Corp | 打刻印の検出方法及び装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111709420B (zh) | 文本检测方法、电子设备及计算机可读介质 | |
CN105608456B (zh) | 一种基于全卷积网络的多方向文本检测方法 | |
JP4323328B2 (ja) | 取り込み画像データから文字列を識別して抜出するシステムおよび方法 | |
Tamilselvi et al. | A Novel Text Recognition Scheme using Classification Assisted Digital Image Processing Strategy | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN112507876B (zh) | 一种基于语义分割的有线表格图片解析方法和装置 | |
CN101122952A (zh) | 一种图片文字检测的方法 | |
US9076225B2 (en) | Image processing device, an image processing method and a program to be used to implement the image processing | |
CN111832390B (zh) | 一种手写古文字检测方法 | |
JP2001043313A (ja) | 文字切出し方法 | |
JP2004178562A (ja) | グラフによる画像分割 | |
CN110084117B (zh) | 基于二值图分段投影的文档表格线检测方法、系统 | |
JPS62173578A (ja) | 情景画像中の文字認識方式 | |
CN115082946A (zh) | 表格图像处理方法、装置、电子设备及计算机存储介质 | |
CN112215783B (zh) | 一种图像噪点识别方法、装置、存储介质及设备 | |
Vu et al. | Automatic extraction of text regions from document images by multilevel thresholding and k-means clustering | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JP4116377B2 (ja) | 画像処理方法および画像処理装置 | |
Baharlou et al. | Fast and adaptive license plate recognition algorithm for persian plates | |
JP7508212B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP3614215B2 (ja) | 画像の2値化方法及び装置 | |
JP2613211B2 (ja) | 画像入力装置 | |
CN115830607A (zh) | 基于人工智能的文本识别方法、装置、计算机设备及介质 | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
Yoshida et al. | A binarization method for the character extraction from scene image by the blanket method |