JPH01244587A

JPH01244587A - 文字切出し装置

Info

Publication number: JPH01244587A
Application number: JP63072433A
Authority: JP
Inventors: Tomoaki Nakano; 倫明中野; Arata Yamamoto; 新山本
Original assignee: Toyota Central R&D Labs Inc
Current assignee: Toyota Central R&D Labs Inc
Priority date: 1988-03-25
Filing date: 1988-03-25
Publication date: 1989-09-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は文字切出し装置、特に文字を含む画像の中から
、個々の文字を抽出出力する文字切出し装置の改良に関
する。

［従来の技術］刻印文字は、経年変化に強く、汚れ易い環境においても
その可読性が失われない。このため、各種生産工程にお
いて、生産指示や管理の重要な情報を示す文字として幅
広く用いられている。

特に自動車の生産工程では、車体を構成する各部品やエ
ンジン等に固有の番号を記すものとして広く用いられて
いる。

このような刻印文字の認識には、通常、文字切出し装置
と文字認識装置とか組合わせて用いられている。

従来の文字切出し装置は、Ｉ’ＦＶカメラ等を用いて刻
印文字を撮影してその濃淡画像を出力し、その濃淡画像
の各画素情報を二値画像データに変換し、この二値画像
データから各文字を検出し７切出し７ていた。

そして、文字識別装置は、このようにして切出された各
文字パターンを予め登録した標準文字パターンと逐次重
ね合わせて比較するというパターンマツチングを行い、
両者の一致度あるいは類似度に基づいて文字の識別を行
っていｆ：：。

しかし、ＩＴＶカメラ等を用いられた濃淡画像を二値画
像データに変換し、この下値画像データから各文字パタ
ーンを検出し切出すという従来の文字切出し装ばては、
背景部に濃淡むらやノイズ等があったり、また文字部と
背景部とのコントラスＩ・が変動する画像データからは
、所望の文字を正確に検出し切出すことが難しいという
問題かあった。

すなわち、現在広く用いられている刻印機では打刻条件
がいつも同しになるように制御することは難しく、刻印
文字毎に溝の深さがばらつく。このため、刻印文字の画
像では、文字部と背景部との濃度のコンＩ・ラストが変
動する。

また、認識対象となる文字の桁数が多い場合は、たとえ
ば車体番号のように文字の桁数が多い場合には、照明に
対する各文字の溝の角度や向きが不均一となる。このた
め、刻印文字の画像では、同じ文字でも、背景と文字部
とのコントラストが異なる場合が多い。

また、刻印文字が打刻された後に、防錆処理や塗装が施
されると、防錆処理や塗装のむらあるいは照明条件の変
化等に起因して画像の濃淡むらが発生ずる。

さらに、刻印文字周辺には細い傷や汚れが付着し易く、
このなめ画像の背景にはノイズが多く現われる。

しかし、画像の背景部に濃淡むちゃノイズか多く、しか
も文字部と背景部のコンＩ・ラストが変動するこのよう
な画像データに対し、画像データを二値化し文字の切出
しを行う従来技術を用いると、１文字となる画像がとぎ
れなり、文字どうしがっながって分Ｗできないことがあ
るという問題があった。

また、これに加えて、画像データに含まれるノイズ部分
と文字部分とを正確に区別して文字の切出しを行うこと
ができない場合も多いという問題があった。

このような問題を解決するために、特開昭６０−１４４
８８４号公報に開示された技術が知られている。

この従来技術は、刻印文字の撮像に際し、刻印面に対し
少なくとも２つの異なる方向がら斜光照射を行い、それ
ぞれの斜光照射に関して刻印文字を撮影して二値画像を
得、これらの画像の論理和をとることで最終的な二値画
像を形成することを特徴としている。

しかし、この従来技術も画像データを二値化閾値を用い
て二値画像に変換する手法を用いている。

従って、画像データの背景部の濃淡むらやノイズ、ある
いは文字部と背景部とのコントラストの違いなどを考慮
して、二値化閾値を最適値に選択設定しなければならな
い。このため、二値化閾値の設定が極めてむずかしいと
いう問題があり、しかも画面に応じ二値化閾値を逐次設
定し直しても、全ての文字をノイズと区別して正確に検
出することは困難であるという問題があった。

また、画像データを二値画像に変換せずに、濃淡画像の
まま文字検出を行うものとして、特開昭６０−２１．１
．５８３号公報に開示された技術が知られている。

この従来技術は、カメラから出力された画像データの各
画素に対して、注目する画素および周辺に位置する画素
の濃度レベルのうち最小値を求め、その値で閾値を設定
して、注目する画素と周辺の画素の濃度レベル差分値を
評価し、文字のエツジ部分か否かを検出することを特徴
としている。

しかし、この従来技術も、エツジ部分か否がの判定を行
うため、濃淡画像に対して差分処理を行い、濃度レベル
の変化の大きな部分を文字のエツジ部分として検出する
ときに、差分画像を閾値で二値化している。

従って、背景部に濃度むちゃノイズかある場合や、文字
部と背景部とのコントラストが低い場合には、画像デー
タから正確に文字を検出し切出すことが難しいという問
題があった。

［発明が解決しようとする問題点］本発明は、このような従来の課題に鑑みなされたもので
あり、その目的は、前述した従来の問題点を解決し、背
址部に濃度むちゃノイズ等が含まれ、しかも文字部と背
景部のコントラストが変動するような画像データからも
、所望の文字を正確に検出し切出すことができる文字切
出し装置を提供することにある。

［問題点を解決するための手段］前記目的を達成するため、本発明は、第１図に示すよう
に、撮像手段を用いて読取られた文字を含む画像データ
から、個々の文字を切出す文字切出し装置において、画像データの背景部分の濃淡むらを緩和して、文字候補
となる領域の濃度を抽出する文字候補濃度抽出手段と、文字候補濃度抽出手段から抽出出力された画像データを
、文字の行方向に走査することにより各行ごとの濃淡特
徴量を演算し、文字行の範囲を検出する文字検出手段と
、検出された文字行の範囲内で、画像データをその文字列
方向に走査することにより各列ごとの濃淡特徴量を演算
し、個々の文字の範囲を検出する文字検出手段と、を含み、検出された個々の文字を画像データから切出し
出力することを特徴とする。

ここにおいて、前記文字候補濃度抽出手段は、画像デー
タの狭い範囲で濃度が大きく変化する領域を、周りの背
址と同じ濃度で置換える処理を行い、処理を施した濃淡
画像データと元の濃淡画像データとの差分画像データを
求めることにより、画像データの背景部分の濃淡むらを
緩和して文字候補となる領域の濃度を抽出するよう形成
することが好ましい。

また、前記文字行検出手段は、画像データを、文字の行方向に走査することにより各行
毎の濃度平均値および濃度分散値を求め、これらの値か
ら文字線の候補となる範囲を抽出し各行における文字線
の出現確率を求め、濃度分散値と文字線出現確率に基づ
き各行毎の濃淡精微量を演算するよう形成することが好
ましい。

また、前記文字検出手段は、検出された文字行の範囲内で、画像データを文字の列方
向に走査することにより各列毎の濃度平均値および濃度
分散値を求め、これらの値から文字線の候補となる範囲
を抽出し各列における文字線の出現確率を求め、濃度分
散値と文字線出現確率に基づき各列毎の濃淡精微量を演
算するよう形成することが好ましい。

さらに、前記文字行検出手段は、対象とする行を挾む複数行の濃度平均値および濃度分散
値の平均値を、対象とする行の濃度平均値および濃度分
散値として用い濃淡精微量を演算するよう形成すること
が好ましく、また、前記文字検出手段は、対象とする列を挾む複数列の濃度平均値および濃度分散
値の平均値を、対象とする列の濃度平均値および濃度分
散値として用い濃淡時＠星を演算するよう形成すること
が好ましい。

また、本発明においては、文字候補濃度抽出手段と文字
行検出手段との間に、文字候補濃度抽出手段から抽出出
力された画像データがらノイズを除去するノイズ除去手
段を設けることが好ましい。

本発明の着眼点従来の文字切出し技術では、刻印文字部分をカメラ等の
撮像手段を用いて撮影し、このように１７で得られた濃
淡の画像データを二値画像に変換したり、また濃淡画像
を微分処理または差分処理することにより、文字のエツ
ジ部を表す画像データに変換し、最終的に閾値て二値化
することで文字のエツジ部を検出して文字の切出しを行
っていた。

これに対し、本発明では、濃淡の画像データを二値化す
ることなく、濃淡画像のままで文字の検出、切出しを行
おうとするものである。

本発明者らは、画像データの背景部に濃淡むらやノイズ
が多く含まれ、しがも文字部と背景部とのコントラスト
が変動する濃淡の画像データがち、どのようにずれは正
確に文字部分のみを検出し切出すことがてきるかについ
て検討を行った。

この検討の結果、まず、画像データの背景部の濃淡むら
や文字部と背景部とのコントラストの変動の影響を受け
ることなく文字の検出を行う為には、濃淡の画像データ
の背景部の濃度変化を緩和して、文字部の濃度を抽出し
てやればよいとの結論に至った。

濃淡の画像データから背景部の濃度変化を緩和して文字
部の濃度を抽出するためには、たとえば文字部やノイズ
のように、狭い範囲で濃度が大きく変化している領域を
、周りの背景部と同じ濃度で置換える処理を行い、次に
その画像データと元の画像データとの差分画像データを
求めてやればよい。このようにすれば、背景部の濃淡む
らのみが互いに相殺され、背景部の濃淡むちゃ文字部と
背景部とのコンＩ・ラストの変動の影響を受けることな
く、文字部分およびノイズ部分のみを画像データとして
抽出することかできる。

次に、本発明者らは、この様にして文字部とノイズ部の
濃度が選択的に抽出された濃淡の画像データから、どの
ようにしたらノイズのみを除去することができるかにつ
いての検討を行った。

この検討の結果、文字部とノイズ部の濃度の違いを利用
したたけでは、全部のノイズ部を十分に除去することが
できないことか判明した。

このなめ、本発明者らはさらに検討を進めたところ、文
字部を含む行または列の領域は、全体的に見ると濃度の
バラツキか大きくなり、また局所的に見ると、文字線と
なる濃度か集中して長く続いたり、断続的に広い範囲渡
って点在する傾向があり、これらの性質を利用して、濃
淡画像データ＝　１４− の各行または列から文字を含むか否かの程度を表す濃淡
性微量を演算することにより、濃淡の画像テークからノ
イズ部を除去し文字部のみを正確に抽出出力できること
を見い出した。

前述した濃淡性微量を求めるためには、各行または各列
毎に濃度の平均値と全体的な濃度のバラツキを表す濃度
分散値をｉｔ　ｎ　Ｌ、次にこれらの値から局所的な文
字線の候補の濃度の範囲、候補数、実質的なバラツキ具
合等を考慮し、文字線が存在する文字出現確率を計算す
る。そして、濃度の分散値と文字線出現確率に基づき各
行または列毎の濃淡性微量の演算を行えはよい。

このようにして求められた濃淡性微量は、文字部を含む
行または列で大きな値をとる。このため、その行方向の
特徴量の分布から文字行を、列方向の特徴量の分布から
各文字間の境界を検出することができ、このようにして
本発明によれば、ノイズ部を含む画像データから文字部
のみを正確に抽出し切出することができる。

＝　１５− ［作用］　　　　　− 本発明は以上の構成からなり、次にその作用を説明する
。

まず、たとえばＴ’Ｖカメラ等の撮像手段により文字を
読取ると、この撮像手段からは、文字を含む濃淡画像デ
ータが出力される。

このように、ＴＶ右カメラから得られる画像データは、
ｍ行ｎ列の画素から構成されている。そして、この画像
データ中に含まれる文字列は、画像データの複数行、複
数列にまたがって存在することか多い。

第３図（ａ）には、このような濃淡画像データに含まれ
る文字列の一部が示されており、同図（ｂ）には、同図
（ａ）のＡ−Ａ−断面における濃度レベルの変化が表さ
れている。

同図から明らかなように、文字を含む濃淡画像データは
、背景部の濃度が異なっているばかりでなく、背景部濃
度に対する文字部の濃度変化も異なる場合が多い。

本発明の第１の特徴は、文字候補濃度抽出手段を用いて
、画像背景部分の濃淡むらを緩和して文字候補となる領
域の濃度を抽出出力することにある。

具体的には、まず第３図（ａ）の画像データに対し、注
目する画素のレベルを周囲の画素のレベルに置換える処
理を複数回繰返すことにより、第３図（ｃ）に示すよう
に、画像データの文字部を背景部の濃度に置換える。こ
のとき、第３図（ｃ）に示すＡ−Ａ−断面の濃度レベル
は、第３図（ｄ）の実線で示すようになる（破線は第３
図（ｂ）で示す濃度レベル）。

次に、第３図（ａ）に示す画像データと第３図（ｃ）に
示す画像データとの差分をとり、第３図（ｅ）に示すよ
うに文字部の濃度のみを抽出した差分画像データを求め
る。

ここにおいて、第３図（ｅ）の画像データのＡ−Ａ−断
面の濃度レベルを見ると、第３図（ｆ）に示すように、
背景部の濃度レベルがほぼ均一となり濃度むらは緩和さ
れていることが理解されよう。

このようにして、本発明によれば、画像データの背景部
に濃淡むらかある場合でも、また文字部と背景部とのコ
ントラストか変動するような場合でも、濃淡画像データ
から文字部の濃度を確実に抽出することができる。

そして、文字候補濃度抽出手段により抽出出力される画
像データは、ノイズ除去手段に入力され、ここで背景部
の濃度に比べて濃度変化の少ないノイズ成分が除去され
る。しかし、このように文字部とノイズとの濃度の違い
だけを利用したのでは、画像データから全てのノイズを
十分に除去することかできない。

本発明の第２の特徴は、画像データに含まれる各行また
は列か文字部を含むか否かの程度を表す濃淡性微量を演
算し、演算された濃淡性微量に基づき画像データから個
々の文字を検出しその切出しを行うことにある。

すなわち、本発明において、ノイズ除去手段から出力さ
れる画素データは文字行検出手段に入力される。画像デ
ータに含まれる文字は、画像デー夕の複数行、複数列に
またがって存在づ−ろことか多い。

このため、この文字行検出手段は、第４図に示すように
、ノイズ除去手段から出力される画像データを文字の行
方向に走査することにより、各行毎の濃淡性微量を演算
１〜、第４　’７　（ａ　）に示すような分布を作成す
る。そして、この分布から、最も変化の太きいところを
文字行の上端および下端の候補とする。そして、この間
に挾まれた濃淡性微量を文字の高さ情報と比較して、妥
当てあれば文字行の範囲として決定する。

次に、文字検出手段は、検出された文字行の範囲内にお
いて、各列毎に濃淡性微量を油算し、第４１ＷＩ　（ｂ
　）に示すような分布を作成する。この分布から、最も
変化の大きな順に文字の左端と右端の候補を文字を表す
一組の情報として検出し、検出された文字情報を予め設
定された文字の幅情報と比較し、その比較結果が妥当で
あれば文字と１゜て決定する。

この様な文字行検出手段および文字検出手段の−１９＝動作をより具体的に説明する。

まず、前記文字行検出手段は、画像データを、文字の行
方向に走査することにより各行毎の濃度平均値および濃
度分散値を求める。この様にして求めた濃度分散値は画
像データの行方向に対する全体的な濃度のバラツキ具合
を表わすことになる。

このようにして、画像データの行方向に対する全体的な
濃度のバラツキを検出しノコ後、次に局所的な文字線の
候補の濃度の範囲、候補数、位置的なバラツキ具合から
その行方向に文字線が存在する確率、すなわち、文字出
現確率を演算する。この文字出現確率は、先はど求めた
各行毎の濃度平均値および濃度分散値に基づき演算され
る。

第４図（ａ）は、このように画像データを行方向に走査
することにより得ｌ：濃淡特微量の分布を表わしている
。同図から明らかなように、濃淡特徴板の分布は、文字
部を含む行で大きな値をとるのて、この行方向の特徴策
の分布から、最も変化の大きいところを文字行の上端と
下端候補として求めてやればよい。そして、上端と下端
候補により挾まれた濃淡性微量の高さを欠字の高さ情報
と比較し、妥当てあれば文字行の範囲として決定する。

このようにして、本発明によれば、画像データに含まれ
るノイズに影響されることなく、画像データに含まれる
文字行の範囲を正確に検出することがてきる、ここにおいて、前記文字行検出手段は、対象とする行そ
のものの濃度平均値および濃度分散値を用いるのてはな
く、まず対象とする１イを中心とした複数の行の濃度平
均値および濃度分散値からその平均値を求め、これを対
象とする行の濃度平均値および濃度分散値として用い濃
淡性微量を演算することが好まし、く、このようにする
ことにより、ノイズの影響をうけることなく文字行の範
囲をより正確に検出することができる。

次に、欠字検出手段は、検出された文字１１の範囲内に
おいて、各列毎に同様にして濃淡性微量を演算し、第４
図（１〕）に示すような分布を作成する。

具体的には、検出された文字行の範囲内で、各画像デー
タを文字の列方向に走査することにより各列毎の濃度平
均値および濃度分散値を求める。

このとき、求められた濃度分散値は、検出された文字行
の範囲内における各列毎の全体的な濃度のバラツキ具合
を表す。

次に、局所的な文字線の濃度の範囲、候補数、位置的な
バラツキ具合等から文字線が存在する文字出現確率を演
算する。この文字出現確率は、前述したように求めた各
列毎の濃度平均値および濃度分散値に基づき演算される
。

そして、このようにして求めた文字分散値と文字線出現
確率とに基づき、検出された文字行の範囲内で、各列毎
の濃淡性微量を演算し７、第４［ｙｌ（ｂ）に示すよう
な分布を作成する。

この分布から最も変化の大きな順に文字の左端と右端の
候補を組にしながら順次検出し、検出した文字候補の幅
が所定の文字の幅情報と比較して妥当であれば、これを
文字として決定する。なお、文字の中には「１１のよう
に、曲の文字に比べて文字幅の狭い文字もあるが、その
場合には、検出した文字の高さが妥当が否かを確認する
ことて文字の範囲かどうかを決定する。

ここにおいて、前記文字検出手段は、対象とする列その
ものの濃度平均値および濃度分散値を用いるのではなく
、まず対象とする列を中心とした複数の列の濃度平均値
および濃度分散値からその平均値を求め、これを対象と
する列の濃度平均値および濃度分散値として用い濃淡性
微量を演算することが好ましく、このようにすることに
より、ノイズの影響をうけることなく個々の文字範囲を
より正確に検出することができる。

このようにして本発明によれば、画像データを行方向と
列方向に走査し、それぞれについて濃淡性微量を演算す
ることにより、行方向の特徴量の分布から文字行を、列
方向の特徴量の分布から各文字間の境界を検出し、画像
データからノイズに影響されることなく個々の文字を正
確に検出している。

＝　２３− そして、文字切出し手段は、このようにして検出された
個々の文字を画像データから切出し出力する。

し発明の効果」以上説明したように、本発明によれば、従来技術のよう
に濃淡画像データを二値画像に変換することなく、濃淡
画像のままで文字検出を行うことができるため、防錆処
理や塗装によるむら、または照明の不均一等に起因して
発生する濃淡画像の背景部の濃淡むちゃ、背景部のノイ
ズ、あるいは文字部と背景部とのコントラストの変動等
にかかわりなく、画像データから正確に個々の文字を検
出し切出すことができる。

さらに、本発明によれば、従来技術のように閾値を設定
する必要はないなめ、撮像条件や照明の変動があった場
合にも、閾値を再設定する必要かなく、したがって、本
発明に係る文字切出し装置を各種生産現場で用いること
により、従来技術に比べ大幅な省力化をはたずことがで
きるという効果がある。

［実施例］次に本発明の好適な実施例を図面に基づき説明する。

第２図には本発明か適用された文字認識装置１゛　　　
０の好適な実施例が示されており、図において、自動車
の車体の構成部品であるフレーム１２には認識対象とな
る刻印文字Ａが打刻されている。この刻印文字Ａはたと
えば英数字および記号からなる１１桁の文字列である。

実施例の文字認識装置１０は、上記刻印文字Ａを自動読
取するだめのものであり、本発明に係る文字切出し装置
１００および文字識別装置２００から構成されている。

前記文字切出し装置１００は、刻印文字Ａを蛍光灯２０
で照明し、ＴＶ右カメラ２で撮像している。刻印文字Ａ
は、溝になっている文字部分が影になり暗く、フレーム
１２の表面部分が明るい濃淡画像としてとらえられる。

そして、文字切出し装Ｗ１００は、′ｒ■カメラ２２か
ら出力される画像データから文字画像データを切出し、
文字識別装置２００へ向は出力する。

そして、文字識別装置２００は、入力される文字画像デ
ータと標準文字パターンとを比較し、文字の種別を判定
することにより、刻印文字Ａの読取りを行う。

久ヱ豆■七葱１本実施例において、文字切出し装Ｗ１００は、ＴＶ右カ
メラ２から出力される画像データをＡ／Ｄ変換回路２４
を介して文字候補濃度抽出回路２６へ入力している。

この文字候補濃度抽出回路２６は、画像データの背景部
分の濃淡むらを緩和して、文字候補となる領域の濃度を
抽出出力するよう形成されており、具体的には第１の画
像メモリ２８、濃度置換回路３０、第２の画像メモリ３
２）差分口＆＠３４および第３の画像メモリ３６から構
成されている。

そして、ＴＶ右カメラ２から出力されＡ／Ｄ変換回絡２
４てデジタル信号に変換された濃淡の画像データは第１
の画像メモリ２８に記憶される。

この第１の画像メモリ２８に記憶された濃淡画像データ
は、濃度置換回路３０より、文字部の濃度が背景部の濃
度に置換えられて第２の画像メモリ３２に記憶される。

このとき、濃淡画像データの文字部の濃度が大きく、背
景部の濃度が小さい場合には、文字部の濃度を背景部の
濃度に置換える処理として、注目する画素を含む周辺の
画素の中で最小値を選び、その値を注目する画素の値と
して置き換えてやｔしはよい。

まｌ：、濃淡画像データの文字部の濃度か小さく背景部
の濃度が大きい場合には、注１］する画素を含む周辺の
画素の中て最大値を選び、その値を注ｌ」する画素の値
として置き換えてやればよい。このような濃度の置換え
処理を、文字部が背景部により完全に置換えられるまで
くりかえし２て行う。

このようにすることにより、たとえば第１の画像メモリ
２８内に、第３図（ａ）に示すような画像データが書込
まれている場合には、第２の画像メモリ３２に、第３１
ｆｆｉ（ｃ）に示すように文字部の濃度が背景部の濃度
に置換えられた画像データが記憶されることになる。

そして、差分回路３４は、第１の画像メモリ２８に記憶
されている画像データから第２の画像メモリ３２に記憶
されている画像データを差分演算し、このようにして求
められた画像データを第３の画像メモリ３６に記憶する
。

これにより、たとえば第１の画像メモリ２８、第２の画
像メモリ３２に第３図（ａ）、（ｃ）に示すような画像
データが記憶されている場合には、第３の画像メモリ３
６には第３図（ｅ）に示すように、画像データの背景部
の濃淡むらが緩和され、しかも文字部となる領域の濃度
が抽出された画像データが記憶されることとなる。

このようにして、本発明によれば、背景部に濃淡むらが
あったり、また文字部と背景部とのコントラス１−が変
動する画像データに対し、画像データの背景部分の濃淡
むらを緩和して、文字候補となる領域の２８度を抽出し
ｌ：良好な画像データを得ることがてきる。

そして、第３の画像メモリ３６に記憶された画像−デー
タは、ノイズ除去口１絡３８に向は出力される。

このノイズ除去回路３８は、入力される画像データの濃
度別の頻度と平均頻度を計算し、平均頻度以上の頻度を
もつ濃度に限定して濃度レベルを平滑し、背景の濃度に
近い濃淡ノイズを除去する。

そして、このように部分的にノイズが除去された画像デ
ータは、ノイズ除去回路３８から文字行検出回路４０へ
向は出力される。

文字行検出回路４０は、このようにして入力される画像
データを文字の行方向に走査することにより、各行毎の
濃淡特徴量を演算し、文字行の範囲を検出するよう形成
されており、Ｖ体的には第１の濃淡特微量泄算回路４２
と第１の検出回路４４を用いて構成されている。

前記第１の濃淡特徴量演算回路４２は、ノイズ除去回路
３８により部分的にノイズか除去された画像データを文
字の行方向に走査し、各行毎に、文字が存在するか否か
の程度を表す行単位の濃淡特徴量を演算する。

第５図には第１の濃淡特＠量演算回路４２の具体的構成
が示され、実施例の回路４２は、濃度平均値演算部４２
ａ、濃度分散値演算部４２ｂ、文字線候補抽出部４２ｃ
、文字線確率演算部４２ｄおよ′Ｕ濃淡特微量演算部４
．２　ｅから成り、前述した行単位の濃淡特徴量の演算
を次のようにして行うよう形成されている。

まず、注目する行を中心として５行分の範囲にわたって
画像データを文字の行方向に走査する。

そして、この５行分の範囲の画像について、濃度別の頻
度を計算し、濃度別頻度を用いて画像濃度の平均値およ
び分散値を計算する。

次に、５行分の画像データに対して３画素×３画素の範
囲毎に、逐次局所的な濃度平均値および濃度平均値から
の濃度のバラツキ具合を計算し、局所的な濃度平均値が
濃度平均値よりも人で、かつ濃度のばらつき具合が予め
定めた固定値より人の場合に文字線の候補の範囲とする
。

次に、５行分の画像データの中に検出された文字線候補
の範囲と大きさと個数、位置的な散在の程度により、５
行分の画像データに文字線が含まれる確率を表すランク
、すなわち、文字線の出現確率を計算する。

５行分の画像データの範囲において、３画素×３画素の
局所的な範囲をとりえる回数に対して、文字線の候補の
範囲となった回数の割合を、文字線の出現確率とし、１
０段階のランクに分類する。

そして、濃度の分散値と、文字線が存在する確率を表わ
すランク値（文字出現確率）に、所定の重み係数を掛け
て演算することにより行単位の濃淡性微量を求め、この
値を注目する行、すなわち５行の中心の行の濃淡性微量
とする。

このような行単位の濃淡性微量の計算を各行について行
い、その演算結果を第１の検出回＃ｔ４４へ向は出力す
る。

第１の検出回路４４は、このようにして入力される行単
位の濃淡性微量に基づき、たとえば第４図（ａ）に示す
ような濃淡性微量の分布を作成する。この分布に基づき
、濃淡性微量の変化の最大となる行を、文字行の上端お
よび下端の候補として抽出し、その行の濃淡性微量の大
きさが、予め与えられた平均の高さと比べて妥当か否か
を判断する。そして、妥当であると判断された場合には
、文字行の上端および下端の値を文字行の範囲として検
出し、この検出データを文字検出回路４６へ向は出力す
る。

文字検出回路４６は、このようにして検出された文字行
の範囲内で、画像データをその文字列方向に走査するこ
とにより各列毎の濃淡性微量を演算し、個々の文字範囲
を検出するよう形成されており、具体的には第２の濃淡
特微量演算回＆＠４８および第２の検出回路５０を用い
て形成されている。

前記第２の濃淡特徴量演算回路４８は、検出された文字
行の上端、下端の範囲内に限定して、各列毎に文字の一
部が存在する列か否かの程度を表す列単位の濃淡性微量
の演算を行う。

＝　３２− 第６図には第２の濃淡特徴量演算回路４８の具体的構成
が示され、実施例の回路４８は、濃度平均値演算部４８
ａ、濃度分散値演算部４８ｂ、文字線候補抽出部４８ｃ
、文字線確率演算部４８ｄおよび濃淡特徴量演算部４８
ｅから成り、前述した列単位の濃淡性微量の演算を次の
ようにして行うよう形成されている。

まず画像データをその文字列方向に走査することにより
、注目する列を中心とする５行分の範囲の画像について
、前述した第１の濃淡特徴量演算回路４２と同様にして
列単位の濃淡性微量を演算し、その値を注目する列、す
なわち５列の中心の列の濃淡性微量とする。

このような列単位の濃淡性微量の演算を、各列について
行い、演算されたデータを第２の検出回路５０へ向は出
力する。

第２の検出回＆＠５０は、このようにして入力される列
単位の濃淡性微量に基づき、第４図（ｂ）に示すように
列毎の濃淡性微量の分布を作成する。

そして、この分布に基づき、濃淡時＠量の変化の大きな
列から順に各文字の左端および右端を検出するうそして
、検出された文字は、予め与えられた平均文字幅（たと
えばｒ’ｌ　Ｊの様に幅の狭い文字は除く）と比べて妥
当か否がが判定される。

なお、「１」のように幅の狭い文字については、別途に
幅の狭い文字の平均文字幅と比較するとともに、文字の
高さが妥当か否かの再確認を行い、ノイズと区別してい
る。

このようにして、本発明によれば、たとえば第４図（ａ
＞に示す行方向の濃淡性微量の分布がら文字行、第４図
（ｂ）に示す列方向の濃淡性微量の分布から各文字間の
境界を検出することにより、ノイズに影響されることな
く個々の文字を正確に検出することかできる。

そして、文字抽出回路５２は、このようにして検出され
た個々の文字を、画像データから切出し、文字識別装置
２００へ向は出力する。

文字派別装置文字識別装置２００は、文字切出し装置１ｏ。

により切出された個々の文字を二値化回路６ｏへ入力し
ている。この二値化回路６０は、入力された個々の文字
を二値画像に変換し、位置正規化回路６２へ向は出力す
る。

位置正規化回路６２は、入力された文字の重心を求めて
、その重心を基準位置に合わせた後、類似度計算回路６
４へ向は出力する。

類似度清算回路４６は、標準パターンメモリ６８に予め
登録されている各文字種の標準パターンデータと、位置
正規化回路６２から出力される各文字データとを逐次重
ね合わせながら、文字の種類とその一致の程度を表す類
似度をＲ１算し、文字判定回路６６へ向は出力する。

文字判定回路６６は、各文字の類似度を所定の判定基準
に照し７合わせ、判定された文字が正確に識別されたか
否かを判定する。

以上説明しｌ：ように、本発明に係る文字切出し装置１
００を用いることにより、刻印文字を正確に切出し、そ
の判読を正確に行うことかできる。

なお、本発明は前述した実施例に限定されるものではな
く、本発明の要旨の範囲内て各種の変形実施か可能であ
る。

たとえば、前記実施例においては、刻印文字を認識する
場合を例にとり説明したが、本発明はこれに限らず、必
要に応じて他の種類の文字の認識に用いてもよい。

、ｌＪ：た、前記実施例においては、光学的な撮像手段
を用いた場合を例にとり説明したが、本発明はこれに限
らず、必要に応じて他のタイプの撮像手段を用いてもよ
い。

また、前記実施例においては、画像データの文字行を横
方向に、列方向を縦方向にとった場合を例にとり説明し
たが、本発明はこれに限らず、行方向を縦、列方向を横
にとり同様にして文字の切出しを行うことも可能である
。

【図面の簡単な説明】

第１図は本発明に係る文字切出し装置のクレーム対応図
、＝　３６− 第２図は本発明が適用された文字識別装置の好適な実施
例を示すフロック回路図、第３図は本発明に係る文字切出し装置の文字候補濃度抽
出動作を示す説明図、第４図は本発明に係る文字切出し装置の文字行検出およ
び文字検出動作を示す説明図、第５図は第２図に示す実
施例の第１の濃淡特徴量検出回路の具体的な構成を示す
フロック回路図、第６図は第２図に示す実施例の第２の
濃淡特徴量演算回路の具体的な構成を示すブロック回路
図である。２２・・・Ｔ　Ｖカメラ２６・・・文字候補濃度抽出回路２８・・・第１の画像メモリ３０・・・濃度置換回路３２・・・第２の画像メモリ３４・・・差分回路３６・・・第３の画像メモリ３８・・・ノイズ除去回路４０・・・文字行検出回路４２・・・第１の濃淡特徴１−演算回路４４・・・第１
の検出回路４６・・・文字検出回路４８・・・第２の濃淡特徴量演算回路５０・・・第２の検出回路５２・・・文字抽出回路１、　ＯＯ・・・文字切出し装置Ａ・・・刻印文字

Claims

【特許請求の範囲】

（１）撮像手段を用いて読取られた文字を含む画像デー
タから、個々の文字を切出す文字切出し装置において、画像データの背景部分の濃淡むらを緩和して、文字候補
となる領域の濃度を抽出する文字候補濃度抽出手段と、文字候補濃度抽出手段から抽出出力された画像データを
、文字の行方向に走査することにより各行ごとの濃淡特
徴量を演算し、文字行の範囲を検出する文字行検出手段
と、検出された文字行の範囲内で、画像データをその文字列
方向に走査することにより各列ごとの濃淡特徴量を演算
し、個々の文字の範囲を検出する文字検出手段と、を含み、検出された個々の文字を画像データから切出し
出力することを特徴とする文字切出し装置。
（２）特許請求の範囲（１）記載の装置において、前記
文字候補濃度抽出手段は、画像データの狭い範囲で濃度
が大きく変化する領域を、周りの背景と同じ濃度で置換
える処理を行い、処理を施した濃淡画像データと元の濃
淡画像データとの差分画像データを求めることにより、
画像データの背景部分の濃淡むらを緩和して文字候補と
なる領域の濃度を抽出するよう形成されてなることを特
徴とする文字切出し装置。
（３）特許請求の範囲（１）〜（２）のいずれかに記載
の装置において、前記文字行検出手段は、画像データを、文字の行方向に走査することにより各行
毎の濃度平均値および濃度分散値を求め、これらの値か
ら文字線の候補となる範囲を抽出し各行における文字線
の出現確率を求め、濃度分散値と文字線出現確率に基づ
き各行毎の濃淡特徴量を演算するよう形成され、前記文字検出手段は、検出された文字行の範囲内で、画像データを文字の列方
向に走査することにより各列毎の濃度平均値および濃度
分散値を求め、これらの値から文字線の候補となる範囲
を抽出し各列における文字線の出現確率を求め、濃度分
散値と文字線出現確率に基づき各列毎の濃淡特徴量を演
算し、個々の文字の範囲を検出することを特徴とする文
字切出し装置。
（４）特許請求の範囲（１）〜（３）のいずれかに記載
の装置において、前記文字行検出手段は、対象とする行を挾む複数行の濃度平均値および濃度分散
値の平均値を、対象とする行の濃度平均値および濃度分
散値として用い濃淡特徴量を演算するよう形成され、前記文字検出手段は、対象とする列を挾む複数列の濃度平均値および濃度分散
値の平均値を、対象とする列の濃度平均値および濃度分
散値として用い濃淡特徴量を演算することを特徴とする
文字切出し装置。
（５）特許請求の範囲（１）〜（４）のいずれかに記載
の装置において、文字候補濃度抽出手段と文字行検出手段との間に文字候
補濃度抽出手段から抽出出力された画像データからノイ
ズを除去するノイズ除去手段を設けたことを特徴とする
文字切出し装置。