JPH01244587A - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JPH01244587A
JPH01244587A JP63072433A JP7243388A JPH01244587A JP H01244587 A JPH01244587 A JP H01244587A JP 63072433 A JP63072433 A JP 63072433A JP 7243388 A JP7243388 A JP 7243388A JP H01244587 A JPH01244587 A JP H01244587A
Authority
JP
Japan
Prior art keywords
character
density
image data
line
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63072433A
Other languages
English (en)
Inventor
Tomoaki Nakano
倫明 中野
Arata Yamamoto
新 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP63072433A priority Critical patent/JPH01244587A/ja
Publication of JPH01244587A publication Critical patent/JPH01244587A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字切出し装置、特に文字を含む画像の中から
、個々の文字を抽出出力する文字切出し装置の改良に関
する。
[従来の技術] 刻印文字は、経年変化に強く、汚れ易い環境においても
その可読性が失われない。このため、各種生産工程にお
いて、生産指示や管理の重要な情報を示す文字として幅
広く用いられている。
特に自動車の生産工程では、車体を構成する各部品やエ
ンジン等に固有の番号を記すものとして広く用いられて
いる。
このような刻印文字の認識には、通常、文字切出し装置
と文字認識装置とか組合わせて用いられている。
従来の文字切出し装置は、I’FVカメラ等を用いて刻
印文字を撮影してその濃淡画像を出力し、その濃淡画像
の各画素情報を二値画像データに変換し、この二値画像
データから各文字を検出し7切出し7ていた。
そして、文字識別装置は、このようにして切出された各
文字パターンを予め登録した標準文字パターンと逐次重
ね合わせて比較するというパターンマツチングを行い、
両者の一致度あるいは類似度に基づいて文字の識別を行
っていf::。
しかし、ITVカメラ等を用いられた濃淡画像を二値画
像データに変換し、この下値画像データから各文字パタ
ーンを検出し切出すという従来の文字切出し装ばては、
背景部に濃淡むらやノイズ等があったり、また文字部と
背景部とのコントラスI・が変動する画像データからは
、所望の文字を正確に検出し切出すことが難しいという
問題かあった。
すなわち、現在広く用いられている刻印機では打刻条件
がいつも同しになるように制御することは難しく、刻印
文字毎に溝の深さがばらつく。このため、刻印文字の画
像では、文字部と背景部との濃度のコンI・ラストが変
動する。
また、認識対象となる文字の桁数が多い場合は、たとえ
ば車体番号のように文字の桁数が多い場合には、照明に
対する各文字の溝の角度や向きが不均一となる。このた
め、刻印文字の画像では、同じ文字でも、背景と文字部
とのコントラストが異なる場合が多い。
また、刻印文字が打刻された後に、防錆処理や塗装が施
されると、防錆処理や塗装のむらあるいは照明条件の変
化等に起因して画像の濃淡むらが発生ずる。
さらに、刻印文字周辺には細い傷や汚れが付着し易く、
このなめ画像の背景にはノイズが多く現われる。
しかし、画像の背景部に濃淡むちゃノイズか多く、しか
も文字部と背景部のコンI・ラストが変動するこのよう
な画像データに対し、画像データを二値化し文字の切出
しを行う従来技術を用いると、1文字となる画像がとぎ
れなり、文字どうしがっながって分Wできないことがあ
るという問題があった。
また、これに加えて、画像データに含まれるノイズ部分
と文字部分とを正確に区別して文字の切出しを行うこと
ができない場合も多いという問題があった。
このような問題を解決するために、特開昭60−144
884号公報に開示された技術が知られている。
この従来技術は、刻印文字の撮像に際し、刻印面に対し
少なくとも2つの異なる方向がら斜光照射を行い、それ
ぞれの斜光照射に関して刻印文字を撮影して二値画像を
得、これらの画像の論理和をとることで最終的な二値画
像を形成することを特徴としている。
しかし、この従来技術も画像データを二値化閾値を用い
て二値画像に変換する手法を用いている。
従って、画像データの背景部の濃淡むらやノイズ、ある
いは文字部と背景部とのコントラストの違いなどを考慮
して、二値化閾値を最適値に選択設定しなければならな
い。このため、二値化閾値の設定が極めてむずかしいと
いう問題があり、しかも画面に応じ二値化閾値を逐次設
定し直しても、全ての文字をノイズと区別して正確に検
出することは困難であるという問題があった。
また、画像データを二値画像に変換せずに、濃淡画像の
まま文字検出を行うものとして、特開昭60−21.1
.583号公報に開示された技術が知られている。
この従来技術は、カメラから出力された画像データの各
画素に対して、注目する画素および周辺に位置する画素
の濃度レベルのうち最小値を求め、その値で閾値を設定
して、注目する画素と周辺の画素の濃度レベル差分値を
評価し、文字のエツジ部分か否かを検出することを特徴
としている。
しかし、この従来技術も、エツジ部分か否がの判定を行
うため、濃淡画像に対して差分処理を行い、濃度レベル
の変化の大きな部分を文字のエツジ部分として検出する
ときに、差分画像を閾値で二値化している。
従って、背景部に濃度むちゃノイズかある場合や、文字
部と背景部とのコントラストが低い場合には、画像デー
タから正確に文字を検出し切出すことが難しいという問
題があった。
[発明が解決しようとする問題点] 本発明は、このような従来の課題に鑑みなされたもので
あり、その目的は、前述した従来の問題点を解決し、背
址部に濃度むちゃノイズ等が含まれ、しかも文字部と背
景部のコントラストが変動するような画像データからも
、所望の文字を正確に検出し切出すことができる文字切
出し装置を提供することにある。
[問題点を解決するための手段] 前記目的を達成するため、本発明は、第1図に示すよう
に、撮像手段を用いて読取られた文字を含む画像データ
から、個々の文字を切出す文字切出し装置において、 画像データの背景部分の濃淡むらを緩和して、文字候補
となる領域の濃度を抽出する文字候補濃度抽出手段と、 文字候補濃度抽出手段から抽出出力された画像データを
、文字の行方向に走査することにより各行ごとの濃淡特
徴量を演算し、文字行の範囲を検出する文字検出手段と
、 検出された文字行の範囲内で、画像データをその文字列
方向に走査することにより各列ごとの濃淡特徴量を演算
し、個々の文字の範囲を検出する文字検出手段と、 を含み、検出された個々の文字を画像データから切出し
出力することを特徴とする。
ここにおいて、前記文字候補濃度抽出手段は、画像デー
タの狭い範囲で濃度が大きく変化する領域を、周りの背
址と同じ濃度で置換える処理を行い、処理を施した濃淡
画像データと元の濃淡画像データとの差分画像データを
求めることにより、画像データの背景部分の濃淡むらを
緩和して文字候補となる領域の濃度を抽出するよう形成
することが好ましい。
また、前記文字行検出手段は、 画像データを、文字の行方向に走査することにより各行
毎の濃度平均値および濃度分散値を求め、これらの値か
ら文字線の候補となる範囲を抽出し各行における文字線
の出現確率を求め、濃度分散値と文字線出現確率に基づ
き各行毎の濃淡精微量を演算するよう形成することが好
ましい。
また、前記文字検出手段は、 検出された文字行の範囲内で、画像データを文字の列方
向に走査することにより各列毎の濃度平均値および濃度
分散値を求め、これらの値から文字線の候補となる範囲
を抽出し各列における文字線の出現確率を求め、濃度分
散値と文字線出現確率に基づき各列毎の濃淡精微量を演
算するよう形成することが好ましい。
さらに、前記文字行検出手段は、 対象とする行を挾む複数行の濃度平均値および濃度分散
値の平均値を、対象とする行の濃度平均値および濃度分
散値として用い濃淡精微量を演算するよう形成すること
が好ましく、 また、前記文字検出手段は、 対象とする列を挾む複数列の濃度平均値および濃度分散
値の平均値を、対象とする列の濃度平均値および濃度分
散値として用い濃淡時@星を演算するよう形成すること
が好ましい。
また、本発明においては、文字候補濃度抽出手段と文字
行検出手段との間に、文字候補濃度抽出手段から抽出出
力された画像データがらノイズを除去するノイズ除去手
段を設けることが好ましい。
本発明の着眼点 従来の文字切出し技術では、刻印文字部分をカメラ等の
撮像手段を用いて撮影し、このように17で得られた濃
淡の画像データを二値画像に変換したり、また濃淡画像
を微分処理または差分処理することにより、文字のエツ
ジ部を表す画像データに変換し、最終的に閾値て二値化
することで文字のエツジ部を検出して文字の切出しを行
っていた。
これに対し、本発明では、濃淡の画像データを二値化す
ることなく、濃淡画像のままで文字の検出、切出しを行
おうとするものである。
本発明者らは、画像データの背景部に濃淡むらやノイズ
が多く含まれ、しがも文字部と背景部とのコントラスト
が変動する濃淡の画像データがち、どのようにずれは正
確に文字部分のみを検出し切出すことがてきるかについ
て検討を行った。
この検討の結果、まず、画像データの背景部の濃淡むら
や文字部と背景部とのコントラストの変動の影響を受け
ることなく文字の検出を行う為には、濃淡の画像データ
の背景部の濃度変化を緩和して、文字部の濃度を抽出し
てやればよいとの結論に至った。
濃淡の画像データから背景部の濃度変化を緩和して文字
部の濃度を抽出するためには、たとえば文字部やノイズ
のように、狭い範囲で濃度が大きく変化している領域を
、周りの背景部と同じ濃度で置換える処理を行い、次に
その画像データと元の画像データとの差分画像データを
求めてやればよい。このようにすれば、背景部の濃淡む
らのみが互いに相殺され、背景部の濃淡むちゃ文字部と
背景部とのコンI・ラストの変動の影響を受けることな
く、文字部分およびノイズ部分のみを画像データとして
抽出することかできる。
次に、本発明者らは、この様にして文字部とノイズ部の
濃度が選択的に抽出された濃淡の画像データから、どの
ようにしたらノイズのみを除去することができるかにつ
いての検討を行った。
この検討の結果、文字部とノイズ部の濃度の違いを利用
したたけでは、全部のノイズ部を十分に除去することが
できないことか判明した。
このなめ、本発明者らはさらに検討を進めたところ、文
字部を含む行または列の領域は、全体的に見ると濃度の
バラツキか大きくなり、また局所的に見ると、文字線と
なる濃度か集中して長く続いたり、断続的に広い範囲渡
って点在する傾向があり、これらの性質を利用して、濃
淡画像データ= 14− の各行または列から文字を含むか否かの程度を表す濃淡
性微量を演算することにより、濃淡の画像テークからノ
イズ部を除去し文字部のみを正確に抽出出力できること
を見い出した。
前述した濃淡性微量を求めるためには、各行または各列
毎に濃度の平均値と全体的な濃度のバラツキを表す濃度
分散値をit n L、次にこれらの値から局所的な文
字線の候補の濃度の範囲、候補数、実質的なバラツキ具
合等を考慮し、文字線が存在する文字出現確率を計算す
る。そして、濃度の分散値と文字線出現確率に基づき各
行または列毎の濃淡性微量の演算を行えはよい。
このようにして求められた濃淡性微量は、文字部を含む
行または列で大きな値をとる。このため、その行方向の
特徴量の分布から文字行を、列方向の特徴量の分布から
各文字間の境界を検出することができ、このようにして
本発明によれば、ノイズ部を含む画像データから文字部
のみを正確に抽出し切出することができる。
= 15− [作用]     − 本発明は以上の構成からなり、次にその作用を説明する
まず、たとえばT’Vカメラ等の撮像手段により文字を
読取ると、この撮像手段からは、文字を含む濃淡画像デ
ータが出力される。
このように、TV右カメラから得られる画像データは、
m行n列の画素から構成されている。そして、この画像
データ中に含まれる文字列は、画像データの複数行、複
数列にまたがって存在することか多い。
第3図(a)には、このような濃淡画像データに含まれ
る文字列の一部が示されており、同図(b)には、同図
(a)のA−A−断面における濃度レベルの変化が表さ
れている。
同図から明らかなように、文字を含む濃淡画像データは
、背景部の濃度が異なっているばかりでなく、背景部濃
度に対する文字部の濃度変化も異なる場合が多い。
本発明の第1の特徴は、文字候補濃度抽出手段を用いて
、画像背景部分の濃淡むらを緩和して文字候補となる領
域の濃度を抽出出力することにある。
具体的には、まず第3図(a)の画像データに対し、注
目する画素のレベルを周囲の画素のレベルに置換える処
理を複数回繰返すことにより、第3図(c)に示すよう
に、画像データの文字部を背景部の濃度に置換える。こ
のとき、第3図(c)に示すA−A−断面の濃度レベル
は、第3図(d)の実線で示すようになる(破線は第3
図(b)で示す濃度レベル)。
次に、第3図(a)に示す画像データと第3図(c)に
示す画像データとの差分をとり、第3図(e)に示すよ
うに文字部の濃度のみを抽出した差分画像データを求め
る。
ここにおいて、第3図(e)の画像データのA−A−断
面の濃度レベルを見ると、第3図(f)に示すように、
背景部の濃度レベルがほぼ均一となり濃度むらは緩和さ
れていることが理解されよう。
このようにして、本発明によれば、画像データの背景部
に濃淡むらかある場合でも、また文字部と背景部とのコ
ントラストか変動するような場合でも、濃淡画像データ
から文字部の濃度を確実に抽出することができる。
そして、文字候補濃度抽出手段により抽出出力される画
像データは、ノイズ除去手段に入力され、ここで背景部
の濃度に比べて濃度変化の少ないノイズ成分が除去され
る。しかし、このように文字部とノイズとの濃度の違い
だけを利用したのでは、画像データから全てのノイズを
十分に除去することかできない。
本発明の第2の特徴は、画像データに含まれる各行また
は列か文字部を含むか否かの程度を表す濃淡性微量を演
算し、演算された濃淡性微量に基づき画像データから個
々の文字を検出しその切出しを行うことにある。
すなわち、本発明において、ノイズ除去手段から出力さ
れる画素データは文字行検出手段に入力される。画像デ
ータに含まれる文字は、画像デー夕の複数行、複数列に
またがって存在づ−ろことか多い。
このため、この文字行検出手段は、第4図に示すように
、ノイズ除去手段から出力される画像データを文字の行
方向に走査することにより、各行毎の濃淡性微量を演算
1〜、第4 ’7 (a )に示すような分布を作成す
る。そして、この分布から、最も変化の太きいところを
文字行の上端および下端の候補とする。そして、この間
に挾まれた濃淡性微量を文字の高さ情報と比較して、妥
当てあれば文字行の範囲として決定する。
次に、文字検出手段は、検出された文字行の範囲内にお
いて、各列毎に濃淡性微量を油算し、第41WI (b
 )に示すような分布を作成する。この分布から、最も
変化の大きな順に文字の左端と右端の候補を文字を表す
一組の情報として検出し、検出された文字情報を予め設
定された文字の幅情報と比較し、その比較結果が妥当で
あれば文字と1゜て決定する。
この様な文字行検出手段および文字検出手段の−19= 動作をより具体的に説明する。
まず、前記文字行検出手段は、画像データを、文字の行
方向に走査することにより各行毎の濃度平均値および濃
度分散値を求める。この様にして求めた濃度分散値は画
像データの行方向に対する全体的な濃度のバラツキ具合
を表わすことになる。
このようにして、画像データの行方向に対する全体的な
濃度のバラツキを検出しノコ後、次に局所的な文字線の
候補の濃度の範囲、候補数、位置的なバラツキ具合から
その行方向に文字線が存在する確率、すなわち、文字出
現確率を演算する。この文字出現確率は、先はど求めた
各行毎の濃度平均値および濃度分散値に基づき演算され
る。
第4図(a)は、このように画像データを行方向に走査
することにより得l:濃淡特微量の分布を表わしている
。同図から明らかなように、濃淡特徴板の分布は、文字
部を含む行で大きな値をとるのて、この行方向の特徴策
の分布から、最も変化の大きいところを文字行の上端と
下端候補として求めてやればよい。そして、上端と下端
候補により挾まれた濃淡性微量の高さを欠字の高さ情報
と比較し、妥当てあれば文字行の範囲として決定する。
このようにして、本発明によれば、画像データに含まれ
るノイズに影響されることなく、画像データに含まれる
文字行の範囲を正確に検出することがてきる、 ここにおいて、前記文字行検出手段は、対象とする行そ
のものの濃度平均値および濃度分散値を用いるのてはな
く、まず対象とする1イを中心とした複数の行の濃度平
均値および濃度分散値からその平均値を求め、これを対
象とする行の濃度平均値および濃度分散値として用い濃
淡性微量を演算することが好まし、く、このようにする
ことにより、ノイズの影響をうけることなく文字行の範
囲をより正確に検出することができる。
次に、欠字検出手段は、検出された文字11の範囲内に
おいて、各列毎に同様にして濃淡性微量を演算し、第4
図(1〕)に示すような分布を作成する。
具体的には、検出された文字行の範囲内で、各画像デー
タを文字の列方向に走査することにより各列毎の濃度平
均値および濃度分散値を求める。
このとき、求められた濃度分散値は、検出された文字行
の範囲内における各列毎の全体的な濃度のバラツキ具合
を表す。
次に、局所的な文字線の濃度の範囲、候補数、位置的な
バラツキ具合等から文字線が存在する文字出現確率を演
算する。この文字出現確率は、前述したように求めた各
列毎の濃度平均値および濃度分散値に基づき演算される
そして、このようにして求めた文字分散値と文字線出現
確率とに基づき、検出された文字行の範囲内で、各列毎
の濃淡性微量を演算し7、第4[yl(b)に示すよう
な分布を作成する。
この分布から最も変化の大きな順に文字の左端と右端の
候補を組にしながら順次検出し、検出した文字候補の幅
が所定の文字の幅情報と比較して妥当であれば、これを
文字として決定する。なお、文字の中には「11のよう
に、曲の文字に比べて文字幅の狭い文字もあるが、その
場合には、検出した文字の高さが妥当が否かを確認する
ことて文字の範囲かどうかを決定する。
ここにおいて、前記文字検出手段は、対象とする列その
ものの濃度平均値および濃度分散値を用いるのではなく
、まず対象とする列を中心とした複数の列の濃度平均値
および濃度分散値からその平均値を求め、これを対象と
する列の濃度平均値および濃度分散値として用い濃淡性
微量を演算することが好ましく、このようにすることに
より、ノイズの影響をうけることなく個々の文字範囲を
より正確に検出することができる。
このようにして本発明によれば、画像データを行方向と
列方向に走査し、それぞれについて濃淡性微量を演算す
ることにより、行方向の特徴量の分布から文字行を、列
方向の特徴量の分布から各文字間の境界を検出し、画像
データからノイズに影響されることなく個々の文字を正
確に検出している。
= 23− そして、文字切出し手段は、このようにして検出された
個々の文字を画像データから切出し出力する。
し発明の効果」 以上説明したように、本発明によれば、従来技術のよう
に濃淡画像データを二値画像に変換することなく、濃淡
画像のままで文字検出を行うことができるため、防錆処
理や塗装によるむら、または照明の不均一等に起因して
発生する濃淡画像の背景部の濃淡むちゃ、背景部のノイ
ズ、あるいは文字部と背景部とのコントラストの変動等
にかかわりなく、画像データから正確に個々の文字を検
出し切出すことができる。
さらに、本発明によれば、従来技術のように閾値を設定
する必要はないなめ、撮像条件や照明の変動があった場
合にも、閾値を再設定する必要かなく、したがって、本
発明に係る文字切出し装置を各種生産現場で用いること
により、従来技術に比べ大幅な省力化をはたずことがで
きるという効果がある。
[実施例] 次に本発明の好適な実施例を図面に基づき説明する。
第2図には本発明か適用された文字認識装置1゛   
0の好適な実施例が示されており、図において、自動車
の車体の構成部品であるフレーム12には認識対象とな
る刻印文字Aが打刻されている。この刻印文字Aはたと
えば英数字および記号からなる11桁の文字列である。
実施例の文字認識装置10は、上記刻印文字Aを自動読
取するだめのものであり、本発明に係る文字切出し装置
100および文字識別装置200から構成されている。
前記文字切出し装置100は、刻印文字Aを蛍光灯20
で照明し、TV右カメラ2で撮像している。刻印文字A
は、溝になっている文字部分が影になり暗く、フレーム
12の表面部分が明るい濃淡画像としてとらえられる。
そして、文字切出し装W100は、′r■カメラ22か
ら出力される画像データから文字画像データを切出し、
文字識別装置200へ向は出力する。
そして、文字識別装置200は、入力される文字画像デ
ータと標準文字パターンとを比較し、文字の種別を判定
することにより、刻印文字Aの読取りを行う。
久ヱ豆■七葱1 本実施例において、文字切出し装W100は、TV右カ
メラ2から出力される画像データをA/D変換回路24
を介して文字候補濃度抽出回路26へ入力している。
この文字候補濃度抽出回路26は、画像データの背景部
分の濃淡むらを緩和して、文字候補となる領域の濃度を
抽出出力するよう形成されており、具体的には第1の画
像メモリ28、濃度置換回路30、第2の画像メモリ3
2)差分口&@34および第3の画像メモリ36から構
成されている。
そして、TV右カメラ2から出力されA/D変換回絡2
4てデジタル信号に変換された濃淡の画像データは第1
の画像メモリ28に記憶される。
この第1の画像メモリ28に記憶された濃淡画像データ
は、濃度置換回路30より、文字部の濃度が背景部の濃
度に置換えられて第2の画像メモリ32に記憶される。
このとき、濃淡画像データの文字部の濃度が大きく、背
景部の濃度が小さい場合には、文字部の濃度を背景部の
濃度に置換える処理として、注目する画素を含む周辺の
画素の中で最小値を選び、その値を注目する画素の値と
して置き換えてやtしはよい。
まl:、濃淡画像データの文字部の濃度か小さく背景部
の濃度が大きい場合には、注1]する画素を含む周辺の
画素の中て最大値を選び、その値を注l」する画素の値
として置き換えてやればよい。このような濃度の置換え
処理を、文字部が背景部により完全に置換えられるまで
くりかえし2て行う。
このようにすることにより、たとえば第1の画像メモリ
28内に、第3図(a)に示すような画像データが書込
まれている場合には、第2の画像メモリ32に、第31
ffi(c)に示すように文字部の濃度が背景部の濃度
に置換えられた画像データが記憶されることになる。
そして、差分回路34は、第1の画像メモリ28に記憶
されている画像データから第2の画像メモリ32に記憶
されている画像データを差分演算し、このようにして求
められた画像データを第3の画像メモリ36に記憶する
これにより、たとえば第1の画像メモリ28、第2の画
像メモリ32に第3図(a)、(c)に示すような画像
データが記憶されている場合には、第3の画像メモリ3
6には第3図(e)に示すように、画像データの背景部
の濃淡むらが緩和され、しかも文字部となる領域の濃度
が抽出された画像データが記憶されることとなる。
このようにして、本発明によれば、背景部に濃淡むらが
あったり、また文字部と背景部とのコントラス1−が変
動する画像データに対し、画像データの背景部分の濃淡
むらを緩和して、文字候補となる領域の28度を抽出し
l:良好な画像データを得ることがてきる。
そして、第3の画像メモリ36に記憶された画像−デー
タは、ノイズ除去口1絡38に向は出力される。
このノイズ除去回路38は、入力される画像データの濃
度別の頻度と平均頻度を計算し、平均頻度以上の頻度を
もつ濃度に限定して濃度レベルを平滑し、背景の濃度に
近い濃淡ノイズを除去する。
そして、このように部分的にノイズが除去された画像デ
ータは、ノイズ除去回路38から文字行検出回路40へ
向は出力される。
文字行検出回路40は、このようにして入力される画像
データを文字の行方向に走査することにより、各行毎の
濃淡特徴量を演算し、文字行の範囲を検出するよう形成
されており、V体的には第1の濃淡特微量泄算回路42
と第1の検出回路44を用いて構成されている。
前記第1の濃淡特徴量演算回路42は、ノイズ除去回路
38により部分的にノイズか除去された画像データを文
字の行方向に走査し、各行毎に、文字が存在するか否か
の程度を表す行単位の濃淡特徴量を演算する。
第5図には第1の濃淡特@量演算回路42の具体的構成
が示され、実施例の回路42は、濃度平均値演算部42
a、濃度分散値演算部42b、文字線候補抽出部42c
、文字線確率演算部42dおよ′U濃淡特微量演算部4
.2 eから成り、前述した行単位の濃淡特徴量の演算
を次のようにして行うよう形成されている。
まず、注目する行を中心として5行分の範囲にわたって
画像データを文字の行方向に走査する。
そして、この5行分の範囲の画像について、濃度別の頻
度を計算し、濃度別頻度を用いて画像濃度の平均値およ
び分散値を計算する。
次に、5行分の画像データに対して3画素×3画素の範
囲毎に、逐次局所的な濃度平均値および濃度平均値から
の濃度のバラツキ具合を計算し、局所的な濃度平均値が
濃度平均値よりも人で、かつ濃度のばらつき具合が予め
定めた固定値より人の場合に文字線の候補の範囲とする
次に、5行分の画像データの中に検出された文字線候補
の範囲と大きさと個数、位置的な散在の程度により、5
行分の画像データに文字線が含まれる確率を表すランク
、すなわち、文字線の出現確率を計算する。
5行分の画像データの範囲において、3画素×3画素の
局所的な範囲をとりえる回数に対して、文字線の候補の
範囲となった回数の割合を、文字線の出現確率とし、1
0段階のランクに分類する。
そして、濃度の分散値と、文字線が存在する確率を表わ
すランク値(文字出現確率)に、所定の重み係数を掛け
て演算することにより行単位の濃淡性微量を求め、この
値を注目する行、すなわち5行の中心の行の濃淡性微量
とする。
このような行単位の濃淡性微量の計算を各行について行
い、その演算結果を第1の検出回#t44へ向は出力す
る。
第1の検出回路44は、このようにして入力される行単
位の濃淡性微量に基づき、たとえば第4図(a)に示す
ような濃淡性微量の分布を作成する。この分布に基づき
、濃淡性微量の変化の最大となる行を、文字行の上端お
よび下端の候補として抽出し、その行の濃淡性微量の大
きさが、予め与えられた平均の高さと比べて妥当か否か
を判断する。そして、妥当であると判断された場合には
、文字行の上端および下端の値を文字行の範囲として検
出し、この検出データを文字検出回路46へ向は出力す
る。
文字検出回路46は、このようにして検出された文字行
の範囲内で、画像データをその文字列方向に走査するこ
とにより各列毎の濃淡性微量を演算し、個々の文字範囲
を検出するよう形成されており、具体的には第2の濃淡
特微量演算回&@48および第2の検出回路50を用い
て形成されている。
前記第2の濃淡特徴量演算回路48は、検出された文字
行の上端、下端の範囲内に限定して、各列毎に文字の一
部が存在する列か否かの程度を表す列単位の濃淡性微量
の演算を行う。
= 32− 第6図には第2の濃淡特徴量演算回路48の具体的構成
が示され、実施例の回路48は、濃度平均値演算部48
a、濃度分散値演算部48b、文字線候補抽出部48c
、文字線確率演算部48dおよび濃淡特徴量演算部48
eから成り、前述した列単位の濃淡性微量の演算を次の
ようにして行うよう形成されている。
まず画像データをその文字列方向に走査することにより
、注目する列を中心とする5行分の範囲の画像について
、前述した第1の濃淡特徴量演算回路42と同様にして
列単位の濃淡性微量を演算し、その値を注目する列、す
なわち5列の中心の列の濃淡性微量とする。
このような列単位の濃淡性微量の演算を、各列について
行い、演算されたデータを第2の検出回路50へ向は出
力する。
第2の検出回&@50は、このようにして入力される列
単位の濃淡性微量に基づき、第4図(b)に示すように
列毎の濃淡性微量の分布を作成する。
そして、この分布に基づき、濃淡時@量の変化の大きな
列から順に各文字の左端および右端を検出するうそして
、検出された文字は、予め与えられた平均文字幅(たと
えばr’l Jの様に幅の狭い文字は除く)と比べて妥
当か否がが判定される。
なお、「1」のように幅の狭い文字については、別途に
幅の狭い文字の平均文字幅と比較するとともに、文字の
高さが妥当か否かの再確認を行い、ノイズと区別してい
る。
このようにして、本発明によれば、たとえば第4図(a
>に示す行方向の濃淡性微量の分布がら文字行、第4図
(b)に示す列方向の濃淡性微量の分布から各文字間の
境界を検出することにより、ノイズに影響されることな
く個々の文字を正確に検出することかできる。
そして、文字抽出回路52は、このようにして検出され
た個々の文字を、画像データから切出し、文字識別装置
200へ向は出力する。
文字派別装置 文字識別装置200は、文字切出し装置1o。
により切出された個々の文字を二値化回路6oへ入力し
ている。この二値化回路60は、入力された個々の文字
を二値画像に変換し、位置正規化回路62へ向は出力す
る。
位置正規化回路62は、入力された文字の重心を求めて
、その重心を基準位置に合わせた後、類似度計算回路6
4へ向は出力する。
類似度清算回路46は、標準パターンメモリ68に予め
登録されている各文字種の標準パターンデータと、位置
正規化回路62から出力される各文字データとを逐次重
ね合わせながら、文字の種類とその一致の程度を表す類
似度をR1算し、文字判定回路66へ向は出力する。
文字判定回路66は、各文字の類似度を所定の判定基準
に照し7合わせ、判定された文字が正確に識別されたか
否かを判定する。
以上説明しl:ように、本発明に係る文字切出し装置1
00を用いることにより、刻印文字を正確に切出し、そ
の判読を正確に行うことかできる。
なお、本発明は前述した実施例に限定されるものではな
く、本発明の要旨の範囲内て各種の変形実施か可能であ
る。
たとえば、前記実施例においては、刻印文字を認識する
場合を例にとり説明したが、本発明はこれに限らず、必
要に応じて他の種類の文字の認識に用いてもよい。
、lJ:た、前記実施例においては、光学的な撮像手段
を用いた場合を例にとり説明したが、本発明はこれに限
らず、必要に応じて他のタイプの撮像手段を用いてもよ
い。
また、前記実施例においては、画像データの文字行を横
方向に、列方向を縦方向にとった場合を例にとり説明し
たが、本発明はこれに限らず、行方向を縦、列方向を横
にとり同様にして文字の切出しを行うことも可能である
【図面の簡単な説明】
第1図は本発明に係る文字切出し装置のクレーム対応図
、 = 36− 第2図は本発明が適用された文字識別装置の好適な実施
例を示すフロック回路図、 第3図は本発明に係る文字切出し装置の文字候補濃度抽
出動作を示す説明図、 第4図は本発明に係る文字切出し装置の文字行検出およ
び文字検出動作を示す説明図、第5図は第2図に示す実
施例の第1の濃淡特徴量検出回路の具体的な構成を示す
フロック回路図、第6図は第2図に示す実施例の第2の
濃淡特徴量演算回路の具体的な構成を示すブロック回路
図である。 22・・・T Vカメラ 26・・・文字候補濃度抽出回路 28・・・第1の画像メモリ 30・・・濃度置換回路 32・・・第2の画像メモリ 34・・・差分回路 36・・・第3の画像メモリ 38・・・ノイズ除去回路 40・・・文字行検出回路 42・・・第1の濃淡特徴1−演算回路44・・・第1
の検出回路 46・・・文字検出回路 48・・・第2の濃淡特徴量演算回路 50・・・第2の検出回路 52・・・文字抽出回路 1、 OO・・・文字切出し装置 A・・・刻印文字

Claims (5)

    【特許請求の範囲】
  1. (1)撮像手段を用いて読取られた文字を含む画像デー
    タから、個々の文字を切出す文字切出し装置において、 画像データの背景部分の濃淡むらを緩和して、文字候補
    となる領域の濃度を抽出する文字候補濃度抽出手段と、 文字候補濃度抽出手段から抽出出力された画像データを
    、文字の行方向に走査することにより各行ごとの濃淡特
    徴量を演算し、文字行の範囲を検出する文字行検出手段
    と、 検出された文字行の範囲内で、画像データをその文字列
    方向に走査することにより各列ごとの濃淡特徴量を演算
    し、個々の文字の範囲を検出する文字検出手段と、 を含み、検出された個々の文字を画像データから切出し
    出力することを特徴とする文字切出し装置。
  2. (2)特許請求の範囲(1)記載の装置において、前記
    文字候補濃度抽出手段は、画像データの狭い範囲で濃度
    が大きく変化する領域を、周りの背景と同じ濃度で置換
    える処理を行い、処理を施した濃淡画像データと元の濃
    淡画像データとの差分画像データを求めることにより、
    画像データの背景部分の濃淡むらを緩和して文字候補と
    なる領域の濃度を抽出するよう形成されてなることを特
    徴とする文字切出し装置。
  3. (3)特許請求の範囲(1)〜(2)のいずれかに記載
    の装置において、 前記文字行検出手段は、 画像データを、文字の行方向に走査することにより各行
    毎の濃度平均値および濃度分散値を求め、これらの値か
    ら文字線の候補となる範囲を抽出し各行における文字線
    の出現確率を求め、濃度分散値と文字線出現確率に基づ
    き各行毎の濃淡特徴量を演算するよう形成され、 前記文字検出手段は、 検出された文字行の範囲内で、画像データを文字の列方
    向に走査することにより各列毎の濃度平均値および濃度
    分散値を求め、これらの値から文字線の候補となる範囲
    を抽出し各列における文字線の出現確率を求め、濃度分
    散値と文字線出現確率に基づき各列毎の濃淡特徴量を演
    算し、個々の文字の範囲を検出することを特徴とする文
    字切出し装置。
  4. (4)特許請求の範囲(1)〜(3)のいずれかに記載
    の装置において、 前記文字行検出手段は、 対象とする行を挾む複数行の濃度平均値および濃度分散
    値の平均値を、対象とする行の濃度平均値および濃度分
    散値として用い濃淡特徴量を演算するよう形成され、 前記文字検出手段は、 対象とする列を挾む複数列の濃度平均値および濃度分散
    値の平均値を、対象とする列の濃度平均値および濃度分
    散値として用い濃淡特徴量を演算することを特徴とする
    文字切出し装置。
  5. (5)特許請求の範囲(1)〜(4)のいずれかに記載
    の装置において、 文字候補濃度抽出手段と文字行検出手段との間に文字候
    補濃度抽出手段から抽出出力された画像データからノイ
    ズを除去するノイズ除去手段を設けたことを特徴とする
    文字切出し装置。
JP63072433A 1988-03-25 1988-03-25 文字切出し装置 Pending JPH01244587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63072433A JPH01244587A (ja) 1988-03-25 1988-03-25 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63072433A JPH01244587A (ja) 1988-03-25 1988-03-25 文字切出し装置

Publications (1)

Publication Number Publication Date
JPH01244587A true JPH01244587A (ja) 1989-09-28

Family

ID=13489162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63072433A Pending JPH01244587A (ja) 1988-03-25 1988-03-25 文字切出し装置

Country Status (1)

Country Link
JP (1) JPH01244587A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0378358U (ja) * 1989-11-24 1991-08-08
JP2008097590A (ja) * 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0378358U (ja) * 1989-11-24 1991-08-08
JP2008097590A (ja) * 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
KR100523898B1 (ko) 이미지 프로세싱 방법 및 장치 및 기록 매체
US9324001B2 (en) Character recognition device and character segmentation method
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JPH0737103A (ja) 傾き角度検出装置
JPH096957A (ja) 濃度画像の2値化方法および画像2値化装置
CN116071763B (zh) 基于文字识别的教辅图书智能校编系统
CN114820625B (zh) 一种汽车顶块缺陷检测方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP2000184202A (ja) 走査により生成した画像上における垂直方向に並んだパタ―ンを除去するための画像処理システム
IL98293A (en) A method for distinguishing between text and graphics
JP2001043313A (ja) 文字切出し方法
Herwanto et al. Zoning feature extraction for handwritten Javanese character recognition
EP0505729B1 (en) Image binarization system
US6154565A (en) Automatic retrieval process for machine-printed or handwritten text on a background, in a multilevel digital image
JPH08305795A (ja) 文字認識方法
JPH0256688A (ja) 文字切出し装置
JPS61141087A (ja) 画像処理方法及び装置
JP4132766B2 (ja) 画像処理装置および方法
JPH01244587A (ja) 文字切出し装置
JP4492258B2 (ja) 文字・図形の認識方法および検査方法
CN112163581B (zh) 一种车牌字母识别方法、系统、装置及存储介质
JP2998443B2 (ja) 文字認識方法及びそのための装置
JP3307782B2 (ja) 文字マーク認識装置
JP4223295B2 (ja) ナンバープレート自動認識装置