JPH0896083A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0896083A JPH0896083A JP6233525A JP23352594A JPH0896083A JP H0896083 A JPH0896083 A JP H0896083A JP 6233525 A JP6233525 A JP 6233525A JP 23352594 A JP23352594 A JP 23352594A JP H0896083 A JPH0896083 A JP H0896083A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- character
- image
- character recognition
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 専門的な知識及び経験を必要とせずに、最適
な前処理手法及び認識処理手法を容易かつ短期間に設定
することができる文字認識装置を提供する。 【構成】 カメラ装置1に撮像された番号が記された製
品10の端面の画像によりその番号を認識する文字認識装
置2であって、複数の前処理手法,文字認識処理手法を
予め備えておき、複数のサンプル用画像の認識結果の統
計的処理に基づいて、最適な前処理手法と文字認識処理
手法との組み合わせを設定する。また、誤認識が生じた
場合にはその画像を保存しておき、保存画像を参照して
両手法の組み合わせを再設定する。
な前処理手法及び認識処理手法を容易かつ短期間に設定
することができる文字認識装置を提供する。 【構成】 カメラ装置1に撮像された番号が記された製
品10の端面の画像によりその番号を認識する文字認識装
置2であって、複数の前処理手法,文字認識処理手法を
予め備えておき、複数のサンプル用画像の認識結果の統
計的処理に基づいて、最適な前処理手法と文字認識処理
手法との組み合わせを設定する。また、誤認識が生じた
場合にはその画像を保存しておき、保存画像を参照して
両手法の組み合わせを再設定する。
Description
【0001】
【産業上の利用分野】本発明は、画像を入力し、入力し
た画像中に存在する文字を認識する文字認識装置に関す
る。
た画像中に存在する文字を認識する文字認識装置に関す
る。
【0002】
【従来の技術】入力画像に含まれる文字を自動的に認識
する文字認識装置は、パターン認識の一分野として最も
古くから開発されており、特に、近年の計算器の発達に
伴って目ざましい進歩を辿っており、オートメーション
化された工場,作業所において広く利用されるようにな
ってきた。このような文字認識装置では、一般的に、ま
ず、ノイズ除去,2値化,文字パターンの切出し,文字
の大きさ・傾き・濃度の正規化などの前処理を入力画像
に施し、その後、前処理された画像に認識処理を施して
画像中の文字を自動的に認識する。ところで、文字認識
における認識処理には、構造解析法,パターンマッチン
グ法,ニューラルネット法,加重方向ヒストグラム法な
どのように何種類かの手法がある。また、前処理におい
ても、文字パターンの切出しを例にとると、投影法,パ
ターンサーチ法,ラベリング法などがあり、2値化にお
いても種々の2値化手法が存在する。
する文字認識装置は、パターン認識の一分野として最も
古くから開発されており、特に、近年の計算器の発達に
伴って目ざましい進歩を辿っており、オートメーション
化された工場,作業所において広く利用されるようにな
ってきた。このような文字認識装置では、一般的に、ま
ず、ノイズ除去,2値化,文字パターンの切出し,文字
の大きさ・傾き・濃度の正規化などの前処理を入力画像
に施し、その後、前処理された画像に認識処理を施して
画像中の文字を自動的に認識する。ところで、文字認識
における認識処理には、構造解析法,パターンマッチン
グ法,ニューラルネット法,加重方向ヒストグラム法な
どのように何種類かの手法がある。また、前処理におい
ても、文字パターンの切出しを例にとると、投影法,パ
ターンサーチ法,ラベリング法などがあり、2値化にお
いても種々の2値化手法が存在する。
【0003】従って、入力画像の品質または画像に含ま
れる文字の字体に応じて、最適な前処理手法及び認識処
理手法を適用することが、認識率の向上を図るためには
大切である。従来では、文字認識装置を新たに設置する
前に、サンプル画像を入力して、そのサンプル画像を用
いて、専門家が適切な前処理手法及び認識処理手法を選
択してその文字認識装置に初期設定することとし、実際
の認識処理中に誤認識が多い場合には専門家の立会いの
もとで初期設定されたこれらの手法を調整,変更するこ
とが一般的である。
れる文字の字体に応じて、最適な前処理手法及び認識処
理手法を適用することが、認識率の向上を図るためには
大切である。従来では、文字認識装置を新たに設置する
前に、サンプル画像を入力して、そのサンプル画像を用
いて、専門家が適切な前処理手法及び認識処理手法を選
択してその文字認識装置に初期設定することとし、実際
の認識処理中に誤認識が多い場合には専門家の立会いの
もとで初期設定されたこれらの手法を調整,変更するこ
とが一般的である。
【0004】
【発明が解決しようとする課題】従来の文字認識装置で
は、最適な前処理手法及び認識処理手法を設定するため
には文字認識に関する専門的な知識及び経験が必要であ
り、一般の技術者では、最適な前処理手法及び認識処理
手法を選択できないという問題がある。また、専門家が
設定した前処理手法及び認識処理手法を適用した後に誤
認識が多く発生した場合に、専門家が不在であると、そ
の誤認識の原因の究明が困難であるため、再設定に長時
間を要するという問題もある。
は、最適な前処理手法及び認識処理手法を設定するため
には文字認識に関する専門的な知識及び経験が必要であ
り、一般の技術者では、最適な前処理手法及び認識処理
手法を選択できないという問題がある。また、専門家が
設定した前処理手法及び認識処理手法を適用した後に誤
認識が多く発生した場合に、専門家が不在であると、そ
の誤認識の原因の究明が困難であるため、再設定に長時
間を要するという問題もある。
【0005】本発明は斯かる事情に鑑みてなされたもの
であり、専門的な知識及び経験を必要とせず、最適な前
処理手法及び認識処理手法を容易かつ短期間に設定する
ことができる文字認識装置を提供することを目的とす
る。
であり、専門的な知識及び経験を必要とせず、最適な前
処理手法及び認識処理手法を容易かつ短期間に設定する
ことができる文字認識装置を提供することを目的とす
る。
【0006】
【課題を解決するための手段】本願の請求項1に係る文
字認識装置は、認識対象文字が含まれている画像を入力
し、入力した画像に2段階の処理を施して文字を認識す
る文字認識装置において、第1段階の複数の処理手法の
処理手順を格納している第1格納手段と、第2段階の複
数の処理手法の処理手順を格納している第2格納手段
と、入力される画像に応じて、前記第1格納手段及び第
2格納手段から第1段階及び第2段階の処理手法の処理
手順を選択する選択手段とを備えることを特徴とする。
字認識装置は、認識対象文字が含まれている画像を入力
し、入力した画像に2段階の処理を施して文字を認識す
る文字認識装置において、第1段階の複数の処理手法の
処理手順を格納している第1格納手段と、第2段階の複
数の処理手法の処理手順を格納している第2格納手段
と、入力される画像に応じて、前記第1格納手段及び第
2格納手段から第1段階及び第2段階の処理手法の処理
手順を選択する選択手段とを備えることを特徴とする。
【0007】本願の請求項2に係る文字認識装置は、請
求項1において、認識対象文字が含まれている複数の入
力画像に対する文字認識結果を統計的に処理する統計処
理手段を備え、前記選択手段が、前記統計処理手段の統
計結果を入力する手段と、入力した統計結果に基づい
て、前記第1格納手段及び第2格納手段から第1段階及
び第2段階の処理手法の処理手順を選択する手段とを有
することを特徴とする。
求項1において、認識対象文字が含まれている複数の入
力画像に対する文字認識結果を統計的に処理する統計処
理手段を備え、前記選択手段が、前記統計処理手段の統
計結果を入力する手段と、入力した統計結果に基づい
て、前記第1格納手段及び第2格納手段から第1段階及
び第2段階の処理手法の処理手順を選択する手段とを有
することを特徴とする。
【0008】本願の請求項3に係る文字認識装置は、認
識対象文字が含まれている画像を入力し、入力した画像
に後の認識処理を行うための前処理を施し、前処理後の
画像から文字を認識する文字認識装置において、複数の
前処理手法の処理手順と複数の文字認識手法の処理手順
とを格納している格納手段と、複数の認識対象画像を用
いて、格納されている前処理手法及び文字認識手法の処
理手順から両手法の処理手順の組み合わせを判断する判
断手段とを備えることを特徴とする。
識対象文字が含まれている画像を入力し、入力した画像
に後の認識処理を行うための前処理を施し、前処理後の
画像から文字を認識する文字認識装置において、複数の
前処理手法の処理手順と複数の文字認識手法の処理手順
とを格納している格納手段と、複数の認識対象画像を用
いて、格納されている前処理手法及び文字認識手法の処
理手順から両手法の処理手順の組み合わせを判断する判
断手段とを備えることを特徴とする。
【0009】本願の請求項4に係る文字認識装置は、請
求項1,2,または3において、入力した画像を保存す
る保存手段を更に備えることを特徴とする。
求項1,2,または3において、入力した画像を保存す
る保存手段を更に備えることを特徴とする。
【0010】
【作用】一般的な文字認識の処理は、前述したように、
入力画像の画質を改良したり、画像中の文字が存在する
領域を切り出したりする前処理と、前処理された画像か
ら文字を認識する文字認識処理とから構成されている。
本発明の文字認識装置にあっては、前処理,文字認識処
理で利用するそれぞれ複数の前処理手法,文字認識処理
手法を備えており、入力画像に応じて、最適な前処理手
法,文字認識処理手法を選択して、これを用いて画像中
の文字を認識する。また、複数のサンプル画像に対し
て、前処理手法と文字認識処理手法との種々の組み合わ
せを適用して文字認識を行い、その認識結果に統計的処
理を施して得られる統計結果に基づいて、最適な両手法
の組み合わせを選択するので、文字認識に対する専門的
な知識,経験がなくても短時間に最適な両手法の組み合
わせを設定できる。また、実際の入力画像を用いての現
場サイドにおけるこれらの両手法の再設定も容易に行え
る。更に、誤認識となった場合にはその入力画像を保存
しておくと、その保存した入力画像を参照することによ
り、誤認識の原因を容易に究明でき、これらの両手法の
再設定も短時間に行える。
入力画像の画質を改良したり、画像中の文字が存在する
領域を切り出したりする前処理と、前処理された画像か
ら文字を認識する文字認識処理とから構成されている。
本発明の文字認識装置にあっては、前処理,文字認識処
理で利用するそれぞれ複数の前処理手法,文字認識処理
手法を備えており、入力画像に応じて、最適な前処理手
法,文字認識処理手法を選択して、これを用いて画像中
の文字を認識する。また、複数のサンプル画像に対し
て、前処理手法と文字認識処理手法との種々の組み合わ
せを適用して文字認識を行い、その認識結果に統計的処
理を施して得られる統計結果に基づいて、最適な両手法
の組み合わせを選択するので、文字認識に対する専門的
な知識,経験がなくても短時間に最適な両手法の組み合
わせを設定できる。また、実際の入力画像を用いての現
場サイドにおけるこれらの両手法の再設定も容易に行え
る。更に、誤認識となった場合にはその入力画像を保存
しておくと、その保存した入力画像を参照することによ
り、誤認識の原因を容易に究明でき、これらの両手法の
再設定も短時間に行える。
【0011】
【実施例】以下、本発明をその実施例を示す図面に基づ
いて具体的に説明する。
いて具体的に説明する。
【0012】図1は、本発明の文字認識装置を利用した
製品番号検査装置の概略図である。図1において、10は
認識対象の文字(本例では製品番号を表す数字の並び)
が端面に刻印されている製品であり、製品10は順次搬送
されてくる。製品10の搬送域には、製品10の端面(番号
刻印面)を撮像するカメラ装置1が設けられており、カ
メラ装置1は撮像した画像を本発明の文字認識装置2へ
出力する。文字認識装置2は、カメラ装置1からの入力
画像に対して、後述するような最適な手法を用いた前処
理及び認識処理を施して製品10の番号の認識を行い、認
識結果を表示装置4へ出力する。表示装置4は認識結果
を表示する。また、製品10の番号を管理している文字認
識装置2に対する上位計算器3が、文字認識装置2に接
続されており、上位計算器3から文字認識装置2へ製品
10の予定番号が搬送順に入力される。
製品番号検査装置の概略図である。図1において、10は
認識対象の文字(本例では製品番号を表す数字の並び)
が端面に刻印されている製品であり、製品10は順次搬送
されてくる。製品10の搬送域には、製品10の端面(番号
刻印面)を撮像するカメラ装置1が設けられており、カ
メラ装置1は撮像した画像を本発明の文字認識装置2へ
出力する。文字認識装置2は、カメラ装置1からの入力
画像に対して、後述するような最適な手法を用いた前処
理及び認識処理を施して製品10の番号の認識を行い、認
識結果を表示装置4へ出力する。表示装置4は認識結果
を表示する。また、製品10の番号を管理している文字認
識装置2に対する上位計算器3が、文字認識装置2に接
続されており、上位計算器3から文字認識装置2へ製品
10の予定番号が搬送順に入力される。
【0013】図2は、図1における本発明の文字認識装
置2の内部構成を示すブロック図である。図2におい
て、21はカメラ装置1からの撮影画像またはサンプル画
像を入力する画像入力部であり、画像入力部21は入力し
た画像を文字認識処理部22へ出力する。文字認識処理部
22は、前処理手法格納部23に格納されている複数の前処
理手法からの1つの前処理手法と、認識処理手法格納部
24に格納されている複数の認識処理手法からの1つの認
識処理手法との組み合わせを適用して、入力画像に対し
て前処理及び認識処理を施して、その認識処理結果を処
理結果保存部25へ出力する。処理結果保存部25は、この
認識処理結果を保存する。統計処理部26は、処理結果保
存部25に保存されている認識処理結果に統計的処理を施
してその統計処理結果を表示装置4へ出力する。文字認
識処理部22での認識結果が誤認識であった場合には、そ
の対象となった入力画像を、文字認識処理部22から画像
保存部27に出力して保存する。
置2の内部構成を示すブロック図である。図2におい
て、21はカメラ装置1からの撮影画像またはサンプル画
像を入力する画像入力部であり、画像入力部21は入力し
た画像を文字認識処理部22へ出力する。文字認識処理部
22は、前処理手法格納部23に格納されている複数の前処
理手法からの1つの前処理手法と、認識処理手法格納部
24に格納されている複数の認識処理手法からの1つの認
識処理手法との組み合わせを適用して、入力画像に対し
て前処理及び認識処理を施して、その認識処理結果を処
理結果保存部25へ出力する。処理結果保存部25は、この
認識処理結果を保存する。統計処理部26は、処理結果保
存部25に保存されている認識処理結果に統計的処理を施
してその統計処理結果を表示装置4へ出力する。文字認
識処理部22での認識結果が誤認識であった場合には、そ
の対象となった入力画像を、文字認識処理部22から画像
保存部27に出力して保存する。
【0014】次に、動作について説明する。本実施例の
文字認識装置2は0〜9までの数字を認識する。前処理
手法格納部23には、画像の2値化手法として、しきい値
が固定である固定2値化手法と、しきい値が画像信号レ
ベルに応じて変化する浮動2値化手法と、濃度ヒストグ
ラムを用いて統計的に決定したしきい値を有する大津の
2値化手法との3種類の手法のそれぞれの処理手順が格
納されている。また、前処理手法格納部23には、文字パ
ターンの切出し手法として、2次元方向からの投影によ
り文字部分を推定して切り出す投影手法と、特有のパタ
ーンを検索し予め決められている文字間隔,文字の大き
さにより切り出すパターンサーチ法と、同一画素値の画
素を連結させた連結成分の存在により切り出すラベリン
グ法との3種類の手法のそれぞれの処理手順が格納され
ている。
文字認識装置2は0〜9までの数字を認識する。前処理
手法格納部23には、画像の2値化手法として、しきい値
が固定である固定2値化手法と、しきい値が画像信号レ
ベルに応じて変化する浮動2値化手法と、濃度ヒストグ
ラムを用いて統計的に決定したしきい値を有する大津の
2値化手法との3種類の手法のそれぞれの処理手順が格
納されている。また、前処理手法格納部23には、文字パ
ターンの切出し手法として、2次元方向からの投影によ
り文字部分を推定して切り出す投影手法と、特有のパタ
ーンを検索し予め決められている文字間隔,文字の大き
さにより切り出すパターンサーチ法と、同一画素値の画
素を連結させた連結成分の存在により切り出すラベリン
グ法との3種類の手法のそれぞれの処理手順が格納され
ている。
【0015】一方、認識処理手法格納部24には、文字の
認識処理手法として、標準の辞書との類似度に基づいて
認識するパターンマッチング手法と、生物の神経細胞の
連係を模擬したニューラルネットワーク手法(詳細は川
崎製鉄技報Vol.23,No.3(1991),pp.253-260に記載)との
2種類の手法のそれぞれの処理手順が格納されている。
認識処理手法として、標準の辞書との類似度に基づいて
認識するパターンマッチング手法と、生物の神経細胞の
連係を模擬したニューラルネットワーク手法(詳細は川
崎製鉄技報Vol.23,No.3(1991),pp.253-260に記載)との
2種類の手法のそれぞれの処理手順が格納されている。
【0016】まず、本発明の文字認識装置2における最
適な前処理手法及び認識処理手法の初期設定時の動作に
ついて説明する。初期設定時には、複数のサンプル画像
と正解の文字列とを文字認識装置2に入力する。文字認
識装置2内の画像入力部21を介して入力されたサンプル
画像は、表示装置4に順次表示される。
適な前処理手法及び認識処理手法の初期設定時の動作に
ついて説明する。初期設定時には、複数のサンプル画像
と正解の文字列とを文字認識装置2に入力する。文字認
識装置2内の画像入力部21を介して入力されたサンプル
画像は、表示装置4に順次表示される。
【0017】オペレータは、表示画像を見ながら、0〜
9までのサンプル数字についてそれぞれ少なくとも1個
の標準サンプルを抽出する。そして、この標準サンプル
を用いて、文字認識装置2は、パターンマッチングの辞
書を作成すると共に、ニューラルネットワークの学習を
行う。
9までのサンプル数字についてそれぞれ少なくとも1個
の標準サンプルを抽出する。そして、この標準サンプル
を用いて、文字認識装置2は、パターンマッチングの辞
書を作成すると共に、ニューラルネットワークの学習を
行う。
【0018】次に、各サンプル画像に対して、以下の手
順に従って文字認識を行う。図3はその動作手順を示す
フローチャートである。まず、前処理手法格納部23に格
納されている上述した3種類の手法(固定2値化手法,
浮動2値化手法,大津の2値化手法)のうちから1つの
2値化手法を選択し(ステップS1)、また、前処理手
法格納部23に格納されている上述した3種類の手法(投
影手法,パターンサーチ法,ラベリング法)のうちから
1つの文字パターンの切出し手法を選択する(ステップ
S2)。選択したこれらの手法を適用して、入力したサ
ンプル画像に前処理を施すが、この際に文字切出しが可
能であったか否かを判断する(ステップS3)。切出し
が可能であれば認識処理を施すべくステップS4に進
む。一方、切出しが不可能である場合には、リジェクシ
ョンとして処理して(ステップS5)、ステップS7に
進む。
順に従って文字認識を行う。図3はその動作手順を示す
フローチャートである。まず、前処理手法格納部23に格
納されている上述した3種類の手法(固定2値化手法,
浮動2値化手法,大津の2値化手法)のうちから1つの
2値化手法を選択し(ステップS1)、また、前処理手
法格納部23に格納されている上述した3種類の手法(投
影手法,パターンサーチ法,ラベリング法)のうちから
1つの文字パターンの切出し手法を選択する(ステップ
S2)。選択したこれらの手法を適用して、入力したサ
ンプル画像に前処理を施すが、この際に文字切出しが可
能であったか否かを判断する(ステップS3)。切出し
が可能であれば認識処理を施すべくステップS4に進
む。一方、切出しが不可能である場合には、リジェクシ
ョンとして処理して(ステップS5)、ステップS7に
進む。
【0019】次に、認識処理手法格納部24に格納されて
いる上述した2種類の手法(パターンマッチング手法,
ニューラルネットワーク手法)のうちから1つの認識処
理手法を選択し(ステップS4)、この選択した認識処
理手法に従って、前処理が終わったサンプル画像に認識
処理を施し、文字認識を行って、認識結果を予め入力し
ておいた正解と照合して照合結果を得る(ステップS
6)。
いる上述した2種類の手法(パターンマッチング手法,
ニューラルネットワーク手法)のうちから1つの認識処
理手法を選択し(ステップS4)、この選択した認識処
理手法に従って、前処理が終わったサンプル画像に認識
処理を施し、文字認識を行って、認識結果を予め入力し
ておいた正解と照合して照合結果を得る(ステップS
6)。
【0020】次に、同一のサンプル画像に対して、上述
の例と、2値化手法,文字パターンの切出し手法,認識
処理手法の何れかを変えて同様の手順(ステップS1〜
S6)にて別の照合結果を得る。以下、全く同様にこれ
らの手法の組み合わせを変えて同一のサンプル画像に前
処理及び文字認識処理を施して、それぞれの場合の照合
結果を得る。1つの同一のサンプル画像について、前処
理手法格納部23に格納されている2値化手法と文字パタ
ーンの切出し手法と認識処理手法格納部24に格納されて
いる認識処理手法とのすべての組合わせによる18(=3
×3×2)通りの場合について認識処理を行った後(ス
テップS7:YES)に、得られた照合結果を正解文字
列と共に処理結果保存部25に保存する。
の例と、2値化手法,文字パターンの切出し手法,認識
処理手法の何れかを変えて同様の手順(ステップS1〜
S6)にて別の照合結果を得る。以下、全く同様にこれ
らの手法の組み合わせを変えて同一のサンプル画像に前
処理及び文字認識処理を施して、それぞれの場合の照合
結果を得る。1つの同一のサンプル画像について、前処
理手法格納部23に格納されている2値化手法と文字パタ
ーンの切出し手法と認識処理手法格納部24に格納されて
いる認識処理手法とのすべての組合わせによる18(=3
×3×2)通りの場合について認識処理を行った後(ス
テップS7:YES)に、得られた照合結果を正解文字
列と共に処理結果保存部25に保存する。
【0021】上述したような処理を入力されたすべての
サンプル画像について行い(ステップS8:YES)、
各サンプル画像における照合結果と正解文字列とを処理
結果保存部25に保存する。
サンプル画像について行い(ステップS8:YES)、
各サンプル画像における照合結果と正解文字列とを処理
結果保存部25に保存する。
【0022】すべてのサンプル画像に対する処理が終わ
ると、統計処理部26は、処理結果保存部25に保存されて
いる照合結果に基づいて、0〜9までの各数字に応じて
正解率,誤読率,不読率を求めるなどの統計的処理を行
う。統計処理部26にて求められた結果、つまり、サンプ
ル数,リジェクト数,正解率,誤読率,不読率が、各手
法の組み合わせ毎に、下記表1に示すように、表示装置
4に表示される。下記表1の例では、2値化手法,文字
パターンの切出し手法,認識処理手法として、それぞれ
固定2値化手法,投影法,パターンマッチング手法を組
み合わせた場合の統計処理結果を一例として示してい
る。
ると、統計処理部26は、処理結果保存部25に保存されて
いる照合結果に基づいて、0〜9までの各数字に応じて
正解率,誤読率,不読率を求めるなどの統計的処理を行
う。統計処理部26にて求められた結果、つまり、サンプ
ル数,リジェクト数,正解率,誤読率,不読率が、各手
法の組み合わせ毎に、下記表1に示すように、表示装置
4に表示される。下記表1の例では、2値化手法,文字
パターンの切出し手法,認識処理手法として、それぞれ
固定2値化手法,投影法,パターンマッチング手法を組
み合わせた場合の統計処理結果を一例として示してい
る。
【0023】
【表1】
【0024】2値化手法,文字パターンの切出し手法,
認識処理手法から1つずつ選択した18通りの組み合わせ
の中で、全体の正解率が最も高い手法の組み合わせ、全
体の誤読率が最も低い手法の組み合わせ、文字毎の認識
率が最も低いものを比較した場合にその認識率が最も高
い手法の組み合わせ、文字毎の誤読率が最も高いものを
比較した場合にその誤読率が最も低い手法の組み合わせ
を、下記表2に示すように表示装置4に表示する。
認識処理手法から1つずつ選択した18通りの組み合わせ
の中で、全体の正解率が最も高い手法の組み合わせ、全
体の誤読率が最も低い手法の組み合わせ、文字毎の認識
率が最も低いものを比較した場合にその認識率が最も高
い手法の組み合わせ、文字毎の誤読率が最も高いものを
比較した場合にその誤読率が最も低い手法の組み合わせ
を、下記表2に示すように表示装置4に表示する。
【0025】
【表2】
【0026】そして、オペレータは、表示装置4に表示
された統計処理に基づくこれらの表示内容を参照して、
最適な手法の組み合わせを選択する。この際、表2の
(a)に示すような全体の正解率が最も高かった組み合
わせを選択しても良いし、表2の(b)に示すような全
体の誤読率が最も低かった組み合わせを選択しても良い
し、表2の(c)に示すような0〜9までの各数字毎で
比較した最低正解率が最も高かった組み合わせを選択し
ても良いし、表2の(d)に示すような各数字毎で比較
した最高誤読率が最も低かった組み合わせを選択しても
良い。
された統計処理に基づくこれらの表示内容を参照して、
最適な手法の組み合わせを選択する。この際、表2の
(a)に示すような全体の正解率が最も高かった組み合
わせを選択しても良いし、表2の(b)に示すような全
体の誤読率が最も低かった組み合わせを選択しても良い
し、表2の(c)に示すような0〜9までの各数字毎で
比較した最低正解率が最も高かった組み合わせを選択し
ても良いし、表2の(d)に示すような各数字毎で比較
した最高誤読率が最も低かった組み合わせを選択しても
良い。
【0027】次に、製品10に刻印された番号を実際に認
識する動作について説明する。製品10はカメラ装置1に
対向する位置まで順次搬送されて、カメラ装置1にて番
号が刻印された端面が撮像される。カメラ装置1にて得
られた画像データは、文字認識装置2へ入力される。画
像入力部21を介して入力された画像データに対して、文
字認識処理部22にて、前処理手法格納部23及び認識処理
手法格納部24に格納されている上述の初期設定時に選択
された最適な前処理手法及び認識処理手法に従って、前
処理及び文字認識処理を施し、製品10に刻印された番号
を読み取る。
識する動作について説明する。製品10はカメラ装置1に
対向する位置まで順次搬送されて、カメラ装置1にて番
号が刻印された端面が撮像される。カメラ装置1にて得
られた画像データは、文字認識装置2へ入力される。画
像入力部21を介して入力された画像データに対して、文
字認識処理部22にて、前処理手法格納部23及び認識処理
手法格納部24に格納されている上述の初期設定時に選択
された最適な前処理手法及び認識処理手法に従って、前
処理及び文字認識処理を施し、製品10に刻印された番号
を読み取る。
【0028】このようなオンラインでの製品10の番号の
認識時にあって、誤って認識した場合または認識不可能
な場合には、その誤読時の画像または不読時の画像を、
後の調整時に参考とするために、画像保存部27へ保存し
ておく。
認識時にあって、誤って認識した場合または認識不可能
な場合には、その誤読時の画像または不読時の画像を、
後の調整時に参考とするために、画像保存部27へ保存し
ておく。
【0029】次に、一旦選択した手法の組み合わせを調
整して変更する場合の動作について説明する。実際のオ
ンラインでの認識処理時に画像保存部27へ保存された画
像を参照して、誤読または不読の原因を究明し、その原
因に基づいて、設定されている手法の組み合わせを最適
な組み合わせに変更する。また、この際同時に、製品10
を撮像するカメラ装置1の光学系などの撮像条件を改善
して、正解率の向上を図ることも大切である。
整して変更する場合の動作について説明する。実際のオ
ンラインでの認識処理時に画像保存部27へ保存された画
像を参照して、誤読または不読の原因を究明し、その原
因に基づいて、設定されている手法の組み合わせを最適
な組み合わせに変更する。また、この際同時に、製品10
を撮像するカメラ装置1の光学系などの撮像条件を改善
して、正解率の向上を図ることも大切である。
【0030】なお、上述の実施例にあっては、前処理に
おける2値化手法,文字パターンの切出し手法としてそ
れぞれ3種類の手法が備えられ、認識処理手法として2
種類の手法が備えられている場合について説明したが、
これは例示であり、予め備えておく手法は何種類であっ
てもよい。また、ノイズ除去,正規化などの他の前処理
についても複数の手法を備えていて、これらも加えて最
適な組み合わせを設定するようにしてもよいことは言う
までもない。
おける2値化手法,文字パターンの切出し手法としてそ
れぞれ3種類の手法が備えられ、認識処理手法として2
種類の手法が備えられている場合について説明したが、
これは例示であり、予め備えておく手法は何種類であっ
てもよい。また、ノイズ除去,正規化などの他の前処理
についても複数の手法を備えていて、これらも加えて最
適な組み合わせを設定するようにしてもよいことは言う
までもない。
【0031】また、上述の実施例では製品の端面に刻印
された番号を認識する場合について説明したが、これは
一例であって、他の用途の文字認識についても本発明を
適用できることは勿論である。
された番号を認識する場合について説明したが、これは
一例であって、他の用途の文字認識についても本発明を
適用できることは勿論である。
【0032】
【発明の効果】以上のように、本発明の文字認識装置で
は、予め備えている複数の前処理手法,文字認識手法か
ら入力画像に応じて最適な手法の組み合わせを選択し
て、画像中の文字を認識するので、文字認識に対する専
門的な知識,経験がなくても短時間に最適な両手法の組
み合わせを初期設定できる。また、誤認識となった場合
にはその入力画像を保存しておくので、保存した入力画
像を参照して誤認識の原因を容易に究明でき、その原因
を解消するためのこれらの両手法の再設定も短時間に行
うことができる。
は、予め備えている複数の前処理手法,文字認識手法か
ら入力画像に応じて最適な手法の組み合わせを選択し
て、画像中の文字を認識するので、文字認識に対する専
門的な知識,経験がなくても短時間に最適な両手法の組
み合わせを初期設定できる。また、誤認識となった場合
にはその入力画像を保存しておくので、保存した入力画
像を参照して誤認識の原因を容易に究明でき、その原因
を解消するためのこれらの両手法の再設定も短時間に行
うことができる。
【図1】本発明の文字認識装置を利用した製品番号検査
装置の概略図である。
装置の概略図である。
【図2】本発明の文字認識装置の内部構成を示すブロッ
ク図である。
ク図である。
【図3】本発明の文字認識装置における初期設定時の動
作手順を示すフローチャートである。
作手順を示すフローチャートである。
1 カメラ装置 2 文字認識装置 3 上位計算器 4 表示装置 10 製品 21 画像入力部 22 文字認識処理部 23 前処理手法格納部 24 認識処理手法格納部 25 処理結果保存部 26 統計処理部 27 画像保存部
───────────────────────────────────────────────────── フロントページの続き (71)出願人 000001199 株式会社神戸製鋼所 兵庫県神戸市中央区脇浜町1丁目3番18号 (72)発明者 和田 正人 大阪府大阪市中央区北浜4丁目5番33号 住友金属工業株式会社内 (72)発明者 橋詰 基 東京都千代田区丸の内一丁目1番2号 日 本鋼管株式会社内 (72)発明者 高橋 暢 岡山県倉敷市水島川崎通1丁目(番地な し) 川崎製鉄株式会社水島製鉄所内 (72)発明者 長谷川 裕之 兵庫県加古川市金沢町1番地 株式会社神 戸製鋼所加古川製鉄所内
Claims (4)
- 【請求項1】 認識対象文字が含まれている画像を入力
し、入力した画像に2段階の処理を施して文字を認識す
る文字認識装置において、第1段階の複数の処理手法の
処理手順を格納している第1格納手段と、第2段階の複
数の処理手法の処理手順を格納している第2格納手段
と、入力される画像に応じて、前記第1格納手段及び第
2格納手段から第1段階及び第2段階の処理手法の処理
手順を選択する選択手段とを備えることを特徴とする文
字認識装置。 - 【請求項2】 認識対象文字が含まれている複数の入力
画像に対する文字認識結果を統計的に処理する統計処理
手段を備え、前記選択手段が、前記統計処理手段の統計
結果を入力する手段と、入力した統計結果に基づいて、
前記第1格納手段及び第2格納手段から第1段階及び第
2段階の処理手法の処理手順を選択する手段とを有する
ことを特徴とする請求項1記載の文字認識装置。 - 【請求項3】 認識対象文字が含まれている画像を入力
し、入力した画像に後の認識処理を行うための前処理を
施し、前処理後の画像から文字を認識する文字認識装置
において、複数の前処理手法の処理手順と複数の文字認
識手法の処理手順とを格納している格納手段と、複数の
認識対象画像を用いて、格納されている前処理手法及び
文字認識手法の処理手順から両手法の処理手順の組み合
わせを判断する判断手段とを備えることを特徴とする文
字認識装置。 - 【請求項4】 入力した画像を保存する保存手段を更に
備えることを特徴とする請求項1,2または3記載の文
字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6233525A JPH0896083A (ja) | 1994-09-28 | 1994-09-28 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6233525A JPH0896083A (ja) | 1994-09-28 | 1994-09-28 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0896083A true JPH0896083A (ja) | 1996-04-12 |
Family
ID=16956410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6233525A Pending JPH0896083A (ja) | 1994-09-28 | 1994-09-28 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0896083A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014071813A (ja) * | 2012-10-01 | 2014-04-21 | Fuji Xerox Co Ltd | 文字認識装置及びプログラム |
JP2017191565A (ja) * | 2016-04-15 | 2017-10-19 | オムロン株式会社 | 画像処理装置、光学コード読取装置、画像処理方法、情報処理プログラムおよび記録媒体 |
JPWO2018158814A1 (ja) * | 2017-02-28 | 2019-12-12 | 日本電気株式会社 | 点検支援装置、点検支援方法およびプログラム |
JP2020181599A (ja) * | 2020-07-21 | 2020-11-05 | オムロン株式会社 | 画像処理装置、光学コード読取装置、画像処理方法、情報処理プログラムおよび記録媒体 |
-
1994
- 1994-09-28 JP JP6233525A patent/JPH0896083A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014071813A (ja) * | 2012-10-01 | 2014-04-21 | Fuji Xerox Co Ltd | 文字認識装置及びプログラム |
JP2017191565A (ja) * | 2016-04-15 | 2017-10-19 | オムロン株式会社 | 画像処理装置、光学コード読取装置、画像処理方法、情報処理プログラムおよび記録媒体 |
JPWO2018158814A1 (ja) * | 2017-02-28 | 2019-12-12 | 日本電気株式会社 | 点検支援装置、点検支援方法およびプログラム |
US11003911B2 (en) | 2017-02-28 | 2021-05-11 | Nec Corporation | Inspection assistance device, inspection assistance method, and recording medium |
JP2020181599A (ja) * | 2020-07-21 | 2020-11-05 | オムロン株式会社 | 画像処理装置、光学コード読取装置、画像処理方法、情報処理プログラムおよび記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569878B (zh) | 一种基于卷积神经网络的照片背景相似度聚类方法及计算机 | |
CN111626146B (zh) | 一种基于模板匹配的合并单元格表格分割识别方法 | |
CN112070649A (zh) | 一种去除特定字符串水印的方法及系统 | |
US11715288B2 (en) | Optical character recognition using specialized confidence functions | |
CN111415336A (zh) | 一种图像篡改识别方法、装置、服务器及存储介质 | |
CN117392042A (zh) | 缺陷检测方法、缺陷检测设备及存储介质 | |
CN115937651A (zh) | 基于改进的yolov5s网络模型的圆柱滚子表面检测方法及系统 | |
CN110766026A (zh) | 一种快速识别卡号的方法及装置、模型训练方法及装置 | |
CN113705468B (zh) | 基于人工智能的数字图像识别方法及相关设备 | |
CN111985269A (zh) | 检测模型构建方法、检测方法、装置、服务器及介质 | |
US6694059B1 (en) | Robustness enhancement and evaluation of image information extraction | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 | |
EP0594061B1 (en) | Apparatus for verifying a container code | |
JPH0896083A (ja) | 文字認識装置 | |
CN111414889A (zh) | 基于文字识别的财务报表识别方法及装置 | |
CN114972857B (zh) | 双分支源与目标定位复制移动检测网络系统及方法 | |
Mulyana et al. | Optimization of Text Mining Detection of Tajweed Reading Laws Using the Yolov8 Method on the Qur'an | |
CN115984211A (zh) | 视觉定位方法、机器人及存储介质 | |
CN109002821A (zh) | 一种基于连通域和切线斜率的网银盾数字识别方法 | |
CN117576416B (zh) | 工件边缘区域的检测方法、设备及存储介质 | |
JP2000322514A (ja) | パターン抽出装置及び文字切り出し装置 | |
CN118261874B (zh) | 基于图像分割大模型和多元高阶回归拟合的鱼竿钓性分析方法 | |
CN116168398B (zh) | 基于图像识别的试卷审批方法、装置和设备 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
CN113888753A (zh) | 基于多特征级联模型的工业质检图像文字匹配方法及装置 |