JP2011108025A - 文字認識方法及び文字認識装置 - Google Patents

文字認識方法及び文字認識装置 Download PDF

Info

Publication number
JP2011108025A
JP2011108025A JP2009262997A JP2009262997A JP2011108025A JP 2011108025 A JP2011108025 A JP 2011108025A JP 2009262997 A JP2009262997 A JP 2009262997A JP 2009262997 A JP2009262997 A JP 2009262997A JP 2011108025 A JP2011108025 A JP 2011108025A
Authority
JP
Japan
Prior art keywords
character
predetermined
character string
dimensional image
arrangement line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009262997A
Other languages
English (en)
Other versions
JP5280337B2 (ja
Inventor
Kazuhisa Hamamoto
和久 浜元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2009262997A priority Critical patent/JP5280337B2/ja
Publication of JP2011108025A publication Critical patent/JP2011108025A/ja
Application granted granted Critical
Publication of JP5280337B2 publication Critical patent/JP5280337B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)

Abstract

【課題】蛇行している文字列や複数行に亘る文字列の中から、確実に所定の文字を抽出(切り出す)ことができるようにする。
【解決手段】文字列11a、11bが複数有する2次元画像Pを取得し、2次元画像Pの中から文字列11aに存在する所定文字12を抽出して当該所定文字12を画像処理により認識する文字認識方法であって、2次元画像Pにおける文字列11a、11bの配置ラインL1、L2を推定し、配置ラインL1、L2上の文字列11a、11bの中から所定文字12の位置を推定し、所定文字12の位置に対して文字認識処理を行うことで、当該所定文字12を認識する。
【選択図】図4

Description

本発明は、例えば、2次元画像を用いた文字認識において、対象物上に施された一連の文字列から所定の文字を抽出(切り出す)ことが可能な文字認識方法及び文字認識装置に関する。
工場等における生産管理の一例として、個々の製品等に対して刻印により固有の識別番号を施し、それをCCDカメラやラインセンサ等の計測機器を用いて検出し、コンピュータを用いて自動的に文字を認識させることで、製造工程及び在庫を管理することが行なわれている。
CCDカメラで得られた画像は2次元画像である。ラインセンサで得られた画像はライン画像であるものの、フレームメモリ等に蓄えられることで、2次元画像とすることができる。係る2次元画像内には、「製造番号XXX」「重量YYY]「高さZZZ]といったように複数の文字からなる文字列が写り込んでおり、現場で行われる画像処理としては、例えば、製造番号XXXのみを抽出・認識し、製品の管理等を行っている。
このように一連の文字列が写り込んでいる2次元画像の中から、ある特定の文字を抽出する(文字領域の切り出す)ための技術として、特許文献1及び特許文献2に開示されたものがある。
例えば、特許文献1は、1又は複数の文字列を撮像してディジタル画像信号を得、これを処理して得た画像内の文字を認識すべく画像内の文字を切り出す方法において、予め文字を切り出すための文字の高さに相当する列サイズ、文字の幅に相当する行サイズ、及び同じ文字列の高い位置にある文字と低い位置にある文字との最大高低差を求めておき、文字列の画像を文字列の方向に投影して得た濃淡に関連する値の文字高さ方向の中央に相当する位置である第1基準点を求め、第1基準点を中心に前記列サイズと前記最大高低差との和に相当する高さで文字列を切り出すステップと、切り出した文字列に対して、文字列と直交する方向に投影して得た濃淡に関連する値の各文字幅方向の中央に相当する位置である第2基準点をそれぞれ求め、第2基準点を中心に、前記行サイズで各文字を切り出すステップと、切り出した各文字それぞれに対して、文字列の方向に投影して得た濃淡に関連する値の文字高さ方向の中央に相当する位置である第3基準点を求め、各第3基準点を中心に前記列サイズで各文字を切り出すステップとを備える文字切り出し方法を開示する。
特許文献2は、文字列画像から文字切り出し候補を生成する文字切り出し装置において、前記文字列画像を入力して記憶する文字列画像記憶部と、前記文字列画像を二値化して連結成分を抽出する連結成分抽出部と、全ての前記連結成分に対して接触しているかどうかの判定を行い、連結成分が接触していない判定されたときに該連結成分自体を最小単位とし、連結成分が接触していると判定されたときに該連結成分を切断して新たに最小単位を作成する最小単位作成部と、2次元空間上に配置された状態の前記最小単位同士の2次元的な接続関係を求める2次元接続関係作成部と、互いに接続関係にある複数の前記最小単位同士を組み合わせて組み合わせパターンを作成し、正しい文字である可能性の高い組み合わせパターンを文字切り出し候補として出力する文字切り出し候補出力部と、を少なくとも有する文字切り出し装置を開示する。
特許第3066448号公報 特開2002−312719号公報
特許文献1に記載された技術は、Y方向の投影機度分布に基づいて全文字を含むように行領域を取得し、続いて、X方向の投影機度分布に基づいて各文字のX座標と特定することで、文字領域を概略で取得するものである。その後、再びY方向の投影機度分布に基づいて、1文字ごとにY方向座標と特定する。この技術を用いることで、切り出したい特定文字列を含む文字列が1行であるならば、当該文字列が蛇行していても問題なく特定文字列を抽出可能であるし、仮に文字列が複数行存在しても、各文字列のズレ量が行間隔未満ならば、特定文字列の切り出しが可能なものとなっている。
特許文献2に記載された技術は、取得した文字画像を2値化して、ブロブといわれる連結成分を抽出する。その後、全ブロブにおいて、接触・非接触の判定をかけ、接触判定されたブロブは接触部位を切断して、また非接触判定のブロブはそのままで「最小単位」とする。次に「最小単位」同士の接続関係を求めて組み合わせることで「組み合わせパターン」を作成して「文字切り出し候補」として出力し、認識処理と言語知識処理とレイアウト解析を行った上で文字抽出結果を出力する。この技術は、複数行の手書き文字も想定しており、文字が歪んでいても文字抽出が可能である。
しかしながら、実際の現場においては、製品に対して、複数の工程で文字を刻印して文字列全体を構成することが多々あり、文字の位置ズレが発生することは否めない。位置ズレ量は場合によっては行間以上の幅になる可能性もある。
例えば、図2(a)に示すように、ある工程で「製造番号」「重量」「高さ」の刻印を製品の表面に施し、その後の別の工程で「003」「102」「200.0」を刻印することがある。その場合、「製造番号」「重量」「高さ」は同じ水平位置に存在するものの、「003」「102」「200.0」の文字は異なった水平位置に存在し、全体として文字列が蛇行することとなる。このような文字列は複数行あることが多く、図3のような文字列を画像で撮像し、画像処理・文字認識を施した場合、製造番号「003」を切り出したいにもかかわらず、1つ下の文字列に含まれる管理番号である「123」を抽出する可能性を否めない。
一方で、円筒状の製品に施された刻印をラインセンサ(光切断法)による機械走査で検出をする場合などでは、機械走査の精度の問題で検出文字列が行間以上に蛇行する場合がある。このような光切断法で得られ、2次元画像とされたものに対し、上記同様に、画像処理・文字認識を施した場合も、製造番号「003」を切り出したいにもかかわらず、1つ下の文字列に含まれる管理番号である「123」を抽出する可能性を否めない。
このような状況下において、従来の技術を適用した場合、まず特許文献1の技術では、最初に行領域を抽出する時に、他の行の文字が行領域内に混入する事を想定していないため、混入したほかの行の文字はノイズとなって各文字のX方向座標特定を妨げ、正確な文字抽出が不可能なものとなる。
特許文献2の技術では、ブロブの抽出において、誤った「最小単位」の組み合わせが行われ、その結果として誤抽出が発生する可能性がある。「認識処理」や「言語知識処理」、「レイアウト解析」を厳格化すれば上記問題を低減もしくは無くせるが、これらの処理・解析を厳格化すると計算ステップが膨大になる問題がある。
そこで、本発明は、上記問題点を鑑み、蛇行している文字列や複数行に亘る文字列の中から、確実に所定の文字を抽出(切り出す)ことが可能な文字認識方法及び文字認識装置を提供することを目的とする。
上述の目的を達成するため、本発明においては以下の技術的手段を講じた。
すなわち、本発明に係る画像処理を用いた文字認識方法は、文字列を複数有する2次元画像を取得し、前記2次元画像の中から前記文字列に存在する所定文字を抽出して当該所定文字を画像処理により認識する文字認識方法であって、前記2次元画像における前記文字列の配置ラインを推定し、前記配置ライン上の文字列の中から所定文字の位置を推定し、前記所定文字の位置に対して文字認識処理を行うことで、当該所定文字を認識する点にある。
前記文字列の配置ラインを推定を行うにあたっては、前記2次元画像において前記文字列を含む探索領域を設定し、この探索領域のY座標毎にX方向に沿って輝度積算を行うことでY方向の投影輝度分布を算出し、この投影輝度分布を基に前記探索領域における各文字の中心Y座標を推定し、この各文字の中心Y座標をX方向に結ぶことで文字列の配置ラインを推定し、前記所定文字の位置を推定するにあたっては、推定した文字列の配置ラインに沿いつつY方向に沿って輝度積算を行うことで配置ラインにおけるX方向の投影輝度分布を算出し、このX方向の投影輝度分布と予め設定されたマスクとの相互相関から所定文字の位置を推定することが好ましい。
本発明に係る文字認識装置は、文字列を複数有する2次元画像を取得する撮像手段と、前記撮像手段で取得した2次元画像の中から所定文字を抽出すると共に画像処理により所定文字を認識する画像処理手段とを備えており、前記画像処理手段は、前記2次元画像における前記文字列の配置ラインを推定する配置ライン推定部と、前記配置ライン推定部が推定した配置ライン上の文字列の中から所定文字の位置を推定する文字位置推定部と、前記文字位置推定部が推定した所定文字の位置に対して文字認識処理を行うことで当該所定文字を認識する文字認識部とを備えている点にある。
前記配置ライン推定部は、2次元画像のY座標毎にX方向に沿って輝度積算を行うことでY方向の投影輝度分布を算出し、この投影輝度分布を基に文字の中心Y座標を推定して文字の中心Y座標をX方向に結ぶことで文字列の配置ラインを推定することが好ましい。 前記文字位置推定部は、文字列の配置ラインに沿いつつY方向に沿って輝度積算することで配置ラインにおけるX方向の投影輝度分布を算出し、このX方向の投影輝度分布と予め設定されたマスクとの相互相関から所定文字の位置を推定することが好ましい。
本発明に係る文字認識方法によると、蛇行している文字列や複数行に亘る文字列の中から、確実に所定の文字を抽出(切り出す)ことができる。
本発明の実施形態に係る文字認識装置の概略図である。 撮像手段で撮像した2次元画像の一例である。 本発明に係る文字認識の処理を説明するための図である。 本発明に係る文字認識の処理を説明するためのフローチャートである。
以下、本発明の実施形態を、図を基に説明する。
なお、以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
本実施形態に係る文字認識装置の全体システム構成について説明する。
図1(a)に示すように、文字認識装置1は、対象物A上に円弧状に施された凹凸状の文字(凹凸文字)を読取る装置である。この文字認識装置1は、対象物A上に施された凹凸文字の2次元画像Pを取得する撮像手段2を備えている。具体的には、この撮像手段2は、光切断法を適用したラインセンサにより構成されている。
ラインセンサ2は、対象物Aにライン状の光切断線(ライン状のレーザ光)を投射する投射部3と、対象物Aの表面から反射してきた光切断線を撮像する撮像部4とを有している。
また、文字認識装置1は、ラインセンサ2を対象物Aに沿って走査するために、対象物Aを回転させる回転用モータ5(回転機構)を有している。これは、ラインセンサ2による1回の計測では、光切断線が当たった部分しか凹凸情報を取得できないため、当該回転用モータ5を用いてラインセンサ2を、対象物Aの円周に倣う方向に走査させることにより、対象物A全体を計測するためである。
さらに、文字認識装置1は、ラインセンサ2で取得した2次元画像Pを処理する画像処理手段6を備えている。画像処理手段6は、コンピュータ(例えば、パーソナルコンピュータ)により構成されており、コンピュータ6は、配置ライン推定部7と、文字位置推定部8と、文字認識部9とを備えている。本発明によれば、後述するように、配置ライン推定部7、文字位置推定部8によって、蛇行している文字列や複数行に亘る文字列の中から、確実に所定の文字を抽出(切り出す)ことができる。そして、切り出した文字を文字認識部9によって認識することができる。
本実施形態に係る文字認識装置1は、円盤状の対象物Aを回転用モータ5で回転させることによって、対象物Aの表面を走査していき、その表面形状を取得する。ラインセンサ2の設置向きは、円盤状の対象物Aの半径方向に沿うように(後述するY軸に平行になるように)設置される。そして、取得した凹凸文字データ(1ライン画像データ)をコンピュータ6内のフレームメモリに蓄えることで、複数の文字列を含む2次元画像Pを取得する。なお、図1(b)に示すように、撮像手段2は、対象物A上の凹凸文字を直接、2次元CCDカメラ等にて撮像するものであってもよい。
以下、文字認識装置によって実行される文字認識方法について説明する。
図2(a)は、文字認識装置1のラインセンサ2によって撮像した2次元画像Pの一例を示している。
図2(a)に示すように、2次元画像P内には、「製造番号 003 重量 100 高さ200.0」という文字列11aが存在していると共に、「管理番号 123 ABC 1263895」という文字列11bが存在している。2次元画像Pを見ると、それぞれの文字列11a、11bは波打った状態で当該2次元画像Pに写り込んでおり、通常、円盤状の対象物A上の凹凸文字(単に文字ということがある)を撮像し、得られた2次元画像Pは、このように波打つのが実情である。
文字が波打つ原因は、対象物Aの文字を撮像したときにおける対象物Aの中心の偏心の影響であったり、又は、対象物(製品)Aに文字を複数の工程にてそれぞれ刻印してしまうことがあげられる。例えば、ある工程で、製品上に「製造番号」「重量]「高さ]を刻印し、その後、別の工程で、「003」「100]「200.0]といった刻印を施す。それぞれの工程は、現場乃至は現場に近い環境で行われるため、厳密な位置あわせを行うことは現実不可能であり、図2(a)に示すように、波打った文字列11a、11bが形成されることとなる。
従来の文字認識処理では、このように、一連の文字列11a、11bが写り込んでいる2次元画像Pの中から、ある文字を抽出する(文字領域の切り出す)ことは困難なことが多く、例えば、製造番号である「003」を抽出したいにもかかわらず、「123」を抽出することがあった。
そこで、本実施形態の文字認識方法及び文字認識装置では、文字切り取り処理により切り出したい所望の文字、即ち、所定文字12の位置を確実に特定することができるようにしている。なお、所定文字12は、1字に限らず、「003」のように複数の字からなるものであってもよいことを前提に、処理手順等について説明する。
本発明の文字認識方法では、まず、ラインセンサ2を用いて対象物A上の凹凸文字を撮像して2次元画像Pを取得する(図4、S1)。2次元画像は、縦がMピクセル、横Nピクセルの2次元画像Pであり、複数(2つの)の文字列11a、11bを含んでいる。
図2(a)に示すように、例えば、2次元画像Pには、「製造番号 003 重量 102 高200.0」という文字列11aと、この文字列11aの一列下に配置された「管理番号 123 ABC 1263895」という文字列11bとを含んでいる。
次に、図2(a)のような複数の文字列11a、11bを含む2次元画像Pに対し、縦Mピクセル、横nピクセル(例えば30ピクセルであり、n<M)の探索領域Qを設定する(図4、S2)。探索領域Qの範囲の設定はコンピュータ6により行うことができる。
探索領域Qの幅(X方向の長さ)に関しては、nを狭くとりすぎると文字種の影響や、文字間隔の影響を受けてしまうので、文字幅や文字間隔以上の値である事が望ましい。逆にnを大きく取りすぎると、文字列11a、11bの位置ズレが発生した境界部位の文字高さを正確に求められない場合があるので、例えば、印字仕様上の文字間隔の最大値が1文字程度、文字列11a、11bの位置ズレ量が半文字分程度であるなら、n=(3文字分の幅)と設定するなどすればよい。
そして、探索領域Qにおいて、Y座標毎にX方向に沿った輝度積算を行うことでY方向の投影輝度分布を算出する(図4、S3)。図2(a)に示すように、例えば、所定の探索領域Qと重なる2次元画像P(撮像画像)において、その各Y座標に沿って並んでいる複数の画素の輝度値をX軸方向に沿って足し合わせる(輝度値の積算を行う)ことで、Y方向の投影輝度分布を得る。積算により得られた輝度分布を投影輝度分布Px(y)とすると、2次元画像Pにおいて文字が存在する付近のY方向の輝度は、極大値(ピーク値)となる。
S3にて得られた投影輝度分布Px(y)を基に、探索領域Qにおける各文字の中心Y座標を推定する(図4、S4)。図2(b)に示すように、具体的には、投影輝度分布Px(y)について文字高さHの幅のウインドを考え、このウインドをY方向に移動させて移動平均をとり、この移動平均の値が極大値(ピーク)となる高値(例えば、ウインドのY方向の中央座標)を文字の中心を示す中心Y座標とする。また、S4では、探索領域Qを2次元画像Pの左端(X=0)から右端(X=N)に向かって移動させながら中心位置の推定処理を行うことで、文字列11a、11bに含まれる全ての文字における中心Y座標を求める。
なお、S4の処理では、投影輝度分布Px(y)において移動平均をとることにより、各文字の中心Y座標を求めているが、投影輝度分布Px(y)に対して微分処理等を行うことによって各文字の中心Y座標を求めてもよい。
次に、図3(a)に示すように、推定した各文字の中心Y座標をX方向に結ぶことで、各文字列11a、11bの配置ラインL1、L2を推定する(図4、S5)。
上述したS3〜S5の処理は、コンピュータ6の配置ライン推定部7により行う。即ち、配置ライン推定部7は、2次元画像PのY座標毎にX方向に沿った輝度積算を行うことでY方向の投影輝度分布Px(y)を算出し、この投影輝度分布Px(y)を基に文字の中心Y座標を推定して文字の中心Y座標をX方向に結ぶことで文字列11a、11bの配置ラインL1、L2を推定する(求める)ものである。
さて、図2、図3に示した2次元画像Pにおいて、上述した処理により、文字列11a、11bの配置ラインL1、L2の推定を行うと、2つの文字列11a、11bが存在することから配置ラインL1、L2は2本となる。切り出したい所定文字12を「003」とすると、当該所定文字12は、上側の文字列11aにあるため、所定文字12を切り出すためには、当該所定文字12を含む文字列11aにおける配置ラインL1を用いる。
そこで、図3(b)に示すように、まず、所定文字12を含む文字列11aに対して、当該文字列11aの配置ラインL1に沿いつつY方向に沿って輝度積算を行うことで、配置ラインL1のX方向の投影輝度分布を算出する(図4、S6)。
具体的には、所定文字12(「003」)を含む文字列11aの配置ラインL1に沿ってX座標の各値ごとに、Y方向の各輝度値の積算を行う。この計算により、切り取り対象行の領域のみのX座標別の投影輝度分布Py(x)が得られる。投影輝度分布Py(x)は、例えば、式(1)で算出する。
なお、図4のS6では、切り取り対象行の領域のみのX座標別の投影輝度分布Py(x)を得られれば良いため、Y方向に積算する輝度の範囲を、例えば、式(1)に示すように、文字の高さH分行うことが好ましい。言い換えれば、図4のS6の処理では、所定文字12を含む文字列11aのみに対する投影輝度分布Py(x)を得られればよいことから、当該処理においてY方向に積算する輝度の範囲は、輝度を積算したときに他の文字列11b内の文字の輝度を含まない程度に設定すれば良い。
これにより、目的の行の文字のみを含んだx座標別の投影輝度分布Py(x)を取得することができ、他の行の文字がノイズとなる事を防ぎ、高性能な文字抽出を実現することができる。
次に、X方向の投影輝度分布Py(x)を基に所定文字12の位置を推定する。具体的には、下記に示すS7〜S9までの処理を行う。
まず、所定文字12(「003」)を含む文字列11aに対応するX座標別の投影輝度分布Py(x)に基づき、所定文字12を含む切り取り対象行の文字列全体のX方向の位置の特定を行う(図4、S7)。
具体的には、X座標別の投影輝度分布Py(x)について、文字列11aにおける全体の幅(X方向の長さ)をWallとして、この幅でウインドを作り、このウインドをX方向に移動して移動平均を取り、そのピークを探索する事によって行う。
なお、文字列全体の幅(長さ)Wallは、本実施形態の場合、製造番号の先頭文字である「製」から、高さを示す末尾文字の「0」までのピクセル間の距離である。文字列全体の幅(長さ)Wallは、予め知り得る情報である。
図4のS7の処理を行うことによって、文字列11aの存在する位置(X座標における始点と終点)を求める。
そして、所定文字12は、文字列11aの先頭文字や末尾文字から何文字目に存在するかに関しても予め分かっているため、S7の処理にて文字列11aの存在する位置を特定した後は、当該文字列11aの先頭文字や末尾文字のX座標等に基づいて、所定文字12が存在すると思われるX座標の範囲(所定文字12の大凡の位置)を求める(図4、S8)。
S8の処理では、所定文字12の大凡の位置(x座標、y座標)が分かるものの、上述したように文字列11aは蛇行していることから、S8の処理だけでは、所定文字12の中心位置、先頭位置、末尾位置などの特定は難しい。そこで、この実施形態では、次に示す処理を行うことにより、所定文字12の位置をより正確に特定することにしている。
図4のS8により求めたX座標の範囲における投影輝度分布Py(x)の波形と、当該所定文字12に対応して予め定められたマスクデータ(マスク波形)との相互相関を取る(図4、S9)。即ち、図4のS9では、マスク波形をX方向に、例えば、文字の幅の半文字分ずつシフトさせながら、当該シフトしたマスク波形と、図4のS8により割り出したX座標の範囲における投影輝度分布Py(x)の波形との相関(相互相関)を計算し、相互相関値がピークとなるマスクの位置(X座標)に、所定文字12が存在することとして、当該所定文字12の位置(例えば、中心位置、先頭位置、末尾位置)を特定する。つまり、この実施形態では、S8の処理とS9の処理との両方を行うことによって、所定文字12のより正確な位置を求めている。
なお、マスクデータは、所定文字12のX方向の輝度分布を示すものであり、このマスクデータは、所定文字12を正確に印字(刻印)したときの仕様から予め割り出しておくことができる。なお、マスクデータは、所定文字12を特定するためのものであるため、当然に文字の種類や数により、ぞれぞれ異なるものである。
S6〜S9までの処理は、コンピュータ6の文字位置推定部8により行う。即ち、文字位置推定部8は、文字列11aの配置ラインL1に沿いつつY方向に沿って輝度積算することで、配置ラインL1のX方向における投影輝度分布Py(x)を算出し、この投影輝度分布Py(x)に基づいて所定文字12の位置を推定する。また、文字位置推定部8は、X方向の投影輝度分布Py(x)と所定文字12に対応して予め設定されたマスクとの相互相関から求める。
そして、所定文字12の位置を求めた後は、所定文字12の位置に対して文字認識処理を行うことで、所定文字12を認識する(図4、S10)。つまり、所定文字12の位置が分かったあとは、その領域のみをターゲットとして、テンプレートマッチング等の文字認識を行うことで、所定文字12である「003」を確実に認識することができる。
なお、所定文字12の位置を正確に特定した後の文字認識処理は、従来からの文字認識方法を用いて所定文字12の位置を認識すればよく、文字認識方法は、この実施形態に限定されない。
本発明の文字認識方法及び文字認識装置によれば、対象物に印字された複数の文字列11a、11bの中から所定文字12が存在する文字列11aの行(文字列11aのY座標)を求めて、その文字列11aから文字を切り出す処理を行うため、行間隔以上の幅で位置ズレ・蛇行した複数行の文字列11a、11bからも文字を切り出すことができる。行領域に他の行の文字が混入して文字抽出性能を低下させることはない。また、文字の認識処理や言語知識処理などを用いないため、必要最小限の計算ステップで文字抽出を実現できる。
また、文字列11aの中から所定文字12を切り出す(位置を特定する)にあたっては、印字仕様上の「理想位置」と「文字の並び」から所定文字12の位置を特定しているため、例え1文字がかすれ気味であっても、正確に文字位置を特定することができる。逆に、本発明の手法を用いないならば、例えば、(a)理想位置から単純に文字抽出を行うような処理を行ったり、(b)文字列の全体の中で、文字を抽出し、先頭から所定番目の文字を抽出するなどの処理を行うことになるが、文字列単位で位置ズレが生じると、(a)の方法では正確な文字抽出ができない場合が多く、(b)の方法を行おうとすると、かすれ気味の文字の抽出に失敗した時に誤った文字を読み取るなどの誤検知を起こす可能性がある。
なお、今回開示された実施形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。上記の実施形態では、探索領域Qに重なった2次元画像P内の全ての文字列11a、11bについて、文字列11a、11bの配置ラインL1、L2を求めるようにしているが、所定文字12が存在する文字列11aのみの配置ラインL1を求めるようにしてもよい。
1 文字認識装置
2 撮像手段(ラインセンサ)
3 投射部
4 撮像部
5 回転用モータ
6 画像処理手段(コンピュータ)
7 配置ライン推定部
8 文字位置推定部
9 文字認識部
10 カメラ
11a 文字列
11b 文字列
12 所定文字

Claims (5)

  1. 文字列を複数有する2次元画像を取得し、前記2次元画像の中から前記文字列に存在する所定文字を抽出して当該所定文字を画像処理により認識する文字認識方法であって、
    前記2次元画像における前記文字列の配置ラインを推定し、
    前記配置ライン上の文字列の中から所定文字の位置を推定し、
    前記所定文字の位置に対して文字認識処理を行うことで、当該所定文字を認識することを特徴とする文字認識方法。
  2. 前記文字列の配置ラインを推定を行うにあたっては、前記2次元画像において前記文字列を含む探索領域を設定し、この探索領域のY座標毎にX方向に沿って輝度積算を行うことでY方向の投影輝度分布を算出し、この投影輝度分布を基に前記探索領域における各文字の中心Y座標を推定し、この各文字の中心Y座標をX方向に結ぶことで文字列の配置ラインを推定し、
    前記所定文字の位置を推定するにあたっては、推定した文字列の配置ラインに沿いつつY方向に沿って輝度積算を行うことで配置ラインにおけるX方向の投影輝度分布を算出し、このX方向の投影輝度分布と予め設定されたマスクとの相互相関から所定文字の位置を推定することを特徴とする請求項1に記載の文字認識方法。
  3. 文字列を複数有する2次元画像を取得する撮像手段と、前記撮像手段で取得した2次元画像の中から所定文字を抽出すると共に画像処理により所定文字を認識する画像処理手段とを備えており、
    前記画像処理手段は、
    前記2次元画像における前記文字列の配置ラインを推定する配置ライン推定部と、
    前記配置ライン推定部が推定した配置ライン上の文字列の中から所定文字の位置を推定する文字位置推定部と、
    前記文字位置推定部が推定した所定文字の位置に対して文字認識処理を行うことで当該所定文字を認識する文字認識部と、
    を備えていることを特徴とする文字認識装置。
  4. 前記配置ライン推定部は、2次元画像のY座標毎にX方向に沿って輝度積算を行うことでY方向の投影輝度分布を算出し、この投影輝度分布を基に文字の中心Y座標を推定して文字の中心Y座標をX方向に結ぶことで文字列の配置ラインを推定することを特徴とする請求項3に記載の文字認識装置。
  5. 前記文字位置推定部は、文字列の配置ラインに沿いつつY方向に沿って輝度積算することで配置ラインにおけるX方向の投影輝度分布を算出し、このX方向の投影輝度分布と予め設定されたマスクとの相互相関から所定文字の位置を推定することを特徴とする請求項3又は4に記載の文字認識装置。
JP2009262997A 2009-11-18 2009-11-18 文字認識方法及び文字認識装置 Expired - Fee Related JP5280337B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009262997A JP5280337B2 (ja) 2009-11-18 2009-11-18 文字認識方法及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009262997A JP5280337B2 (ja) 2009-11-18 2009-11-18 文字認識方法及び文字認識装置

Publications (2)

Publication Number Publication Date
JP2011108025A true JP2011108025A (ja) 2011-06-02
JP5280337B2 JP5280337B2 (ja) 2013-09-04

Family

ID=44231416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009262997A Expired - Fee Related JP5280337B2 (ja) 2009-11-18 2009-11-18 文字認識方法及び文字認識装置

Country Status (1)

Country Link
JP (1) JP5280337B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016033797A (ja) * 2014-07-31 2016-03-10 日本鋳鉄管株式会社 文字読み取り装置、及び文字読み取り方法
US9632691B2 (en) 2013-07-29 2017-04-25 Fujitsu Limited Non-transitory computer-readable medium storing selected character specification program, selected character specification method, and selected character specification device
US11180032B2 (en) * 2017-03-31 2021-11-23 Sanyo Electric Co., Ltd. Monitoring device and power storage system

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58106665A (ja) * 1981-12-18 1983-06-25 Ricoh Co Ltd 文字行切出し方法
JPH0362284A (ja) * 1989-07-31 1991-03-18 Nec Corp 文字行抽出装置
JPH0981676A (ja) * 1995-09-14 1997-03-28 Hitachi Eng Co Ltd 文字切り出し装置及び文字切り出し方法
JP2001092922A (ja) * 1999-09-21 2001-04-06 Hitachi Eng Co Ltd 文字照合方法および装置
JP2005275951A (ja) * 2004-03-25 2005-10-06 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2006155126A (ja) * 2004-11-29 2006-06-15 Mitsubishi Heavy Ind Ltd 車両番号認識装置
JP2008204203A (ja) * 2007-02-20 2008-09-04 Kobe Steel Ltd 文字列画像の画像処理方法,そのプログラム及びその装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58106665A (ja) * 1981-12-18 1983-06-25 Ricoh Co Ltd 文字行切出し方法
JPH0362284A (ja) * 1989-07-31 1991-03-18 Nec Corp 文字行抽出装置
JPH0981676A (ja) * 1995-09-14 1997-03-28 Hitachi Eng Co Ltd 文字切り出し装置及び文字切り出し方法
JP2001092922A (ja) * 1999-09-21 2001-04-06 Hitachi Eng Co Ltd 文字照合方法および装置
JP2005275951A (ja) * 2004-03-25 2005-10-06 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2006155126A (ja) * 2004-11-29 2006-06-15 Mitsubishi Heavy Ind Ltd 車両番号認識装置
JP2008204203A (ja) * 2007-02-20 2008-09-04 Kobe Steel Ltd 文字列画像の画像処理方法,そのプログラム及びその装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9632691B2 (en) 2013-07-29 2017-04-25 Fujitsu Limited Non-transitory computer-readable medium storing selected character specification program, selected character specification method, and selected character specification device
JP2016033797A (ja) * 2014-07-31 2016-03-10 日本鋳鉄管株式会社 文字読み取り装置、及び文字読み取り方法
US11180032B2 (en) * 2017-03-31 2021-11-23 Sanyo Electric Co., Ltd. Monitoring device and power storage system

Also Published As

Publication number Publication date
JP5280337B2 (ja) 2013-09-04

Similar Documents

Publication Publication Date Title
US10438036B1 (en) System and method for reading and decoding ID codes on a curved, sloped and/or annular object
US8254683B2 (en) Code image processing method
JP5025442B2 (ja) タイヤ形状検査方法とその装置
US20110019243A1 (en) Stereoscopic form reader
JP4905013B2 (ja) 外観検査装置、外観検査方法及び高さ測定方法並びに回路基板製造方法
US9946947B2 (en) System and method for finding saddle point-like structures in an image and determining information from the same
JP2011058812A (ja) 視差算出方法、および視差算出装置
JP2016166853A (ja) 位置推定装置および位置推定方法
JP2013174547A (ja) ステレオ3次元計測装置
TW201506800A (zh) 光學文字識別裝置
JP5280337B2 (ja) 文字認識方法及び文字認識装置
JP5274173B2 (ja) 車両検査装置
CN111354038A (zh) 锚定物检测方法及装置、电子设备及存储介质
KR100624469B1 (ko) 비대칭 패턴을 갖는 체크보드 및 이를 이용한영상획득장치의 캘리브레이션 방법 및 장치
JP5160366B2 (ja) 電子部品のパターンマッチング方法
JP2011107878A (ja) 位置検出装置、位置検出方法
JP2009301411A (ja) 凹凸文字抽出のための画像処理方法及び画像処理装置
US9315047B2 (en) Velocity estimation methods, and imaging devices and printing devices using the methods
JP6415164B2 (ja) 文字読み取り装置、及び文字読み取り方法
JP2006235786A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2018116008A (ja) 位置ずれ量取得装置、検査装置、位置ずれ量取得方法および検査方法
JP2002245454A (ja) 画像マッチング方法、画像マッチング装置及びウェハ処理装置
JP6222127B2 (ja) 刻印文字読取り装置
JP2004192506A (ja) パターンマッチング装置、パターンマッチング方法およびプログラム
JP2011047857A (ja) 三次元形状計測方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130522

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5280337

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees