JP2017173925A - 光学文字認識装置 - Google Patents
光学文字認識装置 Download PDFInfo
- Publication number
- JP2017173925A JP2017173925A JP2016056286A JP2016056286A JP2017173925A JP 2017173925 A JP2017173925 A JP 2017173925A JP 2016056286 A JP2016056286 A JP 2016056286A JP 2016056286 A JP2016056286 A JP 2016056286A JP 2017173925 A JP2017173925 A JP 2017173925A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- candidate
- date
- recognized
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】文字の汚れや、変形、光の影響で使用期限を表す日付の文字の誤認識を防止し、高い精度で日付を表す文字列を認識する。【解決手段】文字列を光学的に認識する光学文字認識装置において、光学文字認識装置は、入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1の処理手段と、目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2の処理手段と、文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに文字列候補を日付として認識する第3の処理手段とを備える。【選択図】図8
Description
本発明は、文字列を光学的に認識する光学文字認識装置に関し、特に、日付を表す文字列を認識する光学文字認識装置に関する。本発明はまた、日付を表す文字列を認識するための光学文字認識方法、コンピュータプログラム、及び記録媒体に関する。
薬品の容器に印字されている文字を光学的に認識する装置に対する需要が存在している(特許文献1を参照)。例えば、病棟にいったん運ばれ、結果的に使用されなかった注射薬などの容器を保管庫に返却する場合、その容器を次回の使用時に迅速かつ間違いなく取り出せるように、容器の種類、名称、及び使用期限などに基づいて仕分けをして保管する必要がある。光学文字認識装置を用いて、この仕分けを自動的に行う返戻装置を実現することができれば、作業の効率化及びミスの削減のために効果的である。また、このような返戻装置を用いて容器を保管する場合、容器の保管場所が記録されるので、次回の使用の際にも、処方に基づいて適切な容器を自動的に払い出すことができる。特に薬品の使用期限を表す日付に誤認識があると、使用期限がまだきていない容器を保管せずに廃棄したり、使用期限を過ぎた容器を払い出したりする誤動作を招く。
本願出願人は、特許文献2において、文字列の画像に含まれるさまざまなノイズを、文字列を光学的に認識する前に予め除去することにより、高い精度で日付を表す文字列を認識することができる光学文字認識装置を提案している。
光学文字認識装置により文字列を光学的に認識する場合、文字の汚れ、変形、光の影響で使用期限の日付を誤認識する可能性がある。特に、「5」のエッジがぼけているために「6」に誤認識したり、「1」が傾いているために「7」に誤認識しやすい。このような特定の文字の誤認識を防止することが、返品容器の保管、払い出しを行う返品容器払出装置の信頼性を維持するために重要である。
本発明は、このような従来の問題に鑑みてなされたもので、文字の汚れや、変形、光の影響で使用期限を表す日付の文字の誤認識を防止し、高い精度で日付を表す文字列を認識することができる光学文字認識装置、光学文字認識方法、コンピュータプログラム、及び記録媒体を提供することにある。
前記課題を解決するための手段として、本発明は、
(1)文字列を光学的に認識する光学文字認識装置において、前記光学文字認識装置は、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1の処理手段と、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2の処理手段と、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3の処理手段とを備えることを特徴とする。
(1)文字列を光学的に認識する光学文字認識装置において、前記光学文字認識装置は、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1の処理手段と、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2の処理手段と、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3の処理手段とを備えることを特徴とする。
(2)前記第3の処理手段は、前記候補オブジェクトの特徴量と中心座標により前記候補オブジェクトをグルーピングし、グルーピングした前記候補オブジェクトを連結して前記文字列候補として抽出することを特徴とする。
(3)前記第3の処理手段は、前記候補オブジェクトの高さを特徴量とし、前記候補オブジェクトの中心行座標と高さにより前記候補オブジェクトをグルーピングすることを特徴とする。
(4)前記第3の処理手段は、前記候補オブジェクトの幅を特徴量とし、前記候補オブジェクトの中心列座標と幅により前記候補オブジェクトをグルーピングすることを特徴とする。
(5)前記第3の処理手段は、認識した日付に「6」を含み、かつ、前記フォーマット設定付きワードOCRの出力の信頼度が所定の閾値範囲であるとき、前記「6」を含む文字領域を細線化及び膨張処理してシングルOCRを行い、スコアのトップ1が「5」であれば、「6」を「5」と入れ替え、「6」の信頼度を「5」の信頼度と入れ替えることを特徴とする。
(6)前記第3の処理手段は、認識した日付に「7」を含み、かつ、前記フォーマット設定付きワードOCRの出力の信頼度が所定の閾値範囲であるとき、前記「7」を含む文字領域を膨張処理してシングルOCRを行い、スコアのトップ1が「1」であれば、「7」を「1」と入れ替え、「7」の信頼度を「1」の信頼度と入れ替えることを特徴とする。
(7)前記第3の処理手段は、前記フォーマット設定付きワードOCRの出力の信頼度の最小値と平均値を求め、前記信頼度の最小値が所定の閾値以上であり、かつ前記信頼度の平均値が所定の閾値以上であるとき、前記フォーマット設定付きワードOCRの出力を日付と認識することを特徴とする。
(8)前記第3の処理手段は、前記文字列候補の2桁の月数に相当する候補オブジェクトの間隔と、前記2桁の月数に相当する候補オブジェクトと以外の候補オブジェクトの間隔の平均間隔を求め、前記間隔が前記平均間隔より大きいとき、月数の1桁目の前記候補オブジェクトを無視し、2桁目の前記候補オブジェクトを月数として認識し、前記間隔が前記平均間隔以下であるとき、2桁の候補オブジェクトを月数として認識することを特徴とする。
(9)前記光学文字認識装置は、
カメラと、
証明装置と、
前記円筒形状の容器の回転軸の周りに回転可能であるように前記容器を保持する認識台と、
前記容器には、前記容器中の容器の使用期限の日付を表す文字列が印字されていることを特徴とする。
カメラと、
証明装置と、
前記円筒形状の容器の回転軸の周りに回転可能であるように前記容器を保持する認識台と、
前記容器には、前記容器中の容器の使用期限の日付を表す文字列が印字されていることを特徴とする。
(10)文字列を光学的に認識する光学文字認識方法において、
前記光学文字認識方法は、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップとを備えたことを特徴とする。
前記光学文字認識方法は、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップとを備えたことを特徴とする。
(11)コンピュータによって実行されたときに文字列を光学的に認識するコンピュータプログラムにおいて、前記コンピュータプログラムは、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップとを備えたことを特徴とする。
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップとを備えたことを特徴とする。
(12)コンピュータによって実行されたときに文字列を光学的に認識するコンピュータプログラムを格納したコンピュータにより読み取り可能な記録媒体において、前記コンピュータプログラムは、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップを備えたことを特徴とする。
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップを備えたことを特徴とする。
本発明の光学文字認識装置、光学文字認識方法、コンピュータプログラム、及び記録媒体は、文字の汚れや、変形、光の影響で使用期限を表す日付の文字の誤認識を防止し、従来よりも高い精度で日付を表す文字列を認識することができる。
図1は、本発明の実施形態に係る光学文字認識装置の構成を示すブロック図である。図1の光学文字認識装置は、円筒形状の容器7の表面に印字された日付の文字列を光学的に認識する。
図1の光学文字認識装置は、制御装置1、カメラ2、照明装置3、及びローラ4と無端ベルト5からなる認識台6を備える。図2に示すように、認識台6のローラ4は無端ベルト5の走行方向Fに対して傾斜するように配置されている。ローラ4と無端ベルト5は制御装置1により駆動制御される。容器7は、該容器7の底がローラ4の一端側に設けられた当接部8に向くように認識台6の無端ベルト5上に載置される。ローラ4の回転と無端ベルト5の移動により、容器7は回転しながら底が当接部8に当接して位置決めされる。これにより、容器7は、底が当接部8に当接した状態で撮影される。カメラ2は、認識台6の上方に設けられ、容器7の画像を取得し、制御装置1に送る。照明装置3は、認識台6上の容器7に照明を当てる。光学文字認識装置は、ローラ4に代えて、円筒形状の容器7の回転軸の周りに回転可能であるように容器7を保持する他の機構を備えてもよい。制御装置1は、カメラ2から送られた容器7の画像に対して、図3〜図10を参照して後述する日付検出処理を実行し、容器7の表面に印字された日付を認識する。制御装置1は、画像処理ライブラリ9及び文字認識部10を備え、記録媒体12から読み取られたコンピュータプログラムに従って動作する外部のパーソナルコンピュータ(PC)11に接続されていてもよい。
容器7は、例えば、薬品の容器(アンプル、バイアル瓶)であり、容器7には、図2に示すように、容器7中の薬品の使用期限の日付を表す文字列が印字されている。例えば、このような容器7が病棟から返却されて認識台6に置かれたとき、光学文字認識装置は、容器7に印字された使用期限の日付を光学的に認識する。次いで、光学文字認識装置は、認識された日付に基づいて、容器7を保管するか廃棄するかを決定し、保管する場合は図示しない保管トレイ、廃棄する場合は図示しない廃棄トレイに容器7を移動させる。
文字列は、容器7に貼られたラベル上に印字されていてもよく、容器7上に直接に印字されていてもよい。また、文字列の向きは、円筒形状の容器7の回転軸に平行であってもよく、容器7の回転軸に直交してもよく、又は、これらの向きの文字列が混在していてもよい。
制御装置1は、入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1の処理手段として動作し、また目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2の処理手段として動作し、さらに文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに文字列候補を日付として認識する第3の処理手段として動作する。
以下、図3〜図10を参照して、図1の制御装置1によって実行される日付検出処理について説明する。
図3は、図1の制御装置1によって実行される日付検出処理を示すフローチャートである。制御装置1は、ローラ4と無端ベルト5を用いて容器7を一定角度(例えば15度)ずつ回転させながらカメラ2により容器7を撮影して、容器7の異なる角度をそれぞれ表す複数の画像(入力画像)を取得する。カメラ2としては、容器7に印字された文字列を光学的に認識するために十分な解像度を有するものが使用される。例えば、容器7は直径10〜40mmを有し、例えば、容器7を含む120×90mmにわたる範囲を、画素数3840×2748(約1000万画素)で撮影する白黒のカメラが使用される。この場合、容器7上の1mmは32画素に相当する。図3のステップS1において、制御装置1は、容器7の複数の画像のうちの1つを取得する。ステップS2において、制御装置1は、目標領域抽出処理を実行する。
図4は、図3のステップS2における目標領域抽出処理のサブルーチンを示すフローチャートである。目標領域抽出処理は、特許文献2に詳述されているので(段落0032〜0038)、以下概略的に説明する。
図4のステップS21において、制御装置1は、ステップS1で取得された画像から、予め決められた閾値よりも高い輝度の部分(例えば照明の反射を含む部分)を抽出する。ステップS22において、制御装置1は、ソーベル(Sobel)フィルタを用いて、ステップS1で取得された画像から、円筒形状の容器7の回転軸に実質的に直交する方向に延在する長いエッジ(縦エッジ)を抽出する。容器7の背景にはローラ4が存在するが、ローラ4は、容器7の回転軸に平行に延在するので、縦エッジを抽出することでローラ4の影響を除去することができる。ステップS23において、制御装置1は、図12(a)に示すように、輝度が高い部分及び縦エッジを含む矩形領域(幅w1×高さh1)を目標領域21として抽出し、目標領域の外部の領域を削除する。目標領域21は、認識対象の文字列のオブジェクトを含むと考えられる領域である。
再び図3を参照すると、ステップS2の目標領域抽出処理の実行後、ステップS3において、制御装置1は、目標領域の抽出に成功したか否かを判断し、YESのときはステップS4に進み、NOのときはステップS10に進む。ステップS4において、制御装置1は、候補オブジェクト抽出処理を実行する。
図5は、図3のステップS4における候補オブジェクト抽出処理のサブルーチンを示すフローチャートである。候補オブジェクト抽出処理は、特許文献2に詳述されているので(段落0040〜0060)、以下概略的に説明する。
図5のステップS31において、制御装置1は、目標領域の画像に対して移動平均フィルタを適用することにより、周囲よりも明るい明オブジェクトを抽出し、画像を2値化する。ステップS32において、制御装置1は、2値化された明オブジェクトの輪郭を検出する。次いで、ステップS33〜S34では、ステップS31〜S32で明オブジェクトに対して行った処理と同様の処理を、暗オブジェクトに対して行う。ステップS35において、制御装置1は、ステップS32、S34で輪郭を検出した後の画像に対してキャニー(Canny)フィルタを適用し、画像中のエッジを抽出する。ステップS36において、制御装置1は、輪郭及びエッジを有する明オブジェクトであって、輪郭及びエッジが互いに重なり合い、実質的に一致している明オブジェクトを候補オブジェクトとして抽出する。ステップS37において、制御装置1は、輪郭及びエッジを有する暗オブジェクトであって、輪郭及びエッジが互いに重なり合い、実質的に一致している暗オブジェクトを候補オブジェクトとして抽出する。文字のオブジェクトは常に閉じたエッジを有し、オブジェクトの輪郭及びエッジは一致すると考えられる。従って、実質的に一致した輪郭及びエッジを有するオブジェクトを抽出することにより、文字のオブジェクトを抽出することができる。エッジと輪郭が一致しないオブジェクトは、ノイズとして削除される。
次いで図3のステップS5において、制御装置1は、候補オブジェクトの抽出に成功したか否かを判断し、YESのときはステップS6に進み、NOのときはステップS10に進む。ステップS6において、制御装置1はOCR処理を実行する。
図6は、図3のステップS6におけるOCR処理のサブルーチンを示すフローチャートである。認識対象の文字列が明オブジェクトであるのか、それとも暗オブジェクトであるのか未知であり、また、認識対象の文字列が図5のX軸に平行に延在するのか、それともY軸に平行に延在するのか未知であるので、これらすべての組み合わせについて図7及び図8のOCRサブルーチンを実行する。認識対象の文字列が明オブジェクトであると仮定するとき、図5のステップS36で抽出された明オブジェクトの候補オブジェクトを用いる。認識対象の文字列が暗オブジェクトであると仮定するとき、図5のステップS39で抽出された暗オブジェクトの候補オブジェクトを用いる。認識対象の文字列がX軸に平行に延在すると仮定するとき、目標領域の画像をそのまま使用し、さらに目標領域の画像を180度回転して使用する。認識対象の文字列がY軸に平行に延在すると仮定するとき、目標領域の画像を90度回転して使用する。
光学装置OCR処理で使用する画像は、図11に示すように、容器の底が右側、頭が左側になるように撮像される。撮影された画像の左上の隅を原点とし、右側へX軸、下側へY軸が設定される。認識対象の文字列は、明オブジェクトに対して、X軸に平行に+方向と−方向の2方向、Y軸に平行に+方向と−方向の2方向の計4方向が考えられ、同様に暗オブジェクトに対しても、4方向が考えられる。したがって、OCRは、明オブジェクトと明オブジェクトに対してそれぞれ4方向、合計8方向に行う必要がある。しかし、現実には、図11(a)に示すように、X方向に平行に−方向に延在する文字列と、図11(b)に示すように、Y方向に−方向に延在する文字列が多く、図11(c)に示すX方向に平行に+方向に延在する文字列はまれに存在するが、図11(d)に示すY方向に+方向の文字列は殆どない。そこで、本実施形態のOCR処理は、存在する可能性が高い文字列から存在する可能性が低い文字列の順に行い、存在する可能性がほとんどないものはOCR処理を省略している。このため、OCR処理が8方向から6方向に減少し、処理速度が向上している。
すなわち、図6のステップS51において、制御装置1は、認識対象の文字列がX軸に平行に←(−)方向に延在する明オブジェクトであると仮定して、OCRサブルーチンを実行する。ステップS52において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS53に進む。
ステップS53において、制御装置1は、認識対象の文字列がY軸に平行に↑(−)方向に延在する明オブジェクトであると仮定して、目標領域の画像を90°回転し、OCRサブルーチンを実行する。ステップS54において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS55に進む。
ステップS55において、制御装置1は、認識対象の文字列がX軸に平行に←(−)方向に延在する暗オブジェクトであると仮定して、OCRサブルーチンを実行する。ステップS56において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS57に進む。
ステップS57において、制御装置1は、認識対象の文字列がY軸に平行に↑(−)方向に延在する暗オブジェクトであると仮定して、目標領域の画像を90°回転し、OCRサブルーチンを実行する。ステップS58において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図6のステップS7に進み、NOのときはステップS59に進む。
ステップS59において、制御装置1は、認識対象の文字列がX軸に平行に→(+)方向に延在する明オブジェクトであると仮定して、目標領域の画像を180°回転し、OCRサブルーチンを実行する。ステップS60において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS61に進む。
ステップS61において、制御装置1は、認識対象の文字列がX軸に平行に→(+)方向に延在する暗オブジェクトであると仮定して、目標領域の画像を180°回転し、OCRサブルーチンを実行する。その後、図3のステップS7に進む。
ステップS53において、制御装置1は、認識対象の文字列がY軸に平行に↑(−)方向に延在する明オブジェクトであると仮定して、目標領域の画像を90°回転し、OCRサブルーチンを実行する。ステップS54において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS55に進む。
ステップS55において、制御装置1は、認識対象の文字列がX軸に平行に←(−)方向に延在する暗オブジェクトであると仮定して、OCRサブルーチンを実行する。ステップS56において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS57に進む。
ステップS57において、制御装置1は、認識対象の文字列がY軸に平行に↑(−)方向に延在する暗オブジェクトであると仮定して、目標領域の画像を90°回転し、OCRサブルーチンを実行する。ステップS58において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図6のステップS7に進み、NOのときはステップS59に進む。
ステップS59において、制御装置1は、認識対象の文字列がX軸に平行に→(+)方向に延在する明オブジェクトであると仮定して、目標領域の画像を180°回転し、OCRサブルーチンを実行する。ステップS60において、制御装置1は、OCRに成功したか否かを判断し、YESのときは図3のステップS7に進み、NOのときはステップS61に進む。
ステップS61において、制御装置1は、認識対象の文字列がX軸に平行に→(+)方向に延在する暗オブジェクトであると仮定して、目標領域の画像を180°回転し、OCRサブルーチンを実行する。その後、図3のステップS7に進む。
図7は、図6のステップS51,S53,S55,S57,S59,S61におけるOCRサブルーチンの第1の部分を示すフローチャートである。図8は、図6のステップS51,S53,S55,S57,S59,S61におけるOCRサブルーチンの第2の部分を示すフローチャートである。
図7のステップS71において、制御装置1は、候補オブジェクトのラベリングを行って、予め決められた方向に延在して互いに近接した複数のオブジェクトを文字列候補として抽出する。図12(b)は、図7のステップS61において抽出された文字列候補の例を示す図である。図13は、図7のステップS61における文字列候補の抽出を示す図である。図13において、文字列候補を抽出するための文字列候補マスク31は、例えば、幅w2=75画素、高さh2=3画素を有する。ある位置に配置された文字列候補マスク31が候補オブジェクトの画素を1つでも含むとき、文字列候補マスク31内の領域は、文字列候補の一部であると判断される。文字列候補マスク31を目標領域の全体にわたってスキャンし、個別の連結した文字列候補に対してラベルを付与する。
ステップS71において候補オブジェクトのラベリングを行って文字列候補を抽出するとき、近接した複数の文字列が1つの文字列候補として抽出される可能性がある。従って、いったん文字列候補を文字候補に分離し、各文字候補の特徴量(幅及び高さ)に基づいて、類似した特徴量を有する文字候補を文字列候補として再結合する。図7のステップS72において、制御装置1は、各文字列候補中のオブジェクトのラベリングを行って当該文字列候補に含まれる複数の文字候補を抽出し、各文字候補のバウンディングボックスを生成する。各バウンディングボックスは、文字列候補が延在する方向に平行な幅及び文字列候補が延在する方向に直交する高さを有する矩形形状をそれぞれ有し、各文字候補をそれぞれ包囲する最小外接矩形である。
図14Aは、図7のステップS71において抽出された文字列候補の例を示す図である。図14Bは、図7のステップS72において抽出された文字候補及び生成されたバウンディングボックス42の例を示す図である。各文字候補のバウンディングボックス42は、幅w3及び高さh3を有する。
ステップS73において、文字列候補中のオブジェクトの特徴量(高さ及び幅)及びその平均値と標準偏差を抽出し、オブジェクトをグルーピングする。文字列が横方向の場合は中心行の座標と高さ、文字列が縦方向の場合は中心列行の座標と幅を使用してグルーピングする。
図15(a)に示すように、例えば文字列「2015.12」が横方向の場合、「2」、「0」、「1」、「5」、「1」、「2」の各オブジェクトの高さhと中心行座標yはほぼ同じであるが、「.」のオブジェクトの高さhと中心行座標yは、「2」、「0」、「1」、「5」、「1」、「2」の各オブジェクトの高さhと中心行座標yよりも小さい。また、「2」、「0」、「1」、「5」、「.」、「1」、「2」の各オブジェクトの中心列座標xは全て異なり、「2」、「0」、「5」、「2」の各オブジェクトの幅は同じであるが、「1」と「.」のオブジェクトの幅wは「2」、「0」、「5」、「2」より小さい。このため、図15(b)に示すように、高さhと中心行座標yを座標軸に表すと、「2」、「0」、「1」、「5」、「1」、「2」のオブジェクトのグループAと、「.」のオブジェクトのグループBにグルーピングされる。しかし、図15(c)に示すように、各オブジェクトの中心列座標xと幅wを座標軸に表しても、グルーピングは行えない。そこで、文字列が横方向の場合は中心行の座標yと高さhを使用してグルーピングする。
図16(a)に示すように、例えば文字列「2015.12」が縦方向の場合、「2」、「0」、「1」、「5」、「.」、「1」、「2」の各オブジェクトの中心行座標yは全て異なり、「2」、「0」、「5」、「2」の各オブジェクトの高さhは同じであるが、「1」と「.」のオブジェクトの高さhは「2」、「0」、「5」、「2」より小さい。また、「2」、「0」、「1」、「5」、「1」、「2」の各オブジェクトの幅wと中心列座標xはほぼ同じであるが、「.」のオブジェクトの幅wと中心列座標xは、「2」、「0」、「1」、「5」、「1」、「2」の各オブジェクトの幅wと中心列座標xよりも小さい。このため、図16(b)に示すように、各オブジェクトの中心行座標yと高さhを座標軸に表しても、グルーピングは行えない。しかし、図16(c)に示すように、花wと中心列座標xを座標軸に表すと、「2」、「0」、「1」、「5」、「1」、「2」のオブジェクトのグループAと、「.」のオブジェクトのグループBにグルーピングされる。そこで、文字列が横方向の場合は中心列の座標xと幅wを使用してグルーピングする。
ステップS74では、ステップS73でグルーピングされたオブジェクトを連結し、新しい文字列候補として抽出する。図15(b)の場合、オブジェクトが多い方のグループAにグルーピングされた「2」、「0」、「1」、「5」、「1」、「2」のオブジェクトを連結すると、「.」を含む新しい文字候補「2015.12」を抽出することができる。また、図16(c)の場合、オブジェクトが多い方のグループAにグルーピングされた「2」、「0」、「1」、「5」、「1」、「2」のオブジェクトを連結すると、「.」を含む新しい文字候補「2015.12」を抽出することができる。
ステップS73とS74により、図17(a)に示すように、月数が1桁で2桁目にブランクがあっても1つのグループにグルーピングすることができる。また、図17(b)に示すように、文字列候補内に「使用期限」等の文字や汚れが含まれている場合でも、文字列候補からこれらを排除することができる。
次に、図8のステップS75において、文字列候補の個数はゼロであるか否かを判断し、ゼロであればOCRサブルーチンを終了し、図6のOCR処理に戻る。文字列候補の個数がゼロでなければ、ステップS76で画像中の文字列候補を選択する。ステップS77では、文字列候補中の「./−」マーク領域を、オブジェクトの高さh、幅w、座標により認識し、ステップS78で、「./−」マークがあるか否かを判断する。ステップS78で「./−」マークがなければ、日付ではないのでステップS75に戻り、次の文字候補を選択する。ステップS78で「./−」マークがあれば、ステップS79で、「’」マーク領域を、オブジェクトの高さh、幅w、座標により認識する。なお、ステップS79で「’」マーク領域がなくても、前のステップS78で「./−」マークがありとなっているので、ステップS75に戻ることなく、次のステップS80に移行する。ステップS79で「’」マーク領域があれば、後述するフォーマット候補に、「’xx.xx」を追加するようにしてもよい。
図8のステップS80では、画像の文字列候補を水平正立に回転する。認識台6に載置される容器7はラベルの貼り方、ラベルの剥がれ、日付の印字状態等によって、必ずしも水平正立状態にはない。画像の文字列候補が少しでも傾いていると、OCR処理の精度が低下する。画像の文字列候補を水平正立に回転し、OCR処理の精度を向上する。画像の文字列候補が水平正位であるか否かは文字列候補の各オブジェクトの中心座標から判断することができる。
ステップS81で、フォーマット候補の個数が0であるか否かを判断する。ここで、「フォーマット」とは、後述するように、許容される単語構造体を記述する表現であり、日付では、OCRで認識する文字列、例えば「20xx.xx」、「20xx/xx」、「20xx-xx」等を記述したものである。数1はフォーマットの一例である。
数1において、ブラケット[]内は認識する文字を示す。{2}は、前のブラケットを2階繰り返すことを意味する。西暦の4桁目を示す「2」は、十分に認識できるため「2」単独で認識する。西暦の3桁目を示すブラケット[0Oo]には、「0」と誤認されやすい「O」と「о」が含まれている。西暦の3桁目、4桁目及び月数の2桁目、1桁目を示すブラケット[OoI10-9]には、0−9の数字と、「0」と誤認されやすい「O」及び「о」と、「1」と誤認されやすいアルファベットの「I」と「l」が含まれている。日付の約物を示すブラケット[\\.\\*+−]のうち、バックスラッシュの「\」はエスケープ文字である。
ステップS82で、フォーマット候補の個数は0であるか否かを判断し、0であれば、ステップS75に戻り、次の文字列候補を選択する。ステップS82でフォーマット候補の個数が0でなければ、ステップS82でフォーマット候補を選択する。ステップS83では、制御装置1の文字認識部10は、選択したフォーマット候補で画像処理ライブラリ9によりフォーマット設定付きワードOCRを行う。
ワードOCRでは、各文字領域のクラス名を連結することによって生成される1つの集合体(Word)として文字グループ、すなわち、文字列候補全体に対してOCRを行う。フォーマット設定は、ワードOCRでワード単位での辞書(lexicon)を事前に設定することであり、下記入力項目のFormatに相当する。
画像処理ライブラリ9へのフォーマット設定付きワードOCR処理のための入力には次のものが含まれる。
Format: 許容される単語構造体を記述する表現
(Expression describing the allowed word structure)
NumAlternative:内部の単語修正に考慮される文字ごとのクラス数
(Number of classes per character considered for internal word correction)
NumCorrection:修正される文字の最大数
(Maximum number of corrected characters)
画像処理ライブラリ9からのフォーマット設定付きワードOCR処理の出力は、次のものが含まれる。
Class: 文字のクラス分けの結果
(Result of classifying the character)
Confidence:文字のクラスの信頼度
(Confidence of the class of the character)
Word:分類と修正後の単語テキスト
(Word text after classification and correction)
Score:修正と未修正の分類結果間の類似の度合い
(Measures of similarity between corrected word and uncorrected classification results)
ワードOCRでは、与えられる文字について最も一致するクラスClassを計算し、計算したクラスがClassに出力され、対応するクラスの信頼度(確率)がConfidenceに出力される。各文字の最も良いクラスから導き出されるWordがFormatと一致しないならば、NumAlternativesの各文字の最も良いクラスを考慮することによって修正を試みる。修正に使用される代わりのクラス(alternatives)は、後述するSingleOCRによって単一文字に対して返されるものと同一である。多くてもNumCorrectionsの文字領域(Character regions)に対して、クラス分けが変更される可能性のあるすべての候補をテストすることによって行われる。結果のワードは、修正された文字数によって0.0(訂正することによって辞書に一致する単語は検出されず)と1.0(訂正せずに辞書に一致)の間のScoreによって格付けされる。
図18は画像処理ライブラリ9からのフォーマット設定付きワードOCR処理の出力の一例である。
画像処理ライブラリ9へのフォーマット設定付きワードOCR処理のための入力には次のものが含まれる。
Format: 許容される単語構造体を記述する表現
(Expression describing the allowed word structure)
NumAlternative:内部の単語修正に考慮される文字ごとのクラス数
(Number of classes per character considered for internal word correction)
NumCorrection:修正される文字の最大数
(Maximum number of corrected characters)
画像処理ライブラリ9からのフォーマット設定付きワードOCR処理の出力は、次のものが含まれる。
Class: 文字のクラス分けの結果
(Result of classifying the character)
Confidence:文字のクラスの信頼度
(Confidence of the class of the character)
Word:分類と修正後の単語テキスト
(Word text after classification and correction)
Score:修正と未修正の分類結果間の類似の度合い
(Measures of similarity between corrected word and uncorrected classification results)
ワードOCRでは、与えられる文字について最も一致するクラスClassを計算し、計算したクラスがClassに出力され、対応するクラスの信頼度(確率)がConfidenceに出力される。各文字の最も良いクラスから導き出されるWordがFormatと一致しないならば、NumAlternativesの各文字の最も良いクラスを考慮することによって修正を試みる。修正に使用される代わりのクラス(alternatives)は、後述するSingleOCRによって単一文字に対して返されるものと同一である。多くてもNumCorrectionsの文字領域(Character regions)に対して、クラス分けが変更される可能性のあるすべての候補をテストすることによって行われる。結果のワードは、修正された文字数によって0.0(訂正することによって辞書に一致する単語は検出されず)と1.0(訂正せずに辞書に一致)の間のScoreによって格付けされる。
図18は画像処理ライブラリ9からのフォーマット設定付きワードOCR処理の出力の一例である。
次に、ステップS84では、OCR処理により出力されるScoreが閾値(TH_score)を超えるか否か判断する。Scoreの閾値(TH_score)は、例えば、0.65が好ましいが、これに限るものではない。Scoreが閾値(TH_score)を超えなければ、ステップS81に戻り、次のフォーマット候補を選択する。Scoreが閾値(TH_score)を超えていれば、ステップS85で、日付パターンをマッチングする。日付パターンとしては、例えば以下のものがある。
20xx.xx
20xx.x
xx.20xx
’xx.xx
’xx.x
20xx.xx
20xx.x
xx.20xx
’xx.xx
’xx.x
図18の例では、Scoreは1.0であり、閾値0.65を越えているので、「20xx.xx」にマッチングされる。
図8のステップS86では、シングル(single)OCRで「5」と「6」の誤認が無いか再確認する。ステップS86のSingleOCRは、文字列候補中の各オブジェクトの1つ1つに対してOCRを行う。 SingleOCRでは1つの文字オブジェクトに対して複数のクラス候補が出力される。
図9は、SingleOCRでの「5/6」再確認のサブルーチンである。ステップS91で、認識された文字の中に、「6」があり、かつ、Confidenceが、所定の最低閾値(TH_L_conf)を越え、最高閾値(TH_H_conf)未満であるか否か判断する。最低閾値(TH_L_conf)と最高閾値(TH_H_conf)の具体例を表1に示すが、これに限るものではない。
ステップS91において、認識された文字の中に「6」がない場合は、再確認の対象ではないので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS87に移行する。また、confidenceが所定の最低閾値(TH_L_conf)以下の場合は、認識された文字の信頼性がきわめて低く、再確認を行う必要がないので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS87に移行する。さらに、confidenceが最高閾値(TH_H_conf)以上である場合は、「6」である信頼度が高いので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS87に移行する。
ステップS91において、confidenceが、所定の最低閾値(TH_L_conf)を越え、最高閾値(TH_H_conf)未満である場合、「6」でなく、「5」である可能性があるので、ステップS92で「6」と認識した文字領域を細線化処理し、ステップS93で膨張処理する。この細線化と膨張により、例えば、「5」の一部がつながって「6」と誤認された文字は、正しく「5」に修正される。
ステップS94で、画像処理ライブラリ9により文字列に対しSingleOCRを行う。
画像処理ライブラリ9へのSingleOCR処理のための入力には次のものが含まれる。
Num:決定する最も良いクラスの数
(Number of best classes to determine)
画像処理ライブラリ9からのSingleOCR処理の出力は、次のものが含まれる。
Class:文字のクラス分けの結果
(Result of classifying the character)
Confidence:文字のクラスの信頼度
(Confidence of the class of the character)
SingleOCRでは、与えられる文字についてNum個の最も良いクラス(best Classes)を計算し、計算したクラスがClassに出力され、対応するクラスの信頼度(確率)がConfidenceに出力される。
画像処理ライブラリ9へのSingleOCR処理のための入力には次のものが含まれる。
Num:決定する最も良いクラスの数
(Number of best classes to determine)
画像処理ライブラリ9からのSingleOCR処理の出力は、次のものが含まれる。
Class:文字のクラス分けの結果
(Result of classifying the character)
Confidence:文字のクラスの信頼度
(Confidence of the class of the character)
SingleOCRでは、与えられる文字についてNum個の最も良いクラス(best Classes)を計算し、計算したクラスがClassに出力され、対応するクラスの信頼度(確率)がConfidenceに出力される。
ステップS94でSingleCR処理により出力されるScoreのトップ1が「5」であるか否かを判断し、Scoreのトップ1が「5」でなければ、「6」であると確信できるので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS87に移行する。Scoreのトップ1が「5」であれば、「5」であると確信できるので、ステップS96で,文字「6」を「5」に入れ替え、[6」のConfidenceを「5」のConfidenceに入れ替えた後、図8のルーチンに戻り、次のステップS87に移行する。
図8のステップS87では、SingleOCRで「1」と「7」の誤認が無いか再確認する。図10は、SingleOCRでの「1/7」再確認のサブルーチンである。
図10は、SingleOCRでの「1/7」再確認のサブルーチンである。ステップS101で、認識された文字の中に、「7」があり、かつ、Confidenceが、所定の最低閾値(TH_L_conf)を越え、最高閾値(TH_H_conf)未満であるか否か判断する。最低閾値(TH_L_conf)と最高閾値(TH_H_conf)の具体例は、表1に示すものと同じであるが、これに限るものではない。
ステップS101において、認識された文字の中に「7」がない場合は、再確認の対象ではないので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS88に移行する。また、confidenceが所定の最低閾値(TH_L_conf)以下の場合は、認識された文字の信頼性がきわめて低いので、再確認を行う必要がないので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS88に移行する。さらに、confidenceが最高閾値(TH_H_conf)以上である場合は、「7」である信頼度が高いので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS88に移行する。
ステップS101において、confidenceが、所定の最低閾値(TH_L_conf)を越え、最高閾値(TH_H_conf)未満である場合、「7」でなく、「1」である可能性があるので、ステップS102で「7」と認識した文字領域を膨張処理する。この膨張により、「1」が斜めに印字されて「7」と誤認された文字は、正しく「7」に修正される。ステップS103で、画像処理ライブラリ9により文字列に対しSingleOCRを行う。ステップS103でSingleCR処理により出力されるScoreのトップ1が「1」であるか否かを判断し、Scoreのトップ1が「1」でなければ、「7」であると確信できるので、それ以上の処理を行うことなく、図8のルーチンに戻り、次のステップS88に移行する。Scoreのトップ1が「1」であれば、「7」であると確信できるので、ステップS105で,文字「7」を「1」に入れ替え、[7」のConfidenceを「1」のConfidenceに入れ替えた後、図8のルーチンに戻り、次のステップS88に移行する。
図8のサブルーチンに戻ると、ステップS88で、min_confが最小閾値(TH_L_conf)を越え、mean_confが平均閾値(TH_mean_conf)を越えているか否かを判断する。最小閾値(TH_L_conf)と平均閾値(TH_H_conf)の具体例を表1に示すが、これに限るものではない。
ステップS88において、min_confが最小閾値(TH_L_conf)以下、又はmean_confが平均閾値(TH_mean_conf)以下であれば、信頼性がかなり低いので、ステップS75に戻り、次の文字列候補を選択する。ステップS88において、min_confが最小閾値(TH_L_conf)を越え、mean_confが平均閾値(TH_mean_conf)を越えていれば、ステップS89で、2桁の月数に対して距離を判別する。
例えば、図19に示すように、使用期限の日付文字の右側に製造番号が表示されていることがある。このような場合、「C」が「0」に誤認識されると、使用期限が「2016.10」と認識される。そこで、図20に示すように、最後2桁の月数と認識された数字の間の間隔、obj_disと、最後2桁の後に続く文字の間隔left_disの平均値mean(left_dis)とを比較する。obj_disが、mean(left_dis)を越えていれば、obj_disを無効とし、図22の例では、日付を「2016.1」と認識する。obj_disが、mean(left_dis)以下であれば、obj_disを有効とし、図22の例では、日付を「2016.10」と認識する。ステップS89の処理の後、図6のステップS52,S54,S56,S58,S59、又は図3のステップS7に進む。
図3のステップS7において、制御装置1は、OCRに成功したか否か、すなわち、使用期限の日付を表す文字列の抽出に成功したか否かを判断し、YESのときはステップS8に進み、NOのときはステップS10に進む。月が「1」であると認識した場合、実際には「10」〜「12」であるところ、容器7の角度などに起因して誤って「1」であると認識している可能性がある。以下のステップでは、1つの入力画像に係る文字列候補が月を表す数字として「1」のみを含むとき、他の入力画像に係る文字列候補が月を表す数字として「1」のみを含むか否かを判断する。ステップS8において、制御装置1は、月は「1」であるか否かを判断し、YESのときはステップS9に進み、NOのときはステップS12に進む。ステップS9において、制御装置1は、同じ日付を2回検出したか否かを判断し、YESのときはステップS12に進み、NOのときはステップS10に進む。ステップS10において、制御装置1は、容器7を1周させて18枚撮影したか否かを判断し、YESのときはステップS13に進み、NOのときはステップS11に進む。ステップS11において、制御装置1は、容器7を回転させる。例えば、容器7を20度ずつ回転させる場合には、合計で18個の入力画像を取得することができる。また、容器7の直径が異なる場合であっても一定の角度毎に画像を取得するために、容器7を2周にわたって回転させて直径を検出し、一定の時間間隔で容器7の画像を取得しながら、その直径に応じて異なる速度で容器7を回転させてもよい。ステップS12において、制御装置1は、日付を出力する。ステップS13において、制御装置1は、エラーを出力する。
以上説明したように、本実施形態に係る光学文字認識装置によれば、文字列の画像に含まれるさまざまなノイズを、文字列を光学的に認識する前に予め除去することにより、従来よりも高い精度で日付を表す文字列を認識することができる。
入力画像は、円筒形状の容器の画像に限定されず、他の画像であってもよい(平坦な物体の画像、又は任意の画像データ)。
制御装置1が外部のPC9に接続されているとき、図3〜図10の日付検出処理は、少なくとも部分的にPC9によって実行されてもよい。
以上説明したように日付を表す文字列を認識する光学文字認識方法を実施してもよい。また、そのような光学文字認識方法は、コンピュータによって実行されたときに文字列を光学的に認識するコンピュータプログラムとして実施されてもよい。また、そのようなコンピュータプログラムは、コンピュータにより読み取り可能な記録媒体に格納されてもよい。例えば、図1の記録媒体10にそのようなコンピュータプログラムを格納し、PC11は、記録媒体12からコンピュータプログラムを読み取ったとき、当該コンピュータプログラムに従って光学文字認識方法を実施する。
本発明の光学文字認識装置、光学文字認識方法、コンピュータプログラム、及び記録媒体は、従来よりも高い精度で日付を表す文字列を認識することができる。
1…制御装置、
2…カメラ、
3…証明装置、
4…ローラ、
5…無端ベルト、
6…認識台、
7…容器、
8…当接部、
9…画像処理ライブラリ、
10…文字認識部、
11…パーソナルコンピュータ(PC)、
12…記録媒体、
21…目標領域、
31…文字列候補マスク、
41…文字列候補のバウンディングボックス、
42…文字列候補のバウンディングボックス。
2…カメラ、
3…証明装置、
4…ローラ、
5…無端ベルト、
6…認識台、
7…容器、
8…当接部、
9…画像処理ライブラリ、
10…文字認識部、
11…パーソナルコンピュータ(PC)、
12…記録媒体、
21…目標領域、
31…文字列候補マスク、
41…文字列候補のバウンディングボックス、
42…文字列候補のバウンディングボックス。
Claims (12)
- 文字列を光学的に認識する光学文字認識装置において、前記光学文字認識装置は、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1の処理手段と、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2の処理手段と、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3の処理手段とを備えたことを特徴とする光学文字認識装置。 - 前記第3の処理手段は、前記候補オブジェクトの特徴量と中心座標により前記候補オブジェクトをグルーピングし、グルーピングした前記候補オブジェクトを連結して前記文字列候補として抽出することを特徴とする請求項1に記載の光学文字認識装置。
- 前記第3の処理手段は、前記候補オブジェクトの高さを特徴量とし、前記候補オブジェクトの中心行座標と高さにより前記候補オブジェクトをグルーピングすることを特徴とする請求項2に記載の光学文字認識装置。
- 前記第3の処理手段は、前記候補オブジェクトの幅を特徴量とし、前記候補オブジェクトの中心列座標と幅により前記候補オブジェクトをグルーピングすることを特徴とする請求項2に記載の光学文字認識装置。
- 前記第3の処理手段は、認識した日付に「6」を含み、かつ、前記フォーマット設定付きワードOCRの出力の信頼度が所定の閾値範囲であるとき、前記「6」を含む文字領域を細線化及び膨張処理してシングルOCRを行い、スコアのトップ1が「5」であれば、「6」を「5」と入れ替え、「6」の信頼度を「5」の信頼度と入れ替えることを特徴とする請求項1に記載の光学文字認識装置。
- 前記第3の処理手段は、認識した日付に「7」を含み、かつ、前記フォーマット設定付きワードOCRの出力の信頼度が所定の閾値範囲であるとき、前記「7」を含む文字領域を膨張処理してシングルOCRを行い、スコアのトップ1が「1」であれば、「7」を「1」と入れ替え、「7」の信頼度を「1」の信頼度と入れ替えることを特徴とする請求項1に記載の光学文字認識装置。
- 前記第3の処理手段は、前記フォーマット設定付きワードOCRの出力の信頼度の最小値と平均値を求め、前記信頼度の最小値が所定の閾値以上であり、かつ前記信頼度の平均値が所定の閾値以上であるとき、前記フォーマット設定付きワードOCRの出力を日付と認識することを特徴とする請求項1から6のいずれかに記載の光学文字認識装置。
- 前記第3の処理手段は、前記文字列候補の2桁の月数に相当する候補オブジェクトの間隔と、前記2桁の月数に相当する候補オブジェクトと以外の候補オブジェクトの間隔の平均間隔を求め、前記間隔が前記平均間隔より大きいとき、月数の1桁目の前記候補オブジェクトを無視し、2桁目の前記候補オブジェクトを月数として認識し、前記間隔が前記平均間隔以下であるとき、2桁の候補オブジェクトを月数として認識することを特徴とする請求項1から7のいずれかに記載の光学文字認識装置。
- 前記光学文字認識装置は、
カメラと、
証明装置と、
前記円筒形状の容器の回転軸の周りに回転可能であるように前記容器を保持する認識台と、
前記容器には、前記容器中の容器の使用期限の日付を表す文字列が印字されていることを特徴とする請求項1から8のいずれか1つに記載の光学文字認識装置。 - 文字列を光学的に認識する光学文字認識方法において、前記光学文字認識方法は、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップとを備えたことを特徴とする光学文字認識方法。 - コンピュータによって実行されたときに文字列を光学的に認識するコンピュータプログラムにおいて、前記コンピュータプログラムは、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップとを備えたことを特徴とするコンピュータプログラム。 - コンピュータによって実行されたときに文字列を光学的に認識するコンピュータプログラムを格納したコンピュータにより読み取り可能な記録媒体において、前記コンピュータプログラムは、
入力画像から、認識対象のオブジェクトを含む目標領域を抽出する第1のステップと、
前記目標領域に含まれるオブジェクトから、少なくとも1つの文字列候補のオブジェクトを含む候補オブジェクトを抽出する第2のステップと、
前記文字列候補を選択し、フォーマット設定付きワードOCRを行い、スコアが所定の閾値以上であるときに前記文字列候補を日付として認識する第3のステップを備えたことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016056286A JP2017173925A (ja) | 2016-03-18 | 2016-03-18 | 光学文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016056286A JP2017173925A (ja) | 2016-03-18 | 2016-03-18 | 光学文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017173925A true JP2017173925A (ja) | 2017-09-28 |
Family
ID=59972031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016056286A Pending JP2017173925A (ja) | 2016-03-18 | 2016-03-18 | 光学文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017173925A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255583A (zh) * | 2021-06-21 | 2021-08-13 | 中国平安人寿保险股份有限公司 | 数据标注方法、装置、计算机设备和存储介质 |
WO2022060082A1 (ko) * | 2020-09-16 | 2022-03-24 | 주식회사 스마트잭 | 시약병 특징을 이용한 영상분석 시약정보 수집 방법 및 장치 |
JP2022133474A (ja) * | 2021-12-10 | 2022-09-13 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テキストの認識の方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
-
2016
- 2016-03-18 JP JP2016056286A patent/JP2017173925A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022060082A1 (ko) * | 2020-09-16 | 2022-03-24 | 주식회사 스마트잭 | 시약병 특징을 이용한 영상분석 시약정보 수집 방법 및 장치 |
CN113255583A (zh) * | 2021-06-21 | 2021-08-13 | 中国平安人寿保险股份有限公司 | 数据标注方法、装置、计算机设备和存储介质 |
CN113255583B (zh) * | 2021-06-21 | 2023-02-03 | 中国平安人寿保险股份有限公司 | 数据标注方法、装置、计算机设备和存储介质 |
JP2022133474A (ja) * | 2021-12-10 | 2022-09-13 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テキストの認識の方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6843213B2 (ja) | 画像処理装置及び画像処理方法 | |
JP6344389B2 (ja) | 光学文字認識装置 | |
JP6527410B2 (ja) | 文字認識装置、文字認識方法、及びプログラム | |
JP6143111B2 (ja) | 物体識別装置、物体識別方法、及びプログラム | |
US10095943B2 (en) | Image recognition apparatus | |
CN107403128B (zh) | 一种物品识别方法及装置 | |
JP6831951B2 (ja) | 画像認識システム | |
US8538170B2 (en) | System and method for document location and recognition | |
JP2017173925A (ja) | 光学文字認識装置 | |
JP2019045909A (ja) | 画像認識システム | |
CN107403179B (zh) | 一种物品包装信息的注册方法及装置 | |
JP2023040038A (ja) | プログラム、情報処理方法及び情報処理装置 | |
JP6628336B2 (ja) | 情報処理システム | |
JP2019211869A (ja) | 検索対象情報絞込システム | |
JP2023156991A (ja) | 情報処理システム | |
EP3379489A1 (en) | Printing device, method, and program | |
JP6890849B2 (ja) | 情報処理システム | |
WO2023171132A1 (ja) | 情報処理システム | |
JP6941331B2 (ja) | 画像認識システム | |
US10576362B2 (en) | Card with machine-readable markings, system and method | |
JP7343115B1 (ja) | 情報処理システム | |
JP4188344B2 (ja) | 指紋照合装置、方法およびプログラム | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP6544191B2 (ja) | 画像作成装置 | |
JPS6379193A (ja) | 文字読取装置 |