JP5601279B2 - 数字用テンプレート、数字認識装置及び数字認識方法 - Google Patents

数字用テンプレート、数字認識装置及び数字認識方法 Download PDF

Info

Publication number
JP5601279B2
JP5601279B2 JP2011116205A JP2011116205A JP5601279B2 JP 5601279 B2 JP5601279 B2 JP 5601279B2 JP 2011116205 A JP2011116205 A JP 2011116205A JP 2011116205 A JP2011116205 A JP 2011116205A JP 5601279 B2 JP5601279 B2 JP 5601279B2
Authority
JP
Japan
Prior art keywords
image
character string
numbers
cutout
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011116205A
Other languages
English (en)
Other versions
JP2012243283A (ja
Inventor
杉原  淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Metal Mining Co Ltd
Original Assignee
Sumitomo Metal Mining Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Metal Mining Co Ltd filed Critical Sumitomo Metal Mining Co Ltd
Priority to JP2011116205A priority Critical patent/JP5601279B2/ja
Publication of JP2012243283A publication Critical patent/JP2012243283A/ja
Application granted granted Critical
Publication of JP5601279B2 publication Critical patent/JP5601279B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレート、並びに、数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識装置及び数字認識方法に関する。
従来、スキャナで読み込んだ横書きの文字列の画像を含む原稿画像に対し、横方向に射影をとることで行矩形の文字列の画像を切り出し、さらに、縦方向に射影をとることでその行矩形の文字列の画像に含まれる各文字の画像を切り出すようにした文字認識装置が知られている(例えば、特許文献1参照。)。
特開平5−114048号公報
しかしながら、特許文献1は、外接矩形が正方形となる文字であり、文字間のピッチが固定された横書きの文字列に含まれる文字を認識対象として開示するのみであり、認識対象となる文字がどのように形成されたかを開示することはなく、手書きされた数字を認識対象とすることもない。
上述の点に鑑み、本発明は、画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレート、並びに、数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識装置及び数字認識方法を提供することを目的とする。
上述の目的を達成するために、本発明の実施例に係る数字用テンプレートは、画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレートであって、一又は複数のセグメントで構成される、0から9までの数字のそれぞれを書けるようにする切り抜き部を備え、前記切り抜き部を構成する一又は複数のセグメントは、該切り抜き部を用いて書かれた0から9までの数字のそれぞれの画像に関する、前記文字列の並び方向に垂直な方向への射影に切れ目が生じないように配置されることを特徴とする。
また、本発明の実施例に係る数字認識装置は、上述の数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識装置であって、前記文字列が書かれた対象物の画像を取得する画像取得部と、前記文字列の並び方向に平行な方向への射影により前記画像取得部が取得した対象物の画像における文字列の画像を切り出す文字列切り出し部と、前記文字列の並び方向に垂直な方向への射影により前記文字列切り出し部が切り出した文字列の画像における数字の画像を切り出す数字切り出し部と、前記数字切り出し部が切り出した数字の画像と予め記憶された数字の画像とを照合する数字照合部と、を備えることを特徴とする。
また、本発明の実施例に係る数字認識方法は、上述の数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識方法であって、前記文字列が書かれた対象物の画像を取得する画像取得ステップと、前記文字列の並び方向に平行な方向への射影により前記画像取得ステップにおいて取得された対象物の画像における文字列の画像を切り出す文字列切り出しステップと、前記文字列の並び方向に垂直な方向への射影により前記文字列切り出しステップにおいて切り出された文字列の画像における数字の画像を切り出す数字切り出しステップと、前記数字切り出しステップにおいて切り出された数字の画像と予め記憶された数字の画像とを照合する数字照合ステップとを備えることを特徴とする。
上述の手段により、本発明は、画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレート、並びに、数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識装置及び数字認識方法を提供することができる。
本発明の実施例に係る数字認識装置の構成例を示す機能ブロック図である。 数字用テンプレートの構成例を示す図(その1)である。 図2の数字用テンプレートを用いて手書きされる0〜9の数字を示す図である。 匣鉢の表面画像の一例を示す図である。 図4の表面画像に基づく処理対象画像の一例を示す図である。 処理対象画像と文字列画像との間の関係を示す図である。 図2の数字用テンプレートを用いて手書きされる0〜9の数字と、それら数字の下方向における射影ヒストグラムとを示す図である。 文字列画像と数字画像との間の関係を示す図である。 数字認識処理の流れを示すフローチャートである。 数字用テンプレートの構成例を示す図(その2)である。 図10の数字用テンプレートを用いて手書きされる0〜9の数字と、それら数字の右方向における射影ヒストグラムとを示す図である。 横書き用の切り抜き部の別の構成列を示す図である。 図12の切り抜き部を用いて手書きされる0〜9の数字と、それら数字の下方向における射影ヒストグラムとを示す図である。 縦書き用の切り抜き部の別の構成列を示す図である。 図14の切り抜き部を用いて手書きされる0〜9の数字と、それら数字の右方向における射影ヒストグラムとを示す図である。 書き込み対象物の表面にあてがわれた数字用テンプレートの側面図である。
図1は、本発明の実施例に係る数字認識装置の構成例100を示す機能ブロック図である。本実施例において、数字認識装置100は、電子工業用の粉体材料を受け容れる升状の容器である匣鉢の側壁の外表面に手書きされる数字を画像処理によって認識する装置である。しかしながら、数字認識装置100は、他の様々な物の表面に手書きされる数字を画像処理によって認識するために利用可能であり、数字が手書きされるその表面は、平面、曲面の何れであってもよく、滑面、粗面の何れであってもよい。
数字認識装置100は、主に、制御装置1、撮像装置2、及び記憶装置3で構成され、例えば、撮像装置2により匣鉢の側面を撮像して表面画像を取得し、制御装置1によりその表面画像に含まれる数字の画像を切り出して数字を認識し、その認識結果を記憶装置3に記憶する。
制御装置1は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を備えたコンピュータであって、例えば、処理対象画像生成部10、文字列切り出し部11、数字切り出し部12、数字照合部13、及び認識結果記憶部14のそれぞれの機能要素に対応するプログラムをROMから読み出してRAMに展開しながら、各機能要素に対応する処理をCPUに実行させる。
撮像装置2は、文字列を書き込む対象である書き込み対象物の表面を撮像するための装置であり、例えば、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の撮像素子を備えたカメラである。
記憶装置3は、各種情報を記憶するための装置であり、例えば、ハードディスク等の不揮発性記憶媒体であって、撮像装置2が撮像した画像、制御装置1による数字の認識結果等を記憶する。
ここで、「手書きされる数字」とは、テンプレートを用いて書かれる数字であり、例えば、テンプレートを書き込み対象物の表面にあてがい、筆、ペン、スプレー等で塗料を付着させたり、エッチング液、シンナー等で表面を溶かしたり、或いは、電動ドリル、電動彫刻機等で表面を加工したりすることによって形成される数字を意味する。
図2は、本実施例において数字を手書きするために用いられる数字用テンプレートの構成例を示す図である。
数字用テンプレートTMP1は、同一形状の六つの切り抜き部TP1〜TP6を含む板状の部材であり、使用者が、左右に隣り合う数字の間に距離D1以上の間隔を空けて6桁の数字を横書きできるように構成される。
六つの切り抜き部TP1〜TP6のそれぞれは、幅W1、高さH1の矩形領域にある3つのセグメントSG1〜SG3で構成される。セグメントSG1、SG3は、X方向に長い長方形の切り抜きである。セグメントSG2は、H字形状の切り抜きであり、Y方向においてセグメントSG1とセグメントSG3との間に配置される。また、セグメントSG2は、セグメントSG1及びセグメントSG3のそれぞれから間隔SL1を隔てて配置される。
図3は、切り抜き部TP1〜TP6のうちの一つを用いて手書きされる0〜9の数字を示す図である。このように、数字用テンプレートTMP1の使用者は、0〜9の数字のそれぞれに対応する10個の切り抜き部を用いるのではなく、0〜9の全ての数字に対応する切り抜き部を一つだけ用いて0〜9の全ての数字を手書きすることができる。したがって、使用者は、数字を一つ書く度に数字用テンプレートTMP1を移動させる必要なく、六つ以下の数字の任意の組み合わせを横書きすることができる。
ここで再び図1を参照しながら、制御装置1が有する各種機能要素について説明する。
処理対象画像生成部10は、文字列切り出し処理(後述)の対象となる処理対象画像を生成するための機能要素であり、例えば、撮像装置2が出力する匣鉢の表面画像を取得して処理対象画像を生成する。
具体的には、処理対象画像生成部10は、グレースケール化処理、二値化処理、膨張・縮小処理等の各種画像処理を表面画像に対して施すことによって、文字列や数字の切り出しに適した処理対象画像を生成する。なお、本実施例における二値化処理は、輝度値が閾値未満の画素の値を「1」に設定し、輝度値が閾値以上の画素の値を「0」に設定する。
図4は、撮像装置2が出力する匣鉢の表面画像の一例G1を示し、汚れやひびが存在する表面の左下隅に画像水平方向に並ぶ4桁のシリアル番号「4567」が書かれた状態を示す。
また、図5は、処理対象画像生成部10が生成した処理対象画像の一例G2を示し、各種画像処理によって表面の汚れやひびが取り除かれ、図4の表面画像G1に比べ、シリアル番号が見えやすくなった状態を示す。
文字列切り出し部11は、表面画像G1又は処理対象画像G2から文字列を切り出すための機能要素であり、例えば、処理対象画像生成部10が生成した処理対象画像G2の画像水平方向又は画像垂直方向に関する射影ヒストグラムを導き出し、度数が所定の閾値以上となる画素行又は画素列が集まる画像部分を文字列画像として切り出す。なお、切り出される文字列画像は、一つであってもよく、複数であってもよい。以下、文字列切り出し部11によるこの処理を「文字列切り出し処理」とする。
「射影ヒストグラム」とは、所定方向に並ぶ画素群における所定条件を満たす画素の度数を表すグラフであり、例えば、処理対象画像G2における画像水平方向に並ぶ画素行のうち閾値以下の輝度値を有する画素(例えば、二値化処理によって値「1」が割り当てられた画素である。)の数を画素行毎に計数して表すようにする。
本実施例では、文字列切り出し部11は、数字列の並び方向にあたる処理対象画像の画像水平方向における射影ヒストグラムを導き出し、二値化処理によって値「1」が割り当てられた画素の数を画素行毎に計数する。その後、文字列切り出し部11は、その計数値が閾値以上となる画素行を特定し、その特定した画素行を含む画像部分を文字列画像として切り出す。
図6は、処理対象画像G2と、文字列切り出し部11が切り出す文字列画像G3との間の関係を示す図であり、説明のため、文字列の右方向に射影した場合の射影ヒストグラムを処理対象画像G2の右側に示す。なお、射影ヒストグラムは画像垂直方向に伸びる基準線BL1から左方向に伸びる棒線の長さによって所定条件を満たす画素の度数を表し、文字列切り出し部11はその度数が閾値TH1以上となる画像垂直方向最上位の画素行とその度数が閾値TH1以上となる画像垂直方向最下位の画素行とを含む高さH1の画像部分を文字列画像G3として切り出すようにする。文字列の左方向に射影した場合も同様である。
また、文字列切り出し部11は、その度数が閾値TH1以上となる二つの画素行の間の画像垂直方向における距離(画素数)が所定値以上となる場合には、それら二つの画素行のそれぞれを二つの横書きの文字列画像のそれぞれの境界として認識しながら、二つ以上の横書きの文字列画像を切り出すようにする。
なお、文字列切り出し部11は、処理対象画像G2を用いることなく、表面画像G1の画像水平方向又は画像垂直方向に関する射影ヒストグラムを導き出し、度数が所定の閾値以上となる画素行又は画素列が集まる画像部分を文字列画像として切り出すようにしてもよい。この場合、処理対象画像生成部10は、撮像装置2から表面画像を取得する画像取得部として機能する。
数字切り出し部12は、文字列画像から数字を切り出すための機能要素であり、例えば、文字列切り出し部11が切り出した文字列画像G3の画像水平方向又は画像垂直方向に関する射影ヒストグラムを導き出し、度数が所定の閾値以上となる画素行又は画素列が切れ目なく集まる画像部分を数字画像として切り出す。なお、切り出される数字画像は、一つであってもよく、複数であってもよい。以下、数字切り出し部12によるこの処理を「数字切り出し処理」とする。
また、数字切り出し部12は、文字列切り出し部11が画像水平方向における射影ヒストグラムを導き出していた場合には、画像垂直方向における射影ヒストグラムを導き出し、度数が所定の閾値以上となる画素列が切れ目なく連続する画像部分を数字画像として切り出す。
反対に、数字切り出し部12は、文字列切り出し部11が画像垂直方向における射影ヒストグラムを導き出していた場合には、画像水平方向における射影ヒストグラムを導き出し、度数が所定の閾値以上となる画素行が切れ目なく連続する画像部分を数字画像として切り出す。
図7は、図2の数字用テンプレートTMP1を用いて手書きされる0〜9の数字と、それら数字の下方向における射影ヒストグラムとを示す図であり、図7(A)が数字用テンプレートTMP1を用いて手書きされた0〜9の数字を示し、図7(B)が0〜9の数字のそれぞれに対応する射影ヒストグラムを示す。なお、射影ヒストグラムは画像水平方向に伸びる基準線BL2から上方向に伸びる棒線の長さによって所定条件を満たす画素の度数を表す。
図7で示されるように、0〜9の数字のそれぞれに対応する射影ヒストグラムにおける、度数が閾値TH2以上となる画素列は、幅W1にわたって画像水平方向に切れ目なく連続している(数字「1」に対応する射影ヒストグラムにおける、度数が閾値TH2以上となる画素列は、例外的に、幅W2にわたって画像水平方向に切れ目なく連続する。)。
図8は、図6の文字列画像G3と、数字切り出し部12が切り出す四つの数字画像G4(G4−1〜G4−4)との間の関係を示す図であり、説明のため、文字列の下方向に射影した場合の射影ヒストグラムを文字列画像G3の下側に示す。なお、射影ヒストグラムは、画像水平方向に伸びる基準線BL2から上方向に伸びる棒線の長さによって所定条件を満たす画素の度数を表す。また、数字切り出し部12は、その度数が閾値TH2以上となる画素列が画像水平方向に切れ目なく連続する高さH1、幅W1の四つの画像部分を数字画像G4−1〜G4−4として切り出す。また、四つの数字画像G4−1〜G4−4のそれぞれは、画像水平方向に、互いに距離D1を隔てて配置される。文字列の上方向に射影した場合も同様である。
また、数字切り出し部12は、文字列切り出し部11が複数の文字列画像G3を切り出していた場合には、それら複数の文字列画像G3のそれぞれに対して数字切り出し処理を実行する。
数字照合部13は、切り出された数字画像G4と登録数字画像とを照合するための機能要素である。
「登録数字画像」とは、数字認識装置100に予め登録された数字画像であり、例えば、数字を書くのに用いた数字用テンプレートにおける切り抜き部の形状に対応する標準的な数字の形状を表す画像であり、0〜9の数字のそれぞれに対応する画像を含む。
数字照合部13は、例えば、数字切り出し部12が切り出した高さH1、幅W1の数字画像G4−1〜G4−4のそれぞれと、ROMに登録された0〜9の数字のそれぞれに対応する高さH1、幅W1の登録数字画像(図7(A)参照。)との間でパターンマッチングを実行する。
数字照合部13は、例えば、0〜9の数字のそれぞれに対応する10個の登録数字画像のうち、切り出された特定の数字画像に関して最も類似度が高い登録数字画像が表す数字を、その特定の数字画像が表す数字として認識する。
なお、「類似度」とは、切り出された数字画像と登録数字画像のそれぞれとの類似の度合いを表す尺度である。類似度は、例えば、切り出された数字画像を構成する画素の輝度値(二値化された値)と登録数字画像を構成する対応する画素の輝度値(二値化された値)とを一つ一つ比較したときに、輝度値が等しいとされた画素の数で表される。
認識結果記憶部14は、数字の認識結果を記憶するための機能要素であり、例えば、数字照合部13が認識した数字で構成される4桁のシリアル番号を、対応する書き込み対象物(匣鉢)に関する情報(表面画像、処理対象画像、撮像時刻等である。)に関連付けて記憶装置3に記憶する。
また、認識結果記憶部14は、所定の条件を満たす書き込み対象物(匣鉢)に対応するシリアル番号のみを記憶するようにしてもよい。具体的には、認識結果記憶部14は、画像処理等によってひび割れが検出された書き込み対象物(匣鉢)に対応するシリアル番号のみを記憶するようにしてもよい。この場合、認識結果記憶部14は、対応する書き込み対象物(匣鉢)に関する情報に対してシリアル番号を関連付けることなく(対応する書き込み対象物(匣鉢)に関する情報を記憶装置3に記憶することなく)、シリアル番号のみを記憶するようにしてもよい。記憶装置3に記憶される情報の量を低減させるためである。
また、認識結果記憶部14は、数字照合部13が認識した数字で構成されるシリアル番号を、対応する書き込み対象物(匣鉢)に関する情報と共に、或いは、単独で、表示装置(図示せず。)に表示させてもよい。
次に、図9を参照しながら、数字認識装置100が書き込み対象物(匣鉢)の表面に書き込まれたシリアル番号を認識する処理(以下、「数字認識処理」とする。)の流れについて説明する。なお、図9は、数字認識処理の流れを示すフローチャートであり、数字認識装置100は、撮像装置2が書き込み対象物(匣鉢)の表面を撮像する度にこの数字認識処理を実行するものとする。なお、数字認識装置100は、撮像装置2が撮像した複数の表面画像を一纏めにしてこの数字認識処理を実行するようにしてもよい。また、撮像装置2が撮像する匣鉢の表面画像G1(図4参照。)は、数字用テンプレートTMP1(図2参照。)を用いて書き込まれた横書きの4桁のシリアル番号を含むものとする。
最初に、制御装置1は、処理対象画像生成部10により、撮像装置2が撮像した匣鉢の表面画像G1を取得し、表面画像G1に各種画像処理を施すことによって処理対象画像G2(図5参照。)を生成する(ステップS1)。
その後、制御装置1は、文字列切り出し部11により、処理対象画像生成部10が生成した処理対象画像G2の画像水平方向(シリアル番号の並び方向)に関する射影ヒストグラム(図6参照。)を導き出し、度数が閾値TH1以上となる画素行が集まる高さH1の画像部分を文字列画像G3(図6参照。)として切り出す(ステップS2)。
その後、制御装置1は、数字切り出し部12により、文字列切り出し部11が切り出した文字列画像G3の画像垂直方向(シリアル番号の並び方向に垂直な方向)に関する射影ヒストグラム(図8参照。)を導き出し、度数が閾値TH2以上となる画素列が切れ目なく集まる幅W1の四つの画像部分を数字画像G4−1〜G4−4(図8参照。)として切り出す(ステップS3)。
その後、制御装置1は、数字照合部13により、数字切り出し部12が切り出した高さH1、幅W1の数字画像G4−1〜G4−4のそれぞれと、ROMに登録された0〜9の数字のそれぞれに対応する高さH1、幅W1の登録数字画像(図7(A)参照。)とを照合し(ステップS4)、類似度を導き出す。
ここで、制御装置1は、0〜9の数字のそれぞれに対応する10個の登録数字画像のうち、数字画像G4−1に関して最も類似度が高い登録数字画像が表す数字(この場合、「4」である。)を、数字画像G4−1が表す数字として認識する。
また、制御装置1は、数字画像G4−2〜G4−4のそれぞれについても同様の処理を実行し、数字画像G4−2、G4−3、G4−4のそれぞれが表す数字「5」、「6」、「7」を認識し、4桁のシリアル番号が「4567」であることを認識する。
その後、制御装置1は、認識結果記憶部14により、数字照合部13が認識した数字で構成される4桁のシリアル番号「4567」を処理対象画像G2及び撮像時刻に関連付けて記憶装置3に記憶する(ステップS5)。
このようにして、数字認識装置100は、例えば、数字認識処理と並行して実行されるひび割れ検出処理(例えば、表面画像G1を利用してひび割れを検出する処理である。)によりひび割れが検出された匣鉢のシリアル番号をひび割れ検出直後に表示装置に表示したり、或いは、ひび割れが検出された複数の匣鉢のシリアル番号を所望のタイミングで一括してリスト表示したりすることができる。
次に、図10及び図11を参照しながら、数字認識装置100が認識可能な縦書きの数字列を手書きするための数字用テンプレートについて説明する。
図10は、縦書きの文字列を手書きするために用いられる数字用テンプレートの構成例TMP2を示す図である。
数字用テンプレートTMP2は、同一形状の四つの切り抜き部TP11〜TP14を含む板状の部材であり、使用者が、上下に隣り合う数字の間に距離D1の間隔を空けて四つの数字を縦書きできるように構成される。
四つの切り抜き部TP11〜TP14のそれぞれは、幅W1、高さH1の矩形領域にある3つのセグメントSG11〜SG13で構成される。セグメントSG12は、幅W1、高さH1の矩形領域に形成されるH字形状の切り抜きである。セグメントSG11及びセグメントSG13は、X方向においてH字形状のセグメントSG12の両脚の間に配置される長方形の切り抜きである。また、セグメントSG11及びセグメントSG13は、セグメントSG12の両脚のそれぞれから間隔SL2を隔てて配置される。
図11は、切り抜き部TP11〜TP14のうちの一つを用いて手書きされる0〜9の数字と、それら数字の右方向における射影ヒストグラムとを示す図であり、図11(A)が数字用テンプレートTMP2を用いて手書きされた0〜9の数字を示し、図11(B)が0〜9の数字のそれぞれに対応する射影ヒストグラムを示す。なお、射影ヒストグラムは画像垂直方向に伸びる基準線BL3から左方向に伸びる棒線の長さによって所定条件を満たす画素の度数を表す。
図11(B)で示されるように、0〜9の数字のそれぞれに対応する射影ヒストグラムにおける、度数が所定の閾値TH3以上となる画素行は、高さH1にわたって画像垂直方向に切れ目なく連続している。
このように、数字用テンプレートTMP2の使用者は、0〜9の数字のそれぞれに対応する10個の切り抜き部を用いるのではなく、0〜9の全ての数字に対応する切り抜き部を一つだけ用いて0〜9の全ての数字を手書きすることができる。したがって、使用者は、数字を一つ書く度に数字用テンプレートTMP2を移動させる必要なく、四つ以下の数字の任意の組み合わせを縦書きすることができる。また、数字用テンプレートTMP2を用いて書かれた数字の画像垂直方向における射影は高さH1にわたって切れ目を有しないものとなる。
また、数字認識装置100は、数字用テンプレートTMP1を用いて書かれた横書きの数字列及びその数字列に含まれる個々の数字を切り出す場合と同様に、数字用テンプレートTMP2を用いて書かれた縦書きの数字列及びその数字列に含まれる個々の数字を切り出すことができる。
その場合、文字列切り出し部11は、数字の下方向における射影ヒストグラムを導き出した場合の度数が所定の閾値以上となる二つの画素列の間の画像水平方向における距離(画素数)が所定値以上となる場合には、それら二つの画素列のそれぞれを二つの縦書きの文字列画像のそれぞれの境界として認識しながら、二つ以上の縦書きの文字列画像を切り出すようにする。
これにより、数字認識装置100は、匣鉢のシリアル番号が縦書きされている場合であっても、例えば、数字認識処理と並行して実行されるひび割れ検出処理によりひび割れが検出された匣鉢のシリアル番号をひび割れ検出直後に表示装置に表示したり、或いは、ひび割れが検出された複数の匣鉢のシリアル番号を所望のタイミングで一括してリスト表示したりすることができる。
次に、図12及び図13を参照しながら、数字認識装置100が認識可能な横書きの数字列を手書きするための数字用テンプレートTMP1における切り抜き部の変形例について説明する。
図12は、横書きの文字列を手書きするために用いられる数字用テンプレートTMP1における切り抜き部の別の構成例TP20を示す図である。
切り抜き部TP20は、幅W1、高さH1の領域にある1つのセグメントSG21で構成される。
図13は、切り抜き部TP20を用いて手書きされる0〜9の数字のそれぞれと、それら数字の下方向における射影ヒストグラムとを示す図であり、図13(A)が切り抜き部TP20を用いて手書きされた0〜9の数字のそれぞれを示し、図13(B)が0〜9の数字のそれぞれに対応する射影ヒストグラムを示す。なお、射影ヒストグラムは画像水平方向に伸びる基準線BL4から上方向に伸びる棒線の長さによって所定条件を満たす画素の度数を表す。
図13(B)で示されるように、0〜9の数字のそれぞれに対応する射影ヒストグラムにおける、度数が所定の閾値TH4以上となる画素列は、幅W1にわたって画像水平方向に切れ目なく連続している(数字「1」に対応する射影ヒストグラムにおける、度数が閾値TH4以上となる画素列は、例外的に、幅W2にわたって画像水平方向に切れ目なく連続する。)。
このように、数字用テンプレートTMP1の使用者は、0〜9の数字のそれぞれに対応する10個の切り抜き部を用いるのではなく、0〜9の全ての数字に対応する切り抜き部TP20を一つだけ用いて0〜9の全ての数字を手書きすることができる。したがって、使用者は、数字を一つ書く度に数字用テンプレートTMP1を移動させる必要なく、六つ以下の数字の任意の組み合わせを横書きすることができる。また、数字用テンプレートTMP1を用いて書かれた数字の画像水平方向における射影は幅W1にわたって切れ目を有しないものとなる。
次に、図14及び図15を参照しながら、数字認識装置100が認識可能な縦書きの数字列を手書きするための数字用テンプレートTMP2における切り抜き部の変形例について説明する。
図14は、縦書きの文字列を手書きするために用いられる数字用テンプレートTMP2における切り抜き部の別の構成例TP30を示す図である。
切り抜き部TP30は、幅W1、高さH1の領域にある2つのセグメントSG31及びセグメントSG32で構成される。
図15は、切り抜き部TP30を用いて手書きされる0〜9の数字のそれぞれと、それら数字の右方向における射影ヒストグラムとを示す図であり、図15(A)が切り抜き部TP30を用いて手書きされた0〜9の数字のそれぞれを示し、図15(B)が0〜9の数字のそれぞれに対応する射影ヒストグラムを示す。なお、射影ヒストグラムは画像垂直方向に伸びる基準線BL5から左方向に伸びる棒線の長さによって所定条件を満たす画素の度数を表す。
図15(B)で示されるように、0〜9の数字のそれぞれに対応する射影ヒストグラムにおける、度数が所定の閾値TH5以上となる画素行は、高さH1にわたって画像垂直方向に切れ目なく連続している。
このように、数字用テンプレートTMP2の使用者は、0〜9の数字のそれぞれに対応する10個の切り抜き部を用いるのではなく、0〜9の全ての数字に対応する切り抜き部TP30を一つだけ用いて0〜9の全ての数字を手書きすることができる。したがって、使用者は、数字を一つ書く度に数字用テンプレートTMP2を移動させる必要なく、四つ以下の数字の任意の組み合わせを縦書きすることができる。また、数字用テンプレートTMP2を用いて書かれた数字の画像垂直方向における射影は高さH1にわたって切れ目を有しないものとなる。
次に、図16を参照しながら、数字用テンプレートTMP1を書き込み対象物の表面にあてがったときの状態の一例について説明する。
図16は、書き込み対象物OBJの表面にあてがわれた数字用テンプレートTMP1の側面図であり、数字用テンプレートTMP1の一面に取り付けられるスペーサSPにより、数字用テンプレートTMP1の本体部BDと書き込み対象物OBJの表面との間に空間が形成された状態を示す。
この構成により、数字用テンプレートTMP1は、使用者がペン等を用いて数字を書き込む場合に、書き込まれた数字の縁でにじみが発生するのを抑えることができる。
なお、数字用テンプレートTMP1は、スペーサSPを備えることなく、その一面が書き込み対象物OBJの表面に直接接触するよう構成されてもよい。
以上のように、本実施例で用いられる数字用テンプレートは、数字切り出し処理において数字一文字の幅又は高さにわたって切れ目のない射影をもたらす切り抜き部の配置を採用するため、隣り合う数字の間の切れ目を認識しやすくし、数字認識装置100による数字の切り出し性能及び認識率を向上させることができる。
また、本実施例で用いられる数字用テンプレートの切り抜き部は、ディスプレイで数字を表示する際に用いられるLEDの7セグメント配置に比べ少ないセグメント数で構成されており、各数字を書くためのストローク数(画数)も少なくなり、書きやすさを向上させることができる。但し、本発明は、7セグメント以上のセグメントで構成される切り抜き部を除外するものではない。
また、本実施例で用いられる数字用テンプレートは、隣り合う数字が互いに接触するのを防止するので、数字認識装置100による確実な数字の切り出し及び認識を促進することができる。
また、本実施例で用いられる数字用テンプレートは、手書きではあるものの、書き込まれる数字の形状のバラツキを抑えることができるので、数字認識装置100によるパターンマッチングで使用される登録数字画像の数を(例えば、10個のみに)抑えることができ、パターンマッチングに要する時間を抑えることができる。
また、本実施例で用いられる数字用テンプレートは、使用者が切り抜き部における所望の部分を塗り潰しやすいように構成されるので、書き込まれた数字でかすれ、途切れ等が発生するのを抑えることができ、数字認識装置100による確実な数字の切り出しを促進することができる。
また、本実施例で用いられる数字用テンプレートは、補助線(なぞり書き用のガイドライン、数字一文字分を表す枠等である。)を書き込み対象物の表面に予め形成することなしに、使用者が標準的な形状の数字を書けるようにすることができ、数字認識装置100による確実な数字の切り出し及び認識を促進することができる。
以上、本発明の好ましい実施例について詳説したが、本発明は、上述した実施例に制限されることはなく、本発明の範囲を逸脱することなしに上述した実施例に種々の変形及び置換を加えることができる。
例えば、上述の実施例において、切り抜き部は、幅W1、高さH1の長方形の領域内に配置されるが、正方形の領域内に配置されるものであってもよく、円形、楕円形、多角形等の他の形状を有する領域内に配置されるものであってもよい。
また、上述の実施例において、数字用テンプレート内に配置される複数の切り抜き部はその形状が同一となっているが、異なる形状の切り抜き部が混在するものであってもよく、異なる大きさの切り抜き部が混在するものであってもよい。
また、上述の実施例において、切り抜き部を構成するセグメントの形状は直線で構成されているが、曲線を含むものであってもよい。
また、数字用テンプレートTMP1は、使用者が6桁の数字列を横書きできるように六つの切り抜き部TP1〜TP6を有するが、一つの切り抜き部のみを有するものであってもよく、二つから五つの切り抜き部又は七つ以上の切り抜き部を有するものであってもよい。
同様に、数字用テンプレートTMP1は、使用者が4桁の数字列を縦書きできるように四つの切り抜き部TP11〜TP14を有するが、一つの切り抜き部のみを有するものであってもよく、二つ、三つの切り抜き部又は五つ以上の切り抜き部を有するものであってもよい。
また、上述の実施例において、数字認識装置100は、数字のみを含む数字列における数字を認識するが、ひらがな、カタカナ、アルファベット等の数字以外の文字、記号、絵文字等を含む文字列における数字を認識するようにしてもよい。
1 制御装置
2 撮像装置
3 記憶装置
10 処理対象画像生成部
11 文字列切り出し部
12 数字切り出し部
13 数字照合部
14 認識結果記憶部
100 数字認識装置

Claims (5)

  1. 画像認識の対象となる文字列に含まれる数字を書くための数字用テンプレートであって、
    一又は複数のセグメントで構成される切り抜き部を備え、
    前記切り抜き部は、該切り抜き部の一つで0から9までの数字のそれぞれを書け
    前記切り抜き部を構成する一又は複数のセグメントは、該切り抜き部を用いて書かれた0から9までの数字のそれぞれの画像に関する、前記文字列の並び方向に垂直な方向への射影に切れ目が生じないように配置される、
    ことを特徴とする数字用テンプレート。
  2. 前記文字列の並び方向に並ぶ複数の切り抜き部を含む、
    ことを特徴とする請求項1に記載の数字用テンプレート。
  3. 数字が書き込まれる対象物と当該数字用テンプレートとの間に隙間を形成するためのスペーサを備える、
    ことを特徴とする請求項1又は2に記載の数字用テンプレート。
  4. 請求項1乃至3の何れか一項に記載の数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識装置であって、
    前記文字列が書かれた対象物の画像を取得する画像取得部と、
    前記文字列の並び方向に平行な方向への射影により前記画像取得部が取得した対象物の画像における文字列の画像を切り出す文字列切り出し部と、
    前記文字列の並び方向に垂直な方向への射影により前記文字列切り出し部が切り出した文字列の画像における数字の画像を切り出す数字切り出し部と、
    前記数字切り出し部が切り出した数字の画像と予め記憶された数字の画像とを照合する数字照合部と、
    を備えることを特徴とする数字認識装置。
  5. 請求項1乃至3の何れか一項に記載の数字用テンプレートを用いて書かれた数字を画像処理により認識する数字認識方法であって、
    前記文字列が書かれた対象物の画像を取得する画像取得ステップと、
    前記文字列の並び方向に平行な方向への射影により前記画像取得ステップにおいて取得された対象物の画像における文字列の画像を切り出す文字列切り出しステップと、
    前記文字列の並び方向に垂直な方向への射影により前記文字列切り出しステップにおいて切り出された文字列の画像における数字の画像を切り出す数字切り出しステップと、
    前記数字切り出しステップにおいて切り出された数字の画像と予め記憶された数字の画像とを照合する数字照合ステップと、
    を備えることを特徴とする数字認識方法。
JP2011116205A 2011-05-24 2011-05-24 数字用テンプレート、数字認識装置及び数字認識方法 Active JP5601279B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011116205A JP5601279B2 (ja) 2011-05-24 2011-05-24 数字用テンプレート、数字認識装置及び数字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011116205A JP5601279B2 (ja) 2011-05-24 2011-05-24 数字用テンプレート、数字認識装置及び数字認識方法

Publications (2)

Publication Number Publication Date
JP2012243283A JP2012243283A (ja) 2012-12-10
JP5601279B2 true JP5601279B2 (ja) 2014-10-08

Family

ID=47464876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011116205A Active JP5601279B2 (ja) 2011-05-24 2011-05-24 数字用テンプレート、数字認識装置及び数字認識方法

Country Status (1)

Country Link
JP (1) JP5601279B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512626B (zh) * 2015-12-02 2017-04-05 北京海泰方圆科技股份有限公司 一种识别数码管所显示数字的方法
CN109145912A (zh) * 2018-07-09 2019-01-04 华南理工大学 一种数字仪表读数自动识别方法
BR112021005549A2 (pt) * 2018-10-24 2021-06-29 Fujitsu Frontech Limited dispositivo de inspeção de notas, método de fiscalização de notas e programa de inspeção de notas

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS499330A (ja) * 1972-05-25 1974-01-26
JPS5778997U (ja) * 1980-11-04 1982-05-15
JP3133797B2 (ja) * 1991-10-23 2001-02-13 キヤノン株式会社 文字認識方法及びその装置
JPH0653199U (ja) * 1992-10-14 1994-07-19 義郎 菊池 一列に文字をセットして字を書くテンプレート

Also Published As

Publication number Publication date
JP2012243283A (ja) 2012-12-10

Similar Documents

Publication Publication Date Title
CN110264445B (zh) 分块模板匹配结合形态学处理的电池丝印质量检测方法
TWI413937B (zh) 影像辨識方法與裝置
JP4842197B2 (ja) 多重分割画像を用いた異常動作検出装置、異常動作検出方法及び異常動作検出用プログラム
JP2014059875A5 (ja)
US11170244B2 (en) Device and method for analyzing state of manual work by worker, and work analysis program
CN105184208B (zh) 一种二维码初步定位方法及系统
JP5601279B2 (ja) 数字用テンプレート、数字認識装置及び数字認識方法
CN112964724A (zh) 一种多目标多区域视觉检测方法及检测系统
CN103218600A (zh) 一种实时人脸检测算法
JP2016027444A5 (ja)
TWI428807B (zh) 光學式座標輸入裝置及其座標計算之方法
JP4392907B2 (ja) 文字切出し方法
JP6247103B2 (ja) 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム
JP7275983B2 (ja) 作業分析装置及び作業分析プログラム
JP2013238943A (ja) 二次元コード読取装置
JPH04303278A (ja) 圧縮映像の文字列分離方式
JP2008265169A (ja) カードおよびカード情報読み取り方法
CN108428241A (zh) 高清视频中移动目标的运动轨迹捕获方法
JP2008269121A (ja) 電子機器、2次元コード認識方法、プログラム及び2次元コード
JP4492258B2 (ja) 文字・図形の認識方法および検査方法
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
CN114529922A (zh) 一种无线框表格图像表格结构识别方法
JP6676256B2 (ja) 画像処理装置及び画像処理方法
JP2013065164A (ja) 画像処理装置、画像処理方法および画像処理プログラム
TWI674536B (zh) 指紋導航方法及電子裝置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140804

R150 Certificate of patent or registration of utility model

Ref document number: 5601279

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150