JP5831420B2 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP5831420B2
JP5831420B2 JP2012217683A JP2012217683A JP5831420B2 JP 5831420 B2 JP5831420 B2 JP 5831420B2 JP 2012217683 A JP2012217683 A JP 2012217683A JP 2012217683 A JP2012217683 A JP 2012217683A JP 5831420 B2 JP5831420 B2 JP 5831420B2
Authority
JP
Japan
Prior art keywords
character string
character
format
image processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012217683A
Other languages
English (en)
Other versions
JP2014071698A (ja
Inventor
徳和 殿谷
徳和 殿谷
匡史 日向
匡史 日向
善久 湊
善久 湊
正道 大江
正道 大江
真嗣 栗田
真嗣 栗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2012217683A priority Critical patent/JP5831420B2/ja
Priority to CN201310361931.XA priority patent/CN103714338B/zh
Priority to EP13183068.9A priority patent/EP2713314A3/en
Priority to US14/038,173 priority patent/US9189694B2/en
Publication of JP2014071698A publication Critical patent/JP2014071698A/ja
Application granted granted Critical
Publication of JP5831420B2 publication Critical patent/JP5831420B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する画像処理装置および画像処理方法に関する。
近年、工場の自動化やトレーサビリティの強化により、半製品や製品に付された文字の検査や読み取りのニーズが増加している。このようなニーズに対応して、半製品や製品に対する印字検査用途や文字読み取り用途の文字認識を行うための画像処理装置がしばしば用いられる。このような文字認識を行うための画像処理装置の性能向上が求められている。
このような文字認識に係る画像処理の一例として、特開2002−183667号公報(特許文献1)は、任意の文字集合を認識対象文字集合として設定して言語情報に基づいて高認識率で速やかに認識処理を行う文字認識装置を開示する。特開2006−106931号公報(特許文献2)は、濃淡画像から指定された文字列が存在する位置を探索する文字列探索装置を開示する。また、特開2009−193159号公報(特許文献3)は、文字数が変動する正規表現で表された情報を効率良くかつ正確に文字認識することができる領域抽出プログラムなどを開示する。
特開2002−183667号公報 特開2006−106931号公報 特開2009−193159号公報
ところで、文字認識における課題の一つとして、ノイズや検査位置のずれによる文字列領域の誤検出がある。例えば、複数の行にわたる文字列などを特定する場合などには、このような誤検出される文字列領域を除去することが難しい。また、このような用途では、上述の先行技術文献に開示されるいずれの方法を採用した場合であっても、文字認識を適切に行えない場合がある。
本発明は、このような課題を解決するためのものであり、その目的は、探索条件に合致する複数の文字列領域からなる組を入力画像から特定できる画像処理装置および画像処理方法を提供することである。
本発明のある局面によれば、文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する画像処理装置が提供される。画像処理装置は、探索条件を受け付ける設定手段を含む。探索条件は、複数のフォーマット文字列の指定を含む。各フォーマット文字列は、認識対象の文字別に文字種または特定文字の指定を含む。画像処理装置は、入力画像から候補となる文字列領域を抽出する抽出手段と、複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と複数のフォーマット文字列との類似度を算出する算出手段と、算出された類似度に応じて、複数の文字列領域からなる組のうち、探索条件に合致している組を決定する決定手段とを含む。
好ましくは、探索条件は、複数のフォーマット文字列間の相対位置関係をさらに含み、算出手段は、相対位置関係に合致する複数の文字列領域を選択して、類似度を算出する。
さらに好ましくは、設定手段は、複数のフォーマット文字列の入力順から複数のフォーマット文字列間の相対位置関係を決定する。
好ましくは、文字列領域は、行単位で文字列を抽出したものであり、相対位置関係は、入力画像における文字列領域の行の位置関係を示す。
好ましくは、決定手段は、算出された類似度が最も高い文字列領域の組を決定するとともに、当該決定した文字列領域の組に含まれない他の文字列領域を候補から除外する。
好ましくは、算出手段は、文字列領域に含まれる文字毎にそれぞれ算出される類似度から、文字列領域の組の類似度を算出する。
さらに好ましくは、算出手段は、対象の文字列領域に含まれる文字数が対応するフォーマット文字列で指定される文字数未満である場合には、算出される類似度を低下させる。
好ましくは、設定手段は、探索対象の文字列を含む参照画像に対して文字認識を実行することで取得される認識結果からフォーマット文字列の初期値を設定する。
さらに好ましくは、設定手段は、フォーマット文字列の初期値に対するユーザからの変更を受け付ける。
好ましくは、探索条件は、各文字種に対応付けられた記号を用いて表示される。
好ましくは、フォーマット文字列は、特定文字を認識対象から除外する指定を含む。
好ましくは、設定手段は、フォーマット文字列を予め保持しており、ユーザの選択に応じて、選択されたフォーマット文字列を探索条件に設定する。
本発明の別の局面によれば、文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する画像処理方法が提供される。画像処理方法は、探索条件を受け付けるステップを含む。探索条件は、複数のフォーマット文字列の指定を含む。各フォーマット文字列は、認識対象の文字別に文字種または特定文字の指定を含む。画像処理方法は、入力画像から候補となる文字列領域を抽出するステップと、複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と複数のフォーマット文字列との類似度を算出するステップと、算出された類似度に応じて、複数の文字列領域からなる組のうち、探索条件に合致している組を決定するステップとを含む。
本発明によれば、探索条件に合致する複数の文字列領域からなる組を入力画像から容易に特定できる。
本発明の実施の形態に係る画像処理装置において実行されるフォーマット文字列を用いた文字認識処理を説明するための図である。 本発明の実施の形態に係る画像処理装置による処理結果の一例を示す図である。 本発明の実施の形態に係る画像処理装置により抽出された文字列領域の一例を示す図である。 本発明の実施の形態に係る画像処理装置による処理例を示す図である。 本発明の実施の形態に係る画像処理装置を含む視覚センサシステムの全体構成を示す模式図である。 本発明の実施の形態に係る画像処理装置の概略構成図である。 本発明の実施の形態に係る画像処理装置の機能構成を示す模式図である。 本発明の実施の形態に係る画像処理装置によって実行される画像処理の処理手順を示すフローチャートである。 本発明の実施の形態に係る画像処理装置によって実行される運転モードにおける処理手順を示すフローチャートである。 本発明の実施の形態に係る画像処理装置において実行される組類似度の算出処理を説明するための図である。 本実施の形態に係る画像処理装置が提供するフォーマット文字列を設定するためのユーザインターフェイス画面の一例を示す図である。 本実施の形態に係る画像処理装置が提供するフォーマット文字列を設定するためのユーザインターフェイス画面の一例を示す図である。 本発明の実施の形態に係る画像処理装置によって提供されるフォーマット文字列の自動抽出機能に係る処理手順を示すフローチャートである。 本実施の形態に係る画像処理装置が提供するフォーマット文字列の自動抽出に係るユーザインターフェイス画面の一例を示す図である。 本実施の形態に係る画像処理装置が提供するフォーマット文字列の設定に係るユーザインターフェイス画面の一例を示す図である。
本発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰り返さない。
[A.フォーマット文字列]
本実施の形態の形態に係る画像処理装置は、文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する。この探索条件は、複数のフォーマット文字列を含む。まず、本実施の形態に係るフォーマット文字列について説明する。
本実施の形態に係るフォーマット文字列は、典型的には、認識対象の文字別に文字種または文字を指定するものである。言い換えれば、フォーマット文字列は、認識対象の文字列について、文字種または文字の組み合わせを指定するものである。
具体的には、フォーマット文字列は、認識対象の文字別に文字種の指定(英数字、英字、数字、記号、特殊文字、漢字、ひらがな、カタカナなど)、文字そのものの指定(アルファベットの各文字「A」,「B」,…、記号の各文字「’」,「−」,…、ひらがなの各文字「あ」,「い」,…、カタカナの各文字「ア」,「イ」,…)、フォント種の指定、文字サイズ(フォントサイズ)の指定などを含む。さらに、フォーマット文字列を用いて、文字に加えて、シンボルを指定するようにしてもよい。
典型的には、フォーマット文字列は、認識対象に付与される文字列の印字フォーマットが予め定まっているもの、例えば、商品の型番、価格、製造年月日、識別番号などに応じて設定される。
さらに、フォーマット文字列としては、特定文字を認識対象から除外する指定を設定できるようにしてもよい。すなわち、文字列間を接続するデリミタ(区切要素)などについては、認識対象とする必要がない場合も多いので、これを文字認識においては読み飛ばすようにしてもよい。
このようなフォーマット文字列を適用することで、認識率を向上(誤認識率を低下)させる。すなわち、本実施の形態に係る画像処理装置100は、予め設定したフォーマット文字列(文字/文字種の組み合わせ情報)を用いて、認識候補を限定することで、類似文字への誤認識を改善する。本実施の形態においては、フォーマット文字列は、ユーザが予め設定しているものとする。なお、文字そのものが指定された場合には、当該指定された文字のみが認識候補となる。
図1は、本発明の実施の形態に係る画像処理装置100において実行されるフォーマット文字列を用いた文字認識処理を説明するための図である。図1を参照して、例えば、文字種として、数字、英字、記号を区別するような形態を想定する。フォーマット文字列を定義する方法(表現形式)は、任意に取り決めることができる。図1に示す例では、フォーマット文字列として、「?」、「#」、「$」、「@」などの記号を用いる。各記号の意味は、以下の通りである。
?:すべての文字を認識候補とする
#:数字(0〜9)のみ認識候補とする
$:英字(A〜Z、および/または、a〜z)のみ認識候補とする
@:記号(「’」,「−」,「.」,「:」,「¥」など)のみ認識候補とする
図1に示すフォーマット文字列は、あくまで一例であり、文字種を任意の記号、シンボル、およびアイコンなどを用いて表現してもよい。
図1を参照して、対象物の表面には、文字列「78O(ナナ、ハチ、オー)」が印字されているとする。図1に示すケース1では、フォーマット文字列が指定されていないとする。フォーマット文字列が指定されていないことで、すべての文字(数字、英字、記号)がパターンマッチングの認識候補となる。その結果、例えば、文字列「7B0(ナナ、ビー、ゼロ)」が認識結果として出力される。すなわち、「8(ハチ)」が「B(ビー)」に誤認識され、「O(オー)」が「0(ゼロ)」に誤認識されている。
これに対して、ケース2では、フォーマット文字列として「##$」(数字+数字+英字)が指定されている。このため、抽出された文字列領域に含まれる第1番目および第2番目の文字については、数字がパターンマッチングの認識候補となる。同様に、抽出された文字列領域に含まれる第3番目の文字については、英字がパターンマッチングの認識候補となる。この結果、文字列「7B0」が正しく認識される確率が高くなる。
このように、本実施の形態においては、フォーマット文字列(文字/文字種の組み合わせ情報)を用いて、認識候補を限定することで、認識精度を高める。
本明細書において、「文字列領域」は、1または複数の文字が存在していると判断された一まとまりの領域を意味し、典型的には、互いに隣接して配置された一連の文字を含む領域が相当する。認識対象の文字(文字列)の配置方向を行方向とすれば、行単位で文字列を抽出した領域を文字列領域としてもよい。もちろん、複数の行にわたる領域を文字列領域として抽出してもよい。例えば、文字列が横書きであれば、基本的には、横方向に沿って文字列領域が抽出される。
このような文字列領域の抽出方法としては、公知の方法を採用することができる。例えば、入力画像に対して、第1の方向(横書きであれば横方向)に投影(例えば、輝度値を積分)して文字列が並ぶ行を特定し、各特定した行について、第1の方向とは直交する第2の方向(横方向であれば縦方向)に投影(例えば、輝度値を積分)して各行に含まれる各文字を特定する。このようにして、入力画像から文字列領域が抽出されるとともに、各文字列領域に含まれる各文字が特定される。
[B.処理概要]
次に、本実施の形態に係る画像処理の処理概要について説明する。図2は、本発明の実施の形態に係る画像処理装置100による処理結果の一例を示す図である。
図2(a)に示す処理例は、対象物を撮像することで得られる入力画像から抽出された文字列領域および認識結果を示す。図2(a)に示す文字列領域のうち、右側中段にある文字列領域は、背景の模様といったノイズなどによって誤検出されたものである。本実施の形態においては、図2(b)に示すように、このような誤検出された文字列領域を除去する。
具体的には、本実施の形態に係る画像処理装置100は、複数のフォーマット文字列の指定を含む探索条件を受け付ける。画像処理装置100は、処理対象の入力画像から候補となる文字列領域を抽出する。そして、画像処理装置100は、複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と複数のフォーマット文字列との類似度を算出し、算出された類似度に応じて、複数の文字列領域からなる組のうち、探索条件に合致している組を決定する。このとき、探索条件に合致している文字列領域の組から外れた文字列領域については、誤検出された文字列領域であるとして除去する。
すなわち、画像処理装置100は、予め設定されたフォーマット文字列を抽出された文字列領域に当てはめた際の類似度を算出する。フォーマット文字列を文字列領域の組のそれぞれに適用した際の類似度を計算し、類似度の高い文字列領域の組み合わせを選択する。このとき、画像処理装置100は、類似度の低い文字列領域を誤検出として除去する。なお、同一の入力画像内に探索条件に合致する文字列領域の組が複数存在する場合もある。そのため、類似度を算出した文字列領域の組のうち、類似度が相対的に高い組を1つ以上抽出してもよい。この抽出された文字列領域の組が、入力画像のうち予め定められた探索条件に合致する領域として特定される。
図3は、本発明の実施の形態に係る画像処理装置100により抽出された文字列領域の一例を示す図である。図4は、本発明の実施の形態に係る画像処理装置100による処理例を示す図である。
図3には、入力画像200に対して、4つの文字列領域201〜204が抽出されている例を示す。画像処理装置100は、抽出した文字列領域201〜204の各々から文字列を構成する各文字を抽出し、文字認識を実行する。
図4(a)には、予め設定されたフォーマット文字列の一例を示す。図4(a)に示すように、例えば、3つのフォーマット文字列「$$$$$@##」、「####@##@##」、「$$$$$$」が設定されているとする。
まず、4つの文字列領域201〜204に対して文字認識が実行される。そして、複数の文字列領域からなる組の各々に対して、この3つのフォーマット文字列が適用される。図4(b)には、4つの文字列領域201〜204に対して文字認識が実行された場合の結果を示す。
この文字認識においては、各文字を示す画像と認識候補の文字との間で類似度が算出される。この類似度は、典型的には、予め定義された辞書に含まれる各文字のイメージや特徴量との一致度合いを示す値である。この類似度は、文字認識の際に算出される相関値などを用いて算出される。
画像処理装置100は、これらの文字別の類似度を用いて、複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と複数のフォーマット文字列との類似度を算出する。すなわち、画像処理装置100は、文字列領域に含まれる文字毎にそれぞれ算出される類似度から、文字列領域の組の類似度を算出する。以下、説明の便宜上、文字列領域とフォーマット文字列との組み合わせについての類似度を「組類似度」と称す。この「組類似度」の具体的な算出方法については、後述する。
図4(c)は、文字列領域とフォーマット文字列との組み合わせのそれぞれについて組類似度を算出した例を示す。なお、図4(c)には、複数のフォーマット文字列間の相対位置関係を探索条件とした例を示す。すなわち、入力画像から抽出された文字列領域の出現位置が設定された複数のフォーマット文字列の設定順に対応しているという条件をさらに課している。複数のフォーマット文字列間の相対位置関係を探索条件とする必要はないが、印字フォーマットが予め決まっていると、このような条件を付加することで、より高速かつ効率的に文字認識を実行できる。すなわち、画像処理装置100は、複数のフォーマット文字列の相対位置関係に合致する複数の文字列領域を選択して、組類似度を算出する。
例えば、文字列領域201(R1)の認識結果にフォーマット文字列「$$$$$@##」(F1)を適用し、文字列領域202(R2)の認識結果にフォーマット文字列「####@##@##」(F2)を適用し、文字列領域203(R3)および文字列領域204(R4)の認識結果にフォーマット文字列「$$$$$$」(F3)をそれぞれ適用した場合の類似度が算出される。
図4(c)に示す例では、フォーマット文字列(F1),(F2),(F3)の順で文字列領域(R1),(R2),(R3),(R4)に適用されるので、文字列領域とフォーマット文字列との組み合わせは4つになる。そして、各組み合わせについて、組類似度が算出される。図4(c)に示す例では、フォーマット文字列(F1),(F2),(F3)をそれぞれ文字列領域(R1),(R2),(R4)に適用した組み合わせが最も高い組類似度の値を示す。したがって、画像処理装置100は、文字列領域(R1),(R2),(R4)(図3に示す文字列領域201,202,204)を探索条件に合致する領域であると特定するとともに、各文字列領域についての認識結果(テキスト値)を出力する。
さらに、画像処理装置100は、算出された類似度が最も高い文字列領域の組を決定するとともに、当該決定した文字列領域の組に含まれない他の文字列領域を候補から除外する。図4(c)に示す例では、文字列領域(R3)(図3に示す文字列領域203)が除外される。
以上のような処理によって、文字列領域が誤検出されたとしても、このような誤検出による影響を排除して、最終的な検出結果の認識精度を高めることができる。
典型的には、文字列領域は入力画像から行単位で文字列を抽出したものであり、この場合には、上述の相対位置関係としては、入力画像における文字列領域の行の位置関係が用いられる。
[C.ハードウェア構成]
図5は、本発明の実施の形態に係る画像処理装置100を含む視覚センサシステム1の全体構成を示す模式図である。
図5を参照して、視覚センサシステム1は、生産ラインなどに組み込まれ、対象物(ワーク2)を撮像することで得られる入力画像に対して文字認識を実行することで、入力画像から予め定められた探索条件に合致する領域を特定する。なお、視覚センサシステム1は、特定した文字列を読み取った結果(テキスト情報)を出力してもよい。
視覚センサシステム1においては、ワーク2はベルトコンベヤなどの搬送機構6によって搬送され、搬送されたワーク2は、カメラ8によって所定タイミングで撮像される。カメラ8は、一例として、レンズなどの光学系に加えて、CCD(Coupled Charged Device)やCMOS(Complementary Metal Oxide Semiconductor)センサといった、複数の画素に区画された撮像素子を含んで構成される。なお、カメラ8で撮像されるワーク2に対して光を照射する照明機構をさらに設けてもよい。
カメラ8を撮像することで得られる入力画像は、画像処理装置100へ伝送される。画像処理装置100は、このカメラ8から受けた入力画像に対して後述するような文字認識を含む処理を実行し、その結果を接続されたディスプレイ102で表示したり、その結果を外部装置へ出力したりする。
ワーク2がカメラ8の視野内に到達したことは、搬送機構6の両端に配置された光電センサ4によって検出される。具体的には、光電センサ4は、同一の光軸上に配置された受光部4aと投光部4bとを含み、投光部4bから放射される光がワーク2で遮蔽されることを受光部4aで検出することによって、ワーク2の到達を検出する。この光電センサ4のトリガー信号は、PLC(Programmable Logic Controller)5へ出力される。PLC5は、光電センサ4などからのトリガー信号を受信するとともに、搬送機構6の制御自体を司る。
画像処理装置100は、ワーク2に対して計測処理(画像処理)を実行する運転モードと、探索条件(フォーマット文字列)や計測パラメータなどを設定する設定モードとを有している。
画像処理装置100は、典型的には、汎用的なアーキテクチャを有しているコンピュータであり、予めインストールされたプログラム(命令コード)を実行することで、後述するような各種機能を提供する。このようなプログラムは、典型的には、メモリカード106などに格納された状態で流通する。
汎用的なコンピュータを画像処理装置100として利用する場合には、本実施の形態に係る機能を提供するためのアプリケーションに加えて、コンピュータの基本的な機能を提供するためのOS(Operating System)がインストールされていてもよい。この場合には、本実施の形態に係るプログラムは、OSの一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。すなわち、本実施の形態に係るプログラム自体は、上記のようなモジュールを含んでおらず、OSと協働して処理が実行されてもよい。本実施の形態に係るプログラムとしては、このような一部のモジュールを含まない形態であってもよい。
さらに、本実施の形態に係るプログラムは、他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には、上記のような組合せられる他のプログラムに含まれるモジュールを含んでおらず、当該他のプログラムと協働して処理が実行される。すなわち、本実施の形態に係るプログラムとしては、このような他のプログラムに組込まれた形態であってもよい。なお、プログラムの実行により提供される機能の一部もしくは全部を専用のハードウェア回路として実装してもよい。
図6は、本発明の実施の形態に係る画像処理装置100の概略構成図である。図6を参照して、画像処理装置100は、演算処理部であるCPU(Central Processing Unit)110と、記憶部としてのメインメモリ112およびハードディスク114と、カメラインターフェイス116と、入力インターフェイス118と、表示コントローラ120と、PLCインターフェイス122と、通信インターフェイス124と、データリーダ/ライタ126とを含む。これらの各部は、バス128を介して、互いにデータ通信可能に接続される。
CPU110は、ハードディスク114に格納されたプログラム(コード)をメインメモリ112に展開して、これらを所定順序で実行することで、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、ハードディスク114から読み出されたプログラムに加えて、カメラ8によって取得された入力画像や各種パラメータなどを保持する。なお、ハードディスク114に加えて、あるいは、ハードディスク114に代えて、SSD(Solid-State Drive)などの半導体記憶装置を採用してもよい。
カメラインターフェイス116は、CPU110とカメラ8との間のデータ伝送を仲介する。すなわち、カメラインターフェイス116は、ワーク2を撮像して画像データを生成するためのカメラ8と接続される。より具体的には、カメラインターフェイス116は、1つ以上のカメラ8と接続が可能であり、カメラ8からの画像データを一時的に蓄積するための画像バッファ116aを含む。そして、カメラインターフェイス116は、画像バッファ116aに所定コマ数の画像データが蓄積されると、その蓄積されたデータをメインメモリ112へ転送する。また、カメラインターフェイス116は、CPU110が発生した内部コマンドに従って、カメラ8に対して撮像コマンドを与える。
入力インターフェイス118は、CPU110とマウス104、キーボード、タッチパネルなどの入力部との間のデータ伝送を仲介する。すなわち、入力インターフェイス118は、ユーザが入力部を操作することで与えられる操作指令を受け付ける。
表示コントローラ120は、表示装置の典型例であるディスプレイ102と接続され、CPU110における画像処理の結果などをユーザに通知する。すなわち、表示コントローラ120は、ディスプレイ102に接続され、当該ディスプレイ102での表示を制御する。
PLCインターフェイス122は、CPU110とPLC5との間のデータ伝送を仲介する。より具体的には、PLCインターフェイス122は、PLC5によって制御される生産ラインの状態に係る情報やワークに係る情報などをCPU110へ伝送する。
通信インターフェイス124は、CPU110とコンソール(あるいは、パーソナルコンピュータやサーバ装置)などとの間のデータ伝送を仲介する。通信インターフェイス124は、典型的には、イーサネット(登録商標)やUSB(Universal Serial Bus)などからなる。なお、後述するように、メモリカード106に格納されたプログラムを画像処理装置100にインストールする形態に代えて、通信インターフェイス124を介して、配信サーバなどからダウンロードしたプログラムを画像処理装置100にインストールしてもよい。
データリーダ/ライタ126は、CPU110と記憶媒体であるメモリカード106との間のデータ伝送を仲介する。すなわち、メモリカード106には、画像処理装置100で実行されるプログラムなどが格納された状態で流通し、データリーダ/ライタ126は、このメモリカード106からプログラムを読出す。また、データリーダ/ライタ126は、CPU110の内部指令に応答して、カメラ8によって取得された画像データおよび/または画像処理装置100における処理結果などをメモリカード106へ書込む。なお、メモリカード106は、CF(Compact Flash(登録商標))、SD(Secure Digital)などの汎用的な半導体記憶デバイスや、フレキシブルディスク(Flexible Disk)などの磁気記憶媒体や、CD−ROM(Compact Disk Read Only Memory)などの光学記憶媒体等からなる。
また、画像処理装置100には、必要に応じて、プリンタなどの他の出力装置が接続されてもよい。
図5および図6に示す画像処理装置100は、各種設定を受け付ける機能と文字認識を実行する機能とが同一の装置に実装される例を示すが、これらの機能を別々の装置に実装してもよい。この場合には、それぞれの装置が互いに連係することで、いわば画像処理システムとして本実施の形態に係る機能を実現することになる。本願発明の技術的範囲は、特許請求の範囲に記載された構成を有するものであれば、いずれの実装形態も含まれ得る。
[D.機能構成]
次に、本実施の形態に係る画像処理を実現するための機能構成について説明する。図7は、本発明の実施の形態に係る画像処理装置100の機能構成を示す模式図である。図7に示す各機能は、典型的には、CPU110がハードディスク114(いずれも図6)に格納されたプログラム(コード)を実行することで実現される。
図7を参照して、画像処理装置100は、その機能構成として、画像取込部150と、画像処理部160と、設定部170と、出力部180とを含む。
画像取込部150は、カメラ8が被写体を撮像することで生成される入力画像を取得する。この取得された入力画像は、画像処理部160へ出力される。それに加えて、設定部170が入力画像を参照する場合もある。
画像処理部160は、画像取込部150からの入力画像に対して、上述したような画像処理を実行することで、文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する。より具体的には、画像処理部160は、文字抽出部162と、文字認識部164と、文字列領域特定部166とを含む。
文字抽出部162は、入力画像から候補となる文字列領域を抽出する。この文字列領域は、上述したような輝度値の投影などの方法を用いて抽出される。文字抽出部162は、パラメータ格納部178に格納されている計測パラメータを参照して、文字列領域を抽出する。
文字認識部164は、抽出された文字列領域の各候補に対して、文字認識を実行する。このとき、文字認識部164は、予め設定された辞書データ168を参照して、文字認識を実行する。そして、文字認識部164は、任意の文字列領域の組み合わせに対して、フォーマット文字列を適用することで組類似度を算出する。すなわち、文字認識部164は、複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と複数のフォーマット文字列との類似度を算出する。このとき、文字認識部164は、文字列領域に含まれる文字毎にそれぞれ算出される類似度から、文字列領域の組の類似度(組類似度)を算出する。なお、文字認識部164は、パラメータ格納部178にアクセスして、その中に格納されているフォーマット文字列を参照する。
文字列領域特定部166は、文字認識部164により算出される組類似度に基づいて、探索条件に合致する領域を特定する。すなわち、文字列領域特定部166は、算出された類似度に応じて、複数の文字列領域からなる組のうち、探索条件に合致している組を決定する。併せて、文字列領域特定部166は、算出された組類似度が最も高い文字列領域の組を決定するとともに、当該決定した文字列領域の組に含まれない他の文字列領域を候補から除外する。
出力部180は、文字列領域特定部166により特定された文字列領域の組、および、読み取られたテキスト値を認識結果として出力する。出力部180は、特定された文字列領域の画像そのものを出力してもよい。
設定部170は、ユーザなどから探索条件としてフォーマット文字列を受け付けるとともに、計測パラメータについてもユーザの指定を受け付ける。設定部170は、ユーザ操作に従って、フォーマット文字列および計測パラメータをパラメータ格納部178へ格納する。計測パラメータとしては、例えば、文字色(認識対象の文字の色を指定するパラメータ)、印字種類(認識対象の文字の表現形式を指定するパラメータ)、ドット間隔(認識対象の文字を構成する縦/横のドット間隔を示すパラメータ)、フィルタサイズ(ノイズ除去用のフィルタサイズを指定するパラメータ)、文字太さしきい値(認識対象の文字の太さを指定するパラメータ)、回転バラツキ補正(所定範囲にわたる文字の回転バラツキを探索範囲とする)、斜体バラツキ補正(所定範囲にわたる文字の斜体バラツキを探索範囲とする)、ふち消し補正(計測領域に接している黒い部分をノイズとして読み取り候補から除外する)などが挙げられる。
より具体的には、設定部170は、フォーマット文字列設定部172と、計測パラメータ設定部174と、フォーマット文字列自動抽出部176とを含む。フォーマット文字列設定部172は、フォーマット文字列を受け付けるためのユーザインターフェイス画面を提供するとともに、ユーザからその指定を受け付ける。計測パラメータ設定部174は、計測パラメータの設定/調整を受け付けるためのユーザインターフェイス画面を提供するとともに、ユーザからその指定を受け付ける。
フォーマット文字列自動抽出部176は、後述するように、テスト画像(テストサンプルを撮像することで取得される画像)からフォーマット文字列を自動的に抽出する。このようなフォーマット文字列の自動抽出機能によって、ユーザのフォーマット文字列の入力を支援する。
[E.処理手順]
次に、本実施の形態に係る画像処理の処理手順について説明する。
(e1:全体処理)
図8は、本発明の実施の形態に係る画像処理装置100によって実行される画像処理の処理手順を示すフローチャートである。図8には、フォーマット文字列や計測パラメータなどを設定する設定モードにおける処理と、ワーク2に対して計測処理(画像処理)を実行する運転モードにおける処理とを併せて示す。
図8を参照して、設定モードにおいて、画像処理装置100は、テスト画像を取得する(ステップS2)。このテスト画像は、カメラ8の視野範囲に認識対象の文字列を含む対象物(テストサンプル)を配置し、カメラ8でこの対象物を撮像することで取得された画像である。
続いて、画像処理装置100は、ユーザからフォーマット文字列の設定を受け付ける(ステップS4)とともに、ユーザから計測パラメータの設定を受け付ける(ステップS6)。そして、画像処理装置100は、設定されたフォーマット文字列および計測パラメータを設定値として格納する(ステップS8)。
続いて、運転モードが開始されると、画像処理装置100は、何らかのトリガー信号に応じて対象物を撮像して入力画像を取得する(ステップS10)。続いて、画像処理装置100は、入力画像から文字列領域を抽出する(ステップS12)。そして、画像処理装置100は、抽出した各文字列領域に含まれる各文字について文字認識を実行し(ステップS14)し、複数の文字列領域からなる組の各々についての組類似度を算出する(ステップS16)。さらに、画像処理装置100は、算出された組類似度に基づいて、探索条件に合致する領域を特定する(ステップS18)。そして、画像処理装置100は、文字認識の実行結果を出力する(ステップS20)。
運転モードが選択されている間、ステップS10〜S20の処理が繰り返される。
(e2:運転モード)
次に、運転モードにおける処理手順について、より詳細に説明する。図9は、本発明の実施の形態に係る画像処理装置100によって実行される運転モードにおける処理手順を示すフローチャートである。
図9を参照して、画像処理装置100は、入力画像から文字列領域を抽出する(ステップS100)。そして、画像処理装置100は、抽出した各文字列領域から文字を抽出する(ステップS102)。続いて、画像処理装置100は、抽出した文字毎に文字認識を実行する(ステップS104)。本実施の形態においては、組類似度を算出するため、ステップS104においては、各文字について、辞書データに含まれるすべての文字候補との間で類似度が算出される。すなわち、対象の文字について、英字(A〜Z)、数字(0〜9)、記号(「’」,「−」,「.」,「:」,「¥」など)との間の類似度がそれぞれ算出される。
そして、画像処理装置100は、組類似度を算出すべき、文字列領域の組み合わせを決定する(ステップS106)。続いて、決定した組み合わせのうち、組類似度の算出対象となる文字列領域の組み合わせを選択する(ステップS108)。
画像処理装置100は、選択された文字列領域の組み合わせに対して、フォーマット文字列を文字列領域に適用して、各文字列領域に含まれる各文字の類似度を算出する(ステップS110)。すなわち、画像処理装置100は、フォーマット文字列に基づいて各文字の類似度を算出する。例えば、ある文字に適合される文字種が「#」であれば、数字(0〜9)のみが認識候補となり、対象の文字との間の類似度が最も高い数字およびその類似度が認識結果として出力される。同様に、ある文字に適合される文字種が「$」であれば、英字(A〜Z)のみが認識候補となり、対象の文字との間の類似度が最も高い英字およびその類似度が認識結果として出力される。
画像処理装置100は、各文字列領域の各文字について算出された類似度から、選択された組み合わせについての組類似度を算出する(ステップS112)。典型的には、各文字列領域の各文字についての類似度の総和を当該組み合わせについての組類似度として算出する。
そして、画像処理装置100は、すべての文字列領域の組み合わせが選択されたか否かを判断する(ステップS114)。選択されていない組み合わせが存在している場合(ステップS114においてNOの場合)には、未選択の文字列領域の組み合わせのうち算出対象となる文字列領域の組み合わせを選択する(ステップS116)。そして、ステップS110以下の処理が実行される。
すべての文字列領域の組み合わせが選択済みである場合(ステップS114においてYESの場合)には、画像処理装置100は、算出された組類似度が最も高い組み合わせを特定する(ステップS118)とともに、当該決定した文字列領域の組に含まれない他の文字列領域を候補から除外する(ステップS120)。そして、画像処理装置100は、特定された組み合わせに含まれる文字列領域についての認識結果および類似度を出力する(ステップS122)。
[F.組類似度の算出処理]
次に、文字列領域に含まれる文字毎にそれぞれ算出される類似度および組類似度の算出処理について説明する。
図10は、本発明の実施の形態に係る画像処理装置100において実行される組類似度の算出処理を説明するための図である。図10には、文字列「78O(ナナ、ハチ、オー)」に対して文字認識が実行されることで算出された類似度を示す。上述したように、最初の段階では、すべての認識候補との間で類似度が算出される。この文字認識による認識結果に対して、3つのフォーマット文字列((1)「##$」、(2)「$$$$」、(3)「###」)が適用された場合を考える。
1番目のフォーマット文字列「##$」が適用されると、1番目および2番目の文字については、認識候補が数字に制限され、その中で最も類似度の高い文字(この例では、それぞれ「7」および「8」)が特定され、その類似度(いずれも「50」)が抽出される。3番目の文字については、認識候補が英字に制限され、その中で最も類似度の高い文字(この例では、「O」)が特定され、その類似度(「50」)が抽出される。その結果、類似度としては、50+50+50=150と算出される。
次に、2番目のフォーマット文字列「$$$$」が適用されると、1番目〜3番目の文字については、認識候補が英字に制限され、その中で最も類似度の高い文字(この例では、それぞれ「Z」、「B」および「O」)が特定され、その類似度(それぞれ「20」、「45」および「50」)が抽出される。このとき、フォーマット文字列は4文字の指定を含むが、候補の文字列領域からは3文字しか抽出されなかったので、4番目の文字については、類似度を「0」とみなしてもよい。あるいは、文字が抽出されなかったことをペナルティとして減点してもよい。すなわち、文字列領域に含まれる文字数がフォーマット文字列によって指定した文字数に達しない場合には、ペナルティを与えるようにしてもよい。言い換えれば、画像処理装置100は、対象の文字列領域に含まれる文字数が対応するフォーマット文字列で指定される文字数未満である場合には、算出される類似度を低下させる。
このようにペナルティを与えることで、対応するフォーマット文字列の下では、類似度が低いという特徴量が現れ、選択されにくくなることで、誤認識率を低下させることができる。
最後に、3番目のフォーマット文字列「###」が適用されると、1番目〜3番目の文字については、認識候補が数字に制限され、その中で最も類似度の高い文字(この例では、それぞれ「7」、「8」および「0」)が特定され、その類似度(それぞれ「50」、「50」および「45」)が抽出される。この3番目のフォーマット文字列「###」は認識対象の文字列の本来のフォーマットを示すものではなく、その結果、1番目のフォーマット文字列「##$」を適用した場合に比較して、類似度が低くなっていることがわかる。
図10に示す例では、説明の便宜上、1つの文字列領域についての類似度の算出方法について説明したが、対応する組み合わせに含まれる文字列領域のそれぞれについての類似度の総和を組類似度として算出すればよい。
このような類似度の総和から組類似度を算出する方法として、類似度の総和を用いる方法に代えて、その組に含まれる文字列領域の類似度についての平均値および/または最低値を用いるようにしてもよい。最低値を用いることで、いずれか1つの文字列領域が対応するフォーマット文字列に適合していないような場合に、その組み合わせを除外することが容易になる。
なお、フォーマット文字列を用いて認識される文字列は、記号(「’」,「−」,「.」,「:」,「¥」など)をデリミタ(区切要素)として用いていることが多いので、認識対象から除外して、すなわち文字認識においては読み飛ばすようにしてもよい。
さらに、上述したように、複数のフォーマット文字列間の相対位置関係を探索条件として設定してもよい。すなわち、位置関係の情報を用いて、複数の文字列領域の組み合わせを構成してもよい。
[G.ユーザインターフェイス]
次に、本実施の形態に係る画像処理装置100が提供するユーザインターフェイスの一例について説明する。
(g1:フォーマット文字列の設定)
図11は、本実施の形態に係る画像処理装置100が提供するフォーマット文字列を設定するためのユーザインターフェイス画面400Aの一例を示す図である。図11に示すユーザインターフェイス画面400Aでは、4つの文字列領域に対して、それぞれフォーマット文字列を設定できるようになっている。すなわち、ユーザインターフェイス画面400Aは、4つのフォーマット文字列入力領域410,412,414,416を含む。
ユーザは、いずれかのフォーマット文字列入力領域を選択して、目的のフォーマット文字列を入力する。この際、キーボードなどの入力装置を用いて直接的に入力してもよいが、以下のようなフォーマット文字列入力用のユーザインターフェイス画面が提供されてもよい。
図12は、本実施の形態に係る画像処理装置100が提供するフォーマット文字列を設定するためのユーザインターフェイス画面400Bの一例を示す図である。図12に示すユーザインターフェイス画面400Bは、図11に示すユーザインターフェイス画面400Aにおいて、フォーマット文字列入力領域410,412,414,416のいずれかが選択されることで表示される。
図12に示すユーザインターフェイス画面400Bでは、入力中のフォーマット文字列を示すフォーマット文字列入力領域410と、指定可能な複数の文字種にそれぞれ関連付けられた複数のオブジェクト420と、指定可能な記号に関連付けられた複数のオブジェクト422とが並べて、すなわち同一画面内に表示されている。ユーザがオブジェクト420および422のうちいずれかを選択すると、当該選択されたオブジェクトに対応するフォーマット文字列が追加される。
このように、ユーザが、フォーマット文字列として、文字種または文字の組み合わせを直接指定できるようにしてもよい。
表示領域402には、設定されているフォーマット文字列が各文字種に対応付けられた記号を用いて表示されている。すなわち、記号「#」、「$」、「@」といった記号でフォーマット文字列が既定される。このような記号の意味が一見して把握できるように、図12に示すユーザインターフェイス画面400Bのオブジェクト420の各々では、関連付けられた文字種を示すメッセージ(例えば、「英数字」や「数字文字」といった表示)とともに、当該文字種に対応する記号(例えば、「?」や「#」といった記号)が表示される。
このように、オブジェクト420には、関連付けられた文字種の意味を一見して把握できるようにメッセージが付加されており、さらに対応する文字種を示す記号も併せて付加されているので、ユーザは、各記号の意味を予め知っておかなくても、フォーマット文字列入力領域410に表示される設定中のフォーマット文字列の内容を容易に把握することができる。
ユーザインターフェイス画面400Bでは、設定されているフォーマット文字列を編集するためのオブジェクトも表示されている。例えば、バックスペース操作(カーソルの直前の文字を消去する操作)に関連付けられたオブジェクト424と、クリア操作(設定されているフォーマット文字列を全消去する操作)に関連付けられたオブジェクト426と、カーソルを移動させる操作に関連付けられたオブジェクト428とが配置されている。
図11に示す4つのフォーマット文字列入力領域410,412,414,416の位置関係に基づいて、複数のフォーマット文字列間の相対位置関係を決定してもよい。例えば、フォーマット文字列入力領域410に入力されたフォーマット文字列と、フォーマット文字列入力領域412に入力されたフォーマット文字列との間では、前者が入力画像上の上側に位置し、後者が入力画像の下側に位置するという探索条件としてもよい。
このように、本実施の形態において、探索条件は、複数のフォーマット文字列間の相対位置関係を含む。そして、画像処理装置100は、相対位置関係に合致する複数の文字列領域を選択して類似度を算出する。この複数のフォーマット文字列間の相対位置関係は、複数のフォーマット文字列の入力順から決定されてもよい。
さらに、フォーマット文字列間の相対位置関係を直接的に指定してもよい。このとき、特殊記号を用いて、相対位置関係を指定してもよい。
なお、ユーザがフォーマット文字列を直接的に指定する構成に代えて、使用頻度の高いフォーマット文字列(例えば、年月日など)に関しては、画像処理装置100に予め用意しておき、ユーザが任意に選択できるようにしてもよい。すなわち、画像処理装置100は、フォーマット文字列を予め保持しており、ユーザの選択に応じて、選択されたフォーマット文字列を探索条件として設定してもよい。
(g2:フォーマット文字列の自動抽出)
認識対象の文字列を構成する文字が多い場合には、上述したようなフォーマット文字列を設定する作業が煩雑化し得る。そこで、テスト画像(テストサンプルを撮像することで取得される画像)からフォーマット文字列を自動的に抽出するようにしてもよい。より具体的には、テストサンプルを撮像して取得される入力画像に対して文字認識を実行するとともに、それによって取得された認識結果からフォーマット文字列の候補を自動生成する。さらに、この自動生成されたフォーマット文字列の候補に対して、ユーザが適宜修正/変更を加えて、所望のフォーマット文字列(文字/文字種の組み合わせ情報)を設定する。このフォーマット文字列の自動抽出は、図7に示すフォーマット文字列自動抽出部176によって実行される。このようなフォーマット文字列の自動抽出機能によって、ユーザのフォーマット文字列の入力を支援する。
図13は、本発明の実施の形態に係る画像処理装置100によって提供されるフォーマット文字列の自動抽出機能に係る処理手順を示すフローチャートである。なお、図13に示すフローチャートにおいて、図8に示すフローチャートと同一の処理については、同一のステップ番号を付与している。
図13を参照して、画像処理装置100は、テスト画像を取得する(ステップS2)。そして、画像処理装置100は、テスト画像から文字列領域を抽出する(ステップS30)とともに、抽出した各文字列領域から文字を抽出する(ステップS32)。続いて、画像処理装置100は、抽出した文字毎に文字認識を実行する(ステップS34)。そして、画像処理装置100は、文字認識の結果に基づいて、フォーマット文字列を決定し(ステップS36)、初期値としてユーザへ提示する(ステップS38)。
その後、画像処理装置100は、フォーマット文字列の初期値に対して変更が要求されたか否かを判断する(ステップS40)。フォーマット文字列の初期値に対して変更が要求された場合(ステップS40においてYESの場合)には、画像処理装置100は、ユーザからフォーマット文字列に対する変更を受け付ける(ステップS42)。このユーザ指示に応答して、画像処理装置100は、設定されているフォーマット文字列を修正する。そして、ステップS40以下の処理が繰り返される。
フォーマット文字列の初期値に対して変更が要求されていない場合(ステップS40においてNOの場合)、すなわちユーザからフォーマット文字列の初期値を承諾する指示を受けた場合、画像処理装置100は、ユーザから計測パラメータの設定を受け付ける(ステップS6)。そして、画像処理装置100は、設定されたフォーマット文字列および計測パラメータを設定値として格納する(ステップS8)。
図14は、本実施の形態に係る画像処理装置100が提供するフォーマット文字列の自動抽出に係るユーザインターフェイス画面400Cの一例を示す図である。図14(a)を参照して、まず、ユーザは、テストサンプルを撮像してテスト画像を取得し、この取得したテスト画像に対して、認識対象の文字列領域460を指定する。
続いて、指定された文字列領域460について文字認識が実行される。そして、この文字認識の実行による認識結果に基づいて、各文字の文字種を判断し、この判断された文字別の文字種がフォーマット文字列の初期値として設定される。そして、図14(b)に示すようなユーザインターフェイス画面400Dがユーザへ提示される。ユーザインターフェイス画面400Dにおいては、フォーマット文字列の初期値がフォーマット文字列入力領域410に表示されている。併せて、テスト画像に対して設定された文字列領域460内のイメージが同一画面内に追加的に表示されているとともに、文字列領域460内のイメージに対して文字認識した結果を示すフォーマット文字列470が追加的に表示されている。ユーザは、これらの情報を参照しつつ、オブジェクト420やオブジェクト422などを選択して、フォーマット文字列の初期値に対して必要な修正/編集を行う。すなわち、画像処理装置100は、フォーマット文字列の初期値に対するユーザからの変更を受け付ける。
このように、画像処理装置100は、探索対象の文字列を含む参照画像(テスト画像)に対して文字認識を実行することで取得される認識結果からフォーマット文字列の初期値を設定する。
(g3:フォーマット文字列の設定用ユーザインターフェイス)
設定したフォーマット文字列の適用状態を確認しつつ、フォーマット文字列を設定するようにしてもよい。
図15は、本実施の形態に係る画像処理装置100が提供するフォーマット文字列の設定に係るユーザインターフェイス画面400Eの一例を示す図である。図15に示すユーザインターフェイス画面400Eにおいては、テスト画像に対して認識対象の文字列領域460が設定されており、この設定された文字列領域460に対して、設定されたフォーマット文字列が適用されて文字認識された結果が提示されている。より具体的には、テスト画像上に設定された文字列領域460から抽出された各文字が枠で示されており、各枠の表示態様によって、その中の文字の文字種を示す態様で表示されている。ユーザは、この表示を確認して、文字領域が正しく抽出されているかを判断する。
このように、フォーマット文字列の設定時には、テスト画像に対してフォーマット文字列を適用して得られる結果をユーザへ提示するとともに、ユーザは、それを確認しながら、フォーマット文字列を編集してもよい。
[H.利点]
本実施の形態によれば、入力画像から文字列領域が誤検出されても、フォーマット文字列を適用することで、その誤検出された文字列領域を適切に排除できる。これによって、認識精度を高めることができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 視覚センサシステム、2 ワーク、4 光電センサ、4a 受光部、4b 投光部、5 PLC、6 搬送機構、8 カメラ、100 画像処理装置、102 ディスプレイ、104 マウス、106 メモリカード、110 CPU、112 メインメモリ、114 ハードディスク、116 カメラインターフェイス、116a 画像バッファ、118 入力インターフェイス、120 表示コントローラ、122 PLCインターフェイス、124 通信インターフェイス、126 データリーダ/ライタ、128 バス、150 画像取込部、160 画像処理部、162 文字抽出部、164 文字認識部、166 文字列領域特定部、168 辞書データ、170 設定部、172 フォーマット文字列設定部、174 計測パラメータ設定部、176 フォーマット文字列自動抽出部、178 パラメータ格納部、180 出力部、200 入力画像。

Claims (13)

  1. 文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する画像処理装置であって、
    前記探索条件を受け付ける設定手段を備え、前記探索条件は、複数のフォーマット文字列の指定を含み、各フォーマット文字列は、認識対象の文字別に文字種または特定文字の指定を含み、
    前記入力画像から候補となる文字列領域を抽出する抽出手段と、
    複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と前記複数のフォーマット文字列との類似度を算出する算出手段と、
    算出された類似度に応じて、前記複数の文字列領域からなる組のうち、前記探索条件に合致している組を決定する決定手段とを備える、画像処理装置。
  2. 前記探索条件は、前記複数のフォーマット文字列間の相対位置関係をさらに含み、
    前記算出手段は、前記相対位置関係に合致する複数の文字列領域を選択して、類似度を算出する、請求項1に記載の画像処理装置。
  3. 前記設定手段は、前記複数のフォーマット文字列の入力順から前記複数のフォーマット文字列間の相対位置関係を決定する、請求項2に記載の画像処理装置。
  4. 前記文字列領域は、行単位で文字列を抽出したものであり、
    前記相対位置関係は、前記入力画像における前記文字列領域の行の位置関係を示す、請求項3に記載の画像処理装置。
  5. 前記決定手段は、算出された類似度が最も高い文字列領域の組を決定するとともに、当該決定した文字列領域の組に含まれない他の文字列領域を候補から除外する、請求項1〜4のいずれか1項に記載の画像処理装置。
  6. 前記算出手段は、文字列領域に含まれる文字毎にそれぞれ算出される類似度から、文字列領域の組の類似度を算出する、請求項1〜5のいずれか1項に記載の画像処理装置。
  7. 前記算出手段は、対象の文字列領域に含まれる文字数が対応するフォーマット文字列で指定される文字数未満である場合には、算出される類似度を低下させる、請求項6に記載の画像処理装置。
  8. 前記設定手段は、探索対象の文字列を含む参照画像に対して文字認識を実行することで取得される認識結果からフォーマット文字列の初期値を設定する、請求項1〜7のいずれか1項に記載の画像処理装置。
  9. 前記設定手段は、前記フォーマット文字列の初期値に対するユーザからの変更を受け付ける、請求項8に記載の画像処理装置。
  10. 前記探索条件は、各文字種に対応付けられた記号を用いて表示される、請求項1〜9のいずれか1項に記載の画像処理装置。
  11. 前記フォーマット文字列は、特定文字を認識対象から除外する指定を含む、請求項1〜10のいずれか1項に記載の画像処理装置。
  12. 前記設定手段は、フォーマット文字列を予め保持しており、ユーザの選択に応じて、選択されたフォーマット文字列を前記探索条件に設定する、請求項1〜11のいずれか1項に記載の画像処理装置。
  13. 文字認識によって入力画像のうち予め定められた探索条件に合致する領域を特定する画像処理方法であって、
    前記探索条件を受け付けるステップを含み、前記探索条件は、複数のフォーマット文字列の指定を含み、各フォーマット文字列は、認識対象の文字別に文字種または特定文字の指定を含み、
    前記入力画像から候補となる文字列領域を抽出するステップと、
    複数の文字列領域からなる組の各々について、各組に含まれるそれぞれの文字列領域についての文字認識結果と前記複数のフォーマット文字列との類似度を算出するステップと、
    算出された類似度に応じて、前記複数の文字列領域からなる組のうち、前記探索条件に合致している組を決定するステップとを含む、画像処理方法。
JP2012217683A 2012-09-28 2012-09-28 画像処理装置および画像処理方法 Active JP5831420B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012217683A JP5831420B2 (ja) 2012-09-28 2012-09-28 画像処理装置および画像処理方法
CN201310361931.XA CN103714338B (zh) 2012-09-28 2013-08-19 图像处理装置和图像处理方法
EP13183068.9A EP2713314A3 (en) 2012-09-28 2013-09-05 Image processing device and image processing method
US14/038,173 US9189694B2 (en) 2012-09-28 2013-09-26 Image processing device and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012217683A JP5831420B2 (ja) 2012-09-28 2012-09-28 画像処理装置および画像処理方法

Publications (2)

Publication Number Publication Date
JP2014071698A JP2014071698A (ja) 2014-04-21
JP5831420B2 true JP5831420B2 (ja) 2015-12-09

Family

ID=49118355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012217683A Active JP5831420B2 (ja) 2012-09-28 2012-09-28 画像処理装置および画像処理方法

Country Status (4)

Country Link
US (1) US9189694B2 (ja)
EP (1) EP2713314A3 (ja)
JP (1) JP5831420B2 (ja)
CN (1) CN103714338B (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6264008B2 (ja) * 2013-12-12 2018-01-24 オムロン株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP6403417B2 (ja) * 2014-04-23 2018-10-10 株式会社キーエンス 携帯型光学式読取装置、該携帯型光学式読取装置を用いる光学式読取方法、及びコンピュータプログラム
US9600731B2 (en) * 2015-04-08 2017-03-21 Toshiba Tec Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium
US9563812B2 (en) * 2015-04-08 2017-02-07 Toshiba Tec Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium
JP6524800B2 (ja) * 2015-05-28 2019-06-05 株式会社デンソーウェーブ 情報読取装置
US10102617B2 (en) * 2015-06-25 2018-10-16 Gregory J. Gozdowiak Method and system for automated meter reading
CN105118300B (zh) * 2015-08-28 2017-05-10 浙江工业大学 交通抓拍自动识别车牌号码的纠错方法
CN105653160A (zh) * 2016-02-25 2016-06-08 努比亚技术有限公司 一种文本确定方法和终端
JP6804292B2 (ja) * 2016-12-28 2020-12-23 オムロンヘルスケア株式会社 端末装置
JP7102103B2 (ja) * 2017-03-31 2022-07-19 キヤノン株式会社 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム
JP7039882B2 (ja) * 2017-08-16 2022-03-23 富士フイルムビジネスイノベーション株式会社 画像解析装置及び画像解析プログラム
CN107862251A (zh) * 2017-10-20 2018-03-30 惠州Tcl移动通信有限公司 一种电话号码录入处理的方法、移动终端及存储介质
JP7113203B2 (ja) * 2018-01-22 2022-08-05 パナソニックIpマネジメント株式会社 部品実装装置および部品実装方法
JP7300593B2 (ja) 2018-01-22 2023-06-30 パナソニックIpマネジメント株式会社 部品実装装置およびトレースデータの取得方法
JP7198971B2 (ja) * 2018-01-22 2023-01-05 パナソニックIpマネジメント株式会社 部品実装装置およびトレースデータの取得方法
JP6506427B1 (ja) * 2018-01-25 2019-04-24 株式会社リクルート 情報処理装置、動画検索方法、生成方法及びプログラム
WO2019171118A1 (en) * 2018-03-05 2019-09-12 Omron Corporation Method, apparatus, system and program for determining feature data of image data, and storage medium
JP7225548B2 (ja) * 2018-03-22 2023-02-21 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP7091974B2 (ja) * 2018-09-26 2022-06-28 オムロン株式会社 画像処理システム、画像処理装置、画像処理方法、および画像処理プログラム
JP7293693B2 (ja) * 2019-02-05 2023-06-20 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11816182B2 (en) * 2021-06-07 2023-11-14 Sap Se Character encoding and decoding for optical character recognition

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2842263B2 (ja) * 1994-12-21 1998-12-24 日本電気株式会社 住所読み取り装置
US5778361A (en) * 1995-09-29 1998-07-07 Microsoft Corporation Method and system for fast indexing and searching of text in compound-word languages
JPH103518A (ja) * 1996-06-14 1998-01-06 Ricoh Co Ltd 文字認識方法,記憶媒体および文字認識装置
JP3727422B2 (ja) * 1996-09-03 2005-12-14 松下電器産業株式会社 文字認識装置及びその方法
JP3601658B2 (ja) * 1997-12-19 2004-12-15 富士通株式会社 文字列抽出装置及びパターン抽出装置
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
JP2002183667A (ja) 2000-12-12 2002-06-28 Ricoh Co Ltd 文字認識装置及び記録媒体
AUPR824601A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and system (npw004)
JP2004326491A (ja) * 2003-04-25 2004-11-18 Canon Inc 画像処理方法
JP4418726B2 (ja) 2004-10-01 2010-02-24 日本電信電話株式会社 文字列探索装置、探索方法およびこの方法のプログラム
JP2007034531A (ja) * 2005-07-25 2007-02-08 Sharp Corp 文字認識装置、文字認識方法、文字認識プログラム、および記録媒体
JP4750802B2 (ja) * 2006-01-13 2011-08-17 富士通株式会社 帳票処理プログラムおよび帳票処理装置
JP4940973B2 (ja) * 2007-02-02 2012-05-30 富士通株式会社 論理構造認識処理プログラム、論理構造認識処理方法および論理構造認識処理装置
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法
US8783570B2 (en) * 2007-08-21 2014-07-22 Symbol Technologies, Inc. Reader with optical character recognition
JP5125573B2 (ja) * 2008-02-12 2013-01-23 富士通株式会社 領域抽出プログラム、文字認識プログラム、および文字認識装置
US8260054B2 (en) * 2008-09-22 2012-09-04 Trend Micro Incorporated Methods for matching image-based texual information with regular expressions
WO2011105607A1 (ja) * 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体

Also Published As

Publication number Publication date
CN103714338A (zh) 2014-04-09
US20140093172A1 (en) 2014-04-03
JP2014071698A (ja) 2014-04-21
CN103714338B (zh) 2017-03-01
US9189694B2 (en) 2015-11-17
EP2713314A3 (en) 2016-08-10
EP2713314A2 (en) 2014-04-02

Similar Documents

Publication Publication Date Title
JP5831420B2 (ja) 画像処理装置および画像処理方法
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
JP6286866B2 (ja) 画像処理装置および画像処理方法
JP6527410B2 (ja) 文字認識装置、文字認識方法、及びプログラム
US10885325B2 (en) Information processing apparatus, control method, and storage medium
KR102236616B1 (ko) 정보 처리 장치, 그의 제어 방법, 및 기억 매체
JP5111055B2 (ja) 画像処理装置及び画像処理方法、コンピュータプログラム
CN105911065B (zh) 图案检查装置及图案检查方法
JP2022009474A (ja) ビジョンシステムでラインを検出するためのシステム及び方法
US10134138B2 (en) Information processing apparatus, computer-readable storage medium, information processing method
JP2007072642A (ja) 画像処理装置および画像処理装置の制御方法
RU2641452C2 (ru) Неполные эталоны
US11756321B2 (en) Information processing apparatus and non-transitory computer readable medium
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP6931168B2 (ja) 情報処理装置、制御方法、プログラム
CN112232282A (zh) 一种手势识别方法、装置、存储介质和电子设备
CN117475453B (zh) 一种基于ocr的文书检测方法、装置及电子设备
JP2021005234A (ja) 帳票認識装置、帳票認識方法、及び帳票認識システム
JP2020047138A (ja) 情報処理装置
US11699296B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6011214B2 (ja) 画像処理システムおよび画像処理方法
JP2009175800A (ja) 文字認識装置、そのような装置を備えた燃料ポンプモジュールの組み付け装置及び文字認識方法
JP6833871B2 (ja) 画像処理用部品データ作成方法及び画像処理用部品データ作成システム
WO2014203905A2 (ja) 符号抽出方法、符号抽出装置及びプログラム
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151012

R150 Certificate of patent or registration of utility model

Ref document number: 5831420

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150