JP6102156B2

JP6102156B2 - 画像処理システムおよび画像処理方法

Info

Publication number: JP6102156B2
Application number: JP2012217681A
Authority: JP
Inventors: 恒彦荒木; 史裕長島
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 2012-09-28
Filing date: 2012-09-28
Publication date: 2017-03-29
Anticipated expiration: 2032-09-28
Also published as: EP2713313A3; EP2713313B1; EP2713313A2; JP2014071696A

Description

本発明は、入力画像から文字情報を取得する画像処理システムおよび画像処理方法に関する。

ＦＡ（Factory Automation）分野などにおいては、製造過程の半製品や出荷前の製品などに生じる欠陥を光学的に検出したり、その大きさを光学的に計測したりする装置として、いわゆる画像処理システムが実用化されている。

パターン認識を用いる画像処理の一例として、特開２０１１−１００２４５号公報（特許文献１）は、学習によりパターン認識を高精度に行うパターン認識装置を開示している。具体的には、このパターン認識装置は、学習用サンプルパターンを種別する複数のカテゴリごとに、同じカテゴリに含まれる複数の特徴ベクトルごとに求められる参照特徴ベクトルの同じ位置の要素を、予め設定された範囲の軸に投影し、軸上の要素ごとに、予め設定されたマージン量とカテゴリを関連付けて生成した候補テーブルを生成する。

一般的にパターン認識を行う場合には、予め学習処理（ティーチング処理）を行うことが好ましい。

特開２０１１−１００２４５号公報

画像処理の一形態として、対象物を撮像することで得られる入力画像に対して文字認識を実行することで、入力画像から文字情報を取得する処理が知られている。このような文字認識は、入力画像内の部分画像と予め定められた文字のイメージや特徴量との一致度合いなどを算出して文字を認識（特定）する。

このような文字認識に係る画像処理において、文字フォーマット（書式制御情報）を予め指定することで、認識率を向上させる技術が知られている。例えば、認識対象の文字列についての文字種別（例えば、数字）を予め設定しておき、この文字種別の文字フォーマットの下で文字認識を実行することで、認識対象をアルファベットの文字と誤認識することを防止できる。

画像処理の精度は、画像処理に係るパラメータ（設定値）に影響されやすい。そこで、上述の特開２０１１−１００２４５号公報（特許文献１）に開示されるように、複数の学習用サンプルパターンを処理することで、適切なパラメータ（例えば、しきい値など）を決定する処理がしばしば実行される。このようなパラメータを設定する機能はオートティーチ機能と称され、一般的には、多数のＯＫ画像（正しく抽出すべき対象物を含む画像）およびＮＧ画像（抽出すべきではない対象物を含む画像）を用いて学習（ティーチング）を行う必要がある。

しかしながら、多数の画像を用いた学習（ティーチング）は時間を要するとともに、パラメータが複数ある場合には、その調整が容易ではない。

本発明は、このような課題を解決するためのものであり、その目的は、文字認識により入力画像から文字情報を取得する画像処理において、当該文字認識に係るパラメータの初期値を容易に決定できる画像処理システムおよび画像処理方法を提供することである。

本発明のある局面によれば、入力画像から文字情報を取得する画像処理システムが提供される。画像処理システムは、目的の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付ける第１指定手段と、認識対象の文字別の制約条件を示す文字フォーマットを受付ける第２指定手段と、文字フォーマットに従って、計測領域に含まれる部分画像に対して文字認識を実行する認識手段と、文字認識の実行結果に応じて、文字認識に係るパラメータを変更する変更手段とを含む。変更手段は、文字フォーマットに従う文字認識の実行結果が予め定められた確からしさを超えるようにパラメータを変更して、文字認識に係るパラメータの初期値を決定する。

好ましくは、文字フォーマットは、文字別に文字種別または特定文字の指定を含む。
好ましくは、第１指定手段は、参照画像を表示するとともに、表示された参照画像に対するユーザ操作に応答して計測領域を決定する。

好ましくは、第２指定手段は、設定されている文字フォーマットを表示するとともに、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトを表示し、いずれかのオブジェクトの選択に応答して、選択されたオブジェクトに関連付けられた文字種別を文字フォーマットに追加する。

好ましくは、変更手段は、文字認識に係るパラメータの初期値に対する外部からの変更を受付ける。

さらに好ましくは、認識手段は、変更後の文字認識に係るパラメータに従って、計測領域に含まれる部分画像に対する文字認識を再度実行する。

好ましくは、画像処理システムは、処理対象の入力画像を取得する取得手段をさらに含む。認識手段は、文字フォーマットの下での一致度が相対的に高い領域を特定する。

本発明のある局面によれば、入力画像から文字情報を取得する画像処理方法が提供される。画像処理方法は、目的の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付けるステップと、認識対象の文字別の制約条件を示す文字フォーマットを受付けるステップと、文字フォーマットに従って、計測領域に含まれる部分画像に対して文字認識を実行するステップと、文字認識の実行結果に応じて、文字認識に係るパラメータを変更するステップとを含む。変更するステップは、文字フォーマットに従う文字認識の実行結果が予め定められた確からしさを超えるようにパラメータを変更して、文字認識に係るパラメータの初期値を決定するステップを含む。

本発明によれば、文字認識により入力画像から文字情報を取得する画像処理において、当該文字認識に係るパラメータの初期値を容易に決定できる。

本実施の形態に係る画像処理システムの全体構成を示す外観図である。本実施の形態に係る画像処理システムの機能的構成を示す模式図である。本実施の形態に係る画像処理システムにおける文字認識の処理内容を示す模式図である。本実施の形態に係る画像処理システムにおいて入力画像から文字情報を取得する画像処理方法に係る処理手順を示すフローチャートである。図４に示すフローチャートのステップＳ１１０に示すオートティーチサブルーチンの処理手順を示すフローチャートである。本実施の形態に係る画像処理システムが提供する文字認識処理の初期メニューを示すユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理における計測領域を設定するためのユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理における文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す図である。本実施の形態の変形例に係る画像処理システムが提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す図である。本実施の形態の変形例に係る画像処理システムが提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理におけるオートティーチ機能に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理における手動調整に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理における文字フォーマット調整に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理における計測パラメータ調整に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する文字認識処理における計測パラメータの文字色の調整に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する計測パラメータのドット間隔（縦）の調整に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する計測パラメータの文字太さしきい値の調整に係るユーザインターフェイス画面の一例を示す図である。本実施の形態に係る画像処理システムが提供する計測パラメータの文字太さしきい値の調整に係るユーザインターフェイス画面の一例を示す図である。

本発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰返さない。

［Ａ．画像処理システムの装置構成］
まず、本実施の形態に係る画像処理システムの装置構成について説明する。図１は、本実施の形態に係る画像処理システム１の全体構成を示す外観図である。図２は、本実施の形態に係る画像処理システム１の機能的構成を示す模式図である。

図１を参照して、本実施の形態に係る画像処理システム１は、例えば、生産ラインなどに組込まれる。図１に示す画像処理システム１は、その一つの機能として、入力画像から文字情報を取得する。より具体的には、視覚センサ２００は、対象物（後述の「ワーク２」）を撮像することで得られる入力画像に対して文字認識を実行することで、入力画像から文字情報を取得する機能を有する。特に、視覚センサ２００は、予め定められた文字フォーマットに従って文字認識を実行する。この文字認識の結果として、テキストデータを出力するようにしてもよい。

本明細書において、「文字フォーマット」は、文字認識の実行にあたって、認識候補をより限定するための条件である。典型的には、文字フォーマットは、認識対象の文字別に文字種別の指定（英数字、英文字、数字文字、記号文字、特殊文字、漢字、ひらがな、カタカナなど）、特定文字の指定（アルファベットの各文字「Ａ」，「Ｂ」，…、記号の各文字「’」，「−」，…、ひらがなの各文字「あ」，「い」，…、カタカナの各文字「ア」，「イ」，…）、フォント種別の指定、文字サイズ（フォントサイズ）の指定などを含む。このような文字フォーマットを予め指定することで、印字形式が予め定められているワーク（製品／半製品）などに対する認識率を向上（誤認識率を低下）させることができる。

例えば、「英文字」、「英文字」、「数字」の順に文字フォーマットが指定されていれば、入力画像中の複数の文字列を含む文字領域に対して、１文字目は、「英文字」に属する文字候補から最も一致度の高いものが選択され、２文字目は、「英文字」に属する文字候補から最も一致度の高いものが選択され、３文字目は、「数字」に属する文字候補から最も一致度の高いものが選択される。このような文字フォーマット、すなわち文字認識の認識候補を限定することで、処理を高速化するとともに、認識率を向上させることができる。なお、文字フォーマットの詳細については後述する。

視覚センサ２００において実行される文字認識は、入力画像に含まれる文字領域を読み取ってその内容を示すテキストデータを出力する処理に加えて、文字フォーマットに含まれる特定文字との一致度が高く、かつ指定された文字種別での認識確度が高い領域を抽出する処理を含む。すなわち、後者の処理では、指定された文字フォーマットとの一致度が高い１つ以上領域を入力画像から抽出する。

より具体的には、画像処理システム１は、視覚センサ２００と表示操作部２０１とを含む。視覚センサ２００と表示操作部２０１との間は、伝送ケーブル２０２を介して、所定のプロトコルに従って通信可能に構成されている。

表示操作部２０１は、上記の文字フォーマットの設定を受付けるとともに、視覚センサ２００により撮像された入力画像や処理結果などを表示する。すなわち、ユーザは、表示操作部２０１を操作して、文字フォーマットなどの処理に係る情報を送信することにより、視覚センサ２００での画像処理や撮像処理を制御する。図１には、表示操作部２０１に１台の視覚センサ２００が接続されている例を示すが、伝送ケーブル２０２および図示しないハブとを介して、表示操作部２０１に複数の視覚センサ２００が接続されるようにしてもよい。

図１に示す画像処理システム１では、入力画像を取得する機能および入力画像に対して文字認識を実行する機能が視覚センサ２００に実装され、文字認識の実行に必要な計測パラメータを指定する機能および文字認識の結果を表示する機能が表示操作部２０１に実装される例を示すが、この構成に限られるものではない。例えば、すべての機能を単体の画像処理装置に実装してもよいし、各機能を別々の装置に実装してもよい。あるいは、対象物を撮像して入力画像を取得する機能を撮像装置に実装し、残りの機能を画像処理装置に実装するようにしてもよい。本願発明の技術的範囲は、特許請求の範囲に記載された構成を有するものであれば、いずれの実装形態も含まれ得る。

視覚センサ２００は、ＩＯケーブル２０３を介して、ＰＬＣ（Programmable Logic Controller）２５０と通信可能に接続されている。ＰＬＣ２５０は、他の装置からの信号を受信したり、当該他の装置に信号を送信したりすることによって、画像処理システム１の全体を制御する。

視覚センサ２００は、撮像部２１２および処理部２１３を含み、撮像部２１２は、照明部２１１および撮像レンズ２２１を含む。処理部２１３は、マイクロコンピュータを内蔵する。視覚センサ２００の筐体には、視覚センサ２００を図示しない支持部材に取付けるための取付部２１４が設けられる。

表示操作部２０１は、ＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Organic Electro-Luminescence）などのディスプレイと、指やスタイラスでディスプレイに触れることで指示を受付けるための検出部とが一体的に構成されたタッチパネル２０４を有する。

表示操作部２０１は、ユーザが設定した文字フォーマット３００を視覚センサ２００へ送信し、視覚センサ２００は、対象物を撮像することで取得された入力画像、および当該取得した入力画像３１０に対して文字認識を実行することで得られた文字認識の結果を含む処理結果３２０を表示操作部２０１へ送信する。

次に、図２を参照して、視覚センサ２００および表示操作部２０１の機能的構成について説明する。

視覚センサ２００は、対象物であるワーク２を照明する照明部２１１と、ワーク２を撮像するための撮像部２１２と、処理部２１３とを含む。照明部２１１は、照明用レンズ２２４と光源であるＬＥＤ（Light Emitting Diode）２２５とを有する照明制御システム２２３を含む。撮像部２１２は、撮像レンズ２２１および撮像素子２２２を含む。

処理部２１３は、図示されないランプなどの表示灯（インジケータ）を制御する表示灯制御部２２７と、視覚センサ２００の各種処理を実行するＣＰＵ２２６と、各部に電力を供給する電源部２２８と、伝送ケーブル２０２に接続される通信システム２２９と、外部機器との間で入出力データを遣り取りする入出力システム２３０と、文字フォーマット３００、文字認識データベース３３０、計測パラメータ３４０に加えて、入力画像や処理結果などの各種データを格納するためのメモリ２３１とを含む。文字認識データベース３３０は、文字認識を行うための各文字に関する情報（パターンや特徴量）を含む。

表示操作部２０１は、各部に電力を供給する電源部２４０と、外部から指示を受付けるための検出部２４１およびディスプレイ２４２からなるタッチパネル２０４と、ディスプレイ２４２での表示を制御する表示ドライバ２４３と、表示ドライバ２４３を介してディスプレイ２４２に表示される画像を制御する表示制御部２４４と、画像を格納する画像保存部２４５と、視覚センサ２００から受信した画像を取扱う画像制御部２４６と、視覚センサ２００との間でデータを遣り取りする伝送部２４７とを含む。

表示操作部２０１は、視覚センサ２００に対して着脱自在に構成されており、典型的な使用形態として、製造現場などにおいて製造ラインを巡回するユーザが携帯可能なように小型化されている。そのため、表示操作部２０１のディスプレイ２４２のサイズも小さくなっている。

ディスプレイ２４２は、表示ドライバ２４３からの制御信号に基づいて、画像を表示する。表示ドライバ２４３は、表示制御部２４４からの画像信号に基づいて、ディスプレイ２４２の表示処理を制御するための制御信号を生成し、ディスプレイ２４２に出力する。

表示制御部２４４は、検出部２４１を介したユーザからの指示、画像制御部２４６から提供される画面情報、伝送部２４７を介して視覚センサ２００から提供される入力画像や処理結果などに基づいて、ユーザインターフェイス画面を生成し、表示ドライバ２４３を介してディスプレイ２４２上に表示する。

また、表示制御部２４４は、検出部２４１を介したユーザからの指示に基づいて設定される、文字フォーマットや計測パラメータを、伝送部２４７を介して視覚センサ２００へ送信する。

図２に示す機能構成は、プロセッサがプログラムを実行することで実現されてもよい。あるいは、視覚センサ２００および／または表示操作部２０１の主たる処理回路およびその周辺回路を含めて、ＡＳＩＣ（Application Specific Integrated Circuit）などの専用集積回路を用いて実現してもよい。

［Ｂ．文字フォーマット］
次に、画像処理システム１で扱う文字フォーマットについて説明する。本実施の形態に係る画像処理システム１では、文字フォーマットの一例として、「数字文字」、「英字文字」、「英数字」、「記号文字」といった文字種別を指定できる。これらの文字種別は、認識対象の文字別に指定可能になっている。

「数字文字」は、数字文字「０」，「１」，…，「９」（認識対象：「０」〜「９」）を指定する。画像処理システム１においては、「数字文字」は記号「＃」で示されるとする。

「英字文字」は、英文字「Ａ」，「Ｂ」，…，「Ｚ」（認識対象：「Ａ」〜「Ｚ」）を指定する。画像処理システム１においては、「英字文字」は記号「＄」で示されるとする。なお、「英字文字」として、大文字／小文字を区別するようにしてもよい。このとき、大文字および小文字のそれぞれをより細分化された文字種別としてもよい。例えば、文字種別としては、「英数大文字」および「英数小文字」といった具合である。

「英数字」は、「数字文字」および「英字文字」を包含する文字種別（認識対象：記号文字以外のすべての文字）である。画像処理システム１においては、「数字文字」は記号「？」で示されるとする。

「記号文字」は、記号文字「’」（アポストロフィー），「−」（ハイフン），「．」（ピリオド），「：」（コロン），「／」（スラッシュ）（認識対象：「’」「−」「．」「：」「／」）を指定する。画像処理システム１においては、「記号文字」は記号「＠」で示されるとする。

このようなワイルドカード（「＃」，「？」，「＠」）を指定することで、例えば、０（ゼロ）とＯ（オー）との間での誤認識などを防止できる。

また、画像処理システム１では、上述の文字種別に加えて、特定文字の指定が可能になっている。特定文字とは、認識可能な文字から選択された１つの文字を意味し、数字文字「０」，「１」，…，「９」、英文字「Ａ」，「Ｂ」，…，「Ｚ」、および記号文字「’」，「−」，「．」，「：」，「／」のうち、いずれか１つが選択される。この特定文字が指定された場合には、認識対象の部分画像との間で、指定された特定文字との間についてのみ、類似度の算出処理や安定度の判定処理が実行される。そして、対象の部分画像が指定された特定文字と一致しているか否かが判断される。

これらの文字種別や特定文字の指定に加えて、文字認識の対象から除外する文字属性を指定することもできる。文字認識の対象外になる文字は記号「＊」で示されるとし、スキップを意味する。スキップ属性が指定された場合には、類似度の算出処理や安定度の判定処理がスキップされる。このとき、検出文字数からも除外されるようにしてもよい。このようなスキップ属性を指定することで、誤認識し易い文字などを対象から除外することができ、文字認識処理をより安定的に実行できる。

［Ｃ．文字認識処理］
次に、上述の文字フォーマットを用いた文字認識処理について説明する。図３は、本実施の形態に係る画像処理システム１における文字認識の処理内容を示す模式図である。

図３を参照して、視覚センサ２００では、対象物を撮像することで得られる入力画像３１０から文字領域３１２が抽出される。この文字領域３１２は、入力画像３１０に対してエッジ抽出処理や特徴量抽出処理などによって特定される。さらに、文字領域３１２に含まれる各文字の領域（部分画像）が抽出される。この各文字のイメージに対応する領域（部分画像）の抽出処理は、公知の技術を採用できるので、ここではその詳細な説明は行わない。

続いて、視覚センサ２００は、各文字の領域に対して文字認識を実行する。この文字認識について、文字認識データベース３３０が予め用意されている。文字認識データベース３３０は、典型的には、文字毎にそれを特定するための識別情報（パターンや特徴量）を含む。文字認識データベース３３０に格納される各文字について、対応する文字種別が付加されている。すなわち、数字文字「０」，「１」，…，「９」については、文字種別が「数字文字」であり、英文字「Ａ」，「Ｂ」，…，「Ｚ」については、文字種別が「英文字」であることが情報として付加されている。

図３は文字認識の処理の典型例を示すものであり、本発明において、文字認識処理の実装としては、任意の方法を採用できる。

視覚センサ２００は、文字フォーマット３００の下で、文字認識データベース３３０を参照して各文字の領域（部分画像）に対応する文字を特定する。図３に示す文字フォーマット３００では、「＄＄＄＠＃＃＃」が指定されている。なお、文字フォーマット３００の記述方式は、図３に示すものに限られることなく、任意の記述方式を採用できる。

図３に示す文字フォーマットは、左から第１〜３番目の文字が「英字文字」であり、第４番目の文字が「記号文字」であり、第５〜７番目の文字が「数字文字」であることを示す。そのため、視覚センサ２００は、文字領域３１２に含まれる第１〜３番目の各文字について、文字認識データベース３３０に含まれる英字文字の各文字を候補として、一致度を算出する。すなわち、視覚センサ２００は、まず、文字領域３１２に含まれる第１番目の文字と英文字「Ａ」，「Ｂ」，…，「Ｚ」との間で一致度をそれぞれ算出する。そして、（基本的には）文字候補のうち最も一致度の高いものを認識結果として出力する。以下、視覚センサ２００は、文字領域３１２に含まれる第２番目以降の各文字について、同様の処理を繰返す。

このような文字フォーマット３００を用いることで、図３に示す例では、文字領域３１２の第２番目に「Ｉ（アイ）」があり、文字領域３１２の第３番目に「Ｏ（オー）」があるが、これらをそれぞれ「１（いち）」および「０（ゼロ）」と誤って認識することを防止できる。同様に、図３に示す例では、文字領域３１２の第５番目に「１（いち）」があり、文字領域３１２の第７番目に「０（ゼロ）」があるが、これらをそれぞれ「Ｉ（アイ）」および「Ｏ（オー）」と誤って認識することを防止できる。

例えば、商品の型番、価格、製造年月日、識別番号などは、その印字フォーマットが予め定まっている場合が多いので、このような文字フォーマットを容易に適用することができ、これによって認識率を向上（誤認識率を低下）させることができる。

上述したように、文字フォーマット３００としては、特定文字を指定することもできる。特定文字を指定した場合には、一種のパターンマッチング処理が実行される。すなわち、図３に示す例において、文字フォーマット３００として、例えば、「＄＄＄：＃＃＃」が指定されると、文字領域３１２に含まれる第４番目の文字と「：」（コロン）との間の一致度が算出され、その算出された一致度が予め定められた値より高い場合に限って有効な認識結果として出力される。そのため、文字領域３１２に含まれる第４番目の文字が「：」（コロン）として認識されるもののみが抽出されることになる。この場合には、入力画像３１０から複数の文字領域３１２が抽出されることもある。

図３に示す文字認識処理において、文字領域３１２の抽出処理、文字領域３１２に含まれる各文字の領域（部分画像）の抽出処理、抽出した各文字のイメージに対する文字認識データベース３３０を用いたマッチング処理などは、予め設定されたパラメータに従って実行される。すなわち、文字認識に係るパラメータとして、計測パラメータが予め用意されている。このような計測パラメータの初期値は、本実施の形態に係る画像処理システム１が提供するオートティーチ機能によって決定される。このオートティーチ機能の詳細については、後述する。

［Ｄ．計測パラメータ］
次に、図３に示す文字認識処理において参照される計測パラメータの詳細について説明する。本実施の形態に係る画像処理システム１においては、以下のような計測パラメータを用いる。
（１）文字色：検出対象の文字の色を指定するパラメータ
・設定値：「黒」または「白」
（２）印字種類：検出対象の文字の表現形式を指定するパラメータ
・設定値：「捺印」または「ドット」（「捺印」は、アウトラインフォントなどの外形が連続したフォントを意味し、「ドット」は、ドットマトリックスなどのフォントを意味する）
（３）ドット間隔（縦）：（２）の印字種類が「ドット」の場合のみ有効となるパラメータであり、検出対象の文字を構成する縦のドット間隔を示すパラメータ
・入力範囲：０ピクセル〜入力画像の縦幅（ピクセル）
（４）ドット間隔（横）：（２）の印字種類が「ドット」の場合のみ有効となるパラメータであり、検出対象の文字を構成する横のドット間隔を示すパラメータ
・入力範囲：０ピクセル〜入力画像の横幅（ピクセル）
（５）フィルタサイズ：ノイズ除去用のフィルタサイズを指定するパラメータ
・入力範囲：−６０〜４４０（値が大きいほど広い領域でノイズ除去を行い、値が小さいほど狭い範囲でノイズ除去を行う）
（６）文字太さしきい値：検出対象の文字の太さを指定するパラメータ
・入力範囲：−２５５〜２５５（負の数を設定すると文字が細くなる方向に変化し、正の値を設定すると文字が太くなる方向に変化する）
（７）回転バラツキ補正：機能をＯＮにすることで所定範囲にわたる文字の回転バラツキに対応できる
・設定値：「ＯＮ」または「ＯＦＦ」
（８）斜体バラツキ補正：機能をＯＮにすることで所定範囲にわたる文字の斜体バラツキに対応できる
・設定値：「ＯＮ」または「ＯＦＦ」
（９）ふち消し補正：機能をＯＮにすることで計測領域に接している黒い部分をノイズとして読み取り候補から除外する
・設定値：「ＯＮ」または「ＯＦＦ」
（１０）細長文字しきい値：検出矩形の高さの幅に対する倍率がいくら以上のときに細長文字（Ｉ，Ｊ，１，：，／）と判定するかを指定する
・入力範囲：１〜１０
（１１）ハイフン高さ上限：ハイフンと見なす領域の高さ上限値を指定する
入力範囲：０〜１００
（１２）ハイフン高さ下限：ハイフンと見なす領域の高さ下限値を指定する
入力範囲：０〜１００
［Ｅ．処理手順］
次に、本実施の形態に係る画像処理システム１において入力画像から文字情報を取得する画像処理方法に係る処理手順について説明する。

図４は、本実施の形態に係る画像処理システム１において入力画像から文字情報を取得する画像処理方法に係る処理手順を示すフローチャートである。図５は、図４に示すフローチャートのステップＳ１１０に示すオートティーチサブルーチンの処理手順を示すフローチャートである。本実施の形態に係る画像処理システム１は、動作モードとして、文字認識処理を含む計測処理に係る各種パラメータを調整するための調整モードと、実際に計測処理を実行する運転モードとを含む。図４に示す処理手順の当初は調整モードが選択されているとする。

図４を参照して、まず、調整モードにおいて、オートティーチ機能が実行される。すなわち、ユーザは、視覚センサ２００の視野範囲に認識対象の文字列を含む対象物（基準サンプル）を配置し、表示操作部２０１を操作して参照画像の取得を指示する。すると、視覚センサ２００は、目的の対象物（基準サンプル）を撮像することで参照画像を取得する（ステップＳ１００）。そして、視覚センサ２００は、その取得した参照画像を表示操作部２０１へ送信する。

表示操作部２０１は、視覚センサ２００から受信した参照画像を表示するとともに、参照画像に対する認識対象とすべき領域（計測領域）の設定を受付ける（ステップＳ１０２）。後述するように、ユーザは、タッチパネル上に表示される参照画像に対して計測領域を設定する。すなわち、表示操作部２０１は、目的の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付ける処理を実行する。続いて、表示操作部２０１は、計測領域に含まれる認識対象の文字列についての文字フォーマットを受付ける（ステップＳ１０４）。すなわち、表示操作部２０１は、認識対象の文字別の制約条件を示す文字フォーマットを受付ける処理を実行する。この入力された文字フォーマットは、視覚センサ２００へ送信される。

そして、視覚センサ２００は、オートティーチ処理を実行する（ステップＳ１１０）。このオートティーチ処理については、図５を参照して、より詳細に説明する。

図５に示すオートティーチ処理においては、変更される可能性の高い計測パラメータから順にその値を確定させる。これは、すべての計測パラメータを同時に変更すると、適切ではない計測パラメータの組み合わせを決定する可能性があるからである。図５に示す例では、（１）文字色および印字種類、（２）文字太さしきい値およびフィルタサイズ、（３）ドット間隔（縦）およびドット間隔（横）、（４）回転バラツキ補正および斜体バラツキ補正の順で計測パラメータを決定する。現実的に、文字太さしきい値およびフィルタサイズは同時に変更することが多いので、これらを同時に決定する処理としている。オートティーチ処理の開始時には、いずれの計測パラメータもデフォルト値が設定されているとする。

図５に示すオートティーチ処理においては、文字認識の結果（読み取り結果）と設定されている文字フォーマットとが一致しているか否かに基づいて、文字フォーマットに従う文字認識の実行結果が予め定められた確からしさを超えるか否かを判断する。すなわち、文字フォーマットの条件がない状態で実行された文字認識の結果が設定されている文字フォーマットと一致すれば、そのときの計測パラメータは、信頼度が高いといえる。このように、文字認識の結果（読み取り結果）と設定されている文字フォーマットとの一致の有無を確認することで、本来意図している文字フォーマットに沿った領域抽出を行えるように計測パラメータを決定できる。なお、文字フォーマットにおいて特定文字が指定されている場合には、その指定されている指定文字との一致の有無が判断される。

より具体的には、図５を参照して、視覚センサ２００は、文字色および印字種類の組についての値を変更し（ステップＳ１１０１）、当該変更後の計測パラメータに従って、参照画像の計測領域に含まれる部分画像に対して文字認識を実行する（ステップＳ１１０２）。そして、視覚センサ２００は、文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致しているか否かを判断する（ステップＳ１１０３）。文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致している場合（ステップＳ１１０３においてＹＥＳの場合）には、視覚センサ２００は、現在の計測パラメータを設定値として反映する（ステップＳ１１０４）。そして、図４のステップＳ１１４の処理が実行される。

文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致していない場合（ステップＳ１１０３においてＮＯの場合）には、視覚センサ２００は、文字太さしきい値およびフィルタサイズの組についての値を変更し（ステップＳ１１０５）、当該変更後の計測パラメータに従って、参照画像の計測領域に含まれる部分画像に対して文字認識を実行する（ステップＳ１１０６）。そして、視覚センサ２００は、文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致しているか否かを判断する（ステップＳ１１０７）。文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致している場合（ステップＳ１１０７においてＹＥＳの場合）には、視覚センサ２００は、現在の計測パラメータを設定値として反映する（ステップＳ１１０４）。そして、図４のステップＳ１１４の処理が実行される。

文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致していない場合（ステップＳ１１０７においてＮＯの場合）には、視覚センサ２００は、ドット間隔（縦）およびドット間隔（横）の組についての値を変更し（ステップＳ１１０８）、当該変更後の計測パラメータに従って、参照画像の計測領域に含まれる部分画像に対して文字認識を実行する（ステップＳ１１０９）。そして、視覚センサ２００は、文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致しているか否かを判断する（ステップＳ１１１０）。文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致している場合（ステップＳ１１１０においてＹＥＳの場合）には、視覚センサ２００は、現在の計測パラメータを設定値として反映する（ステップＳ１１０４）。そして、図４のステップＳ１１４の処理が実行される。

但し、ドット間隔（縦）およびドット間隔（横）は、印字種類が「ドット」の場合のみ有効なパラメータであり、印字種別の値が「捺印」である場合には、ステップＳ１１０８〜Ｓ１１１０の処理をスキップしてよい。

文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致していない場合（ステップＳ１１１０においてＮＯの場合）には、視覚センサ２００は、回転バラツキ補正および斜体バラツキ補正の組についての値を変更し（ステップＳ１１１１）、当該変更後の計測パラメータに従って、参照画像の計測領域に含まれる部分画像に対して文字認識を実行する（ステップＳ１１１２）。そして、視覚センサ２００は、文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致しているか否かを判断する（ステップＳ１１１３）。文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致している場合（ステップＳ１１１３においてＹＥＳの場合）には、視覚センサ２００は、現在の計測パラメータを設定値として反映する（ステップＳ１１０４）。そして、図４のステップＳ１１４の処理が実行される。

なお、回転バラツキ補正および斜体バラツキ補正については、念のため、その機能を有効化して試してみるものであり、これらの計測パラメータについては、オートティーチ処理の対象から除外してもよい。

文字認識の結果（読み取り結果）から取得される文字フォーマットと設定されている文字フォーマットとが一致していない場合（ステップＳ１１１３においてＮＯの場合）には、一旦、計測パラメータを元の値に戻した後（ステップＳ１１１４）、ステップＳ１１０１以下の処理が再度実行される。

このように、視覚センサ２００は、文字認識の実行結果に基づいて、文字フォーマットに従う文字認識の実行結果が予め定められた確からしさを超えるようにパラメータを変更して、文字認識に係るパラメータの初期値を決定する。言い換えれば、視覚センサ２００は、文字認識の実行結果が予め定められた文字フォーマットと適合するように、パラメータを変更して、文字認識に係るパラメータの初期値を決定する。

再度図４を参照して、視覚センサ２００は、現在の計測パラメータをオートティーチ機能により設定された計測パラメータの初期値として出力する（ステップＳ１１４）。その後、ユーザの要求に応じて、計測パラメータの変更処理が実行される。具体的には、表示操作部２０１は、計測パラメータの変更がユーザから要求されたか否かを判断する（ステップＳ１２０）。典型的には、タッチパネル上で、計測パラメータの変更を示すオブジェクト（ボタン）が選択されたか否かが判断される。計測パラメータの変更がユーザから要求されていなければ（ステップＳ１２０においてＮＯの場合）、ステップＳ１３０以下の処理が実行される。

計測パラメータの変更がユーザから要求されると（ステップＳ１２０においてＹＥＳの場合）、表示操作部２０１は、計測パラメータの現在値を表示するとともに、計測パラメータの変更指示を受付ける（ステップＳ１２２）。すなわち、表示操作部２０１は、文字認識に係るパラメータの初期値に対する外部からの変更を受付ける処理を実行する。表示操作部２０１に対して指定された計測パラメータの変更指示は、視覚センサ２００へ送信され、視覚センサ２００が保持する計測パラメータを変更する。そして、視覚センサ２００は、変更後の計測パラメータおよび設定されている文字フォーマットに従って、計測領域に含まれる部分画像に対して文字認識を再度実行する（ステップＳ１２４）。すなわち、視覚センサ２００は、変更後の文字認識に係るパラメータに従って、計測領域に含まれる部分画像に対する文字認識を再度実行する。この再度実行された文字認識の結果は、表示操作部２０１に表示される。

その後、表示操作部２０１は、運転モードの開始が指示されたか否かを判断する（ステップＳ１３０）。運転モードの開始が指示されていなければ（ステップＳ１３０においてＮＯの場合）、ステップＳ１４０の処理が実行される。

運転モードの開始が指示されると（ステップＳ１３０においてＹＥＳの場合）、視覚センサ２００は、予め定められたトリガー条件に応じて、対象物を撮像して入力画像を取得し（ステップＳ１３２）、現在の計測パラメータおよび文字フォーマットに従って、入力画像に含まれる領域に対して文字認識を実行する（ステップＳ１３４）。そして、視覚センサ２００は、文字認識の実行結果を表示操作部２０１などへ出力する（ステップＳ１３６）。

すなわち、表示操作部２０１は、運転モードの開始が指示されると、その時点で設定されている計測パラメータおよび文字フォーマットを視覚センサ２００へ送信する。そして、視覚センサ２００は、処理対象の入力画像を取得する処理を実行するとともに、この取得した入力画像に対して認識処理を実行する。この認識処理においては、視覚センサ２００は、設定されている文字フォーマットの下での一致度が相対的に高い領域を特定する。

言い換えれば、入力画像から抽出された１つ以上の文字領域のうち、文字フォーマットに従う文字認識を行った結果、その一致度が予め定められた値より高い文字領域が抽出される。そのため、１つの入力画像から複数の文字領域、すなわち複数の文字情報が抽出される場合もある。画像処理システム１が提供されるアプリケーションに依存して、このような複数の文字情報の抽出を禁止してもよいし、許容してもよい。

そして、表示操作部２０１は、運転モードの停止が指示されたか否かを判断する（ステップＳ１４０）。運転モードの停止が指示されていなければ（ステップＳ１４０においてＮＯの場合）、ステップＳ１３２以下の処理が実行される。運転モードの停止が指示されると（ステップＳ１４０においてＹＥＳの場合）、表示操作部２０１は、調整モードへ遷移し、初期メニュー画面を表示し（ステップＳ１４２）、オートティーチ機能の開始が指示されたか否かを判断する（ステップＳ１４４）。オートティーチ機能の開始が指示されていなければ（ステップＳ１４４においてＮＯの場合）、ステップＳ１４２以下の処理が実行される。

オートティーチ機能の開始が指示されると（ステップＳ１４４においてＹＥＳの場合）、ステップＳ１００以下の処理が実行される。

［Ｆ．ユーザインターフェイス画面］
次に、上述の図４に示す処理手順の各局面において提供されるユーザインターフェイス画面の一例について説明する。

（ｆ１：初期メニュー画面）
図６は、本実施の形態に係る画像処理システム１が提供する文字認識処理の初期メニューを示すユーザインターフェイス画面４００Ａの一例を示す図である。図６に示すユーザインターフェイス画面４００Ａは、表示操作部２０１において提供される。以下の各ユーザインターフェイス画面についても同様に、表示操作部２０１において提供される。

図６を参照して、ユーザインターフェイス画面４００Ａにおいて、文字認識を実行するための各種設定がフロー形式で表示されている。具体的には、ティーチング処理を示す「ティーチ」、文字認識に係る各種パラメータの設定処理を示す「判定条件」、文字認識の結果を利用したＯＫ／ＮＧ判定などの各種パラメータの設定処理を示す「照合条件」の３つの処理を示すオブジェクトが表示されている。ユーザが、「ティーチ」のオブジェクト４０２を選択すると、上述のオートティーチ機能が開始される。

（ｆ２：計測領域の設定）
図７は、本実施の形態に係る画像処理システム１が提供する文字認識処理における計測領域を設定するためのユーザインターフェイス画面４００Ｂの一例を示す図である。図７を参照して、ユーザインターフェイス画面４００Ｂでは、目的の対象物（基準サンプル）を撮像することで取得された参照画像４０４が表示されている。ユーザは、この表示されている参照画像４０４の上から目的の計測領域を設定する。具体的には、ユーザは、タッチ操作あるいはマウス操作などによって、カーソル４０６を操作して計測領域に対応する領域を設定する。図７においては、４つのカーソル４０６で囲まれる範囲が計測領域４０８となる。

このように、表示操作部２０１は、参照画像４０４を表示するとともに、表示された参照画像４０４に対するユーザ操作に応答して計測領域４０８を決定する。その後、ユーザインターフェイス画面４００Ｂの「ＯＫ」のオブジェクトが選択されると、計測領域４０８に含まれる認識対象の文字列についての文字フォーマットの設定画面へ遷移する。

（ｆ３：文字フォーマットの設定）
図８は、本実施の形態に係る画像処理システム１が提供する文字認識処理における文字フォーマットを設定するためのユーザインターフェイス画面４００Ｃの一例を示す図である。画像処理システム１では、同一の入力画像に対して複数の計測領域を設定することが可能であり、図８に示すユーザインターフェイス画面４００Ｃでは、４つの計測領域に対して、それぞれ文字フォーマットを設定できるようになっている。すなわち、ユーザインターフェイス画面４００Ｃは、４つの文字フォーマット入力領域４１０，４１２，４１４，４１６を含む。

あるいは、複数の文字列（行）が含まれるように単一の計測領域を設定し、それに含まれるそれぞれの文字列に対して文字列フォーマットを設定することができる。例えば、単一の計測領域に２つの文字列が含まれる場合には、２つの文字フォーマット入力領域４１０，４１２を用いてそれぞれの文字列フォーマットを設定してもよいし、１つの文字フォーマット入力領域４１０において、予め定められたデリミタ（例えば、改行コード）を用いて区分しつつ、それぞれの文字列フォーマットを設定してもよい。

ユーザは、いずれかの文字フォーマット入力領域を選択して、目的の文字フォーマットを入力する。この際、キーボードなどの入力装置を用いて直接的に入力してもよいが、以下のような文字フォーマット入力用のユーザインターフェイス画面が提供されてもよい。

図９および図１０は、本実施の形態の変形例に係る画像処理システム１が提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す図である。図９または図１０に示すユーザインターフェイス画面は、図８に示すユーザインターフェイス画面４００Ｃにおいて、文字フォーマット入力領域４１０，４１２，４１４，４１６のいずれかが選択されることで表示される。

図９に示すユーザインターフェイス画面４００Ｄでは、入力中の文字フォーマットを示す文字フォーマット入力領域４１０と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクト４２０と、指定可能な特定文字に関連付けられた複数のオブジェクト４３０とが並べて、すなわち同一画面内に表示されている。ユーザがオブジェクト４２０および４３０のうちいずれかを選択すると、当該選択されたオブジェクトに対応する文字フォーマットが追加される。すなわち、表示操作部２０１は、いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別または特定文字を文字フォーマットに追加する。

すなわち、表示操作部２０１は、設定されている文字フォーマットを表示するとともに、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトを表示し、いずれかのオブジェクトの選択に応答して、選択されたオブジェクトに関連付けられた文字種別を文字フォーマットに追加する。

複数のオブジェクト４２０は、「数字文字」を指定するオブジェクトと、「数字文字」を指定するオブジェクトと、「英字文字」を指定するオブジェクトと、「記号文字」を指定するオブジェクトと、「スキップ属性」を指定するオブジェクトとを含む。

表示領域４０２には、設定されている文字フォーマットが各文字種別に対応付けられた記号を用いて表示されている。すなわち、記号「＃」、「＄」、「＠」といった記号で文字フォーマットが既定される。このような記号の意味が一見して把握できるように、図９に示すユーザインターフェイス画面４００Ｄのオブジェクト４２０の各々では、関連付けられた文字種別を示すメッセージ（例えば、「英数字」や「数字文字」といった表示）とともに、当該文字種別に対応する記号（例えば、「？」や「＃」といった記号）が表示される。

このように、オブジェクト４２０には、関連付けられた文字種別の意味を一見して把握できるようにメッセージが付加されており、さらに対応する文字種別を示す記号も併せて付加されているので、ユーザは、各記号の意味を予め知っておかなくても、文字フォーマット入力領域４１０に表示される設定中の文字フォーマットの内容を容易に把握することができる。

ユーザインターフェイス画面４００Ｄでは、設定されている文字フォーマットを編集するためのオブジェクトも表示されている。例えば、バックスペース操作（カーソルの直前の文字を消去する操作）に関連付けられたオブジェクト４２４と、クリア操作（設定されている文字フォーマットを全消去する操作）に関連付けられたオブジェクト４２６と、カーソルを移動させる操作に関連付けられたオブジェクト４２８とが配置されている。

また、特定文字を個別に指定する必要がある場合には、ユーザはオブジェクト４３０を選択する。これによって、図９に示すユーザインターフェイス画面４００Ｄは、図１０に示すユーザインターフェイス画面４００Ｅへ遷移する。

図１０を参照して、ユーザインターフェイス画面４００Ｅは、ユーザインターフェイス画面４００Ｄと比較して、オブジェクト４２０および４３０に代えて、オブジェクト４３２を配置したものに相当する。オブジェクト４３２は、指定可能な特定文字を所定規則で配置したものであり、図１０に示す例では、ＱＷＥＲＴ式で数字およびアルファベットが配置されている例を示す。このような配列順に限られず、アルファベット順や他の配列順を採用してもよい。ユーザは、ユーザインターフェイス画面４００Ｅを用いて、所望の特定文字を文字フォーマットとして設定することができる。

図９および図１０に示すユーザインターフェイス画面を採用することで、文字フォーマットについて知識の無いユーザであっても、容易に文字フォーマットとして文字種別などを指定することができる。

その後、ユーザインターフェイス画面４００Ｄまたは４００Ｅの「ＯＫ」のオブジェクトが選択されると、オートティーチ機能が開始される。

（ｆ４：オートティーチ機能）
図１１は、本実施の形態に係る画像処理システム１が提供する文字認識処理におけるオートティーチ機能に係るユーザインターフェイス画面４００Ｆの一例を示す図である。図１１を参照して、ユーザインターフェイス画面４００Ｆでは、参照画像４０４および参照画像４０４の上に設定されている計測領域４０８が表示されており、ユーザがＴＥＡＣＨのオブジェクト４３６を選択すると、オートティーチ機能が開始される。具体的には、視覚センサ２００は、設定された文字フォーマットに従って、計測領域に含まれる部分画像に対して文字認識を実行するとともに、計測パラメータを最適化する。すなわち、このオートティーチ機能の実行中、設定された文字フォーマットに基づく文字認識の結果が最適化されるように、計測パラメータが調整される。

その後、ユーザがメニュー表示するためのオブジェクト４３８を選択すると、手動調整を行うためのメニュー画面が表示される。

図１２は、本実施の形態に係る画像処理システム１が提供する文字認識処理における手動調整に係るユーザインターフェイス画面４００Ｇの一例を示す図である。図１２に示すように、オブジェクト４３８が選択されると、各種メニュー項目が一覧表示される。すなわち、設定されている計測領域を変更するためのオブジェクト４４０（計測領域編集）と、設定されている文字フォーマットを変更するためのオブジェクト４４２（文字フォーマット）と、撮像条件などを変更するためのオブジェクト４４４（カメラ調整）と、計測パラメータを変更するためのオブジェクト４４６（計測パラメータ）と、動作モードでの処理をテストするためのオブジェクト４４８（連続計測テスト）とが表示される。

（ｆ５：文字フォーマット変更）
図１２に示すユーザインターフェイス画面４００Ｇにおいて、設定されている文字フォーマットを変更するためのオブジェクト４４２（文字フォーマット）が選択されると、設定されている文字フォーマットを変更（調整）するためのユーザインターフェイス画面が提供される。

図１３は、本実施の形態に係る画像処理システム１が提供する文字認識処理における文字フォーマット調整に係るユーザインターフェイス画面４００Ｈの一例を示す図である。図１３を参照して、ユーザインターフェイス画面４００Ｈでは、４つの文字フォーマット入力領域４１０，４１２，４１４，４１６に、それぞれ現在設定されている文字フォーマットが表示される。それに加えて、文字フォーマット入力領域４１０，４１２，４１４，４１６のそれぞれに関連付けて、オートティーチ機能によって抽出された文字認識結果４１１，４１３，４１５，４１７が表示される。ユーザは、この文字認識結果４１１，４１３，４１５，４１７を参照して、設定した文字フォーマットが正しいか、設定した文字フォーマットに従って正しく文字認識できているかなどを判断する。

（ｆ６：計測パラメータ変更）
図１２に示すユーザインターフェイス画面４００Ｇにおいて、計測パラメータを変更するためのオブジェクト４４６（計測パラメータ）が選択されると、設定されている計測パラメータを確認および変更（調整）するためのユーザインターフェイス画面が提供される。

図１４は、本実施の形態に係る画像処理システム１が提供する文字認識処理における計測パラメータ調整に係るユーザインターフェイス画面４００Ｉの一例を示す図である。図１４を参照して、ユーザインターフェイス画面４００Ｉでは、計測パラメータの項目および現在設定されている値が一覧表示される。具体的には、計測パラメータとして、文字色を示すフィールド４５０と、印字種類を示すフィールド４５２と、ドット間隔（縦）を示すフィールド４５４と、ドット間隔（縦）を示すフィールド４５６と、文字太さしきい値を示すフィールド４５８と、ノイズフィルタサイズを示すフィールド４６０とが表示されている。

ユーザは、このユーザインターフェイス画面４００Ｉを参照して、オートティーチ機能の結果決定された計測パラメータの状態を確認する。さらに、各フィールドを選択することで、設定されている値を変更または調整することができる。

《ｆ６ａ：文字色》
図１４に示すユーザインターフェイス画面４００Ｉにおいて、文字色を示すフィールド４５０が選択されると、設定されている文字色についての設定値を確認および変更（調整）するためのユーザインターフェイス画面が提供される。

図１５は、本実施の形態に係る画像処理システム１が提供する文字認識処理における計測パラメータの文字色の調整に係るユーザインターフェイス画面４００Ｊの一例を示す図である。文字色の設定値としては、「黒文字」および「白文字」のいずれかが選択的に設定されるので、図１４に示すユーザインターフェイス画面４００Ｊでは、「黒文字」に対応するオブジェクト４６２と、「白文字」に対応するオブジェクト４６４とが選択可能に表示されている。さらに、現在の設定値がわかるように、「黒文字」のオブジェクト４６２の表示態様は、「白文字」のオブジェクト４６４とは異なっている。

《ｆ６ｂ：ドット間隔》
図１４に示すユーザインターフェイス画面４００Ｉにおいて、ドット間隔（縦）を示すフィールド４５４が選択されると、設定されているドット間隔（縦）についての設定値を確認および変更（調整）するためのユーザインターフェイス画面が提供される。

図１６は、本実施の形態に係る画像処理システム１が提供する計測パラメータのドット間隔（縦）の調整に係るユーザインターフェイス画面４００Ｋの一例を示す図である。

図１６に示すユーザインターフェイス画面４００Ｋでは、現在のドット間隔（縦）の設定値およびその設定値に従って実行された文字認識の結果がプレビュー表示されている。具体的には、参照画像上に設定された計測領域４０８から抽出された文字領域が枠で示されており、各枠についても、その中の文字の文字種別を示す態様で表示されている。ユーザは、この表示を確認して、文字領域が正しく抽出されているかを判断する。

さらに、ユーザインターフェイス画面４００Ｋには、ドット間隔（縦）を調整するためのオブジェクト４６６が表示されており、ユーザがオブジェクト４６６を操作することで、ドット間隔（縦）の設定値を調整できる。この際、ドット間隔（縦）を調整した結果が即座にわかるように、変更後の計測パラメータに従って部分画像に対して文字認識が再度実行される。これによって、ユーザは、ドット間隔（縦）などの計測パラメータの最適値への設定（いわゆる、チューニング作業）を容易に行うことができる。

《ｆ６ｃ：しきい値》
図１４に示すユーザインターフェイス画面４００Ｉにおいて、文字太さしきい値を示すフィールド４５８が選択されると、設定されている文字太さしきい値についての設定値を確認および変更（調整）するためのユーザインターフェイス画面が提供される。

図１７および図１８は、本実施の形態に係る画像処理システム１が提供する計測パラメータの文字太さしきい値の調整に係るユーザインターフェイス画面４００Ｌの一例を示す図である。

図１７および図１８に示すユーザインターフェイス画面４００Ｌでは、現在の文字太さしきい値の設定値およびその設定値に従って実行された文字認識の結果がプレビュー表示されている。具体的には、参照画像上に設定された計測領域４０８から抽出された文字領域が枠で示されており、各枠についても、その中の文字の文字種別を示す態様で表示されている。ユーザは、この表示を確認して、文字領域が正しく抽出されているかを判断する。

さらに、ユーザインターフェイス画面４００Ｌには、文字太さしきい値を調整するためのオブジェクト４７４が表示されており、ユーザがオブジェクト４７４を操作することで、文字太さしきい値の設定値を調整できる。この際、文字太さしきい値を調整した結果が即座にわかるように、変更後の計測パラメータに従って部分画像に対して文字認識が再度実行される。

具体的には、図１７に示すユーザインターフェイス画面４００Ｌでは、文字太さしきい値が０に設定されており、図１８に示すユーザインターフェイス画面４００Ｌでは、文字太さしきい値が１８に変更されている。図１７と図１８とを比較する、文字太さしきい値が大きくなることによって、文字領域として抽出される範囲が変わっているのがわかる。このように、ユーザは、文字太さしきい値などの計測パラメータの最適値への設定（いわゆる、チューニング作業）を容易に行うことができる。

［Ｇ．利点］
本実施の形態によれば、文字種別や特定文字などからなる文字フォーマットを入力し、オートティーチ機能を実行することで、文字認識処理に必要な計測パラメータが自動調整される。これにより、文字認識などの画像処理の知識が少ないユーザであっても、文字認識を実行するために必要な計測パラメータを容易に設定できる。

また、本実施の形態によれば、多くのＯＫ画像およびＮＧ画像を予め用意する代わりに、文字フォーマットを利用するので、より少ない演算回数で計測パラメータを設定および最適化できる。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

２ワーク、２００視覚センサ、２０１表示操作部、２０２伝送ケーブル、２０３ＩＯケーブル、２０４タッチパネル、２１１照明部、２１２撮像部、２１３処理部、２１４取付部、２２１撮像レンズ、２２２撮像素子、２２３照明制御システム、２２４照明用レンズ、２２６ＣＰＵ、２２７表示灯制御部、２２８，２４０電源部、２２９通信システム、２３０入出力システム、２３１メモリ、２４１検出部、２４２ディスプレイ、２４３表示ドライバ、２４４表示制御部、２４５画像保存部、２４６画像制御部、２４７伝送部、２５０ＰＬＣ、３００文字フォーマット、３１０入力画像、３１２文字領域、３２０処理結果、３３０文字認識データベース、３４０計測パラメータ。

Claims

入力画像から文字情報を取得する画像処理システムであって、
基準の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付ける第１指定手段と、
認識対象の文字別の制約条件を示す文字フォーマットを受付ける第２指定手段と、
前記文字フォーマットに従って、前記計測領域に含まれる部分画像に対して文字認識を実行する認識手段と、
文字認識に係るパラメータを設定する設定手段とを備え、
前記設定手段は、
前記参照画像の前記計測領域に含まれる部分画像に対する現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致するか否かを判断する判断手段と、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致すれば、当該現在のパラメータを前記文字認識に係るパラメータの初期値として決定する決定手段と、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致しなければ、当該現在のパラメータに対して変更を加えた上で、変更後のパラメータに従う文字認識を再度実行させる変更手段とを含む、画像処理システム。
前記パラメータは、複数の要素を含み、
前記変更手段は、直前に実行された文字認識の実行前に変更された要素とは異なる要素を変更する、請求項１に記載の画像処理システム。
前記文字フォーマットは、文字別に文字種別または特定文字の指定を含む、請求項１または２に記載の画像処理システム。
前記第１指定手段は、前記参照画像を表示するとともに、表示された参照画像に対するユーザ操作に応答して前記計測領域を決定する、請求項１〜３のいずれか１項に記載の画像処理システム。
前記第２指定手段は、設定されている文字フォーマットを表示するとともに、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトを表示し、いずれかのオブジェクトの選択に応答して、選択されたオブジェクトに関連付けられた文字種別を文字フォーマットに追加する、請求項１〜４のいずれか１項に記載の画像処理システム。
前記設定手段は、前記文字認識に係るパラメータの初期値に対する外部からの変更を受付ける、請求項１〜５のいずれか１項に記載の画像処理システム。
前記認識手段は、前記設定手段によって設定されたパラメータに従って、前記基準の対象物と同種類の対象物を撮像することで得られた対象画像に対して、当該対象画像の前記計測領域に含まれる部分画像に対する文字認識を実行する、請求項１〜６のいずれか１項に記載の画像処理システム。
処理対象の入力画像を取得する取得手段をさらに備え、
前記認識手段は、前記文字フォーマットの下での一致度が相対的に高い領域を特定する、請求項１〜７のいずれか１項に記載の画像処理システム。
入力画像から文字情報を取得する画像処理方法であって、
基準の対象物を撮像することで得られた参照画像に対する計測領域の設定を受付けるステップと、
認識対象の文字別の制約条件を示す文字フォーマットを受付けるステップと、
前記文字フォーマットに従って、前記計測領域に含まれる部分画像に対して文字認識を実行するステップと、
文字認識に係るパラメータを設定するステップとを含み、
前記設定するステップは、
前記参照画像の前記計測領域に含まれる部分画像に対する現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致するか否かを判断するステップと、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致すれば、当該現在のパラメータを前記文字認識に係るパラメータの初期値として決定するステップと、
前記現在のパラメータに従う文字認識の実行結果が前記文字フォーマットに一致しなければ、当該現在のパラメータに対して変更を加えた上で、変更後のパラメータに従う文字認識を再度実行させるステップとを含む、画像処理方法。