JP6011214B2 - 画像処理システムおよび画像処理方法 - Google Patents

画像処理システムおよび画像処理方法 Download PDF

Info

Publication number
JP6011214B2
JP6011214B2 JP2012217682A JP2012217682A JP6011214B2 JP 6011214 B2 JP6011214 B2 JP 6011214B2 JP 2012217682 A JP2012217682 A JP 2012217682A JP 2012217682 A JP2012217682 A JP 2012217682A JP 6011214 B2 JP6011214 B2 JP 6011214B2
Authority
JP
Japan
Prior art keywords
character
image processing
processing system
operation unit
display operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012217682A
Other languages
English (en)
Other versions
JP2014071697A (ja
Inventor
恒彦 荒木
恒彦 荒木
勇樹 谷保
勇樹 谷保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2012217682A priority Critical patent/JP6011214B2/ja
Priority to EP13177487.9A priority patent/EP2713312A3/en
Publication of JP2014071697A publication Critical patent/JP2014071697A/ja
Application granted granted Critical
Publication of JP6011214B2 publication Critical patent/JP6011214B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、入力画像から文字情報を取得する画像処理システムおよび画像処理方法に関する。
FA(Factory Automation)分野などにおいては、製造過程の半製品や出荷前の製品などに生じる欠陥を光学的に検出したり、その大きさを光学的に計測したりする装置として、いわゆる視覚センサが実用化されている。
このような視覚センサの利用形態の一つとして、対象物を撮像することで得られる入力画像に対して文字認識を実行することで、入力画像から文字情報を取得する形態がある。このような文字認識は、入力画像内の部分画像と予め定められた文字のイメージや特徴量との一致度合いなどを算出して文字を認識(特定)する。
このような文字認識処理の一例として、特開平02−072497号公報(特許文献1)は、読取フィールド内に記録された文字について、フォーマットコントロールデータに基づいて読取処理を行う光学的文字読取装置を開示する。このフォーマットコントロールデータには、読取フィールドの位置、記録される文字の文字種、文字フォント、文字ピッチ等の情報が含まれており、このようなフォーマットコントロールデータを用いることで、読み取り精度を高めることができる。
また、特開平06−036069号公報(特許文献2)は、書式制御情報の字種の指定に正規表現を使用することにより詳細な指定を可能にして、認識率を向上させる文字認識装置を開示する。
これらの先行技術文献によれば、書式制御情報(フォーマットコントロールデータ)を予め指定することで、認識率を向上させる技術が開示されている。
特開平02−072497号公報 特開平06−036069号公報
上述のように書式制御情報を設定する際には、その入力規則をユーザが知っておく必要がある。現実的には、ヘルプ画面やマニュアルに入力規則を記載しておき、ユーザは、これらを参照しながら書式制御情報を入力することになる。
しかしながら、表示画面が比較的狭い場合などには、ヘルプ画面を表示するための領域を十分に確保することができないことがある。また、ユーザが紙ベースのマニュアルを参照しながら、書式制御情報を入力することは煩わしい。さらに、入力規則に不慣れなユーザは、書式制御情報の入力に時間を要してしまう。
本発明は、このような課題を解決するためのものであり、その目的は、入力規則などを知らないユーザであっても、文字認識に用いられる制約条件を容易に設定することのできるユーザインターフェイスを備えた画像処理システムおよび画像処理方法を提供することである。
本発明のある局面によれば、入力画像から文字情報を取得する画像処理システムが提供される。画像処理システムは、予め定められた制約条件の下で、入力画像に含まれる領域に対して文字認識を実行する処理部と、制約条件の設定を受付ける表示操作部とを含む。制約条件は、認識対象の文字別に、少なくとも文字種別の指定を含む。表示操作部は、設定されている制約条件を示す領域と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトとを並べて表示するとともに、いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別を制約条件に追加する。
好ましくは、制約条件は、各文字種別に対応付けられた記号を用いて表示され、オブジェクトの各々では、関連付けられた文字種別を示すメッセージとともに、当該文字種別に対応する記号が表示される。
好ましくは、制約条件は、特定文字の指定をさらに含み、表示操作部は、指定可能な特定文字に関連付けられたオブジェクトをさらに表示する。
さらに好ましくは、表示操作部は、表示切替が選択されると、文字種別に関連付けられたオブジェクトに代えて、指定可能な複数の特定文字にそれぞれ関連付けられた複数のオブジェクトを、予め定められた配列に従って配置した状態で表示する。
好ましくは、表示操作部は、認識対象の文字列を含む参照画像に対して文字認識を実行することで取得される文字情報から文字別の文字種別を決定し、制約条件の初期値として設定する。
さらに好ましくは、表示操作部は、設定されている制約条件とともに、参照画像を表示する。
本発明のある局面によれば、入力画像から文字情報を取得する画像処理方法が提供される。画像処理方法は、文字認識に係る制約条件の設定を受付けるための画面を提示するステップと、設定された制約条件の下で、入力画像に含まれる領域に対して文字認識を実行するステップとを含む。制約条件は、認識対象の文字別に、少なくとも文字種別の指定を含む。画面を提示するステップは、設定されている制約条件を示す領域と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトとを並べて表示するステップと、いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別を制約条件に追加するステップとを含む。
本発明によれば、入力規則などを知らないユーザであっても、文字認識に用いられる制約条件を容易に設定できる。
本実施の形態に係る画像処理システムの全体構成を示す外観図である。 本実施の形態に係る画像処理システムの機能的構成を示す模式図である。 本実施の形態に係る画像処理システムにおける文字認識の処理内容を示す模式図である。 本実施の形態に係る画像処理システムが提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す模式図である。 本実施の形態に係る画像処理システムが提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す模式図である。 本実施の形態に係る画像処理システムにおいて入力画像から文字情報を取得する画像処理方法に係る処理手順を示すフローチャートである。 本実施の形態の変形例に係る画像処理システムにおける文字フォーマットの設定処理を説明する概念図である。 本実施の形態の変形例に係る画像処理システムが提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す模式図である。
本発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰返さない。
[A.画像処理システムの装置構成]
まず、本実施の形態に係る画像処理システムの装置構成について説明する。図1は、本実施の形態に係る画像処理システム1の全体構成を示す外観図である。図2は、本実施の形態に係る画像処理システム1の機能的構成を示す模式図である。
図1を参照して、本実施の形態に係る画像処理システム1は、例えば、生産ラインなどに組込まれる。図1に示す画像処理システム1は、その一つの機能として、入力画像から文字情報を取得する。より具体的には、視覚センサ200は、対象物(後述の「ワーク2」)を撮像することで得られる入力画像に対して文字認識を実行することで、入力画像から文字情報を取得する機能を有する。特に、視覚センサ200は、予め定められた制約条件の下で、文字認識を実行する。この文字認識の結果として、テキストデータを出力するようにしてもよい。
本明細書において、「制約条件」は、文字認識の実行にあたって、認識候補をより限定するための条件であり、以下では「文字フォーマット」とも記す。典型的には、制約条件(文字フォーマット)は、認識対象の文字別に文字種別の指定(英数字、英文字、数字文字、記号文字、特殊文字、漢字、ひらがな、カタカナなど)、特定文字の指定(アルファベットの各文字「A」,「B」,…、記号の各文字「’」,「−」,…、ひらがなの各文字「あ」,「い」,…、カタカナの各文字「ア」,「イ」,…)、フォント種別の指定、文字サイズ(フォントサイズ)の指定などを含む。このような文字フォーマットを予め指定することで、印字形式が予め定められているワーク(製品/半製品)などに対する認識率を向上(誤認識率を低下)させることができる。
例えば、「英文字」、「英文字」、「数字」の順に文字フォーマットが指定されていれば、入力画像中の複数の文字列を含む文字領域に対して、1文字目は、「英文字」に属する文字候補から最も一致度の高いものが選択され、2文字目は、「英文字」に属する文字候補から最も一致度の高いものが選択され、3文字目は、「数字」に属する文字候補から最も一致度の高いものが選択される。このような制約条件、すなわち文字認識の対象を限定することで、処理を高速化するとともに、認識率を向上させることができる。なお、文字フォーマットの詳細については後述する。
なお、視覚センサ200において実行される文字認識は、入力画像に含まれる文字領域を読み取ってその内容を示すテキストデータを出力する処理に加えて、文字フォーマットに含まれる特定文字との一致度が高く、かつ指定された文字種別での認識確度が高い領域を抽出する処理を含む。すなわち、後者の処理では、指定された文字フォーマットとの一致度が高い1つ以上領域を入力画像から抽出する。
より具体的には、画像処理システム1は、視覚センサ200と表示操作部201とを含む。視覚センサ200と表示操作部201との間は、伝送ケーブル202を介して、所定のプロトコルに従って通信可能に構成されている。
表示操作部201は、上記の文字フォーマットの設定を受付けるとともに、視覚センサ200により撮像された入力画像や処理結果などを表示する。すなわち、ユーザは、表示操作部201を操作して、文字フォーマットなどの処理に係る情報を送信することにより、視覚センサ200での画像処理や撮像処理を制御する。図1には、表示操作部201に1台の視覚センサ200が接続されている例を示すが、伝送ケーブル202および図示しないハブとを介して、表示操作部201に複数の視覚センサ200が接続されるようにしてもよい。
図1に示す画像処理システム1では、入力画像を取得する機能および入力画像に対して文字認識を実行する機能が視覚センサ200に実装され、文字認識の実行に必要な各種パラメータを指定する機能および文字認識の結果を表示する機能が表示操作部201に実装される例を示すが、この構成に限られるものではない。例えば、すべての機能を単体の画像処理装置に実装してもよいし、各機能を別々の装置に実装してもよい。あるいは、対象物を撮像して入力画像を取得する機能を撮像装置に実装し、残りの機能を画像処理装置に実装するようにしてもよい。本願発明の技術的範囲は、特許請求の範囲に記載された構成を有するものであれば、いずれの実装形態も含まれ得る。
視覚センサ200は、IOケーブル203を介して、PLC(Programmable Logic Controller)250と通信可能に接続されている。PLC250は、他の装置からの信号を受信したり、当該他の装置に信号を送信したりすることによって、画像処理システム1の全体を制御する。
視覚センサ200は、撮像部212および処理部213を含み、撮像部212は、照明部211および撮像レンズ221を含む。処理部213は、マイクロコンピュータを内蔵する。視覚センサ200の筐体には、視覚センサ200を図示しない支持部材に取付けるための取付部214が設けられる。
表示操作部201は、LCD(Liquid Crystal Display)や有機EL(Organic Electro-Luminescence)などのディスプレイと、指やスタイラスでディスプレイに触れることで指示を受付けるための検出部とが一体的に構成されたタッチパネル204を有する。
表示操作部201は、ユーザが設定した文字フォーマット300を視覚センサ200へ送信し、視覚センサ200は、対象物を撮像することで取得された入力画像、および当該取得した入力画像310に対して文字認識を実行することで得られた文字認識の結果を含む処理結果320を表示操作部201へ送信する。
次に、図2を参照して、視覚センサ200および表示操作部201の機能的構成について説明する。
視覚センサ200は、対象物であるワーク2を照明する照明部211と、ワーク2を撮像するための撮像部212と、処理部213とを含む。照明部211は、照明用レンズ224と光源であるLED(Light Emitting Diode)225とを有する照明制御システム223を含む。撮像部212は、撮像レンズ221および撮像素子222を含む。
処理部213は、図示されないランプなどの表示灯(インジケータ)を制御する表示灯制御部227と、視覚センサ200の各種処理を実行するCPU226と、各部に電力を供給する電源部228と、伝送ケーブル202に接続される通信システム229と、外部機器との間で入出力データを遣り取りする入出力システム230と、文字フォーマット300および文字認識データベース330に加えて、入力画像や処理結果などの各種データを格納するためのメモリ231とを含む。文字認識データベース330は、文字認識を行うための各文字に関する情報(パターンや特徴量)を含む。
表示操作部201は、各部に電力を供給する電源部240と、外部から指示を受付けるための検出部241およびディスプレイ242からなるタッチパネル204と、ディスプレイ242での表示を制御する表示ドライバ243と、表示ドライバ243を介してディスプレイ242に表示される画像を制御する表示制御部244と、画像を格納する画像保存部245と、視覚センサ200から受信した画像を取扱う画像制御部246と、視覚センサ200との間でデータを遣り取りする伝送部247とを含む。
表示操作部201は、視覚センサ200に対して着脱自在に構成されており、典型的な使用形態として、製造現場などにおいて製造ラインを巡回するユーザが携帯可能なように小型化されている。そのため、表示操作部201のディスプレイ242のサイズも小さくなっている。
ディスプレイ242は、表示ドライバ243からの制御信号に基づいて、画像を表示する。表示ドライバ243は、表示制御部244からの画像信号に基づいて、ディスプレイ242の表示処理を制御するための制御信号を生成し、ディスプレイ242に出力する。
表示制御部244は、検出部241を介したユーザからの指示、画像制御部246から提供される画面情報、伝送部247を介して視覚センサ200から提供される入力画像や処理結果などに基づいて、ユーザインターフェイス画面を生成し、表示ドライバ243を介してディスプレイ242上に表示する。
また、表示制御部244は、検出部241を介したユーザからの指示に基づいて設定される文字フォーマットなどのパラメータを、伝送部247を介して視覚センサ200へ送信する。
図2に示す機能構成は、プロセッサがプログラムを実行することで実現されてもよい。あるいは、視覚センサ200および/または表示操作部201の主たる処理回路およびその周辺回路を含めて、ASIC(Application Specific Integrated Circuit)などの専用集積回路を用いて実現してもよい。
[B.文字フォーマット]
次に、画像処理システム1で扱う文字フォーマットについて説明する。本実施の形態に係る画像処理システム1では、文字フォーマットの一例として、「数字文字」、「英字文字」、「英数字」、「記号文字」といった文字種別を指定できる。これらの文字種別は、認識対象の文字別に指定可能になっている。
「数字文字」は、数字文字「0」,「1」,…,「9」(認識対象:「0」〜「9」)を指定する。画像処理システム1においては、「数字文字」は記号「#」で示されるとする。
「英字文字」は、英文字「A」,「B」,…,「Z」(認識対象:「A」〜「Z」)を指定する。画像処理システム1においては、「英字文字」は記号「$」で示されるとする。なお、「英字文字」として、大文字/小文字を区別するようにしてもよい。このとき、大文字および小文字のそれぞれをより細分化された文字種別としてもよい。例えば、文字種別としては、「英数大文字」および「英数小文字」といった具合である。
「英数字」は、「数字文字」および「英字文字」を包含する文字種別(認識対象:記号文字以外のすべての文字)である。画像処理システム1においては、「数字文字」は記号「?」で示されるとする。
「記号文字」は、記号文字「’」(アポストロフィー),「−」(ハイフン),「.」(ピリオド),「:」(コロン),「/」(スラッシュ)(認識対象:「’」「−」「.」「:」「/」)を指定する。画像処理システム1においては、「記号文字」は記号「@」で示されるとする。
このようなワイルドカード(「#」,「?」,「@」)を指定することで、例えば、0(ゼロ)とO(オー)との間での誤認識などを防止できる。
また、画像処理システム1では、上述の文字種別に加えて、特定文字の指定が可能になっている。特定文字とは、認識可能な文字から選択された1つの文字を意味し、数字文字「0」,「1」,…,「9」、英文字「A」,「B」,…,「Z」、および記号文字「’」,「−」,「.」,「:」,「/」のうち、いずれか1つが選択される。この特定文字が指定された場合には、認識対象の部分画像との間で、指定された特定文字との間についてのみ、類似度の算出処理や安定度の判定処理が実行される。そして、対象の部分画像が指定された特定文字と一致しているか否かが判断される。
これらの文字種別や特定文字の指定に加えて、文字認識の対象から除外する文字属性を指定することもできる。文字認識の対象外になる文字は記号「*」で示されるとし、スキップを意味する。スキップ属性が指定された場合には、類似度の算出処理や安定度の判定処理がスキップされる。このとき、検出文字数からも除外されるようにしてもよい。このようなスキップ属性を指定することで、誤認識し易い文字などを対象から除外することができ、文字認識処理をより安定的に実行できる。
[C.文字認識処理]
次に、上述の文字フォーマットを用いた文字認識処理について説明する。図3は、本実施の形態に係る画像処理システム1における文字認識の処理内容を示す模式図である。
図3を参照して、視覚センサ200では、対象物を撮像することで得られる入力画像310から文字領域312が抽出される。この文字領域312は、入力画像310に対してエッジ抽出処理や特徴量抽出処理などによって特定される。さらに、文字領域312に含まれる各文字の領域(部分画像)が抽出される。この各文字のイメージに対応する領域(部分画像)の抽出処理は、公知の技術を採用できるので、ここではその詳細な説明は行わない。
続いて、視覚センサ200は、各文字の領域に対して文字認識を実行する。この文字認識について、文字認識データベース330が予め用意されている。文字認識データベース330は、典型的には、文字毎にそれを特定するための識別情報(パターンや特徴量)を含む。文字認識データベース330に格納される各文字について、対応する文字種別が付加されている。すなわち、数字文字「0」,「1」,…,「9」については、文字種別が「数字文字」であり、英文字「A」,「B」,…,「Z」については、文字種別が「英文字」であることが情報として付加されている。
図3は文字認識の処理の典型例を示すものであり、本発明において、文字認識処理の実装としては、任意の方法を採用できる。
視覚センサ200は、文字フォーマット300の下で、文字認識データベース330を参照して各文字の領域(部分画像)に対応する文字を特定する。図3に示す文字フォーマット300では、「$$$@###」が指定されている。なお、文字フォーマット300の記述方式は、図3に示すものに限られることなく、任意の記述方式を採用できる。
図3に示す文字フォーマットは、左から第1〜3番目の文字が「英字文字」であり、第4番目の文字が「記号文字」であり、第5〜7番目の文字が「数字文字」であることを示す。そのため、視覚センサ200は、文字領域312に含まれる第1〜3番目の各文字について、文字認識データベース330に含まれる英字文字の各文字を候補として、一致度を算出する。すなわち、視覚センサ200は、まず、文字領域312に含まれる第1番目の文字と英文字「A」,「B」,…,「Z」との間で一致度をそれぞれ算出する。そして、(基本的には)文字候補のうち最も一致度の高いものを認識結果として出力する。以下、視覚センサ200は、文字領域312に含まれる第2番目以降の各文字について、同様の処理を繰返す。
このような文字フォーマット300を用いることで、図3に示す例では、文字領域312の第2番目に「I(アイ)」があり、文字領域312の第3番目に「O(オー)」があるが、これらをそれぞれ「1(いち)」および「0(ゼロ)」と誤って認識することを防止できる。同様に、図3に示す例では、文字領域312の第5番目に「1(いち)」があり、文字領域312の第7番目に「0(ゼロ)」があるが、これらをそれぞれ「I(アイ)」および「O(オー)」と誤って認識することを防止できる。
例えば、商品の型番、価格、製造年月日、識別番号などは、その印字フォーマットが予め定まっている場合が多いので、このような文字フォーマットを容易に適用することができ、これによって認識率を向上(誤認識率を低下)させることができる。
上述したように、文字フォーマット300としては、特定文字を指定することもできる。特定文字を指定した場合には、一種のパターンマッチング処理が実行される。すなわち、図3に示す例において、文字フォーマット300として、例えば、「$$$:###」が指定されると、文字領域312に含まれる第4番目の文字と「:」(コロン)との間の一致度が算出され、その算出された一致度が予め定められた値より高い場合に限って有効な認識結果として出力される。そのため、文字領域312に含まれる第4番目の文字が「:」(コロン)として認識されるもののみが抽出されることになる。この場合には、入力画像310から複数の文字領域312が抽出されることもある。
[D.文字フォーマット設定]
次に、上述の文字フォーマットを設定するためのユーザインターフェイスについて説明する。本実施の形態に係る画像処理システム1は、動作モードとして、文字認識処理を含む計測処理に係る各種パラメータを調整するための調整モードと、実際に計測処理を実行する運転モードとを含む。以下に示すユーザインターフェイス画面は、基本的には、調整モードにおいて表示されるが、運転モードにおいて表示してもよい。
図4および図5は、本実施の形態に係る画像処理システム1が提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す模式図である。図4および図5に示すユーザインターフェイス画面400A,400Bは、表示操作部201において提供される。
図4に示すユーザインターフェイス画面400Aにおいて、設定されている文字フォーマットを示す表示領域402と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクト410とが並べて、すなわち同一画面内に表示されている。図4に示す例では、現在指定されている文字フォーマットが表示領域402に表示されており、ユーザがオブジェクト410のうちいずれかを選択すると、当該選択されたオブジェクトに対応する文字フォーマットが追加される。すなわち、表示操作部201は、いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別を文字フォーマットに追加する。
より具体的には、複数のオブジェクト410は、「数字文字」を指定するオブジェクト411と、「数字文字」を指定するオブジェクト412と、「英字文字」を指定するオブジェクト413と、「記号文字」を指定するオブジェクト414と、「スキップ属性」を指定するオブジェクト415とを含む。典型的には、表示操作部201は、タッチパネル204を有しており、ユーザは、タッチパネル204上に表示されるユーザインターフェイス画面400A上の目的のオブジェクトを選択することで、目的の文字フォーマットを設定する。
表示領域402には、設定されている文字フォーマットが各文字種別に対応付けられた記号を用いて表示されている。すなわち、記号「#」、「$」、「@」といった記号で文字フォーマットが既定される。このような記号の意味が一見して把握できるように、図4に示すユーザインターフェイス画面400Aのオブジェクト410を構成するオブジェクト411〜415の各々では、関連付けられた文字種別を示すメッセージ(例えば、「英数字」や「数字文字」といった表示)とともに、当該文字種別に対応する記号(例えば、「?」や「#」といった記号)が表示される。
このように、オブジェクト410(オブジェクト411〜415)には、関連付けられた文字種別の意味を一見して把握できるようにメッセージが付加されており、さらに対応する文字種別を示す記号も併せて付加されているので、ユーザは、各記号の意味を予め知っておかなくても、表示領域402に表示される設定中の文字フォーマットの内容を容易に把握することができる。
また、ユーザインターフェイス画面400Aにおいて、指定可能な特定文字に関連付けられた複数のオブジェクト420も並べて表示されている。特に、ユーザインターフェイス画面400Aにおいては、使用頻度が高いと考えられる記号文字に関連付けられるオブジェクト421〜425が配置されている。すなわち、複数のオブジェクト420は、「’」に関連付けられたオブジェクト421と、「−」に関連付けられたオブジェクト422と、「.」に関連付けられたオブジェクト423と、「:」に関連付けられたオブジェクト424と、「/」に関連付けられたオブジェクト425とを含む。これらのオブジェクト420(オブジェクト421〜425)についても、ユーザの選択に応じて、文字フォーマットに追加される。
ユーザインターフェイス画面400Aでは、設定されている文字フォーマットを編集するためのオブジェクトも表示されている。例えば、バックスペース操作(カーソルの直前の文字を消去する操作)に関連付けられたオブジェクト404と、クリア操作(設定されている文字フォーマットを全消去する操作)に関連付けられたオブジェクト406と、カーソルを移動させる操作に関連付けられたオブジェクト408とが配置されている。
ユーザインターフェイス画面400Aに配置されている「OK」と表示されたオブジェクト450が選択されると、設定中の文字フォーマットが有効化され、「キャンセル」と表示されたオブジェクト452が選択されると、設定中の文字フォーマットが破棄されるとともに、図示しないメニュー画面へ遷移する。
また、特定文字を個別に指定する必要がある場合には、ユーザはオブジェクト430を選択する。これによって、図4に示すユーザインターフェイス画面400Aは、図5に示すユーザインターフェイス画面400Bへ遷移する。
図5を参照して、ユーザインターフェイス画面400Bは、ユーザインターフェイス画面400Aにおいて、オブジェクト410および420に代えて、オブジェクト440を配置したものに相当する。オブジェクト440は、指定可能な特定文字を所定規則で配置したものであり、図5に示す例では、QWERT式で数字およびアルファベットが配置されている例を示す。このような配列順に限られず、アルファベット順や他の配列順を採用してもよい。ユーザは、ユーザインターフェイス画面400Bを用いて、所望の特定文字を文字フォーマットとして設定することができる。
このように、図4に示すユーザインターフェイス画面400Aにおいて、表示切替を指示するオブジェクト430が選択されると、図5のユーザインターフェイス画面400Bに示すように、表示操作部201は、文字種別に関連付けられたオブジェクト(オブジェクト410および420)に代えて、指定可能な複数の特定文字にそれぞれ関連付けられた複数のオブジェクト440を予め定められた配列に従って配置した状態で表示する。
図4および図5に示すユーザインターフェイス画面を採用することで、文字フォーマットについて知識の無いユーザであっても、容易に文字フォーマットとして文字種別などを指定することができる。
[E.処理手順]
次に、本実施の形態に係る画像処理システム1において入力画像から文字情報を取得する画像処理方法に係る処理手順について説明する。図6は、本実施の形態に係る画像処理システム1において入力画像から文字情報を取得する画像処理方法に係る処理手順を示すフローチャートである。図6に示す処理手順の当初は調整モードが選択されているとする。
図6を参照して、表示操作部201は、文字フォーマットの設定がユーザから要求されたか否かを判断する(ステップS100)。文字フォーマットの設定がユーザから要求されていなければ(ステップS100においてNOの場合)、表示操作部201は、ユーザが要求した処理を実行する(ステップS102)。そして、ステップS100以下の処理が繰返される。
文字フォーマットの設定がユーザから要求されると(ステップS100においてYESの場合)、表示操作部201は、文字フォーマットを設定するためのユーザインターフェイス画面400A(図4)をタッチパネル204上で提示する(ステップS104)。すなわち、表示操作部201は、文字認識に係る文字フォーマットの設定を受付けるための画面を提示する処理を実行する。このとき、表示操作部201は、ユーザインターフェイス画面400Aにおいて、設定されている文字フォーマットを示す表示領域402と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクト410とを並べて表示する。
続いて、表示操作部201は、タッチパネル204に対してタッチ操作がなされたか否かを判断する(ステップS106)。タッチパネル204に対してタッチ操作がなされていなければ(ステップS106においてNO)、ステップS106の処理が繰返される。
タッチパネル204に対してタッチ操作がなされると(ステップS106においてYES)、表示操作部201は、いずれのオブジェクトの位置がタッチされたか否かを判断する(ステップS108)。
オブジェクト410(オブジェクト411〜415)のいずれかがタッチされた場合(ステップS108において「文字種別オブジェクト」)には、表示操作部201は、タッチされたオブジェクトに関連付けられた文字種別を現在指定されている文字フォーマットに追加する(ステップS110)とともに、その追加後の文字フォーマットを表示領域402に表示する(ステップS112)。すなわち、表示操作部201は、いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別を文字フォーマットに追加する処理を実行する。そして、ステップS108以下の処理が再度実行される。
オブジェクト420(オブジェクト421〜425)のいずれかがタッチされた場合(ステップS108において「記号文字オブジェクト」)には、表示操作部201は、タッチされたオブジェクトに関連付けられた記号文字を現在指定されている文字フォーマットに追加する(ステップS114)とともに、その追加後の文字フォーマットを表示領域402に表示する(ステップS116)。そして、ステップS108以下の処理が再度実行される。
オブジェクト430がタッチされた場合(ステップS108において「表示切替オブジェクト」)には、表示操作部201は、ユーザインターフェイス画面400Aに代えて、図5のユーザインターフェイス画面400Bをタッチパネル204上で提示する(ステップS118)。そして、ステップS108以下の処理が再度実行される。
その他のオブジェクトがタッチされた場合(ステップS108において「その他オブジェクト」)には、表示操作部201は、タッチされたオブジェクトに関連付けられた処理を実行する(ステップS120)。そして、ステップS108以下の処理が再度実行される。
「キャンセル」を示すオブジェクト452がタッチされた場合(ステップS108において「キャンセルオブジェクト」)には、表示操作部201は、現在設定中の文字フォーマットを破棄し(ステップS122)、ステップS126以下の処理を実行する。
「OK」を示すオブジェクト450がタッチされた場合(ステップS108において「OKオブジェクト」)には、表示操作部201は、現在設定中の文字フォーマットを有効化し(ステップS124)、ステップS126以下の処理を実行する。
ステップS126において、表示操作部201は、運転モードの開始が指示されたか否かを判断する(ステップS126)。運転モードの開始が指示されていなければ(ステップS126においてNOの場合)、ステップS100以下の処理が実行される。
運転モードの開始が指示されると(ステップS126においてYESの場合)、現在設定されている文字フォーマットの下、文字認識が開始される(ステップS128)。すなわち、表示操作部201は、設定された文字フォーマットを視覚センサ200へ送信するとともに、視覚センサ200は、予め定められたトリガー条件に応じて、対象物を撮像して入力画像を取得するとともに、取得した入力画像に対して文字認識を実行する。言い換えれば、視覚センサ200は、設定された文字フォーマットの下で、入力画像に含まれる領域に対して文字認識を実行する。
そして、表示操作部201は、運転モードの停止が指示されたか否かを判断する(ステップS130)。運転モードの停止が指示されていなければ(ステップS130においてNOの場合)、ステップS128以下の処理が実行される。運転モードの停止が指示されると(ステップS130においてYESの場合)、ステップS100以下の処理が実行される。
[F.変形例]
上述の実施の形態においては、ユーザが文字フォーマットを手動で設定する例について説明したが、ティーチング処理などにおいて、基準となる入力画像から読み取った文字情報に基づいて、文字フォーマットの設定を支援するようにしてもよい。以下、入力画像から取得された文字情報に基づいて、文字フォーマットの設定を支援する構成について例示する。
図7は、本実施の形態の変形例に係る画像処理システム1における文字フォーマットの設定処理を説明する概念図である。図7(a)を参照して、まず、ユーザは、検出対象となる基準の対象物を撮像して入力画像を取得し、この取得した入力画像に対して、検出対象の文字列が存在する領域460を指定する。この領域460の指定に応答して、視覚センサ200が文字認識を実行する。そして、この文字認識によって取得された文字情報に基づいて、各文字の文字種別を判断し、この判断された文字別の文字種別が文字フォーマットの初期値として設定される。
図7(a)に示すユーザインターフェイス画面400Cにおいて、文字認識の基準となる対象物を撮像して得られる画像が表示されるとともに、ユーザがタッチ操作などで、検出対象の文字列が存在する領域を指定する。そして、「OK」ボタンが選択されると、図7(b)に示すユーザインターフェイス画面400Aが表示される。このユーザインターフェイス画面400Aの表示領域402には、文字認識の結果(この例では、「|01|08699783090012」であるとする)から、18文字から構成されており、第1番目および第4番目が記号文字であり、その他の文字が数字文字であると判断される。そして、文字フォーマットの初期値として、左から第1番目および第4番目の文字が「記号文字」を示す記号「@」であり、その他の文字が「数字文字」を示す記号「#」が設定される。
本変形例では、表示操作部201は、認識対象の文字列を含む参照画像に対して文字認識を実行することで取得される文字情報から文字別の文字種別を決定し、文字フォーマットの初期値として設定する。このような支援機能によって、ユーザは、より容易に文字フォーマットを設定することができる。
さらに、初期値として設定された文字フォーマットを修正/編集する際には、検出対象の文字列が存在する領域460の画像を併せて表示する方がより好ましい場合もある。その場合には、文字フォーマットを修正/編集するユーザインターフェイス画面において、検出対象の文字列が存在する領域460の画像を併せて表示してもよい。
図8は、本実施の形態の変形例に係る画像処理システム1が提供する文字フォーマットを設定するためのユーザインターフェイス画面の一例を示す模式図である。図8を参照して、ユーザインターフェイス画面400Dにおいては、図4に示すユーザインターフェイス画面400Aに比較して、検出対象となる基準の対象物を撮像して取得した入力画像に対して設定された領域460のイメージが同一画面内に追加的に表示されているとともに、領域460のイメージに対して文字認識した結果を示す文字列470が追加的に表示されている。ユーザは、これらの表示情報を参照しつつ、文字フォーマットを修正/編集する。このように、表示操作部201は、設定されている文字フォーマットとともに、参照画像を表示する。
[G.利点]
本実施の形態によれば、文字フォーマットについて知識の無いユーザであっても、容易に制約条件としての文字フォーマットを指定できる。また、本実施の形態によれば、文字フォーマットの入力規則をユーザに通知するためのヘルプ画面やマニュアルを提示するスペースのない比較的小さなディスプレイ(あるいは、解像度がそれほど高くないディスプレイ)を採用した場合であっても、これらを必要とすることなく、ユーザは、入力規則および現在設定されている文字フォーマットの内容を一見して把握できる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 画像処理システム、2 ワーク、200 視覚センサ、201 表示操作部、202 伝送ケーブル、203 IOケーブル、204 タッチパネル、211 照明部、212 撮像部、213 処理部、214 取付部、221 撮像レンズ、222 撮像素子、223 照明制御システム、224 照明用レンズ、226 CPU、227 表示灯制御部、228,240 電源部、229 通信システム、230 入出力システム、231 メモリ、241 検出部、242 ディスプレイ、243 表示ドライバ、244 表示制御部、245 画像保存部、246 画像制御部、247 伝送部、250 PLC、300 文字フォーマット、310 入力画像、312 文字領域、320 処理結果、330 文字認識データベース。

Claims (7)

  1. 入力画像から文字情報を取得する画像処理システムであって、
    予め定められた制約条件の下で、前記入力画像に含まれる領域に対して文字認識を実行する処理部と、
    前記制約条件の設定を受付ける表示操作部とを備え、
    前記制約条件は、認識対象の文字別に、少なくとも文字種別の指定を含み、
    前記表示操作部は、設定されている制約条件を示す領域と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトとを並べて表示するとともに、いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別を制約条件に追加する、画像処理システム。
  2. 前記制約条件は、各文字種別に対応付けられた記号を用いて表示され、
    前記オブジェクトの各々では、関連付けられた文字種別を示すメッセージとともに、当該文字種別に対応する記号が表示される、請求項1に記載の画像処理システム。
  3. 前記制約条件は、特定文字の指定をさらに含み、
    前記表示操作部は、指定可能な特定文字に関連付けられたオブジェクトをさらに表示する、請求項1または2に記載の画像処理システム。
  4. 前記表示操作部は、表示切替が選択されると、文字種別に関連付けられたオブジェクトに代えて、指定可能な複数の特定文字にそれぞれ関連付けられた複数のオブジェクトを、予め定められた配列に従って配置した状態で表示する、請求項3に記載の画像処理システム。
  5. 前記表示操作部は、認識対象の文字列を含む参照画像に対して文字認識を実行することで取得される文字情報から文字別の文字種別を決定し、前記制約条件の初期値として設定する、請求項1〜4のいずれか1項に記載の画像処理システム。
  6. 前記表示操作部は、設定されている制約条件とともに、前記参照画像を表示する、請求項5に記載の画像処理システム。
  7. 入力画像から文字情報を取得する画像処理方法であって、
    文字認識に係る制約条件の設定を受付けるための画面を提示するステップと、
    設定された制約条件の下で、前記入力画像に含まれる領域に対して文字認識を実行するステップとを備え、
    前記制約条件は、認識対象の文字別に、少なくとも文字種別の指定を含み、
    前記画面を提示するステップは、
    設定されている制約条件を示す領域と、指定可能な複数の文字種別にそれぞれ関連付けられた複数のオブジェクトとを並べて表示するステップと、
    いずれかのオブジェクトが選択されると、選択されたオブジェクトに関連付けられた文字種別を制約条件に追加するステップとを含む、画像処理方法。
JP2012217682A 2012-09-28 2012-09-28 画像処理システムおよび画像処理方法 Active JP6011214B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012217682A JP6011214B2 (ja) 2012-09-28 2012-09-28 画像処理システムおよび画像処理方法
EP13177487.9A EP2713312A3 (en) 2012-09-28 2013-07-22 Image processing system and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012217682A JP6011214B2 (ja) 2012-09-28 2012-09-28 画像処理システムおよび画像処理方法

Publications (2)

Publication Number Publication Date
JP2014071697A JP2014071697A (ja) 2014-04-21
JP6011214B2 true JP6011214B2 (ja) 2016-10-19

Family

ID=48856515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012217682A Active JP6011214B2 (ja) 2012-09-28 2012-09-28 画像処理システムおよび画像処理方法

Country Status (2)

Country Link
EP (1) EP2713312A3 (ja)
JP (1) JP6011214B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7271987B2 (ja) * 2019-02-14 2023-05-12 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3988715A (en) * 1975-10-24 1976-10-26 International Business Machines Corporation Multi-channel recognition discriminator
JPS61100873A (ja) * 1984-10-23 1986-05-19 Fujitsu Ltd 光学文字/図形読み取り装置
JP2845457B2 (ja) 1988-09-08 1999-01-13 株式会社東芝 光学的文字読取装置
JPH0636069A (ja) * 1992-07-13 1994-02-10 Toshiba Corp 文字認識装置
US6401067B2 (en) * 1999-01-28 2002-06-04 International Business Machines Corporation System and method for providing user-directed constraints for handwriting recognition
JP4791641B2 (ja) * 2001-03-15 2011-10-12 株式会社リコー 候補文字出力装置、候補文字出力方法、プログラムおよびコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
EP2713312A3 (en) 2015-04-08
JP2014071697A (ja) 2014-04-21
EP2713312A2 (en) 2014-04-02

Similar Documents

Publication Publication Date Title
JP5831420B2 (ja) 画像処理装置および画像処理方法
JP6878034B2 (ja) 情報処理装置、制御方法、およびプログラム
US20080150908A1 (en) Image Printing Apparatus and Method for Setting a Printing Parameter Therein
JP5075997B2 (ja) 電子機器、プログラムおよび文字列認識方法
JP2009230498A (ja) 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム
US12118203B2 (en) Ink data generation apparatus, method, and program
JP6102156B2 (ja) 画像処理システムおよび画像処理方法
JP2018025885A (ja) 画像処理装置
JP6011214B2 (ja) 画像処理システムおよび画像処理方法
JP5229102B2 (ja) 帳票検索装置、帳票検索プログラムおよび帳票検索方法
CN107534710B (zh) 电子设备以及标记处理方法
US11100318B2 (en) Information processing apparatus and non-transitory computer readable medium
JP7241506B2 (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
US9152885B2 (en) Image processing apparatus that groups objects within image
JP2011197744A (ja) 情報処理装置、プログラム、記録媒体および情報処理システム
JP2008257530A (ja) 電子ペン入力データ処理システム
JP4543741B2 (ja) グラフ作成装置、プログラムおよび記録媒体
JP7247568B2 (ja) プログラム及び入力様式設定方法
US12094233B2 (en) Information processing apparatus and non-transitory computer readable medium
JP4693825B2 (ja) 情報処理装置およびプログラム
JP7551197B1 (ja) 文字列読取方法、文字列読取装置及びプログラム
US20240185628A1 (en) Client terminal, control method for client terminal, and storage medium
US20220178986A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2009176191A (ja) 画像形成システム,画像形成装置,端末装置,画像形成装置の特定方法及びプログラム
JP2024039177A (ja) 表示内容通知プログラム、表示内容通知装置、表示内容通知方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160905

R150 Certificate of patent or registration of utility model

Ref document number: 6011214

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150