JP7087971B2 - 画像処理装置、画像処理方法、および画像処理プログラム - Google Patents

画像処理装置、画像処理方法、および画像処理プログラム Download PDF

Info

Publication number
JP7087971B2
JP7087971B2 JP2018227561A JP2018227561A JP7087971B2 JP 7087971 B2 JP7087971 B2 JP 7087971B2 JP 2018227561 A JP2018227561 A JP 2018227561A JP 2018227561 A JP2018227561 A JP 2018227561A JP 7087971 B2 JP7087971 B2 JP 7087971B2
Authority
JP
Japan
Prior art keywords
category
image
model set
model
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018227561A
Other languages
English (en)
Other versions
JP2020091602A (ja
Inventor
秀典 ▲高▼木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2018227561A priority Critical patent/JP7087971B2/ja
Priority to CN201911029972.2A priority patent/CN111275138B/zh
Publication of JP2020091602A publication Critical patent/JP2020091602A/ja
Application granted granted Critical
Publication of JP7087971B2 publication Critical patent/JP7087971B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本開示は、像が属するカテゴリを決定する技術に関する。
カメラにより撮影された画像を取得し、当該画像に含まれる像(例えば、文字または部品の像等)が複数のカテゴリ(例えば、文字の場合数字における「0~9」および英字における「A~Z」等)のうち、いずれのカテゴリに属するのかを判定する画像処理装置がある。このような画像処理装置は、例えば生産工程を自動化する産業用の装置として導入されている。より具体的には、画像処理装置は、予め登録した複数のモデル(例えば、像の特徴量)に基づいて、当該像のカテゴリを決定する。
ここで、画像処理装置が像のカテゴリを決定する場合に、当該像と当該像が属すると決定されるべきカテゴリに予め登録された1または複数のモデルとの類似度が低い場合は、当該像が当該カテゴリに属するとは決定されないことがあった。対象の像が属する正しいカテゴリに決定して、認識の精度を向上させるために、類似度が低いと判断された像を当該カテゴリの新たなモデルとして登録する場合がある。
認識の精度を向上させる一例として、特開2009-193387号公報(特許文献1)は、文字認識装置は、ユーザ辞書に誤認識した文字を登録する。より具体的には、文字認識装置は、ユーザ辞書に登録した各文字について、ユーザが一連の文字列として認識することを期待する学習文字列を学習文字列テーブルに登録して、ユーザ辞書を用いた認識における誤認識を防止することを開示している。
特開2009-193387号公報
しかしながら、画像処理装置が新たなモデルを登録することで、新たなモデルを登録したカテゴリに属すると決定されるべき像の認識の精度が向上しても、新たなモデルを登録することで、他のカテゴリに属すると決定されるべき像における認識の精度が低下することがある。そのため、画像処理装置を使用するユーザは、各カテゴリの認識の精度が一定以上となるように試行錯誤を繰り返し、当該画像処理装置に登録するモデルの調整を行っていた。このような調整を行うと多くの時間が必要となる。また調整を行うユーザの経験の違いによって、調整後の認識の精度が異なることがあった。したがって、ユーザの経験によらず、モデルの変更の適否を判断できる情報をユーザに提供可能となる技術が必要とされている。
本開示は、係る実情に鑑み考え出されたものであり、モデルの変更の適否を判断できる情報をユーザに提供可能となる技術が開示される。
本開示の一例では、複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセットを格納する記憶部と、上記記憶部に格納された上記第1モデルセットを参照して、入力画像に含まれる像が上記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定する決定部と、対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出する算出部と、上記算出部が、上記第1モデルセットを対象として算出した上記第1モデルセットに含まれるカテゴリ毎の指標と、上記算出部が、上記第1モデルセットとは異なる第2モデルセットを対象として算出した上記第2モデルセットに含まれるカテゴリ毎の指標との間の差を含む情報を出力する出力部とを備える。
この開示によれば、画像処理装置は、モデルの変更の適否を判断できる情報をユーザに提供可能となる。
本開示の一例では、画像処理装置の上記出力部は、上記第1モデルセットに含まれるカテゴリ毎の指標と、上記第2モデルセットに含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間で指標が変化したカテゴリについて、他のカテゴリとは異なる表示態様となる情報を出力する。
この開示によれば、画像処理装置は、カテゴリ毎に差が生じた指標と差が生じていない指標とを異なる表示態様とする情報を出力可能となる。
本開示の一例では、画像処理装置は、上記入力画像に含まれる像の選択と、当該選択された像のカテゴリの設定とを受け付ける受付部と、上記選択された像に基づいてモデルを生成する生成部と、上記第1モデルセットの設定されたカテゴリに上記生成されたモデルを追加したものを上記第2モデルセットとする追加部とをさらに備える。
この開示によれば、画像処理装置は、既存のモデルセットに新たなモデルを追加した新規のモデルセットを容易に作成できる。
本開示の一例では、画像処理装置の上記出力部は、上記第2モデルセットに含まれるカテゴリ毎の指標のうちの上記指標の値が予め定められた値未満となる指標がある場合に、上記生成されたモデルの上記第1モデルセットへの追加を確定させるか否かの確認をユーザに促す情報を出力する。
この開示によれば、画像処理装置は、新たなモデルのモデルセットへの追加を確定させると、安定度が閾値以下となるカテゴリが発生することをユーザに対して通知できる。
本開示の一例では、画像処理装置の上記出力部は、上記第2モデルセットに含まれるカテゴリ毎の指標と、上記第1モデルセットに含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間での指標の値の変化が予め定められた値以上となる場合に、上記生成されたモデルの上記第1モデルセットへの追加を確定させるか否かの確認をユーザに促す情報を出力する。
この開示によれば、画像処理装置は、モデルセットへの新たなモデルの追加を確定させた場合に、少なくとも1つのカテゴリの安定度が、モデルの追加前と比べて一定値以上低下することをユーザに対して確実に通知できる。
本開示の一例では、画像処理装置の上記受付部は、上記第1モデルセットに含まれる上記モデルの選択を受け付け、上記選択されたモデルを削除する削除部をさらに備える。
この開示によれば、画像処理装置は、モデルの登録数が登録可能な上限に達した場合に、既に登録されたモデルを削除することで新たなモデルを追加可能となる。また、画像処理装置は、登録されたモデルが認識の精度を低下させている場合に、当該モデルを削除することで認識の精度を向上させることができる。
本開示の一例では、画像処理装置の上記算出部は、上記指標を、上記複数のカテゴリのうち条件に合致する属性を有する一部のカテゴリ内で算出する。
この開示によれば、画像処理装置は、文字認識を行う対象に限定して指標を算出するため、処理負荷を軽減でき、文字認識の対象となるカテゴリのみの指標の情報をユーザに提供できる。
本開示の一例では、画像処理装置の上記算出部は、上記選択されたカテゴリに属するモデルと、上記他のカテゴリに属するモデルとの類似度に基づいて、当該選択されたカテゴリの上記指標を算出する。
この開示によれば、画像処理装置は、像とモデルとの類似度に基づいて、像が属するカテゴリを正確に判定できる。
本開示の一例では、画像処理装置の上記記憶部は、属する上記カテゴリが予め決定されたレファレンスを格納し、上記算出部は、上記カテゴリに属するレファレンスと上記カテゴリに属する上記モデルとの類似度と、上記カテゴリに属する上記レファレンスと他のカテゴリに属する上記モデルとの類似度とに基づいて、当該カテゴリの上記指標を算出する。
この開示によれば、画像処理装置は、レファレンスを用いたモデルの類似度に基づいて、像が属するカテゴリを正確に判定できる。
本開示の一例では、入力画像に含まれる像は、文字の像である。
この開示によれば、画像処理装置は、文字の像におけるモデルの変更の適否を判断できる情報をユーザに提供可能となる。
本開示の一例では、画像処理方法は、記憶部に格納された複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセットを参照して、入力画像に含まれる像が上記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定するステップと、対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出するステップと、上記算出するステップが、上記第1モデルセットを対象として算出した上記第1モデルセットに含まれるカテゴリ毎の指標と、上記算出するステップが、上記第1モデルセットとは異なる第2モデルセットを対象として算出した上記第2モデルセットに含まれるカテゴリ毎の指標との間の差を含む情報を出力するステップとを含む。
この開示によれば、画像処理方法は、モデルの変更の適否を判断できる情報をユーザに提供可能となる。
本開示の一例では、画像処理プログラムは、コンピュータを画像処理装置として機能させるための画像処理プログラムであって、上記画像処理プログラムは上記コンピュータに、記憶部に格納された複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセットを参照して、入力画像に含まれる像が上記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定するステップと、対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出するステップと、上記算出するステップが、上記第1モデルセットを対象として算出した上記第1モデルセットに含まれるカテゴリ毎の指標と、上記算出するステップが、上記第1モデルセットとは異なる第2モデルセットを対象として算出した上記第2モデルセットに含まれるカテゴリ毎の指標との間の差を含む情報を出力するステップとを実行させる。
この開示によれば、画像処理プログラムは、モデルの変更の適否を判断できる情報をユーザに提供可能となる。
本開示によれば、ある局面において、モデルの変更の適否を判断できる情報をユーザに提供可能となる。
画像処理装置100の構成例について説明する図である。 モデルを追加する前と追加した後の指標の変化について説明する図である。 画像処理システム1の構成例を示す図である。 画像処理装置100のハードウェア構成例を説明する図である。 辞書データ115の構成例を表わす図である。 画像処理装置100において実行される文字認識処理の機能ブロック図である。 表示部140に表示される各像の識別結果について説明する図である。 類似度と安定度との関係について表わす図である。 第1安定度画像610の具体例を表わす図である。 第1安定度画像610と、第2安定度画像620とを切替えて表示することについて説明する図である。 像の識別情報を出力する処理について説明するフローチャートである。 差を含む情報を出力する処理について説明するフローチャートである。 第3安定度画像630の具体例を表わす図である。 レファレンス701を用いたカテゴリの指標の算出について説明する図である。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
<適用例>
図1を参照して、本発明の適用例について説明する。図1は、画像処理装置100の構成例について説明する図である。本実施の形態では、画像処理装置100は、例えば後述するカメラ(例えば、図6に示すカメラ8)が、後述するワーク(例えば、図6に示すワーク2)を撮影して得られる文字の像を認識する処理を実行する。より具体的には、画像処理装置100は、入力画像300に含まれる像について、複数のカテゴリのうちのいずれのカテゴリに属するかを判断する。なお、画像処理装置100が実行する処理は、文字認識処理に限定されることなく、その他の認識処理であってもよい。その他の認識処理として、例えば装置の部品形状または食品の形状等が含まれる。さらに、例えば対象物の傷、打痕および異物の付着等をカテゴリとする対象物の欠陥に関する認識処理が含まれる。
画像処理装置100は、決定部170、算出部184、出力部174および記憶装置154を含む。決定部170は、入力画像300に含まれる像が複数のカテゴリのうちいずれのカテゴリに属するのかを決定する。カテゴリは、文字に含まれる数字、英字および記号等を分類したものである。より具体的には、カテゴリは、例えば数字の「0~9」、英字の「A~Z」および記号(例えば、「(」,「)」,「/」,「:」等)である。
決定部は、入力画像300に含まれる像が複数のカテゴリのうちのいずれのカテゴリに属するのかを決定する。より具体的には、決定部170は、入力画像300に含まれる「2018.12/AEIA」の各像(例えば、数字、英字および記号を含む12個のそれぞれの像)が、複数のカテゴリのうちのいずれのカテゴリに属するのかを決定する。決定部170は、例えば、英字「AEIA」における英字「I」の像311が英字「I」のカテゴリ12に属すると決定する。
決定部170は、像が属するカテゴリを決定する場合に、記憶装置154に格納された第1モデルセット111を参照する。第1モデルセット111は、文字における複数のカテゴリ11の各々に1または複数のモデルを対応付けたデータである。第1モデルセット111は、例えば、英字「I」のカテゴリ12、数字「1」のカテゴリ13および記号「/」のカテゴリ14を含む。英字「I」のカテゴリ12には、英字「I」のモデル121が対応付けられている。数字「1」のカテゴリ13には、数字「1」のモデル131が対応付けられている。記号「/」のカテゴリ14には、記号「/」のモデル141が対応付けられている。各カテゴリのモデルは、1または複数のモデルを含む。
図1では、まず最初に、入力画像300に含まれる像のうち、英字「I」の像311が属するカテゴリを決定する処理について説明する。決定部170は、例えば、英字「I」の像311と、第1モデルセット111に含まれる各カテゴリに対応付けられた1または複数のモデルとの類似度を導出する。より具体的には、決定部170は、英字「I」の像311の特徴量と、全てのカテゴリにおける各モデルの特徴量とに基づいて類似度(例えば、相関値)を導出する。特徴量は、例えば特徴量空間におけるn次元のベクトル情報で表現される。簡単のために特徴量を一次元のスカラ値とすると、像311の特徴量とモデルの特徴量との差の絶対値が小さいときに、類似度は高い値となる。なお、類似度は相関値に限らず、相関値以外の情報で表わされてもよい。
決定部170は、例えば英字「I」の像311と最も高い類似度が導出されたモデルが属するカテゴリを、英字「I」の像311が属するカテゴリとする。より具体的には、決定部170は、像311の特徴量と各モデルの特徴量とによる類似度から、例えば英字「I」のカテゴリ12に含まれるモデルが最も高い類似度になると判断する。その結果、決定部170は、英字「I」の像311が英字「I」のカテゴリ12に属すると決定する。これにより、英字「I」の像311には、英字「I」のカテゴリ12が設定される。
算出部184は、第1モデルセット111に含まれる各カテゴリの指標と、第2モデルセット112に含まれる各カテゴリの指標とを算出する。第2モデルセット112は、第1モデルセット111のカテゴリにモデルを追加したものである。第2モデルセット112は、例えば英字「I」の像311のモデル223を、英字「I」のカテゴリ12における1または複数のモデル121に含まれるモデルとしたものである。なお、英字「I」の像311は、後述するように数字「1」のカテゴリに含まれるモデルとの類似度が比較的高い像である。
指標とは、あるカテゴリに属すると決定されるべき像が、当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を表わすものである。また指標は、ある像と当該像が属するカテゴリに含まれるモデルとの類似度と、ある像と他のカテゴリに含まれるモデルとの類似度の差である。このように指標は、異なるカテゴリにおけるモデル間の類似度を用いて算出される値である。以下では、指標を「安定度」とも称する。なお、指標と安定度との関係は、指標の値が小さい場合は、誤って決定する可能性が小さくなり、安定度の値は大きくなる。また、指標の値が大きい場合は、誤って決定する可能性が大きくなり、安定度の値は小さくなる。安定度の具体的な算出方法については後述する。
図2を参照して指標の内容について説明する。図2は、カテゴリのモデルを追加する前と追加した後の指標の変化について説明する図である。図2(A)を参照して、モデルを追加する前の状態における指標について説明する。図2(A)の英字「I」のカテゴリ12と、数字「1」のカテゴリ13とには、それぞれ1つのモデルが対応付けられている。より具体的には、英字「I」のカテゴリ12には、英字「I」のモデル221が対応付けられ、数字「1」のカテゴリ13には、数字「1」のモデル231が対応付けられている。
英字「I」のモデル221が英字「I」のカテゴリ12に属することで、例えば第1範囲121aの範囲内にある像の特徴量と、英字「I」のモデル221の特徴量との差の絶対値は比較的小さくなる。特徴量の差の絶対値が小さい場合は、類似度は高くなる。決定部170は、ある像の特徴量と他のカテゴリに属するモデルの特徴量との差の絶対値を導出する。決定部170は、上記導出した差の絶対値よりも、ある像の特徴量と英字「I」のモデル221の特徴量との差の絶対値のほうが小さい場合は、ある像は英字「I」のカテゴリ12に属すると決定する。
数字「1」のモデル231が数字「1」のカテゴリ13に属することで、例えば第2範囲131aの範囲内にある像の特徴量と、数字「1」のモデル231の特徴量との差の絶対値は比較的小さくなる。決定部170は、ある像の特徴量と他のカテゴリに属するモデルの特徴量との差の絶対値を導出する。決定部170は、上記導出した差の絶対値よりも、ある像の特徴量と数字「1」のモデル211の特徴量との差の絶対値のほうが小さい場合は、ある像は数字「1」のカテゴリ13に属すると決定する。
図2(A)に示す数字「1」の像321は、当該像321の特徴量に基づいて、第2範囲131aの範囲内となる。言い換えると、数字「1」の像321の特徴量と、英字「I」のモデル211の特徴量との差の絶対値はL1となる。以下、差の絶対値を距離とも称する。また、数字「1」の像321の特徴量と、数字「1」のモデル231の特徴量とは距離L2となる。上述のように、像311の特徴量とモデルの特徴量との差の絶対値が小さい(距離が小さい)ほど、類似度は一層高くなる。図2(A)の距離L1と距離L2との関係は、距離L1>距離L2であるため、数字「1」の像321は、英字「I」のモデル211との類似度よりも、数字「1」のモデル231との類似度が高くなる。したがって、決定部170が、数字「1」のカテゴリ13に属すると決定するべき数字「1」の像321を、数字「1」のカテゴリ13とは異なる英字「I」のカテゴリ12に属すると誤って決定する可能性は小さくなる。すなわち、数字「1」のカテゴリの指標は小さくなる。また、距離L1と距離L2との差は比較的大きいため、数字「1」のカテゴリの安定度は大きくなる。安定度は、2つの類似度の差が大きいほど大きく値となる。これにより、画像処理装置100は、像とモデルとの類似度に基づいて、像が属するカテゴリを正確に判定できる。
なお、距離の表し方は、特定の距離の表し方に限定されることはない。距離の表し方は、例えばユークリッド距離であってもよいし、マハラノビス距離であってもよい。画像処理装置100は、それぞれの距離の表し方に応じて、あるカテゴリに含まれる複数のモデルにおける全ての特徴量を用いて距離を算出してもよい。また、画像処理装置100は、それぞれの距離の表し方に応じて、あるカテゴリに含まれる複数のモデルにおける特徴量を平均して距離を算出してもよい。また、画像処理装置100は、ニューラルネットワークを用いた機械学習に基づいて距離を算出してもよい。
次に、図2(B)参照して、モデルを追加した後の状態における指標について説明する。図2(B)では、英字「I」のカテゴリ12に、図1において説明した英字「I」の像311のモデル223の特徴量が追加されている。モデル223の特徴量が追加されたことで、英字「I」のカテゴリ12の第1範囲121aは拡大して、第3範囲122aとなる。その結果、数字「1」の像321の特徴量は、数字「1」のカテゴリ13の第2範囲131aだけでなく、英字「I」のカテゴリ12の第3範囲122aにも含まれる。これにより、決定部170は、数字「1」のカテゴリ13に属すると決定するべき数字「1」の像321を、数字「1」のカテゴリ13とは異なる英字「I」のカテゴリ12に属すると誤って決定する可能性が大きくなる。数字「1」のカテゴリの指標は大きくなる。また、数字「1」の像321の特徴量と、英字「I」のモデル211の特徴量との距離L3と、上記距離L2との差は比較的小さい。そのため、数字「1」のカテゴリの安定度は小さくなる。
図1を再び参照して、算出部184は各モデルセットにおけるカテゴリ毎の指標を算出する。より具体的には、算出部184は、第1モデルセット111における英字「I」のカテゴリ12の指標Aと、第2モデルセット112における同じカテゴリの指標Aとを算出する。算出部184は、第1モデルセット111における数字「1」のカテゴリ13の指標Bと、第2モデルセット112における同じカテゴリの指標Bとを算出する。算出部184は、記第1モデルセット111における号「/」のカテゴリ14の指標Cと、第2モデルセット112における同じカテゴリの指標Cとを算出する。
算出部184は、第1モデルセット111における各指標と、第2モデルセット112における各指標とを比較する。より具体的には、算出部184は、指標AとA、指標BとB、指標CとCとを比較する。算出部184は、比較によりカテゴリ毎の指標の差の絶対値を算出して出力部174に送信する。
指標の比較について具体例を示して説明する。第1モデルセット111における数字「1」のカテゴリ13における指標Bは、図2(A)を用いて説明した指標に相当する。より具体的には、指標Bは小さい値(安定度は大きい値)となる。これに対して、第2モデルセット112における数字「1」のカテゴリ13の指標Bは、図2(B)を用いて説明した指標に相当する。より具体的には、指標Bは大きい値(安定度は小さい値)となる。算出部184は、数字「1」のカテゴリ13における第1モデルセットの指標Bと、第2モデルセットの指標Bとの差の絶対値を出力部174に送信する。算出部184は、例えば指標Bの値を「10」とし、指標Bの値を「20」とすると、差の絶対値である「10」を出力部174に送信する。なお、算出部184は、他のカテゴリ(例えば、英字「I」のカテゴリ12および記号「/」のカテゴリ14等)の第1モデルセット111と、第2モデルセット112との差についても出力部174に送信する。
出力部174は、算出部184から取得した指標の差を含む結果情報500を出力する。出力部174は、後述する表示部(例えば、図6に示す表示部140)に結果情報500を出力する。これにより、画像処理装置100は、モデル変更の適否を判断できる情報をユーザに提供可能となる。
<第1の実施の形態>
[画像処理システム1の構成]
以下、画像処理装置を100を含む画像処理システム1の構成、画像処理装置100のハードウェア構成および画像処理装置100の具体的な処理について説明する。
図3は、画像処理システム1の構成例を示す図である。図3を参照して、画像処理システム1は、生産ライン等に組込まれる。画像処理システム1は、対象物であるワーク2を撮像することで得られる入力画像300に対して、文字認識処理を実行する。より具体的には、画像処理システム1は、予め定められた設定に従って、入力画像300に対して探索条件に合致する領域を特定して文字認識処理を実行する。探索条件は、例えばフォーマット文字列により設定される。フォーマット文字列については後述する。
画像処理システム1においては、ワーク2はベルトコンベヤ等の搬送機構6によって搬送され、搬送されたワーク2は、カメラ8によって所定タイミングで撮像される。カメラ8は、一例として、レンズ等の光学系に加えて、CCD(Coupled Charged Device)やCMOS(Complementary Metal Oxide Semiconductor)センサといった、複数の画素に区画された撮像素子を含んで構成される。なお、カメラ8で撮像されるワーク2に対して光を照射する照明機構をさらに設けてもよい。カメラ8を撮像することで得られる入力画像300は、画像処理装置100へ伝送される。
ワーク2がカメラ8の視野内に到達したことは、搬送機構6の両端に配置された光電センサ4によって検出される。より具体的には、光電センサ4は、同一の光軸上に配置された受光部4aと投光部4bとを含む。投光部4bから放射される光が、ワーク2で遮蔽されることを受光部4aにより検出することによりワーク2の到達を検出する。この光電センサ4のトリガ信号は、PLC(Programmable Logic Controller)5へ出力される。PLC5は、光電センサ4等からのトリガ信号を受信するとともに、搬送機構6の制御自体を司る。
画像処理装置100は、例えば、ワーク2に対して計測処理(画像処理)を実行する。より具体的には、画像処理装置100は、入力画像300に含まれる像が複数のカテゴリのうちのいずれのカテゴリに属するかを決定し、カテゴリにモデルが追加される前の第1モデルセット111におけるカテゴリ毎の指標と、カテゴリにモデルが追加された後の第2モデルセット112におけるカテゴリ毎の指標とを算出する。画像処理装置100は、第1モデルセット111におけるカテゴリ毎の指標と,第2モデルセット112におけるカテゴリ毎の指標との間の差を含む情報を表示部140に出力する。
表示部140は、例えば液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、またはその他の表示装置である。
また、画像処理装置100は、探索条件を設定する。さらに、画像処理装置100は、入力装置であるマウス104やキーボード(図示せず)をユーザが操作することで与えられる操作指令を受け付ける。
なお、画像処理装置100は、汎用的なアーキテクチャを有しているコンピュータであり、予めインストールされたプログラム(命令コード)を実行することで、各種機能を提供してもよい。汎用的なコンピュータを画像処理装置100として利用する場合には、本実施の形態に係る機能を提供するためのアプリケーションに加えて、コンピュータの基本的な機能を提供するためのOS(Operating System)がインストールされていてもよい。
[画像処理装置100のハードウェア構成例]
図4は、画像処理装置100のハードウェア構成例を説明する図である。図4を参照して、画像処理装置100は、演算処理部であるプロセッサ150と、記憶部としてのメモリ152および記憶装置154と、取得部130と、入力インターフェイス160と、表示コントローラ162と、PLCインターフェイス164と、通信インターフェイス166とを含む。これらの各部は、バス175を介して、互いにデータ通信可能に接続される。
プロセッサ150は、記憶装置154に格納されたプログラム(コード)をメモリ152に展開して、これらを所定順序で実行することで、画像処理部として機能する。より具体的には、プロセッサ150は、プログラムをメモリ152に展開して、算出部184および出力部174として機能する。また、プロセッサ150は、後述する抽出部、導出部、設定部、受付部、生成部および追加部(例えば、図6に示す抽出部171、導出部172、設定部173、受付部181、生成部182および追加部183)として機能する。なお、以下ではプロセッサ150がプログラムを実行することで必要な処理が実現される構成例について説明するが、これらの提供される処理の一部または全部を、専用のハードウェア回路(たとえば、ASICまたはFPGA等)を用いて実装してもよい。
メモリ152は、例えばDRAM(Dynamic Random Access Memory)等の揮発性のデバイスである。メモリ152は、記憶装置154から読み出されたプログラムに加えて、カメラ8によって取得された入力画像300、および、入力画像300に対する画像処理に用いられるモデルセット等を保持する。
記憶装置154は、例えばハードディスクおよびSSD(Solid State Drive)等の不揮発性のデバイスであり、プロセッサ150が実行する各種機能を実現するための制御プログラム110を保持する。また、記憶装置154は、辞書データ115を保持する。辞書データ115は、少なくとも1つのモデルセットを含む。
なお、制御プログラム110を含む本実施の形態に係るプログラムは、OSの一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。すなわち、本実施の形態に係るプログラム自体は、上記のようなモジュールを含んでおらず、OSと協働して処理が実行されてもよい。本実施の形態に係るプログラムとしては、このような一部のモジュールを含まない形態であってもよい。さらに、本実施の形態に係るプログラムは、他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には、上記のような組合せられる他のプログラムに含まれるモジュールを含んでおらず、当該他のプログラムと協働して実行される。
図5は、辞書データ115の構成例を表わす図である。辞書データ115は、1または複数のモデルセットを有する。図5を参照して、辞書データ115は、例えば第1モデルセット111を有する。属性は、例えば数字、英字および記号を含む。第1モデルセット111は、文字の属性毎に複数のカテゴリを含む。より具体的には、第1モデルセット111は、数字の複数のカテゴリ21と、英字の複数のカテゴリ22と、記号の複数のカテゴリ23とを含む。また、各カテゴリには1または複数のモデルが対応付けられている。例えば、数字「0」のカテゴリには、数字「0」の複数のモデル31が対応付けられている。なお、第1モデルセット111に含まれる上記カテゴリおよびモデルは一例であり、他のカテゴリおよび他のモデルを含んでもよい。第1モデルセット111は、例えば平仮名および片仮名の少なくともいずれかのカテゴリおよびモデルを含んでもよい。
図4を再び参照して、取得部130は、プロセッサ150とカメラ8との間のデータ伝送を仲介するインターフェイスである。取得部130はカメラ8と電気的に接続される。カメラ8はワーク2を撮像する。より具体的には、取得部130は、1つ以上のカメラ8と接続が可能であり、画像バッファ130aを含む。画像バッファ130aは、カメラ8から取得された画像データを一時的に蓄積する。そして、取得部130は、画像バッファ130aに所定コマ数の画像データが蓄積されると、その蓄積された、入力画像300の画像データをメモリ152へ転送する。このように、カメラ8によりリアルタイムに撮影された入力画像300がメモリ152へ転送される。
入力インターフェイス160は、プロセッサ150とマウス104およびキーボード等の入力部との間のデータ伝送を仲介する。すなわち、入力インターフェイス160は、ユーザが入力部を操作することで与えられる操作指令を受け付ける。表示コントローラ162は、表示部140と接続され、表示部140に結果情報500に基づく、カテゴリ毎の安定度を含む後述する安定度画像(例えば、図9に示す第1安定度画像610)を表示させる。
PLCインターフェイス164は、プロセッサ150とPLC5との間のデータ伝送を仲介する。より具体的には、PLCインターフェイス164は、PLC5によって制御される生産ラインの状態に係る情報やワークに係る情報等をプロセッサ150へ伝送する。通信インターフェイス166は、プロセッサ150と管理サーバー(図示せず)との間のデータ伝送を仲介する。通信インターフェイス166は、例えば、一般的なネットワークプロトコルであるイーサーネット(登録商標)、産業用ネットワークプロトコルとして用いられるEtherCAT(登録商標)およびEtherNet/IP(登録商標)等のいずれかが採用されてもよい。
[画像処理装置100の機能ブロック図]
図6は、画像処理装置100において実行される文字認識処理の機能ブロック図である。図6を参照して、画像処理装置100は、決定部170、出力部174、受付部181、生成部182、追加部183および算出部184を含む。また、決定部170は、抽出部171、導出部172および設定部173を含む。プロセッサ150は、記憶装置154に格納された制御プログラム110が読み出されて実行されることで、上記各部として機能する。以下では、プロセッサ150により実行される各部の具体的な処理について説明する。
決定部170は、画像処理システム1の運用時に処理を実行する。決定部170に含まれる抽出部171は、入力画像300に含まれる像を抽出する。より具体的には、抽出部171は、入力画像300に含まれる「2018.12/AEIA」の各像(例えば、12個の像)を抽出し、各像を含む像情報を導出部172に送信する。
導出部172は、各像の類似度を導出する。より具体的には、導出部172は、記憶装置154に格納された第1モデルセット111を参照して、像の特徴量と各カテゴリに属するモデルの特徴量とに基づいて類似度を導出する。導出部172は、1つの像についてカテゴリ毎の類似度を導出する。また導出部172は、複数の像(例えば、12個の像)の類似度を導出し、導出した複数の像の類似度を含む類似度情報を設定部173に送信する。
設定部173は、特徴量に基づく類似度により、当該像が属するカテゴリを設定する。より具体的には、設定部173は、1つの像について導出されたカテゴリ毎の類似度のうち最も高い類似度となるモデルのカテゴリを当該像が属するカテゴリとして設定する。設定部173は、複数の像のカテゴリを設定し、設定した複数の像のカテゴリを含むカテゴリ情報を出力部174に送信する。
出力部174は、各像の識別結果を出力する。識別結果は、像のカテゴリと、像が属するカテゴリの類似度と、像の安定度とを含む。出力部174は、識別結果を含む識別情報を表示部140に送信する。表示部140は、各像の識別結果を表示する。
図7は、表示部140に表示される各像の識別結果について説明する図である。図7を参照して、識別結果画像605は、4つの数字(例えば、「2018」)の像と、1つの記号(例えば、「.」)の像と、2つの数字(例えば、「12」)の像と、1つの記号(例えば、「/」)の像と、4つの英字(例えば、「AE1A」)の像とを含む。すなわち、識別結果画像605は、12個の像で構成される。これらの像は、例えば、「####@##@$$$$」のフォーマット文字列によりカテゴリ、類似度および安定度が算出される。フォーマット文字列は、任意の数字を表わす「#」と、任意の英字を表わす「$」と、任意の記号を表わす「@」を含む正規表現である。なお、フォーマット文字列を用いて指標を算出する対象のカテゴリを限定する処理については、第2の実施の形態で説明する。
識別結果画像605には12個の像が含まれる。各像の上側には、設定部173が設定した各像のカテゴリが含まれる。各像の下側には、導出部172が導出した各像の類似度が含まれる。各像の類似度の下側には、出力部174が出力した安定度が含まれる。
ここで、識別結果画像605に含まれる各像において、例えば類似度の閾値を60とし、安定度の閾値を10とした場合に、4つの英字「AE1A」の像のうちの英字「I」の像311の類似度および安定度が閾値以下の値となる。ある像における類似度および安定度の少なくともいずれかが閾値よりも低い場合は、例えば像の上側に表示されているカテゴリの色、類似度の色および安定度の色の少なくともいずれかが、他の像のカテゴリ等の色とは異なる色で表示される。より具体的には、識別結果画像605の12個の像におけるカテゴリ、類似度および安定度のうち、英字「I」の像における英字「I」のカテゴリ、類似度および安定度は、ユーザに対して目立つ色(例えば、赤色)で表示され、その他の像におけるカテゴリ、類似度および安定度は、ユーザに対して目立たない色(例えば、黒色)で表示される。
図6を再び参照して、受付部181は、設定部173から各像のカテゴリを含むカテゴリ情報を取得する。受付部181は、カテゴリ情報を受け付けることで、記憶装置154に格納された第1モデルセット111に、各像のいずれかを追加するユーザ操作を受け可能となる。すなわち、カテゴリ情報を受け付けることがモデルの追加処理を実行するためのトリガとなる。受付部181は、ユーザが表示部140に表示された識別結果画像605を確認して、マウス104を含む入力部を操作することで与えられる操作指令を受け付ける。識別結果画像605は、他のカテゴリと異なる色で表示されたカテゴリ、類似度および安定度の少なくともいずれを含む。受付部181は、ユーザが選択した像およびカテゴリを含む像選択情報を生成部182に出力する。
生成部182は、ユーザが選択した像の特徴量を生成する。生成部182は、例えば図1を用いて説明した英字「I」の像311の特徴量を生成する。生成部182は、ユーザが選択した像の特徴量を含む特徴量情報を追加部183に送信する。
追加部183は、ユーザが選択した像の特徴量を含むモデルを、ユーザが選択したカテゴリに追加する。より具体的には、追加部183は、第1モデルセット111とは異なる新たなモデルセットである第2モデルセットを作成する。新たなモデルは、ユーザが選択した像のモデルである。当該モデルが、ユーザが選択したカテゴリに追加されて新たな第2モデルセット112が作成される。追加部183は、新たなモデルセットを作成したことを含むモデルセット作成情報を算出部184に送信する。これにより、画像処理装置100は、既存のモデルセットに新たなモデルを追加した新規のモデルセットを容易に作成できる。
算出部184は、第1モデルセット111に含まれる各カテゴリの指標(安定度)と、第2モデルセット112に含まれる各カテゴリの指標(安定度)とを算出する。算出部184は、指標AとA、指標BとB、指標CとCを比較する。算出部184は、比較によりカテゴリ毎の指標(安定度)の差の絶対値を算出して出力部174に送信する。
図8は、類似度と安定度との関係について表わす図である。図8(A)は、各カテゴリにおける類似度が最も高いカテゴリにおけるモデルと2番目に高いカテゴリにおけるモデルとのそれぞれの類似度を表わす図である。例えば、数字「1」のカテゴリ13において、最も高い類似度を表わすカテゴリにおけるモデルは、数字「1」のカテゴリにおけるモデルとなる。より具体的には、数字「1」のカテゴリにおけるモデルの類似度は60となる。また2番目に高い類似度を表わすカテゴリにおけるモデルは、英字「I」のカテゴリにおけるモデルとなる。英字「I」のカテゴリにおけるモデルの類似度は50となる。
図8(B)は、各カテゴリにおける安定度を表わす図である。安定度は、最も高い類似度から2番目に高い類似度を減算することにより算出される(最も高い類似度-2番目に高い類似度)。図8(A)を用いて説明した数字「1」のカテゴリ13において、最も高い類似度「60」から2番目に高い類似度「50」を減算すると値は「10」となる。すなわち、数字「1」のカテゴリ13の安定度は「10」となる。なお、図8(B)に示すように、数字「1」のカテゴリの安定度は、他のカテゴリの安定度(例えば、数字「0」のカテゴリにおける安定度「40」および数字「2」のカテゴリにおける安定度「60」よりも低い値となる。また、数字「1」のカテゴリ13の安定度は、上記の安定度閾値以下となっている。
安定度が低い値となるのは、例えばカテゴリに新たなモデルを追加したためである。図2を再び参照して説明すると、上述の図2(A)においては、数字「1」の像321と英字「I」のモデル221との距離がL1となり、数字「1」の像321と数字「1」のモデル231との距離がL2となる。距離L1と距離L2との関係は、距離L1>距離L2である。両方の距離の差が比較的大きいため、数字「1」の像321が他のカテゴリである英字「I」に属すると誤って決定される可能性は小さくなる。その結果、指標は小さくなり、安定度は大きくなる。例えば、安定度の値が20となる。これに対して、上述の図2(B)においては、数字「1」の像321と英字「I」のモデル223と距離がL3となり、数字「1」の像321と数字「1」のモデル231との距離がL2となる。距離L3と距離L2との関係は、距離L3≒距離L2である。両方の距離の差が比較的小さいため、数字「1」の像321が他のカテゴリである英字「I」に属すると誤って決定される可能性は大きくなる。その結果、指標は大きくなり、安定度は小さく(例えば、安定度の値が10と)なる。なお、距離の算出対象のモデルが、モデル221からモデル223に変更されているのは、像321との距離がより近いモデルが距離の算出対象となるためである。
なお、図2(A)におけるカテゴリとモデルとの関係は、新たなモデルを追加する前の第1モデルセット111におけるカテゴリとモデルとの関係に相当する。これに対して、図2(B)におけるカテゴリとモデルとの関係は、新たなモデルを追加した後の第2モデルセット112におけるカテゴリとモデルとの関係に相当する。新たなモデルは、例えば英字「I」のモデル223である。
図8(B)における安定度について、算出部184は、指標(安定度)の差を含む情報を出力部174に出力する。指標の差は、例えば安定度の値20と安定度の値10との差である。なお、算出部184は、指標の差を含む情報を出力する場合に、安定度に変化がない(差の値が0)カテゴリの情報も含めて出力する。これにより、画像処理装置100は、差が生じた指標と、差が生じていない指標とを異なる表示態様とする情報を出力可能となる。
出力部174は、差の情報を含む結果情報500を表示部140に出力する。表示部140は出力部174から出力された結果情報500に基づき、第1安定度画像610を表示する。
図9は、第1安定度画像610の具体例を表わす図である。図9を参照して、第1安定度画像610は、カテゴリ毎の安定度情報611と追加確認情報612とを含む。
安定度情報611において、縦軸は安定度を表わし、横軸は、数字の複数のカテゴリ(例えば、0~9)、英字の複数のカテゴリ(例えば、A~Z)および複数の記号のカテゴリ(例えば、「/」および「:」等)を表わす。そして、安定度の閾値613としては、例えば10の値が設定されている。第1安定度画像610は、第1モデルセット111に含まれるカテゴリ毎の指標と、第2モデルセット112に含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間で指標が変化したカテゴリ(例えば、数字「1」のカテゴリ13)について、他のカテゴリとは異なる表示態様とする。より具体的には、第1安定度画像610における数字「1」のカテゴリ13における棒グラフのうち、安定度の値10~20を示す数値範囲614の色を他のカテゴリの安定度を表わす棒グラフの色とは異なる色とする。このように、数値範囲614の色を変更するのは、新たなモデルの追加により、追加前には安定度の値が20であったのに対して、追加後は安定度の値が10に下がったことを、第1安定度画像610を確認したユーザが一目でわかるようするためである。画像処理装置100は、ユーザに対して安定度の変化が直感的にわかる画像を提供できる。
また、出力部174は、第2モデルセット112に含まれる少なくとも1つのカテゴリの安定度が予め定められた閾値613の値以下(例えば、安定度の値が10以下)となる場合に、結果情報500を出力して、表示部140に追加確認情報612を表示させる。追加確認情報612は、特徴量が生成された新たなモデルの第2モデルセット112への追加を確定させるか否かをユーザに促す情報である。画像処理装置100は、例えば新たなモデルのモデルセットへの追加により、安定度が閾値613の値以下となるカテゴリが発生する場合にのみ表示部140に追加確認情報612を表示させる。画像処理装置100は、新たなモデルのモデルセットへの追加を確定させると、安定度が閾値以下となるカテゴリが発生することをユーザに対して通知できる。なお、画像処理装置100は、追加確認情報612に含まれる「はい」のボタンが入力部を用いたユーザ操作により選択されると、新たなモデルのモデルセットへの追加を確定させる。また、画像処理装置100は、追加確認情報612の「いいえ」のボタンが入力部を用いたユーザ操作により選択されると、新たなモデルのモデルセットへの追加は行わない。
出力部174は、例えば安定度の変化が予め定められた値以上となる場合に、結果情報500を出力して表示部140に追加確認情報612を表示させてもよい。例えば、新たなモデルの追加により変化した安定度が、閾値613を超える(閾値以下とはならない)場合であっても、変化量が大きい(例えば、安定度の値が40以上低下した)ときには、出力部174は、結果情報500を出力して表示部140に追加確認情報612を表示させるようにしてもよい。これにより、画像処理装置100は、モデルセットへの新たなモデルの追加を確定させた場合に、少なくとも1つのカテゴリの安定度がモデルの追加前と比べて、一定値以上低下することをユーザに対して確実に通知できる。
上記の画像処理装置100は、表示部140に1つの第1安定度画像610を表示して、第1安定度画像610の数字「1」のカテゴリ13における棒グラフのうち、安定度の10~20を表わす数値範囲614の色を、他のカテゴリの安定度を表わす棒グラフの色とは異なる色とすることについて説明した。これに対して、画像処理装置100は、表示部140に第1安定度画像610と第2安定度画像620とを切替え可能に表示してもよい。
図10は、第1安定度画像610と第2安定度画像620とを切替えて表示することについて説明する図である。第2安定度画像620は、第1モデルセット111に含まれるカテゴリ毎の指標を表示する画像である。より具体的には、第2安定度画像620は、数値範囲614における安定度が低下する前の数字「1」のカテゴリ13を含む各カテゴリの安定度を表わす画像である。画像処理装置100は、第1安定度画像610と第2安定度画像620とを入力部によるユーザ操作により切替え可能として表示部140に表示する。これにより、画像処理装置100は、ユーザに対して安定度の変化がより一層直感的にわかる画像を提供できる。なお、画像処理装置100は、第1安定度画像610と第2安定度画像620とを切替える以外に、第1安定度画像610と第2安定度画像620とを表示部140の1つの画面に並べて表示させてもよい。
[画像処理装置の処理手順]
図11および図12を参照して、画像処理装置100におけるプロセッサ150の制御構造について説明する。図11および図12の制御は、例えばプロセッサ150が制御プログラム110を実行することによって実現される。図11は、像の識別情報を出力する処理について説明するフローチャートである。ステップS105において、プロセッサ150は、入力画像300に含まれる像を抽出する。
ステップS110において、プロセッサ150は、第1モデルセット111を参照して、像の類似度を導出する。
ステップS115において、プロセッサ150は、像の類似度に基づいて、当該像のカテゴリを設定する。
ステップS120において、プロセッサ150は、像の識別情報を表示部140に出力する。
図12は、差を含む情報を出力する処理について説明するフローチャートである。ステップS205において、プロセッサ150は、ユーザによる入力部を用いたユーザ操作に基づいて、新たなモデルとして追加する像と当該像のカテゴリとを選択する。
ステップS210において、プロセッサ150は、選択された像の特徴量を生成する。
ステップS215において、プロセッサ150は、第1モデルセットに含まれるカテゴリのうちユーザが選択したカテゴリに、ユーザが選択したモデルを追加する。プロセッサ150は、モデルの追加により、第1モデルセット111とは異なる第2モデルセット112を作成する。
ステップS220において、プロセッサ150は、記憶装置154から第2モデルセット112を読み出す。
ステップS225において、プロセッサ150は、第1モデルセット111におけるカテゴリ毎の指標と、第2モデルセット112におけるカテゴリ毎の指標との差を算出する。
ステップS230において、プロセッサ150は、全てのカテゴリにおける指標の差の算出が終了したか否かを判断する。全てのカテゴリにおける指標の差の算出が終了した場合(ステップS230においてYES)には、プロセッサ150は、制御をステップS235に切替える。そうでない場合には(ステップS230においてNO)、プロセッサ150は、制御をステップS225に切替える。
ステップS235において、プロセッサ150は、各カテゴリの差を含む情報を表示部140に出力する。
<第2の実施の形態>
以下、本開示に係る第2の実施の形態について説明する。第1の実施の形態では、画像処理装置100が、複数のカテゴリ内で指標を算出することについて説明した。これに対して、第2の実施の形態では、画像処理装置100は、複数のカテゴリのうち条件に合致する属性を有する一部のカテゴリ内で指標を算出する。より具体的には、例えば、画像処理装置100は、フォーマット文字列を用いて、指標を算出するカテゴリを限定する。
第2の実施の形態に係る画像処理装置は、前述の実施の形態に係る画像処理装置100と同じハードウェア構成およびを用いて実現される。また、第2の実施の形態に係る画像処理装置は、第1の実施の形態に係る画像処理装置100における処理と一部が異なる以外は同様の処理を実行する。以下では、図13を参照して、画像処理装置100のハードウェア構成および処理について、同じ内容については説明は繰り返さずに、一部が異なる処理の内容について説明する。
図13は、第3安定度画像630の具体例を表わす図である。画像処理装置100は、例えば、条件が数字および英字のカテゴリ内で指標算出することである場合は、第3安定度画像630に表わすように、数字「0」~「9」と英字「A」~「Z」とのカテゴリ間で指標が変化したカテゴリについて、他のカテゴリとは異なる表示態様となる情報を出力する。このように、画像処理装置100は、指標を算出する対象の条件が「数字」および「英字」のカテゴリに設定されている場合は、条件として設定されていない「記号」のカテゴリの指標の算出は行わない。その結果、画像処理装置100は、例えば記号を除く数字および英字のカテゴリ毎の安定度を含む第3安定度画像630を表示部140に表示させる。これにより、画像処理装置100は、文字認識を行う対象に限定して指標を算出するため、処理負荷を軽減でき、文字認識の対象となるカテゴリのみの指標の情報をユーザに提供できる。
なお、条件は上記の条件に限定されず他の条件であってもよい。条件は、例えば上記のように複数の属性を指定するものでもよいし、1つの属性のみを指定するものであってもよい。また、属性に含まれるカテゴリのうち特定のカテゴリを指定するものであってもよい。例えば、数字のうち「4~9」のカテゴリを指定する等である。また、画像処理装置100は、例えば入力部を用いたユーザ操作を受け付けて、条件を指定してもよい。さらに、画像処理装置100はフォーマット文字列に含まれる文字の属性と同じ属性となるように条件を指定してもよい。
<第3の実施の形態>
以下、本開示に係る第3の実施の形態について説明する。第1の実施の形態では、画像処理装置100はモデルを追加したことによる像321とモデルとの類似度に関する距離の変化から算出された指標の差を出力することについて説明した。これに対して、第3の実施の形態では、画像処理装置100は、カテゴリに属するレファレンス701とカテゴリに属するモデルとの類似度と、カテゴリに属するレファレンス701と他のカテゴリに属するモデルとの類似度とに基づいて指標を算出する。
第3の実施の形態に係る画像処理装置は、前述の実施の形態に係る画像処理装置100と同じハードウェア構成を用いて実現される。また、第3の実施の形態に係る画像処理装置は、第1の実施の形態に係る画像処理装置100における処理と一部が異なる以外は同様の処理を実行する。以下では、図13を参照して、画像処理装置100のハードウェア構成および処理について、同じ内容については説明は繰り返さずに、一部が異なる処理の内容について説明する。
図14は、レファレンス701を用いたカテゴリの指標の算出について説明する図である。図14(A)を参照して、モデルを追加する前の状態における指標について説明する。レファレンス701は、特徴量空間において、例えば英字「I」のモデル221と、数字「1」のモデル231との間の特徴量を有する。英字「I」のモデル221とレファレンス701との距離はL11であり、数字「1」のモデル231とレファレンス701との距離はL12となる。レファレンス701は、例えば記憶装置154に予め格納されており、属するカテゴリが予め定められている。レファレンス701が属するカテゴリは、例えば数字「1」のカテゴリ13と予め決定されている。そして、距離L11と距離L12との差の絶対値が予め定めた値以下の場合には、数字「1」のカテゴリの指標は小さくなる。言い換えると、数字「1」のカテゴリの安定度は大きくなる。これにより、画像処理装置100はレファレンスを用いたモデルの類似度に基づいて、像が属するカテゴリを正確に判定できる。
次に、図14(B)を参照して、レファレンス701と英字「I」のモデル223との距離はL13であり、レファレンス701と数字「1」のモデル231との距離はL12となる。そして、距離L13と距離L12との差の絶対値が予め定めた値よりも大きくなる場合には、予め設定されているレファレンス701のカテゴリは、数字「1」のカテゴリ13から英字「I」のカテゴリ12に変化する。このようにレファレンス701に予め設定されているカテゴリが変化することで、変化前のカテゴリである数字「1」のカテゴリの指標は大きくなる。言い換えると、数字「1」のカテゴリの安定度は小さくなる。画像処理装置100は、モデルの追加によるレファレンス701のカテゴリの変化に基づき、モデルの変更の適否を判断できる情報をユーザに提供する。
<変形例>
第1~第3の実施の形態では、画像処理装置100は、あるカテゴリにモデルを追加した場合の指標の差を出力することについて説明した。これに対して、画像処理装置100は、ユーザの入力部を用いた操作により、あるカテゴリに登録されているモデルの削除を受け付けて、当該モデルを削除した場合の指標の差を含む情報を表示部140に出力するようにしてもよい。画像処理装置100は、例えば入力部を用いたユーザ操作により、当該モデルを削除した場合の指標の差を含む情報を表示部140に出力する。これにより、画像処理装置100は、モデルの登録数が登録可能な上限に達した場合に、既に登録されたモデルを削除することで新たなモデルを追加可能となる。また、画像処理装置100は、登録されたモデルが認識の精度を低下させている場合に、当該モデルを削除することで認識の精度を向上させることができる。
なお、画像処理装置100は、ユーザの入力部を用いた操作により、あるカテゴリに登録されているモデルの削除および新たなモデルの登録するリプレイスを受け付けて、指標の差を出力するようにしてもよい。
第1~第3の実施の形態では、数値範囲614の色を他のカテゴリにおける安定度を表わす棒グラフの色とは異なる色とすることについて説明した。これに対して、数字「1」のカテゴリ13の棒グラフにおける数値範囲614の部分を点滅させてもよい。数値範囲614の対象のカテゴリとなる数字「1」のカテゴリ13の色を他のカテゴリ色と異ならせてもよい。
第1~第3の実施の形態では、画像処理装置100は、各カテゴリごとの指標(安定度)の値を表示部140に第1安定度画像610等として表示させることについて説明した。これに対して、画像処理装置100は、表示部140に指標の差の値のみを表示させてもよい。その場合、画像処理装置100は、例えば、指標の差が0の値の場合は0の値を表わす画像を表示部140に表示させる。また、画像処理装置100は、例えば、指標の差の値が10の場合は10の値を表わす画像を表示部140に表示させる。
<付記>
以上のように、本実施の形態は以下のような開示を含む。
[構成1]
複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセット(111)を格納する記憶部(154)と、
前記記憶部(154)に格納された前記第1モデルセット(111)を参照して、入力画像に含まれる像が前記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定する決定部(170)と、
対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出する算出部(184)と、
前記第1モデルセット(111)を対象として算出された前記第1モデルセットに含まれるカテゴリ毎の指標と、前記第1モデルセット(111)とは異なる第2モデルセット(112)を対象として算出された前記第2モデルセット(112)に含まれるカテゴリ毎の指標との間の差を含む情報を出力する出力部(174)とを備える、画像処理装置。
[構成2]
前記出力部(174)は、前記第1モデルセット(111)に含まれるカテゴリ毎の指標と、前記第2モデルセット(112)に含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間で指標が変化したカテゴリについて、他のカテゴリとは異なる表示態様となる情報を出力する、構成1に記載の画像処理装置。
[構成3]
前記入力画像(300)に含まれる像の選択と、当該選択された像のカテゴリの設定とを受け付ける受付部(181)と、
前記選択された像に基づいてモデルを生成する生成部(182)と、
前記第1モデルセット(111)の設定されたカテゴリに前記生成されたモデルを追加したものを前記第2モデルセット(112)とする追加部(183)とをさらに備える、構成1または2に記載の画像処理装置。
[構成4]
前記出力部(174)は、前記第2モデルセット(112)に含まれるカテゴリ毎の指標のうちの前記指標の値が予め定められた値未満となる指標がある場合に、前記生成されたモデルの前記第1モデルセット(111)への追加を確定させるか否かの確認をユーザに促す情報を出力する、構成3に記載の画像処理装置。
[構成5]
前記出力部(174)は、前記第2モデルセット(112)に含まれるカテゴリ毎の指標と、前記第1モデルセット(111)に含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間での指標の値の変化が予め定められた値以上となる場合に、前記生成されたモデルの前記第1モデルセット(111)への追加を確定させるか否かの確認をユーザに促す情報を出力する、構成3に記載の画像処理装置。
[構成6]
前記受付部(181)は、前記第1モデルセット(111)に含まれる前記モデルの選択を受け付け、
前記選択されたモデルを削除する削除部をさらに備える、構成3~5のいずれか1項に記載の画像処理装置。
[構成7]
前記算出部(184)は、前記指標を、前記複数のカテゴリのうち条件に合致する属性を有する一部のカテゴリ内で算出する、構成1~6のいずれか1項に記載の画像処理装置。
[構成8]
前記算出部(184)は、前記選択されたカテゴリに属するモデルと、前記他のカテゴリに属するモデルとの類似度に基づいて、当該選択されたカテゴリの前記指標を算出する、構成1~7のいずれか1項に記載の画像処理装置。
[構成9]
前記記憶部(154)は、属する前記カテゴリが予め決定されたレファレンス(701)を格納し、
前記算出部(184)は、前記カテゴリに属するレファレンス(701)と前記カテゴリに属する前記モデルとの類似度と、前記カテゴリに属する前記レファレンス(701)と他のカテゴリに属する前記モデルとの類似度とに基づいて、当該カテゴリの前記指標を算出する、構成1~7のいずれか1項に記載の画像処理装置。
[構成10]
前記入力画像(300)に含まれる像は、文字の像である、構成1~9のいずれか1項に記載の画像処理装置。
[構成11]
記憶部(154)に格納された複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセット(111)を参照して、入力画像(300)に含まれる像が前記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定するステップ(S115)と、
対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出するステップ(S225)と、
前記第1モデルセット(111)を対象として算出された前記第1モデルセット(111)に含まれるカテゴリ毎の指標と、前記第1モデルセット(111)とは異なる第2モデルセット(112)を対象として算出された前記第2モデルセット(112)に含まれるカテゴリ毎の指標との間の差を含む情報を出力するステップ(S235)とを含む、画像処理方法。
[構成12]
コンピュータを画像処理装置(100)として機能させるための画像処理プログラムであって、
前記画像処理プログラムは前記コンピュータに、
記憶部(154)に格納された複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセット(111)を参照して、入力画像(300)に含まれる像が前記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定するステップ(S115)と、
対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出するステップ(S225)と、
前記第1モデルセット(111)を対象として算出された前記第1モデルセット(111)に含まれるカテゴリ毎の指標と、前記第1モデルセットとは異なる第2モデルセット(112)を対象として算出された前記第2モデルセット(112)に含まれるカテゴリ毎の指標との間の差を含む情報を出力するステップ(S235)とを実行させる、画像処理プログラム。
今回開示された実施の形態は全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。
1 画像処理システム、2 ワーク、4 光電センサ、4a 受光部、4b 投光部、6 搬送機構、8 カメラ、100 画像処理装置、104 マウス、110 制御プログラム、111 第1モデルセット、112 第2モデルセット、115 辞書データ、121a 第1範囲、122a 第3範囲、130 取得部、130a 画像バッファ、131a 第2範囲、140 表示部、152 メモリ、154 記憶装置、160 入力インターフェイス、162 表示コントローラ、164 インターフェイス、166 通信インターフェイス、170 決定部、171 抽出部、172 導出部、173 設定部、174 出力部、175 バス、181 受付部、182 生成部、183 追加部、184 算出部、300 入力画像、311,321 像、500 結果情報、605 識別結果画像、611 安定度情報、612 追加確認情報、613 閾値、614 数値範囲、701 レファレンス。

Claims (11)

  1. 複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセットを格納する記憶部と、
    前記記憶部に格納された前記第1モデルセットを参照して、入力画像に含まれる像が前記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定する決定部と、
    対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出する算出部と、
    前記第1モデルセットを対象として算出された前記第1モデルセットに含まれるカテゴリ毎の指標と、前記第1モデルセットとは異なる第2モデルセットを対象として算出された前記第2モデルセットに含まれるカテゴリ毎の指標との間の差を含む情報を出力する出力部とを備え
    前記出力部が出力する情報は、前記第1モデルセットと前記第2モデルセットとの間で指標に差が生じるカテゴリを特定するための情報を含む、画像処理装置。
  2. 前記出力部は、前記第1モデルセットに含まれるカテゴリ毎の指標と、前記第2モデルセットに含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間で指標が変化したカテゴリについて、他のカテゴリとは異なる表示態様となる情報を出力する、請求項1に記載の画像処理装置。
  3. 前記入力画像に含まれる像の選択と、当該選択された像のカテゴリの設定とを受け付ける受付部と、
    前記選択された像に基づいてモデルを生成する生成部と、
    前記第1モデルセットの設定されたカテゴリに前記生成されたモデルを追加したものを前記第2モデルセットとする追加部とをさらに備える、請求項1または2に記載の画像処理装置。
  4. 前記出力部は、前記第2モデルセットに含まれるカテゴリ毎の指標のうちの前記指標の値が予め定められた値未満となる指標がある場合に、前記生成されたモデルの前記第1モデルセットへの追加を確定させるか否かの確認をユーザに促す情報を出力する、請求項3に記載の画像処理装置。
  5. 前記出力部は、前記第2モデルセットに含まれるカテゴリ毎の指標と、前記第1モデルセットに含まれるカテゴリ毎の指標とのうち、対応するカテゴリ間での指標の値の変化が予め定められた値以上となる場合に、前記生成されたモデルの前記第1モデルセットへの追加を確定させるか否かの確認をユーザに促す情報を出力する、請求項3に記載の画像処理装置。
  6. 前記受付部は、前記第1モデルセットに含まれる前記モデルの選択を受け付け、
    前記選択されたモデルを削除する削除部をさらに備える、請求項3~5のいずれか1項に記載の画像処理装置。
  7. 前記算出部は、前記指標を、前記複数のカテゴリのうち条件に合致する属性を有する一部のカテゴリ内で算出する、請求項1~6のいずれか1項に記載の画像処理装置。
  8. 前記記憶部は、属する前記カテゴリが予め決定されたレファレンスを格納し、
    前記算出部は、前記カテゴリに属するレファレンスと前記カテゴリに属する前記モデルとの類似度と、前記カテゴリに属する前記レファレンスと他のカテゴリに属する前記モデルとの類似度とに基づいて、当該カテゴリの前記指標を算出する、請求項1~7のいずれか1項に記載の画像処理装置。
  9. 前記入力画像に含まれる像は、文字の像である、請求項1~のいずれか1項に記載の画像処理装置。
  10. コンピュータが実行する画像処理方法であって、前記画像処理方法は、
    記憶部に格納された複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセットを参照して、入力画像に含まれる像が前記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定するステップと、
    対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出するステップと、
    前記第1モデルセットを対象として算出された前記第1モデルセットに含まれるカテゴリ毎の指標と、前記第1モデルセットとは異なる第2モデルセットを対象として算出された前記第2モデルセットに含まれるカテゴリ毎の指標との間の差を含む情報を出力するステップとを含み、
    前記出力される情報は、前記第1モデルセットと前記第2モデルセットとの間で指標に差が生じるカテゴリを特定するための情報を含む、画像処理方法。
  11. コンピュータを画像処理装置として機能させるための画像処理プログラムであって、
    前記画像処理プログラムは前記コンピュータに、
    記憶部に格納された複数のカテゴリの各々に1または複数のモデルを対応付けた第1モデルセットを参照して、入力画像に含まれる像が前記複数のカテゴリのうちのいずれのカテゴリに属するのかを決定するステップと、
    対象のモデルセットに含まれる複数のカテゴリ内の各カテゴリについて、当該カテゴリに属すると決定されるべき像が当該カテゴリとは異なるカテゴリに属すると誤って決定される可能性を示す指標を算出するステップと、
    前記第1モデルセットを対象として算出された前記第1モデルセットに含まれるカテゴリ毎の指標と、前記第1モデルセットとは異なる第2モデルセットを対象として算出された前記第2モデルセットに含まれるカテゴリ毎の指標との間の差を含む情報を出力するステップとを実行させ
    前記出力される情報は、前記第1モデルセットと前記第2モデルセットとの間で指標に差が生じるカテゴリを特定するための情報を含む、画像処理プログラム。
JP2018227561A 2018-12-04 2018-12-04 画像処理装置、画像処理方法、および画像処理プログラム Active JP7087971B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018227561A JP7087971B2 (ja) 2018-12-04 2018-12-04 画像処理装置、画像処理方法、および画像処理プログラム
CN201911029972.2A CN111275138B (zh) 2018-12-04 2019-10-28 图像处理装置、图像处理方法以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018227561A JP7087971B2 (ja) 2018-12-04 2018-12-04 画像処理装置、画像処理方法、および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2020091602A JP2020091602A (ja) 2020-06-11
JP7087971B2 true JP7087971B2 (ja) 2022-06-21

Family

ID=71001543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018227561A Active JP7087971B2 (ja) 2018-12-04 2018-12-04 画像処理装置、画像処理方法、および画像処理プログラム

Country Status (2)

Country Link
JP (1) JP7087971B2 (ja)
CN (1) CN111275138B (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000011094A (ja) 1998-06-26 2000-01-14 Hitachi Ltd 手書き文字認識装置及び方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03158986A (ja) * 1989-11-17 1991-07-08 Hitachi Ltd パターン認識装置
JPH06139412A (ja) * 1992-10-26 1994-05-20 Seiko Epson Corp パターン認識辞書の作成方法およびその作成装置
JPH09223197A (ja) * 1996-02-15 1997-08-26 Fujitsu Ltd 文字認識装置
WO2013139032A1 (en) * 2012-03-23 2013-09-26 Microsoft Corporation Rotation-free recognition of handwritten characters
CN107368827B (zh) * 2017-04-01 2020-09-15 阿里巴巴集团控股有限公司 字符识别方法及装置、用户设备、服务器
CN108898137B (zh) * 2018-05-25 2022-04-12 黄凯 一种基于深度神经网络的自然图像字符识别方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000011094A (ja) 1998-06-26 2000-01-14 Hitachi Ltd 手書き文字認識装置及び方法

Also Published As

Publication number Publication date
JP2020091602A (ja) 2020-06-11
CN111275138B (zh) 2024-01-16
CN111275138A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN109409398B (zh) 图像处理装置、图像处理方法以及存储介质
US10719743B2 (en) License plate reader using optical character recognition on plural detected regions
US9189694B2 (en) Image processing device and image processing method
JP6517666B2 (ja) 物品管理装置、その方法、及びそのプログラム
US20150262030A1 (en) Image processing device, image processing method, and image processing program
JP7102103B2 (ja) 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
US11797857B2 (en) Image processing system, image processing method, and storage medium
CN110705596A (zh) 白屏检测方法、装置、电子设备及存储介质
US10509934B1 (en) Methods and apparatus for improving QR code locator detectability and/or finding the corners of a locator pattern
CN111967490A (zh) 用于地图检测的模型训练方法和地图检测方法
JP2015210542A (ja) 携帯型光学式読取装置、該携帯型光学式読取装置を用いる光学式読取方法、及びコンピュータプログラム
JP2018081629A (ja) 判定装置、判定方法および判定プログラム
JP2020017156A (ja) 文字認識装置、文字認識プログラムおよび文字認識方法
JP7087971B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
US11922680B2 (en) Image determination device, image determination method, and non-transitory computer readable medium storing program
KR20190056873A (ko) 다중 신경망을 활용한 객체 검출 장치 및 그 방법과, 객체 검출 학습 방법
JP2002163637A (ja) 画像検査装置及び画像検査方法
CN112232295B (zh) 一种新增目标船只的确认方法、装置及电子设备
US11961218B2 (en) Machine vision systems and methods for automatically generating one or more machine vision jobs based on region of interests (ROIs) of digital images
CN115526859A (zh) 生产缺陷识别的方法、分布式处理平台、设备及存储介质
US11671565B2 (en) Image processing system, image processing device, image processing method, and non-transitory computer readable medium storing program
CN111402341A (zh) 相机参数确定方法、装置、电子设备及可读存储介质
JP2020047138A (ja) 情報処理装置
CN114998906B (zh) 文本检测方法、模型的训练方法、装置、电子设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220523

R150 Certificate of patent or registration of utility model

Ref document number: 7087971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150