JP7166505B1

JP7166505B1 - 画像フィルタ生成システム、画像フィルタ生成装置、推論装置、推論方法及びプログラム

Info

Publication number: JP7166505B1
Application number: JP2022547921A
Authority: JP
Inventors: 大樹阿多; 大輔安味; 諭名女松
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2022-02-15
Filing date: 2022-02-15
Publication date: 2022-11-07
Anticipated expiration: 2042-02-15
Also published as: US20240420494A1; JPWO2023157092A1; WO2023157092A1; CN118661210A

Abstract

物品画像データ取得部（３２０）は、ＯＣＲを行う物品画像データを取得する。推論結果データ生成部（３３０）は、学習済モデルにＯＣＲを行う物品画像データを入力して第１推論結果データと第２推論結果データとを生成する。推論結果データ出力部（３４０）は、第１推論結果データと第２推論結果データとを出力する。画像フィルタ生成部（１３０）は、第１推論結果データに基づく第１画像フィルタと第２推論結果データに基づく第２画像フィルタとを生成する。画像フィルタ出力部（１４０）は、第１画像フィルタと第２画像フィルタとを出力する。

Description

本開示は、画像フィルタ生成システム、画像フィルタ生成装置、推論装置、推論方法及びプログラムに関する。

従来、撮像部材で撮像した物品に記載された文字を認識する所謂ＯＣＲ（Optical Character Recognition/Reader）において、当該物品の撮像画像に画像処理を行うときに機械学習によって学習した装置を用いることが知られている。

特許文献１には、画像処理において適用する画像変換フィルタの順序計画を出力する順序計画部にニューラルネットワークを用いる画像処理装置が開示されている。特許文献１では、学習制御部が学習用画像と画像変換フィルタ群を組み合わせて構成可能な順序パターンとのペアである学習データペアの群によってニューラルネットワークを学習させている。具体的には、学習制御部が学習データペアに含まれる学習用画像をニューラルネットワークに入力して出力した順序計画と当該学習データペアに含まれる順序パターンとから求めた誤差である損失を当該ニューラルネットワークにフィードバックすることで学習させている。

特許文献２には、入力撮影画像のための適正画像を生成する画像補正装置が開示されている。特許文献２では、サンプル画像から区分けされた小領域画像を適正画像にする空間フィルタのパラメータを教師値として学習させることにより統計的学習則を構築する。また、特許文献２では、入力撮影画像を区分けした小領域画像に含まれている画素の画素値を統計的学習則に入力して出力されたパラメータに基づいて作成された空間フィルタを用いて小領域画像を補正する。

特開２０２０－１５４６００号公報特開２００９－１０８５３号公報

特許文献１、２に記載された装置では、入力された画像の画像処理に最も適した画像フィルタの組合せ、パラメータを一つだけ推論している。このため、特許文献１、２に記載された装置では、ＯＣＲの実際の運用において発生する環境のゆらぎ、例えば、朝・夕の時間帯における工場の窓からの光の差し込み、ワークが撮像される位置、向き、回転角度のズレ、ワークの個体差といった事象に対応できず、文字を誤認識する虞がある。

本開示は、上記実情に鑑みてなされたものであり、文字の誤認識を低減することを目的とする。

上記目的を達成するため、本開示に係る画像フィルタ生成システムは、撮像部材が撮像した物品の画像データである物品画像データに対してＯＣＲを行う前の画像処理に用いる画像フィルタを生成する。画像フィルタ生成システムは、画像フィルタを生成する画像フィルタ生成装置と、予め取得した物品画像データと物品画像データの画像処理に用いた画像フィルタとの関係性を学習する学習装置と、ＯＣＲを行う物品画像データの画像処理に適した画像フィルタを推論する推論装置とを備える。学習装置は、物品画像データ、物品画像データの画像処理に用いた画像フィルタの組合せ及び画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、画像フィルタ関連データに基づく画像フィルタを用いて物品画像データの画像処理を行ったときのＯＣＲで出力された文字認識の得点を示すデータであるＯＣＲ得点データ、を含む学習用データを取得する学習用データ取得部と、学習用データを用いた機械学習によって物品画像データと画像フィルタ関連データとＯＣＲ得点データとの関係性を示す学習済モデルを生成する学習済モデル生成部と、学習済モデルを出力する学習済モデル出力部とを含む。推論装置は、ＯＣＲを行う物品画像データを取得する物品画像データ取得部と、学習済モデルにＯＣＲを行う物品画像データを入力して、ＯＣＲを行う物品画像データの画像処理に適した画像フィルタの組合せ及び画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第１推論結果データ、ならびに、第１推論結果データとは異なる第２推論結果データ、を生成する推論結果データ生成部と、第１推論結果データと第２推論結果データとを出力する推論結果データ出力部とを含む。画像フィルタ生成装置は、第１推論結果データに基づく画像フィルタである第１画像フィルタと第２推論結果データに基づく画像フィルタである第２画像フィルタとを生成する画像フィルタ生成部と、第１画像フィルタと第２画像フィルタとを出力する画像フィルタ出力部とを含む。

本開示によれば、推論装置は、第１推論結果データと第２推論結果データとを生成、出力し、画像フィルタ生成装置は、第１画像フィルタと第２画像フィルタとを生成、出力する。このため、ユーザは、第１画像フィルタと第２画像フィルタとの何れかの画像フィルタを用いて物品画像データの画像処理を行うことができ、ＯＣＲを行ったときの文字認識の得点が最も高い画像フィルタを選択できる。この結果、本開示に係る画像フィルタ生成システムは、第１推論結果データと第２推論結果データとを生成しない画像フィルタ生成システムよりも文字の誤認識を低減できる。

実施の形態１に係る画像フィルタ生成システムの全体説明図実施の形態１に係る画像フィルタ生成システムの機能構成を示す図実施の形態１に係る各装置のハードウェア構成を示すブロック図実施の形態１に係る学習用データの説明図実施の形態１に係る推論結果データを出力する処理の概要を説明するための図実施の形態１に係る学習済モデル生成処理のフローチャート実施の形態１に係る推論結果データ生成処理のフローチャート実施の形態１に係る画像フィルタ生成処理のフローチャート実施の形態１に係る画像フィルタ生成システムの作用説明図実施の形態２に係る推論結果データ生成処理のフローチャート実施の形態２に係る画像フィルタ生成処理のフローチャート実施の形態３に係るビジョンセンサの機能構成を示す図

以下、本開示を実施するための形態に係る画像フィルタ生成システム、画像フィルタ生成装置、推論装置、推論方法及びプログラムについて図面を参照して詳細に説明する。なお、図中同一又は相当する部分には同じ符号を付す。

［実施の形態１］
（実施の形態１に係る画像フィルタ生成システム１について）
本開示の実施の形態１に係る画像フィルタ生成システム１は、例えば、工場で生産された製品、部品といった所謂ワークを撮像した画像データについてＯＣＲ（Optical Character Recognition/Reader）を行う前の画像処理に用いる画像フィルタを生成するシステムである。

図１に示すように、画像フィルタ生成システム１は、撮像装置の一例であって、撮像した画像データの画像処理に用いる画像フィルタを生成する画像フィルタ生成装置の一例としてのビジョンセンサ１００を備える。また、画像フィルタ生成システム１は、予め取得した物品の画像データである物品画像データと物品画像データに対してＯＣＲを行う前の画像処理に用いた画像フィルタとの関係性を学習する学習装置２００を備える。また、画像フィルタ生成システム１は、ＯＣＲを行う物品画像データの画像処理に適した画像フィルタを推論する推論装置３００を備える。また、画像フィルタ生成システム１は、データを記憶する記憶装置４００を備える。ビジョンセンサ１００、学習装置２００、推論装置３００及び記憶装置４００は、図示しないＬＡＮ（Local Area Network）を介してデータの送受信が可能となっている。

画像フィルタ生成システム１では、先ず、ビジョンセンサ１００が予め撮像して得られた物品画像データについて予め生成した画像フィルタを用いて画像処理を行い、ＯＣＲを試行する。また、ビジョンセンサ１００は、ＯＣＲを試行した物品画像データの試行結果に基づく学習用データを学習装置２００に出力し、学習装置２００は、取得した学習用データを用いた機械学習によって学習済モデルを生成する。また、学習装置２００は、生成した学習済モデルを記憶装置４００に出力して記憶させ、推論装置３００は、記憶装置４００が記憶している学習用モデルを取得する。

また、ビジョンセンサ１００は、実際にＯＣＲを行う物品を撮像したとき、推論装置３００に物品画像データを出力する。また、推論装置３００は、取得した物品画像データを学習用モデルに入力して当該物品画像データの画像処理に適した画像フィルタの推論結果を示すデータである推論結果データを生成してビジョンセンサ１００に出力する。そして、ビジョンセンサ１００は、取得した推論結果データに基づく画像フィルタを生成し、生成した画像フィルタを用いて物品画像データの画像処理を行った後、ＯＣＲを行う。

（実施の形態１に係るビジョンセンサ１００について）
図２に示すように、ビジョンセンサ１００は、物品を撮像する撮像部材の一例としてのカメラ１１０を含む。また、ビジョンセンサ１００は、複数種類の画像フィルタの組合せ及び各画像フィルタのパラメータを示すデータである画像フィルタ関連データを生成する画像フィルタ関連データ生成部１２０を含む。また、ビジョンセンサ１００は、画像フィルタを生成する画像フィルタ生成部１３０、画像フィルタを出力する画像フィルタ出力部１４０、画像処理を行う画像処理部１５０、ＯＣＲを行うＯＣＲ部１６０を含む。また、ビジョンセンサ１００は、物品画像データを出力する物品画像データ出力部１７０、学習用データを出力する学習用データ出力部１８０、推論結果データを取得する推論結果データ取得部１９０を含む。

（実施の形態１に係る学習装置２００について）
学習装置２００は、例えば、パーソナルコンピュータ、サーバコンピュータ、スーパーコンピュータといったコンピュータ装置である。学習装置２００は、学習用データを取得する学習用データ取得部２１０、学習済モデルを生成する学習済モデル生成部２２０、学習済モデルを出力する学習済モデル出力部２３０を含む。学習済モデル生成部２２０は、後述する報酬を算出する報酬算出部２２１、後述する価値関数を更新する価値関数更新部２２２を含む。

（実施の形態１に係る推論装置３００について）
推論装置３００は、学習装置２００と同様のコンピュータ装置である。推論装置３００は、学習済モデルを取得する学習済モデル取得部３１０、物品画像データを取得する物品画像データ取得部３２０、推論結果データを生成する推論結果データ生成部３３０、推論結果データを出力する推論結果データ出力部３４０を含む。

（実施の形態１に係る記憶装置４００について）
記憶装置４００は、例えば、ＬＡＮで接続された通信ネットワーク上のＨＤＤ（Hard Disk Drive）、所謂ＮＡＳ（Network Attached Storage）である。記憶装置４００は、学習済モデルを記憶する学習済モデル記憶部４１０を含む。

（実施の形態１に係る学習装置２００のハードウェア構成について）
図３に示すように、学習装置２００は、制御プログラム５９に従って処理を実行する制御部５１を備える。制御部５１は、ＣＰＵ（Central Processing Unit）を備える。制御部５１は、制御プログラム５９に従って、図２に示す、学習済モデル生成部２２０、報酬算出部２２１、価値関数更新部２２２として機能する。

図３に戻り、学習装置２００は、制御プログラム５９をロードし、制御部５１の作業領域として用いられる主記憶部５２を備える。主記憶部５２は、ＲＡＭ（Random Access Memory）を備える。

また、学習装置２００は、制御プログラム５９を予め記憶する外部記憶部５３を備える。外部記憶部５３は、制御部５１の指示に従って、このプログラムが記憶するデータを制御部５１に供給し、制御部５１から供給されたデータを記憶する。外部記憶部５３は、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）等の不揮発性メモリを備える。

また、学習装置２００は、ユーザに操作される操作部５４を備える。操作部５４を介して、入力された情報が制御部５１に供給される。操作部５４は、キーボード、マウス、タッチパネル等の情報入力部品を備える。

また、学習装置２００は、操作部５４を介して入力された情報及び制御部５１が出力した情報を表示する表示部５５を備える。表示部５５は、ＬＣＤ（Liquid Crystal Display）、有機ＥＬ（Electro-Luminescence）ディスプレイ等の表示装置を備える。

図３に戻り、学習装置２００は、情報を送受信する送受信部５６を備える。送受信部５６は、ネットワークに接続する通信網終端装置、無線通信装置等の情報通信部品を備える。送受信部５６は、図２に示す、学習用データ取得部２１０、学習済モデル出力部２３０として機能する。

図３に戻り、学習装置２００では、主記憶部５２、外部記憶部５３、操作部５４、表示部５５及び送受信部５６はいずれも内部バス５０を介して制御部５１に接続されている。

学習装置２００は、制御部５１が主記憶部５２、外部記憶部５３、操作部５４、表示部５５及び送受信部５６を資源として用いることによって、図２に示す上記の各部２１０、２２０～２２２、２３０の機能を実現する。例えば、学習装置２００は、学習用データ取得部２１０が行う学習用データ取得ステップを実行する。また、例えば、学習装置２００は、学習済モデル生成部２２０が行う学習済モデル生成ステップ、報酬算出部２２１が行う報酬算出ステップ、価値関数更新部２２２が行う価値関数更新ステップを実行する。また、例えば、学習装置２００は、学習済モデル出力部２３０が行う学習済モデル出力ステップを実行する。

（実施の形態１に係る推論装置３００のハードウェア構成について）
また、図３に示すように、推論装置３００も学習装置２００と同様に、制御部５１、主記憶部５２、外部記憶部５３、操作部５４、表示部５５、送受信部５６を備える。制御部５１は、制御プログラム５９に従って、図２に示す、推論結果データ生成部３３０として機能する。また、送受信部５６は、図２に示す、学習済モデル取得部３１０、物品画像データ取得部３２０、推論結果データ出力部３４０として機能する。

図３に戻り、推論装置３００は、制御部５１が主記憶部５２、外部記憶部５３、操作部５４、表示部５５及び送受信部５６を資源として用いることによって、図２に示す上記の各部３１０～３３０の機能を実現する。例えば、推論装置３００は、学習済モデル取得部３１０が行う学習済モデル取得ステップ、物品画像データ取得部３２０が行う物品画像データ取得ステップ、推論結果データ生成部３３０が行う推論結果データ生成ステップ、推論結果データ出力部３４０が行う推論結果データ出力ステップを実行する。

（実施の形態１に係るビジョンセンサ１００のハードウェア構成について）
また、図示は省略するが、ビジョンセンサ１００は、制御部５１、主記憶部５２、外部記憶部５３、操作部５４、送受信部５６を備える。制御部５１は、制御プログラム５９に従って、図２に示す、画像フィルタ関連データ生成部１２０、画像フィルタ生成部１３０、画像フィルタ出力部１４０、画像処理部１５０、ＯＣＲ部１６０として機能する。また、送受信部５６は、図２に示す、物品画像データ出力部１７０、学習用データ出力部１８０、推論結果データ取得部１９０として機能する。

図３に戻り、ビジョンセンサ１００は、制御部５１が主記憶部５２、外部記憶部５３、操作部５４及び送受信部５６を資源として用いることによって、図２に示す上記の各部１２０～１９０の機能を実現する。例えば、ビジョンセンサ１００は、画像フィルタ関連データ生成部１２０が行う画像フィルタ関連データ生成ステップ、画像フィルタ生成部１３０が行う画像フィルタ生成ステップ、画像フィルタ出力部１４０が行う画像フィルタ出力ステップを実行する。また、例えば、ビジョンセンサ１００は、画像処理部１５０が行う画像処理ステップ、ＯＣＲ部１６０が行うＯＣＲステップを実行する。また、例えば、ビジョンセンサ１００は、物品画像データ出力部１７０が行う物品画像データ出力ステップ、学習用データ出力部１８０が行う学習用データ出力ステップ、推論結果データ取得部１９０が行う推論結果データ取得ステップを実行する。

（実施の形態１に係るビジョンセンサ１００の機能構成の詳細について）
図２に戻り、カメラ１１０は、物品の一例として、予め定めた設計値の許容範囲内のワーク、すなわち、良品のワークを撮像して物品画像データを生成する。ここで、カメラ１１０は、製造時に実際の製造ラインで搬送されるワークを撮像してもよく、実際の製造ラインと近似する製造ラインで搬送されるワークを撮像してもよく、製造時の環境の模擬環境でワークを撮像してもよい。なお、模擬環境でワークを撮像する場合、カメラ１１０は、例えば、製造時に想定される環境のゆらぎ、具体的には、朝・昼・夕といった時間帯、搬送されるワークの向き、回転角度を模倣してワークを複数回撮像することで、複数種類の物品画像データを生成してもよい。

画像フィルタ関連データ生成部１２０は、カメラ１１０から予め取得した物品画像データにＯＣＲを試行するとき、画像処理に用いる画像フィルタの画像フィルタ関連データを生成する。なお、ＯＣＲを試行する物品画像データは、上述した過去の製造時に実際に撮像したワークの物品画像データ、模擬環境で撮像したワークの物品画像データが含まれる。また、画像フィルタ関連データが示す複数種類の画像フィルタの組合せは、例えば、二値化、膨張、収縮、平滑化フィルタ、ノイズ除去フィルタ、輪郭抽出フィルタ、ハイパスフィルタ、ローパスフィルタ、クリップ、エッジ強調用フィルタといった公知の画像フィルタのうちから選択した複数種類の画像フィルタの組合せである。また、画像フィルタ関連データが示す各画像フィルタのパラメータは、例えば、閾値、カーネルサイズ、ゲイン、最大値、最小値といった公知のパラメータのうちから選択した複数種類のパラメータの値の組合せである。

なお、画像フィルタ関連データ生成部１２０は、例えば、過去の製造時に実際に使用した画像フィルタから画像フィルタ関連データを生成してもよい。また、画像フィルタ関連データ生成部１２０は、例えば、乱数を用いて画像フィルタの組合せと各画像フィルタのパラメータを選択して画像フィルタ関連データを生成してもよい。

画像フィルタ生成部１３０は、画像フィルタ関連データに基づいて画像フィルタを生成する。ここで、例えば、画像フィルタ関連データが示す画像フィルタの組合せがノイズ除去フィルタ及び輪郭抽出フィルタの組合せであり、ノイズ除去フィルタのパラメータが第１パラメータであり、輪郭抽出フィルタのパラメータが第２パラメータである場合について考える。この場合、画像フィルタ生成部１３０は、第１パラメータを設定したノイズ除去フィルタと第２パラメータを設定した輪郭抽出フィルタとを組み合わせた画像フィルタを生成する。

画像フィルタ出力部１４０は、画像フィルタ生成部１３０が画像フィルタを生成したとき、生成された画像フィルタを画像処理部１５０に出力する。
画像処理部１５０は、画像フィルタ出力部１４０から取得した画像フィルタを用いて物品画像データの画像処理を行う。
ＯＣＲ部１６０は、画像処理が行われた物品画像データに対してＯＣＲを行うとともに、文字認識の信頼度を示す値である得点を出力する。

物品画像データ出力部１７０は、カメラ１１０から取得したＯＣＲを行う物品画像データを推論装置３００に出力する。
学習用データ出力部１８０は、学習用データを学習装置２００に出力する。ここで、学習用データは、ＯＣＲを試行した物品画像データと、当該物品画像データの画像処理に用いた画像フィルタを特定可能な画像フィルタ関連データとを含む。さらに、学習用データは、当該画像フィルタ関連データに基づく画像フィルタで物品画像データの画像処理を行った後にＯＣＲを試行して出力された得点を示すデータであるＯＣＲ得点データを含む。よって、学習用データは、過去の製造時のワークについての物品画像データと画像フィルタ関連データとＯＣＲ得点データとを含むデータである。

ここで、学習用データ出力部１８０が学習用データを学習装置２００に出力するためにビジョンセンサ１００が学習用データを生成する処理について説明する。先ず、図４に示すように、自然数をｍとしたとき、カメラ１１０が生成したｍ種類の物品画像データをＩＭＧ－１、ＩＭＧ－２、…、ＩＭＧ－ｍとする。また、自然数をｎとしたとき、画像フィルタ関連データ生成部１２０が生成したｎ種類の画像フィルタ関連データをＦ／Ｐ－００１、Ｆ／Ｐ－００２、…Ｆ／Ｐ－００ｎとする。画像フィルタ生成部１３０は、ｎ種類の画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…Ｆ／Ｐ－００ｎに基づくｎ種類の画像フィルタを生成する。また、画像処理部１５０は、各物品画像データＩＭＧ－１、ＩＭＧ－２、…、ＩＭＧ－ｍにｎ種類の画像フィルタを用いて画像処理を行い、ＯＣＲ部１６０は、ｍ×ｎ種類の画像処理済の物品画像データにＯＣＲを行い、ｍ×ｎ種類のＯＣＲ得点データを出力する。

ここで、各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…、Ｆ／Ｐ－００ｎに基づく画像フィルタで画像処理及びＯＣＲを行った第１物品画像データＩＭＧ－１のＯＣＲ得点データをＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２、…、ＩＭＧ－１＿Ｆ／Ｐ－００ｎとする。また、各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…、Ｆ／Ｐ－００ｎに基づく画像フィルタで画像処理及びＯＣＲを行った第２物品画像データＩＭＧ－２のＯＣＲ得点データをＩＭＧ－２＿Ｆ／Ｐ－００１、ＩＭＧ－２＿Ｆ／Ｐ－００２、…、ＩＭＧ－２＿Ｆ／Ｐ－００ｎとする。また、各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…、Ｆ／Ｐ－００ｎに基づく画像フィルタで画像処理及びＯＣＲを行った第ｍ物品画像データＩＭＧ－ｍのＯＣＲ得点データをＩＭＧ－ｍ＿Ｆ／Ｐ－００１、ＩＭＧ－ｍ＿Ｆ／Ｐ－００２、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００ｎとする。

この結果、学習用データ出力部１８０は、学習用データとして、ｍ種類の物品画像データＩＭＧ－１、ＩＭＧ－２、…、ＩＭＧ－ｍと、ｎ種類の画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…Ｆ／Ｐ－００ｎと、ｍ×ｎ種類のＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２、…、ＩＭＧ－１＿Ｆ／Ｐ－００ｎ、ＩＭＧ－２＿Ｆ／Ｐ－００１、ＩＭＧ－２＿Ｆ／Ｐ－００２、…、ＩＭＧ－２＿Ｆ／Ｐ－００ｎ、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００１、ＩＭＧ－ｍ＿Ｆ／Ｐ－００２、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００ｎとを含むデータを出力することになる。

図２に戻り、推論結果データ取得部１９０は、推論装置３００から出力された推論結果データを取得する。なお、このとき、画像フィルタ生成部１３０は、推論結果データに基づいて画像フィルタを生成し、画像フィルタ出力部１４０は、画像フィルタを画像処理部１５０に出力する。また、画像処理部１５０は、取得した画像フィルタを用いて物品画像データの画像処理を行い、ＯＣＲ部１６０は、画像処理が行われた物品画像データに対してＯＣＲを行う。

（実施の形態１に係る学習装置２００の機能構成の詳細について）
学習用データ取得部２１０は、ビジョンセンサ１００から出力された学習用データを取得する。学習用データ取得部２１０は、例えば、学習用データとして、ｍ種類の物品画像データＩＭＧ－１、ＩＭＧ－２、…、ＩＭＧ－ｍと、ｎ種類の画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…Ｆ／Ｐ－００ｎと、ｍ×ｎ種類のＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２、…、ＩＭＧ－１＿Ｆ／Ｐ－００ｎ、ＩＭＧ－２＿Ｆ／Ｐ－００１、ＩＭＧ－２＿Ｆ／Ｐ－００２、…、ＩＭＧ－２＿Ｆ／Ｐ－００ｎ、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００１、ＩＭＧ－ｍ＿Ｆ／Ｐ－００２、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００ｎとを含むデータを取得する。

学習済モデル生成部２２０は、取得した複数種類の学習用データを用いた機械学習によって物品画像データと画像フィルタ関連データとＯＣＲ得点データとの関係性を示す学習済モデルを生成する。学習済モデル生成部２２０は、機械学習として公知の強化学習（Reinforcement Learning）のアルゴリズムの一例であるＱ学習（Q-learning）を用いて学習済モデルを生成する。ここで、強化学習とは、ある環境内における行動主体であるエージェントが環境のパラメータである現在の状態を観測して取るべき行動を決定する機械学習である。強化学習では、エージェントの行動により環境が動的に変化し、エージェントには環境の変化に応じて報酬が与えられる。そして、強化学習では、エージェントがこれを繰り返し、一連の行動を通じて報酬が最も多く得られる行動方針が学習される。

また、Ｑ学習では、報酬が最も多く得られる行動方針として価値関数の一例としての行動価値関数に基づく行動価値が算出される。ここで、時刻ｔにおける環境の状態をｓ_ｔ、時刻ｔにおける行動をａ_ｔ、行動ａ_ｔによって変化した状態をｓ_ｔ＋１、状態がｓ_ｔからｓ_ｔ＋１に変化することによって得られる報酬をｒ_ｔ＋１、割引率をγ、学習係数をαとし、０＜γ≦１，０＜α≦１が成立するものとする。そして、行動価値関数をＱ（ｓ_ｔ，ａ_ｔ）とした場合、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）の一般的な更新式は以下の数１で示される。

また、Ｑ学習では、行動価値をＱとした場合、時刻ｔ＋１における最も価値の高い行動ａ_ｔ＋１の行動価値Ｑが、時刻ｔにおいて実行された行動ａ_ｔの行動価値Ｑよりも大きければ行動価値Ｑを大きくし、行動ａ_ｔ＋１の行動価値Ｑが行動ａ_ｔの行動価値Ｑよりも小さければ行動価値Ｑを小さくする。換言すれば、Ｑ学習では、時刻ｔにおける行動ａ_ｔの行動価値Ｑを、時刻ｔ＋１における最良の行動価値に近づけるために、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を更新する。その結果、ある環境内における最良の行動価値Ｑが、それ以前の環境における行動価値Ｑに順次伝播していく。

学習済モデル生成部２２０は、学習用データに含まれる物品画像データに基づく値を状態ｓ_ｔに当てはめるとともに、学習用データに含まれる画像フィルタ関連データに基づく値を行動ａ_ｔに当てはめることで、Ｑ学習を用いて学習済モデルを生成する。なお、物品画像データに基づく値の状態ｓ_ｔへの当てはめについては任意の当てはめが可能である。例えば、物品画像データを示す数値をｘ、予め定められた定数をｕとする。このとき、状態ｓ_ｔについて、ｓ_ｔ＝ｕ×ｘが成立してもよい。

また、画像フィルタ関連データに基づく値の行動ａ_ｔへの当てはめについては、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）と状態ｓ_ｔとに基づいて行動ａ_ｔを算出可能であり且つ行動ａ_ｔに基づいて画像フィルタの組合せ及び各画像フィルタのパラメータが特定可能である限りにおいて任意の当てはめが可能である。例えば、画像フィルタ関連データを示す数値をｙ、予め定められた定数をｖとする。このとき、行動ａ_ｔについて、ａ_ｔ＝ｖ×ｙが成立してもよい。

報酬算出部２２１は、学習用データに含まれる物品画像データを示す数値と、画像フィルタ関連データを示す数値と、ＯＣＲ得点データに基づく得点の値に基づいて報酬ｒ_ｔ＋１を算出する。例えば、報酬算出部２２１は、２種類の学習用データを比較したとき、物品画像データを示す数値と画像フィルタ関連データを示す数値とのうちの少なくとも何れか一の数値の変化によって、ＯＣＲ得点データに基づく得点の値が変化すれば与える報酬ｒ_ｔ＋１も変化させる。具体的には、報酬算出部２２１は、得点の値が増加していれば報酬ｒ_ｔ＋１を増大し、例えば、＋１の報酬を与える一方、得点の値が減少していれば報酬ｒ_ｔ＋１を減少し、例えば、－１の報酬を与える。

ここで、例えば、第１物品画像データＩＭＧ－１と、２種類の画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２とについて考える。この場合、各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２を示す数値が異なることで、ＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２に基づく得点の値も異なる。このため、報酬算出部２２１は、ＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２に基づく得点の値をＳＣ１、ＳＣ２とした場合、画像フィルタ関連データがＦ／Ｐ－００１からＦ／Ｐ－００２に変化したとき、（ＳＣ２－ＳＣ１）＞０であれば＋１の報酬を与える一方、（ＳＣ２－ＳＣ１）≦０であれば－１の報酬を与える。

価値関数更新部２２２は、報酬算出部２２１が算出した報酬ｒ_ｔ＋１に基づいて、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を更新する。また、価値関数更新部２２２は、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を示すデータを学習済モデルとして生成する。

学習済モデル生成部２２０は、学習用データ取得部２１０が１００から学習用データを取得する度に、報酬ｒ_ｔ＋１の算出と行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）の更新とを繰り返している。また、学習済モデル生成部２２０は、上述した数１に示す更新式で行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を更新する度に、更新した行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を示すデータを学習済モデルとして生成する。
学習済モデル出力部２３０は、生成した学習済モデル、すなわち、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を示すデータを記憶装置４００に出力して記憶させる。

（実施の形態１に係る推論装置３００の機能構成の詳細について）
学習済モデル取得部３１０は、記憶装置４００が記憶している学習済モデルを取得する。
物品画像データ取得部３２０は、ビジョンセンサ１００から出力されたＯＣＲを行う物品画像データを取得する。本実施の形態では、物品画像データ取得部３２０が取得するＯＣＲを行う物品画像データは、ビジョンセンサ１００においてＯＣＲの運用を行う前に実際の製造ラインで予め撮像しておいたワークの物品画像データである。具体的には、ＯＣＲを行う物品画像データには、ワークに記載された文字がボケている物品画像データ、室内が明るい状態で撮像したワークの物品画像データ、室内が暗い状態で撮像したワークの物品画像データといった画像処理が必要な複数種類の物品画像データが含まれる。なお、画像処理が必要な物品画像データには、実際の製造ラインにおいて画像が撮像される確率を示すデータが含まれていてもよい。

推論結果データ生成部３３０は、学習済モデルにＯＣＲを行う物品画像データを入力して推論結果データとして第１推論結果データと第１推論結果データとは異なる第２推論結果データを生成する。

ここで、ＯＣＲを行う物品画像データを入力された学習済モデルが第１推論結果データと第２推論結果データとを出力する処理の概要について説明する。先ず、学習装置２００が機械学習に用いた学習用データは、４種類の物品画像データＩＭＧ－１、ＩＭＧ－２、ＩＭＧ－３、ＩＭＧ－４、５種類の画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、Ｆ／Ｐ－００３、Ｆ／Ｐ－００４、Ｆ／Ｐ－００５、２０種類のＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２、…、ＩＭＧ－１＿Ｆ／Ｐ－００５、ＩＭＧ－２＿Ｆ／Ｐ－００１、ＩＭＧ－２＿Ｆ／Ｐ－００２、…、ＩＭＧ－２＿Ｆ／Ｐ－００５、…、ＩＭＧ－４＿Ｆ／Ｐ－００１、ＩＭＧ－４＿Ｆ／Ｐ－００２、…、ＩＭＧ－４＿Ｆ／Ｐ－００５を含むデータであったとする。

また、図５に示すように、２０種類のＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２、…、ＩＭＧ－１＿Ｆ／Ｐ－００５、ＩＭＧ－２＿Ｆ／Ｐ－００１、ＩＭＧ－２＿Ｆ／Ｐ－００２、…、ＩＭＧ－２＿Ｆ／Ｐ－００５、…、ＩＭＧ－４＿Ｆ／Ｐ－００１、ＩＭＧ－４＿Ｆ／Ｐ－００２、…、ＩＭＧ－４＿Ｆ／Ｐ－００５に基づく得点の値が、９９、６０、…、０、７０、１０、…、１１、…、２０、９１、…、９１であったとする。

また、図５に示すように、ＯＣＲを行う物品画像データは、第１物品画像データＩＭＧ－１と同様である確率が９％、第２物品画像データＩＭＧ－２と同様である確率が６０％、第３物品画像データＩＭＧ－３と同様である確率が３０％、第４物品画像データＩＭＧ－４と同様である確率が１％であるとする。

この場合、図５に示すように、第１物品画像データＩＭＧ－１は、第１画像フィルタ関連データＦ／Ｐ－００１に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が９９点で最も大きくなる。また、第２物品画像データＩＭＧ－２は、第３画像フィルタ関連データＦ／Ｐ－００３に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が９８点で最も大きくなる。また、第３物品画像データＩＭＧ－３は、第２画像フィルタ関連データＦ／Ｐ－００２に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が１００点で最も大きくなる。また、第４物品画像データＩＭＧ－４は、第２画像フィルタ関連データＦ／Ｐ－００２又は第５画像フィルタ関連データＦ／Ｐ－００５に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が９１点で最も大きくなる。

ここで、例えば、学習済モデルには、推論結果データが２種類、得点の値が９０点以上という条件が推論結果データ生成部３３０から与えられている場合について考える。この場合、先ず、学習済モデルは、画像処理及びＯＣＲを行ったときの得点の値が９０点以上となる各物品画像データＩＭＧ－１～ＩＭＧ－４が何種類であったかを示す網羅率が最も高くなる２種類の画像フィルタ関連データの組合せの候補を特定する。

具体的には、学習済モデルは、２種類の画像フィルタ関連データでは網羅率１００％となる組合せがないので、網羅率７５％となる第１画像フィルタ関連データＦ／Ｐ－００１と第２画像フィルタ関連データＦ／Ｐ－００２とを第１候補、第１画像フィルタ関連データＦ／Ｐ－００１と第３画像フィルタ関連データＦ／Ｐ－００３とを第２候補として算出する。なお、第１候補の各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２に基づく画像フィルタを用いて画像処理及びＯＣＲを行ったときの得点の最大値は、第１物品画像データＩＭＧ－１が９９点、第２物品画像データＩＭＧ－２が７０点、第３物品画像データＩＭＧ－３が１００点、第４物品画像データＩＭＧ－４が９１点である。また、第２候補の各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００３に基づく画像フィルタを用いて画像処理及びＯＣＲを行ったときの得点の最大値は、第１物品画像データＩＭＧ－１が９９点、第２物品画像データＩＭＧ－２が９８点、第３物品画像データＩＭＧ－３が９１点、第４物品画像データＩＭＧ－４が８０点である。

そして、学習済モデルは、実際の製造ラインにおいて各物品画像データＩＭＧ－１～ＩＭＧ－４が得られる確率から第１候補と第２候補の得点の期待値を算出し、期待値が高い候補を推論結果データとして出力する。具体的には、第１候補の得点の期待値は、８１．８２点である（９９×０．０９＋７０×０．６０＋１００×０．３０＋９１×０．０１＝８１．８２）。一方、第２候補の得点の期待値は、９５．８１点である（９９×０．０９＋９８×０．６０＋９１×０．３０＋８０×０．０１＝９５．８１）。このため、学習済モデルは、第１推論結果データと第２推論結果データとして第２候補である第１画像フィルタ関連データＦ／Ｐ－００１と第３画像フィルタ関連データＦ／Ｐ－００３とを出力する。この結果、推論結果データ生成部３３０は、第１推論結果データと第２推論結果データとして第１画像フィルタ関連データＦ／Ｐ－００１と第３画像フィルタ関連データＦ／Ｐ－００３とを生成することになる。

なお、本実施の形態では、推論結果データ生成部３３０は、第１推論結果データと第２推論結果データとの２種類の推論結果データを生成しているが、３種類以上の推論結果データを生成してもよい。例えば、推論結果データ生成部３３０は、第１推論結果データと第２推論結果データと第３推論結果データとの３種類の推論結果データを生成してもよい。

この場合、学習済モデルは、網羅率１００％となる第１画像フィルタ関連データＦ／Ｐ－００１と第２画像フィルタ関連データＦ／Ｐ－００２と第３画像フィルタ関連データＦ／Ｐ－００３とを第１候補、第１画像フィルタ関連データＦ／Ｐ－００１と第３画像フィルタ関連データＦ／Ｐ－００３と第５画像フィルタ関連データＦ／Ｐ－００５とを第２候補として算出する。なお、第１候補の各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、Ｆ／Ｐ－００３に基づく画像フィルタを用いて画像処理及びＯＣＲを行ったときの得点の最大値は、第１物品画像データＩＭＧ－１が９９点、第２物品画像データＩＭＧ－２が９８点、第３物品画像データＩＭＧ－３が１００点、第４物品画像データＩＭＧ－４が９１点である。また、第２候補の各画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００３、Ｆ／Ｐ－００５に基づく画像フィルタを用いて画像処理及びＯＣＲを行ったときの得点の最大値は、第１物品画像データＩＭＧ－１が９９点、第２物品画像データＩＭＧ－２が９８点、第３物品画像データＩＭＧ－３及び第４物品画像データＩＭＧ－４が９１点である。

よって、第１候補の得点の期待値は、９８．６２点である（９９×０．０９＋９８×０．６０＋１００×０．３０＋９１×０．０１＝９８．６２）。一方、第２候補の得点の期待値は、９５．９２点である（９９×０．０９＋９８×０．６０＋９１×０．３０＋９１×０．０１＝９５．９２）。なお、この場合、各物品画像データＩＭＧ－１～ＩＭＧ－４が得られる確率が変化しても第１候補の得点の期待値のほうが第２候補の得点の期待値よりも高くなる。例えば、各物品画像データＩＭＧ－１～ＩＭＧ－４が得られる確率が各２５％であれば、第１候補の得点の期待値の９７点（（９９＋９８＋１００＋９１）／４＝９７）のほうが第２候補の得点の期待値の９４．７５点（（（９９＋９８＋９１＋９１）／４＝９４．７５）よりも高くなる。このため、学習済モデルは、第１推論結果データ、第２推論結果データ及び第３推論結果データとして第１候補である第１画像フィルタ関連データＦ／Ｐ－００１、第２画像フィルタ関連データＦ／Ｐ－００２及び第３画像フィルタ関連データＦ／Ｐ－００３を出力する。この結果、推論結果データ生成部３３０は、第１推論結果データ、第２推論結果データ及び第３推論結果データとして第１画像フィルタ関連データＦ／Ｐ－００１、第２画像フィルタ関連データＦ／Ｐ－００２及び第３画像フィルタ関連データＦ／Ｐ－００３とを生成することになる。

なお、推論結果データ生成部３３０は、得点の値が９０点以上という条件を学習済モデルに与えなくてもよい。この場合であっても、学習済モデルは、得点の期待値が最も高くなる画像フィルタ関連データＦ／Ｐ－００１～Ｆ／Ｐ－００５の組合せを特定することで第１推論結果データと第２推論結果データとを出力できる。
なお、物品画像データ取得部３２０が取得したＯＣＲを行う物品画像データには、実際の製造ラインにおいて画像が撮像される確率を示すデータが含まれていなくてもよい。この場合、推論結果データ生成部３３０は、取得した物品画像データが得られる確率が全て同一である前提で得点の期待値が最も高くなる画像フィルタ関連データＦ／Ｐ－００１～Ｆ／Ｐ－００５の組合せを特定してもよい。

図２に戻り、推論結果データ出力部３４０は、生成された推論結果データとして第１推論結果データと第２推論結果データとをビジョンセンサ１００に出力する。よって、ビジョンセンサ１００では、推論結果データ取得部１９０は、第１推論結果データと第２推論結果データとを取得する。また、画像フィルタ生成部１３０は、第１推論結果データに基づく第１画像フィルタと、第２推論結果データに基づく第２画像フィルタとを生成し、画像フィルタ出力部１４０は、第１画像フィルタと第２画像フィルタとを画像処理部１５０に出力する。そして、画像処理部１５０は、各画像フィルタを用いて物品画像データの画像処理を行い、ＯＣＲ部１６０は、各画像処理が行われた物品画像データに対してＯＣＲを行う。

（実施の形態１に係る学習済モデル生成処理について）
次に、フローチャートを用いて学習装置２００が学習済モデルを生成、出力する動作について説明する。学習装置２００は、電源をオンにすると、図６に示す学習済モデル生成処理の実行を開始する。先ず、学習用データ取得部２１０は、ビジョンセンサ１００から新たな学習用データを取得する（ステップＳ１０１）。例えば、学習用データ取得部２１０は、学習用データとして、図４に示すｍ種類の物品画像データＩＭＧ－１、ＩＭＧ－２、…、ＩＭＧ－ｍと、ｎ種類の画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、…Ｆ／Ｐ－００ｎと、ｍ×ｎ種類のＯＣＲ得点データＩＭＧ－１＿Ｆ／Ｐ－００１、ＩＭＧ－１＿Ｆ／Ｐ－００２、…、ＩＭＧ－１＿Ｆ／Ｐ－００ｎ、ＩＭＧ－２＿Ｆ／Ｐ－００１、ＩＭＧ－２＿Ｆ／Ｐ－００２、…、ＩＭＧ－２＿Ｆ／Ｐ－００ｎ、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００１、ＩＭＧ－ｍ＿Ｆ／Ｐ－００２、…、ＩＭＧ－ｍ＿Ｆ／Ｐ－００ｎとを含むデータを取得する。

次に、学習済モデル生成部２２０は、取得した複数種類の学習用データを用いた機械学習によって学習済モデルを生成する。具体的には、報酬算出部２２１は、取得した学習用データに含まれる物品画像データ、画像フィルタ関連データ及びＯＣＲ得点データに基づいて報酬ｒ_ｔ＋１を算出する（ステップＳ１０２）。例えば、報酬算出部２２１は、第１物品画像データＩＭＧ－１について画像フィルタ関連データがＦ／Ｐ－００１からＦ／Ｐ－００２に変化したとき、（ＳＣ２－ＳＣ１）＞０であれば＋１の報酬を与える一方、（ＳＣ２－ＳＣ１）≦０であれば－１の報酬を与える。

次に、価値関数更新部２２２は、算出した報酬ｒ_ｔ＋１に基づいて行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を更新する（ステップＳ１０３）。例えば、価値関数更新部２２２は、物品画像データを示す数値ｘから状態ｓ_ｔを算出するとともに、画像フィルタ関連データを示す数値ｙから行動ａ_ｔを算出する。そして、価値関数更新部２２２は、上述した数１に示す更新式で行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を更新する。そして、学習済モデル生成部２２０は、更新された行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を示すデータである学習済モデルを記憶装置４００に出力して学習済モデル記憶部４１０に記憶させ（ステップＳ１０４）、処理を終了する。

（実施の形態１に係る推論結果データ生成処理について）
次に、フローチャートを用いて推論装置３００が推論結果データを生成、出力する動作について説明する。推論装置３００は、電源をオンにすると、図７に示す推論結果データ生成処理の実行を開始する。先ず、学習済モデル取得部３１０は、記憶装置４００が記憶している学習済モデルを取得する（ステップＳ２０１）。次に、物品画像データ取得部３２０は、ビジョンセンサ１００から新たにＯＣＲを行う物品画像データを取得する（ステップＳ２０２）。次に、推論結果データ生成部３３０は、学習済モデルに新たにＯＣＲを行う物品画像データを入力して第１推論結果データと第２推論結果データとを生成する（ステップＳ２０３）。そして、推論結果データ出力部３４０は、生成された第１推論結果データと第２推論結果データとをビジョンセンサ１００に出力し（ステップＳ２０４）、処理を終了する。

（実施の形態１に係る画像フィルタ生成処理について）
次に、フローチャートを用いてビジョンセンサ１００が画像フィルタを生成、出力する動作について説明する。ビジョンセンサ１００は、電源をオンにすると、図８に示す画像フィルタ生成処理の実行を開始する。先ず、物品画像データ出力部１７０は、ＯＣＲを行う物品画像データを推論装置３００に出力する（ステップＳ３０１）。次に、推論結果データ取得部１９０は、推論装置３００から出力された第１推論結果データと第２推論結果データとを取得する（ステップＳ３０２）。次に、画像フィルタ生成部１３０は、第１推論結果データに基づく第１画像フィルタと、第２推論結果データに基づく第２画像フィルタとを生成する（ステップＳ３０３）。そして、画像フィルタ出力部１４０は、第１画像フィルタと第２画像フィルタとを画像処理部１５０に出力し（ステップＳ３０４）、処理を終了する。

以上説明したように、本実施の形態に係る画像フィルタ生成システム１によれば、ビジョンセンサ１００は、カメラ１１０が物品を撮像することで得られた物品画像データに対してＯＣＲを行う前の画像処理に用いる画像フィルタを生成する。

ここで、例えば、工場においてビジョンセンサで撮像したワークの画像データについてＯＣＲを行う場合について考える。この場合、ワークが正常な位置に配置されていない、工場内が明るすぎたり暗すぎたりするといったワークの撮像時の環境が原因で文字認識を行い易い物品画像データが得られず、文字を誤認識することがある。このため、従来の技術者は、ノウハウをベースとして様々な画像フィルタの組合せ、各画像フィルタのパラメータの設定といった試行を人手作業で行い、特定の環境でＯＣＲの信頼性が高い画像フィルタを予め複数種類準備し、現在の環境においてＯＣＲの得点が最も高いものを採用していた。しかしながら、準備する画像フィルタは、ワークの材質、色、形状といったワークの種類、組み合わせる画像フィルタの種類、パラメータを全て考慮する必要があるため、人手作業で準備、採用するには膨大な時間を要する問題がある。

これに対して、本実施の形態に係る画像フィルタ生成システム１では、ビジョンセンサ１００は、物品画像データが示すワークの種類、画像フィルタ関連データが示す組み合わせる画像フィルタの種類、パラメータを全て考慮して画像フィルタを自動的に生成する。
このようにすることで、本実施の形態に係る画像フィルタ生成システム１は、画像フィルタを人手作業で準備、採用するよりもＯＣＲを行う物品画像データを得てから画像フィルタを用いた画像処理を行うまでの時間を短縮できる。

また、本実施の形態に係る画像フィルタ生成システム１によれば、学習装置２００では、学習用データ取得部２１０は、ビジョンセンサ１００から物品画像データと画像フィルタ関連データとを含む学習用データを取得する。また、学習済モデル生成部２２０は、学習用データを用いた機械学習によって物品画像データと画像フィルタ関連データとの関係性を示す学習済モデルを生成し、学習済モデル出力部２３０は、学習済モデルを記憶装置４００に出力して記憶させる。

また、推論装置３００では、物品画像データ取得部３２０は、ＯＣＲを行う物品画像データを取得する。また、推論結果データ生成部３３０は、学習済モデル取得部３１０が記憶装置４００から取得した学習済モデルにＯＣＲを行う物品画像データを入力して第１推論結果データと第２推論結果データとを生成する。また、推論結果データ出力部３４０は、第１推論結果データと第２推論結果データとをビジョンセンサ１００に出力する。そして、ビジョンセンサ１００では、画像フィルタ生成部１３０は、第１推論結果データに基づく第１画像フィルタと第２推論結果データに基づく第２画像フィルタとを生成し、画像フィルタ出力部１４０は、第１画像フィルタと第２画像フィルタとを出力する。

したがって、ビジョンセンサ１００では、画像処理部１５０は、第１画像フィルタを用いて物品画像データの画像処理を行うとともに、第２画像フィルタを用いて物品画像データの画像処理を行うことができる。また、ＯＣＲ部１６０は、第１画像フィルタを用いた画像処理が行われた物品画像データに対してＯＣＲを行うとともに、第２画像フィルタを用いた画像処理が行われた物品画像データに対してＯＣＲを行うことができる。

ここで、例えば、図９に示すように、新たにＯＣＲを行う物品画像データをＩＭＧ－０とし、推論装置３００が生成、出力した第１推論結果データをＦ／Ｐ－００１、第２推論結果データをＦ／Ｐ－００２とする。この場合、ビジョンセンサ１００は、第１推論結果データＦ／Ｐ－００１に基づく第１画像フィルタと、第２推論結果データＦ／Ｐ－００２に基づく第２画像フィルタとを生成する。また、ビジョンセンサ１００は、物品画像データＩＭＧ－０に対して各画像フィルタを用いて画像処理及びＯＣＲを行う。このとき、出力される各ＯＣＲ得点データをＩＭＧ－０＿Ｆ／Ｐ－００１、ＩＭＧ－０＿Ｆ／Ｐ－００２とし、各ＯＣＲ得点データＩＭＧ－０＿Ｆ／Ｐ－００１、ＩＭＧ－０＿Ｆ／Ｐ－００２に基づく得点の値をＳＣＡ、ＳＣＢとする。この場合、ビジョンセンサ１００は、（ＳＣＡ－ＳＣＢ）＞０であれば第１画像フィルタで画像処理及びＯＣＲを行った文字認識の結果を採用する一方、（ＳＣＡ－ＳＣＢ）≦０であれば第２画像フィルタで画像処理及びＯＣＲを行った文字認識の結果を採用する。

このようにすることで、ビジョンセンサ１００は、第１画像フィルタと第２画像フィルタとのうちから、ＯＣＲを行ったときの文字認識の得点が最も高い画像フィルタを選択できる。よって、カメラ１１０がワークを撮像してからＯＣＲを行うまでの所謂タクトタイム内であれば、ビジョンセンサ１００は、カメラ１１０がワークを撮像する度にＯＣＲを行う物品画像データに最も適した画像フィルタを選択し、当該画像フィルタを用いた画像処理及びＯＣＲを行うことができる。この結果、本実施の形態に係る画像フィルタ生成システム１は、推論装置が第１推論結果データと第２推論結果データとを生成しない画像フィルタ生成システムよりも文字の誤認識を低減できる。

なお、本実施の形態では、推論装置３００は、２種類の推論結果データを生成、出力しているが、３種類以上の推論結果データを生成、出力してもよい。例えば、推論装置３００が３種類の推論結果データを生成、出力した場合、ビジョンセンサ１００は、第１画像フィルタと第２画像フィルタと第３画像フィルタとのうちから、ＯＣＲを行ったときの文字認識の得点が最も高い画像フィルタを選択できる。なお、この場合、上述したタクトタイム内に３種類の推論結果データに基づく画像フィルタを用いた画像処理及びＯＣＲを試行する必要がある。よって、推論装置３００が３種類以上の推論結果データを生成、出力する場合には、推論結果データの種類の数は、タクトタイムを考慮して定める必要がある。

また、本実施の形態に係る画像フィルタ生成システム１によれば、学習用データ取得部２１０が取得する学習用データには、物品画像データと、画像フィルタ関連データと、ＯＣＲ得点データとを含む。そして、学習済モデル生成部２２０は、学習用データを用いた機械学習によって物品画像データと画像フィルタ関連データとＯＣＲ得点データとの関係性を示す学習済モデルを生成する。

このようにすることで、推論装置３００は、学習済モデルにＯＣＲを行う物品画像データを入力することで、ＯＣＲを行ったときに出力される文字認識の得点が最も高くなると推論される推論結果データを生成、出力できる。この結果、本実施の形態に係る画像フィルタ生成システム１は、学習装置が物品画像データと画像フィルタ関連データとＯＣＲ得点データとの関係性を示す学習済モデルを生成しない画像フィルタ生成システムよりも文字の誤認識を低減できる。

また、本実施の形態に係る画像フィルタ生成システム１によれば、学習装置２００では、学習済モデル生成部２２０が行う機械学習は、行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を用いる強化学習である。また、学習済モデル生成部２２０は、２種類の学習用データにおいて物品画像データと画像フィルタ関連データとのうちの少なくとも一のデータが変化した結果、ＯＣＲ得点データが示す得点が増加したときに報酬ｒ_ｔ＋１を増加させる一方で得点が減少したときに報酬ｒ_ｔ＋１を減少させることで行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を更新する。そして、学習済モデル生成部２２０は、更新した行動価値関数Ｑ（ｓ_ｔ，ａ_ｔ）を示すデータを学習済モデルとして生成する。

このようにすることで、推論装置３００は、ＯＣＲ得点データが示す得点に基づいて強化学習された学習済モデルにＯＣＲを行う物品画像データを入力することで、ＯＣＲを行ったときに出力される文字認識の得点が最も高くなると推論される推論結果データを生成、出力できる。この結果、本実施の形態に係る画像フィルタ生成システム１は、ＯＣＲ得点データが示す得点に基づいて強化学習された学習済モデルを学習装置が生成しない画像フィルタ生成システムよりも文字の誤認識を低減できる。

また、本実施の形態に係る画像フィルタ生成システム１によれば、学習用データに含まれる物品画像データは、過去の製造時に実際に撮像されたワークの物品画像データを含む。
このようにすることで、本実施の形態に係る画像フィルタ生成システム１は、過去の製造時に実際に撮像されたワークの物品画像データを含む学習用データを用いた機械学習によって学習済モデルを生成しない画像フィルタ生成システムよりも実際の製造時のワークの物品画像データに対してＯＣＲを行ったときの文字の誤認識を低減できる。

また、本実施の形態に係る画像フィルタ生成システム１によれば、学習用データに含まれる物品画像データは、実際の環境を想定した模擬環境で撮像されたワークの物品画像データを含む。
このようにすることで、本実施の形態に係る画像フィルタ生成システム１は、模擬環境で撮像されたワークの物品画像データを含む学習用データを用いた機械学習によって学習済モデルを生成しない画像フィルタ生成システムよりも実際の製造時のワークの物品画像データに対してＯＣＲを行ったときの文字の誤認識を低減できる。

［実施の形態２］
実施の形態１では、推論装置３００は、複数種類の推論結果データを生成、出力しているが、推論装置３００が複数種類の推論結果データを生成、出力しなくてもよい。実施の形態２に係る画像フィルタ生成システム１では、推論装置３００は、１種類の推論結果データのみを生成、出力する。以下、図２、図５、図１０、図１１を参照して、実施の形態２に係る画像フィルタ生成システム１について、詳細に説明する。なお、実施の形態２では、実施の形態１と異なる構成について説明し、実施の形態１と同一の構成については冗長であるため説明を省略する。

（実施の形態２に係る推論装置３００の機能構成の詳細について）
図２に戻り、本実施の形態２に係る物品画像データ取得部３２０は、ビジョンセンサ１００から出力されたＯＣＲを行う物品画像データを取得する。本実施の形態では、物品画像データ取得部３２０が取得するＯＣＲを行う物品画像データは、ビジョンセンサ１００においてＯＣＲの運用を行っているときに実際の製造ラインで撮像されたワークの物品画像データである。
実施の形態２に係る推論結果データ生成部３３０は、学習済モデルにＯＣＲを行う物品画像データを入力して推論結果データを生成する。
実施の形態２に係る推論結果データ出力部３４０は、生成された推論結果データをビジョンセンサ１００に出力する。

ここで、ＯＣＲを行う物品画像データを入力された学習済モデルが推論結果データを出力する処理の概要について説明する。図５に示すように、第１物品画像データＩＭＧ－１は、第１画像フィルタ関連データＦ／Ｐ－００１に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が９９点で最も大きくなる。また、第２物品画像データＩＭＧ－２は、第３画像フィルタ関連データＦ／Ｐ－００３に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が９８点で最も大きくなる。また、第３物品画像データＩＭＧ－３は、第２画像フィルタ関連データＦ／Ｐ－００２に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が１００点で最も大きくなる。また、第４物品画像データＩＭＧ－４は、第２画像フィルタ関連データＦ／Ｐ－００２又は第５画像フィルタ関連データＦ／Ｐ－００５に基づく画像フィルタで画像処理及びＯＣＲを行ったときに得点の値が９１点で最も大きくなる。

よって、学習済モデルは、例えば、ＯＣＲを行う物品画像データＩＭＧ－０が第１物品画像データＩＭＧ－１に最も近似していれば推論結果データとして第１画像フィルタ関連データＦ／Ｐ－００１を出力する。また、学習済モデルは、ＯＣＲを行う物品画像データＩＭＧ－０が第２物品画像データＩＭＧ－２に最も近似していれば推論結果データとして第３画像フィルタ関連データＦ／Ｐ－００３を出力する。また、学習済モデルは、ＯＣＲを行う物品画像データＩＭＧ－０が第３物品画像データＩＭＧ－３に最も近似していれば推論結果データとして第２画像フィルタ関連データＦ／Ｐ－００２を出力する。また、学習済モデルは、ＯＣＲを行う物品画像データＩＭＧ－０が第２物品画像データＩＭＧ－２に最も近似していれば推論結果データとして第２画像フィルタ関連データＦ／Ｐ－００２又は第５画像フィルタ関連データＦ／Ｐ－００５を出力する。この結果、推論結果データ生成部３３０は、推論結果データとして上述した画像フィルタ関連データＦ／Ｐ－００１、Ｆ／Ｐ－００２、Ｆ／Ｐ－００３、Ｆ／Ｐ－００５の何れかを生成することになる。

（実施の形態２に係る推論結果データ生成処理について）
次に、フローチャートを用いて推論装置３００が推論結果データを生成、出力する動作について説明する。図１０に示すように、ステップＳ２０１、２０２の処理が実行された後、推論結果データ生成部３３０は、学習済モデルに新たにＯＣＲを行う物品画像データを入力して推論結果データを生成する（ステップＳ２１３）。そして、推論結果データ出力部３４０は、生成された推論結果データを出力し（ステップＳ２１４）、処理を終了する。

（実施の形態２に係る画像フィルタ生成処理について）
次に、フローチャートを用いてビジョンセンサ１００が画像フィルタを生成、出力する動作について説明する。図１１に示すように、ステップＳ３０１の処理が実行された後、推論結果データ取得部１９０は、推論装置３００から出力された推論結果データを取得する（ステップＳ３１２）。次に、画像フィルタ生成部１３０は、取得した推論結果データに基づく画像フィルタを生成する（ステップＳ３１３）。そして、画像フィルタ出力部１４０は、生成された画像フィルタを画像処理部１５０に出力し（ステップＳ３１４）、処理を終了する。

以上説明したように、本実施の形態に係る画像フィルタ生成システム１によれば、推論装置３００では、推論結果データ生成部３３０は、学習済モデルにＯＣＲを行う物品画像データを入力して推論結果データを生成する。また、ビジョンセンサ１００では、画像フィルタ生成部１３０は、推論結果データに基づく画像フィルタを生成し、画像フィルタ出力部１４０は、画像フィルタを出力する。そして、画像処理部１５０は、画像フィルタを用いて物品画像データの画像処理を行い、ＯＣＲ部１６０は、画像フィルタを用いた画像処理が行われた物品画像データに対してＯＣＲを行う。

このようにすることで、ビジョンセンサ１００は、学習済モデルがＯＣＲを行ったときの文字認識の得点が最も高いと推論した画像フィルタを用いて物品画像データの画像処理を行うことができる。例えば、ビジョンセンサ１００は、推論結果データＦ／Ｐ－００１に基づく画像フィルタを生成し、ＯＣＲの運用を行っているときに実際の製造ラインで撮像されたワークの物品画像データＩＭＧ－０に対して当該画像フィルタを用いて画像処理及びＯＣＲを行う。このため、実施の形態１のように、２種類の画像フィルタを用いて画像処理及びＯＣＲを行い、得点の値が高いほうの文字認識の結果を採用しなくてもよい。この結果、ビジョンセンサ１００は、カメラ１１０がワークを撮像する度に推論装置３００からＯＣＲを行う物品画像データに最も適した推論結果データを取得し、当該推論結果データに基づく画像フィルタを用いた画像処理及びＯＣＲを行うことができる。
その他、本実施の形態に係る画像フィルタ生成システム１は、実施の形態１に係る画像フィルタ生成システム１と同様の作用効果を奏する。

［実施の形態３］
実施の形態１、２では、ビジョンセンサ１００、学習装置２００、推論装置３００及び記憶装置４００を別個の装置としたが、これに限定されず、一体の装置であってもよい。例えば、画像フィルタ生成装置であるビジョンセンサ１００が他の装置２００、３００、４００の機能を備えていてもよい。実施の形態３に係るビジョンセンサ１００は、学習装置２００、推論装置３００及び記憶装置４００の機能を全て備える。以下、図１２を参照して、実施の形態３に係るビジョンセンサ１００について、詳細に説明する。なお、実施の形態３では、実施の形態１、２と異なる構成について説明し、実施の形態１、２と同一の構成については冗長であるため説明を省略する。

（実施の形態３に係るビジョンセンサ１００について）
図１２に示すように、ビジョンセンサ１００は、物品画像データ出力部１７０、学習用データ出力部１８０、推論結果データ取得部１９０が省略されている。また、ビジョンセンサ１００は、学習用データ取得部２１０、学習済モデル生成部２２０、報酬算出部２２１、価値関数更新部２２２、物品画像データ取得部３２０、推論結果データ生成部３３０、学習済モデル記憶部４１０を更に含む。なお、学習済モデル取得部３１０は、学習済モデル記憶部４１０が記憶している学習済モデルを取得し、物品画像データ取得部３２０は、カメラ１１０からＯＣＲを行う物品画像データを取得する。

以上説明したように、本実施の形態に係るビジョンセンサ１００は、実施の形態１、２に係る学習装置２００、推論装置３００及び記憶装置４００の機能を発揮できる。
このようにすることで、本実施の形態に係るビジョンセンサ１００は、実施の形態１、２に係る画像フィルタ生成システム１と同様の作用効果を奏する。

［変更例］
なお、上記の実施の形態３では、実施の形態１、２に係る各装置１００、２００、３００、４００を一体の装置としたが、一体の装置とする組み合わせについてはこれに限定されない。例えば、実施の形態１、２に係る学習装置２００と記憶装置４００とを一体の装置とし、残りの装置１００、３００は別体の装置であってもよく、実施の形態１、２に係る推論装置３００と記憶装置４００とを一体の装置とし、残りの装置１００、２００は別体の装置であってもよい。また、例えば、実施の形態１、２に係る学習装置２００と推論装置３００と記憶装置４００とを一体の装置とし、残りのビジョンセンサ１００のみが別体の装置であってもよい。

なお、上記の実施の形態１、２では、ビジョンセンサ１００、学習装置２００、推論装置３００及び記憶装置４００は、ＬＡＮを介してデータの送受信を可能としたが、データの送受信の構成についてはこれに限定されない。例えば、ビジョンセンサ１００、学習装置２００、推論装置３００及び記憶装置４００を互いに接続する通信ケーブルを介してデータの送受信を可能としてもよく、インターネットを介してデータの送受信を可能としてもよい。この場合、例えば、学習装置２００、推論装置３００及び記憶装置４００は、所謂クラウドサーバとして機能してもよい。この場合、クラウドサーバは、ビジョンセンサ１００から取得した学習データを用いた機械学習によって学習済モデルを生成、記憶してもよい。また、この場合、クラウドサーバは、ビジョンセンサ１００から新たに取得したＯＣＲを行う物品画像データを学習済モデルに入力して推論結果データを生成し、ビジョンセンサ１００に出力してもよい。

なお、上記の実施の形態１～３では、学習済モデル生成部２２０は、強化学習のアルゴリズムの一例としてのＱ学習を用いて学習済モデルを生成したが、これに限定されず、他の強化学習のアルゴリズムを用いて学習済モデルを生成してもよい。例えば、学習済モデル生成部２２０は、ＴＤ学習（TD-learning）を用いて学習済モデルを生成してもよい。

なお、上記の実施の形態１～３では、学習済モデル生成部２２０は、強化学習のアルゴリズムを用いて学習済モデルを生成したが、これに限定されず、例えば、深層学習（Deep Learning）、ニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシンといった他の公知の学習アルゴリズムを用いて学習済モデルを生成してもよい。また、学習方法についても強化学習に限定されず、例えば、教師あり学習、教師なし学習、半教師なし学習といった異なる学習に公知のアルゴリズムを用いて学習済モデルを生成してもよい。

ここで、学習済モデル生成部２２０が教師あり学習で学習済モデルを生成する場合、学習用データには、例えば、ＯＣＲを試行した物品画像データにおいて認識されるべき文字の正解を示すデータである正解データが含まれている必要がある。なお、正解データは、人手で予め入力してもよく、複数の物品画像データについてＯＣＲを行って認識した文字列を比較した結果に基づいて自動的に入力されてもよい。
また、学習済モデル生成部２２０が教師なし学習で学習済モデルを生成する場合、学習用データには、例えば、ワークに記載された文字がボケている物品画像データ、室内が明るい状態で撮像したワークの物品画像データ、室内が暗い状態で撮像したワークの物品画像データといった画像処理が必要な各物品画像データの分類が可能な分類データが含まれている必要がある。また、学習用データに含まれる画像フィルタ関連データは、例えば、各分類の物品画像データの画像処理に適した画像フィルタの画像フィルタ関連データである必要があり、このような画像フィルタ関連データを予め選択しておく必要がある。
また、学習済モデル生成部２２０が半教師なし学習で学習済モデルを生成する場合、学習用データには、例えば、上述した分類データと正解データとが含まれている必要がある。

なお、上記の実施の形態１、２では、学習装置２００は、画像フィルタ生成システム１に設けられたビジョンセンサ１００から学習用データを取得しており、上記の実施の形態３では、ビジョンセンサ１００は、自ら生成した学習用データを取得しているが、これに限定されない。例えば、学習装置２００及びビジョンセンサ１００は、ＯＣＲを行う他の装置、システムから学習用データを取得してもよい。学習装置２００及びビジョンセンサ１００は、例えば、同一のエリアで稼働している複数の画像フィルタ生成システムから学習用データを取得してもよく、異なるエリアで独立して稼働している画像フィルタ生成システムから学習用データを取得してもよい。この場合、学習装置２００及びビジョンセンサ１００は、任意のタイミングで学習用データを取得する他の画像フィルタ生成システムを追加したり、除去したりしてもよい。

なお、上記の実施の形態１、２では、画像フィルタ生成システム１に予め設けられた学習装置２００がビジョンセンサ１００から取得した学習用データのみを機械学習して学習済モデルを生成、出力したが、これに限定されない。例えば、他の画像フィルタ生成システムに設けられビジョンセンサから学習用データを取得して機械学習を行った学習装置を画像フィルタ生成システム１の学習装置２００とし、ビジョンセンサ１００から学習用データを取得することで再学習を行って学習済モデルを更新、出力してもよい。

なお、上記の実施の形態１、２では、推論装置３００は、画像フィルタ生成システム１に設けられた学習装置２００が生成、出力して記憶装置４００に記憶されている学習済モデルを取得したが、これに限定されない。例えば、推論装置３００は、他の画像フィルタ生成装置、他の画像フィルタ生成システムで生成、出力された学習済モデルを取得してもよい。

なお、制御部５１、主記憶部５２、外部記憶部５３、操作部５４、送受信部５６、内部バス５０等を備えるビジョンセンサ１００、学習装置２００及び推論装置３００の処理を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。例えば、前記の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体、例えば、フレキシブルディスク、ＤＶＤ－ＲＯＭ（Read-Only Memory）等に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、上記の処理を実行するビジョンセンサ１００、学習装置２００及び推論装置３００を構成してもよい。また、通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロードすることでビジョンセンサ１００、学習装置２００及び推論装置３００を構成してもよい。

また、ビジョンセンサ１００、学習装置２００及び推論装置３００の機能を、ＯＳ（Operating System）とアプリケーションプログラムの分担により実現する場合、または、ＯＳとアプリケーションプログラムとの協働により実現する場合には、アプリケーションプログラム部分のみを記録媒体、記憶装置に格納してもよい。

また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して提供することも可能である。例えば、通信ネットワーク上の掲示板（BBS, Bulletin Board System）に前記コンピュータプログラムを掲示し、ネットワークを介して前記コンピュータプログラムを提供してもよい。そして、このコンピュータプログラムを起動し、ＯＳの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行してもよい。

本開示は、本開示の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、本開示を説明するためのものであり、本開示の範囲を限定するものではない。つまり、本開示の範囲は、実施の形態ではなく、請求の範囲によって示される。そして、請求の範囲内及びそれと同等の開示の意義の範囲内で施される様々な変形が、本開示の範囲内とみなされる。

１…画像フィルタ生成システム、５０…内部バス、５１…制御部、５２…主記憶部、５３…外部記憶部、５４…操作部、５５…表示部、５６…送受信部、５９…制御プログラム、１００…ビジョンセンサ、１１０…カメラ、１２０…画像フィルタ関連データ生成部、１３０…画像フィルタ生成部、１４０…画像フィルタ出力部、１５０…画像処理部、１６０…ＯＣＲ部、１７０…物品画像データ出力部、１８０…学習用データ出力部、１９０…推論結果データ取得部、２００…学習装置、２１０…学習用データ取得部、２２０…学習済モデル生成部、２２１…報酬算出部、２２２…価値関数更新部、２３０…学習済モデル出力部、３００…推論装置、３１０…学習済モデル取得部、３２０…物品画像データ取得部、３３０…推論結果データ生成部、３４０…推論結果データ出力部、４００…記憶装置、４１０…学習済モデル記憶部。

Claims

撮像部材が撮像した物品の画像データである物品画像データに対してＯＣＲを行う前の画像処理に用いる画像フィルタを生成する画像フィルタ生成システムであって、
前記画像フィルタを生成する画像フィルタ生成装置と、
予め取得した前記物品画像データと前記物品画像データの画像処理に用いた前記画像フィルタとの関係性を学習する学習装置と、
前記ＯＣＲを行う前記物品画像データの画像処理に適した前記画像フィルタを推論する推論装置と、
を備え、
前記学習装置は、
前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記ＯＣＲで出力された文字認識の得点を示すデータであるＯＣＲ得点データ、を含む学習用データを取得する学習用データ取得部と、
前記学習用データを用いた機械学習によって前記物品画像データと前記画像フィルタ関連データと前記ＯＣＲ得点データとの関係性を示す学習済モデルを生成する学習済モデル生成部と、
前記学習済モデルを出力する学習済モデル出力部と、
を含み、
前記推論装置は、
前記ＯＣＲを行う前記物品画像データを取得する物品画像データ取得部と、
前記学習済モデルに前記ＯＣＲを行う前記物品画像データを入力して、前記ＯＣＲを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第１推論結果データ、ならびに、前記第１推論結果データとは異なる第２推論結果データ、を生成する推論結果データ生成部と、
前記第１推論結果データと前記第２推論結果データとを出力する推論結果データ出力部と、
を含み、
前記画像フィルタ生成装置は、
前記第１推論結果データに基づく前記画像フィルタである第１画像フィルタと前記第２推論結果データに基づく前記画像フィルタである第２画像フィルタとを生成する画像フィルタ生成部と、
前記第１画像フィルタと前記第２画像フィルタとを出力する画像フィルタ出力部と、
を含む、
画像フィルタ生成システム。
前記学習用データに含まれる前記物品画像データは、過去の製造時に実際に撮像されたワークの前記物品画像データである、
請求項１に記載の画像フィルタ生成システム。
前記学習用データに含まれる前記物品画像データは、実際の環境を想定した模擬環境で撮像されたワークの前記物品画像データである。
請求項１に記載の画像フィルタ生成システム。
撮像部材が撮像した物品の画像データである物品画像データに対してＯＣＲを行う前の画像処理に用いる画像フィルタを生成する画像フィルタ生成装置であって、
予め取得した前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記ＯＣＲで出力された文字認識の得点を示すデータであるＯＣＲ得点データ、を含む学習用データを取得する学習用データ取得部と、
前記学習用データを用いた機械学習によって前記物品画像データと前記画像フィルタ関連データと前記ＯＣＲ得点データとの関係性を示す学習済モデルを生成する学習済モデル生成部と、
前記ＯＣＲを行う前記物品画像データを取得する物品画像データ取得部と、
前記学習済モデルに前記ＯＣＲを行う前記物品画像データを入力して、前記ＯＣＲを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第１推論結果データ、ならびに、前記第１推論結果データとは異なる第２推論結果データ、を生成する推論結果データ生成部と、
前記第１推論結果データに基づく前記画像フィルタである第１画像フィルタと前記第２推論結果データに基づく前記画像フィルタである第２画像フィルタとを生成する画像フィルタ生成部と、
前記第１画像フィルタと前記第２画像フィルタとを出力する画像フィルタ出力部と、
を備える画像フィルタ生成装置。
撮像部材が撮像した物品の画像データである物品画像データに対してＯＣＲを行う前の画像処理に用いる画像フィルタを推論する推論装置であって、
前記ＯＣＲを行う前記物品画像データを取得する物品画像データ取得部と、
予め取得した前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記ＯＣＲで出力された文字認識の得点を示すデータであるＯＣＲ得点データ、を含む学習用データを用いた機械学習によって生成された学習済モデルに前記ＯＣＲを行う前記物品画像データを入力して、前記ＯＣＲを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第１推論結果データ、ならびに、前記第１推論結果データとは異なる第２推論結果データ、を生成する推論結果データ生成部と、
前記第１推論結果データと前記第２推論結果データとを出力する推論結果データ出力部と、
を備える推論装置。
撮像部材が撮像した物品の画像データである物品画像データに対してＯＣＲを行う前の画像処理に用いる画像フィルタを推論する推論方法であって、
コンピュータが、前記ＯＣＲを行う前記物品画像データを取得する物品画像データ取得ステップと、
前記コンピュータが、予め取得した前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記ＯＣＲで出力された文字認識の得点を示すデータであるＯＣＲ得点データ、を含む学習用データを用いた機械学習によって生成された学習済モデルに前記ＯＣＲを行う前記物品画像データを入力して、前記ＯＣＲを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第１推論結果データ、ならびに、前記第１推論結果データとは異なる第２推論結果データ、を生成する推論結果データ生成ステップと、
前記第１推論結果データと前記第２推論結果データとを出力する推論結果データ出力ステップと、
を含む推論方法。
コンピュータを、
ＯＣＲを行うために撮像部材が撮像した物品の画像データである物品画像データを取得する物品画像データ取得部、
予め取得した前記物品画像データ、前記物品画像データに対して前記ＯＣＲを行う前の画像処理に用いた画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記ＯＣＲで出力された文字認識の得点を示すデータであるＯＣＲ得点データ、を含む学習用データを用いた機械学習によって生成された学習済モデルに前記ＯＣＲを行う前記物品画像データを入力して、前記ＯＣＲを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第１推論結果データ、ならびに、前記第１推論結果データとは異なる第２推論結果データ、を生成する推論結果データ生成部、
前記第１推論結果データと前記第２推論結果データとを出力する推論結果データ出力部、
として機能させるプログラム。