JPWO2023157092A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2023157092A5 JPWO2023157092A5 JP2022547921A JP2022547921A JPWO2023157092A5 JP WO2023157092 A5 JPWO2023157092 A5 JP WO2023157092A5 JP 2022547921 A JP2022547921 A JP 2022547921A JP 2022547921 A JP2022547921 A JP 2022547921A JP WO2023157092 A5 JPWO2023157092 A5 JP WO2023157092A5
- Authority
- JP
- Japan
- Prior art keywords
- data
- image
- article
- inference result
- ocr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003384 imaging method Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 claims 3
- 230000006870 function Effects 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
Description
上記目的を達成するため、本開示に係る画像フィルタ生成システムは、撮像部材が撮像した物品の画像データである物品画像データに対してOCRを行う前の画像処理に用いる画像フィルタを生成する。画像フィルタ生成システムは、画像フィルタを生成する画像フィルタ生成装置と、予め取得した物品画像データと物品画像データの画像処理に用いた画像フィルタとの関係性を学習する学習装置と、OCRを行う物品画像データの画像処理に適した画像フィルタを推論する推論装置とを備える。学習装置は、物品画像データ、物品画像データの画像処理に用いた画像フィルタの組合せ及び画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、画像フィルタ関連データに基づく画像フィルタを用いて物品画像データの画像処理を行ったときのOCRで出力された文字認識の得点を示すデータであるOCR得点データ、を含む学習用データを取得する学習用データ取得部と、学習用データを用いた機械学習によって物品画像データと画像フィルタ関連データとOCR得点データとの関係性を示す学習済モデルを生成する学習済モデル生成部と、学習済モデルを出力する学習済モデル出力部とを含む。推論装置は、OCRを行う物品画像データを取得する物品画像データ取得部と、学習済モデルにOCRを行う物品画像データを入力して、OCRを行う物品画像データの画像処理に適した画像フィルタの組合せ及び画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第1推論結果データ、ならびに、第1推論結果データとは異なる第2推論結果データ、を生成する推論結果データ生成部と、第1推論結果データと第2推論結果データとを出力する推論結果データ出力部とを含む。画像フィルタ生成装置は、第1推論結果データに基づく画像フィルタである第1画像フィルタと第2推論結果データに基づく画像フィルタである第2画像フィルタとを生成する画像フィルタ生成部と、第1画像フィルタと第2画像フィルタとを出力する画像フィルタ出力部とを含む。
Claims (7)
- 撮像部材が撮像した物品の画像データである物品画像データに対してOCRを行う前の画像処理に用いる画像フィルタを生成する画像フィルタ生成システムであって、
前記画像フィルタを生成する画像フィルタ生成装置と、
予め取得した前記物品画像データと前記物品画像データの画像処理に用いた前記画像フィルタとの関係性を学習する学習装置と、
前記OCRを行う前記物品画像データの画像処理に適した前記画像フィルタを推論する推論装置と、
を備え、
前記学習装置は、
前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記OCRで出力された文字認識の得点を示すデータであるOCR得点データ、を含む学習用データを取得する学習用データ取得部と、
前記学習用データを用いた機械学習によって前記物品画像データと前記画像フィルタ関連データと前記OCR得点データとの関係性を示す学習済モデルを生成する学習済モデル生成部と、
前記学習済モデルを出力する学習済モデル出力部と、
を含み、
前記推論装置は、
前記OCRを行う前記物品画像データを取得する物品画像データ取得部と、
前記学習済モデルに前記OCRを行う前記物品画像データを入力して、前記OCRを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第1推論結果データ、ならびに、前記第1推論結果データとは異なる第2推論結果データ、を生成する推論結果データ生成部と、
前記第1推論結果データと前記第2推論結果データとを出力する推論結果データ出力部と、
を含み、
前記画像フィルタ生成装置は、
前記第1推論結果データに基づく前記画像フィルタである第1画像フィルタと前記第2推論結果データに基づく前記画像フィルタである第2画像フィルタとを生成する画像フィルタ生成部と、
前記第1画像フィルタと前記第2画像フィルタとを出力する画像フィルタ出力部と、
を含む、
画像フィルタ生成システム。 - 前記学習用データに含まれる前記物品画像データは、過去の製造時に実際に撮像されたワークの前記物品画像データである、
請求項1に記載の画像フィルタ生成システム。 - 前記学習用データに含まれる前記物品画像データは、実際の環境を想定した模擬環境で撮像されたワークの前記物品画像データである。
請求項1に記載の画像フィルタ生成システム。 - 撮像部材が撮像した物品の画像データである物品画像データに対してOCRを行う前の画像処理に用いる画像フィルタを生成する画像フィルタ生成装置であって、
予め取得した前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記OCRで出力された文字認識の得点を示すデータであるOCR得点データ、を含む学習用データを取得する学習用データ取得部と、
前記学習用データを用いた機械学習によって前記物品画像データと前記画像フィルタ関連データと前記OCR得点データとの関係性を示す学習済モデルを生成する学習済モデル生成部と、
前記OCRを行う前記物品画像データを取得する物品画像データ取得部と、
前記学習済モデルに前記OCRを行う前記物品画像データを入力して、前記OCRを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第1推論結果データ、ならびに、前記第1推論結果データとは異なる第2推論結果データ、を生成する推論結果データ生成部と、
前記第1推論結果データに基づく前記画像フィルタである第1画像フィルタと前記第2推論結果データに基づく前記画像フィルタである第2画像フィルタとを生成する画像フィルタ生成部と、
前記第1画像フィルタと前記第2画像フィルタとを出力する画像フィルタ出力部と、
を備える画像フィルタ生成装置。 - 撮像部材が撮像した物品の画像データである物品画像データに対してOCRを行う前の画像処理に用いる画像フィルタを推論する推論装置であって、
前記OCRを行う前記物品画像データを取得する物品画像データ取得部と、
予め取得した前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記OCRで出力された文字認識の得点を示すデータであるOCR得点データ、を含む学習用データを用いた機械学習によって生成された学習済モデルに前記OCRを行う前記物品画像データを入力して、前記OCRを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第1推論結果データ、ならびに、前記第1推論結果データとは異なる第2推論結果データ、を生成する推論結果データ生成部と、
前記第1推論結果データと前記第2推論結果データとを出力する推論結果データ出力部と、
を備える推論装置。 - 撮像部材が撮像した物品の画像データである物品画像データに対してOCRを行う前の画像処理に用いる画像フィルタを推論する推論方法であって、
コンピュータが、前記OCRを行う前記物品画像データを取得する物品画像データ取得ステップと、
前記コンピュータが、予め取得した前記物品画像データ、前記物品画像データの画像処理に用いた前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記OCRで出力された文字認識の得点を示すデータであるOCR得点データ、を含む学習用データを用いた機械学習によって生成された学習済モデルに前記OCRを行う前記物品画像データを入力して、前記OCRを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第1推論結果データ、ならびに、前記第1推論結果データとは異なる第2推論結果データ、を生成する推論結果データ生成ステップと、
前記第1推論結果データと前記第2推論結果データとを出力する推論結果データ出力ステップと、
を含む推論方法。 - コンピュータを、
OCRを行うために撮像部材が撮像した物品の画像データである物品画像データを取得する物品画像データ取得部、
予め取得した前記物品画像データ、前記物品画像データに対して前記OCRを行う前の画像処理に用いた画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである画像フィルタ関連データ、ならびに、前記画像フィルタ関連データに基づく前記画像フィルタを用いて前記物品画像データの画像処理を行ったときの前記OCRで出力された文字認識の得点を示すデータであるOCR得点データ、を含む学習用データを用いた機械学習によって生成された学習済モデルに前記OCRを行う前記物品画像データを入力して、前記OCRを行う前記物品画像データの画像処理に適した前記画像フィルタの組合せ及び前記画像フィルタ毎のパラメータの値を示すデータである推論結果データとして、第1推論結果データ、ならびに、前記第1推論結果データとは異なる第2推論結果データ、を生成する推論結果データ生成部、
前記第1推論結果データと前記第2推論結果データとを出力する推論結果データ出力部、
として機能させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/006000 WO2023157092A1 (ja) | 2022-02-15 | 2022-02-15 | 画像フィルタ生成システム、画像フィルタ生成装置、推論装置、推論方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP7166505B1 JP7166505B1 (ja) | 2022-11-07 |
JPWO2023157092A1 JPWO2023157092A1 (ja) | 2023-08-24 |
JPWO2023157092A5 true JPWO2023157092A5 (ja) | 2024-01-23 |
Family
ID=83931107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022547921A Active JP7166505B1 (ja) | 2022-02-15 | 2022-02-15 | 画像フィルタ生成システム、画像フィルタ生成装置、推論装置、推論方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7166505B1 (ja) |
CN (1) | CN118661210A (ja) |
WO (1) | WO2023157092A1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4834693B2 (ja) * | 2008-05-26 | 2011-12-14 | 株式会社東芝 | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 |
JP7215242B2 (ja) * | 2019-03-08 | 2023-01-31 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
JP7298223B2 (ja) * | 2019-03-19 | 2023-06-27 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
-
2022
- 2022-02-15 CN CN202280086732.XA patent/CN118661210A/zh active Pending
- 2022-02-15 WO PCT/JP2022/006000 patent/WO2023157092A1/ja active Application Filing
- 2022-02-15 JP JP2022547921A patent/JP7166505B1/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Abu et al. | A study on Image Classification based on Deep Learning and Tensorflow | |
CN108805789A (zh) | 一种基于对抗神经网络去除水印的方法、装置、设备及可读介质 | |
CN111709321B (zh) | 一种基于图卷积神经网络的人体行为识别方法 | |
JPWO2020179729A5 (ja) | ||
WO2020141462A4 (en) | System and method for a web scraping tool and classification engine | |
CN110414546A (zh) | 使用中间损失函数训练图像信号处理器 | |
CN112668623B (zh) | 基于生成对抗网络的双耳销钉缺陷样本的生成方法及装置 | |
CN110059593B (zh) | 一种基于反馈卷积神经网络的面部表情识别方法 | |
JP2024112961A5 (ja) | ||
JP2022014776A5 (ja) | ||
JP2021179833A5 (ja) | ||
CN112949469A (zh) | 针对人脸篡改图像特点分布的图像识别方法、系统及设备 | |
JP2019207099A5 (ja) | ||
CN112509154B (zh) | 图像生成模型的训练方法、图像生成方法及装置 | |
JPWO2020241142A5 (ja) | ||
JPWO2022044210A5 (ja) | ||
JPWO2023157092A5 (ja) | ||
JP2019208851A5 (ja) | ||
Santos et al. | Deep neural network model based on one-stage detector for identifying fundus lesions | |
JPWO2021106028A5 (ja) | 機械学習装置、機械学習方法、及び、機械学習プログラム | |
JPWO2023286847A5 (ja) | ||
Park et al. | Ensuring Visual Commonsense Morality for Text-to-Image Generation | |
He et al. | Deep saliency: What is learnt by a deep network about saliency? | |
CN116724224A (zh) | 加工面判定装置、加工面判定程序、加工面判定方法、加工系统、推论装置及机器学习装置 | |
Fraile et al. | Automatic analysis of infant engagement during play: An end-to-end learning and Explainable AI pilot experiment |