JP7745854B2 - 重量推定装置及び教師データ作成方法 - Google Patents
重量推定装置及び教師データ作成方法Info
- Publication number
- JP7745854B2 JP7745854B2 JP2023051129A JP2023051129A JP7745854B2 JP 7745854 B2 JP7745854 B2 JP 7745854B2 JP 2023051129 A JP2023051129 A JP 2023051129A JP 2023051129 A JP2023051129 A JP 2023051129A JP 7745854 B2 JP7745854 B2 JP 7745854B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- depth
- data
- machine learning
- color image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Description
対象物のカラー画像を撮像可能なRGBカメラと、
前記対象物までの深度情報を含む深度データ画像を撮像可能なステレオカメラと、
前記対象物の前記カラー画像と前記深度情報とに基づいて、前記対象物の重量を推定できるように機械学習させた機械学習モデルと、
撮像された前記カラー画像と前記深度データ画像とが入力された場合に、前記機械学習モデルを用いて前記対象物の重量推定を行う重量推定部と、
を備えている。
RGBカメラで撮像された対象物のカラー画像と、ステレオカメラで撮像された前記対象物までの深度情報を含む深度データ画像から機械学習用データを作成する教師データ作成方法であって、
前記カラー画像から前記対象物の外周を囲む第1画像部分を切り出す第1の対象物切出工程と、
前記第1の対象物切出工程によって切り出された前記第1画像部分を未加工で予め定めた所定サイズの枠に貼付する第1の画像貼付工程と、
前記深度データ画像から撮影範囲が前記第1画像部分と同一である第2画像部分を切り出す第2の対象物切出工程と、
前記第2の対象物切出工程によって切り出された前記第2画像部分を未加工で前記所定サイズの新たな枠に貼付する第2の画像貼付工程と、
を備えている。
図1は、対象物12の重量を推定する重量推定装置10の模式図である。重量推定装置10は、複合カメラ14、重量推定部18、重量表示器20及び機械学習モデル22を備えている。
図2は、機械学習モデル22に機械学習を行わせる際の教師データ(機械学習用データの一例)のカラー画像及び深度データ画像を作成する作業装置の配置図である。機械学習モデル22の機械学習に使用する教師データのカラー画像及び深度データ画像を作成するためには、重量推定装置10による重量推定の対象物12について、視野座標空間16における相対位置、大きさ(サイズ)、形状及び重量の各パラメータの値が想定範囲内にあって適切に分布する対象物48のカラー画像及び深度データ画像を十分な個数、用意する必要がある。
図3は、機械学習モデル22の機械学習の際に教師データとして使用する種々のカラー画像を示す図である。なお、図3に図示のカラー画像は、各々1つであるが、カラー画像には、実際には、赤R、緑G及び青Bの3つの画像から構成されている。図面では、図示の簡略化上、赤R、緑G及び青Bの3つの画像を1つの画像として示している。
図4は、対象物48の複数の座標位置で対関係のカラー画像及び深度データ画像を示している。対関係のカラー画像及び深度データ画像とは、同一の対象物48を同一の座標位置でRGBカメラ14a及びステレオカメラ14bを同時に撮影したときのカラー画像及び深度データ画像をいうものとする。図4において、上下方向に同一段のカラー画像と深度データ画像とは、対関係にある。
図5は、重量の異なる対象物48についてのカラー画像を示す図である。作業者は、対象物48を、視野座標空間58における所定のセル空間に維持しつつ、対象物48(例:レタス)の葉を少しずつちぎって、重量を段階的に減少させ、重量の相違する計4つの対象物48(図5では、深度データ画像の図示は省略している。)を作成する。
図6-図8は、それぞれ異なる深度データ画像に対する深度データの補間処理についての説明図である。前述したように、深度データ画像において、深度データの取得できなかった領域は、黒に表示される。黒のままの深度データ画像は、教師データの価値を低下させる。深度データの補間は、これに対処するものである。
図9は、カラー画像から対象物48の画像領域を切り出して最終の教師データを作成する工程説明図である。マスク60aを用いて、カラー画像において切出し領域62aを決定する(図9の最上段の画像)。切出し領域62aは、マスク60aを内包する最小の矩形の各辺に対して外側に20画素(pixel)のマージンを付けて広げた矩形領域として定義される。
図11は、深度増減(距離増減)による教師データの拡張(データ拡張)についての説明図である。データ拡張とは、元の学習用データに変換を施したデータを学習用データとして用いることで、データを水増しする手法である。一般的に、データ拡張の手法としては、(a)予め元の学習用データに変換を施したデータを学習用データに加えておくことでデータ数を増やしたデータセットで学習を行う手法、及び(b)学習用データにランダムな変換を施すジェネレータを使用する手法がある。
周知のデータ拡張を施す場合、手法の性質によって変換を施す対象を適切に選択しなければならない点に注意が必要である。例えば、明るさの調整などのカラー画像の輝度に着目したデータ拡張ではカラー画像のみに変換を施し、深度データ画像を変換対象に含めるのは不適切である。一方、左右反転、ランダム回転、平行移動など位置概念を変更するデータ拡張ではカラー画像及び深度データ画像に同様の処理を施さなければならない。今回は使用していないが、ランダムイレイジングなどデータの一部をランダムなノイズへ変換するデータ拡張を使用する場合、カラー画像と深度データ画像にそれぞれ独立してランダム値を適応することで、互いの情報からノイズ領域の推測が可能となり推論精度が向上する可能性も考えられる。
図12は、機械学習モデル22を機械学習させたときのEpoch(エポック数)とMSE(平均二乗誤差。損失関数に設定。)及びMAE(平均絶対誤差。重量のグラムgの誤差に相当。)との関係を調べたグラフである。なお、今回、訓練に使用するデータに関しては前述の通り1つの株から撮影方法を変更、葉を除く等して複数のデータを得た。モデルを学習する際には、適切に汎化性能を確認するために、学習用データと検証用データで同じ株由来のデータが混在しないようにした。
重量推定装置10は、特定の1種類の対象物12(例:レタス)専用に、重量を推定している。しかしながら、本発明の重量推定装置は、色が明確に区別されれば(例:緑のレタスと、オレンジ色のみかんと、紫色のナスと、黄色のバナナ及び赤色のリンゴ。)、複数種類の対象物について重量の推定を行うことができる。
Claims (5)
- 葉物野菜である対象物のカラー画像を撮像可能なRGBカメラと、
前記対象物までの深度情報を含む深度データ画像を撮像可能なステレオカメラと、
前記対象物の前記カラー画像と前記深度情報とに基づいて、前記対象物の重量を推定できるように機械学習させた機械学習モデルと、
撮像された前記カラー画像と前記深度データ画像とが入力された場合に、前記機械学習
モデルを用いて前記対象物の重量推定を行う重量推定部と、
を備え、
前記機械学習モデルの機械学習は、深度データ画像と対関係にあるカラー画像から作成したマスクに基づいて該深度データ画像を対象物内領域と対象物外領域とに区分けし、前記対象物内領域の深度取得不能領域を、該対象物内領域において該深度取得不能領域に隣接している深度取得領域の深度に基づいて補間された深度データ画像を機械学習用データとして使用している、重量推定装置。 - 前記機械学習モデルは、
ランダムに生成した増減距離をランダム距離として設定するランダム距離設定部と、
対関係の既存のカラー画像及び深度データ画像をそれぞれ元カラー画像及び元深度データ画像として、前記元深度データ画像の全画素の深度を、前記ランダム距離に相当する分だけ一律に変更するとともに、元カラー画像及び元深度データ画像の画像を、変更後の深度に対応するサイズに拡縮した新カラー画像及び新深度データ画像に対応するデータを拡張データとして生成する拡張データ生成部と、
を備えている、請求項1に記載の重量推定装置。 - 葉物野菜である対象物のカラー画像を撮像可能なRGBカメラと、
前記対象物までの深度情報を含む深度データ画像を撮像可能なステレオカメラと、
前記対象物の前記カラー画像と前記深度情報とに基づいて、前記対象物の重量を推定できるように機械学習させた機械学習モデルと、
撮像された前記カラー画像と前記深度データ画像とが入力された場合に、前記機械学習
モデルを用いて前記対象物の重量推定を行う重量推定部と、
を備え、
前記機械学習モデルは、
ランダムに生成した増減距離をランダム距離として設定するランダム距離設定部と、
対関係の既存のカラー画像及び深度データ画像をそれぞれ元カラー画像及び元深度データ画像として、前記元深度データ画像の全画素の深度を、前記ランダム距離に相当する分だけ一律に変更するとともに、元カラー画像及び元深度データ画像の画像を、変更後の深度に対応するサイズに拡縮した新カラー画像及び新深度データ画像に対応するデータを拡張データとして生成する拡張データ生成部と、
を備えている、重量推定装置。 - 請求項1又は3に記載の重量推定装置の前記機械学習モデルに機械学習を行わせる際の機械学習用データを作成する教師データ作成方法であって、
前記カラー画像から前記対象物の外周を囲む第1画像部分を切り出す第1の対象物切出工程と、
前記第1の対象物切出工程によって切り出された前記第1画像部分を未加工で予め定めた所定サイズの枠に貼付する第1の画像貼付工程と、
前記深度データ画像から撮影範囲が前記第1画像部分と同一である第2画像部分を切り出す第2の対象物切出工程と、
前記第2の対象物切出工程によって切り出された前記第2画像部分を未加工で前記所定サイズの新たな枠に貼付する第2の画像貼付工程と、
を備えていることを特徴とする教師データ作成方法。 - 前記機械学習用データには、対関係の既存のカラー画像及び深度データ画像をそれぞれ元カラー画像及び元深度データ画像として、前記元深度データ画像の全画素の深度を、ランダムに生成したランダム距離に相当する分だけ一律に増減するとともに、元カラー画像及び元深度データ画像を、変更後の深度に対応するサイズに拡縮した新カラー画像及び新深度データ画像に対応するデータが拡張データとして含まれている、請求項4に記載の教師データ作成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023051129A JP7745854B2 (ja) | 2023-03-28 | 2023-03-28 | 重量推定装置及び教師データ作成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023051129A JP7745854B2 (ja) | 2023-03-28 | 2023-03-28 | 重量推定装置及び教師データ作成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024140129A JP2024140129A (ja) | 2024-10-10 |
| JP7745854B2 true JP7745854B2 (ja) | 2025-09-30 |
Family
ID=92976508
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023051129A Active JP7745854B2 (ja) | 2023-03-28 | 2023-03-28 | 重量推定装置及び教師データ作成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7745854B2 (ja) |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016514384A (ja) | 2013-01-30 | 2016-05-19 | クアルコム,インコーポレイテッド | 電力効率の良い深度センサーの使用によるリアルタイム3d再構成 |
| JP2019114842A (ja) | 2017-12-21 | 2019-07-11 | 株式会社ソニー・インタラクティブエンタテインメント | 画像処理装置、コンテンツ処理装置、コンテンツ処理システム、および画像処理方法 |
| JP2019192022A (ja) | 2018-04-26 | 2019-10-31 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
| JP2020155060A (ja) | 2019-03-22 | 2020-09-24 | 国立大学法人信州大学 | 結球野菜の結球中心の認識方法、認識装置、および収穫機 |
| JP2020532440A (ja) | 2017-09-01 | 2020-11-12 | カリフォルニア大学The Regents of the University of California | オブジェクトをロバストに把持し、ターゲティングするためのロボットシステムおよび方法 |
| JP2022533881A (ja) | 2019-05-21 | 2022-07-27 | メタ プラットフォームズ テクノロジーズ, リミテッド ライアビリティ カンパニー | ルームモードの局所効果を組み込むための音響フィルタの決定 |
| JP2022546627A (ja) | 2019-10-07 | 2022-11-04 | ボストン ポーラリメトリックス,インコーポレイティド | 偏光によるセンサシステム及び撮像システムの増強のための方法 |
| US20230043110A1 (en) | 2020-02-27 | 2023-02-09 | Pixxize Gmbh | System and method for recording animals |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11761790B2 (en) * | 2016-12-09 | 2023-09-19 | Tomtom Global Content B.V. | Method and system for image-based positioning and mapping for a road network utilizing object detection |
| JP2019057250A (ja) * | 2017-09-22 | 2019-04-11 | Ntn株式会社 | ワーク情報処理装置およびワークの認識方法 |
| JP7170602B2 (ja) * | 2019-08-27 | 2022-11-14 | 富士フイルム富山化学株式会社 | 学習データ作成装置及び方法、並びに機械学習装置及び方法 |
| JP7729544B2 (ja) * | 2021-06-17 | 2025-08-26 | 国立大学法人 東京大学 | 俯瞰映像提示システム |
| JP2023022517A (ja) * | 2021-08-03 | 2023-02-15 | 株式会社東芝 | 計測システム及び計測プログラム |
-
2023
- 2023-03-28 JP JP2023051129A patent/JP7745854B2/ja active Active
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016514384A (ja) | 2013-01-30 | 2016-05-19 | クアルコム,インコーポレイテッド | 電力効率の良い深度センサーの使用によるリアルタイム3d再構成 |
| JP2020532440A (ja) | 2017-09-01 | 2020-11-12 | カリフォルニア大学The Regents of the University of California | オブジェクトをロバストに把持し、ターゲティングするためのロボットシステムおよび方法 |
| JP2019114842A (ja) | 2017-12-21 | 2019-07-11 | 株式会社ソニー・インタラクティブエンタテインメント | 画像処理装置、コンテンツ処理装置、コンテンツ処理システム、および画像処理方法 |
| JP2019192022A (ja) | 2018-04-26 | 2019-10-31 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
| JP2020155060A (ja) | 2019-03-22 | 2020-09-24 | 国立大学法人信州大学 | 結球野菜の結球中心の認識方法、認識装置、および収穫機 |
| JP2022533881A (ja) | 2019-05-21 | 2022-07-27 | メタ プラットフォームズ テクノロジーズ, リミテッド ライアビリティ カンパニー | ルームモードの局所効果を組み込むための音響フィルタの決定 |
| JP2022546627A (ja) | 2019-10-07 | 2022-11-04 | ボストン ポーラリメトリックス,インコーポレイティド | 偏光によるセンサシステム及び撮像システムの増強のための方法 |
| US20230043110A1 (en) | 2020-02-27 | 2023-02-09 | Pixxize Gmbh | System and method for recording animals |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024140129A (ja) | 2024-10-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111640157B (zh) | 一种基于神经网络的棋盘格角点检测方法及其应用 | |
| CN114332689B (zh) | 一种柑橘识别定位方法、装置、设备及存储介质 | |
| US7456842B2 (en) | Color edge based system and method for determination of 3D surface topology | |
| CN105825494B (zh) | 一种图像处理方法及移动终端 | |
| CN112801074B (zh) | 一种基于交通摄像头的深度图估计方法 | |
| CN112233067A (zh) | 一种热轧钢卷端面质量检测方法及系统 | |
| CN109087315B (zh) | 一种基于卷积神经网络的图像识别定位方法 | |
| CN104091324A (zh) | 一种基于连通域分割的棋盘格图像快速特征匹配算法 | |
| CN104751407A (zh) | 一种用于对图像进行虚化的方法和装置 | |
| CN111383340B (zh) | 一种基于3d图像的背景过滤方法、装置及系统 | |
| US20220005224A1 (en) | Automatic detection of a calibration object for modifying image parameters | |
| WO2024250854A1 (en) | Methods and systems for correcting bright-dark lines on screens | |
| CN104751406A (zh) | 一种用于对图像进行虚化的方法和装置 | |
| JP7745854B2 (ja) | 重量推定装置及び教師データ作成方法 | |
| CN115457131B (zh) | 基于u-v视差图的室内自由空间估计和障碍物检测方法 | |
| CN110751690B (zh) | 铣床刀头视觉定位方法 | |
| CN113511028A (zh) | 油画复制方法 | |
| CN111010558B (zh) | 一种基于短视频图像的立木深度图生成方法 | |
| CN116168066B (zh) | 基于数据分析的建筑物三维点云配准预处理方法 | |
| CN108876849B (zh) | 基于辅助标识的深度学习目标识别及定位方法 | |
| JP6962662B2 (ja) | 検出装置及びプログラム | |
| CN105989587A (zh) | 一种多功能oct系统的自动定标方法 | |
| CN107181938A (zh) | 图像显示方法和设备、图像分析方法、设备及系统 | |
| KR102896792B1 (ko) | 인공지능 기반 산업용 ocr 모델을 학습시키기 위한 학습 데이터셋을 증강시키는 방법 | |
| CN105989591A (zh) | 一种自动获取取款人面部立体信息的自动取款机成像方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240227 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250213 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250422 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250619 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250902 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250908 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7745854 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |