WO2023140266A1

WO2023140266A1 - ピッキング装置及び画像生成プログラム

Info

Publication number: WO2023140266A1
Application number: PCT/JP2023/001255
Authority: WO
Inventors: 徹岩▲崎▼
Original assignee: 興和株式会社
Priority date: 2022-01-19
Filing date: 2023-01-18
Publication date: 2023-07-27
Also published as: JPWO2023140266A1

Abstract

ピッキング対象物の位置を正確に特定可能なピッキング装置を提供するために、複数のピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得し、複数のピッキング対象物の全体に関する３次元点群情報を取得し、２次元撮影画像データと３次元点群情報との間でキャリブレーションを実行し、３次元点群情報から複数のピッキング対象物の天面候補領域を抽出し、２次元撮影画像データにおける天面候補領域に相当する領域を関心領域に設定し、関心領域内の輝度情報が所定条件を満たす２次元撮影画像データを選択又は合成してＡＩ判定用画像データを取得し、予め学習を行った学習済モデルに対してＡＩ判定用画像データを入力することで、当該ＡＩ判定用画像データにおける各ピッキング対象物の中心座標情報を取得し、中心座標情報及び高さ情報に基づいて、ピッキングロボットによるピッキングを制御するようにした。

Description

ピッキング装置及び画像生成プログラム

　本発明は、ピッキング対象物の位置を正確に特定可能なピッキング装置及び画像生成プログラムに関する。

　従来から、工場からの出荷段階や物流拠点などにおいて、荷物の仕分け、積み替え、荷卸しなどの作業をロボットによって自動化することが行われてきた。

　把持対象となる箱状ピッキング対象物を自動的に確認・計測するための技術として、例えば、特許文献１が既に提案されている。この特許文献１には、２次元カメラで撮影した２次元画像と、３次元カメラ等で取得する３次元点群情報との２つの情報を併用することで、把持対象となる箱状ピッキング対象物を正確に把握する構成が開示されている。

特開２０１９－１３６８２８号公報

　特許文献１のように、２次元カメラで撮影した２次元画像と、３次元カメラ等で取得する３次元点群情報との２つの情報を併用することでピッキング対象物の位置の検出精度を向上させることが可能であるが、２つを組み合わせてもピッキング対象物の位置検出を誤ってしまう可能性は残る。例えば、ピッキング対象物が隙間なく精緻に積まれている場合、３次元点群情報のみでは天面におけるピッキング対象物の境界を特定できないおそれがある。また、２次元カメラで撮影した２次元画像について、例えば、ＡＩによって画像認識処理することでピッキング対象物の位置の検出を行う構成の場合、２次元画像に光の反射による白飛び個所や、他の物の陰になってしまうことで生じる暗部などが含まれていると、ピッキング対象物の位置を誤検出してしまうおそれがある。

　本発明は、上記問題点に鑑みなされたものであり、ピッキング対象物の位置を正確に特定可能なピッキング装置及び画像生成プログラムを提供することを目的とする。

　本発明に係るピッキング装置は、ピッキング対象物をピッキングするハンド部を備えたピッキングロボットと、前記ピッキング対象物を２次元撮影するための２次元カメラと、前記ピッキング対象物までの距離情報を表す３次元点群情報を取得するための３次元カメラと、前記ピッキングロボットのピッキング動作を制御する制御ユニットとを備え、前記制御ユニットは、前記２次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得する２次元撮影画像取得機能と、前記３次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体に関する３次元点群情報を取得する３次元点群情報取得機能と、前記２次元撮影画像データと前記３次元点群情報との間で対象となる前記ピッキング対象物を基準として座標情報を共通化するキャリブレーション機能と、前記３次元点群情報から複数の前記ピッキング対象物の天面候補領域を抽出する天面候補領域抽出機能と、前記２次元撮影画像データにおける前記天面候補領域に相当する領域を関心領域に設定する関心領域設定機能と、少なくとも１以上の前記２次元撮影画像データに基づいて、前記関心領域内の輝度情報が所定条件を満たす前記２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得るＡＩ判定用画像取得機能と、入力された画像データから前記ピッキング対象物を特定して各ピッキング対象物の中心座標情報を出力することについて予め学習を行った学習済モデルに対して前記ＡＩ判定用画像データを入力することで、当該ＡＩ判定用画像データにおける各ピッキング対象物の中心座標情報を取得する中心座標情報取得機能と、前記中心座標情報及び前記３次元点群情報から取得される高さ情報に基づいて、前記ピッキングロボットによるピッキング対象物のピッキング動作及び移載動作を制御するピッキング制御機能とを備えることを特徴とする。

　また、本発明に係るピッキング装置は、前記ＡＩ判定用画像取得機能は、前記関心領域内の画素の平均輝度値が所定の下限閾値以上及び／又は所定の上限閾値以下であることを前記ＡＩ判定用画像データが満たすべき所定条件とすることを特徴とする。

　また、本発明に係るピッキング装置は、前記ＡＩ判定用画像取得機能は、前記２次元カメラにおける露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データについて前記所定条件を満たすか否かを判定することで前記ＡＩ判定用画像データを取得することを特徴とする。

　また、本発明に係るピッキング装置は、前記ＡＩ判定用画像取得機能は、前記２次元カメラにおける露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データに基づいてＨＤＲ処理を実行することで、前記関心領域内の輝度情報が所定条件を満たす前記ＡＩ判定用画像データを生成することを特徴とする。

　また、本発明に係るピッキング装置は、前記２次元カメラは、前記ピッキングロボットの前記ハンド部と一体となって移動し得るように前記ハンド部の近傍に設置することを特徴とする。

　また、本発明に係るピッキング装置は、前記３次元カメラは、前記ピッキングロボットの前記ハンド部と一体となって移動し得るように前記ハンド部の近傍に設置することを特徴とする。

　また、本発明に係るピッキング装置は、前記２次元カメラ及び前記３次元カメラの替わりにステレオカメラを採用して、前記ステレオカメラによって、前記２次元撮影画像データの取得と、前記３次元点群情報の取得とを実現することを特徴とする。

　本発明に係る画像生成プログラムは、ピッキング対象物を撮影した２次元撮影画像データを判定して前記ピッキング対象物の特定及び当該ピッキング対象物の中心座標情報の算出を行う処理を、機械学習によって予め学習が行われた学習済モデル（ＡＩ）に基づいて行う構成において用いられるＡＩ判定用画像データの生成処理をコンピュータに実現させるための画像生成プログラムであって、前記コンピュータに、２次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得する２次元撮影画像取得機能と、３次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体に関する３次元点群情報を取得する３次元点群情報取得機能と、前記２次元撮影画像データと前記３次元点群情報との間で対象となる前記ピッキング対象物を基準として座標情報を共通化するキャリブレーション機能と、前記３次元点群情報から複数の前記ピッキング対象物の天面候補領域を抽出する天面候補領域抽出機能と、前記２次元撮影画像データにおける前記天面候補領域に相当する領域を関心領域に設定する関心領域設定機能と、少なくとも１以上の前記２次元撮影画像データに基づいて、前記関心領域内の輝度情報が所定条件を満たす前記２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得るＡＩ判定用画像取得機能とを実現させることを特徴とする。

　本発明によれば、入力された画像データからピッキング対象物を特定して各ピッキング対象物の中心座標情報を出力することについて予め学習を行った学習済モデルに対して入力するＡＩ判定用画像データを、３次元点群情報から抽出した天面候補領域に相当する関心領域内の輝度情報が所定条件を満たす２次元撮影画像データを選択又は合成して得るようにしたので、白飛びや暗部を含まないＡＩ判定用画像データを用いることで精度の高いピッキング対象物の中心座標情報（位置情報）の取得が可能となる。

本発明の実施の形態の少なくとも１つに対応するピッキング装置の全体構成を説明するための説明図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置の構成の一例を示すブロック図である。本発明の実施の形態の少なくとも１つに対応するピックアップ対象物のピッキング処理の流れの一例を示すフローチャート図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置において取得される２次元撮影画像データの一例を表した画像図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置において取得される３次元点群情報の一例を表した画像図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置において２次元撮影画像データに関心領域を設定した様子の一例を表した画像図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置において生成したＡＩ判定用画像データの一例を表した画像図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置においてＡＩが出力した中心座標情報を２次元撮影画像データに重畳表示した様子の一例を表した画像図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置において露光時間を変化させての複数回撮影した撮影画像の例を表した画像図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置において２次元撮影画像データの関心領域のみに着目して所定条件を判定する様子を説明するための説明図である。本発明の実施の形態の少なくとも１つに対応するピッキング装置においてＨＤＲ処理によってＡＩ判定用画像データを生成する例を説明するための説明図である。

［第１の実施の形態］
　以下、図面を参照しながら、本発明の第１の実施の形態に係るピッキング装置の例について説明する。

　図１は、本発明の実施の形態の少なくとも１つに対応するピッキング装置の全体構成を説明するための説明図である。図１に示すように、ピッキング装置１００は、ピッキングロボット１０と、２次元カメラ２０と、３次元カメラ３０と、制御ユニット４０とを少なくとも備える。本例のピッキング装置１００は、２次元カメラ２０によって撮影した２次元撮影画像データと、３次元カメラ３０によって取得した３次元点群情報とに基づいて、制御ユニット４０においてピックアップ対象物の天面の正確な位置を特定して、その特定した情報に基づいてピッキングロボット１０を制御して、ピッキング対象物の積み替えなどの作業を自動で実行させるためのものである。

　図２は、本発明の実施の形態の少なくとも１つに対応するピッキング装置の構成の一例を示すブロック図である。図２に示すように、ピッキング装置１００は、ピッキングロボット１０と、２次元カメラ２０と、３次元カメラ３０と、制御ユニット４０とを少なくとも備える。

　ピッキングロボット１０は、ピッキング対象物をピッキングするハンド部を備えたロボットである。本例では、ピッキング対象物の中心箇所を吸着して持ち上げる吸着ハンドを備えたピッキングロボット１０として説明を行うが、これに限定されるものではなく、例えば、ピッキング対象物の側面を挟んで把持するハンドを備えるものであってもよい。このピッキングロボット１０は、後述する制御ユニット４０によって動作を制御される。

　２次元カメラ２０は、ピッキング対象物を２次元撮影するための構成である。ピッキング対象物を撮影可能であれば設置位置や撮影角度は様々に設定可能であるが、本例のようにピッキング対象物の天面を吸着して掴む構成である場合には、ピッキング対象物の天面が写るように上方から撮影するように設置することが好ましい。具体的には、ピッキングロボット１０の先端のハンド部の近傍に設置することが考えられる。ハンド部の近傍とは、ハンド部と一体となって移動し得る位置であり、ハンド部と連動して移動させたとしてもピッキング作業に影響を及ぼさない位置のことをいう。また、ハンド部と一体に設置する場合に限らず、ピッキングロボット１０とは別にピッキング対象物の近くにピッキングロボット１０の動作範囲と干渉しないように櫓を組んで、櫓に２次元カメラ２０を設置するようにしてもよい。この２次元カメラ２０は、後述する制御ユニット４０によって撮影の実行が制御される。

　３次元カメラ３０は、ピッキング対象物までの距離情報を表す３次元点群情報を取得するための構成である。３次元点群情報を取得可能であればどのような手段であってもよいが、例えば、ＴＯＦカメラ（Time-of-Flight Camera）などが考えられる。また、その他にも、ステレオカメラを用いて距離情報を抽出する構成であってもよいし、ＬｉＤＡＲ（Light Detection and Ranging、Laser Imaging Detection and Ranging）を用いて３次元点群情報を取得する構成であってもよい。この３次元カメラ３０は、後述する制御ユニット４０によって撮影の実行が制御される。この３次元カメラ３０については、ピッキング対象物を撮影可能であれば設置位置や撮影角度は様々に設定可能であるが、本例のようにピッキング対象物の天面を吸着して掴む構成である場合には、ピッキング対象物の天面が写るように上方からの撮影するように設置することが好ましい。具体的には、ピッキングロボット１０の先端のハンド部の近傍に設置することが考えられる。ハンド部の近傍とは、ハンド部と一体となって移動し得る位置であり、ハンド部と連動して移動させたとしてもピッキング作業に影響を及ぼさない位置のことをいう。また、ハンド部と一体に設置する場合に限らず、ピッキングロボット１０とは別にピッキング対象物の近くにピッキングロボット１０の動作範囲と干渉しないように櫓を組んで、櫓に３次元カメラ３０を設置するようにしてもよい。なお、図１の例では、２次元カメラ２０と３次元カメラ３０とを隣接させて設置することで、ほぼ同様の撮影角度となるように構成している。

　制御ユニット４０は、２次元カメラ２０による撮影、３次元カメラ３０による撮影、及び、ピッキングロボットのピッキング動作を制御するための構成である。制御ユニット４０は、後述する制御を実行可能であればどのような手段にて構成されてもよいが、例えば、コンピュータ、マイコン、ＰＬＣ（Programmable Logic Controller）、またはこれらの組み合わせにて実現される。このうち、コンピュータは、一般的なコンピュータが通常備えているであろうＣＰＵ（Central Processing Unit：中央演算処理装置）と、メモリと、ハードディスクドライブ、ＳＳＤ等のストレージとを備えており、また、マウス、キーボード等の入力装置と、ディスプレイ、プリンタ等の出力装置と、通信ネットワークと接続するための通信装置とを備えており、これらがバスを介して接続されている構成であってもよい。情報処理装置１０の各部における処理は、これらの各部における処理を実行するためのプログラムをメモリから読み込んで制御回路（Processing circuit、Processing circuitry）として機能するＣＰＵやＧＰＵあるいはＦＰＧＡ（Field Programmable Gate Array）において実行することで実現する。言い換えると、当該プログラムの実行により、プロセッサ（処理回路）が、各装置の各処理を実行できるように構成される。また、ピッキング対象物の中心座標情報の取得までの処理はコンピュータにおいて実行し、中心座標情報を用いたピッキングロボット１０の動作制御についてはＰＬＣを用いて実現するといった構成も考えられる。また、制御ユニット４０に用いる各種データ、及び、制御ユニット４０による処理の結果として得られた各種データは、図示しない記憶部に適宜記憶されることはいうまでもない。

　図２に示すように、制御ユニット４０は、２次元撮影画像取得機能４１、３次元点群情報取得機能４２、キャリブレーション機能４３、天面候補領域抽出機能４４、関心領域設定機能４５、ＡＩ判定用画像取得機能４６、中心座標情報取得機能４７、ピッキング制御機能４８とを備えている。

　２次元撮影画像取得機能４１は、２次元カメラ２０を制御して荷積みされた複数のピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得する機能を有する。また、２次元撮影画像取得機能４１は、複数回の撮影を実行する際に、撮影時の露光時間を変化させて露光時間が異なる複数の２次元撮影画像データを取得し得る。

　３次元点群情報取得機能４２は、３次元カメラ３０を制御して荷積みされた複数のピッキング対象物の全体に関する３次元点群情報を取得する機能を有する。ここで、３次元点群情報とは、撮影範囲に存在する物体までの距離を計測点毎に算出した情報であり、点群の情報を解析することで物体の面や形状を特定することが可能となる。

　キャリブレーション機能４３は、２次元撮影画像データと３次元点群情報との間で対象となるピッキング対象物を基準として座標情報を共通化する機能を有する。２次元撮影画像データと３次元点群情報との間で共通に写るピックアップ対象物を基準として座標情報の共通化、いわゆるキャリブレーションを実行することで、２次元撮影画像データと３次元点群情報との間で相互に座標情報の変換が可能となる。これにより、２次元撮影画像データと同一画角にて３次元点群情報を描画し直すといった処理も可能となる。このキャリブレーション機能４３における座標情報の共通化処理により、２次元撮影画像データに写るピックアップ対象物の天面の各点についてのＸＹ座標と、２次元カメラ２０による撮影点からピックアップ対象物の天面までの距離であるＺ座標（鉛直方向の距離情報）とを取得することができる。

　天面候補領域抽出機能４４は、３次元点群情報から複数のピッキング対象物の天面候補領域を抽出する機能を有する。キャリブレーション機能４３における座標情報の共通化処理により、ピックアップ対象物の各点までの距離情報が明らかとなる。ここで、撮影点からＺ座標方向に徐々に探索範囲を広げていくと、あるＺ座標付近に複数の点群が平面的に存在する箇所を検知可能である。本例のように、ピッキング対象物の上方から撮影を行い、上方からピッキングロボット１０によってピッキングを実行する場合、３次元カメラ３０の撮影位置からＺ方向の距離が最も近い平面個所を天面候補領域として抽出することが好ましい。なお、点群が平面的に存在する箇所を検出する際に、Ｚ方向の距離に幅を持たせて探索するようにしてもよい。どの程度のＺ方向の距離範囲に点群が存在する場合に同一平面と推定するかについては作業環境に応じて適宜設定可能である。

　関心領域設定機能４５は、２次元撮影画像データにおける天面候補領域に相当する領域を関心領域に設定する機能を有する。天面候補領域抽出機能４４において３次元点群情報から天面候補領域を抽出したが、２次元撮影画像データと３次元点群情報とは座標情報を共通化しているため、この天面候補領域に相当する２次元撮影画像データ上の個所を関心領域に設定することが可能となる。関心領域の設定は、その内側に存在する画素情報のみを抽出可能なように関心領域の範囲を設定する必要がある。

　ＡＩ判定用画像取得機能４６は、少なくとも１以上の２次元撮影画像データに基づいて、関心領域内の輝度情報が所定条件を満たす２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得る機能を有する。このＡＩ判定用画像取得機能４６では、２次元撮影画像データ全体ではなく、関心領域に含まれる画素についての輝度情報に着目して、その輝度情報が所定条件を満たす２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得るようにする。ここで、輝度情報に関する所定条件とは、例えば、関心領域部分が暗過ぎたり明る過ぎたりする画像を除くために関心領域内の全画素に関する平均輝度値が所定の下限閾値以上及び／又は所定の上限閾値以下であること（上限と下限を両方設定する場合には、平均輝度値が所定の範囲内であること）を所定条件とすることが考えられる。また、例えば、関心領域部分に暗部が存在する画像を除くために輝度値が所定値以下（例えば、８ビットの場合の輝度値が１０以下）の画素が所定個数以上存在しないことを所定条件とすることが考えられる。また、例えば、関心領域部分に白飛びが存在する画像を除くために輝度値が所定値以上（例えば、８ビットの場合の輝度値が２４５以上）の画素が所定個数以上存在しないことを所定条件とすることが考えられる。

　また、ＡＩ判定用画像取得機能４６では、２次元カメラ２０における露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データについて所定条件を満たすか否かを判定することでＡＩ判定用画像データを取得するようにすることが考えられる。すなわち、予め２次元カメラ２０における露光条件を変化させて複数回の撮影を実行して複数の２次元撮影画像データを取得しておき、複数の２次元撮影画像データについて所定条件を満たすか否かを判定することで、最も適した２次元撮影画像データを選択してＡＩ判定用画像データとすることが考えられる。

　また、ＡＩ判定用画像取得機能４６では、２次元カメラ２０における露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データに基づいてＨＤＲ処理を実行することで、関心領域内の輝度情報が所定条件を満たすＡＩ判定用画像データを生成するようにすることが考えられる。ここで、ＨＤＲ（High-dynamic-range）処理とは、様々な露光時間にて撮影した複数の２次元撮影画像データから、最適な明るさ（白飛びや黒潰れしていない）の部分を選択し、１つの画像へ合成する処理のことをいう。これは、ＨＤＲ合成ともいう。ＨＤＲ処理は既知の技術であるため詳細は省略するが、このＨＤＲ処理を行うことで、白飛びや黒潰れのないＡＩ判定用画像データに適した画像を取得することが可能となる。ＨＤＲ処理によって得られた画像データについて関心領域内の輝度情報が所定条件を満たすかを判定して、満たす場合には、ＨＤＲ処理によって得られた画像データをＡＩ判定用画像データに設定する。

　中心座標情報取得機能４７は、入力された画像データからピッキング対象物を特定して各ピッキング対象物の中心座標情報を出力することについて予め学習を行った学習済モデルに対してＡＩ判定用画像データを入力することで、当該ＡＩ判定用画像データにおける各ピッキング対象物の中心座標情報を取得する機能を有する。ここで、学習済モデルとは、ピッキング対象物が写っている画像データとその画像データにおけるピッキング対象物の中心座標情報の正解データとをセットにした教師データセットを複数用いて機械学習を行うことで、ピッキング対象物が写っている画像データが入力された場合に中心座標情報を出力することについて学習されたモデルのことをいう。学習済モデルはどのようなモデルであってもよいが、例えば、ニューラルネットワークで構成された学習済モデルが考えられる。学習に用いる教師データセットについては、様々な画像が採用可能であり、例えば、学習段階においては白飛びや黒潰れを含む画像データを用いて学習を行うようにしてもよい。また、中心座標情報を出力する場合に限らず、箱状のピッキング対象物の天面の四隅の位置の座標情報を出力することについて学習を行った学習済モデルを採用するようにしてもよいし、ピッキング対象物の天面の四隅の位置の座標情報と中心座標情報を両方出力することについて学習を行った学習済モデルを採用するようにしてもよい。すなわち、制御対象のピッキングロボット１０を制御してピッキング作業を実行するために必要な情報を取得できるように学習済モデルを学習しておくことが好ましい。

　ピッキング制御機能４８は、中心座標情報及び３次元点群情報から取得される高さ情報に基づいて、ピッキングロボットによるピッキング対象物のピッキング動作及び移載動作を制御する機能を有する。ピッキング対象物のピッキング動作及び移載動作に必要な情報として中心座標情報や高さ情報（Ｚ座標情報）を取得する。ここで、同じ高さに天面を有するピックアップ対象物が複数存在する場合に、何れのピッキング対象物を選択してピッキング動作及び移載動作を実行するかについては、適宜設定可能である。一例としては、ハンド部に最も近いピックアップ対象物を選択するようにルール設定しておくことが考えられる。ハンド部によってピックアップ対象物を掴んだ後の制御については、既知の技術に基づいて適宜実行可能である。

　図３は、本発明の実施の形態の少なくとも１つに対応するピックアップ対象物のピッキング処理の流れの一例を示すフローチャート図である。図３に示すように、ピッキング処理は、ピッキング装置１００の制御ユニット４０において、ピッキング対象物を撮影した１以上の２次元撮影画像データを取得することによって開始される（ステップＳ１０１）。次に、制御ユニット４０は、ピッキング対象物を撮影した３次元点群情報を取得する（ステップＳ１０２）。次に、制御ユニット４０は、２次元撮影画像データと３次元点群情報との間で座標情報を共通化するキャリブレーションを実行する（ステップＳ１０３）。次に、制御ユニット４０は、３次元点群情報から天面候補領域を抽出する（ステップＳ１０４）。次に、制御ユニット４０は、２次元撮影画像データにおける天面候補領域に相当する位置を関心領域として設定する（ステップＳ１０５）。次に、制御ユニット４０は、１以上の２次元撮影画像データに基づいて、関心領域内の輝度情報が所定条件を満たす画像データを選択又は生成することでＡＩ判定用画像データを取得する（ステップＳ１０６）。次に、制御ユニット４０は、ＡＩ判定用画像データを学習済モデル（ＡＩ）に入力することで、ピッキング対象物の中心座標情報を取得する（ステップＳ１０７）。そして、制御ユニット４０は、取得した中心座標情報及び高さ情報に基づいてピッキングロボットによるピッキング対象物のピッキング動作及び移載動作の制御を実行して（ステップＳ１０８）、ピッキング処理を終了する。

　次に、本例によるピッキング装置１００による動作について、具体的な画像を例に用いて説明を行う。

　図４は、本発明の実施の形態の少なくとも１つに対応するピッキング装置において取得される２次元撮影画像データの一例を表した画像図である。この図４に示す画像図では、箱状のピックアップ対象物が下段に３つ載置され、その上に２つの箱状のピックアップ対象物が載置された状態を２次元カメラ２０にて撮影した２次元撮影画像データを表している。

　図５は、本発明の実施の形態の少なくとも１つに対応するピッキング装置において取得される３次元点群情報の一例を表した画像図である。この図５に示す画像図は、図４と同じピックアップ対象物を３次元カメラ３０にて撮影することで得られた３次元点群情報を表しており、１つの画像は斜め方向から撮影した３次元点群情報を表しており、１つの画像は２次元カメラの画角で描画した３次元点群情報を表しており、残りの１つの画像は、天面候補領域を抽出したものを表している。

　図６は、本発明の実施の形態の少なくとも１つに対応するピッキング装置において２次元撮影画像データに関心領域を設定した様子の一例を表した画像図である。この図６に示す画像図は、２次元撮影画像データに関心領域を設定した状態を表しており、関心領域以外の個所をマスキング処理したマスキング画像となっている。

　図７は、本発明の実施の形態の少なくとも１つに対応するピッキング装置において生成したＡＩ判定用画像データの一例を表した画像図である。ＡＩ判定用画像データとして採用し得るものは、関心領域内の輝度情報が所定条件を満たす２次元撮影画像データであるので、図６のようにして設定した関心領域の範囲を基準として、１以上の２次元撮影画像データについて所定条件を満たすか否かの判定を行って、所定条件を満たす２次元撮影画像データをＡＩ判定用画像データとして採用する。

　図８は、本発明の実施の形態の少なくとも１つに対応するピッキング装置においてＡＩが出力した中心座標情報を２次元撮影画像データに重畳表示した様子の一例を表した画像図である。この図８に示す画像図は、ＡＩが出力した中心座標情報を２次元撮影画像データに重畳表示した状態を表している。この図８に示すように、ピックアップ対象物の中心座標情報（必要に応じて四隅の座標情報を含むようにしてもよい）を高精度に取得することができれば、ピッキング動作を正確に制御することが可能となる。中心座標情報（必要に応じて四隅の座標情報を含むようにしてもよい）を高精度に取得するためには、ＡＩ判定用画像データとして採用する画像データが、白飛びや黒潰れのない判定精度の高い画像である必要がある。

　図９は、本発明の実施の形態の少なくとも１つに対応するピッキング装置において露光時間を変化させての複数回撮影した撮影画像の例を表した画像図である。この図９に示すように、露光時間を変化させて複数回撮影を実行すると、露光時間によって得られる画像データの状態が異なることが分かる。この図９に示す例では３パターンを表示しており、中間の露光時間の画像データが最適であるといえるが、露光時間の変化パターンをもっと増やした場合に何れの露光時間が最適であるかについては、撮影環境によって異なるといえる。

　図１０は、本発明の実施の形態の少なくとも１つに対応するピッキング装置において２次元撮影画像データの関心領域のみに着目して所定条件を判定する様子を説明するための説明図である。図９に示す２次元撮影画像データについて関心領域を設定すると、この図１０に示す画像図のように関心領域が設定される。図９のように露光時間を変化させた複数の２次元撮影画像データについて、図１０に示すように設定された関心領域内の輝度情報が所定条件を満たすか否かを判定して、所定条件を満たす２次元撮影画像データをＡＩ判定用画像データとして採用するようにしてもよい。

　図１１は、本発明の実施の形態の少なくとも１つに対応するピッキング装置においてＨＤＲ処理によってＡＩ判定用画像データを生成する例を説明するための説明図である。図１１に示す未処理の２次元撮影画像データは、黒潰れまではいかないものの陰になっていて暗い箇所や、白飛び発生箇所が存在する。これに対して、露光時間を変化させた複数の２次元撮影画像データを用いてＨＤＲ処理（ＨＤＲ合成）を行うことで、暗部箇所及び白飛び箇所が解消された画像データを生成することができる。このＨＤＲ処理によって得られた画像データについて関心領域内の輝度情報が所定条件を満たすか否かを判定して、所定条件を満たす場合にはＨＤＲ処理で得られた画像データをＡＩ判定用画像データとして採用するようにしてもよい。

　以上のように、本発明に係るピッキング装置１００によれば、ピッキング対象物をピッキングするハンド部を備えたピッキングロボットと、ピッキング対象物を２次元撮影するための２次元カメラと、ピッキング対象物までの距離情報を表す３次元点群情報を取得するための３次元カメラと、ピッキングロボットのピッキング動作を制御する制御ユニットとを備え、制御ユニットは、２次元カメラを制御して荷積みされた複数のピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得する２次元撮影画像取得機能と、３次元カメラを制御して荷積みされた複数のピッキング対象物の全体に関する３次元点群情報を取得する３次元点群情報取得機能と、２次元撮影画像データと３次元点群情報との間で対象となるピッキング対象物を基準として座標情報を共通化するキャリブレーション機能と、３次元点群情報から複数のピッキング対象物の天面候補領域を抽出する天面候補領域抽出機能と、２次元撮影画像データにおける天面候補領域に相当する領域を関心領域に設定する関心領域設定機能と、少なくとも１以上の２次元撮影画像データに基づいて、関心領域内の輝度情報が所定条件を満たす２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得るＡＩ判定用画像取得機能と、入力された画像データからピッキング対象物を特定して各ピッキング対象物の中心座標情報を出力することについて予め学習を行った学習済モデルに対してＡＩ判定用画像データを入力することで、当該ＡＩ判定用画像データにおける各ピッキング対象物の中心座標情報を取得する中心座標情報取得機能と、記中心座標情報及び３次元点群情報から取得される高さ情報に基づいて、ピッキングロボットによるピッキング対象物のピッキング動作及び移載動作を制御するピッキング制御機能とを備えるようにしたので、入力された画像データからピッキング対象物を特定して各ピッキング対象物の中心座標情報を出力することについて予め学習を行った学習済モデルに対して入力するＡＩ判定用画像データを、３次元点群情報から抽出した天面候補領域に相当する関心領域内の輝度情報が所定条件を満たす２次元撮影画像データを選択又は合成して得るようにしたので、白飛びや暗部を含まないＡＩ判定用画像データを用いることで精度の高いピッキング対象物の中心座標情報（位置情報）の取得が可能となる。

　また、ＡＩ判定用画像取得機能は、関心領域内の画素の平均輝度値が所定の下限閾値以上及び／又は所定の上限閾値以下であることをＡＩ判定用画像データが満たすべき所定条件とするようにしたので、平均輝度値が低すぎたり高すぎたりする２次元撮影画像データを除外して２次元撮影画像データをＡＩ判定用画像データとして採用することが可能となる。

　また、ＡＩ判定用画像取得機能は、２次元カメラにおける露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データについて所定条件を満たすか否かを判定することでＡＩ判定用画像データを取得するようにしたので、撮影環境における最適な露光時間による２次元撮影画像データをＡＩ判定用画像データとして採用することが可能となる。

　また、ＡＩ判定用画像取得機能は、２次元カメラにおける露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データに基づいてＨＤＲ処理を実行することで、関心領域内の輝度情報が所定条件を満たすＡＩ判定用画像データを生成するようにしたので、ＨＤＲ処理によって白飛びや黒潰れのない判定精度の高いＡＩ判定用画像データを生成することが可能となる。

［第２の実施の形態］
　第１の実施の形態においては、２次元カメラ２０を用いて２次元撮影画像データを取得し、３次元カメラ３０を用いて３次元点群情報を取得するものとして説明を行ったが、これに限定されるものではない。例えば、ステレオカメラを採用して、ステレオカメラによって２次元撮影画像データの取得と３次元点群情報の取得の両方を実現するようにしてもよい。

　ステレオカメラによれば、２つの異なる撮影角度でそれぞれ撮影を実行して２つの２次元撮影画像データを取得した後に、その２つの２次元撮影画像データを用いてステレオマッチングによって深度情報（距離情報）を取得して３次元点群情報を生成することができる。このときに用いた２つの２次元撮影画像データの一方を、第１の実施の形態において２次元カメラ２０によって取得していた２次元撮影画像データの替わりとして用いることで、ステレオカメラによって２次元撮影画像データの取得と３次元点群情報の取得の両方を実現することが可能となる。また、ステレオカメラは、２次元撮影画像データと３次元点群情報との間のキャリブレーション機能を担うことも可能である。

　１００　　　　　　ピッキング装置
　１０　　　　　　　ピッキングロボット
　２０　　　　　　　２次元カメラ
　３０　　　　　　　３次元カメラ
　４０　　　　　　　制御ユニット
　４１　　　　　　　２次元撮影画像取得機能
　４２　　　　　　　３次元点群情報取得機能
　４３　　　　　　　キャリブレーション機能
　４４　　　　　　　天面候補領域抽出機能
　４５　　　　　　　関心領域設定機能
　４６　　　　　　　ＡＩ判定用画像取得機能
　４７　　　　　　　中心座標情報取得機能
　４８　　　　　　　ピッキング制御機能

Claims

　ピッキング対象物をピッキングするハンド部を備えたピッキングロボットと、
　前記ピッキング対象物を２次元撮影するための２次元カメラと、
　前記ピッキング対象物までの距離情報を表す３次元点群情報を取得するための３次元カメラと、
　前記ピッキングロボットのピッキング動作を制御する制御ユニットとを備え、
　前記制御ユニットは、
　前記２次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得する２次元撮影画像取得機能と、
　前記３次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体に関する３次元点群情報を取得する３次元点群情報取得機能と、
　前記２次元撮影画像データと前記３次元点群情報との間で対象となる前記ピッキング対象物を基準として座標情報を共通化するキャリブレーション機能と、
　前記３次元点群情報から複数の前記ピッキング対象物の天面候補領域を抽出する天面候補領域抽出機能と、
　前記２次元撮影画像データにおける前記天面候補領域に相当する領域を関心領域に設定する関心領域設定機能と、
　少なくとも１以上の前記２次元撮影画像データに基づいて、前記関心領域内の輝度情報が所定条件を満たす前記２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得るＡＩ判定用画像取得機能と、
　入力された画像データから前記ピッキング対象物を特定して各ピッキング対象物の中心座標情報を出力することについて予め学習を行った学習済モデルに対して前記ＡＩ判定用画像データを入力することで、当該ＡＩ判定用画像データにおける各ピッキング対象物の中心座標情報を取得する中心座標情報取得機能と、
　前記中心座標情報及び前記３次元点群情報から取得される高さ情報に基づいて、前記ピッキングロボットによるピッキング対象物のピッキング動作及び移載動作を制御するピッキング制御機能と
を備えることを特徴とするピッキング装置。
　前記ＡＩ判定用画像取得機能は、前記関心領域内の画素の平均輝度値が所定の下限閾値以上及び／又は所定の上限閾値以下であることを前記ＡＩ判定用画像データが満たすべき所定条件とする
　請求項１記載のピッキング装置。
　前記ＡＩ判定用画像取得機能は、前記２次元カメラにおける露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データについて前記所定条件を満たすか否かを判定することで前記ＡＩ判定用画像データを取得する
　請求項１又は２記載のピッキング装置。
　前記ＡＩ判定用画像取得機能は、前記２次元カメラにおける露光条件を変化させて複数回の撮影を実行して取得した複数の２次元撮影画像データに基づいてＨＤＲ処理を実行することで、前記関心領域内の輝度情報が所定条件を満たす前記ＡＩ判定用画像データを生成する
　請求項１又は２記載のピッキング装置。
　前記２次元カメラは、前記ピッキングロボットの前記ハンド部と一体となって移動し得るように前記ハンド部の近傍に設置する
　請求項１から請求項４の何れか一項に記載のピッキング装置。
　前記３次元カメラは、前記ピッキングロボットの前記ハンド部と一体となって移動し得るように前記ハンド部の近傍に設置する
　請求項１から請求項４の何れか一項に記載のピッキング装置。
　前記２次元カメラ及び前記３次元カメラの替わりにステレオカメラを採用して、前記ステレオカメラによって、前記２次元撮影画像データの取得と、前記３次元点群情報の取得とを実現する
　請求項１から請求項６の何れか一項に記載のピッキング装置。
　ピッキング対象物を撮影した２次元撮影画像データを判定して前記ピッキング対象物の特定及び当該ピッキング対象物の中心座標情報の算出を行う処理を、機械学習によって予め学習が行われた学習済モデル（ＡＩ）に基づいて行う構成において用いられるＡＩ判定用画像データの生成処理をコンピュータに実現させるための画像生成プログラムであって、
　前記コンピュータに、
　２次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体を撮影した少なくとも１以上の２次元撮影画像データを取得する２次元撮影画像取得機能と、
　３次元カメラを制御して荷積みされた複数の前記ピッキング対象物の全体に関する３次元点群情報を取得する３次元点群情報取得機能と、
　前記２次元撮影画像データと前記３次元点群情報との間で対象となる前記ピッキング対象物を基準として座標情報を共通化するキャリブレーション機能と、
　前記３次元点群情報から複数の前記ピッキング対象物の天面候補領域を抽出する天面候補領域抽出機能と、
　前記２次元撮影画像データにおける前記天面候補領域に相当する領域を関心領域に設定する関心領域設定機能と、
　少なくとも１以上の前記２次元撮影画像データに基づいて、前記関心領域内の輝度情報が所定条件を満たす前記２次元撮影画像データを選択又は合成して、ＡＩ判定用画像データを得るＡＩ判定用画像取得機能と
　を実現させる画像生成プログラム。