JP7201189B2

JP7201189B2 - 物体サイズ検出のためのロボットシステム

Info

Publication number: JP7201189B2
Application number: JP2022081462A
Authority: JP
Inventors: ユジンズ; 良樹金本; ジェロニモモレイラロドリゲスホセ; ニコラエフディアンコフローゼン
Original assignee: Mujin Inc
Current assignee: Mujin Inc
Priority date: 2021-05-18
Filing date: 2022-05-18
Publication date: 2023-01-10
Anticipated expiration: 2042-05-18
Also published as: CN115643800A; US20220375097A1; CN116619386A; JP7189586B2; JP2022177833A; JP2022177834A; WO2022245842A1; US20220371200A1; JP2023024554A; EP4341053A1; CN115366091A; JP2023016882A

Description

関連出願の相互参照
本出願は、２０２１年５月１８日出願の「ＡＲＯＢＯＴＩＣＳＹＳＴＥＭＦＯＲＯＢＪＥＣＴＳＩＺＥＭＥＡＳＵＲＥＭＥＮＴＯＲＭＩＮＩＭＵＭＶＩＡＢＬＥＲＥＧＩＯＮＤＥＴＥＣＴＩＯＮ」と題された米国特許仮出願第６３／１８９，７４３号の利益を主張し、その内容全体が参照により本明細書に組み込まれる。

本技術は、概して、ロボットシステム、より具体的には、物体サイズの測定もしくは推定、および／または最小実行可能領域検出を実施するためのシステム、プロセス、および技術を対象とする。

性能がますます向上し、コストが低減するにつれ、現在、多くのロボット（例えば、物理的アクションを自動／自律的に実行するように構成された機械）が様々な異なる分野で広く使用されている。ロボットは、例えば、製造および／または組立、梱包および／または包装、輸送および／または出荷などにおける様々なタスク（例えば、空間を通した物体の操縦または搬送）を実行するために使用され得る。タスクを実行する際に、ロボットは、人のアクションを再現することができ、それによって、そうでなければ危険または反復的なタスクを実施するのに必要な人の関与を置き換えるか、または低減することができる。

本明細書の一実施形態によれば、計算システムであって、少なくとも１つの処理回路を備え、少なくとも１つの処理回路が、アームおよびアームに接続されたエンドエフェクターを有するロボット、および視野を有するカメラと通信し、視野内に１つ以上の物体がある、またはあったときに、非一時的コンピュータ可読媒体に記憶されている命令を実行するように構成されているものが提供される。命令は、カメラによって生成される１つ以上の物体の初期画像情報を取得することと、初期画像情報に基づいて１つ以上の物体の複数の角を検出することと、複数の角から標的物体の標的開放角を識別することと、標的物体の最小実行可能領域（ＭＶＲ）を規定することと、最小実行可能領域に基づいて非遮蔽面積を規定することと、ロボットのアームを位置決めするための位置決めコマンドを送信することと、最小実行可能領域内の標的物体を掴むための把持コマンドを送信することと、移動方向、移動距離、および移動タイプに基づいて、ロボットのアームを使用して標的物体を移動させるための移動コマンドを送信することと、１つ以上の物体の補足的な画像情報を取得することと、補足的な画像情報に基づいて標的物体の推定寸法を算出することと、を行うためのものであり、位置決めコマンド、把持コマンド、および移動コマンドのうちの少なくとも１つは、ロボットのアームが１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている。

さらなる実施形態は、非一時的コンピュータ可読媒体と、視野を有するカメラと通信し、かつ、命令を実行するように構成された少なくとも１つの処理回路と、を備える、ロボットシステムを制御する方法を提供する。方法は、カメラによって生成される１つ以上の物体の初期画像情報を取得することと、初期画像情報に基づいて１つ以上の物体の複数の角を検出することと、複数の角から標的物体の標的開放角を識別することと、標的物体の最小実行可能領域（ＭＶＲ）を規定することと、最小実行可能領域に基づいて非遮蔽面積を規定することと、ロボットのアームを位置決めするための位置決めコマンドを送信することと、最小実行可能領域内の標的物体を掴むための把持コマンドを送信することと、移動方向、移動距離、および移動タイプに基づいて、ロボットのアームを使用して標的物体を移動させるための移動コマンドを送信することと、１つ以上の物体の補足的な画像情報を取得することと、補足的な画像情報に基づいて標的物体の推定寸法を算出することと、を含み、位置決めコマンド、把持コマンド、および移動コマンドのうちの少なくとも１つは、ロボットのアームが１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている。

さらなる実施形態では、非一時的コンピュータ可読媒体が提供される。非一時的コンピュータ可読媒体は、視野を有するカメラと通信する少なくとも１つの処理回路による実行のための命令を含み、少なくとも１つの処理回路は、１つ以上の物体が視野内にある、またはあったときに、命令を行うように構成されており、命令は、カメラによって生成される１つ以上の物体の初期画像情報を取得することと、初期画像情報に基づいて１つ以上の物体の複数の角を検出することと、複数の角から標的物体の標的開放角を識別することと、標的物体の最小実行可能領域（ＭＶＲ）を規定することと、最小実行可能領域に基づいて非遮蔽面積を規定することと、ロボットのアームを位置決めするための位置決めコマンドを送信することと、最小実行可能領域内の標的物体を掴むための把持コマンドを送信することと、移動方向、移動距離、および移動タイプに基づいて、ロボットのアームを使用して標的物体を移動させるための移動コマンドを送信することと、１つ以上の物体の補足的な画像情報を取得することと、補足的な画像情報に基づいて標的物体の推定寸法を算出することと、を行うために構成されており、位置決めコマンド、把持コマンド、および移動コマンドのうちの少なくとも１つは、ロボットのアームが１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている。

本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするためのシステムを示す。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするためのシステムを示す。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするためのシステムを示す。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするためのシステムを示す。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするように構成された計算システムを示すブロック図を提供する。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするように構成された計算システムを示すブロック図を提供する。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするように構成された計算システムを示すブロック図を提供する。本明細書の実施形態に従い、最小実行可能領域を規定することを実施するか、または容易にするように構成された計算システムを示すブロック図を提供する。システムによって処理され、本明細書の実施形態に従う、画像情報の実施例を提供する。システムによって処理され、本明細書の実施形態に従う、画像情報の実施例を提供する。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の実施形態による、最小実行可能領域を規定する態様を示す。本明細書の一実施形態による、最小実行可能領域を定義する方法を示すフロー図を提供する。本明細書の一実施形態による、標的物体の寸法を推定する方法を示すフロー図を提供する。本明細書の実施形態による、標的物体の寸法を推定する態様を示す。本明細書の実施形態による、標的物体の寸法を推定する態様を示す。

協調搬送機構を有するロボットシステムのシステムおよび方法が本明細書に説明されている。いくつかの実施形態に従って構成されたロボットシステム（例えば、各々が１つ以上の指定されたタスクを実行するデバイスの統合されたシステム）は、複数のユニット（例えば、ロボット）の操作を協調させることによって、統合されたタスクを自律的に実行する。

本明細書に記載される本技術は、既存のコンピュータベースの画像認識およびロボット制御分野に技術的改善をもたらす。技術的改善は、物体とのロボットの相互作用の効率および信頼性を向上させるために、物体の握る部分を識別する全体的な速度および信頼性の向上を提供する。画像情報を使用して、カメラの視野内に存在する物体を決定および区別することで、本明細書に説明されるプロセスは、１つの標的物体の潜在的な握る部分の識別を調整および支援するための物体の移動の使用を通して、既存の画像認識をさらに改善する。

特に、本明細書に説明される本技術は、各物体の寸法および位置の識別が未知であるか、または不完全な正確さで既知であるとき、ロボットシステムが、複数の物体のうちの特定の物体と相互作用するのを支援する。例えば、複数の物体が互いに同一平面に位置決めされる場合、既存のコンピュータベースの画像認識は、各物体を識別することが困難であり、物体とどのように相互作用するかについて、ロボットシステムに確実かつ正確に指示することが困難であり得る。特に、それは、物体の寸法が正確に識別されない場合、１つの物体が終了し、別の物体が開始するロボットシステムにとって明確ではない場合がある。したがって、システムは、物体が他の物体と交差する場所で物体を把持することを試みるリスクがある。そのような場合、システムは、いずれの物体も把持することに失敗する場合がある。物体の正確な寸法が、完全な正確さで知られていなくてもよいが、本明細書に提供されるシステムおよび方法は、物体の正しいエッジを識別または決定することを必要とせず、ロボットアームによって把持され得る物体の少なくとも一部分、例えば、最小実行可能領域を迅速かつ確実に識別する能力を提供する。さらに、システムは、物体を掴む場所を調整するように構成され得る。物体を特定の場所（例えば、中心から外れた場所）で掴む場合、物体を輸送することが困難である場合がある。本明細書に提供されるシステムおよび方法は、ロボットアームによる初期の把持後の物体の移動を使用して、物体の正しい寸法を決定し、更新された寸法に基づいて、ロボットが物体とどのように相互作用するかを調整または変更し得る。

以下に、本開示の技術の理解を提供するために、具体的な詳細が記載されている。実施形態では、本明細書に導入される技術は、本明細書に開示される各具体的な詳細を含まずに実施されてもよい。他の実例では、特定の機能またはルーチンなどの周知の特徴は、本開示を不必要に不明瞭化することを避けるために詳細には説明されない。本明細書における「実施形態」、「一実施形態」などへの参照は、説明される特定の特徴、構造、材料、または特性が、本開示の少なくとも１つの実施形態に含まれることを意味する。したがって、本明細書におけるそのような語句の外観は、必ずしもすべて同じ実施形態を指すわけではない。一方で、そのような参照は、必ずしも相互に排他的なものではない。さらに、特定の特徴、構造、材料、または特性は、１つ以上の実施形態で、任意の好適な様式で組み合わせられ得る。図に示される様々な実施形態は、単に例示的な表現であり、必ずしも縮尺どおりに描かれるものではないことを理解されたい。

周知であり、かつ多くの場合にロボットシステムおよびサブシステムと関連付けられるが、本開示の技術のいくつかの重要な態様を不必要に不明瞭にし得る、構造またはプロセスを説明する数点の詳細は、明確化の目的で以下の説明には記載されていない。さらに、以下の開示は、本技術の異なる態様の数点の実施形態を説明しているが、数点の他の実施形態は、本節に説明されるものとは異なる構成または異なる構成要素を有してもよい。したがって、開示された技術は、追加の要素を有するか、または以下に説明される要素のうちの数点を有しない、他の実施形態を有してもよい。

以下に説明される本開示の多くの実施形態または態様は、プログラム可能なコンピュータまたはコントローラによって実行されるルーチンを含む、コンピュータまたはコントローラ実行可能命令の形態をとり得る。関連分野の当業者であれば、開示された技術は、以下に示され説明されるもの以外のコンピュータまたはコントローラシステム上で、またはそれらを用いて実践され得ることを理解するであろう。本明細書に説明される技術は、以下に説明されるコンピュータ実行可能命令のうちの１つ以上を実行するように、特別にプログラム、構成、または構築されている、専用コンピュータまたはデータプロセッサで具現化され得る。したがって、本明細書において一般的に使用される「コンピュータ」および「コントローラ」という用語は、任意のデータプロセッサを指し、インターネット家電およびハンドヘルドデバイス（パームトップコンピュータ、ウェアラブルコンピュータ、セルラーまたはモバイルフォン、マルチプロセッサシステム、プロセッサベースまたはプログラム可能な家電、ネットワークコンピュータ、ミニコンピュータなどを含む）を含み得る。これらのコンピュータおよびコントローラによって処理される情報は、液晶ディスプレイ（ＬＣＤ）を含む、任意の好適なディスプレイ媒体で提示され得る。コンピュータまたはコントローラ実行可能タスクを実行するための命令は、ハードウェア、ファームウェア、またはハードウェアとファームウェアとの組み合わせを含む、任意の好適なコンピュータ可読媒体に、またはその上に記憶され得る。命令は、例えば、フラッシュドライブ、ＵＳＢデバイス、および／または他の好適な媒体を含む、任意の適切なメモリデバイスに含まれ得る。

「結合」および「接続」という用語は、それらの派生語とともに、本明細書では、構成要素間の構造的な関係を説明するために使用され得る。これらの用語は、互いの同義語として意図されていないことが理解されるべきである。むしろ、特定の実施形態では、「接続」は、２つ以上の要素が互いに直接接触していることを示すために使用され得る。文脈において別途明白にされない限り、「結合」という用語は、２つ以上の要素が、互いに直接的または間接的（それらの間の他の介在要素との）接触にあるか、または２つ以上の要素が互いに協働するか、もしくは相互作用する（例えば、信号送信／受信のための、または関数呼び出しのためのなどの、因果関係にあるような）か、またはその両方を示すために使用され得る。

計算システムによる画像分析に対する本明細書の任意の参照は、選択された点に対する様々な場所のそれぞれの奥行き値を説明する奥行き情報を含み得る空間構造情報に従って、またはそれを使用して実施され得る。奥行き情報は、物体を識別するか、または物体が空間的にどのように配置されているかを推定するために使用され得る。一部の実例では、空間構造情報は、物体の１つ以上の表面上の場所を説明する点群を含んでもよく、または該点群を生成するために使用され得る。空間構造情報は、可能な画像分析の一形態に過ぎず、当業者が公知の他の形態が、本明細書に説明される方法に従って使用され得る。

図１Ａは、物体検出、すなわちより具体的には、物体認識を実施するためのシステム１５００を示している。より詳細には、システム１５００は、計算システム１１００およびカメラ１２００を含み得る。この実施例では、カメラ１２００は、カメラ１２００が位置する環境を描写するか、もしくはそうでなければ表し、またはより具体的には、カメラ１２００の視野（カメラ視野とも呼ぶ）中の環境を表す、画像情報を生成するように構成され得る。環境は、例えば、倉庫、製造工場、小売空間、または他の施設であり得る。こうした実例では、画像情報が、箱、ビン、ケース、木枠または他の容器などの、こうした施設に位置する物体を表し得る。システム１５００は、以下でより詳細に論じるように、画像情報を使用して、カメラ視野内の個々の物体を区別すること、画像情報に基づいて物体認識または物体登録を実施すること、および／または画像情報に基づいてロボット相互作用計画を実施することなど、画像情報を生成、受信、および／または処理するよう構成され得る（「および／または」および「または」という用語は、本開示では互換的に使用される）。ロボット相互作用計画は、例えば、ロボットと容器または他の物体との間のロボット相互作用を促進するように、施設でロボットを制御するために使用され得る。計算システム１１００およびカメラ１２００が、同じ施設に位置してもよく、または互いと遠隔に位置し得る。例えば、計算システム１１００は、倉庫または小売空間から遠隔のデータセンターでホストされる、クラウドコンピューティングプラットフォームの一部であってもよく、ネットワーク接続を介して、カメラ１２００と通信し得る。

実施形態では、カメラ１２００（画像感知装置とも呼ばれ得る）は、２Ｄカメラおよび／または３Ｄカメラであり得る。例えば、図１Ｂは、計算システム１１００、ならびにカメラ１２００Ａおよびカメラ１２００Ｂ（その両方がカメラ１２００の実施形態であり得る）を含む、システム１５００Ａ（システム１５００の実施形態であり得る）を示している。この実施例では、カメラ１２００Ａは、カメラの視野中にある環境の視覚的外観を記述する２Ｄ画像を含むまたは形成する、２Ｄ画像情報を生成するように構成される、２Ｄカメラであり得る。カメラ１２００Ｂは、カメラの視野中の環境に関する空間構造情報を含むまたは形成する３Ｄ画像情報を生成するように構成される３Ｄカメラ（空間構造感知カメラまたは空間構造感知装置とも呼ばれる）であり得る。空間構造情報は、カメラ１２００の視野中にある様々な物体の表面上の場所など、カメラ１２００Ｂに対する様々な場所のそれぞれの奥行き値を説明する、奥行き情報（例えば、奥行きマップ）を含んでもよい。カメラの視野または物体の表面上のこれらの場所を、物理的な場所と称することもできる。この実施例の奥行き情報は、物体が三次元（３Ｄ）空間の中で空間的にどのように配置されるかを推定するために使用され得る。一部の実例では、空間構造情報は、カメラ１２００Ｂの視野中にある物体の１つ以上の表面上の場所を説明する点群を含んでもよく、または該点群を生成するために使用され得る。より具体的には、空間構造情報は、物体の構造（物体構造とも呼ぶ）上の様々な場所を説明し得る。

実施形態では、システム１５００が、カメラ１２００の環境でロボットと様々な物体との間のロボット相互作用を促進するためのロボット操作システムであり得る。例えば、図１Ｃは、図１Ａおよび図１Ｂのシステム１５００／１５００Ａの実施形態であり得る、ロボット操作システム１５００Ｂを示している。ロボット操作システム１５００Ｂは、計算システム１１００、カメラ１２００、およびロボット１３００を含んでもよい。上述のように、ロボット１３００は、カメラ１２００の環境の中にある１つ以上の物体、例えば、箱、木枠、ビン、またはその他の容器と相互作用するために使用され得る。例えば、ロボット１３００は、１つの場所から容器を拾い上げ、それらを別の場所に移動するように構成され得る。一部の事例では、ロボット１３００は、容器または他の物体のグループが降ろされて、例えば、ベルトコンベヤーに移動されるといった、パレットから降ろす操作を実施するために使用され得る。一部の実装形態では、カメラ１２００は、ロボット１３００のロボットアーム３３２０など、ロボット１３００に取り付けられてもよい。一部の実装形態では、カメラ１２００は、ロボット１３００から分離し得る。例えば、カメラ１２００は、倉庫または他の構造の天井に装着されてもよく、構造に対して静止したままであり得る。

一実施形態では、図１Ａ～図１Ｃの計算システム１１００は、ロボットコントローラとも呼ばれ得るロボット１３００を形成してもよく、またはロボット１３００に組み込まれてもよい。ロボット制御システムは、システム１５００Ｂに含まれ得、例えば、ロボット１３００と容器または他の物体との間のロボット相互作用を制御するためのロボット相互作用移動コマンドなどの、ロボット１３００用のコマンドを生成するように構成されている。こうした実施形態では、計算システム１１００は、例えば、カメラ１２００によって生成された画像情報に基づいて、このようなコマンドを生成するように構成されてもよい。例えば、計算システム１１００は、画像情報に基づいて運動計画を決定するように構成されてもよく、運動計画は、例えば、物体を握るか、または他の方法で拾い上げることを意図し得る。計算システム１１００は、運動計画を実行するために、１つ以上のロボット相互作用移動コマンドを生成し得る。

実施形態では、計算システム１１００は、視覚システムを形成しても、またはその一部であり得る。視覚システムは、例えば、ロボット１３００が位置する環境を記述する、または別の方法として、もしくは追加的に、カメラ１２００が位置する環境を記述する、視覚情報を生成するシステムであり得る。視覚情報が、上で考察された３Ｄ画像情報、および／または２Ｄ画像情報、またはいくつかの他の画像情報を含んでもよい。一部のシナリオでは、計算システム１１００が、視覚システムを形成する場合、視覚システムは、上で考察されたロボット制御システムの一部であってもよく、またはロボット制御システムから分離し得る。視覚システムは、ロボット制御システムから分離する場合、視覚システムは、ロボット１３００が位置する環境を記述する、情報を出力するように構成され得る。情報は、視覚システムからこうした情報を受信し、情報に基づいて、運動計画を実施し、および／またはロボット相互作用移動コマンドを生成することができる、ロボット制御システムに出力され得る。視覚システムに関する詳細情報は、以下に詳しく説明されている。

実施形態では、計算システム１１００は、ＲＳ－２３２インターフェース、ユニバーサルシリアルバス（ＵＳＢ）インターフェースなどの専用有線通信インターフェースを介して、および／もしくは周辺構成要素相互接続（ＰＣＩ）バスなどのローカルコンピュータバスを介して提供される接続など、直接接続によってカメラ１２００ならびに／またはロボット１３００と通信し得る。実施形態では、計算システム１１００が、ネットワークを介してカメラ１２００および／またはロボット１３００と通信し得る。ネットワークは、パーソナルエリアネットワーク（ＰＡＮ）、例えば、イントラネットといったローカルエリアネットワーク（ＬＡＮ）、メトロポリタンエリアネットワーク（ＭＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、またはインターネットなど、いかなるタイプおよび／または形態のネットワークであり得る。ネットワークは、例えば、イーサネットプロトコル、インターネットプロトコル群（ＴＣＰ／ＩＰ）、ＡＴＭ（ＡｓｙｎｃｈｒｏｎｏｕｓＴｒａｎｓｆｅｒＭｏｄｅ）技術、ＳＯＮＥＴ（ＳｙｎｃｈｒｏｎｏｕｓＯｐｔｉｃａｌＮｅｔｗｏｒｋｉｎｇ）プロトコル、またはＳＤＨ（ＳｙｎｃｈｒｏｎｏｕｓＤｉｇｉｔａｌＨｉｅｒａｒｃｈｙ）プロトコルを含む、プロトコルの異なる技術、および層またはスタックを利用し得る。

実施形態では、計算システム１１００は、カメラ１２００および／もしくはロボット１３００と直接情報を伝達してもよく、または中間記憶装置、もしくはより広くは、中間の非一時的コンピュータ可読媒体を介して通信し得る。例えば、図１Ｄは、計算システム１１００の外部にあり得る非一時的コンピュータ可読媒体１４００を含む、システム１５００／１５００Ａ／１５００Ｂの実施形態であってもよく、例えば、カメラ１２００によって生成される画像情報を記憶するための外部バッファまたはリポジトリとして作用し得る、システム１５００Ｃを示している。こうした一実施例では、計算システム１１００は、非一時的コンピュータ可読媒体１４００から、画像情報を検索するか、さもなければ受信することができる。非一時的コンピュータ可読媒体１４００の例としては、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、またはそれらの任意の好適な組み合わせが挙げられる。非一時的コンピュータ可読媒体は、例えば、コンピュータディスケット、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＤＤ）、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消却可能プログラム可能読み出し専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、携帯型コンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル多目的ディスク（ＤＶＤ）、および／またはメモリスティックを形成し得る。

上述のように、カメラ１２００は、３Ｄカメラおよび／または２Ｄカメラであり得る。２Ｄカメラは、カラー画像またはグレースケール画像などの、２Ｄ画像を生成するように構成され得る。３Ｄカメラは、例えば、飛行時間（ＴＯＦ）カメラもしくは構造化光カメラなどの、奥行き感知カメラ、またはいかなる他のタイプの３Ｄカメラであり得る。一部の事例では、２Ｄカメラおよび／または３Ｄカメラは、電荷結合素子（ＣＣＤ）センサおよび／または相補型金属酸化膜半導体（ＣＭＯＳ）センサなど、イメージセンサを含み得る。実施形態では、３Ｄカメラは、レーザー、ＬＩＤＡＲデバイス、赤外線デバイス、明／暗センサ、運動センサ、マイクロ波検出器、超音波検出器、レーダー検出器、または奥行き情報、または空間構造情報を取り込むように構成される任意の他のデバイスを含み得る。

上述のように、画像情報が、計算システム１１００によって処理され得る。実施形態では、計算システム１１００は、サーバー（例えば、１つ以上のサーバーブレード、プロセッサなどを有する）、パーソナルコンピュータ（例えば、デスクトップコンピュータ、ラップトップコンピュータなど）、スマートフォン、タブレットコンピュータ装置、および／もしくは他の任意の他の計算システムを含んでもよく、またはそれらとして構成され得る。実施形態では、計算システム１１００の機能性のすべては、クラウドコンピューティングプラットフォームの一部として行われてもよい。計算システム１１００は、単一のコンピュータ装置（例えば、デスクトップコンピュータ）であってもよく、または複数のコンピュータ装置を含んでもよい。

図２Ａは、計算システム１１００の実施形態を示すブロック図を提供する。この実施形態における計算システム１１００は、少なくとも１つの処理回路１１１０、および非一時的コンピュータ可読媒体（または複数の媒体）１１２０を含む。一部の実例では、処理回路１１１０は、非一時的コンピュータ可読媒体１１２０（例えば、コンピュータメモリ）上に記憶された命令（例えば、ソフトウェア命令）を実行するように構成されたプロセッサ（例えば、中央処理ユニット（ＣＰＵ）、専用コンピュータ、および／またはオンボードサーバー）を含み得る。一部の実施形態では、プロセッサは、他の電子／電気装置に操作可能に結合された別個の／スタンドアロンコントローラに含まれてもよい。プロセッサは、プログラム命令を実装して、他の装置を制御／インターフェースし、それによって、計算システム１１００にアクション、タスク、および／または操作を実行させ得る。実施形態では、処理回路１１１０は、１つ以上のプロセッサ、１つ以上の処理コア、プログラマブルロジックコントローラ（「ＰＬＣ」）、特定用途向け集積回路（「ＡＳＩＣ」）、プログラマブルゲートアレイ（「ＰＧＡ」）、フィールドプログラマブルゲートアレイ（「ＦＰＧＡ」）、それらの任意の組み合わせ、または任意の他の処理回路を含む。

実施形態では、計算システム１１００の一部である非一時的コンピュータ可読媒体１１２０が、上で考察された中間の非一時的コンピュータ可読媒体１４００の代替または追加であり得る。非一時的コンピュータ可読媒体１１２０は、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、またはそれらの任意の好適な組み合わせなどの記憶装置であってもよく、例えば、コンピュータディスケット、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＳＤ）、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消却可能プログラム可能読み出し専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、携帯型コンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル多目的ディスク（ＤＶＤ）、メモリスティック、それらの任意の組み合わせ、または任意の他の記憶装置などであり得る。一部の実例では、非一時的コンピュータ可読媒体１１２０は、複数の記憶装置を含み得る。特定の実装形態では、非一時的コンピュータ可読媒体１１２０は、カメラ１２００によって生成され、計算システム１１００によって受信される画像情報を記憶するように構成される。一部の実例では、非一時的コンピュータ可読媒体１１２０は、物体認識操作を実施するために使用される１つ以上のモデルテンプレートを記憶し得る。非一時的コンピュータ可読媒体１１２０は、処理回路１１１０によって実行されるとき、処理回路１１１０に、本明細書に説明される１つ以上の方法論を実施させるコンピュータ可読プログラム命令を、代替的または追加的に記憶し得る。

図２Ｂは、計算システム１１００の実施形態であり、通信インターフェース１１３０を含む計算システム１１００Ａを描写する。通信インターフェース１１３０は、例えば、図１Ａ～図１Ｄのカメラ１２００によって生成された画像情報を受信するように構成され得る。画像情報は、上で考察された中間の非一時的コンピュータ可読媒体１４００もしくはネットワークを介して、またはカメラ１２００と計算システム１１００／１１００Ａとの間のより直接的な接続を介して受信され得る。実施形態では、通信インターフェース１１３０は、図１Ｃのロボット１３００と通信するように構成され得る。計算システム１１００が、ロボット制御システムの外部にある場合、計算システム１１００の通信インターフェース１１３０が、ロボット制御システムと通信するように構成され得る。通信インターフェース１１３０はまた、通信構成要素または通信回路と呼ばれる場合があり例えば、有線または無線プロトコルによって通信を実施するように構成される通信回路を含んでもよい。実施例として、通信回路が、ＲＳ－２３２ポートコントローラ、ＵＳＢコントローラ、イーサネットコントローラ、Ｂｌｕｅｔｏｏｔｈ（登録商標）コントローラ、ＰＣＩバスコントローラ、任意の他の通信回路、またはそれらの組み合わせを含んでもよい。

一実施形態では、図２Ｃに図示されるように、非一時的コンピュータ可読媒体１１２０は、本明細書に論じられる１つ以上のデータオブジェクトを記憶するように構成された記憶空間１１２８を含み得る。例えば、記憶空間は、モデルテンプレート、ロボットアーム移動コマンド、および計算システム１１００Ｂがアクセスを必要とし得る任意の追加のデータオブジェクトを記憶し得る。

実施形態では、処理回路１１１０が、非一時的コンピュータ可読媒体１１２０に記憶される１つ以上のコンピュータ可読プログラム命令によってプログラムされ得る。例えば、図２Ｄは、計算システム１１００／１１００Ａ／１１００Ｂの実施形態である計算システム１１００Ｃを示し、その中の処理回路１１１０は、物体認識モジュール１１２１、最小実行可能領域（ＭＶＲ）モジュール１１２２、および運動計画モジュール１１２９を含む１つ以上のモジュールによってプログラムされる。

実施形態では、物体認識モジュール１１２１は、本開示全体を通して論じられたように、画像情報を取得および分析するように構成され得る。画像情報に関して本明細書で論じられる方法、システム、および技術は、物体認識モジュールを使用し得る。

ＭＶＲ決定モジュール１１２２は、物体認識モジュール１１２１によって実施または取得された画像情報および分析に従って、最小実行可能領域を算出、決定、および／または識別するように構成され得る。ＭＶＲ決定に関して本明細書で論じられる方法、システム、および技術は、ＭＶＲ決定モジュール１１２２によって実施され得る。

運動計画モジュール１１２９は、ロボットの移動を計画するように構成され得る。例えば、運動計画モジュール１１２９は、個々の設置場所／向きを導出し、対応する運動計画、または物体を掴むおよび／もしくは移動させるためのそれらの組み合わせを算出してもよい。ロボットアームの移動に関して本明細書で論じられる方法、システム、および技術は、運動計画モジュール１１２９によって実施され得る。

図２Ｅ、図２Ｆおよび図３Ａを参照すると、画像分析のために実施され得る物体認識モジュール１１２１に関連する方法が説明される。図２Ｅおよび図２Ｆは、画像分析方法と関連付けられた例示的な画像情報を示すが、図３Ａは、画像分析方法と関連付けられた例示的なロボット環境を示す。計算システムによる画像分析に関連する本明細書の参照は、選択された点に対する様々な場所のそれぞれの奥行き値を説明する奥行き情報を含み得る空間構造情報に従って、またはそれを使用して実施され得る。奥行き情報は、物体を識別するか、または物体が空間的にどのように配置されているかを推定するために使用され得る。一部の実例では、空間構造情報は、物体の１つ以上の表面上の場所を説明する点群を含んでもよく、または該点群を生成するために使用され得る。空間構造情報は、可能な画像分析の一形態に過ぎず、当業者が公知の他の形態が、本明細書に説明される方法に従って使用され得る。

実施形態では、計算システム１１００は、カメラ（例えば、１２００／３２００）のカメラ視野（例えば、３２１０）内の物体を表す画像情報を取得し得る。一部の実例では、物体は、カメラ１２００／３２００のカメラ視野３２１０における１つ以上の物体（例えば、３５１０～３５４０）の第１の物体（例えば、３５１０）であってもよい。画像情報２６００、２７００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄのグループがカメラ視野３２１０にある（またはあった）ときに、カメラ（例えば、１２００／３２００）によって生成されてもよく、個々の物体のうちの１つ以上を記述してもよい。物体の外観は、カメラ１２００／３２００の視点からの物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄの外観を記述する。カメラ視野に複数の物体がある場合、カメラは、必要に応じて、複数の物体または単一の物体を表す画像情報を生成し得る。画像情報は、物体のグループがカメラ視野にある（またはあった）ときに、カメラ（例えば、１２００／３２００）によって生成されてもよく、および、例えば、２Ｄ画像情報および／または３Ｄ画像情報を含み得る。

一例として、図２Ｅは、画像情報の第１のセット、より具体的には、２Ｄ画像情報２６００を図示し、これは、上述のように、カメラ３２００によって生成され、図３Ａの物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０を表す。より具体的には、２Ｄ画像情報２６００は、グレースケール、またはカラー画像であり得、カメラ３２００の視点からの物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０の外観を記述し得る。実施形態では、２Ｄ画像情報２６００は、カラー画像の単一色チャネル（例えば、赤、緑、または青のチャネル）に対応し得る。カメラ３２００が物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０の上方に配設される場合、２Ｄ画像情報２６００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０のそれぞれの上部表面の外観を表し得る。図２Ｅの実施例では、２Ｄ画像情報２６００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０のそれぞれの表面を表す、画像部分とも呼ばれる、それぞれの部分２０００Ａ／２０００Ｂ／２０００Ｃ／２０００Ｄ／２５５０を含み得る。図２Ｅでは、２Ｄ画像情報２６００の各画像部分２０００Ａ／２０００Ｂ／２０００Ｃ／２０００Ｄ／２５５０は、画像領域、すなわち、より具体的には、ピクセル領域（画像がピクセルによって形成される場合）であり得る。２Ｄ画像情報２６００のピクセル領域内の各ピクセルは、座標［Ｕ、Ｖ］のセットによって記述される位置を有するものとして特徴付けられ得、図２Ｅおよび図２Ｆに示されるように、カメラ座標系または他の何らかの座標系に相対的な値を有し得る。ピクセルの各々はまた、０～２５５または０～１０２３の値などの、強度値を有してもよい。さらなる実施形態では、ピクセルの各々は、様々なフォーマット（例えば、色相、飽和、強度、ＣＭＹＫ、ＲＧＢなど）のピクセルに関連付けられた任意の追加情報を含んでもよい。

上述のように、画像情報は、一部の実施形態では、２Ｄ画像情報２６００などの画像のすべてまたは一部分であってもよい。実施例では、計算システム３１００は、対応する物体３０００Ａと関連付けられた画像情報のみを取得するように、２Ｄ画像情報２６００から画像部分２０００Ａを抽出するように構成されてもよい。例えば、計算システム３１００は、図２Ｆに示される２Ｄ画像情報２６００および／または３Ｄ画像情報２７００に基づいて画像セグメンテーション操作を実施することによって、画像部分２０００Ａを抽出し得る。一部の実装形態では、画像セグメンテーション操作は、物体の物理的エッジ（例えば、箱のエッジ）が２Ｄ画像情報２６００の中に現れる画像の場所を検出すること、およびこうした画像の場所を使用して、カメラ視野（例えば、３２１０）内の個々の物体を表すことに限定された画像部分（例えば、５６１０）を識別することを含み得る。

図２Ｆは、画像情報が３Ｄ画像情報２７００である、実施例を図示している。より具体的には、３Ｄ画像情報２７００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０の１つ以上の表面（例えば、上部表面、または他の外部表面）上の様々な場所のそれぞれの奥行き値を示す、例えば、奥行きマップまたは点群を含み得る。一部の実装形態では、画像情報を抽出するための画像セグメンテーション操作は、物体の物理的エッジ（例えば、箱のエッジ）が３Ｄ画像情報２７００の中に現れる画像の場所を検出すること、およびこうした画像の場所を使用して、カメラ視野（例えば、３０００Ａ）内の個々の物体を表すことに限定された画像部分（例えば、２７３０）を識別することを含み得る。

それぞれの奥行き値は、３Ｄ画像情報２７００を生成するカメラ３２００に対するものであってもよく、またはいくつかの他の基準点に対するものであり得る。一部の実施形態では、３Ｄ画像情報２７００は、カメラ視野（例えば、３２１０）の中にある物体の構造上の様々な場所に対するそれぞれの座標を含む、点群を含み得る。図２Ｆの実施例では、点群は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０のそれぞれの表面上の場所を説明する、それぞれの座標セットを含み得る。座標は、［ＸＹＺ］座標などの３Ｄ座標であってもよく、カメラ座標系、または何らかの他の座標系に対する値を有してもよい。例えば、３Ｄ画像情報２７００は、物体３０００Ｄの表面上の物理的な場所とも呼ばれる、場所２７１０₁～２７１０_nのセットのそれぞれの奥行き値を示す、画像部分とも呼ばれる第１の部分２７１０を含み得る。さらに、３Ｄ画像情報２７００は、第２の部分、第３の部分、および第４の部分２７２０、２７３０、および２７４０をさらに含み得る。次に、これらの部分は、それぞれ、物体２７２０₁～２７２０_n、２７３０₁～２７３０_n、および２７４０₁～２７４０_nによって表され得る、場所のセットに対するそれぞれの奥行き値をさらに示し得る。これらの図は単に実施例であり、対応する画像部分を有する任意の数の物体が使用され得る。上述のように、取得された３Ｄ画像情報２７００は、一部の実例では、カメラによって生成される３Ｄ画像情報２７００の第１のセットの一部分であってもよい。図２Ｅの実施例では、取得された３Ｄ画像情報２７００が図３Ａの第１の物体３０００Ａを表す場合、３Ｄ画像情報２７００は、画像部分２７１０のみを参照するように狭められ得る。

実施形態では、画像正規化操作は、画像情報を取得する一部として、計算システム１１００によって実施され得る。画像正規化操作は、変換された画像または変換された画像部分を生成するために、カメラ３２００によって生成された画像または画像部分を変換することを伴い得る。例えば、取得された、２Ｄ画像情報２６００、３Ｄ画像情報２７００、または２つの組み合わせを含み得る画像情報が、視点、物体姿勢、および視覚的記述情報と関連付けられた照明条件において画像情報を変更させるように試みるために、画像正規化操作を受け得る場合である。そのような正規化は、画像情報およびモデル（例えば、テンプレート）情報間のより正確な比較を容易にするために実施され得る。視点は、カメラ３２００に対する物体の姿勢、および／またはカメラ３２００が物体を表す画像を生成するときに、カメラ３２００が物体を見ている角度を指し得る。

例えば、画像情報は、標的物体がカメラ視野３２１０内にある物体認識操作中に生成され得る。カメラ３２００は、標的物体がカメラに対して特定の姿勢を有するときに、標的物体を表す画像情報を生成し得る。例えば、標的物体は、その上面をカメラ３２００の光学軸に対して垂直にする姿勢を有してもよい。こうした実施例では、カメラ３２００によって生成される画像情報は、標的物体の上面図などの特定の視点を表し得る。一部の実例では、カメラ３２００が物体認識操作中に画像情報を生成しているときに、画像情報は、照明強度などの特定の照明条件で生成され得る。こうした実例では、画像情報は、特定の照明強度、照明色、または他の照明条件を表し得る。

実施形態では、画像正規化操作は、画像または画像部分を、モデルテンプレートの情報と関連付けられた視点および／または照明条件により良く一致させるように、カメラによって生成されるシーンの画像または画像部分を調整することを伴い得る。調整は、画像または画像部分を変換して、物体姿勢またはモデルテンプレートの視覚的記述情報に関連付けられた照明条件のうちの少なくとも１つに一致する変換された画像を生成することを伴い得る。

視点調整は、画像がモデルテンプレート内の視覚的記述情報と同じ視点を表すように、シーンの画像の処理、ワーピング、および／またはシフトを伴い得る。処理は、例えば、画像の色、コントラスト、または照明を変更することを含み、シーンのワーピングは、画像のサイズ、寸法、または比率を変更することを含み得、画像のシフトは、画像の位置、向き、または回転を変更することを含み得る。例示的な実施形態では、処理、ワーピング、および／またはシフトを使用して、シーンの画像内の物体を、モデルテンプレートの視覚的記述情報に一致するか、またはそれにより良好に対応する向きおよび／またはサイズを有するように変更してもよい。モデルテンプレートが、一部の物体の正面視界（例えば、上面視界）を記述する場合、シーンの画像は、シーン内の物体の正面視界も表すようにワーピングされ得る。

様々な実施形態では、「コンピュータ可読命令」および「コンピュータ可読プログラム命令」という用語は、様々なタスクおよび操作を遂行するように構成される、ソフトウェア命令またはコンピュータコードを記述するために使用される。様々な実施形態では、「モジュール」という用語は、処理回路１１１０に１つ以上の機能タスクを行わせるように構成される、ソフトウェア命令またはコードの集まりを広く指す。モジュールおよびコンピュータ可読命令は、処理回路または他のハードウェアコンポーネントが、モジュールもしくはコンピュータ可読命令を実行しているときに、様々な操作またはタスクを実施するものとして説明され得る。

本開示の一態様は、物体検出（物体認識とも呼ばれる）、物体サイズ測定、および／または最小実行可能領域検出を実施することができる、ロボットシステムまたは任意の他の計算システムに関する。物体検出またはサイズ測定は、シーン内の個々の物体の寸法を決定すること、または個々の物体の境界を決定することを伴い得る。物体は、物体のグループの一部である箱などの、物体のグループの一部であってもよい。例えば、ロボットシステムは、パレットの各層が互いに近くに設置された物体を有する、物体のパレットを有するシーンを取り込むカメラデータをロボットシステムが受信する、パレットから降ろす操作の一部として物体検出操作を実施し得る。

このシナリオにおける物体検出は、１つの個々の物体を層上の他の物体と区別できるように、パレットの特定の層上の個々の物体を区別するためのカメラデータ（画像情報）の処理または分析を伴い得る。問題は、物体のパレットがすべて互いに同一平面に位置決めされるときに起こり、ロボットシステムが物体を互いに検出または分離することが困難になる。本明細書に説明されるプロセスは、パレットから個々の物体を拾い上げ、それを他の場所に移動させるための計画を生成するために、ロボットシステムが物体のサイズおよび／または境界を識別することを可能にし得る。一部の実装形態では、ロボットシステムは、シーンにおける物体に対する少なくとも１つの最小実行可能領域を識別し得る。最小実行可能領域は、特定の物体の潜在的な輪郭または寸法の推定である。そのため、ロボットシステムは、物体の正しい寸法を知らずに、エンドエフェクター装置（例えば、グリッパ）を用いて、最小実行可能領域で個々の物体を掴むことができる。物体の最小実行可能領域は、単一の物体の表面上に完全に存在すると推定される、物体の上部表面上の領域を表す。したがって、この領域内の物体を把持する試みは、エンドエフェクター装置が、物体のエッジ上に延在せずに、単一の物体のみに接触することを確保する。本明細書で論じられるように、最小実行可能領域の決定は、物体移動ロボットアームの正確性および速度を向上させ得る。

上記の例では、物体は、例えば、パレットまたは他のプラットフォーム上の他の物体の隣に設置された箱または他の物体であってもよい。カメラが、複数の物体を有するシーンを取り込む画像を生成する場合、画像自体は、異なる物体を区別する目的で完全には信頼性がない場合がある。例えば、一部のカメラは、シーン内の様々な場所の奥行き値を示す画像を生成することができ得るが、複数の物体が、同じ高さを有するか、または別様にカメラから同じ距離である場合、画像は、特に、複数の物体が一緒に密に詰め込まれている場合、複数の物体の上部表面を覆う領域に対する実質的に均一な奥行き値を示し得る。したがって、そのような画像は、複数の物体の中から個々の物体を識別する目的で、限定された情報を提供し得る。一部のカメラは、物体の上部表面などの、物体の視覚的な外観を取り込む画像を生成することができ得るが、これらの上部表面は、それらの上に印刷された線または他の視覚的マーキングを有し得る。したがって、そのような画像は、線を含み得るが、線の各々は、物体のうちの１つの境界（例えば、第１または第２のエッジ）と関連付けられ得るか、または単に視覚的マーキングであり得る（例えば、擬似エッジであり得る）。そのため、本明細書に提供するシステムおよび方法は、物体表面の最小実行可能領域を決定するために使用され得る。最小実行可能領域は、単一の物体の表面上に完全に存在すると推定される、物体の上部表面上の領域を表す。最小実行可能領域は、物体の実際の物理的エッジおよび／または物体の擬似エッジによって境界付けられ得る。システムが擬似エッジと物理的エッジとの間を容易に区別することができない場合、この不能性は、以下で論じられるように、最小実行可能領域を規定する方法を通して説明され得る。

図３Ａ～図３Ｈは、本明細書に説明されるプロセスおよび方法が実施され得る例示的な環境を例示する。図３Ａは、計算システム３１００（例えば、計算システム１１００の実施形態）、ロボット３３００、およびカメラ３２００を含むシステム３５００（図１Ａ～図１Ｄのシステム１５００／１５００Ａ／１５００Ｂ／１５００Ｃの実施形態であり得る）を有する環境を図示する。カメラ３２００は、カメラ１２００の実施形態であってもよく、カメラ３２００のカメラ視野３２１０内のシーンを表す、または、より具体的には、物体３０００Ａ、３０００Ｂ、３０００Ｃ、および３０００Ｄなどの、カメラ視野３２１０内の物体（箱など）を表す画像情報を生成するように構成され得る。一実施例では、物体３０００Ａ～３０００Ｄの各々は、例えば、箱または木枠などの容器であってもよく、一方で、物体３５５０は、例えば、上に容器が配設されるパレットであり得る。

実施形態では、図３Ａのシステム３５００は、光源３６００などの１つ以上の光源を含み得る。光源３６００は、例えば、発光ダイオード（ＬＥＤ）、ハロゲンランプ、または任意の他の光源であってもよく、可視光、赤外線、または物体３０００Ａ～３０００Ｄの表面に向かって任意の他の形態の光を放射するように構成され得る。一部の実施形態では、計算システム３１００は、光源３６００と通信して、光源３６００が起動されたときを制御するように構成され得る。他の実装形態では、光源３６００は、計算システム３１００とは独立して動作し得る。

一実施形態では、システム３５００は、カメラ３２００、または２Ｄ画像情報２６００を生成するように構成される２Ｄカメラと、３Ｄ画像情報２７００を生成するように構成される３Ｄカメラと、を含む、複数のカメラ３２００を含み得る。２Ｄ画像情報２６００（例えば、カラー画像またはグレースケール画像）は、カメラ視野３２１０における、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄなどの１つ以上の物体の外観を記述し得る。例えば、２Ｄ画像情報２６００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄの外部表面（例えば、上部表面）上に配設される視覚的詳細、および／またはそれらの外部表面の輪郭を取り込むか、または別様に表し得る。実施形態では、３Ｄ画像情報２７００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０のうちの１つ以上の構造を記述してもよく、物体の構造は、物体の構造または物体の物理的構造とも呼ばれ得る。例えば、３Ｄ画像情報２７００は、奥行きマップを含んでもよく、より全般的には、カメラ３２００に対する、または何らかの他の基準点に対する、カメラ視野３２１０の様々な場所のそれぞれの奥行き値を説明し得る、奥行き情報を含んでもよい。それぞれの奥行き値に対応する場所は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０のそれぞれの上部表面上の場所などの、カメラ視野３２１０の様々な表面上の場所（物理的な場所とも呼ばれる）であり得る。一部の実例では、３Ｄ画像情報２７００は、物体３０００Ａ／３０００Ｂ／３０００Ｃ／３０００Ｄ／３５５０、またはカメラ視野３２１０内のいくつかの他の物体の１つ以上の外側表面上の様々な場所を説明する、複数の３Ｄ座標を含み得る、点群を含み得る。点群が図２Ｆに示される。

図３Ａの実施例では、ロボット３３００（ロボット１３００の実施形態であり得る）は、ロボット基部３３１０に取り付けられる一端を有し、かつロボットグリッパなどのエンドエフェクター装置３３３０に取り付けられるか、またはそれらによって形成される別の端を有する、ロボットアーム３３２０を含み得る。ロボット基部３３１０は、ロボットアーム３３２０を装着するために使用されうるが、ロボットアーム３３２０、より具体的には、エンドエフェクター装置３３３０は、ロボット３３００の環境で１つ以上の物体と相互作用するために使用され得る。相互作用（ロボット相互作用とも呼ぶ）は、例えば、物体３０００Ａ～３０００Ｄのうちの少なくとも１つを握るか、または他の方法で拾い上げることを含み得る。例えば、ロボット相互作用は、ロボット３３００が、パレットから物体３０００Ａ～３０００Ｄを拾い上げ、かつ物体３０００Ａ～３０００Ｄを目的の場所まで移動するために使用される、パレットから降ろす操作の一部であり得る。エンドエフェクター装置３３３０は、物体を把持するか、または掴むための吸引カップまたは他の構成要素を有し得る。エンドエフェクター装置３３３０は、吸引カップまたは他の把持構成要素を使用して、例えば、上面を介して、物体の単一の面または表面との接触を通して、物体を把持するか、または掴むように構成され得る。

ロボット３３００は、構造部材を操作するため、および／またはロボットユニットを輸送するためになど、作業を実装するために使用される情報を取得するように構成された追加のセンサをさらに含み得る。センサは、ロボット３３００および／または周囲の環境の１つ以上の物理的特性（例えば、その状態、条件、および／または１つ以上の構造部材／関節の場所）を検出または測定するよう構成された装置を含み得る。センサの一部の実施例には、加速度計、ジャイロスコープ、力センサ、歪みゲージ、触覚センサ、トルクセンサ、位置エンコーダなどが含まれ得る。

図３Ｂは、図３Ａの物体３０００Ａ、３０００Ｂ、３０００Ｃ、および３０００Ｄの上面図を図示する。各物体３０００Ａ～３０００Ｄは、表面３００１、複数の角３００２、およびこの実施例では、開放角３００４を含む。本明細書で使用される場合、「開放角」は、別の物体３０００に隣接していない複数の角３００２の任意の角を指す。開放角は、それ自体が別の物体と境界を接するものではない物体の上部表面の２つのエッジによって形成され得る。一実施例では、２つのエッジは、２つの水平エッジを含み得る。２つのエッジの全体が、開放されたとみなされる角に対して隣接する物体を含まないことは、要求されない。物体３０００Ａ～３０００Ｄのクローズアップ上面図を図示する図３Ｃを参照すると、各物体３０００Ａ～３０００Ｄの追加の特徴が図示されている。二次元描写では、物体３０００Ａは、４つのエッジ、長さ方向の物理的エッジ３０１３、幅方向の物理的エッジ３０１５、幅方向の物理的エッジ３０１７、および長さ方向の物理的エッジ３０１９によって規定される表面を有し得る。示される例示的な実施形態では、幅方向の物理的エッジ３０１５および長さ方向の物理的エッジ３０１３は、いかなる隣接する物体のエッジにも隣接していないか、またはそれらと同一平面ではなく、したがって、開放エッジと呼ばれ得る。示される例示的な実施形態では、幅方向の物理的エッジ３０１７および長さ方向の物理的エッジ３０１９は、隣接する物体３０００Ｂおよび３０００Ｄのエッジに隣接しており、かつそれらと同一平面であり、したがって、閉鎖エッジと呼ばれ得る。上記に説明されたエッジを指す「長さ方向」および「幅方向」という用語の使用は、物体および／またはエッジの特定の向きが要求されることを暗示するものではない。一般に、略長方形の物体について、長さ方向のエッジは、幅方向のエッジに隣接している（および略垂直である）。長さ方向および幅方向は、本明細書で使用される場合、物体または物体のグループの文脈内の特定の方向のみを指し、特定の絶対方向を指さない。物体３０００Ａ、３０００Ｂ、および３０００Ｄの位置決めは、計算システム３１００が各物体の特徴を区別することをより困難にし得る。

決定するための方法４０００、および開放角３００４に対する最小実行可能領域が図４に図示されている。方法４０００は、非一時的コンピュータ可読媒体に記憶され得、かつ少なくとも１つの処理回路が、視野を有するカメラと通信している状態で、少なくとも１つの処理回路によって実行され得る。

操作において、方法４０００は、１つ以上の物体３０００、例えば、物体３０００Ａ～３０００Ｄの物理的特性を表す画像情報を取得する操作４００２を含む。画像情報は、カメラ３２００によって生成され、１つ以上の物体に関連付けられた少なくとも物体の外観を説明し、各物体は、複数のエッジを含む。図３Ａは、画像情報の取得または生成を図示する。実施形態では、画像情報は、三次元または斜視図で取得され、方法の正確性を向上するために、視点は、二次元ビューにシフトされる。視点調整は、画像情報の処理、ワーピング、および／またはシフトを伴い得る。処理は、画像情報の色、コントラスト、または照明を変更することを含み得、シーンのワーピングは、画像情報のサイズ、寸法、または比率を変更することを含み得、画像情報のシフトは、画像情報の位置、向き、または回転を変更することを含み得る。ワーピングは、三次元で物体を図示することから、二次元、例えば、上面図で物体を図示することに画像情報を変換する、ワーピング変換を規定するホモグラフィを決定することを伴い得る。一部の実例では、ワーピングは、画像情報を、所望の二次元ビューの対応する点、例えば、角と合致させる、回転および／または並進運動を記述し得る。

実施形態では、以下に説明される計算および方法は、カメラが物体（複数可）をもはや撮像していない後、または物体（複数可）が視野を離れた後に実施され得る。

操作において、方法４０００は、画像情報に基づいて、複数の物体３０００の複数の角３００２を検出するための操作４００４を含む。存在する任意の角を検出するために、計算システム１１００／３１００は、様々な方法を使用し得る。例えば、角検出は、エッジ検出およびエッジ交点のその後の決定を伴い得る。エッジ検出は、２Ｄおよび３Ｄ画像情報、例えば、点群情報の分析に基づいて実施され得る。エッジ検出は、例えば、（ｉ）物体間の境界を表し得る２Ｄ画像内の線またはエッジを識別するための２Ｄ画像分析、（ｉｉ）層セグメンテーションおよびエッジを検出するための異なる高さ／奥行きの検出を伴う点群分析、または（ｉｉｉ）開放エッジを識別するための２Ｄまたは３Ｄ画像分析を含み得る。本明細書に説明される実施例は、単に例としてのものであり、エッジ検出は、必要に応じて代替的な技術をさらに含んでもよい。

エッジ検出は、例えば、物体間の境界を表し得る２Ｄ画像内の線またはエッジを識別するための２Ｄ画像分析を含み得る。そのような分析は、エッジを表し得る２Ｄ画像内の視覚的不連続性を識別し得る。例えば、そのような分析は、例えば、ピクセル強度の不連続性条件またはスパイクピクセル強度条件の分析を含み得る。規定されたピクセル強度不連続性条件を満たすことは、ピクセル強度値の変化、すなわち、より具体的には、変化するピクセル強度を有する領域間のピクセル強度値の微分または勾配を使用することを含み得る。次いで、勾配または微分が、特に、エッジに対して垂直に移動しているときに、エッジまたは角に存在するピクセル強度のスパイクを検出するために使用され得る。さらに、計算システム１１００／３１００は、隣接するピクセル間にスパイクまたは不連続性を規定して、エッジおよび角を識別するために、ピクセル強度の差異を識別するようにバイナリ閾値を適用し得る。

エッジ検出は、例えば、層セグメンテーション、およびエッジを検出するための異なる高さ／奥行きの検出を伴う点群分析を含み得る。隣接する物体は、異なる高さを有し得る。したがって、点群（３Ｄ画像情報）内の異なる高さ（または奥行き）の検出が、物体間のエッジを検出するために使用され得る。したがって、計算システム１１００／３１００は、規定された奥行き不連続性条件を満たす点群の一部分に従って、エッジを検出し得る。

さらなる実施例では、エッジ検出は、隣接する物体を欠く物理的エッジを検出することによって実施され得る。物体が隣接する物体を欠く場合、例えば、物体が物体のグループの外周に位置する場合、物体のグループのエッジは、関連付けられた個々の物体の物理的エッジとして検出され得る。

実施形態では、エッジ検出のための上述の方法のいずれかは、エッジ検出の正確性または信頼性を向上させるために、各または他のエッジ検出方法と組み合わせられ得る。

操作において、方法４０００は、複数の角３００２から開放角３００４を識別する操作４００５を含む。上記に論じられたように、「開放角」は、別の物体３０００に隣接していない複数の角３００２の角を指す。実施形態では、システムは、複数の角を識別し、角３００２が識別されると、角３００２のうちの開放角から、標的開放角３００４Ａなどの、開放角を選択するように構成され得る。実施形態では、複数の角３００２の各々は、角検出操作４００４が隣接する物体の欠如によって識別された物理的エッジに基づいて角を検出し得るため、開放角であってもよい。さらに、標的開放角を識別するとき、システムは、開放角が別の物体に隣接していないことを認識し得る。標的開放角３００４Ａは、単一の標的開放角であってもよい。

開放角（凸角または外角とも呼ばれる）は、上記に論じられたように、例えば、点群の形態で、３Ｄ画像情報の分析を通して識別され得る。開放角は、例えば、点群内の頂点を識別し（例えば、エッジ交点または他の手段に基づいて）、次いで、識別された頂点を１つ以上の基準（例えば、長さ、奥行き、幅、直交性基準）に供して、それらが開放角を表すか否かを決定することによって識別され得る。角および潜在的なエッジを識別するための画像情報の使用に関する詳細は、２０２０年４月７日発行の米国特許第１０，６１４，３４０号に見出されており、参照によりその全体が組み込まれている。

上記のように、および物体３０００Ａ～３０００Ｄの拡大上面図を図示する図３Ｃを参照すると、各物体３０００Ａ～３０００Ｄの追加の特徴が図示されている。二次元描写では、物体３０００Ａは、４つのエッジ、長さ方向の物理的エッジ３０１３、幅方向の物理的エッジ３０１５、幅方向の物理的エッジ３０１７、および長さ方向の物理的エッジ３０１９によって規定される表面を有し得る。示される例示的な実施形態では、幅方向の物理的エッジ３０１７および長さ方向の物理的エッジ３０１９は、隣接する物体３０００Ｂおよび３０００Ｄのエッジに隣接しており、かつそれらと同一平面である。上述のように、物体３０００Ａ、３０００Ｂ、および３０００Ｄのそのような位置決めは、計算システム３１００が各物体の特徴を区別することをより困難にし得る。

操作において、方法４０００は、標的開放角３００４Ａに対する、図３Ｅおよび図３Ｇに例示される、最小実行可能領域３００６を規定する操作４００６を含む。最小実行可能領域３００６は、物体３０００を移動するようにロボットアーム３３２０のエンドエフェクター装置３３３０が掴むことができる、標的開放角３００４Ａに関連付けられた物体３０００の表面３００１上の領域を表す。上述のように、ロボットアーム３３２０は、例えば、エンドエフェクター装置３３３０の吸引グリップを使用して、上部表面によって、標的開放角３００４Ａを含む標的物体などの物体を把持することができる。物体の最小実行可能領域３００６は、単一の物体の表面上に完全に存在すると推定される、物体の上部表面上の領域を表す。したがって、最小実行可能領域３００６によって規定される領域内の標的物体を把持する試みは、エンドエフェクター装置３３３０が、標的物体を把持するときに、隣接する物体も把持しないように、標的物体のエッジの上に延在することなく、標的物体（例えば、単一の物体）のみに接触することを確保し得る。物体３０００のエッジが他の物体に隣接しているか、またはそれらと接触している状況では、計算システム１１００／３１００は、物体の正しい寸法を識別するのが困難であるか、またはより長い時間が掛かる場合がある。そのため、ロボットアーム３３２０が、物体３０００のエッジの上に延在することなく、および／または別の別個の物体に接触することなく、物体３０００を堅固に掴み得る領域を正確に規定することは、困難であり得る。したがって、最小実行可能領域３００６は、ロボットアーム３３２０が、物体３０００の正しい寸法を知らずに物体３０００を掴み得る、推定されたか、または潜在的な寸法に基づく領域を規定する。最小実行可能領域３００６は、ロボットアーム３３２０が物体３０００を掴み得る領域を規定することが意図される。最小実行可能領域３００６のサイズは、それが見つかる物体３０００のサイズとは異なる場合があり、時には顕著に異なる場合がある。操作４００８～４０１６は、最小実行可能領域３００６がどのように算出および検証され得るかを図示する。

操作において、方法４０００は、複数の候補エッジセグメントを生成するための操作４００８を含む。複数の候補エッジセグメントは、複数の幅方向の候補エッジセグメントおよび複数の長さ方向の候補エッジセグメントを含み得る。複数の幅方向の候補エッジセグメントおよび複数の長さ方向の候補エッジセグメントは、標的開放角３００４Ａに関連付けられた物体３０００の、それぞれ、幅方向の物理的エッジ３０１７および長さ方向の物理的エッジ３０１９に対応するための候補である、エッジまたはエッジの一部分を表す。標的開放角３００４Ａに関連付けられた物体３０００は、他の物体３０００に隣接して、またはそれらと同一平面に位置決めされ得、物体３０００Ａが終了し、他の物体（３０００Ｂ、３０００Ｃ、３００Ｄなど）が開始する場所を区別する際に計算システム１１００／３１００が課題に直面する状況を作り出す。

計算システム１１００／３１００は、まず、２Ｄ画像情報内の複数の潜在的なエッジセグメントを識別し得る。潜在的なエッジセグメントは、物体の物理的エッジを表すものとして認識される可能性をもたらす特性を有する、任意のタイプの検出可能な視覚的マーキングから識別され得る。例えば、視覚的マーキングは、エッジ、しわ、ギャップ、着色の変化、および他の不連続性を含み得る。次いで、潜在的なエッジセグメントは、例えば、クラスタリング技術を介して、複数の候補エッジセグメントを識別するようにさらに処理され得る。適切なクラスタリング技術は、例えば、２０２０年２月１４日出願の米国特許出願第１６／７９１，０２４号に説明されており、参照によりその全体が本明細書に組み込まれる。一実施形態では、候補エッジセグメントは、幅方向の物理的エッジ３０１７（長さ方向の候補エッジセグメントに対して）、または長さ方向の物理的エッジ３０１３（幅方向の候補エッジセグメントに対して）のいずれかに対して、実質的に垂直（例えば、垂直の５度以内）であることに基づいて、潜在的なエッジセグメントから識別され得る。図３Ｃは、例示的な目的のために、複数の幅方向の候補エッジセグメントの個々の幅方向の候補エッジセグメント３００９、および複数の長さ方向候補エッジセグメントの個々の長さ方向候補エッジセグメント３０１１を例示する。

実施形態では、複数の候補エッジセグメントの検出は、最小および最大候補サイズに従って制限され得る。計算システム１１００／３１００は、予想される物体サイズに基づいて、最小および最大候補サイズを決定し得る。予想される物体は、長さ、幅、および高さ寸法を有し得る。最小候補サイズは、予想される物体に見出される最小面に従って（例えば、３つの寸法のうちの２つに従って）規定され得る。いくつかの実施形態では、最小候補サイズは、長さおよび幅寸法によって、ならびに／または対角寸法によって規定され得る。最小候補サイズは、予想される物体に見出される最大面に従って（例えば、３つの寸法のうちの２つに従って）規定され得る。最小候補サイズ３０１６および最大候補サイズ３０１８が、例として、図３Ｄに例示されている。したがって、最小候補サイズ３０１６は、最小の可能性がある物体面と関連付けられ得、したがって、最大候補サイズ３０１８は、最大の可能性がある物体面と関連付けられ得る。最小候補サイズ３０１６は、最小の可能性がある物体面の寸法を表す幅方向の寸法３０１６Ａおよび長さ方向の寸法３０１６Ｂを含み得るが、最大候補サイズ３０１８は、最大の可能性がある物体面の寸法を表す幅方向の寸法３０１８Ａおよび長さ方向の寸法３０１８Ｂを含み得る。一部の実施形態では、最小候補サイズ３０１６と最大候補サイズ３０１８との間の領域のみが、潜在的なエッジセグメントの生成について分析される。

実施形態では、操作４００８は、整列された候補エッジセグメントを組み合わせるように操作し得る。例えば、１つ以上の候補エッジセグメントが整列されている場合、それらは、さらなる分析のために計算システム１１００／３１００によって組み合わせられ得る。整列された候補エッジセグメントは、実質的な共直線性（また実質的に類似アライメントとも呼ばれる）を有し得、これは、事前に規定された角度閾値および／または所定のオフセット閾値に従って規定され得る。２つの候補エッジセグメントに対する角度閾値は、例えば、２つの候補エッジ間の角度が、角度閾値（例えば、５°、４°、３°、２°、または１°などの、特定の度数）内であること、または２つの候補エッジの各々によって形成されるそれぞれの角度が、角度閾値内であることを要求し得る。２つの候補エッジセグメントに対するオフセット閾値は、例えば、候補エッジがオフセット閾値よりも小さいオフセットを有することを要求し得る。一実施形態では、２つの候補エッジ間のオフセットは、候補エッジから延在する、または別様に外挿される、それぞれの線間の最短距離によって規定され得る。整列された候補エッジセグメントは、より大きい候補エッジセグメントを作り出すために組み合わせられ得る。

操作において、方法４０００は、複数の候補エッジセグメントから複数の候補エッジを決定する操作４０１０を含む。ここで図３Ｃおよび図３Ｄを参照すると、複数の候補エッジセグメントから候補エッジを選択する操作が説明されている。一連の閾値またはフィルタは、分析中の物体の物理的エッジを表す可能性が低いか、表さない可能性が高いか、または表すことが不可能である、候補エッジセグメントを排除するために適用され得る。操作４０１０は、幅方向の物理的エッジ３０１７および長さ方向の物理的エッジ３０１９の推定として、複数の幅方向の候補エッジ（個々の幅方向の候補エッジ３００８によって図３Ｃで表される）および複数の長さ方向の候補エッジ（個々の長さ方向の候補エッジ３０１０によって図３Ｃで表される）を含む、複数の候補エッジを決定し得る。操作４０１０は、１つ以上の基準の適用に従って、候補エッジを選択し得る。

第１の閾値または基準は、位置基準または物理的エッジからセグメントまでの閾値であってもよい。位置基準は、候補エッジセグメントが、既知の開放物理的エッジ、より具体的には、候補エッジセグメントに対して実質的に垂直に向けられた既知の開放物理的エッジの閾値距離内に収まるか否かの評価を表す。図３Ｃは、近位終点３００９Ａおよび遠位終点３００９Ｂを有し、かつ開放物理的エッジのうちの１つである長さ方向の物理的エッジ３０１３に対応する長さ方向の物理的エッジベクトル３０１２に対して実質的に垂直に位置決めされた、幅方向の候補エッジセグメント３００９を例示する。近位終点３００９Ａは、長さ方向の物理的エッジ３０１３に対して幅方向の候補エッジセグメント３００９の近位端に位置決めされ、遠位終点３００９Ｂは、長さ方向の物理的エッジ３０１３に対して幅方向の候補エッジセグメント３００９の遠位端に位置決めされる。位置基準は、近位終点３００９Ａと長さ方向の物理的エッジ３０１３との間のエッジ距離３０３０Ａまでのセグメントが、規定された最小値内にあるか否かの評価を表す。規定された最小値は、倍率δ₁によって加重された最小候補サイズ３０１６の最小寸法（Ｍｉｎ）の長さとして設定され得る。したがって、位置基準は、０≦距離３０３０Ａ≦δ_1*Ｍｉｎとして表現され得る。倍率δ₁は、０．４～０．６、または０．４～０．５の値として設定され得る。位置基準は、幅方向の候補エッジセグメント３００９の近位終点３００９Ａが、最小候補サイズ３０１６の最小寸法（Ｍｉｎ）の長さの半分を超えて、長さ方向の物理的エッジ３０１３から離間されないことを保証する。位置基準を満たさない任意の候補エッジセグメントは、複数の候補エッジの考えられるメンバーとして排除され得る。位置基準はまた、近位終点３０１１Ａおよび遠位終点３０１１Ｂを有する長さ方向の候補エッジセグメント３０１１などの、複数の長さ方向の候補エッジセグメントに適用され得る。近位終点３０１１Ａは、セグメントからエッジまでの距離３０３２Ａに基づいて、幅方向の物理的エッジ３０１５への近接度に対する位置基準に従って評価され得る。

さらなる実施形態では、幅方向の候補エッジセグメント３００９の遠位終点３００９Ｂは、セグメントからエッジまでの距離３０３０Ｂに基づいて、最大候補サイズ３０１８の長さ方向の寸法３０１８Ｂへの近接度に対する位置基準に従って評価され得る。長さ方向の候補エッジセグメントの遠位終点３０１１Ｂは、セグメントからエッジまでの距離３０３２Ｂに基づいて、最大候補サイズ３０１８の長さ方向の寸法３０１８Ａへの近接度に対する位置基準に従って評価され得る。遠位端３００９Ｂおよび３０１１Ｂに適用される位置基準は、近位終点３００９Ａおよび３０１１Ａに適用される位置基準の代わりに、またはそれに加えて使用され得る。

位置基準は、幅方向の候補エッジセグメント３００９または長さ方向の候補エッジセグメント３０１１が、幅方向の物理的エッジ３０１７または長さ方向の物理的エッジ３０１９のいずれかに対応する場合、近位終点３００９Ａ／３００９Ｂまたは遠位終点３０１１Ａ／３０１１Ｂのいずれかが、物理的エッジの閾値距離または物体の最大候補サイズ内に位置決めされることになることを予想する。したがって、位置基準は、潜在的な候補エッジセグメントが、分析される物体の既知の物理的エッジまたは予想される物理的エッジ（最大候補サイズによって表される）に近い終点を有するか否かを評価する。倍率δ₁は、エッジセグメントを識別する際のノイズ、センサの矛盾、または他の誤差源を考慮するか、または対処するように選択され得る。

セグメント長さ基準またはセグメント長さ閾値とも呼ばれる第２の基準は、候補エッジセグメントの長さが閾値を超えるか否かを評価する。実施形態では、閾値は、倍率δ₂によって加重された最小候補サイズ３０１６の最小寸法（Ｍｉｎ）の長さとして設定され得る。したがって、長さ基準は、近位終点３００９Ａ／３０１１Ａと遠位終点３００９Ｂ／３０１１Ｂとの間のエッジセグメント長さ３０５１を、最小候補サイズ３０１６と比較し得る。幅方向の候補エッジセグメント３００９または長さ方向の候補エッジセグメント３０１１のエッジセグメント長さ３０５１が、最小候補サイズ３０１６の最小寸法の長さの割合よりも小さい場合、計算システム１１００／３１００は、候補エッジセグメント３００９／３０１１を候補エッジとしての考慮から排除し得る。長さ基準はまた、δ_2*Ｍｉｎ≦エッジセグメント長さ３０５１として記述され得る。倍率δ₂は、０．６～０．８、０．６５～０．７５、０．６９～０．７１の範囲の値、またはおよそ０．７の値を有し得る。

第２の基準は、候補エッジセグメントが物理的エッジと対応し、そのため、候補エッジとみなされるために、候補エッジセグメントが、最小候補サイズの最小寸法の一部分を超過するのに十分な長さであるべきであると予想する。したがって、セグメント長さ閾値を満たさない候補エッジセグメントは、物理的エッジを潜在的に表す候補として考慮されない可能性がある。倍率δ₂は、エッジセグメントを識別する際のノイズ、センサの矛盾、または他の誤差源を考慮するか、または対処するように選択され得る。

直交性基準またはセグメント直交性閾値とも呼ばれる第３の基準は、候補線セグメントが、長さ方向の物理的エッジ３０１３または幅方向の物理的エッジ３０１５のいずれかに対して実質的に垂直であるか否かを評価する。本明細書で使用される場合、実質的に垂直という用語は、正確に垂直の５度以内を意味する。例えば、幅方向の候補エッジセグメント３００９は、実質的な垂直性または実質的な直交性を決定するために、長さ方向の物理的エッジ３０１３と比較され、長さ方向の候補エッジセグメント３０１１は、実質的な垂直性または実質的な直交性を決定するために、幅方向の物理的エッジ３０１５と比較される。第３の基準は、幅方向の候補エッジセグメント３００９または長さ方向の候補エッジセグメント３０１１が、それぞれ、幅方向の物理的エッジ３０１７または長さ方向の物理的エッジ３０１５のいずれかと対応する場合、潜在的なエッジは、物理的エッジであって、そこから潜在的なエッジが延在する、物理的エッジと実質的に垂直であるべきであると予想する。直交性基準を満たさない候補エッジセグメントは、潜在的な候補エッジとして排除され得る。

候補エッジは、位置基準、長さ基準、および直交性基準の３つの基準の各々を満たす複数の候補エッジセグメントから選択または決定され得る。複数の候補エッジは、複数の幅方向の候補エッジおよび複数の長さ方向の候補エッジを含み得る。図３Ｃは、個々の幅方向の候補エッジ３００８および個々の長さ方向の候補エッジ３０１０を例示する。幅方向の候補エッジ３００８は、関連付けられた幅方向の候補エッジセグメント３００９と整列され、長さ方向の物理的エッジ３０１３から実質的に垂直に延在する。長さ方向の候補エッジ３０１０は、関連付けられた長さ方向の候補エッジセグメント３０１１と整列され、幅方向の物理的エッジ３０１５から実質的に垂直に延在する。

操作において、方法４０００は、複数の幅方向の候補エッジおよび複数の長さ方向の候補エッジのそれぞれの間に複数の交点３０２４を生成するための操作４０１２を含む。交点３０２４は、複数の幅方向の候補エッジまたはその突出部のうちのいずれかのうちの１つが、複数の長さ方向の候補エッジまたはその突出部のうちのいずれかのうちの１つと交差する位置として規定される。突出部は、識別された候補エッジが、垂直に向けられた候補エッジのうちの１つと交差するほど十分には延在しない状況で使用され得る。幅方向の候補エッジセグメント３００９と長さ方向の候補エッジセグメント３０１１との間の個々の交点３０２４が図３Ｃに図示される。図３Ｅに図示されるように、各幅方向の候補エッジ３００８Ａ、３００８Ｂ、３００８Ｃおよび長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、３０１０Ｃは、複数の交点３０２４Ａ～３０２４Ｉと関連付けられ得る。例えば、幅方向の候補エッジ３００８Ａは、長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、および３０１０Ｃと交差して、３つの別個の交点３０２４Ａ、３０２４Ｄ、および３０２４Ｇを作り出す。これらの交点３０２４Ａ～３０２４Ｉの各々は、標的開放角３００４Ａに対向する標的物体の潜在的な角を表す。

操作において、方法４０００は、標的開放角３００４Ａと相関する候補最小実行可能領域を生成する操作４０１４を含む。上述のように、最小実行可能領域３００６（図３Ｃに示される）が、物体３０００を移動させるためにロボットアーム３３２０によって掴まれるか、もしくは把持され得る、またはそのために利用可能であり得る、標的開放角３００４Ａと関連付けられた物体３０００の表面３００１上の領域を表す。標的開放角３００４Ａに関連付けられた物体３０００が他の物体に隣接しているか、またはそれと接触している用途では、計算システム３１００は、物体３０００の寸法を正確および／または精密に推定しない場合があり、そのため、ロボットアーム３３２０が物体３０００を堅固に掴み得る領域を正確に規定するのは困難である。そのため、最小実行可能領域３００６は、ロボットアーム３３２０が、正しい寸法を知らずに物体３０００を掴み得る、推定されたか、または潜在的な寸法に基づく領域を規定する。最小実行可能領域３００６は、標的開放角３００４Ａによって規定される物体３０００の表面３００１上の面積、複数の幅方向の候補エッジの幅方向の候補エッジ３００８、複数の長さ方向の候補エッジの長さ方向の候補エッジ３０１０、および交点３０２４である。

上記のように、複数の幅方向の候補エッジ３００８Ａ、３００８Ｂ、３００８Ｃ、複数の長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、３０１０Ｃ、および複数の交点３０２４Ａ～３０２４Ｉは、以前の操作で識別される。合わせて、複数の幅方向の候補エッジ３００８Ａ、３００８Ｂ、３００８Ｃ、複数の長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、３０１０Ｃ、および複数の交点３０２４Ａ～３０２４Ｉは、潜在的な最小実行可能領域候補３０６６のセットを規定し得、その個々の候補（例えば、潜在的な最小実行可能領域候補３００６Ａ～３００６Ｇ）が図３Ｅに例示される。実施形態では、各交点３０２４は、それが形成される幅方向の候補エッジ３００８および長さ方向の候補エッジ３０１０をさらに指定するため、標的開放角３００４Ａに関連付けられた最小実行可能領域候補が、交点３０２４に従って識別され得る。図３Ｅに図示されるように、多数の潜在的な最小実行可能領域３００６が、単一の幅方向の候補エッジ３００８Ａ、３００８Ｂ、３００８Ｃ、または単一の長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、３０１０Ｃと関連付けられ得る。加えて、潜在的な最小実行可能領域候補３０６６のセットの各々は、単一の交点３０２４と関連付けられる。上記に論じられたように、潜在的な最小実行可能領域候補３０６６のセットの各々は、最小の可能性がある物体と関連付けられる最小候補サイズ３０１６、および最大の可能性がある物体と関連付けられた最大候補サイズ３０１８内に収まる。

図３Ｅの潜在的な最小実行可能領域候補３０６６は、幅方向の候補エッジ３００８Ａ、３００８Ｂ、３００８Ｃおよび長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、３０１０Ｃの組み合わせとして、以下の表１に提示される。

候補最小実行可能領域３０６７は、標的開放角３００４Ａと、関連付けられた交点３０２４との間に最小対角距離を有する、潜在的な最小実行可能領域候補３００６Ａ、３００６Ｂなどに基づいて、潜在的な最小実行可能領域候補３０６６のセットから選択され得る。最小距離は、候補最小実行可能領域３０６７の決定における主因として使用され得る。長さ基準に対する倍率δ₂の使用に起因して、候補最小実行可能領域３０６７は、最小候補サイズ３０１６よりも小さくてもよい。さらなる実施形態では、最小候補サイズ３０１６は、候補最小実行可能領域３０６７として選択される潜在的な最小実行可能領域候補３０６６の最小サイズとして設定され得る。

候補最小実行可能領域３０６７に対して最小対角距離を選択することによって、システムは、候補最小実行可能領域３０６７が、それが位置する実際の物体３０００より大きくないと決定する。候補最小実行可能領域３０６７を形成する識別されたエッジは、標的物体３０００Ａの実際の寸法を表し得るが、それらは、標的物体３０００Ａの考えられるエッジを表す。標的開放角３００４Ａと、関連付けられた交点３０２４との間の最小対角距離を選択することによって、計算システム１１００／３１００は、標的物体３０００Ａのみに存在する増大した可能性を有する、面積、候補最小実行可能領域３０６７を決定する。実施形態では、システムは、候補最小実行可能領域３０６７が１つ以上の物体と交差しないと決定し得る。したがって、候補最小実行可能領域３０６７内で標的物体３０００Ａを把持することは、ロボットアームが一度に１つよりも多い物体３０００を把持しようと試みる可能性を低減することによって、把持操作の信頼性を向上させる。

潜在的な最小実行可能領域候補３０６６のセットから最小実行可能領域候補を決定する様々な他の方法が使用されてもよい。例えば、潜在的な最小実行可能領域候補が、以前に識別された開放角３００４でもある交点３０２４を含む事象において、その潜在的な最小実行可能領域候補は、物体３０００の表面３００１の全体と相関すると想定され得るため、選択され得る。あるいは、潜在的な最小実行可能領域候補が、例えば、特定の割合閾値内の、最小候補サイズ３０１６または最大候補サイズ３０１８のいずれかと実質的に同様の寸法を有する場合、物体３０００は、それぞれ、最小候補サイズ３０１６または最大候補サイズ３０１８のいずれかであり、潜在的な最小実行可能領域候補が選択され得ることが想定され得る。一部の実施形態では、潜在的な最小実行可能領域候補３０６６のセットから選択される候補最小実行可能領域３０６７は、潜在的な最小実行可能領域候補３０６６のセットの最大面積または中央面積を有する、潜在的な最小実行可能領域候補３００６Ａ、３００６Ｂなどに基づき得る。一部の実施形態では、潜在的な最小実行可能領域候補３０６６のセットから選択される候補最小実行可能領域３０６７は、最短候補エッジと関連付けられた交点３０２４を有する、潜在的な最小実行可能領域候補３００６Ａ、３００６Ｂなどに基づき得る。

操作において、方法４０００は、最小実行可能領域候補３０６７を検証または調整して、最小実行可能領域３００６を生成する操作４０１６を含む。最小実行可能領域候補３０６７の検証は、以下で論じられるように、１つ以上の技術を含み得る。したがって、検証および／または調整された最小実行可能領域候補３０６７は、最小実行可能領域３００６として規定され得、物体を識別するための検出仮説として、または検出仮説を増強するために、計算システム１１００／３１００によって使用され得る。本明細書で使用される場合、検出仮説という用語は、計算システム１１００／３１００によって決定される物体のサイズまたは形状に関する仮説を指す。実施形態では、検出仮説は、さらなる分析（例えば、追加の画像分析技術を使用する）を介して、ロボット操作を通じて、および／または追加の手段を通じて、確認され得る。

最小実行可能領域候補３０６７は、操作４００４で識別された（操作４００６～４０１４による）各開放角３００４に対して発見され得、そのように検出された最小実行可能領域候補３０６７は、他の最小実行可能領域候補３０６７に対する比較によって検証され得る。例えば、計算システム１１００／３１００は、重複検証または遮蔽検証を実施し得る。計算システム１１００／３１００は、標的開放角３００４Ａの最小実行可能領域候補３０６７の一部分が、異なる開放角３００４と関連付けられた最小実行可能領域候補３０６７と交差するか否かを決定し得る。そのような場合、標的開放角３００４Ａの最小実行可能領域候補３０６７と、異なる開放角３００４の最小実行可能領域候補３０６７との間の比較は、開放角３００４／３００４Ａが、同じ物体３０００Ａに属すること（遮蔽検証）、または開放角３００４／３００４Ａが、異なる物体３０００に属すること（重複検証）を決定し得る。

共有物体の場合、計算システム１１００／３１００は、遮蔽検証を実施し得る。同じ標的物体３０００Ａに属する２つの最小実行可能領域候補３０６７は、互いに遮蔽し得る。計算システム１１００／３１００は、両方の最小実行可能領域候補３０６７の情報を組み合わせて、最小実行可能領域３００６を生成することができるか、または標的開放角３００４Ａの最小実行可能領域候補３０６７を調整して、異なる開放角３００４の最小実行可能領域候補３０６７の情報を組み込み、物体３０００Ａに対してより正確な最小実行可能領域３００６を作り出すことができる。

あるいは、角が同じ物体３０００に属していない事象において、計算システム１１００／３１００は、２つの重複する最小実行可能領域候補３０６７と関連付けられた信頼レベルを減少させ得る。どの最小実行可能領域候補３０６７をさらなる処理のための最小実行可能領域３００６として指定するかを決定する際、計算システム１１００／３１００は、最も高い信頼レベルを有する最小実行可能領域候補３０６７（例えば、他の最小実行可能領域候補３０６７との重複がより少ないか、または全くない）を選択し得る。

実施形態では、最小実行可能領域候補３０６７の正確性は、追加因子を使用してさらに向上し得る。例えば、パレットが一様なタイプの物体（例えば、単一のＳＫＵを有する物体）を収容することが知られている事象において、物体の各々に対する最小実行可能領域（特に、物体の寸法と合致する最小実行可能領域）は、実質的に一様であると予想され得る。そのような場合、数個の異なる技術が、潜在的な最小実行可能領域候補３０６６から最小実行可能領域候補３０６７を識別および検証するために用いられ得る。単一のＳＫＵまたは一様な物体の方法は、テンプレート検証操作、包装検証操作、および角分類操作のうちの１つ以上を含み得る。

ここで図３Ｆを参照すると、実施形態では、一様なタイプの物体を収容する物体リポジトリ（例えば、パレット、容器、または他の物体リポジトリ）について、最小実行可能領域候補３０６７は、テンプレート検証操作に基づいて、潜在的な最小実行可能領域候補３０６６から識別および／または検証され得る。本明細書に実施される物体認識方法の態様は、２０２０年８月１２日出願の米国特許出願第１６／９９１，５１０号、および２０２０年８月１２日出願の米国特許出願第１６／９９１，４６６号により詳細に説明されており、その各々が参照により本明細書に組み込まれる。テンプレート検証操作は、一様な物体が同様の寸法および視覚的特徴を有するという仮定に基づいて進行する。潜在的な最小実行可能領域候補３０６６によって規定される画像情報の一部分は、潜在的な最小実行可能領域候補３０６６の各々に対応するテンプレート３０６８を生成するように分析され得る。各テンプレート３０６８は、少なくともテクスチャ値、色値、および寸法値を含む、関連付けられた画像部分から生成された情報を含み得る。テクスチャ値は、潜在的な最小実行可能領域候補３０６６の画像部分が、テクスチャありまたはテクスチャなしの表面を識別するか否かを規定し得る。色値は、潜在的な最小実行可能領域候補３０６６を表す画像部分の色を規定し得る。寸法値は、潜在的な最小実行可能領域候補３０６６のエッジ寸法および／または面積を表し得る。テンプレート３０６８は、互いに比較されて、テクスチャ値、色値、および寸法値のうちの１つ以上で合致するテンプレート３０６８を識別し得る。これらの値のうちの１つ以上で合致することは、合致するテンプレート３０６８と関連付けられた、潜在的な最小実行可能領域候補３０６６が、真の物理的物体３０００を表すことを示し得る。物体３０００が一様なタイプである場合、合致するテンプレート３０６８を有することが予想され得る。したがって、合致するテンプレート３０６８を識別することによって、１つ以上の最小実行可能領域候補３０６７が、潜在的な最小実行可能領域候補３０６６から識別され得る。実施形態では、識別された１つ以上の最小実行可能領域候補３０６７は、テンプレート検証操作に基づいて、最小実行可能領域３００６としてさらに検証され得る。

ここで図３Ｇおよび図３Ｈを参照すると、実施形態では、一様なタイプの物体３０９１を収容する物体リポジトリ３０９０（例えば、パレット、容器、または他の物体リポジトリ）について、最小実行可能領域候補３０６７（ここでは図示せず）は、包装検証操作に基づいて、潜在的な最小実行可能領域候補３０６６から識別および／または検証され得る。物体リポジトリ３０９０が完全に包装されている（例えば、物体によって完全に占有された層を有する）ことが知られているか、または物体リポジトリがエッジの周囲で包装されていることが知られている場合、この情報は、いくつかの方法で、潜在的な最小実行可能領域候補３０６６からの最小実行可能領域候補３０６７の識別および検証を支援または増強するために使用され得る。

まず、包装検証操作は、最小実行可能領域候補３０６７の識別および検証を支援するために、包装された物体リポジトリ３０９０の総面積を使用し得る。物体リポジトリ３０９０が完全に包装されている場合、その上に位置する物体３０９１の総表面積は、単一の物体３０９１の表面積によって均等に分割可能になる。図３Ｇに示される例では、単一の物体３０９１の表面積によって除算された物体３０９１の総表面積は、８である。潜在的な最小実行可能領域候補３０６６の面積は、物体３０９１の総表面積と比較されて、最小実行可能領域候補３０６７を、総表面積に均等に分割する面積を用いて識別し得る。閾値係数（例えば、９５％、９８％、９９％など）が、ノイズおよび測定誤差の他の発生源を考慮するように、分割操作に適用されてもよい。識別された最小実行可能領域候補３０６７は、本明細書に説明されるさらなる方法に従って、最小実行可能領域３００６を決定するためにさらに検証され得る。

第２に、包装検証操作は、最小実行可能領域候補３０６７の識別および検証を支援するために、包装された物体リポジトリ３０９０の寸法を使用し得る。物体３０９１が行および列の等数で配置される特定の配置では、潜在的な最小実行可能領域候補３０６６の寸法が、物体リポジトリ３０９０の寸法と比較されて、最小実行可能領域候補３０６７を識別および／または検証し得る。例えば、物体リポジトリ３０９０の幅方向の寸法Ｘ１および長さ方向の寸法Ｘ２は、物体３０９１の寸法に合致する、潜在的な最小実行可能領域候補３０６６の寸法によって均等に分割されることになる。潜在的な最小実行可能領域候補３０６６が、寸法Ｄ１およびＤ２を有する、暗い境界を用いて図３Ｇに示される。Ｘ１＝ｍ＊Ｄ１であり、式中、ｍが整数（図３Ｇの例では、ｍ＝２）であり、かつＸ２＝ｎ＊Ｄ２であり、式中、ｎが整数（図３Ｇの例では、ｎ＝４）である場合、潜在的な最小実行可能領域候補３０６６が、物体リポジトリ３０９０上の物体３０９１の真の寸法を表し、最小実行可能領域候補３０６７として識別され得ることを示し得る。潜在的な最小実行可能領域候補３０６６の寸法がこれらの条件を満たさない場合、物体リポジトリ３０９０上の物体３０９１の真の寸法を表す可能性は低い。実施形態では、割合閾値（例えば、９５％、９８％、９９％）は、ノイズおよび他の因子に起因する、測定における潜在的な誤差を考慮するために、Ｘ１およびＸ２の方程式において使用され得る。識別された最小実行可能領域候補３０６７は、本明細書に説明されるさらなる方法に従って、最小実行可能領域３００６を決定するためにさらに検証され得る。

第３に、包装検証操作は、より一般的な配置に対する最小実行可能領域候補３０６７の識別および検証を支援するために、物体リポジトリ３０９０の寸法を使用し得る。物体３０９１が、物体リポジトリ３０９０のエッジを完全に包装する、不等数の行および列（ピンホイールパターンとも呼ばれる）で配置される、図３Ｈに示される、一般的な配置では、物体リポジトリ３０９０の各側面の長さは、物体３０９１の幅方向の寸法の整数に、物体３０９１の長さ方向の寸法の整数を加えたものに等しくなければならない。一般的な配置の包装操作は、物体リポジトリ３０９０が完全に包装されているか否かにかかわらず、エッジが完全に包装されている限り、使用され得る。潜在的な最小実行可能領域候補３０６６の寸法は、物体３０９１の幅および長さの両方を考慮する一対の方程式を使用して、最小実行可能領域候補３０６７を識別および／または検証するために、物体リポジトリ３０９０の寸法と比較され得る。潜在的な最小実行可能領域候補３０６６が、寸法Ｄ１およびＤ２を有する、暗い境界を用いて図３Ｈに示される。一般的な配置では、満たされるべき方程式は、次のとおりである。Ｘ１＝ｍ１＊Ｄ１＋ｎ１＊Ｄ２、式中、ｍ１およびｎ１が両方とも整数であり（図３Ｈの例では、ｍ１＝１およびｎ１＝３）、かつＸ２＝ｍ２＊Ｄ１＋ｎ２＊Ｄ２、式中、ｍ２およびｎ２が両方とも整数である（図３Ｈの例では、ｍ２＝１およびｎ２＝３）である。両方の方程式が、潜在的な最小実行可能領域候補３０６６の寸法によって満たされ得る場合、それは、潜在的な最小実行可能領域候補３０６６が、物体リポジトリ３０９０上の物体３０９１の真の寸法を表し、最小実行可能領域候補３０６７として識別され得ることを示し得る。潜在的な最小実行可能領域候補３０６６の寸法がこれらの条件を満たさない場合、物体リポジトリ３０９０上の物体３０９１の真の寸法を表す可能性は低い。実施形態では、割合閾値（例えば、９５％、９８％、９９％）は、ノイズおよび他の因子に起因する、測定における潜在的な誤差を考慮するために、Ｘ１およびＸ２の方程式において使用され得る。識別された最小実行可能領域候補３０６７は、本明細書に説明されるさらなる方法に従って、最小実行可能領域３００６を決定するためにさらに検証され得る。

実施形態では、角分類操作は、一様なタイプの物体３０９１を有する物体リポジトリ３０９０上で、計算システム１１００／３１００によって実施され得る。物体３０９１が一様であるため、開放角で識別可能な物体３０９１は、いくつかの特徴を共通に有し得ることが予想されることになる。例えば、角タイプの物体３０９１は、物体リポジトリ３０９０の角間で比較され得る。角タイプは、例えば、長方形、八角形、および丸み付きを含み得る。一部の状況では、測定誤差に起因して、物体リポジトリ３０９０の角にある異なるタイプの物体角を区別することは困難であり得る。例えば、物体の角が八角形であるか、または丸み付きであるかを決定することは、困難であり得る。そのような場合、物体リポジトリ３０９０の各角の物体角が比較され得、最も頻繁に識別される物体角は、物体リポジトリ３０９０における物体３０９１の物体角タイプとして決定され得る。同様の技術が、物体リポジトリ３０９０の角に位置する物体３０００のテクスチャありまたはテクスチャなしの分類を決定するために使用され得る。

以下に詳述する方法５０００は、標的物体の寸法を推定するための方法を説明する。実施形態では、方法５０００は、方法４０００で規定される最小実行可能領域を使用し得る。実施形態では、方法５０００は、ロボットアームが物体と相互作用し始めると、標的物体の寸法を推定し得る。特に、方法４０００で規定される最小実行可能領域は、ノイズ、偽エッジ、または他の不正確さに起因して、正しくないサイズである場合がある。したがって、ロボットアームが、固定されていない位置で物体を把持するように命令され、物体または環境への損傷のリスクが増加する場合がある。例えば、中心から外れた位置で物体を把持すると、持ち上げようとしたときに、把持点で許容できないレベルのトルクをもたらす場合がある。より正確に物体寸法を推定するために、ロボットアームは、把持した物体を移動させて、物体と、隣接する物体との間のギャップを露出させ、決定される物体の寸法のより正確な近似を可能にすることができる。次いで、規定された最小実行可能領域と新たに識別された標的物体寸法とを比較して、規定された最小実行可能領域の正確さを決定することができ、差が大きい場合、ロボットアームは、規定された寸法に基づいて、物体を解放および再把持することができる。

物体の寸法を推定するための方法５０００を図５に示す。方法５０００は、標的物体を、物体の物理的寸法の良好な視界を可能にするように移動または再位置決めすることに基づく。方法５０００では、標的物体の標的開放角の最小実行可能領域が最初に決定される。標的物体の最小実行可能領域は、標的物体の推定寸法を表す。最小実行可能領域は、例えば、上述の方法４０００によって推定され得る。次いで、標的物体は、最小実行可能領域に基づいて把持される。標的物体の寸法推定の正確さを増加させるために、方法５０００は、周囲の物体に対して標的物体を移動するか、または引きずって、物体間のギャップを露出させることを含み得る。次いで、ギャップは、標的物体の寸法を決定するために使用され得、かつ（例えば、（例えば、方法４０００で生成された）最小実行可能領域を調節することによって）計算システムによって使用され得る。方法５０００は、非一時的コンピュータ可読媒体に記憶することができ、かつ少なくとも１つの処理回路が、視野を有するカメラと通信している状態で、少なくとも１つの処理回路によって実行され得る。方法５０００によって生成された標的物体の推定寸法を、例えば、方法４０００によって決定された最小実行可能領域と比較し、それにより、ロボットのアームが、物体を持ち上げて移動する前に、標的物体を確実に把持することを確保することができる。

上で論じたように、方法４０００によって実施される最小実行可能領域の算出は、最小実行可能領域が単一の物体上にのみ存在することを確保するが、偽エッジまたはその他のエラーソースが潜在的に含まれるため、最小実行可能領域の中心は、標的物体の中心の近くにはない場合がある。したがって、最小実行可能領域の中心で物体を把持することは、中心から外れ、物体を持ち上げることが困難になることをもたらす場合がある。方法の調整された最小実行可能領域が標的物体の寸法を十分に推定していない場合、方法５０００は、新たに生成された標的物体の寸法に基づいて、ロボットのアームに標的物体を再把持するように命令することができる。

実施形態では、方法５０００は、最小実行可能領域を識別するための方法４０００に続いて、および／または方法４０００とともに、実施され得る。かかる実施形態では、方法５０００の操作は、方法４０００の操作と同じであってもよい。例えば、操作４００２および５００２、操作４００４および５００４、ならびに操作４００５および５００５は、一致していてもよく、かつ／または同じ操作であってもよい。方法５０００の操作５００６は、操作４００８～４０１６を含む、操作４００６のすべてまたは一部を組み込み得る。

方法５０００は、図３の１つ以上の物体３０００、例えば、物体３０００Ａ～３０００Ｄの物理的特性を表す初期画像情報を取得する操作５００２を含む。初期画像情報は、カメラ３２００によって生成され、１つ以上の物体に関連付けられた少なくとも物体の外観を説明し、各物体は、複数のエッジを含む。初期画像情報を取得するための操作５００２は、操作４００２に関して上で論じた方法および技術のいずれかまたはすべてを含み得る。初期画像情報は、方法４０００で収集されたものと同じ初期画像情報であってもよく、または新たに収集された初期画像情報であってもよい。明確にするために、操作５００２で取得された初期画像情報のいずれかのソースが初期画像情報と称される場合がある。本明細書に記載の方法５０００は、計算システムの少なくとも１つの処理回路によって実行され得る。

操作において、方法５０００は、複数の角３００２を検出するための操作５００４を含む。存在する任意の角を検出するために、計算システム３１００は、操作４００４に関して上で論じた任意のおよびすべての方法および技術を含む、様々な方法を使用することができる。本明細書に記載の操作５００４は、計算システムの少なくとも１つの処理回路によって完了され得る。

操作において、方法５０００は、複数の角３００２から標的開放角３００４Ａを識別するための操作５００５を含む。操作５００５は、操作４００５に関して上述した方法および技術のいずれかおよびすべてを含み得る。本明細書に記載の操作５００５は、計算システムの少なくとも１つの処理回路によって完了され得る。

操作において、方法５０００は、標的開放角３００４Ａの最小実行可能領域３００６を規定するための操作５００６を含む。操作５００６は、方法４０００の１つ以上の部分、特に、操作４００６～４０１６を実施して、標的開放角３００４Ａの最小実行可能領域３００６を決定することを含み得る。最小実行可能領域３００６は、物体３０００を移動するようにロボットアーム３３２０が掴むことができる、標的開放角３００４Ａに関連付けられた物体３０００の表面３００１上の領域を表す。

操作５００６で規定される最小実行可能領域３００６は、方法４０００によって（例えば、操作４００６～４０１６のうちの１つ以上によって）規定される検証済み最小実行可能領域３００６であってもよい。さらなる実施形態では、操作４０１４によって決定される候補最小実行可能領域が、方法５０００での継続使用のために選択され得る。上述のように、標的開放角３００４Ａの最小実行可能領域を規定することは、交差角３０２４を規定することを含み、交差角は、標的開放角３００４Ａに対向する。本明細書で使用される場合、標的開放角３００４Ａおよび交差角３０２４に関して「対向する」という用語は、これらの角の、標的物体の表面（例えば、頂部表面）の対向する角における位置を指し、対向する角は、該位置から延在する共通のエッジを有しない。上で論じたように、各最小実行可能領域３００６は、標的開放角３００４Ａ、長さ方向の物理的エッジ３０１３の一部分、幅方向の物理的エッジ３０１５の一部分、幅方向の候補エッジ３００８、長さ方向の候補エッジ３０１０、ならびに幅方向の候補エッジ３００８および長さ方向の候補エッジ３０１０に関連付けられた交点３０２４によって規定される。図３Ｅに描かれるように、多数の最小実行可能領域３００６Ａ、３００６Ｂ、３００６Ｃなどが、単一の幅方向の候補エッジ３００８Ａ、３００８Ｂ、３００８Ｃ、または単一の長さ方向の候補エッジ３０１０Ａ、３０１０Ｂ、３０１０Ｃに関連付けられ得る。さらに、各最小実行可能領域３００６は、単一の交点３０２４にのみ関連付けられている。本明細書に記載の操作５００６は、計算システムの少なくとも１つの処理回路によって完了され得る。

ここで図６Ａを参照すると、操作において、方法５０００は、最小実行可能領域３００６に基づいて非遮蔽面積３０２７を規定するための操作５００８を含む。方法５０００の実行中に、ロボットアーム３３２０は、カメラ３２００の視野３２１０と、開放角３００４Ａに関連付けられた物体３０００との間で空間を移動し得る。この移動の間、ロボットアーム３３２０は、カメラ３２００の視野３２１０内の標的物体の検出に使用される特徴を遮断または遮蔽し得る。以下で論じるように、方法５０００は、例えば、操作５０１６で、後続の画像情報の取り込みを伴う。標的物体３０００Ａの寸法および最小実行可能領域３００６を説明する後続の画像情報を正確に取り込むためには、物体３０００Ａの特定の部分、または特徴が、カメラ３２００によって視認可能であるように非遮蔽状態のままであり、かつ位置決めされることが望ましい。

非遮蔽面積３０２７は、以下で論じる補足的な画像情報の収集操作中に画像が取得されることが望ましい、物体のグループの表面の二次元領域である。非遮蔽面積３０２７とカメラ３２００との間は、非遮蔽ゾーンであり、ロボットアーム３３２０の位置決めが、非遮蔽面積３０２７の補足的な画像情報を取得するカメラ３２００の形態を遮断または遮蔽しないように、撮像操作中に回避されるべき三次元空間である。本明細書で参照されるように、非遮蔽面積３０２７を遮断するということは、非遮蔽面積３０２７をカメラ３２００による観察から遮断することを指す。

非遮蔽面積３０２７の特徴は、最小実行可能領域３００６に従って規定され得る。したがって、最小実行可能領域３００６の１つ以上のエッジは、非遮蔽面積３０２７を規定する基礎として機能し得る。非遮蔽面積３０２７内に含めるための特徴は、交点３０２４から延在する幅方向の候補エッジ３００８と、幅方向の候補エッジ３００８と実質的に垂直である、交点３０２４から延在する長さ方向の候補エッジ３０１０と、を含み得る。非遮蔽面積３０２７のさらなる部分は、最小実行可能領域３００６を規定する物理的エッジ３０１３／３０１５の延長部を含み得る。非遮蔽面積３０２７内に含まれる物理的エッジ延長部は、最小実行可能領域３００６の境界を越えて延在する物体スタックの物理的エッジ３０１３／３０１５の部分である。物理的エッジ延長部とは、物理的エッジ３０１３／３０１５と候補エッジ３００８／３０１０との交差部を越えて延在する、物理的エッジ３０１３／３０１５の部分である。

非遮蔽面積３０２７の例を図６Ａに示す。例示の目的で、非遮蔽面積３０２７は、４つの別個のストリップ３０２８Ａ～３０２８Ｄを含むように示されている。各ストリップ３０２８は、標的物体の既知の物理的エッジまたは候補エッジと平行に走り、かつこれらのエッジに対応する、領域である。例えば、標的物体３０００Ａに対して、ストリップ３０２８は、幅方向の候補エッジ３００８、長さ方向の候補エッジ３０１０、長さ方向の物理的エッジ３０１３、または幅方向の物理的エッジ３０１５と平行に走り、かつこれらのエッジに対応する。例えば、図６Ａに示されるように、ストリップ３０２８Ａは、長さ方向の物理的エッジ３０１３に対応し、ストリップ３０２８Ｂは、幅方向の候補エッジ３００８に対応し、ストリップ３０２８Ｃは、長さ方向の候補エッジ３０１０に対応し、ストリップ３０２８Ｄは、幅方向の物理的エッジ３０１５に対応する。各ストリップ３０２８は、長さおよび幅を有し、対応する（物理的または候補）エッジの少なくとも一部分がストリップ３０２８の面積内に含まれるように位置する。

各ストリップ３０２８の長さは、固定された距離であってもよく、または最大候補サイズに基づいていてもよい。例えば、図６Ａを参照すると、ストリップ３０２８Ａは、幅方向の候補エッジ３００８に対応するように位置決めされており、ストリップ３０２８Ａが最大候補サイズ３０１８の境界と交わるまで、幅方向の候補エッジ３００８を超えて延在する。ストリップ３０２８は、用途に応じて選択される、５ｍｍ、４ｍｍ、３ｍｍなどの様々な幅を有し得る。ストリップ３０２８の幅が大きいほど、物体３０００Ａが移動または引きずられたときにギャップ３０２６が検出され得る機会が大きくなる。しかしながら、幅を大きくすると、ノイズまたは信号のエラーの可能性が増加するという犠牲をもたらし得る。ストリップ３０２８の面積が小さいほど、ロボットアーム３３２０は、ロボットアーム３３２０が回避すべき面積がより小さくなるため、より多くの移動の自由度を有し得る。さらに、より小さい遮蔽面積は、計算負荷を低減し得る。本明細書に記載の操作５００８は、計算システムの少なくとも１つの処理回路によって完了され得る。

操作において、方法５０００は、ロボット３３００のロボットアーム３３２０を位置決めするための位置決めコマンドを送信するための操作５０１０を含む。位置決めコマンドを、計算システム１１００／３１００によって送信して、標的物体３０００Ａを把持する位置にロボットアーム３３２０を位置決めし、標的物体３０００Ａを移動させることができる。位置決めコマンドにより、ロボットアーム３３２０を非遮蔽ゾーンの外側に位置決めすることができ、そのため、ロボットアーム３３２０および／またはエンドエフェクター装置３３３０は、カメラによる非遮蔽面積３０２７の視界を遮断しない。位置決めコマンドは、計算システムの少なくとも１つの処理回路によって送信され得る。

操作において、方法５０００は、標的物体３０００Ａの最低実行可能領域３００６内の場所から標的物体３０００Ａを掴む、拾い上げる、把持するなどのための最小実行可能領域（ＭＶＲ）把持コマンドを送信するための操作５０１２を含む。例えば、標的物体３０００Ａを把持するために、最小実行可能領域３００６の中心またはおよそ中心が計算システム１１００／３１００によって選択され得る。上で論じたように、エンドエフェクター装置３３３０は、物体の表面を介した接触を通じて物体を把持または固設することができる、吸引カップまたは他の把持ツールを用いることができる。実施形態では、把持コマンドは、把持する操作中に、ロボットアーム３３２０およびエンドエフェクター装置３３３０を非遮蔽ゾーンの外側に留まらせるように構成され得る。

操作において、方法５０００は、標的物体３０００Ａを移動させるための移動コマンドを送信するための操作５０１４を含む。上で論じたように、標的物体３０００Ａを移動して、標的物体３０００Ａと、隣接する物体との間の１つ以上のギャップを開放し、それによって、計算システム１１００／３１００が、標的物体３０００Ａの寸法をより正確に推定することを可能にすることができる。移動コマンドは、３つの態様（移動距離、移動方向、および移動タイプ）を含み得る。以下でより詳細に論じる移動距離および移動方向は、以下で論じるように、隣接する物体に関連する情報に従って決定され得る。移動タイプには、持ち上げ運動または引きずり運動が含まれ得る。

実施形態では、移動コマンドの生成は、移動コマンドに対する移動タイプの決定を含み得る。移動タイプの決定には、ロボットアーム３３２０に持ち上げ運動または把持運動を使用させるかどうかを決定することが含まれ得る。どの移動タイプを使用するかを決定するために、計算システム１１００／３１００は、（例えば、操作５００６で取得したときの）最小実行可能領域３００６を最大候補サイズ３０１８と比較し得る。最大候補サイズ３０１８と比較したときに最小実行可能領域３００６が小さい場合、操作５００６で決定された最小実行可能領域３００６が、小さい角のみを表すことによって、標的物体３０００Ａの寸法を誤って推定するリスクが増加する。ロボットアーム３３２０が、標的物体３０００Ａの小さい角のみを表す最小実行可能領域３００６から標的物体３０００Ａを持ち上げた場合、標的物体３０００Ａまたは環境が、エンドエフェクター装置３３３０上に設置された増加したトルクによって損傷する可能性がある。代替的に、最小実行可能領域３００６が最大候補サイズ３０１８に匹敵する場合、最小実行可能領域３００６が標的物体３０００Ａを正確に描写するというより高い信頼性がある。したがって、最小実行可能領域３００６と最大候補サイズ３０１８との間の領域候補比を使用して、移動コマンドに対して持ち上げ運動または把持運動を選択するかどうかを決定することができる。領域候補比が特定の閾値以上である場合、計算システムは、持ち上げ運動を選択し得る。例示的な閾値の値としては、５０％以上、６０％以上、７０％以上、８０％以上、および９０％以上が挙げられる。計算システム１１００／３１００は、領域候補比が閾値を超えると、持ち上げ運動を選択することができる。これは、最小実行可能領域３００６と最大候補サイズ３０１８との間の匹敵する相対的なサイズ決めが、トルクの増加により、標的物体３０００Ａまたは環境に対する損傷の高いリスクを伴わずに、ロボットアーム３０３２が標的物体３０００Ａを確実に把持することができることになるという信頼性を増加させるためである。かかる状況で移動タイプとして持ち上げ運動を選択することによりさらに、計算システム３１００は、以下に説明するように、標的物体３０００Ａのサイズ、および標的物体３０００Ａの重量を測定することができる場合がある。

領域候補比が閾値の値よりも小さい場合、引きずり運動は、移動コマンドに対する移動タイプとして選択され得る。計算システム１１００／３１００は、引きずり運動を選択する場合がある。これは、閾値を超えていない場合に、最小実行可能領域が標的物体３０００Ａの寸法を正確に表しているという確実性がより低く、標的物体３０００Ａまたは環境のいずれかに対する損傷のリスクが増加するためである。実施形態では、移動コマンドは、摩擦を低減するように引きずり運動を実施している間に、ロボットアーム３３２０に小さい持ち上げ力を提供させるように構成され得る。引きずり運動を選択することにより、計算システム１１００／３１００は、以下に説明するように、標的物体３０００Ａのサイズを測定することができるが、標的物体３０００Ａの重量を測定しない場合がある。

移動コマンドの移動距離および移動方向は、標的物体３０００Ａを、周囲のまたは隣接する物体３０００Ｂ～３０００Ｄに対して移動させて、物体３０００のエッジ間のギャップ３０２６を露出させることを許容するように決定され得る。実施形態では、標的物体３０００Ａの移動距離および移動方向は、標的開放角３００４Ａの移動距離および方向に基づく。移動距離は、ギャップを露出させるのに必要な移動の量に従って決定され得る。移動方向は、ギャップを露出させる可能性および標的物体３０００Ａに隣接する物体３０００との衝突を回避する可能性に基づいて決定され得る。

移動距離の決定は、ギャップを露出させるのに必要な移動の量に従って決定され得る。ギャップ３０２６を露出させるために、標的物体３０００Ａは、ギャップ幅の閾値を超えるギャップ３０２６を露出させるのに十分な移動距離を選択し得る（さらなる詳細については以下を参照）。実施形態では、移動距離は、物体のサイズに従って選択され得る（例えば、より大きい物体は、識別可能なギャップ３０２６を作り出すためにより大きい移動距離を必要とし得る）。ギャップ３０２６が移動コマンドの実行中に視認されるいくつかの実施形態では、予め設定された移動距離は存在しない場合がある。移動距離は、十分なギャップサイズ（ギャップ幅の閾値を超える）が検出されたという決定に基づいて動的に決定され得る。

移動方向は、標的物体３０００Ａを隣接する物体３０００から離れる方向に移動させて、潜在的な衝突を回避しながらギャップ３０２６を露出させるように選択され得る。実施形態では、移動方向は、ベクトルの組み合わせとして選択され得、ベクトルの各々は、隣接する物体から離れる方向を表す。したがって、物体３０００Ａは、対角方向３０２９に移動され得る。対角方向３０２９は、幅方向の物理的エッジのベクトル３０１４に対向する方向の水平ベクトルと、長さ方向の物理的エッジのベクトル３０１２に対向する方向の垂直ベクトルとの組み合わせを表す。ギャップ３０２６は、露出されると、以下でより詳細に説明するように、標的物体３０００Ａの寸法を推定するために計算システム１１００／３１００によって使用され得る。本明細書に記載の操作５０１４は、計算システムの少なくとも１つの処理回路によって完了され得る。

実施形態では、計算システム１１００／３１００は、移動コマンドの実行中に移動コマンドを調整し得る。移動コマンドの調整には、移動コマンドを決定する際に、物体３０００Ａを引きずることが障害物、例えば、重い物体によって妨害されているかどうかを考慮に入れることができる。ロボットアーム３３２０または物体３０００Ａのいずれかに対する損傷を回避するために、システムは、例えば、引きずり力または抵抗力が規定された閾値を超えたときを検出する力センサを含み得る。規定された閾値は、ロボット３３００、ロボットアーム３３２０、および／またはエンドエフェクター装置３３３０に関連する安全因子に従って選択され得る。規定された閾値はまた、物体３０００Ａおよび／または移動する物体のタイプに関連する安全因子に従って選択され得る。規定された閾値を超えた場合、ロボットアーム３３２０は、元の移動方向および移動距離とは異なる方向および距離で、引きずることを実施しようと試みるように指令され得、かつ／または物体３０００Ａが把持される場所を変更するよう指令され得る。高い量の引きずり力または抵抗力が検出された実施形態では、ロボットアーム３３２０は、力が静まるまで物体３０００Ａを把持し続け、それにより、物体３０００Ａが、力の結果として、偶発的に、かつ予期せずに移動するリスクを低減することができる。例えば、標的物体３０００Ａが複数の物体の上に積み重ねられている状況では、過剰な引きずり力または抵抗力が、標的物体３０００Ａの下に位置決めされた物体３０００間の不安定性を引き起こし得る。

処理回路は、ロボット３３００のロボットアーム３３２０を制御し、それにより、操作５０１０、５０１２、および５０１４（以下で論じる）中に非遮蔽面積３０２７を遮断または遮蔽することを回避するように構成され得、その結果、カメラ３２００は、非遮蔽面積３０２７の視認性を維持することができる。計算システム３１００は、非遮蔽面積３０２７、例えば、ストリップ３０２８Ａ～３０２８Ｄをカメラ３３２０の視界から遮断することを回避するように、ロボット３３００のエンドエフェクター装置３３３０および／またはロボットアーム３３２０に対する位置決めコマンド、把持コマンド、および移動コマンドを生成し得る。実施形態では、位置決めコマンド、把持コマンド、および移動コマンドは、位置決めコマンドおよび把持コマンドの間、ならびに移動コマンドの少なくとも一部分の間に、非遮蔽面積の遮断を許容するように構成され得る。例えば、ロボットアーム３３２０のエンドエフェクター装置３３３０は、標的物体３０００Ａを把持するように位置決めされ得、標的物体３０００Ａは、ロボットアーム３３２０の少なくとも一部分が非遮蔽面積を遮断している間に把持され得る。標的物体３０００Ａを把持した後、ロボットアーム３３２０は、非遮蔽面積３０２７を遮断することを回避するように、さらに位置決めされ得る。さらなる実施形態では、移動コマンドは、ロボットアーム３３２０が非遮蔽面積３０２７を遮断している間に開始され得、移動コマンドの実行により、ロボットアーム３３２０を、非遮蔽面積３０２７を遮断することを回避する位置へとさらに移動させる。さらなる実施形態では、ロボットアーム３３２０部分の位置は、これらが、操作５０１６で補足的な画像情報が取り込まれたときに非遮蔽面積を遮断しないことを確保するように、移動コマンドの実行中に調整され得る。

実施形態では、ロボット３３００のロボットアーム３３２０が、カメラの視野３２１０から非遮蔽面積３０２７を部分的または完全に遮断することなく、位置決めコマンド、把持コマンド、および移動コマンドを実行することが不可能または実現不可能である状況が存在する場合がある。かかる事例では、計算システム１１００／３１００は、ロボット３３００のロボットアーム３３２０に対する移動コマンドまたは命令を生成し、これにより、ロボットアーム３３２０は、非遮蔽面積３０２７の特定の態様が妨害されないままである限り、計算システム１１００／３１００が標的物体３０００の寸法を正確に推定することができるため、非遮蔽面積３０２７を部分的に遮断することができる。特に、カメラ３２００の視野３２１０内に位置決めされた、交点３０２４、幅方向の候補エッジ３００８の少なくとも一部分、および長さ方向の候補エッジ３０１０の少なくとも一部分は、計算システム１１００／３１００が標的物体３０００Ａの寸法を推定することを許容し得る。部分的に遮蔽された状況では、以下でより詳細に論じられるように、計算システム１１００／３１００は、カメラ３２００の視野３２１０内にある、交点３０２４、幅方向の候補エッジ３００８の部分、および長さ方向の候補エッジ３０１０の部分から標的物体３０００Ａの推定された物体寸法を推論または投影するように構成され得る。したがって、計算システム１１００／３１００は、部分的な遮蔽を許容し、それにもかかわらず、交点３０２４、幅方向の候補エッジ３００８の少なくとも一部分、および長さ方向の候補エッジ３０１０の少なくとも一部分を、カメラ３２００による視認から遮断されずに残すように、位置決めコマンド、把持コマンド、および移動コマンドの実行を引き起こすように構成され得る。

操作において、方法５０００は、１つ以上の物体３０００の後続の画像情報を取得するための操作５０１６を含む。後続の画像情報は、１つ以上の物体３０００、具体的には、標的物体３０００Ａの（操作５０１４で生じる）移動を識別するために取得される。後続の画像情報は、操作５０１４の後の１つ以上の物体の変更された位置を表す情報を含む。操作５００２と同様に、後続の画像情報は、図３Ａに示されるように、カメラ３２００によって収集されるか、または取り込まれる。操作５０１６は、補足的な画像情報を取り込む際に、操作４００２および５００２に関して上で論じた方法および技術のいずれかまたはすべてを含み得る。さらに、上で論じられるように、以前に実行されたロボットの移動コマンド（位置決め、把持、移動）が、上に記載のように、非遮蔽面積を遮断されずに、または少なくとも部分的に遮断されずに残すように実行され得る。

さらに、補足的な画像情報の取り込みは、上述のロボットの移動コマンドの実行後または実行中に実施され得る。例えば、補足的な画像情報は、運動コマンドの実行後に取り込まれ得る。別の実施例では、補足的な画像情報は、運動コマンドの実行中に取り込まれ得る。運動コマンドの完了後に取り込まれた補足的な画像情報は、補足的な静止画像情報と称され得る一方、運動コマンドの実行中に取り込まれた補足的な画像情報は、補足的な運動画像情報と称され得る。本明細書に記載の操作５０１６は、計算システムの少なくとも１つの処理回路によって完了され得る。

操作において、方法５０００は、補足的な画像情報に基づいて、標的物体３０００Ａの寸法を推定するための操作５０１８を含む。図６Ｂは、操作５０１４に従って標的物体３０００Ａが引きずられた後の後続の画像情報を描いている。標的物体３０００Ａの寸法を推定するための操作５０１８は、補足的な静止画像情報、補足的な運動画像情報、またはこれらの両方を使用することができる。

補足的な静止画像情報に従って標的物体３０００Ａの寸法を推定することは、移動コマンドに関連付けられたロボットの移動が完了した後に、後続の画像情報内に描かれた標的物体３０００Ａと任意の隣接する物体３０００との間のギャップ３０２６の存在を検出することを含む。後続の画像情報は、ギャップ３０２６の存在について、非遮蔽面積３０２７で、または図６Ａおよび図６Ｂに示されるようにストリップ３０２８Ａ～３０２８Ｄで分析される。ギャップ３０２６は、本明細書に記載の画像分析技術（例えば、エッジ検出、点群分析など）のいずれかに従って、補足的な画像情報から検出され得る。ギャップ３０２６は、近隣の物体の境界またはエッジから分離されている、標的物体３０００Ａの境界またはエッジを示す。図６Ｂでは、標的物体３０００Ａは、物体３０００Ｂおよび３０００Ｄから分離され、ギャップ３０２６Ａおよび３０２６Ｂをそれぞれ作り出しているものとして示されている。

各ギャップ３０２６Ａ、３０２６Ｂは、識別後に、該ギャップの幅を測定し、ギャップ幅がギャップ幅の閾値を超えるかどうかを決定するために、さらに分析することができる。ギャップ幅の閾値は、１ｃｍ～３ｃｍ、１．５ｃｍ～２．５ｃｍ、またはおよそ２ｃｍに設定され得る。必要に応じて、その他のギャップ幅の閾値を使用することができる。実施形態では、ギャップ幅の閾値は、分析される物体（より大きい閾値を有するより大きい物体）のサイズに応じて、またはシステム内に伴われたカメラおよびその他のセンサ（より小さい閾値を許容するより正確なカメラおよびセンサ）の能力に応じて選択され得る。例えば、ギャップ幅の閾値を超える幅を有するギャップ３０２６は、物体３０００のエッジに対応するように決定され得る一方、ギャップ幅の閾値を超えないギャップ３０２６は、撮像ノイズ、振動、または他の不正確さによって引き起こされたものとして無視され得る。この実施例では、非遮蔽面積３０２７のストリップ３０２８Ａ～３０２８Ｄは、ギャップ幅の閾値を超えるギャップ３０２６が存在するかどうかを示すか、または検出するように、計算システム３１００によって分析され得る。図６Ｂを参照すると、ストリップ３０２８Ａおよび３０２８Ｃはギャップ３０２６Ａを包含し、一方、ストリップ３０２８Ｂおよび３０２８Ｄはギャップ３０２６Ｂを包含する。ギャップ幅の閾値を超えるギャップ３０２６が検出された後、ギャップ３０２６を使用して、標的物体３０００Ａおよび近隣の物体３０００の両方の物理的エッジを規定することができる。ギャップ３０２６に基づいて識別された物理的エッジを追加で使用して、物体３０００を互いに区別または識別すること、ならびに標的物体３０００Ａの寸法を推定することができる。

ギャップ３０２６の識別により、計算システム１１００／３１００は、標的物体３０００Ａの真の物理的エッジを決定することができる。標的物体３０００Ａの真の物理的エッジに基づいて、計算システム１１００／３１００は、標的物体３０００Ａの寸法を推定することができる。

実施形態では、標的物体３０００Ａの寸法を推定するための操作５０１８は、ギャップ３０２６、および移動コマンドの実行によって引き起こされたロボットの運動の間の物体３０００の移動を検出および分析するように操作され得る。本明細書に記載の操作５０１８は、計算システムの少なくとも１つの処理回路によって完了され得る。かかる分析は、操作５０１６中に取り込まれた補足的な運動画像情報に基づく場合がある。補足的な運動画像情報によるギャップ検出を使用して、上に記載の補足的な静止画像情報によるギャップ検出を補足するか、または置き換えることができる。計算システム１１００／３１００は、ストリップ３０２８Ａ～３０２８Ｄ内に位置決めされた点のクラスタを識別することに基づいて、かかるギャップおよび物体運動の検出を実施し得る。計算システム１１００／３１００は、移動コマンドによって引き起こされたロボットの運動の間に、ストリップ３０２８Ａ～３０２８Ｄに沿って検索して、点、例えば、点群内の点が、物体３０００Ａの引きずり運動または持ち上げ運動のいずれかに関連して移動しているかどうかを検出することができる。

追跡される点は、物体３０００のいずれかの表面３００１上の場所と一致し得る。計算システム３１００は、同じ方向に、同じ量だけクラスタ内に移動している、識別された点をグループ化し得る。クラスタを使用して、物体を識別し、クラスタの移動に基づいて隣接する物体間を区別することができる。各クラスタの移動を、他のクラスタの各々の移動と比較することができる。２つ以上のクラスタが、匹敵する移動を表示する場合、クラスタの各々は、同じ物体に関連付けられ得る。例えば、点の第１のクラスタは、標的物体３０００Ａの物理的エッジ３０１３に関連付けられ得、点の第２のクラスタは、標的物体３０００Ａの幅方向の物理的エッジ３０１５に関連付けられ得る。かかる実施例では、第１のクラスタおよび第２のクラスタの両方の移動が匹敵することになり、それゆえ、計算システム３１００は、クラスタを同じ標的物体３０００Ａに関連付け得る。

上述のクラスタ追跡の間に収集される情報は、２つの方法で使用され得る。第１に、クラスタ追跡は、物体間のギャップ３０２６を識別し、物体の真の物理的エッジを識別するために、スタンドアロン方式で使用され得る。例えば、同様の運動を示す４つの垂直のエッジは、物体の真の物理的エッジとして理解され得る。第２に、クラスタ追跡は、補足的な静止画像情報に基づいて、ギャップ検出方法によって取得された情報を補足するために使用され得る。例えば、物体の一部分が、ギャップと同様の視覚的特徴を有する場合がある。したがって、物体のその部分が、補足的な静止画像情報に従って、ギャップとして誤って識別される場合がある。しかしながら、物体のその部分が、移動コマンドの実行中に撮像および監視されるストリップ３０２８Ａ～３０２８Ｄのうちの１つと一致する場合、偽のギャップに関連付けられたすべての点クラスタが、同様の方式で移動すると決定され得る。したがって、偽のギャップは、実際のギャップであったため、偽として識別され得、ギャップに関連付けられたクラスタのうちのいくつかは、これらのクラスタが隣接する、移動していない物体の表面上の点となることになるため、移動を示さないことになる。

操作において、方法５０００は、ロボット３３００のエンドエフェクター装置３３３０に標的物体３０００Ａを解放させるための解放コマンドを送信するための操作５０２０を含み得る。操作５０２０は、任意の操作であり、この操作は、標的物体３０００Ａの推定寸法が、最小実行可能領域３００６と比較して、許容誤差の閾値を超える場合に実行され得る。操作５０１２では、上で論じたように、ロボットアーム３３２０は、操作５００６で規定された最小実行可能領域３００６に基づいて、標的物体３０００Ａを掴むように指令される。上述のように、操作５００６で規定された最小実行可能領域３００６は、最も小さい面積を有する潜在的な候補の最小実行可能領域に基づいて選択され得る。操作５０１４に関して上述したように、最小実行可能領域３００６が標的物体３０００Ａの寸法を過小評価する事例が存在する。かかる事例では、ロボット３３００のロボットアーム３３２０が、不安定な方法で、例えば、エッジのあまりにも近くで、または中心から外れて、物体３０００を握る場合があり、これにより、標的物体３０００Ａ、環境、またはロボット３３００自体が損傷する場合がある。

例えば、標的物体３０００Ａは、一片のテープを使用して一緒に連結された２つのフラップを有し得る。操作５００６の間、計算システム１１００／３１００が、単一の標的物体３０００Ａの２つのフラップ間のギャップを標的物体３０００Ａのエッジとして不適切に考慮し、ロボット３３００のロボットアーム３３２０によって確実に把持することができない最小実行可能領域３００６をもたらす場合がある。かかる事例では、中心から外れて握ることにより、ロボット３３００のロボットアーム３３２０が、偶発的にフラップを引き裂いて開ける可能性がある。サイズの不一致に基づいて、操作５０１４に関して上で論じられるように、計算システム１１００／３１００は、ロボット３３００のロボットアーム３３２０に、物体を持ち上げるのではなく引きずるように命令し、損傷のリスクを低減したであろう。

標的物体３０００Ａの寸法をより正確に推定した後、計算システム１１００／３１００は、物体を解放および再把持するかどうかを決定し得る。最小実行可能領域３００６は、標的物体３０００Ａの推定寸法と比較され得る。最小実行可能領域３００６と標的物体３０００Ａの推定寸法との間の差が許容誤差の閾値を超える場合、ロボット３３００のロボットアーム３３２０は、標的物体３０００Ａを解放するように指令され得る。許容誤差の閾値は、標的物体３０００Ａの推定寸法および／または標的物体３０００Ａの重量に対する最小実行可能領域３００６の比に基づいて選択され得る。特に、許容誤差の閾値は、標的物体３０００Ａの推定寸法が最小実行可能領域３００６よりも大幅に大きい場合に超えるように設定され得る。許容誤差の閾値のいくつかの例には、標的物体３０００Ａの推定寸法が、最小実行可能領域３００６のサイズの１．２５倍、１．５倍、２倍、２．５倍、または３倍超であることが含まれる。比較により、許容誤差の閾値外の結果がもたらされ、解放コマンドが送信された場合、以下に記載されるように、標的物体３０００Ａを再把持するための操作５０２２が実施される。比較により、許容誤差の閾値内の結果がもたらされた場合、解放コマンドが送信されず、操作５０２２はスキップされ、以下に記載される操作５０２４が実施される。本明細書に記載の操作５０２０は、計算システムの少なくとも１つの処理回路によって完了され得る。

操作において、方法５０００は、ロボット３３００のロボットアーム３３２０の再把持コマンドを送信して、標的物体３０００Ａの推定寸法内の標的物体３０００Ａを再把持するための操作５０２２を含む。再把持コマンドは、ロボット３３００のロボットアーム３３２０が標的物体３０００Ａを解放した後に実行され得る。操作５０２２は、許容誤差の閾値を超えたと操作５０２０が決定し、かつ続いて、ロボット３３００のロボットアーム３３２０が物体３０００Ａを解放したときに行われ得る。標的物体３０００Ａが解放されると、ロボット３３００のロボットアーム３３２０は、標的物体３０００Ａの推定寸法に基づいて、標的物体３０００Ａを掴むように再び位置決めされ、命令される。例えば、ロボットアーム３３２０は、標的物体３０００Ａの推定される中心で、または中心の近くで、標的物体３０００Ａを掴むように命令され得る。標的物体３０００Ａを再把持する追加のステップにより、標的物体３０００Ａを持ち上げる前に、より安定したグリップを確保する。本明細書に記載の操作５０２２は、計算システムの少なくとも１つの処理回路によって完了され得る。

操作において、方法５０００は、ロボットアーム３３２０に搬送コマンドを送信するための操作５０２４を含む。搬送コマンドは、２つの状況で送信され得る。第１に、操作５０１８で、解放コマンドが必要である（例えば、標的物体の推定寸法が最小実行可能領域に対する閾値を超える）と決定された場合、操作５０２２の結果としてロボットアーム３３２０が標的物体３０００Ａを確実に把持していると決定された後、搬送コマンドが送信される。第２に、操作５０１８で、解放コマンドは必要ない（例えば、標的物体の推定寸法が最小実行可能領域に対する閾値を超えていない）と決定された場合、解放コマンドの送信を伴わずに、搬送コマンドが送信され得る。計算システム１１００／３１００は、ロボットアーム３３２０に搬送コマンドを送信して、標的物体３０００Ａを持ち上げ、標的物体を目的地まで搬送するように構成されている。物体３０００Ａを持ち上げることによって、標的物体３０００Ａの重量および寸法に関する追加情報を確かめることができる。標的物体３０００Ａの重量を使用して、さらなる操作において計算システム１１００／３１００によってロボット３３００に提供される命令を変更することができ、重量を使用して、標的物体３０００Ａの分類および識別を支援することができる。本明細書に記載の操作５０２４は、計算システムの少なくとも１つの処理回路によって完了され得る。

実施形態では、システムは、方法４０００および５０００に基づいて、パレットから降ろす操作を実施することができる。パレットから降ろす操作は、パレットから降ろす操作を安全かつ確実に実施するように、パレット上にある物体の寸法を識別および推定するために、方法４０００および５０００を繰り返し実行することを伴い得る。各物体は、本明細書に記載のＭＶＲおよび寸法推定技術に従って識別および評価され、その結果、物体の輸送を、物体、環境、および／またはロボットアームへの損傷を伴わずに達成することができる。本明細書に記載の方法は、パレットから降ろされるときに、パレットの物体のサイズ、形状、および重量を識別する必要がある状況で特に有用な場合がある。

関連分野の当業者にとって、本明細書に記載する方法および用途への、その他の好適な修正ならびに適応を、実施形態のうちのいずれの範囲からも逸脱することなく行うことができることは明らかであろう。上に記載する実施形態は、説明に役立つ実施例であり、本発明がこれらの特定の実施形態に限定されると解釈されるべきではない。本明細書に開示する様々な実施形態は、記載および添付の図に具体的に提示する組み合わせとは異なる組み合わせで、組み合わせてもよいことは理解されるべきである。実施例によって、本明細書に記載するプロセスもしくは方法のいずれのある特定の行為または事象は、異なるシーケンスで行われてもよく、追加、統合、または完全に省略し得ることも理解されるべきである（例えば、記載したすべての行為または事象は、方法またはプロセスを実施するのに必要ではない場合がある）。加えて、本明細書の実施形態のある特定の特徴を、明確にするために、単一の構成要素、モジュール、またはユニットにより行われていると記載しているものの、本明細書に記載する特徴および機能は、構成要素、モジュール、またはユニットのいかなる組み合わせによって行われてもよいことは理解されるべきである。したがって、添付の特許請求の範囲で規定される、本発明の趣旨または範囲から逸脱することなく、様々な変更および修正を当業者が及ぼし得る。

実施形態１は、計算システムであって、非一時的コンピュータ可読媒体と、少なくとも１つの処理回路と、を備える。少なくとも１つの処理回路が、視野を有するカメラと通信し、視野内に１つ以上の物体がある、またはあったときに、非一時的コンピュータ可読媒体に記憶されている命令を実行して、カメラによって生成される１つ以上の物体の初期画像情報を取得することと、初期画像情報に基づいて、１つ以上の物体の複数の角を検出することと、複数の角から標的物体の標的開放角を識別することと、標的物体の最小実行可能領域（ＭＶＲ）を規定することと、最小実行可能領域に基づいて、非遮蔽面積を規定することと、ロボットのアームを位置決めするための位置決めコマンドを送信することと、最小実行可能領域内の標的物体を掴むための把持コマンドを送信することと、移動方向、移動距離、および移動タイプに基づいて、ロボットのアームを使用して標的物体を移動させるための移動コマンドを送信することと、１つ以上の物体の補足的な画像情報を取得することと、補足的な画像情報に基づいて、標的物体の推定寸法を算出することと、を行うように構成されており、位置決めコマンド、把持コマンド、および移動コマンドのうちの少なくとも１つが、ロボットのアームが１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている。

実施形態２は、推定寸法によって規定された面積が最小実行可能領域と比較して許容誤差の閾値を超える場合に、少なくとも１つの処理回路が、ロボットのエンドエフェクターに標的物体を解放させるための解放コマンドを送信するようにさらに構成されている、実施形態１に記載の計算システムである。

実施形態３は、少なくとも１つの処理回路が、ロボットのエンドエフェクターが推定寸法内の標的物体を掴むための再把持コマンドを送信するようにさらに構成されている、実施形態２に記載の計算システムである。

実施形態４は、推定寸法が最小実行可能領域と比較して許容誤差の閾値内にある場合に、少なくとも１つの処理回路が、標的物体を搬送するために、ロボットのアームに搬送コマンドを送信するようにさらに構成されている、実施形態１～３のいずれか１つに記載の計算システムである。

実施形態５は、標的開放角の最小実行可能領域を規定することが、標的開放角に対向する交差角を規定することを含む、実施形態１～４のいずれか１つに記載の計算システムである。

実施形態６は、最小実行可能領域を規定することが、標的物体の物理的エッジを識別することをさらに含む、実施形態１～５のいずれか１つに記載の計算システムである。

実施形態７は、標的開放角の最小実行可能領域を規定することが、交差角から第１の方向に延在する第１の候補エッジを規定することと、交差角から、第１の方向と実質的に垂直である第２の方向に延在する第２の候補エッジを規定することと、を含む、実施形態１～６のいずれか１つに記載の計算システムである。

実施形態８は、非遮蔽面積が、交差角、ならびに第１の候補エッジおよび第２の候補エッジの少なくとも一部分を含む、実施形態１～７のいずれか１つに記載の計算システムである。

実施形態９は、少なくとも１つの処理回路が、位置決めコマンド、把持コマンド、および移動コマンドを送信するようにさらに構成されており、そのため、補足的な画像情報が取得されている間、ロボットのアームが非遮蔽面積を遮断しない、実施形態１～８のいずれか１つに記載の計算システムである。

実施形態１０は、少なくとも１つの処理回路が、補足的な画像情報に基づいて、標的物体と標的物体に隣接する物体との間の少なくとも１つのギャップを検出するようにさらに構成されている、実施形態１～９のいずれか１つに記載の計算システムである。

実施形態１１は、初期情報から標的物体の第１の物理的エッジを識別することと、少なくとも１つのギャップに基づいて、標的物体の第２の物理的エッジを識別することと、をさらに含み、標的物体の推定寸法を算出することは、第１の物理的エッジおよび第２の物理的エッジに従って行われる、実施形態１～１０のいずれか１つに記載の計算システムである。

実施形態１２は、移動距離および移動方向が、標的物体に隣接する物体との衝突を回避することに基づいて決定される、実施形態１～１１のいずれか１つに記載の計算システムである。

実施形態１３は、補足的な画像情報を取得することが、移動コマンドの実行によって引き起こされたロボットアームの移動中に実施される、実施形態１～１２のいずれか１つに記載の計算システムである。

実施形態１４は、少なくとも１つの処理回路が、移動コマンドの実行によって引き起こされたロボットアームの移動中の匹敵する移動に従って、標的物体の物理的エッジを識別するようにさらに構成されている、実施形態１～１３のいずれか１つに記載の計算システムである。

実施形態１５は、少なくとも１つの処理回路が、ＭＶＲと標的物体の最大候補サイズとの比較に基づいて、持ち上げ移動または引きずり移動として移動タイプを決定するようにさらに構成されている、実施形態１～１４のいずれか１つに記載の計算システムである。

実施形態１６は、非一時的コンピュータ可読媒体と、視野を有するカメラと通信し、命令を実行するように構成されている、少なくとも１つの処理回路と、を備える、ロボットシステムを制御する方法である。方法は、カメラによって生成される１つ以上の物体の初期画像情報を取得することと、初期画像情報に基づいて、１つ以上の物体の複数の角を検出することと、複数の角から標的物体の標的開放角を識別することと、標的物体の最小実行可能領域（ＭＶＲ）を規定することと、最小実行可能領域に基づいて、非遮蔽面積を規定することと、ロボットのアームを位置決めするための位置決めコマンドを送信することと、最小実行可能領域内の標的物体を掴むための把持コマンドを送信することと、移動方向、移動距離、および移動タイプに基づいて、ロボットのアームを使用して標的物体を移動させるための移動コマンドを送信することと、１つ以上の物体の補足的な画像情報を取得することと、補足的な画像情報に基づいて、標的物体の推定寸法を算出することと、を含み、位置決めコマンド、把持コマンド、および移動コマンドのうちの少なくとも１つが、ロボットのアームが１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている。

実施形態１７は、標的開放角の最小実行可能領域を規定することが、標的開放角に対向する交差角を規定することと、標的物体の物理的エッジを識別することと、交差角から第１の方向に延在する第１の候補エッジを規定することと、交差角から、第１の方向と実質的に垂直である第２の方向に延在する第２の候補エッジを規定することと、を含む、実施形態１６に記載の方法システムである。

実施形態１８は、補足的な画像情報に基づいて、標的物体と標的物体に隣接する物体との間の少なくとも１つのギャップを検出することと、初期情報から標的物体の第１の物理的エッジを識別することと、少なくとも１つのギャップに基づいて、標的物体の第２の物理的エッジを識別することと、をさらに含み、標的物体の推定寸法を算出することは、第１の物理的エッジおよび第２の物理的エッジに従って行われる、実施形態１６に記載の方法である。

実施形態１９は、補足的な画像情報を取得することが、移動コマンドの実行によって引き起こされたロボットアームの移動中に実施され、方法が、移動コマンドの実行によって引き起こされたロボットアームの移動中の匹敵する移動に従って、標的物体の物理的エッジを識別することをさらに含む、実施形態１６に記載の方法である。

実施形態２０は、少なくとも１つの処理回路による実行のための命令を含む非一時的コンピュータ可読媒体である。少なくとも１つの処理回路が、視野を有するカメラと通信し、かつ１つ以上の物体が視野内にある、またはあったときに、命令を行うように構成されており、命令が、１つ以上の物体の初期画像情報を取得することであって、初期画像情報が、カメラによって生成されることと、初期画像情報に基づいて、１つ以上の物体の複数の角を検出することと、複数の角から標的物体の標的開放角を識別することと、標的物体の最小実行可能領域（ＭＶＲ）を規定することと、最小実行可能領域に基づいて、非遮蔽面積を規定することと、ロボットのアームを位置決めするための位置決めコマンドを送信することと、最小実行可能領域内の標的物体を掴むための把持コマンドを送信することと、移動方向、移動距離、および移動タイプに基づいて、ロボットのアームを使用して標的物体を移動させるための移動コマンドを送信することと、１つ以上の物体の補足的な画像情報を取得することと、補足的な画像情報に基づいて、標的物体の推定寸法を算出することと、を行うように構成されており、位置決めコマンド、把持コマンド、および移動コマンドのうちの少なくとも１つが、ロボットのアームが１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている。

Claims

少なくとも１つの処理回路を備え、
前記少なくとも１つの処理回路は、アームおよび前記アームに接続されたエンドエフェクターを有するロボット、および前記ロボットの前記アームから離れて１つ以上の物体の上方に配設された、視野を有するカメラと通信し、前記視野内に前記１つ以上の物体がある、またはあったときに、非一時的コンピュータ可読媒体に記憶されている命令を実行するものであり、
前記命令は、
前記カメラによって生成される、１つ以上の物体の初期画像情報を取得することと、
前記初期画像情報に基づいて、前記１つ以上の物体の複数の角を検出することと、
前記複数の角から標的物体の標的開放角を識別することと、
前記標的物体の最小実行可能領域（ＭＶＲ）を規定することと、
前記最小実行可能領域に基づいて、非遮蔽面積を規定することと、
前記ロボットの前記アームを位置決めするための位置決めコマンドを送信することと、
前記最小実行可能領域内の前記標的物体を掴むための把持コマンドを送信することと、
移動方向、移動距離、および移動タイプに基づいて、前記ロボットの前記アームを使用して前記標的物体を移動させるための移動コマンドを送信することと、
前記１つ以上の物体の補足的な画像情報を取得することと、
前記補足的な画像情報に基づいて、前記標的物体の推定寸法を算出することと、
を行うためのものであり、
前記非遮蔽面積は、前記標的物体の物理的エッジの少なくとも一部分、前記最小実行可能領域の第１の候補エッジの少なくとも一部分、及び、前記最小実行可能領域の第２の候補エッジの少なくとも一部分、の少なくとも一つを含み、
前記位置決めコマンド、前記把持コマンド、および前記移動コマンドのうちの少なくとも１つは、前記ロボットの前記アームが前記１つ以上の物体の前記非遮蔽面積を遮断するのを防止するように構成されている、計算システム。
前記推定寸法によって規定された面積が前記最小実行可能領域と比較して許容誤差の閾値を超える場合に、前記少なくとも１つの処理回路は、前記ロボットの前記エンドエフェクターに前記標的物体を解放させるための解放コマンドを送信するようにさらに構成されている、請求項１に記載の計算システム。
前記少なくとも１つの処理回路は、前記ロボットの前記エンドエフェクターが前記推定寸法内の前記標的物体を掴むための再把持コマンドを送信するようにさらに構成されている、請求項２に記載の計算システム。
前記推定寸法が前記最小実行可能領域と比較して許容誤差の閾値内にある場合に、前記少なくとも１つの処理回路は、前記標的物体を搬送するために、前記ロボットの前記アームに搬送コマンドを送信するようにさらに構成されている、請求項１に記載の計算システム。
前記標的開放角の前記最小実行可能領域を規定することは、前記標的開放角に対向する交差角を規定することを含む、請求項１に記載の計算システム。
前記最小実行可能領域を規定することは、前記標的物体の前記物理的エッジを識別することをさらに含む、請求項５に記載の計算システム。
前記標的開放角の前記最小実行可能領域を規定することは、前記交差角から第１の方向に延在する前記第１の候補エッジを規定することと、前記交差角から、前記第１の方向と実質的に垂直である第２の方向に延在する前記第２の候補エッジを規定することと、を含む、請求項６に記載の計算システム。
前記非遮蔽面積は、前記交差角と、前記第１の候補エッジおよび前記第２の候補エッジの少なくとも一部分と、を有するストリップを含む、請求項７に記載の計算システム。
前記少なくとも１つの処理回路は、前記位置決めコマンド、前記把持コマンド、および前記移動コマンドを送信するようにさらに構成されており、その結果、前記補足的な画像情報が取得されている間、前記ロボットの前記アームが前記非遮蔽面積を遮断しない、請求項１に記載の計算システム。
前記少なくとも１つの処理回路は、前記補足的な画像情報に基づいて、前記標的物体と前記標的物体に隣接する物体との間の少なくとも１つのギャップを検出するようにさらに構成されている、請求項１に記載の計算システム。
前記初期画像情報から前記標的物体の第１の物理的エッジを識別することと、
前記少なくとも１つのギャップに基づいて、前記標的物体の第２の物理的エッジを識別することと、をさらに含み、
前記標的物体の前記推定寸法を算出することは、前記第１の物理的エッジおよび前記第２の物理的エッジに従って行われる、請求項１０に記載の計算システム。
前記移動距離および前記移動方向は、前記標的物体に隣接する前記物体との衝突を回避することに基づいて決定される、請求項１に記載の計算システム。
前記補足的な画像情報を取得することは、前記移動コマンドの実行によって引き起こされた前記ロボットの前記アームの移動中に実施される、請求項１に記載の計算システム。
前記少なくとも１つの処理回路は、前記移動コマンドの実行によって引き起こされた前記ロボットの前記アームの移動中の匹敵する移動に従って、前記標的物体の物理的エッジを識別するようにさらに構成されている、請求項１３に記載の計算システム。
前記少なくとも１つの処理回路は、前記ＭＶＲと前記標的物体の最大候補サイズとの比較に基づいて、持ち上げ移動または引きずり移動として前記移動タイプを決定するようにさらに構成されている、請求項１に記載の計算システム。
非一時的コンピュータ可読媒体、及び、少なくとも１つの処理回路を備える、ロボットシステムを制御する方法であって、
前記少なくとも１つの処理回路が、アームを有するロボット、および前記ロボットの前記アームから離れて１つ以上の物体の上方に配設された、視野を有するカメラと通信し、かつ、命令を実行するように構成されており、
当該方法が、
前記カメラによって生成される、１つ以上の物体の初期画像情報を取得することと、
前記初期画像情報に基づいて、前記１つ以上の物体の複数の角を検出することと、
前記複数の角から標的物体の標的開放角を識別することと、
前記標的物体の最小実行可能領域（ＭＶＲ）を規定することと、
前記最小実行可能領域に基づいて、非遮蔽面積を規定することと、
前記ロボットの前記アームを位置決めするための位置決めコマンドを送信することと、
前記最小実行可能領域内の前記標的物体を掴むための把持コマンドを送信することと、
移動方向、移動距離、および移動タイプに基づいて、前記ロボットの前記アームを使用して前記標的物体を移動させるための移動コマンドを送信することと、
前記１つ以上の物体の補足的な画像情報を取得することと、
前記補足的な画像情報に基づいて、前記標的物体の推定寸法を算出することと、を含み、
前記非遮蔽面積は、前記標的物体の物理的エッジの少なくとも一部分、前記最小実行可能領域の第１の候補エッジの少なくとも一部分、及び、前記最小実行可能領域の第２の候補エッジの少なくとも一部分、の少なくとも一つを含み、
前記位置決めコマンド、前記把持コマンド、および前記移動コマンドのうちの少なくとも１つは、前記ロボットの前記アームが前記１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている、方法。
前記標的開放角の前記最小実行可能領域を規定することは、
前記標的開放角に対向する交差角を規定することと、
前記標的物体の前記物理的エッジを識別することと、
前記交差角から第１の方向に延在する前記第１の候補エッジを規定することと、
前記交差角から、前記第１の方向と実質的に垂直である前記第２の方向に延在する第２の候補エッジを規定することと、を含む、請求項１６に記載の方法。
前記補足的な画像情報に基づいて、前記標的物体と前記標的物体に隣接する物体との間の少なくとも１つのギャップを検出することと、
前記初期画像情報から前記標的物体の第１の物理的エッジを識別することと、
前記少なくとも１つのギャップに基づいて、前記標的物体の第２の物理的エッジを識別することと、をさらに含み、
前記標的物体の前記推定寸法を算出することは、前記第１の物理的エッジおよび前記第２の物理的エッジに従って行われる、請求項１６に記載の方法。
前記補足的な画像情報を取得することは、前記移動コマンドの実行によって引き起こされた前記ロボットの前記アームの移動中に実施され、
前記方法は、前記移動コマンドの実行によって引き起こされた前記ロボットの前記アームの移動中の匹敵する移動に従って、前記標的物体の物理的エッジを識別することをさらに含む、請求項１６に記載の方法。
少なくとも１つの処理回路による実行のための命令を含む非一時的コンピュータ可読媒体であって、
前記少なくとも１つの処理回路は、アームを有するロボット、および前記ロボットの前記アームから離れて１つ以上の物体の上方に配設された、視野を有するカメラと通信し、
前記命令は、
前記カメラによって生成される、１つ以上の物体の初期画像情報を取得することと、
前記初期画像情報に基づいて、前記１つ以上の物体の複数の角を検出することと、
前記複数の角から標的物体の標的開放角を識別することと、
前記標的物体の最小実行可能領域（ＭＶＲ）を規定することと、
前記最小実行可能領域に基づいて、非遮蔽面積を規定することと、
前記ロボットの前記アームを位置決めするための位置決めコマンドを送信することと、
前記最小実行可能領域内の前記標的物体を掴むための把持コマンドを送信することと、
移動方向、移動距離、および移動タイプに基づいて、前記ロボットの前記アームを使用して前記標的物体を移動させるための移動コマンドを送信することと、
前記１つ以上の物体の補足的な画像情報を取得することと、
前記補足的な画像情報に基づいて、前記標的物体の推定寸法を算出することと、
を行うために構成されており、
前記非遮蔽面積は、前記標的物体の物理的エッジの少なくとも一部分、前記最小実行可能領域の第１の候補エッジの少なくとも一部分、及び、前記最小実行可能領域の第２の候補エッジの少なくとも一部分、の少なくとも一つを含み、
前記位置決めコマンド、前記把持コマンド、および前記移動コマンドのうちの少なくとも１つは、前記ロボットの前記アームが前記１つ以上の物体の非遮蔽面積を遮断するのを防止するように構成されている、非一時的コンピュータ可読媒体。