JP7458405B2 - 部分的視覚情報に基づく対象物寸法付けのためのシステムと方法 - Google Patents
部分的視覚情報に基づく対象物寸法付けのためのシステムと方法 Download PDFInfo
- Publication number
- JP7458405B2 JP7458405B2 JP2021535808A JP2021535808A JP7458405B2 JP 7458405 B2 JP7458405 B2 JP 7458405B2 JP 2021535808 A JP2021535808 A JP 2021535808A JP 2021535808 A JP2021535808 A JP 2021535808A JP 7458405 B2 JP7458405 B2 JP 7458405B2
- Authority
- JP
- Japan
- Prior art keywords
- dimensional model
- objects
- partial
- model
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 120
- 230000000007 visual effect Effects 0.000 title claims description 42
- 238000013527 convolutional neural network Methods 0.000 claims description 56
- 239000013598 vector Substances 0.000 claims description 51
- 230000011218 segmentation Effects 0.000 claims description 27
- 238000011176 pooling Methods 0.000 claims description 11
- 238000009877 rendering Methods 0.000 claims description 6
- 238000013213 extrapolation Methods 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 14
- 238000005259 measurement Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 238000013459 approach Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000005286 illumination Methods 0.000 description 7
- 238000003909 pattern recognition Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 239000003599 detergent Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000005484 gravity Effects 0.000 description 4
- 235000013361 beverage Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 229910044991 metal oxide Inorganic materials 0.000 description 3
- 150000004706 metal oxides Chemical class 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004513 sizing Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 102100033620 Calponin-1 Human genes 0.000 description 2
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 2
- 101000945318 Homo sapiens Calponin-1 Proteins 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101100118004 Arabidopsis thaliana EBP1 gene Proteins 0.000 description 1
- 101150052583 CALM1 gene Proteins 0.000 description 1
- 102100025580 Calmodulin-1 Human genes 0.000 description 1
- 102100025579 Calmodulin-2 Human genes 0.000 description 1
- 102100033591 Calponin-2 Human genes 0.000 description 1
- 101100459256 Cyprinus carpio myca gene Proteins 0.000 description 1
- 101001077352 Homo sapiens Calcium/calmodulin-dependent protein kinase type II subunit beta Proteins 0.000 description 1
- 101000945403 Homo sapiens Calponin-2 Proteins 0.000 description 1
- 101000863856 Homo sapiens Shiftless antiviral inhibitor of ribosomal frameshifting protein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 101150091339 cam-1 gene Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010413 gardening Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000013068 supply chain management Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/40—Scaling the whole image or part thereof
- G06T3/4046—Scaling the whole image or part thereof using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10012—Stereo images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/12—Bounding box
Description
本出願は、2018年12月20日に米国特許商標庁において出願された米国仮特許出願第62/783141号の利益を主張するものであり、その開示全体は、ここにおいて参照により組み込まれる。
[態様1]
ぴったり取り囲むバウンディングボックスを推定するための方法であって、
コンピューティングシステムにより、1つ又は複数の対象物を含むシーンの視覚情報を取り込むための1台以上の深度カメラを備えている走査システムを制御することと、
前記コンピューティングシステムにより、前記視覚情報に基づいて、前記シーンの前記1つ又は複数の対象物を検出することと、
前記コンピューティングシステムにより、前記1つ又は複数の対象物に対応する、前記1つ又は複数の対象物の対応する1つの部分的三次元モデルを備えている、1つ又は複数の三次元モデルを生成するために、前記シーンのフレームから前記1つ又は複数の対象物のそれぞれを単一化することと、
前記コンピューティングシステムにより、前記部分的三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのより完全な三次元モデルを外挿することと、
前記コンピューティングシステムにより、前記より完全な三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのぴったり取り囲むバウンディングボックスを推定することを備える方法。
[態様2]
前記走査システムは更に、前記1台以上の深度カメラとは別個の1台以上のカラーカメラを備えていることを備える態様1の方法。
[態様3]
前記1台以上の深度カメラは、
飛行時間型深度カメラと、
構造化光深度カメラと、
少なくとも2台のカラーカメラを備えているステレオ深度カメラ、
少なくとも2台のカラーカメラとカラープロジェクタを備えているステレオ深度カメラ、
少なくとも2台の赤外線カメラを備えているステレオ深度カメラ、または
カラーカメラ、複数の赤外線カメラ、および前記複数の赤外線カメラにより検出可能な波長区間における光を出射するように構成されている赤外線プロジェクタを備えているステレオ深度カメラを備える態様1の方法。
[態様4]
前記シーンにおける前記1つ又は複数の対象物を前記検出することは、前記視覚情報において、背景および基平面を示すものから前記1つ又は複数の対象物を切り離すことを備える態様1の方法。
[態様5]
生成された三次元モデルを備えている前記より完全な三次元モデルを前記外挿することは、入力された部分的三次元モデルに基づいて、前記生成された三次元モデルを予測するように訓練されている生成モデルに、前記部分的三次元モデルを供給することを備える態様1の方法。
[態様6]
前記生成モデルは、条件付き敵対的生成ネットワークを備える態様5の方法。
[態様7]
前記より完全な三次元モデルを前記外挿することは、前記部分的三次元モデルと一致するモデルを、三次元モデルの一覧表から検索し、前記部分的三次元モデルと一致する前記モデルを、前記より完全な三次元モデルとして出力することを備える態様1の方法。
[態様8]
前記一覧表の前記三次元モデルのそれぞれは、特徴空間における対応する記述子と関連付けられており、
前記三次元モデルの一覧表を前記検索することは、
前記部分的三次元モデルを、畳み込みニューラルネットワークを備えている特徴記述子に供給することにより、前記部分的三次元モデルの記述子を抽出することと、
前記部分的三次元モデルの前記記述子と、前記一覧表の前記三次元モデルの前記記述子との間の最も高い類似性に従って、前記部分的三次元モデルと一致する前記モデルを識別することを備える態様7の方法。
[態様9]
前記部分的三次元モデルの前記記述子を前記抽出することは、
前記三次元モデルの周りのバウンディングボックスを定義することと、
複数のボクセルを計算するために前記部分的三次元モデルをボクセル化することと、
前記ボクセルを前記畳み込みニューラルネットワークに供給することを備える態様8の方法。
[態様10]
前記部分的三次元モデルの前記記述子を前記抽出することは、
前記部分的三次元モデルの複数の二次元ビューをレンダリングすることと、
前記複数の二次元ビューを第1段階畳み込みニューラルネットワークに供給することにより、前記部分的三次元モデルの前記二次元ビューから特徴ベクトルを抽出することと、
前記記述子を生成するために前記特徴ベクトルを組み合わせることを備える態様8の方法。
[態様11]
前記特徴ベクトルは、最大プーリングを使用して組み合わされる態様10の方法。
[態様12]
前記完全三次元モデルを前記外挿することは、
一致分類を計算するために前記部分的三次元モデルを分類することと、
前記一致分類に対するより完全な三次元モデルを生成するための1つ又は複数の発見的方法ルールをロードすることと、
前記1つ又は複数の発見的方法ルールに従って、前記部分的三次元モデルから前記より完全な三次元モデルを生成することを備える態様1の方法。
[態様13]
前記1つ又は複数の発見的方法ルールは、前記一致分類に基づく前記より完全な三次元モデルの1つ又は複数の仮定された対称軸、または、前記一致分類に基づく前記より完全な三次元モデルの標準全体形状を備える態様12の方法。
[態様14]
前記1つ又は複数の対象物は複数の対象物を備えており、
前記1つ又は複数の対象物のそれぞれを、前記シーンの前記フレームから前記単一化することは、外観に基づくセグメンテーションを前記視覚情報に適用することにより前記複数の対象物を単一化することを備える態様1の方法。
[態様15]
前記1つ又は複数の対象物は複数の対象物を備えており、
前記1つ又は複数の対象物のそれぞれを、前記シーンの前記フレームから前記単一化することは、セマンティックセグメンテーションを前記視覚情報に適用することにより前記複数の対象物を単一化することを備える態様1の方法。
[態様16]
セマンティックセグメンテーションを前記適用することは、セグメンテーションマップを計算するために、前記視覚情報を、訓練された完全畳み込みニューラルネットワークに供給することを備えており、
各部分的三次元モデルは、前記セグメンテーションマップの1つのセグメントに対応していることを特徴とする態様15の方法。
[態様17]
前記ぴったり取り囲むバウンディングボックスを、アイテム記述子と関連付けることを更に備える態様1の方法。
[態様18]
ぴったり取り囲むバウンディングボックスを推定するためのシステムであって、
1台以上の深度カメラを備えている走査システムと、
前記走査システムを制御するように構成されているプロセッサと、
命令を格納しているメモリを備えており、前記命令は、前記プロセッサにより実行されると、前記プロセッサに、
1つ又は複数の対象物を含むシーンの視覚情報を取り込むように前記1台以上の深度カメラを制御させ、
前記視覚情報に基づいて、前記シーンの前記1つ又は複数の対象物を検出させ、
前記1つ又は複数の対象物に対応する、前記1つ又は複数の対象物の対応する1つの部分的三次元モデルを備えている、1つ又は複数の三次元モデルを生成するために、前記シーンの前記フレームから前記1つ又は複数の対象物のそれぞれを単一化させ、
前記部分的三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのより完全な三次元モデルを外挿させ、
前記より完全な三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのぴったり取り囲むバウンディングボックスを推定させるシステム。
[態様19]
生成された三次元モデルを備えている前記より完全な三次元モデルを外挿させる前記命令は、前記プロセッサにより実行されると、前記プロセッサに、入力された部分的三次元モデルに基づいて、前記生成された三次元モデルを予測するように訓練されている生成モデルに、前記部分的三次元モデルを供給させる命令を備える態様18のシステム。
[態様20]
前記生成モデルは、条件付き敵対的生成ネットワークを備える態様19のシステム。
[態様21]
前記より完全な三次元モデルを外挿させる前記命令は、前記プロセッサにより実行されると、前記プロセッサに、前記部分的三次元モデルと一致するモデルを、三次元モデルの一覧表から検索させ、前記部分的三次元モデルと一致する前記モデルを、前記より完全な三次元モデルとして出力させる命令を備える態様18のシステム。
Claims (19)
- ぴったり取り囲むバウンディングボックスを推定するための方法であって、
コンピューティングシステムにより、1つ又は複数の対象物を含むシーンの視覚情報を取り込むための1台以上の深度カメラを備えている走査システムを制御することと、
前記コンピューティングシステムにより、前記視覚情報に基づいて、前記シーンの前記1つ又は複数の対象物を検出することと、
前記コンピューティングシステムにより、前記1つ又は複数の対象物に対応する、前記1つ又は複数の対象物の対応する1つの部分的三次元モデルを備えている、1つ又は複数の三次元モデルを生成するために、前記シーンのフレームから前記1つ又は複数の対象物のそれぞれを単一化することと、
前記コンピューティングシステムにより、前記部分的三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのより完全な三次元モデルを外挿することと、
前記コンピューティングシステムにより、前記より完全な三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのぴったり取り囲むバウンディングボックスを推定することを備え、
前記より完全な三次元モデルを前記外挿することは、前記部分的三次元モデルと一致するモデルを、三次元モデルの一覧表から検索し、前記部分的三次元モデルと一致する前記モデルを、前記より完全な三次元モデルとして出力することを備える方法。 - 前記走査システムは更に、前記1台以上の深度カメラとは別個の1台以上のカラーカメラを備えていることを備える請求項1の方法。
- 前記1台以上の深度カメラは、
飛行時間型深度カメラと、
構造化光深度カメラと、
少なくとも2台のカラーカメラを備えているステレオ深度カメラ、
少なくとも2台のカラーカメラとカラープロジェクタを備えているステレオ深度カメラ、
少なくとも2台の赤外線カメラを備えているステレオ深度カメラ、または
カラーカメラ、複数の赤外線カメラ、および前記複数の赤外線カメラにより検出可能な波長区間における光を出射するように構成されている赤外線プロジェクタを備えているステレオ深度カメラを備える請求項1の方法。 - 前記シーンにおける前記1つ又は複数の対象物を前記検出することは、前記視覚情報において、背景および基平面を示すものから前記1つ又は複数の対象物を切り離すことを備える請求項1の方法。
- 生成された三次元モデルを備えている前記より完全な三次元モデルを前記外挿することは、入力された部分的三次元モデルに基づいて、前記生成された三次元モデルを予測するように訓練されている生成モデルに、前記部分的三次元モデルを供給することを備える請求項1の方法。
- 前記生成モデルは、条件付き敵対的生成ネットワークを備える請求項5の方法。
- 前記一覧表の前記三次元モデルのそれぞれは、特徴空間における対応する記述子と関連付けられており、
前記三次元モデルの一覧表を前記検索することは、
前記部分的三次元モデルを、畳み込みニューラルネットワークを備えている特徴記述子に供給することにより、前記部分的三次元モデルの記述子を抽出することと、
前記部分的三次元モデルの前記記述子と、前記一覧表の前記三次元モデルの前記記述子との間の最も高い類似性に従って、前記部分的三次元モデルと一致する前記モデルを識別することを備える請求項1の方法。 - 前記部分的三次元モデルの前記記述子を前記抽出することは、
前記三次元モデルの周りのバウンディングボックスを定義することと、
複数のボクセルを計算するために前記部分的三次元モデルをボクセル化することと、
前記ボクセルを前記畳み込みニューラルネットワークに供給することを備える請求項7の方法。 - 前記部分的三次元モデルの前記記述子を前記抽出することは、
前記部分的三次元モデルの複数の二次元ビューをレンダリングすることと、
前記複数の二次元ビューを第1段階畳み込みニューラルネットワークに供給することにより、前記部分的三次元モデルの前記二次元ビューから特徴ベクトルを抽出することと、
前記記述子を生成するために前記特徴ベクトルを組み合わせることを備える請求項7の方法。 - 前記特徴ベクトルは、最大プーリングを使用して組み合わされる請求項9の方法。
- 前記より完全な三次元モデルを前記外挿することは、
一致分類を計算するために前記部分的三次元モデルを分類することと、
前記一致分類に対するより完全な三次元モデルを生成するための1つ又は複数の発見的方法ルールをロードすることと、
前記1つ又は複数の発見的方法ルールに従って、前記部分的三次元モデルから前記より完全な三次元モデルを生成することを備える請求項1の方法。 - 前記1つ又は複数の発見的方法ルールは、前記一致分類に基づく前記より完全な三次元モデルの1つ又は複数の仮定された対称軸、または、前記一致分類に基づく前記より完全な三次元モデルの標準全体形状を備える請求項11の方法。
- 前記1つ又は複数の対象物は複数の対象物を備えており、
前記1つ又は複数の対象物のそれぞれを、前記シーンの前記フレームから前記単一化することは、外観に基づくセグメンテーションを前記視覚情報に適用することにより前記複数の対象物を単一化することを備える請求項1の方法。 - 前記1つ又は複数の対象物は複数の対象物を備えており、
前記1つ又は複数の対象物のそれぞれを、前記シーンの前記フレームから前記単一化することは、セマンティックセグメンテーションを前記視覚情報に適用することにより前記複数の対象物を単一化することを備える請求項1の方法。 - セマンティックセグメンテーションを前記適用することは、セグメンテーションマップを計算するために、前記視覚情報を、訓練された完全畳み込みニューラルネットワークに供給することを備えており、
各部分的三次元モデルは、前記セグメンテーションマップの1つのセグメントに対応していることを特徴とする請求項14の方法。 - 前記ぴったり取り囲むバウンディングボックスを、アイテム記述子と関連付けることを更に備える請求項1の方法。
- ぴったり取り囲むバウンディングボックスを推定するためのシステムであって、
1台以上の深度カメラを備えている走査システムと、
前記走査システムを制御するように構成されているプロセッサと、
命令を格納しているメモリを備えており、前記命令は、前記プロセッサにより実行されると、前記プロセッサに、
1つ又は複数の対象物を含むシーンの視覚情報を取り込むように前記1台以上の深度カメラを制御させ、
前記視覚情報に基づいて、前記シーンの前記1つ又は複数の対象物を検出させ、
前記1つ又は複数の対象物に対応する、前記1つ又は複数の対象物の対応する1つの部分的三次元モデルを備えている、1つ又は複数の三次元モデルを生成するために、前記シーンの前記フレームから前記1つ又は複数の対象物のそれぞれを単一化させ、
前記部分的三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのより完全な三次元モデルを外挿させ、
前記より完全な三次元モデルに基づいて、前記1つ又は複数の対象物の前記対応する1つのぴったり取り囲むバウンディングボックスを推定させ、
前記より完全な三次元モデルを外挿させる前記命令は、前記プロセッサにより実行されると、前記プロセッサに、前記部分的三次元モデルと一致するモデルを、三次元モデルの一覧表から検索させ、前記部分的三次元モデルと一致する前記モデルを、前記より完全な三次元モデルとして出力させる命令を備える、
システム。 - 生成された三次元モデルを備えている前記より完全な三次元モデルを外挿させる前記命令は、前記プロセッサにより実行されると、前記プロセッサに、入力された部分的三次元モデルに基づいて、前記生成された三次元モデルを予測するように訓練されている生成モデルに、前記部分的三次元モデルを供給させる命令を備える請求項17のシステム。
- 前記生成モデルは、条件付き敵対的生成ネットワークを備える請求項18のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862783141P | 2018-12-20 | 2018-12-20 | |
US62/783,141 | 2018-12-20 | ||
PCT/US2019/068144 WO2020132627A1 (en) | 2018-12-20 | 2019-12-20 | Systems and methods for object dimensioning based on partial visual information |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022514757A JP2022514757A (ja) | 2022-02-15 |
JP7458405B2 true JP7458405B2 (ja) | 2024-03-29 |
Family
ID=71102033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021535808A Active JP7458405B2 (ja) | 2018-12-20 | 2019-12-20 | 部分的視覚情報に基づく対象物寸法付けのためのシステムと方法 |
Country Status (5)
Country | Link |
---|---|
US (3) | US11481885B2 (ja) |
EP (1) | EP3899874A4 (ja) |
JP (1) | JP7458405B2 (ja) |
CN (1) | CN113498530A (ja) |
WO (1) | WO2020132627A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102017219806A1 (de) * | 2017-11-08 | 2019-05-09 | BSH Hausgeräte GmbH | Handscanner zur verbesserten Fleckenerkennung, System mit einem solchen Handscanner und Verfahren zu seinem Betrieb |
US20200137380A1 (en) * | 2018-10-31 | 2020-04-30 | Intel Corporation | Multi-plane display image synthesis mechanism |
CN113498530A (zh) | 2018-12-20 | 2021-10-12 | 艾奎菲股份有限公司 | 基于局部视觉信息的对象尺寸标注系统和方法 |
CN109993825B (zh) * | 2019-03-11 | 2023-06-20 | 北京工业大学 | 一种基于深度学习的三维重建方法 |
US11600049B2 (en) * | 2019-04-24 | 2023-03-07 | Magic Leap, Inc. | Perimeter estimation from posed monocular video |
US11468276B2 (en) * | 2020-04-16 | 2022-10-11 | Robert Bosch Gmbh | System and method of a monotone operator neural network |
EP3944192A1 (en) * | 2020-07-22 | 2022-01-26 | Dassault Systèmes | Method for 3d scanning of a real object |
IL305918A (en) * | 2021-03-15 | 2023-11-01 | Ortelligence Inc | Systems and methods for dynamic identification of a surgical tray and the items contained therein |
EP4071699A1 (en) * | 2021-04-08 | 2022-10-12 | Inter IKEA Systems B.V. | A method for determining one or more storage boxes for storing objects |
CN113297691B (zh) * | 2021-04-30 | 2022-04-08 | 成都飞机工业(集团)有限责任公司 | 一种基于平面遍历的最小包围盒尺寸求解方法 |
WO2022266101A1 (en) * | 2021-06-14 | 2022-12-22 | The Johns Hopkins University | Systems, methods, and computer programs for using a network of machine learning models to detect an image depicting an object of interest which can be partially occluded by another object |
JP7190147B1 (ja) | 2022-02-02 | 2022-12-15 | 株式会社アストライアーソフトウエア | 3次元形状記述子抽出器の製造方法、3次元形状検索方法及び3次元形状検索システム |
JP2023128662A (ja) * | 2022-03-04 | 2023-09-14 | 株式会社野村総合研究所 | 計測システム |
CN114895832B (zh) * | 2022-05-17 | 2023-08-08 | 网易(杭州)网络有限公司 | 对象的调整方法、装置、电子设备及计算机可读介质 |
CN116797787B (zh) * | 2023-05-22 | 2024-01-02 | 中国地质大学(武汉) | 基于跨模态融合与图神经网络的遥感影像语义分割方法 |
CN116740060B (zh) * | 2023-08-11 | 2023-10-20 | 安徽大学绿色产业创新研究院 | 基于点云几何特征提取的装配式预制构件尺寸检测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160196659A1 (en) | 2015-01-05 | 2016-07-07 | Qualcomm Incorporated | 3d object segmentation |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050276443A1 (en) * | 2004-05-28 | 2005-12-15 | Slamani Mohamed A | Method and apparatus for recognizing an object within an image |
EP1766552A2 (en) * | 2004-06-23 | 2007-03-28 | Strider Labs, Inc. | System and method for 3d object recognition using range and intensity |
WO2012012943A1 (en) * | 2010-07-28 | 2012-02-02 | Shenzhen Institute Of Advanced Technology Chinese Academy Of Sciences | Method for reconstruction of urban scenes |
US8587583B2 (en) * | 2011-01-31 | 2013-11-19 | Microsoft Corporation | Three-dimensional environment reconstruction |
WO2013162735A1 (en) * | 2012-04-25 | 2013-10-31 | University Of Southern California | 3d body modeling from one or more depth cameras in the presence of articulated motion |
US20140172377A1 (en) * | 2012-09-20 | 2014-06-19 | Brown University | Method to reconstruct a surface from oriented 3-d points |
US10733798B2 (en) * | 2013-03-14 | 2020-08-04 | Qualcomm Incorporated | In situ creation of planar natural feature targets |
US9715761B2 (en) * | 2013-07-08 | 2017-07-25 | Vangogh Imaging, Inc. | Real-time 3D computer vision processing engine for object recognition, reconstruction, and analysis |
US9392262B2 (en) | 2014-03-07 | 2016-07-12 | Aquifi, Inc. | System and method for 3D reconstruction using multiple multi-channel cameras |
EP2933779A1 (en) * | 2014-04-15 | 2015-10-21 | Alcatel Lucent | Capturing an environment with objects |
US9436987B2 (en) * | 2014-04-30 | 2016-09-06 | Seiko Epson Corporation | Geodesic distance based primitive segmentation and fitting for 3D modeling of non-rigid objects from 2D images |
US9245196B2 (en) * | 2014-05-09 | 2016-01-26 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for tracking people in indoor environments using a visible light camera and a low-frame-rate infrared sensor |
US9589362B2 (en) * | 2014-07-01 | 2017-03-07 | Qualcomm Incorporated | System and method of three-dimensional model generation |
US9600892B2 (en) * | 2014-11-06 | 2017-03-21 | Symbol Technologies, Llc | Non-parametric method of and system for estimating dimensions of objects of arbitrary shape |
US9911242B2 (en) * | 2015-05-14 | 2018-03-06 | Qualcomm Incorporated | Three-dimensional model generation |
US10304203B2 (en) * | 2015-05-14 | 2019-05-28 | Qualcomm Incorporated | Three-dimensional model generation |
US10452789B2 (en) * | 2015-11-30 | 2019-10-22 | Intel Corporation | Efficient packing of objects |
US9904867B2 (en) * | 2016-01-29 | 2018-02-27 | Pointivo, Inc. | Systems and methods for extracting information about objects from scene information |
EP3422955B1 (en) * | 2016-02-29 | 2023-10-18 | Packsize International, LLC | System and method for assisted 3d scanning |
CN106251396B (zh) * | 2016-07-29 | 2021-08-13 | 迈吉客科技(北京)有限公司 | 三维模型的实时控制方法和系统 |
WO2018067978A1 (en) * | 2016-10-08 | 2018-04-12 | Purdue Research Foundation | Method and apparatus for generating two-dimensional image data describing a three-dimensional image |
IL297846B2 (en) | 2016-11-15 | 2023-12-01 | Magic Leap Inc | A deep learning system for discovering a cube |
US10354411B2 (en) * | 2016-12-20 | 2019-07-16 | Symbol Technologies, Llc | Methods, systems and apparatus for segmenting objects |
EP3566193A4 (en) * | 2017-01-04 | 2020-08-26 | Aquifi, Inc. | SYSTEMS AND METHODS FOR SHAPE-BASED OBJECT RECOVERY |
US10430641B2 (en) * | 2017-03-08 | 2019-10-01 | GM Global Technology Operations LLC | Methods and systems for object tracking using bounding boxes |
US10699421B1 (en) * | 2017-03-29 | 2020-06-30 | Amazon Technologies, Inc. | Tracking objects in three-dimensional space using calibrated visual cameras and depth cameras |
WO2019075276A1 (en) * | 2017-10-11 | 2019-04-18 | Aquifi, Inc. | SYSTEMS AND METHODS FOR IDENTIFYING OBJECT |
US20210183097A1 (en) * | 2017-11-13 | 2021-06-17 | Siemens Aktiengesellschaft | Spare Part Identification Using a Locally Learned 3D Landmark Database |
US10970518B1 (en) * | 2017-11-14 | 2021-04-06 | Apple Inc. | Voxel-based feature learning network |
CN115019015A (zh) * | 2017-12-22 | 2022-09-06 | 奇跃公司 | 密集3d重建数据的缓存和更新 |
US11341350B2 (en) * | 2018-01-05 | 2022-05-24 | Packsize Llc | Systems and methods for volumetric sizing |
US10817752B2 (en) * | 2018-05-31 | 2020-10-27 | Toyota Research Institute, Inc. | Virtually boosted training |
CN113498530A (zh) * | 2018-12-20 | 2021-10-12 | 艾奎菲股份有限公司 | 基于局部视觉信息的对象尺寸标注系统和方法 |
US10825217B2 (en) * | 2019-01-02 | 2020-11-03 | Microsoft Technology Licensing, Llc | Image bounding shape using 3D environment representation |
US10937178B1 (en) * | 2019-05-09 | 2021-03-02 | Zoox, Inc. | Image-based depth data and bounding boxes |
US20220254045A1 (en) * | 2021-02-09 | 2022-08-11 | Everypoint, Inc. | Determining Object Structure Using Physically Mounted Devices With Only Partial View Of Object |
-
2019
- 2019-12-20 CN CN201980092617.1A patent/CN113498530A/zh active Pending
- 2019-12-20 JP JP2021535808A patent/JP7458405B2/ja active Active
- 2019-12-20 US US16/724,029 patent/US11481885B2/en active Active
- 2019-12-20 EP EP19901394.7A patent/EP3899874A4/en active Pending
- 2019-12-20 WO PCT/US2019/068144 patent/WO2020132627A1/en unknown
-
2022
- 2022-09-20 US US17/949,054 patent/US11798152B2/en active Active
-
2023
- 2023-09-06 US US18/462,267 patent/US20230410276A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160196659A1 (en) | 2015-01-05 | 2016-07-07 | Qualcomm Incorporated | 3d object segmentation |
Non-Patent Citations (3)
Title |
---|
Nguyen, Duc Thanh、Hua, Binh-Son、Tran, Minh-Khoi、Pham, Quang-Hieu、Yeung, Sai-Kit,A Field Model for Repairing 3D Shapes,2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016年,p.5676-5684,DOI: 10.1109/CVPR.2016.612 |
Schiebener, David、Schmidt, Andreas、Vahrenkamp, Nikolaus、Asfour, Tamim,Heuristic 3D object shape completion based on symmetry and scene context,2016 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS),2016年,p.74-81,DOI: 10.1109/IROS.2016.7759037 |
Yang, Bo、Rosa, Stefano、Markham, Andrew、Trigoni, Niki、Wen, Hongkai,3D Object Dense Reconstruction from a Single Depth View,IEEE Transactions on Pattern Analysis and Machine Intelligence,2018年02月,DOI: 10.1109/TPAMI.2018.2868195 |
Also Published As
Publication number | Publication date |
---|---|
EP3899874A4 (en) | 2022-09-07 |
WO2020132627A1 (en) | 2020-06-25 |
US11481885B2 (en) | 2022-10-25 |
US11798152B2 (en) | 2023-10-24 |
EP3899874A1 (en) | 2021-10-27 |
US20230131623A1 (en) | 2023-04-27 |
CN113498530A (zh) | 2021-10-12 |
US20230410276A1 (en) | 2023-12-21 |
JP2022514757A (ja) | 2022-02-15 |
US20200372626A1 (en) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7458405B2 (ja) | 部分的視覚情報に基づく対象物寸法付けのためのシステムと方法 | |
US11709046B2 (en) | Systems and methods for volumetric sizing | |
CA3115898C (en) | Systems and methods for object identification | |
US10691979B2 (en) | Systems and methods for shape-based object retrieval | |
US20190096135A1 (en) | Systems and methods for visual inspection based on augmented reality | |
EP3422955B1 (en) | System and method for assisted 3d scanning | |
US10528616B2 (en) | Systems and methods for automatically generating metadata for media documents | |
US11868863B2 (en) | Systems and methods for joint learning of complex visual inspection tasks using computer vision | |
US11720766B2 (en) | Systems and methods for text and barcode reading under perspective distortion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20220929 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221019 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7458405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |