JP6810247B2 - メディアドキュメントのメタデータを自動的に生成するシステム及び方法 - Google Patents
メディアドキュメントのメタデータを自動的に生成するシステム及び方法 Download PDFInfo
- Publication number
- JP6810247B2 JP6810247B2 JP2019507781A JP2019507781A JP6810247B2 JP 6810247 B2 JP6810247 B2 JP 6810247B2 JP 2019507781 A JP2019507781 A JP 2019507781A JP 2019507781 A JP2019507781 A JP 2019507781A JP 6810247 B2 JP6810247 B2 JP 6810247B2
- Authority
- JP
- Japan
- Prior art keywords
- media
- metadata
- model
- feature vector
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 61
- 239000013598 vector Substances 0.000 claims description 174
- 238000013527 convolutional neural network Methods 0.000 claims description 37
- 238000009877 rendering Methods 0.000 claims description 7
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- 230000003287 optical effect Effects 0.000 description 12
- 238000005286 illumination Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000011960 computer-aided design Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229910044991 metal oxide Inorganic materials 0.000 description 2
- 150000004706 metal oxides Chemical class 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 101100118004 Arabidopsis thaliana EBP1 gene Proteins 0.000 description 1
- 101150052583 CALM1 gene Proteins 0.000 description 1
- 102100025580 Calmodulin-1 Human genes 0.000 description 1
- 102100025579 Calmodulin-2 Human genes 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 101100459256 Cyprinus carpio myca gene Proteins 0.000 description 1
- 101001077352 Homo sapiens Calcium/calmodulin-dependent protein kinase type II subunit beta Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 101150091339 cam-1 gene Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Description
一般的には、スキャナシステムは、シーンからデータを収集するカメラのようなセンサを有するハードウェア装置を有する。スキャナシステムは、センサによって収集したデータからシーンの深度画像及び/又は3次元(3D)モデルを生成するコンピュータプロセッサ又は他の処理ハードウェアを有してもよい。
本発明の実施の形態の一態様によれば、3次元(3D)モデルのような一連の既存のメディアドキュメントがデータベースに格納されている。(3Dモデルのような)供給されたメディアドキュメントのメタデータを生成するとき、供給されたメディアドキュメントに類似するメディアドキュメントについてデータベースに対するクエリーが行われ、類似するエントリーが結果として戻される。
本発明の実施の形態の一態様によれば、データベースは、K個の異なる種類に分けられたN個のエントリー(N個のメディアドキュメント)を格納する。エントリーの数(N)は数百万程度であってもよく、種類の数(K)は、数千又は数万程度であってもよい。K個の種類を階層的なツリー状構造に分けてもよく、その一部を表1に示す。
本発明の実施の形態の一態様は、所定の入力メディアドキュメントのメタデータを生成するために所定の入力メディアドキュメントに類似するエントリーの上述したデータベースの検索の実行を対象とする。
本発明の実施の形態の一態様は、アクセスポリシーに従ってデータベースの検索を制限することに関する。例えば、データベースに対してクエリーを行う種々のユーザは、ポリシーに基づいて、ユーザがアクセスすることができるデータベースの一部のみを検索することができる。例えば、5人のユーザ<a1,a2,a3,b1,b2>が存在し、ユーザ<a1,a2,a3>がグループAに属し、ユーザ<b1,b2>がグループBに属し、三つのセットのエントリー(又は三つのセットのメディアドキュメント)<dbA,dbB,dbC>によってデータベースが構成され、dbAは、グループAのメンバーによって見ることができ、dbBは、グループBのメンバーによって見ることができ、dbCは、グループAとグループBの両方のメンバーによって見ることができる場合、ユーザb1は、dbB及びdbCのエントリーのみの検索が許可(許容)され、dbAのエントリーへのアクセスが許可されない(拒否される)(したがって、検索は、dbAのエントリーに対して実行されない。)。したがって、ユーザb1によって行われる検索は、dbB及びdbCのエントリーに限定される。これらのポリシーを、メタデータの異なる欄に異なるように適用することもできる。例えば、ユーザb1は、タグ及びタイトル欄を追加するためにデータベース全体において検索することが許可されるが、テキスト欄を追加するためにdbB及びdbCしか検索することが許可されない。これらのポリシーの適用は、例えば、テキスト及び視覚情報、分類された情報、機密情報及び成人向け又は安全でない資料検索制限のデジタル著作権の行使を含む。
本発明の実施の形態の一態様によれば、クエリーのメディアドキュメント及びそれの自動的に生成したメタデータは、新たなエントリーとしてのデータベースへの挿入の候補を形成し、したがって、別のクエリーのメタデータの検索及び生成に更に用いることができるエントリーとなる。
明瞭のために、本発明の一実施の形態による3次元(3D)モデルをキャプチャするとともにモデルのメタデータを自動的に生成する処理の限定されない例を、図8に関連して以下で説明する。
上述したように、自動的に生成したメタデータを有する3次元(3D)モデルのようなメディアドキュメントのメタデータを自動的に生成するアプリケーションの一例は、電子商取引アプリケーションにおけるものである。特に、販売される製品の3Dモデルを提供することは、ショッピング体験を向上させることができ、その結果、顧客が3D環境内で仮想的に商品を扱うことができるようにすることによる顧客の契約が増加し、これによって、製品のサイズ及び形状の更に実体験のように感じる理解を提供する。さらに、販売される製品の2D画像は、普通であり、購入者によって典型的に予測される。
Claims (20)
- メディアドキュメントのメタデータを自動的に生成する方法であって、
コンピュータによって、畳み込みニューラルネットワークを用いて前記メディアドキュメントの特徴ベクトルを算出することであって、前記メディアドキュメントは、3次元(3D)モデルであり、前記特徴ベクトルを算出することは、
前記コンピュータによって、前記3Dモデルの複数の2次元(2D)ビューをレンダリングするために複数の角度から前記3Dモデルをレンダリングすることと、
前記コンピュータによって、一つ以上の畳み込みニューラルネットワークを用いて、各々が前記3Dモデルの2Dビューの一つに対応する複数の単一ビュー特徴ベクトルを生成することと、
統合された特徴ベクトルを算出するために、前記コンピュータによって、前記2Dビューに対応する前記複数の単一ビュー特徴ベクトルを集約することであって、前記統合された特徴ベクトルは、前記2Dビューの数に依存しない一定の長さを有することと、
前記コンピュータによって、最終段階の畳み込みニューラルネットワークを用いて、前記統合された特徴ベクトルから前記特徴ベクトルを算出することと、
を備えることと、
前記コンピュータによって、前記メディアドキュメントの前記特徴ベクトルに類似する対応する特徴ベクトルを有する一つ以上のマッチングメディアドキュメントの一群のメディアドキュメントを検索することであって、前記一群のメディアドキュメントの各メディアドキュメントがメタデータに関連することと、
前記コンピュータによって、前記一つ以上のマッチングメディアドキュメントに関連するメタデータに基づいて前記メディアドキュメントのメタデータを生成することであって、生成されたメタデータは、前記一つ以上のマッチングメディアドキュメントの数なくとも一つのしきい値のメタデータに出現する前記メタデータの部分を含むことと、
前記コンピュータによって、生成したメタデータに関連して前記メディアドキュメントを表示することと、
を備える方法。 - 前記一群のメディアドキュメントは、一群の2次元(2D)画像を備え、
前記特徴ベクトルを算出することは、前記コンピュータによって、前記3Dモデルの一つ以上の特徴ベクトルを算出することを備え、
前記一つ以上のマッチングメディアドキュメントは、前記一群の2D画像の一つ以上のマッチング2D画像を備え、
前記マッチング2D画像の対応する特徴ベクトルの各々は、前記3Dモデルの一つ以上の特徴ベクトルの少なくとも一つに類似する請求項1に記載の方法。 - 前記コンピュータによって、3次元スキャナを用いて前記3Dモデルをキャプチャすることを更に備え、前記3次元スキャナは、
二つ以上の赤外(IR)カメラと、
一つ以上のIRコリメート照明と、
を備える請求項1に記載の方法。 - 前記コンピュータによって、生成したメタデータの複数の欄の一つ以上の検証を備えるユーザ入力を受け取ることを更に備える請求項1に記載の方法。
- 生成したメタデータ及び前記メディアドキュメントの各々に関連するメタデータはそれぞれ、複数の欄を備え、
前記メタデータを生成することは、
前記コンピュータによって、前記複数の欄の各欄に対して、前記一つ以上のマッチングメディアドキュメントの二つ以上のしきい値のメタデータに出現するデータを識別することと、
前記コンピュータによって、識別したデータを生成したメタデータに追加することと、
を備える請求項1に記載の方法。 - 生成したメタデータは、メディアドキュメントの種類を備え、
前記コンピュータによって、前記メディアドキュメントの種類を算出するために前記メディアドキュメントの特徴ベクトルを分類器に供給することと、
前記コンピュータによって、分類に基づいて前記種類を算出することと、
を備える請求項1に記載の方法。 - 前記コンピュータによって、前記メディアドキュメント及び生成したメタデータメタデータを前記一群のメディアドキュメントに追加することを更に備える請求項1に記載の方法。
- 前記一つ以上のマッチングメディアドキュメントの一つ以上の対応する特徴ベクトルの各々は、多次元空間における前記メディアドキュメントの特徴ベクトルからの対応する距離を有し、
前記対応する距離の各々は、しきい値距離未満である請求項1に記載の方法。 - 前記コンピュータによって、前記メディアドキュメントに関連するメタデータを受け取ることを更に備え、
前記一群のメディアドキュメントを検索することは、前記コンピュータによって、前記メディアドキュメントに関連するメタデータの複数の欄のうちの少なくとも一つにマッチングするメタデータを有する前記一群のメディアドキュメントの一つ以上のメディアドキュメントを識別することを備え、
前記マッチングメディアドキュメントは、識別した一つ以上のメディアドキュメントの少なくとも一つを備える請求項1に記載の方法。 - 前記一群のメディアドキュメントは、第1のセットのメディアドキュメント及び第2のセットのメディアドキュメントを備え、
ユーザに関連するアクセスポリシーによって、前記第1のセットのメディアドキュメントへのアクセスを許可するとともに前記第2のセットのメディアドキュメントへのアクセスを拒否し、
前記一群のメディアドキュメントを検索することは、前記第1のセットのメディアドキュメントに限定される請求項1に記載の方法。 - メディアドキュメントのメタデータを自動的に生成するシステムであって、
プロセッサと、
前記プロセッサによって実行されるときに、
畳み込みニューラルネットワークを用いて前記メディアドキュメントの特徴ベクトルを算出することであって、前記メディアドキュメントは、3次元(3D)モデルであり、前記特徴ベクトルを算出することは、
前記3Dモデルの複数の2次元(2D)ビューをレンダリングするために複数の角度から前記3Dモデルをレンダリングすることと、
一つ以上の畳み込みニューラルネットワークを用いて、各々が前記3Dモデルの2Dビューの一つに対応する複数の単一ビュー特徴ベクトルを生成することと、
統合された特徴ベクトルを算出するために、前記2Dビューに対応する前記複数の単一ビュー特徴ベクトルを集約することであって、前記統合された特徴ベクトルは、前記2Dビューの数に依存しない一定の長さを有することと、
最終段階の畳み込みニューラルネットワークを用いて、前記統合された特徴ベクトルから前記特徴ベクトルを算出することと、
を備えることと、
前記メディアドキュメントの前記特徴ベクトルに類似する対応する特徴ベクトルを有する一つ以上のマッチングメディアドキュメントの一群のメディアドキュメントを検索することであって、前記一群のメディアドキュメントの各メディアドキュメントがメタデータに関連することと、
前記一つ以上のマッチングメディアドキュメントに関連するメタデータに基づいて前記メディアドキュメントのメタデータを生成することであって、生成されたメタデータは、前記一つ以上のマッチングメディアドキュメントの数なくとも一つのしきい値のメタデータに出現する前記メタデータの部分を含むことと、
生成したメタデータに関連して前記メディアドキュメントを表示することと、
を前記プロセッサによって実行させる格納された命令を有するメモリと、
を備えるシステム。 - 前記一群のメディアドキュメントは、一群の2次元(2D)画像を備え、
前記特徴ベクトルを算出することの命令は、前記プロセッサによって実行されるときに、前記3Dモデルの一つ以上の特徴ベクトルを算出することを前記プロセッサによって実行させる命令を備え、
前記一つ以上のマッチングメディアドキュメントは、前記一群の2D画像の一つ以上のマッチング2D画像を備え、
前記マッチング2D画像の対応する特徴ベクトルの各々は、前記3Dモデルの一つ以上の特徴ベクトルの少なくとも一つに類似する請求項11に記載のシステム。 - 二つ以上の赤外(IR)カメラと、
一つ以上のIRコリメート照明と、
を備える3次元スキャナを更に備え、前記メモリは、前記プロセッサによって実行されるときに、3次元スキャナを用いて前記3Dモデルをキャプチャすることを前記プロセッサによって実行させる命令を更に格納する請求項11に記載のシステム。 - 前記メモリは、前記プロセッサによって実行されるときに、生成したメタデータの複数の欄の一つ以上の検証を備えるユーザ入力を受け取ることを前記プロセッサによって実行させる命令を更に格納する請求項11に記載のシステム。
- 生成したメタデータ及び前記メディアドキュメントの各々に関連するメタデータはそれぞれ、複数の欄を備え、
前記メタデータを生成することの命令は、前記プロセッサによって実行されるときに、
前記複数の欄の各欄に対して、前記一つ以上のマッチングメディアドキュメントの二つ以上のしきい値のメタデータに出現するデータを識別することと、
識別したデータを生成したメタデータに追加することと、
を前記プロセッサによって実行させる命令を備える請求項11に記載のシステム。 - 生成したメタデータは、メディアドキュメントの種類を備え、
前記メモリは、前記プロセッサによって実行されるときに、
前記メディアドキュメントの種類を算出するために前記メディアドキュメントの特徴ベクトルを分類器に供給することと、
分類に基づいて前記種類を算出することと、
を前記プロセッサによって実行させる命令を更に格納する請求項11に記載のシステム。 - 前記メモリは、前記プロセッサによって実行されるときに、前記メディアドキュメント及び生成したメタデータメタデータを前記一群のメディアドキュメントに追加することを前記プロセッサによって実行させる命令を更に格納する請求項11に記載のシステム。
- 前記一つ以上のマッチングメディアドキュメントの一つ以上の対応する特徴ベクトルの各々は、多次元空間における前記メディアドキュメントの特徴ベクトルからの対応する距離を有し、
前記対応する距離の各々は、しきい値距離未満である請求項11に記載のシステム。 - 前記メモリは、前記プロセッサによって実行されるときに、前記メディアドキュメントに関連するメタデータを受け取ることを前記プロセッサによって実行させる命令を更に格納し、
前記一群のメディアドキュメントを検索することの命令は、前記プロセッサによって実行されるときに、前記メディアドキュメントに関連するメタデータの複数の欄のうちの少なくとも一つにマッチングするメタデータを有する前記一群のメディアドキュメントの一つ以上のメディアドキュメントを識別することを前記プロセッサによって実行させる命令を備え、
前記マッチングメディアドキュメントは、識別した一つ以上のメディアドキュメントの少なくとも一つを備える請求項11に記載のシステム。 - 前記一群のメディアドキュメントは、第1のセットのメディアドキュメント及び第2のセットのメディアドキュメントを備え、
ユーザに関連するアクセスポリシーによって、前記第1のセットのメディアドキュメントへのアクセスを許可するとともに前記第2のセットのメディアドキュメントへのアクセスを拒否し、
前記一群のメディアドキュメントを検索することは、前記第1のセットのメディアドキュメントに限定される請求項11に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662374598P | 2016-08-12 | 2016-08-12 | |
US62/374,598 | 2016-08-12 | ||
PCT/US2017/046642 WO2018031959A1 (en) | 2016-08-12 | 2017-08-11 | Systems and methods for automatically generating metadata for media documents |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019530062A JP2019530062A (ja) | 2019-10-17 |
JP6810247B2 true JP6810247B2 (ja) | 2021-01-06 |
Family
ID=61160193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019507781A Active JP6810247B2 (ja) | 2016-08-12 | 2017-08-11 | メディアドキュメントのメタデータを自動的に生成するシステム及び方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US10296603B2 (ja) |
EP (2) | EP3497550B1 (ja) |
JP (1) | JP6810247B2 (ja) |
CN (2) | CN116484029A (ja) |
ES (1) | ES2941259T3 (ja) |
PL (1) | PL3497550T3 (ja) |
WO (1) | WO2018031959A1 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10242474B2 (en) | 2015-07-15 | 2019-03-26 | Fyusion, Inc. | Artificially rendering images using viewpoint interpolation and extrapolation |
US10222932B2 (en) | 2015-07-15 | 2019-03-05 | Fyusion, Inc. | Virtual reality environment based manipulation of multilayered multi-view interactive digital media representations |
US11095869B2 (en) * | 2015-09-22 | 2021-08-17 | Fyusion, Inc. | System and method for generating combined embedded multi-view interactive digital media representations |
US10147211B2 (en) | 2015-07-15 | 2018-12-04 | Fyusion, Inc. | Artificially rendering images using viewpoint interpolation and extrapolation |
US11006095B2 (en) | 2015-07-15 | 2021-05-11 | Fyusion, Inc. | Drone based capture of a multi-view interactive digital media |
US11783864B2 (en) | 2015-09-22 | 2023-10-10 | Fyusion, Inc. | Integration of audio into a multi-view interactive digital media representation |
US10496897B2 (en) * | 2015-11-25 | 2019-12-03 | Institute Of Automation Chinese Academy Of Sciences | Method and apparatus for recognizing RGB-D objects based on adaptive similarity measure of dense matching item |
CN107025642B (zh) * | 2016-01-27 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 基于点云数据的车辆轮廓检测方法和装置 |
US11202017B2 (en) | 2016-10-06 | 2021-12-14 | Fyusion, Inc. | Live style transfer on a mobile device |
US10437879B2 (en) | 2017-01-18 | 2019-10-08 | Fyusion, Inc. | Visual search using multi-view interactive digital media representations |
US10313651B2 (en) * | 2017-05-22 | 2019-06-04 | Fyusion, Inc. | Snapshots at predefined intervals or angles |
US11069147B2 (en) | 2017-06-26 | 2021-07-20 | Fyusion, Inc. | Modification of multi-view interactive digital media representation |
CN107609152B (zh) * | 2017-09-22 | 2021-03-09 | 百度在线网络技术(北京)有限公司 | 用于扩展查询式的方法和装置 |
US10579875B2 (en) * | 2017-10-11 | 2020-03-03 | Aquifi, Inc. | Systems and methods for object identification using a three-dimensional scanning system |
US10713563B2 (en) * | 2017-11-27 | 2020-07-14 | Technische Universiteit Eindhoven | Object recognition using a convolutional neural network trained by principal component analysis and repeated spectral clustering |
US10586118B2 (en) | 2018-01-13 | 2020-03-10 | Toyota Jidosha Kabushiki Kaisha | Localizing traffic situation using multi-vehicle collaboration |
US10963706B2 (en) * | 2018-01-13 | 2021-03-30 | Toyota Jidosha Kabushiki Kaisha | Distributable representation learning for associating observations from multiple vehicles |
US10916135B2 (en) | 2018-01-13 | 2021-02-09 | Toyota Jidosha Kabushiki Kaisha | Similarity learning and association between observations of multiple connected vehicles |
US20190251744A1 (en) * | 2018-02-12 | 2019-08-15 | Express Search, Inc. | System and method for searching 3d models using 2d images |
US11062469B2 (en) | 2018-03-09 | 2021-07-13 | Microsoft Technology Licensing, Llc | 4D tracking utilizing depth data from multiple 3D cameras |
US11429658B1 (en) * | 2018-04-11 | 2022-08-30 | Soroco Private Limited | Systems and methods for content-aware image storage |
US11367222B2 (en) | 2018-04-20 | 2022-06-21 | Hewlett-Packard Development Company, L.P. | Three-dimensional shape classification and retrieval using convolutional neural networks and majority vote |
US10592747B2 (en) | 2018-04-26 | 2020-03-17 | Fyusion, Inc. | Method and apparatus for 3-D auto tagging |
WO2019232645A1 (en) * | 2018-06-07 | 2019-12-12 | Element Ai Inc. | Unsupervised classification of documents using a labeled data set of other documents |
US10817270B2 (en) | 2018-08-02 | 2020-10-27 | Oracle International Corporation | AI-generated instant micro apps |
DE112019004364T5 (de) * | 2018-08-29 | 2021-06-02 | Movidius Ltd. | Computer-vision system |
US11507052B2 (en) * | 2018-09-24 | 2022-11-22 | The Boeing Company | System and method of voxel based parametric specification for manufacturing a part |
US10810725B1 (en) | 2018-12-07 | 2020-10-20 | Facebook, Inc. | Automated detection of tampered images |
EP3899784A4 (en) | 2018-12-19 | 2022-10-19 | Packsize, LLC | SYSTEMS AND METHODS FOR COMMON LEARNING COMPLEX VISUAL INSPECTION TASKS USING COMPUTER VISION |
US20200202622A1 (en) * | 2018-12-19 | 2020-06-25 | Nvidia Corporation | Mesh reconstruction using data-driven priors |
EP3980916A4 (en) * | 2019-06-06 | 2023-06-21 | Bluebeam, Inc. | METHODS AND SYSTEMS FOR AUTOMATIC DESIGN ELEMENT DETECTION IN A TWO-DIMENSIONAL DESIGN DOCUMENT |
JP7448566B2 (ja) | 2019-06-14 | 2024-03-12 | マジック リープ, インコーポレイテッド | クロスリアリティシステムにおけるスケーラブル3次元オブジェクト認識 |
US11537816B2 (en) * | 2019-07-16 | 2022-12-27 | Ancestry.Com Operations Inc. | Extraction of genealogy data from obituaries |
JP7410613B2 (ja) * | 2019-08-27 | 2024-01-10 | キヤノン株式会社 | 情報処理装置およびその制御方法およびプログラム |
CN111191052B (zh) * | 2019-12-24 | 2023-12-22 | 广州索答信息科技有限公司 | 一种数据采集方法、设备及介质 |
CN111243085B (zh) * | 2020-01-20 | 2021-06-22 | 北京字节跳动网络技术有限公司 | 图像重建网络模型的训练方法、装置和电子设备 |
US11430042B2 (en) * | 2020-04-30 | 2022-08-30 | Capital One Services, Llc | Methods and systems for providing a vehicle recommendation |
US11240707B2 (en) | 2020-05-28 | 2022-02-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Adaptive vehicle identifier generation |
CN116324783A (zh) * | 2020-08-20 | 2023-06-23 | 西门子工业软件公司 | 用于在cad环境中提供三维计算机辅助设计(cad)模型的方法和系统 |
US11232298B1 (en) * | 2021-08-18 | 2022-01-25 | IAA, Inc. | Automated data extraction and document generation |
JP2023062237A (ja) * | 2021-10-21 | 2023-05-08 | アセントロボティクス株式会社 | 対象デジタルツインモデル生成システム、ロボットの制御システム、仮想店舗生成システム、対象デジタルツインモデル生成方法、ロボットの制御方法、および仮想店舗生成方法 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06223198A (ja) * | 1993-01-26 | 1994-08-12 | Hitachi Ltd | 光線追跡による画像生成装置及び方法 |
US6044375A (en) * | 1998-04-30 | 2000-03-28 | Hewlett-Packard Company | Automatic extraction of metadata using a neural network |
US6525699B1 (en) | 1998-05-21 | 2003-02-25 | Nippon Telegraph And Telephone Corporation | Three-dimensional representation method and an apparatus thereof |
JP4516957B2 (ja) * | 2003-01-25 | 2010-08-04 | パーデュー リサーチ ファンデーション | 3次元オブジェクトについて検索を行なうための方法、システムおよびデータ構造 |
US9900478B2 (en) * | 2003-09-04 | 2018-02-20 | Flir Systems, Inc. | Device attachment with infrared imaging sensor |
US8166059B2 (en) * | 2005-07-08 | 2012-04-24 | Oracle International Corporation | Optimization of queries on a repository based on constraints on how the data is stored in the repository |
WO2009003225A1 (en) * | 2007-06-29 | 2009-01-08 | Adelaide Research & Innovation Pty Ltd | Method and system for generating a 3d model from images |
AU2009281762A1 (en) * | 2008-08-15 | 2010-02-18 | Brown University | Method and apparatus for estimating body shape |
US8340453B1 (en) * | 2008-08-29 | 2012-12-25 | Adobe Systems Incorporated | Metadata-driven method and apparatus for constraining solution space in image processing techniques |
US8411953B2 (en) * | 2008-09-30 | 2013-04-02 | International Business Machines Corporation | Tagging images by determining a set of similar pre-tagged images and extracting prominent tags from that set |
US8686992B1 (en) * | 2009-03-30 | 2014-04-01 | Google Inc. | Methods and systems for 3D shape matching and retrieval |
US20110222757A1 (en) * | 2010-03-10 | 2011-09-15 | Gbo 3D Technology Pte. Ltd. | Systems and methods for 2D image and spatial data capture for 3D stereo imaging |
CN101827203B (zh) * | 2010-03-29 | 2012-05-30 | 天津大学 | 一种视频标注方法 |
US8485668B2 (en) * | 2010-05-28 | 2013-07-16 | Microsoft Corporation | 3D interaction for mobile device |
US8457355B2 (en) * | 2011-05-05 | 2013-06-04 | International Business Machines Corporation | Incorporating video meta-data in 3D models |
WO2013036181A1 (en) * | 2011-09-08 | 2013-03-14 | Telefonaktiebolaget L M Ericsson (Publ) | Assigning tags to media files |
CN103164463B (zh) * | 2011-12-16 | 2017-03-22 | 国际商业机器公司 | 推荐标签的方法和装置 |
US9008433B2 (en) | 2012-02-08 | 2015-04-14 | International Business Machines Corporation | Object tag metadata and image search |
GB2514320B (en) * | 2013-03-15 | 2020-01-29 | 3D Industries Ltd | A method and system for 3D model database retrieval |
US9117104B2 (en) * | 2013-07-10 | 2015-08-25 | Cherif Algreatly | Object recognition for 3D models and 2D drawings |
US9905043B2 (en) * | 2013-09-10 | 2018-02-27 | Microsoft Technology Licensing, Llc | Techniques to generate digital maps |
GB2514432B (en) | 2013-10-02 | 2015-05-27 | Cybertooling Ltd | Floor height adjustment |
US20150142782A1 (en) * | 2013-11-15 | 2015-05-21 | Trendalytics, Inc. | Method for associating metadata with images |
WO2015083199A1 (en) * | 2013-12-04 | 2015-06-11 | J Tech Solutions, Inc. | Computer device and method executed by the computer device |
WO2015085435A1 (fr) * | 2013-12-15 | 2015-06-18 | Socovar, Société En Commandite | Méthode et système de comparaison de modèles 3d |
EP2886043A1 (de) * | 2013-12-23 | 2015-06-24 | a.tron3d GmbH | Verfahren zum Fortsetzen von Aufnahmen zum Erfassen von dreidimensionalen Geometrien von Objekten |
US9311737B1 (en) * | 2014-01-17 | 2016-04-12 | Pixar | Temporal voxel data structure |
US9392262B2 (en) | 2014-03-07 | 2016-07-12 | Aquifi, Inc. | System and method for 3D reconstruction using multiple multi-channel cameras |
KR20170031656A (ko) * | 2014-07-08 | 2017-03-21 | 삼성전자주식회사 | 화상을 이용해 3차원 정보를 처리하는 전자 장치 및 방 |
US9747493B2 (en) * | 2014-09-23 | 2017-08-29 | Keylemon Sa | Face pose rectification method and apparatus |
CN104391960B (zh) * | 2014-11-28 | 2019-01-25 | 北京奇艺世纪科技有限公司 | 一种视频标注方法及系统 |
GB2532948B (en) | 2014-12-02 | 2021-04-14 | Vivo Mobile Communication Co Ltd | Object Recognition in a 3D scene |
US9858484B2 (en) * | 2014-12-30 | 2018-01-02 | Facebook, Inc. | Systems and methods for determining video feature descriptors based on convolutional neural networks |
ITUB20153277A1 (it) * | 2015-08-28 | 2017-02-28 | St Microelectronics Srl | Procedimento per ricerche visuali, sistema, apparecchiatura e prodotto informatico corrispondenti |
US9773302B2 (en) * | 2015-10-08 | 2017-09-26 | Hewlett-Packard Development Company, L.P. | Three-dimensional object model tagging |
CN105243139B (zh) * | 2015-10-10 | 2018-10-23 | 天津大学 | 一种基于深度学习的三维模型检索方法及其检索装置 |
US10482681B2 (en) * | 2016-02-09 | 2019-11-19 | Intel Corporation | Recognition-based object segmentation of a 3-dimensional image |
CN107066559B (zh) * | 2017-03-30 | 2019-12-27 | 天津大学 | 一种基于深度学习的三维模型检索方法 |
-
2017
- 2017-08-11 PL PL17840385.3T patent/PL3497550T3/pl unknown
- 2017-08-11 US US15/675,684 patent/US10296603B2/en active Active
- 2017-08-11 EP EP17840385.3A patent/EP3497550B1/en active Active
- 2017-08-11 CN CN202310465193.7A patent/CN116484029A/zh active Pending
- 2017-08-11 ES ES17840385T patent/ES2941259T3/es active Active
- 2017-08-11 CN CN201780061114.9A patent/CN109791554B/zh active Active
- 2017-08-11 EP EP23154628.4A patent/EP4195069A1/en active Pending
- 2017-08-11 WO PCT/US2017/046642 patent/WO2018031959A1/en unknown
- 2017-08-11 JP JP2019507781A patent/JP6810247B2/ja active Active
-
2019
- 2019-04-04 US US16/375,615 patent/US10528616B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN109791554B (zh) | 2023-05-09 |
EP3497550A1 (en) | 2019-06-19 |
US20190236096A1 (en) | 2019-08-01 |
EP4195069A1 (en) | 2023-06-14 |
US10528616B2 (en) | 2020-01-07 |
EP3497550B1 (en) | 2023-03-15 |
CN116484029A (zh) | 2023-07-25 |
CN109791554A (zh) | 2019-05-21 |
PL3497550T3 (pl) | 2023-07-24 |
JP2019530062A (ja) | 2019-10-17 |
ES2941259T3 (es) | 2023-05-19 |
WO2018031959A1 (en) | 2018-02-15 |
US10296603B2 (en) | 2019-05-21 |
US20180046649A1 (en) | 2018-02-15 |
EP3497550A4 (en) | 2020-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6810247B2 (ja) | メディアドキュメントのメタデータを自動的に生成するシステム及び方法 | |
US10691979B2 (en) | Systems and methods for shape-based object retrieval | |
Sun et al. | Pix3d: Dataset and methods for single-image 3d shape modeling | |
JP7458405B2 (ja) | 部分的視覚情報に基づく対象物寸法付けのためのシステムと方法 | |
US11922580B2 (en) | Floorplan generation based on room scanning | |
US20190096135A1 (en) | Systems and methods for visual inspection based on augmented reality | |
CN113436136A (zh) | 以对象为中心的扫描 | |
US20190188451A1 (en) | Lightweight 3D Vision Camera with Intelligent Segmentation Engine for Machine Vision and Auto Identification | |
JP2016537901A (ja) | ライトフィールド処理方法 | |
US11574485B2 (en) | Automatic measurements based on object classification | |
US20200057778A1 (en) | Depth image pose search with a bootstrapped-created database | |
US9208606B2 (en) | System, method, and computer program product for extruding a model through a two-dimensional scene | |
Zhang et al. | Research on 3D architectural scenes construction technology based on augmented reality | |
US20160042233A1 (en) | Method and system for facilitating evaluation of visual appeal of two or more objects | |
Kim et al. | Multimodal visual data registration for web-based visualization in media production | |
Panek et al. | Visual localization using imperfect 3d models from the internet | |
Khan et al. | A review of benchmark datasets and training loss functions in neural depth estimation | |
Xu et al. | MPR-GAN: A novel neural rendering framework for MLS point cloud with deep generative learning | |
Kriegler et al. | Evaluation of monocular and stereo depth data for geometry-assisted learning of 3D pose | |
Liu et al. | Synthesis and identification of three-dimensional faces from image (s) and three-dimensional generic models | |
Takamatsu et al. | A study on depth map generation using a light field camera and a monocular RGB camera based on deep learning | |
Sathirasethawong | Light Field Imaging and Reconstruction Tools for Small Objects | |
San | Accurate dense depth from light field technology for object segmentation and 3D computer vision | |
Nilosek | Analysis and exploitation of automatically generated scene structure from aerial imagery | |
Duenas Oviedo et al. | Colour Hue and Texture Evaluation for 3D Symbolization of Indoor Environments Using RGB-D Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200421 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201021 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6810247 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |