JP5830784B2 - 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム - Google Patents
画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム Download PDFInfo
- Publication number
- JP5830784B2 JP5830784B2 JP2013521387A JP2013521387A JP5830784B2 JP 5830784 B2 JP5830784 B2 JP 5830784B2 JP 2013521387 A JP2013521387 A JP 2013521387A JP 2013521387 A JP2013521387 A JP 2013521387A JP 5830784 B2 JP5830784 B2 JP 5830784B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- image
- graph
- relevance
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 112
- 230000008569 process Effects 0.000 claims description 78
- 230000006870 function Effects 0.000 claims description 29
- 230000000007 visual effect Effects 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 8
- 210000004556 brain Anatomy 0.000 claims description 5
- 238000010079 rubber tapping Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 230000007704 transition Effects 0.000 claims description 2
- 230000007613 environmental effect Effects 0.000 claims 1
- 230000000763 evoking effect Effects 0.000 claims 1
- 239000013598 vector Substances 0.000 description 77
- 238000012545 processing Methods 0.000 description 59
- 238000000605 extraction Methods 0.000 description 37
- 238000004364 calculation method Methods 0.000 description 25
- 238000013461 design Methods 0.000 description 23
- 238000013139 quantization Methods 0.000 description 16
- 230000010365 information processing Effects 0.000 description 13
- 238000003860 storage Methods 0.000 description 13
- 238000005065 mining Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 238000012706 support-vector machine Methods 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 241000282472 Canis lupus familiaris Species 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 239000011521 glass Substances 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000001902 propagating effect Effects 0.000 description 5
- 241000219095 Vitis Species 0.000 description 4
- 235000009754 Vitis X bourquina Nutrition 0.000 description 4
- 235000012333 Vitis X labruscana Nutrition 0.000 description 4
- 235000014787 Vitis vinifera Nutrition 0.000 description 4
- 235000013351 cheese Nutrition 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 240000007817 Olea europaea Species 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 235000019674 grape juice Nutrition 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000015205 orange juice Nutrition 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000004381 surface treatment Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
- G06V10/464—Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/7635—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks based on graphs, e.g. graph cuts or spectral clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7784—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Discrete Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Description
なお、領域処理部201、一般物体認識部202、特定物体認識部203、MDB検索部206、MDB学習部207、及びMDBマネージメント208は、画像認識エンジン200を構成している。画像認識エンジン200は後述の図6A記載の画像認識システムに置き換えても良い。また、グラフ演算部221、グラフ記憶部222、グラフ管理部223、及び関連性演算部224は、関連性検索エンジン220を構成している。
サーバ101の機能ブロックは必ずしもこれらに限定されるものではないが、これら代表的な機能について簡単に説明する。
ネットワーク通信制御部204は、画像の入力出力処理や、ネットワーク端末との情報通信制御などを行う。データ検索処理部205は、リンク先から情報を収集したり、集合知の問合せや、収集、ならびに検索などを行う。
MDB検索部206は、物体の名称等のタグデータ等を検索する。MDB学習部207は、新規設計データの追加や詳細情報の追加、時間情報の登録、付帯情報の登録、更新、追加などを行う。MDBマネージメント部208は、設計データから特徴点や特徴量の抽出、付帯情報からカテゴリ情報を抽出しカテゴリデータへの登録や、カテゴリデータ内のカテゴリ分類の拡張、分割、更新、統合、修正、新規カテゴリの登録などを行う。
リンクデータ232は、リンクに関するデータを格納する。リンク構造の一例については、図14A(E)に基づいて後述する。
付加情報データ252は、物体の名称、製造者、部品番号、日時、素材、組成、加工情報など物体に関するあらゆる情報を保持している。
特徴量データ253は、設計情報に基づいて生成される個々の物体の特徴点や特徴量情報を保持している。
カテゴリデータ254は、一般物体認識部において物体のカテゴリ分類を行う際に使用する情報を保持している。
不特定物体データ255は、現時点で特定物体認識不能の物体に関しての情報を保持しており、その後に類似の特徴を有する物体が頻繁に検出されれば、新たな特定物体として新規登録処理される。
次に、図4に従って、本発明に係るシステムの一実施形態における画像認識システムの全体的なフローを説明する。
次に、S502においてMDBで生成された特徴量データ253を元に、元画像内の特徴点及び特徴量が抽出され、MDBより生成される特徴量データと比較される。ここで、MDBより特徴量データを生成・比較する方法には、以下の2種類がある。
ここで、図6Aに、本発明に係るシステムの他の実施形態における画像認識システムの機能ブロックを示す。図6Aに示す画像認識システム202は、サーバ101の一部として運用することも可能であるし、あるいは、サーバ101とは独立したサーバシステムとしても運用可能である。画像認識システム202は、サーバ101における一般物体認識部や特定物体認識部に対応する一般物体認識システム及び特定物体認識システムに加え、シーンを認識するためのシーン認識システムをも備えている。サーバ101における画像認識機能部の別形態あるいは応用例として、以下に詳述する。
次に、図12〜図36に基づいて、本発明に係るシステムの一実施形態におけるインタレスト・グラフ収集処理について説明する。
例えば、関連性検索窓への検索対象画像の投入という操作に代えて、検索の対象となる画像全体、或いは特定の画像領域を明示的にネットワーク端末105の表示スクリーン上でダブルタップする等の操作により、サーバ側の画像認識エンジン200に当該選択画像の認識処理を問い合わせる事も可能である。
図12B(A)では、フリックした結果、グレープジュース1220の関連要素としてのオレンジジュース1221及びグレープ1222が表示され、さらに、グレープ122の関連要素としてのフルーツ群1223〜1226が表示されている。
図14A(A)に示す通り、生成時刻及びvalue(1402)にhash演算1404を施すことでkey(1401)を得る。例えば、hash演算1404がハッシュアルゴリズムSHA−1を用いた場合には、keyは160ビット長になる。Key(1401)はlocate演算1403によってvalue(1402)を得る。例えばlocate演算1403には分散ハッシュテーブル(Distributed Hash Table)方が利用できる。本実施例では、このkeyとvalueの関係を”(key, {value})”で表現し(図14A(B)))、ノードデータ及びリンクデータとしてGDB102Aに格納する単位とする。
例えば、図14A(C)の2つのノードがリンクされている場合、ノードn1(1410)は、”(n1, {ノードn1})”で、ノードn2(1411)は、”(n2, {ノードn2})”で表現する。n1やn2はそれぞれノードn1(1410)、ノードn2(1411)のkeyであり、ノード実体ノードn1(1410)、ノードn2(1411)をそれぞれhash演算しそれぞれのkeyを得る。また、リンクl1(1412)は、ノードと同様に“(l1, {n1, n2})”で表現し、{n1, n2}をhash演算することでそのkey(l1)1412を得る。
図15は、画像1501を関連性検索窓1203にドラグ&ドロップした後の関連性グラフを示している。画像1501は画像認識エンジン200、または、画像認識システム202で処理され、3個の画像構成要素が抽出されている。すわなち、画像構成要素Wine(1502)、Wine Glass(1503)、Wine Bottle(1504)の3個である。図中では、それらにWine, Wine Glass, Wine Bottleというラベルが付されているが、これらは画面に出力されることはなく、あくまで本発明における説明を容易にするためのものである。これらの画像構成要素は関連検索エンジン220で処理され、それぞれ1505から1518の関連要素群が抽出されている。例えば、画像1502は5個の関連要素群の画像と関連がある。それらは、Olive(1505)、Cheese(1506)、Bread(1507)、Fine Dish(1508)、Wine Glass(1508)の5個である。Wine Glass(1503)はDecanter(1509)を関連要素とし関連がある。Wine Bottle(1504)は8個の関連要素群の画像と関連がある。それらは、Wine(1502)、Wine Glass(1503)、Decanter(1509)、Cork(1511)、Grape(1513)、DRC(1515)、Wine Cellar(1516)、Oak Barrel(1517)の8個である。
これらの関係を表現するために、GDB102Aにはデータセット1605が格納されている。
これらの関係を表現するために、GDB102Aにはデータセット1705が格納されている。
図18は本発明に係わる関連性導出演算の一例で、関連性検索エンジン220における関連性演算部224での処理を示したものである。図17で見たように、画像構成要素の画像と関連要素を構成しているノードとの間には複雑なグラフ構造が存在している。例えば、図18(A)のグラフが与えられているとする。これは、2つのノード間のグラフ構造から抽出された部分グラフである。ここで、それぞれのノード間のリンクのfを計算する(図14(E)の関数fを計算する)。関数fは確率であったりベクトルであったりとノードとリンクのタイプによって変わる。例えば,リンク1801のfを計算し得られた値を行の一要素とし、これをすべてのリンクに繰り返すと、図18(B)の行列(v1)を得る。図18(C)は行列(v1)の各行をビンに対応させたヒストグラム図として描いた。この行列(v1)を多次元特徴ベクトルとしてノード間の関連性の計算に用いる。つまり、この多次元特徴ベクトルはノード間の直接的な関係性の強さを表している。図18ではノード1801(n1)とノード1809(n2)の間の関連性を当該多次元特徴ベクトルで表し、関連性知識データベース1310に記録する。また、GDB102Aにはノードn1とノードn2との間にリンクが生成されたことになるので、すなわち、”(ln1-n2, {f(v1)})”(ここでf(v1)は関連性知識データベースへのアクセス関数/メソッドである)なるリンクデータをGDB102Aに格納する。この様にして、ノード間の関連性を学習していく。
図19に、本発明に係わるインタレスト・グラフ獲得の一例を示す。図19(A)は関連性グラフをユーザに対応するノード1903(当該ノードのタイプが”USER”である)を中心に簡略化して描いた。ノード1903は3つのオブジェクトに対応したノード1904、1905、1906(それらのノードはタイプが”OBJECT”である)と繋がっている。図18に記載の手順でノード1903とノード1904、ノード1905、及びノード1906の間のそれぞれの多次元特徴ベクトルを計算し合計したものが図19(A)中の多次元特徴ベクトル1901である。
ここで、2つのオブジェクトがノード1903に追加されたとする(図19(B))。ノード1913とノード1914である。同様にノード1903とノード1913、ノード1914の間のそれぞれの多次元特徴ベクトルを計算し合計した結果、図19(B)中の多次元特徴ベクトル1911が得られる。点線円1902と点線円1912における特徴ベクトルの違いに注意されたい。この様に多次元特徴ベクトルを適応的に強めることで当該ユーザ1903を中心ノードとするインタレスト・グラフを獲得する。
また、関連性差分部224による計算を特定のユーザの集まりに対して適応すれば、当該グループのユーザ(いわゆるユーザクラスタ)に関する特徴を表したものになるし、ユーザ全体の当該計算を適応すれば、ユーザ全体に関する特徴を表したものになる。そして、詳細は後述するが統計情報処理部209により当該ユーザを中心とした多次元特徴ベクトル群は統計的なインタレスト・グラフを表現する。
図20A乃至図20Cに、本発明に係るシステムの一実施形態におけるグラフ構造の表示例を示す。
ここで、会社のロゴの場合には、一例として複数の意味が含まれることに留意されたい。具体的には、会社そのものを指し示し、かつ、その会社の商品も指し示すことがあり得る。
例えば、図20C(B)では、ノード2024のさらなるつながりのあるノード2032や、新しいノード2033が追加表示されている。
図21に、本発明に係るシステムの他の実施形態における動作例を示す。図21(A)において、関連性検索窓1203には、入力検索条件として論理演算子(AND2101及びOR2102)が導入される。ここで、AND(2101)を指定した場合、画像2104と画像2105とから始まるノード間で共通かつ直接的に関連するノード群が選択される。すなわち、ノード2104とノード2105からの直接リンクのあるノード群が選ばれる。一方、OR(2102)の場合、それぞれのノードのいずれか1つ以上に直接的に関連するノード群が選択される。すなわち、ノード2104から直接リンクのあるノードとノード2105から直接リンクのあるノードの両方が選ばれる。
また間接的リンクが存在する場合には、後述の統計情報処理部209を利用して、ノード2202をルートとする部分グラフをGDB102Aから抽出し多次元特徴ベクトル生成部1302で生成された多次元特徴ベクトルを対象として、例えば、当該多次元ベクトルの共起確率よりも大きな確率を持つ多次元特徴ベクトルをもつノード群を選び出し、ノード2201とノード2203を間接的につないでいく。この方法の場合、当該ノード間をつなぐパスは複数存在する場合があるが、その時には、当該パス上のノードの数が最小になるパス、あるいは、当該パス上のノード間の重みが最小になるパスを最短パスとして、それを含む関連性グラフを表示しても良い。
なお、この後には、ノード2202とノード2204との間に直接のリンク(2210)を生成しても良い。
このような非直接的なパスが複数発見される場合、前記したように、最も中継ノード数の少ない、或いは、当該パス上のノード間の重みが最小となるような間接関連性を抽出する事が可能である。
さらには、これら複数の非直接的なパスを辿る事により、思いもよらないノード間の関連を発見することができる。
ここでまずオブジェクト2504とオブジェクト2515との間には直接的リンク2510は存在しないとする。しかし本発明における関連性検索エンジン220は図23にみてきたような間接的な関連性を見つけ出す可能性がある。そこで、ユーザ2501のネットワーク端末上にオブジェクト2515の存在の可能性がユーザ2501に対して喚起された場合(図25(C))、当該ユーザは、それらを直接に結びつける演算子Reference(2506)を実行することができる。これにより、オブジェクト2504とオブジェクト2515の間のリンクが提起され、関連性差分部224の処理により新たな多次元特徴ベクトルが生成される。このリンク生成の要請が複数発生し所定の閾値を超えた場合、或いは特定の権限を有するスーパーバイザにより、オブジェクト2504とオブジェクト2515を直接関連付けるリンクを図14Bの”CONNECT”オペレーションによって生成する。
図27を用いて、統計情報処理部209の一実施形態における機能ブロック構成を説明する。
統計情報処理部209は3つの要素から構成される。グラフ・ベクトル構成部2701、推論エンジン部2702、およびグラフマイニング処理部2703の3つであり、推論エンジン部2703はさらに決定木処理部2710、ベイジアンネットワーク処理部2711から、グラフマイニング処理部2703はパターンマイニング処理部2712、RWR(Random Walk with Restarts)処理部2713から構成されている。なお、グラフマイニングの処理手順はこれらに限らない。
図28に本発明に係るシステムの一実施形態における特定ユーザフィルター処理部210の構成を示す。当該処理部は3個の要素から構成される。多次元ベクトル構成部2801、主観フィルター構成部2802、及び多次元ベクトル処理部2803である。GDB102Aから取り出され、例えば統計情報処理部209で処理された結果の部分グラフは、多次元ベクトル構成部2801にて多次元ベクトルとして再構成される。ユーザ情報は主観フィルター処理部2802において、ユーザデータベース2804の情報を用いてユーザの主観的評価フィルターを多次元特徴ベクトル(図28(B))として生成する。これら2個の構成部(2801と2802)からの出力の多次元特徴ベクトルが、多次元特徴ベクトル処理部2803で処理され、図28(C)のユーザの主観的評価を反映したノード間のつながりの深さを表した多次元特徴ベクトルとして再構成される。
これらはユーザデータベース2804に登録可能であると同時に、これら主観が”SUBJECT”として汎用的に適用可能となる。前記主観フィルター構成部2802は上記主観要素を構成する部分グラフから多次元特徴ベクトル(図28(B))を生成する。当該多次元特徴ベクトルの各ビンの値は、上記主観要素を反映した数値として利用可能である。
図には、3人のユーザ3101から3103と6個のオブジェクト3110から3115の関係が描かれている。ユーザ3101はオブジェクト3110、3111、3112に興味があり、ユーザ3102はオブジェクト3111、3113、3114に興味があり、ユーザ3103はオブジェクト3110、3111、3113、3115に興味があることが描かれている。
このインタレスト・グラフはGDB102Aのデータからユーザと関連のあるノードであり、グラフ演算部221が抽出したものであり、関連性検索エンジン220におけるグラフ記憶部222に存在している。
上記接続演算子LIKE、切断演算子DISLIKE、参照演算子Reference、非参照演算子UnreferenceによってGDB102Aの情報は時々刻々と変化しているので、この図31(A)のインタレスト・グラフも動的なインタレスト・グラフとして獲得できる。
101 サーバ
102A グラフデータベース(GDB)
102B マザーデータベース(MDB)
103 接続
104 ネットワーク(あるいはインターネット)
105a〜105d ネットワーク端末装置
106 一般物体認識システム
107 画像カテゴリデータベース
108 シーン認識システム
109 シーン構成要素データベース
110 特定物体認識システム
200 画像認識エンジン
209 統計情報処理部
210 特定ユーザフィルター処理部
220 関連性検索エンジン
221 グラフ演算部
222 グラフ記憶部
223 グラフ管理部
224 関連性演算部
Claims (16)
- 1以上の物体(object)及び主題(subject)の少なくとも一方を含む画像情報を入力手段として用いる検索システムを含む、又は当該検索システムに接続されているインタレスト・グラフ収集システムであって、
ネットワーク上に存在する多数の画像群、及び端末経由でユーザがネットワーク上にアップロードした画像群の少なくとも一方から、前記ユーザが関心を持った画像全体、或いは画像の特定領域を前記ユーザにより端末上で選択され、
前記選択した画像を、ネットワークを介してサーバ側の画像認識エンジンに問い合わせることにより、前記画像認識エンジンが、前記選択された画像全体、或いは前記特定領域に含まれる様々な一般物体・特定物体・人・顔・シーン・文字・記号・イラストレーション、ロゴ、ファビコンを含む画像構成要素群を抽出及び認識し、
前記認識された入力画像に含まれる前記画像構成要素群を、前記画像認識エンジンを介してサーバ側の関連性検索エンジンに通知することにより、
前記関連性検索エンジンが前記画像構成要素群における画像構成要素それぞれに対し、直接的及び間接的に一定以上の関連があると判断したその他の要素群を、関連性検索エンジン内の関連性知識データベースに学習可能な状態で記憶されている要素間の直接関連性を記述した情報を基に抽出し、
前記画像認識エンジンにより認識された前記画像構成要素群における要素及び前記関連性検索エンジンにより抽出された前記要素群における要素それぞれをノードとする関連性グラフを、前記ノードのそれぞれの間の関連性の深さと共に、前記ユーザの端末に二次元画像、或いは三次元画像、或いは前記関連性グラフの観察時間としての時間軸変数を加えた四次元時空間画像として視覚的に表現し、
前記画像認識エンジンが提示した複数の画像構成要素群の中から、前記ユーザが選択した特定の画像構成要素、或いは端末に表現されている関連性グラフ上の特定のノードの選択と当該ノードを中心とする領域の拡大操作、或いは前記ユーザによるジェスチャー、視線、音声、及び脳波の少なくとも1つを用いた拡大操作を用いることにより得られた入力を、前記端末を介して前記インタレスト・グラフ収集システムが受け取り、
前記ノードを中心とするより詳細な関連性グラフを前記ユーザの前記端末に視覚的に表現し、
それらの一連の操作を前記ノードに対する前記ユーザの一定の関心の存在であるとし、前記ユーザを中心ノードとする各要素間の直接関連性を記述した情報で、前記ノードに係るユーザの関心の深さを表わす値を変更することで、
前記ユーザを中心ノードとするインタレスト・グラフとして獲得すること、及び、当該インタレスト・グラフを広範なユーザに拡大して獲得することの少なくとも一方により、特定のユーザ、特定のユーザクラスタ、或いはユーザ全体にまたがる統計的なインタレスト・グラフとして収集すること
を特徴とするインタレスト・グラフ収集システム。 - 前記端末に表現されている前記関連性グラフの任意のノードを、前記ユーザがタッチスクリーン上でタップ或いはタッチして選択するか、ポインタのカーソルを任意のノードに移動し選択する操作、
或いは前記関連性グラフの任意の領域に向けて前記ユーザがタッチスクリーン上でフリックするか、ポインタのカーソルを前記関連性グラフの任意の領域に移動し画面全体をドラグしスクロールする操作、
或いは方向キーを含む入力キーによる前記選択又は前記スクロールの操作、
或いは前記ユーザによるジェスチャーや視線、音声、或いは脳波を用いた前記選択又は前記スクロールの操作を用いることにより得られた入力を、前記端末を介して前記インタレスト・グラフ収集システムが受け取り、
前記選択されたノード、或いは移動後の領域を中心とする新たな関連性グラフを、前記関連性検索エンジンが前記端末に追加的に送ることで、前記ユーザにとって関心のあるノード或いは領域を、前記ユーザが前記関連性グラフをシームレスに辿りながら、複数のノード間にまたがる広範な関連性として視覚的に認識する、
請求項1に記載のインタレスト・グラフ収集システム。 - 前記ユーザが着目し選択したノードを表す画像を、ネットワークを介して前記画像認識エンジンに再び問い合わせることにより、
前記画像認識エンジンを用いて前記ノードに関する新たな画像構成要素群を獲得し、当該画像構成要素群を起点とする新たな関連要素群を前記関連性検索エンジンから前記端末に送信することで、
前記ユーザが前記ノードに対する新たな関連性をそれら相互の関連性の深さと共に関連性グラフにおいて視覚的に認識することを可能にした上で、
直前の同様の操作において前記ノードへの起点となっている画像構成要素から当該ノードに至る一連のノード間の関連性の存在を前記ユーザが認識し利用していることを関連性検索エンジンが推測し、
各要素間の直接関連性を記述した情報を用いて、前記一連のノード間の関連性を変更することよって、前記関連性検索エンジン内の関連性知識データベースの追加学習をする、請求項1に記載のインタレスト・グラフ収集システム。 - 前記画像認識エンジンにより認識可能となった画像構成要素群、及び当該画像構成要素群における画像構成要素それぞれに対応する関連要素群に対し、当該関連要素群のそれぞれを代表する写真、イラストレーション、文字、記号、ロゴ、ファビコンを含む情報から生成した縮小画像サムネイルを前記関連性検索エンジンが元画像に代えて端末に送信することにより、
前記関連性グラフのノードとして前記サムネイル単位での表示・選択を可能にする、請求項1に記載のインタレスト・グラフ収集システム。 - 画像認識プロセスに備わる入力条件選択機能として、関連性探索演算子(Connection Search)を導入して、複数のノードを前記画像認識エンジンに問い合わせ、
関連性探索プロセスにおいて、複数のノード間の関係を、それぞれの入力ノード群に対し直接的及び間接的に関連するその他のノードを経由する一連の関連性として探索することで、異なるレイヤ(階層)に及ぶノード間の間接的な関係を発見し、
前記ノード間の最短パスを含む関連性グラフとして端末に表現し、
前記関連性探索プロセスにおいて、発見された前記間接的な関係を、関連性検索エンジン内の関連性知識データベースに学習可能な状態で追加記憶することで、
以降の同様或いは類似の関連性探索要求に備える、
請求項1に記載のインタレスト・グラフ収集システム。 - ユーザと間接的な関係にあるノード、或いはユーザとの関連性が低い若しくはないとされているその他のノードに対し、前記ノードを前記ユーザとの直接的な関係として結び付ける接続演算子(LIKE)、及び既に結びつけられているノードとユーザ間の直接的な関係を切断する切断演算子(DISLIKE)を導入することで、
前記ユーザを中心ノードとする各要素間の直接関連性を記述した情報において、ノードに係るユーザの関心の深さを表わす値を増加、或いは減少、或いは滅消させ、
前記ユーザを中心ノードとする、個々のユーザに対応したインタレスト・グラフの更新を行う、請求項1に記載のインタレスト・グラフ収集システム。 - 複数のノードを対象にした新たな直接的関連性の存在及び非存在の可能性を、前記複数のノードが直接的に結び付けられるべきだとして提起する参照演算子(REFERENCE)、及び既に直接的に結び付いているもののその直接的な関連の存在が疑わしいとして直接的関係の非存在を提起する非参照演算子(UNREFERENCE)を導入することで、
前記新たな直接関連性の存在或いは非存在の可能性を、前記関連性検索エンジンが広範なユーザ若しくは特定のユーザ群に対し喚起し、
特定の権限を有するスーパーバイザ或いは一定数以上の他のユーザから関連がある或いはないと判断されたノード群におけるノード間の関連性を表す値を、前記関連性検索エンジンが更新し、
前記ノード群に係る更新された関連性グラフとして端末に反映すると共に、
前記新たな直接関連性の存在或いは非存在に係る更新情報を、前記広範なユーザ若しくは前記特定のユーザ群に通知する、
請求項1に記載のインタレスト・グラフ収集システム。 - 前記関連性検索エンジン内に関連性知識データベースとして記憶されている要素間の直接関連性を記述した情報に対し、前記ユーザの主観的な評価が反映される重み付け操作をし、
前記重み付け操作された情報を基に、各ノード間相互の関連性及び関連性の深さを、前記ユーザの端末上に、前記ユーザが持つ、広範なユーザ若しくは特定のユーザ群との感じ方の違いという要因を反映した関連性グラフとして視覚的に表現する、
請求項1に記載のインタレスト・グラフ収集システム。 - 前記関連性検索エンジン内に関連性知識データベースとして記憶されている要素間の直接関連性を記述した情報に対し、前記ユーザが検索しようとする時間帯や日時、季節、時代、場所を含む環境フィルターを適用し、
前記環境フィルターが適用された情報を基に、各ノード間相互の関連性及び関連性の深さを、前記ユーザの端末上に、観察時間や地域(Location)特性といった時空間要因を反映した関連性グラフとして視覚的に表現する、
請求項1に記載のインタレスト・グラフ収集システム。 - 複数のユーザによる関連性検索の過程を通じて、複数のノードに対する特定のユーザクラスタ或いはユーザ全体集団に及ぶ視覚的な関心の在り所や関心の遷移が一定以上変化した時点で、前記複数のノードそれぞれに対する着目度の大幅な変化を統計情報化し、
前記関連性グラフ上で前記複数のノードに直接的に関わるユーザ、或いはユーザクラスタ、或いはユーザ全体、或いは特定の第三者に速やかに通知する、
請求項1に記載のインタレスト・グラフ収集システム。 - 前記インタレスト・グラフを活用して、特定のノードが表わす商品或いはサービスに対し一定以上の関心を示した特定のユーザ或いはユーザ群に対し、前記商品或いは前記サービスへの購買意欲を喚起する広告、リコメンデーションを含む情報の提示、又は当該情報を提供する第三者への繋ぎ込みを行い、
前記特定のユーザ或いはユーザ群の属性、及び前記特定のユーザ或いはユーザ群の属する時空間要因の少なくとも一方を加味した前記関連性グラフを活用して、前記商品或いは前記サービスと直接的或いは間接的に関連する他の商品或いはサービスに対する広告及びリコメンデーションの少なくとも1つを含む情報の提示、又は当該情報を提供する第三者への繋ぎ込みを行う、
請求項1に記載のインタレスト・グラフ収集システム。 - 前記インタレスト・グラフを活用することにより提示可能になる広告、サービス、或いはリコメンデーションを表わす視覚情報及びリンク情報の少なくとも一方を、対象となるユーザの端末に表現されている関連性グラフ上に、表示/非表示を選択可能な状態で提示する、
請求項1に記載のインタレスト・グラフ収集システム。 - 前記画像認識エンジンを組み込んだ関連性検索の過程を通じて獲得したインタレスト・グラフを活用して、同様の関心を持つ広範なユーザ間のコミュニケーションを、前記関連性検索を通じて喚起し、
前記インタレスト・グラフに加えて人と人、人と人以外の関係性を包含する、広義の動的なソーシャル・グラフを、ネットワークを介して獲得する、
請求項1に記載のインタレスト・グラフ収集システム。 - 1以上の物体(object)及び主題(subject)の少なくとも一方を含む画像情報を入力手段として用いる検索システムを含む、又は当該検索システムに接続されているサーバであって、
ネットワーク上に存在する多数の画像群、及び端末経由でユーザがネットワーク上にアップロードした画像群の少なくとも一方から、前記ユーザが関心を持った画像全体、或いは画像の特定領域を前記ユーザにより端末上で選択され、
前記選択した画像を、ネットワークを介してサーバ側の画像認識エンジンに問い合わせることにより、前記画像認識エンジンが、前記選択された画像全体、或いは前記特定領域に含まれる様々な一般物体・特定物体・人・顔・シーン・文字・記号・イラストレーション、ロゴ、ファビコンを含む画像構成要素群を抽出及び認識し、
前記認識された入力画像に含まれる前記画像構成要素群を、前記画像認識エンジンを介してサーバ側の関連性検索エンジンに通知することにより、
前記関連性検索エンジンが前記画像構成要素群における画像構成要素それぞれに対し、直接的及び間接的に一定以上の関連があると判断したその他の要素群を、関連性検索エンジン内の関連性知識データベースに学習可能な状態で記憶されている要素間の直接関連性を記述した情報を基に抽出し、
前記画像認識エンジンにより認識された前記画像構成要素群における要素及び前記関連性検索エンジンにより抽出された前記要素群における要素それぞれをノードとする関連性グラフを、前記ノードのそれぞれの間の関連性の深さと共に、前記ユーザの端末に二次元画像、或いは三次元画像、或いは前記関連性グラフの観察時間としての時間軸変数を加えた四次元時空間画像として視覚的に表現し、
前記画像認識エンジンが提示した複数の画像構成要素群の中から、前記ユーザが選択した特定の画像構成要素、或いは端末に表現されている関連性グラフ上の特定のノードの選択と当該ノードを中心とする領域の拡大操作、或いは前記ユーザによるジェスチャー、視線、音声、及び脳波の少なくとも1つを用いた拡大操作を用いることにより得られた入力を、前記端末を介して前記サーバが受け取り、
前記ノードを中心とするより詳細な関連性グラフを前記ユーザの前記端末に視覚的に表現し、
それらの一連の操作を前記ノードに対する前記ユーザの一定の関心の存在であるとし、前記ユーザを中心ノードとする各要素間の直接関連性を記述した情報で、前記ノードに係るユーザの関心の深さを表わす値を変更することで、
前記ユーザを中心ノードとするインタレスト・グラフとして獲得すること、及び、当該インタレスト・グラフを広範なユーザに拡大して獲得することの少なくとも一方により、特定のユーザ、特定のユーザクラスタ、或いはユーザ全体にまたがる統計的なインタレスト・グラフとして収集するよう構成されているサーバ。 - 1以上の物体(object)及び主題(subject)の少なくとも一方を含む画像情報を入力手段として用いる検索システムを含む、又は当該検索システムに接続されているサーバに、
ネットワーク上に存在する多数の画像群、及び端末経由でユーザがネットワーク上にアップロードした画像群の少なくとも一方から、前記ユーザが関心を持った画像全体、或いは画像の特定領域を前記ユーザにより端末上で選択され、
前記選択した画像を、ネットワークを介してサーバ側の画像認識エンジンに問い合わせることにより、前記画像認識エンジンが、前記選択された画像全体、或いは前記特定領域に含まれる様々な一般物体・特定物体・人・顔・シーン・文字・記号・イラストレーション、ロゴ、ファビコンを含む画像構成要素群を抽出及び認識し、
前記認識された入力画像に含まれる前記画像構成要素群を、前記画像認識エンジンを介してサーバ側の関連性検索エンジンに通知することにより、
前記関連性検索エンジンが前記画像構成要素群における画像構成要素それぞれに対し、直接的及び間接的に一定以上の関連があると判断したその他の要素群を、関連性検索エンジン内の関連性知識データベースに学習可能な状態で記憶されている要素間の直接関連性を記述した情報を基に抽出し、
前記画像認識エンジンにより認識された前記画像構成要素群における要素及び前記関連性検索エンジンにより抽出された前記要素群における要素それぞれをノードとする関連性グラフを、前記ノードのそれぞれの間の関連性の深さと共に、前記ユーザの端末に二次元画像、或いは三次元画像、或いは前記関連性グラフの観察時間としての時間軸変数を加えた四次元時空間画像として視覚的に表現し、
前記画像認識エンジンが提示した複数の画像構成要素群の中から、前記ユーザが選択した特定の画像構成要素、或いは端末に表現されている関連性グラフ上の特定のノードの選択と当該ノードを中心とする領域の拡大操作、或いは前記ユーザによるジェスチャー、視線、音声、及び脳波の少なくとも1つを用いた拡大操作を用いることにより得られた入力を、前記端末を介して前記サーバが受け取り、
前記ノードを中心とするより詳細な関連性グラフを前記ユーザの前記端末に視覚的に表現し、
それらの一連の操作を前記ノードに対する前記ユーザの一定の関心の存在であるとし、前記ユーザを中心ノードとする各要素間の直接関連性を記述した情報で、前記ノードに係るユーザの関心の深さを表わす値を変更することで、
前記ユーザを中心ノードとするインタレスト・グラフとして獲得すること、及び、当該インタレスト・グラフを広範なユーザに拡大して獲得することの少なくとも一方により、特定のユーザ、特定のユーザクラスタ、或いはユーザ全体にまたがる統計的なインタレスト・グラフとして収集すること
を実行させるためのコンピュータプログラム。 - 請求項15に記載のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/064463 WO2012176317A1 (ja) | 2011-06-23 | 2011-06-23 | 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012176317A1 JPWO2012176317A1 (ja) | 2015-02-23 |
JP5830784B2 true JP5830784B2 (ja) | 2015-12-09 |
Family
ID=47422192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013521387A Active JP5830784B2 (ja) | 2011-06-23 | 2011-06-23 | 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9600499B2 (ja) |
JP (1) | JP5830784B2 (ja) |
WO (1) | WO2012176317A1 (ja) |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013058608A2 (ko) * | 2011-10-20 | 2013-04-25 | 아주대학교산학협력단 | 트리맵 가시화 시스템 및 방법 |
US9054876B1 (en) * | 2011-11-04 | 2015-06-09 | Google Inc. | Fast efficient vocabulary computation with hashed vocabularies applying hash functions to cluster centroids that determines most frequently used cluster centroid IDs |
US10360706B2 (en) * | 2012-05-22 | 2019-07-23 | Sony Corporation | Device method and program for adjusting a display state of a superimposed image |
SG11201407749TA (en) * | 2012-05-24 | 2014-12-30 | Hitachi Ltd | Image analysis device, image analysis system, and image analysis method |
IN2015KN00242A (ja) * | 2012-07-20 | 2015-06-12 | Intertrust Tech Corp | |
US9124545B2 (en) | 2013-02-14 | 2015-09-01 | Facebook, Inc. | Lock screen with socialized applications |
CN105027162B (zh) * | 2013-02-27 | 2018-02-02 | 株式会社日立制作所 | 图像解析装置、图像解析系统、图像解析方法 |
EP2973044A2 (en) * | 2013-03-15 | 2016-01-20 | James Webber | Graph database devices and methods for partitioning graphs |
US10740396B2 (en) | 2013-05-24 | 2020-08-11 | Sap Se | Representing enterprise data in a knowledge graph |
US20140351241A1 (en) * | 2013-05-24 | 2014-11-27 | Sap Ag | Identifying and invoking applications based on data in a knowledge graph |
US9158599B2 (en) | 2013-06-27 | 2015-10-13 | Sap Se | Programming framework for applications |
WO2014208575A1 (ja) | 2013-06-28 | 2014-12-31 | 日本電気株式会社 | 映像監視システム、映像処理装置、映像処理方法および映像処理プログラム |
JP6220179B2 (ja) * | 2013-07-25 | 2017-10-25 | 日本放送協会 | 番組検索装置及び番組検索プログラム |
US9348947B2 (en) | 2013-07-26 | 2016-05-24 | Helynx, Inc. | Systems and methods for visualizing and manipulating graph databases |
US10776965B2 (en) * | 2013-07-26 | 2020-09-15 | Drisk, Inc. | Systems and methods for visualizing and manipulating graph databases |
US9443167B2 (en) * | 2013-08-02 | 2016-09-13 | Emotient, Inc. | Filter and shutter based on image emotion content |
US10152495B2 (en) * | 2013-08-19 | 2018-12-11 | Qualcomm Incorporated | Visual search in real world using optical see-through head mounted display with augmented reality and user interaction tracking |
EP3044731A4 (en) * | 2013-09-11 | 2017-02-22 | See-Out Pty Ltd. | Image searching method and apparatus |
KR102120864B1 (ko) * | 2013-11-06 | 2020-06-10 | 삼성전자주식회사 | 영상 처리 방법 및 장치 |
TWI536186B (zh) | 2013-12-12 | 2016-06-01 | 三緯國際立體列印科技股份有限公司 | 三維圖檔搜尋方法與三維圖檔搜尋系統 |
US10885095B2 (en) * | 2014-03-17 | 2021-01-05 | Verizon Media Inc. | Personalized criteria-based media organization |
JP5926755B2 (ja) | 2014-03-19 | 2016-05-25 | 国立大学法人京都大学 | 関係性グラフ用オブジェクト表示システム |
JP6320112B2 (ja) | 2014-03-27 | 2018-05-09 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
EP3147798A4 (en) * | 2014-05-22 | 2018-01-17 | Sony Corporation | Information processing device, information processing method, and program |
US10091411B2 (en) * | 2014-06-17 | 2018-10-02 | Lg Electronics Inc. | Mobile terminal and controlling method thereof for continuously tracking object included in video |
US20160203137A1 (en) * | 2014-12-17 | 2016-07-14 | InSnap, Inc. | Imputing knowledge graph attributes to digital multimedia based on image and video metadata |
WO2016103651A1 (ja) * | 2014-12-22 | 2016-06-30 | 日本電気株式会社 | 情報処理システム、情報処理方法、及び、記録媒体 |
US20160292247A1 (en) * | 2015-03-31 | 2016-10-06 | Kenneth Scott Kaufman | Method of retrieving categorical data entries through an interactive graphical abstraction |
KR101713197B1 (ko) * | 2015-04-01 | 2017-03-09 | 주식회사 씨케이앤비 | 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템 |
US10078651B2 (en) * | 2015-04-27 | 2018-09-18 | Rovi Guides, Inc. | Systems and methods for updating a knowledge graph through user input |
US10402446B2 (en) | 2015-04-29 | 2019-09-03 | Microsoft Licensing Technology, LLC | Image entity recognition and response |
JP2016218950A (ja) * | 2015-05-26 | 2016-12-22 | 株式会社神戸デジタル・ラボ | インタレスト情報生成システム |
US9934327B2 (en) | 2015-06-01 | 2018-04-03 | International Business Machines Corporation | Mining relevant approximate subgraphs from multigraphs |
US10474320B2 (en) * | 2015-06-07 | 2019-11-12 | Apple Inc. | Document channel selection for document viewing application |
KR20170004450A (ko) * | 2015-07-02 | 2017-01-11 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
US9396400B1 (en) * | 2015-07-30 | 2016-07-19 | Snitch, Inc. | Computer-vision based security system using a depth camera |
US10878021B2 (en) | 2015-08-17 | 2020-12-29 | Adobe Inc. | Content search and geographical considerations |
US10475098B2 (en) | 2015-08-17 | 2019-11-12 | Adobe Inc. | Content creation suggestions using keywords, similarity, and social networks |
US11048779B2 (en) | 2015-08-17 | 2021-06-29 | Adobe Inc. | Content creation, fingerprints, and watermarks |
US9881226B1 (en) * | 2015-09-24 | 2018-01-30 | Amazon Technologies, Inc. | Object relation builder |
WO2017055890A1 (en) | 2015-09-30 | 2017-04-06 | The Nielsen Company (Us), Llc | Interactive product auditing with a mobile device |
CN105354550B (zh) * | 2015-11-03 | 2018-09-28 | 华东师范大学 | 一种基于图像局部特征点配准的表单内容提取方法 |
US10956948B2 (en) * | 2015-11-09 | 2021-03-23 | Anupam Madiratta | System and method for hotel discovery and generating generalized reviews |
CN106779791B (zh) * | 2015-11-25 | 2021-01-15 | 阿里巴巴集团控股有限公司 | 一种搭配对象图片组合的生成方法及装置 |
US10872114B2 (en) * | 2015-12-17 | 2020-12-22 | Hitachi, Ltd. | Image processing device, image retrieval interface display device, and method for displaying image retrieval interface |
JP2017117335A (ja) * | 2015-12-25 | 2017-06-29 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
US10185755B2 (en) * | 2015-12-28 | 2019-01-22 | Business Objects Software Limited | Orchestration of data query processing in a database system |
US20170249325A1 (en) * | 2016-02-26 | 2017-08-31 | Microsoft Technology Licensing, Llc | Proactive favorite leisure interest identification for personalized experiences |
US10049267B2 (en) * | 2016-02-29 | 2018-08-14 | Toyota Jidosha Kabushiki Kaisha | Autonomous human-centric place recognition |
US10452874B2 (en) | 2016-03-04 | 2019-10-22 | Disney Enterprises, Inc. | System and method for identifying and tagging assets within an AV file |
JP6645879B2 (ja) * | 2016-03-16 | 2020-02-14 | 株式会社東芝 | 関係可視化装置、方法およびプログラム |
US10783382B2 (en) * | 2016-04-06 | 2020-09-22 | Semiconductor Components Industries, Llc | Systems and methods for buffer-free lane detection |
US10740385B1 (en) * | 2016-04-21 | 2020-08-11 | Shutterstock, Inc. | Identifying visual portions of visual media files responsive to search queries |
US10671930B2 (en) * | 2016-05-01 | 2020-06-02 | Indiggo Associates LLC | Knowledge inference apparatus and methods to determine emerging industrial trends and adapt strategic reasoning thereof |
US20170337293A1 (en) * | 2016-05-18 | 2017-11-23 | Sisense Ltd. | System and method of rendering multi-variant graphs |
US11550455B2 (en) * | 2016-06-07 | 2023-01-10 | Palo Alto Research Center Incorporated | Localized visual graph filters for complex graph queries |
US10339708B2 (en) * | 2016-11-01 | 2019-07-02 | Google Inc. | Map summarization and localization |
WO2018093182A1 (en) * | 2016-11-16 | 2018-05-24 | Samsung Electronics Co., Ltd. | Image management method and apparatus thereof |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
JP6750046B2 (ja) * | 2017-01-31 | 2020-09-02 | 株式会社Nttドコモ | 情報処理装置及び情報処理方法 |
JP6811645B2 (ja) * | 2017-02-28 | 2021-01-13 | 株式会社日立製作所 | 画像検索装置及び画像検索方法 |
US10394987B2 (en) | 2017-03-21 | 2019-08-27 | International Business Machines Corporation | Adaptive bug-search depth for simple and deep counterexamples |
US20180339730A1 (en) * | 2017-05-26 | 2018-11-29 | Dura Operating, Llc | Method and system for generating a wide-area perception scene graph |
GB201709845D0 (en) * | 2017-06-20 | 2017-08-02 | Nchain Holdings Ltd | Computer-implemented system and method |
US10572743B1 (en) | 2017-08-28 | 2020-02-25 | Ambarella, Inc. | Real-time color classification for street vehicles |
JP7006059B2 (ja) * | 2017-09-12 | 2022-01-24 | 凸版印刷株式会社 | 画像処理装置、画像処理方法、及びプログラム |
CN108064389B (zh) * | 2017-09-15 | 2019-02-01 | 达闼科技(北京)有限公司 | 一种目标识别方法、装置和智能终端 |
KR102599947B1 (ko) | 2017-10-27 | 2023-11-09 | 삼성전자주식회사 | 관련 이미지를 검색하기 위한 전자 장치 및 이의 제어 방법 |
JP6989450B2 (ja) * | 2018-06-21 | 2022-01-05 | 株式会社東芝 | 画像解析装置、画像解析方法及びプログラム |
JP7131195B2 (ja) * | 2018-08-14 | 2022-09-06 | 日本電信電話株式会社 | 物体認識装置、物体認識学習装置、方法、及びプログラム |
US11436215B2 (en) | 2018-08-20 | 2022-09-06 | Samsung Electronics Co., Ltd. | Server and control method thereof |
WO2020055910A1 (en) | 2018-09-10 | 2020-03-19 | Drisk, Inc. | Systems and methods for graph-based ai training |
WO2020054067A1 (ja) * | 2018-09-14 | 2020-03-19 | 三菱電機株式会社 | 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム |
RU2707710C1 (ru) * | 2018-10-13 | 2019-11-28 | Анатолий Васильевич Попов | Способ выделения вектора признаков для распознавания изображений объектов |
US11205050B2 (en) * | 2018-11-02 | 2021-12-21 | Oracle International Corporation | Learning property graph representations edge-by-edge |
US10896493B2 (en) * | 2018-11-13 | 2021-01-19 | Adobe Inc. | Intelligent identification of replacement regions for mixing and replacing of persons in group portraits |
CN111382628B (zh) * | 2018-12-28 | 2023-05-16 | 成都云天励飞技术有限公司 | 同行判定方法及装置 |
JP7272626B2 (ja) * | 2019-01-09 | 2023-05-12 | i-PRO株式会社 | 照合システム、照合方法およびカメラ装置 |
US11755925B2 (en) * | 2019-03-13 | 2023-09-12 | Fair Isaac Corporation | Computer-implemented decision management systems and methods |
US11720621B2 (en) * | 2019-03-18 | 2023-08-08 | Apple Inc. | Systems and methods for naming objects based on object content |
US10853983B2 (en) * | 2019-04-22 | 2020-12-01 | Adobe Inc. | Suggestions to enrich digital artwork |
US11107098B2 (en) | 2019-05-23 | 2021-08-31 | Content Aware, Llc | System and method for content recognition and data categorization |
US11861863B2 (en) * | 2019-06-17 | 2024-01-02 | Faro Technologies, Inc. | Shape dependent model identification in point clouds |
JP7155074B2 (ja) * | 2019-07-03 | 2022-10-18 | 富士フイルム株式会社 | 情報提案システム、情報提案方法、プログラムおよび記録媒体 |
CN110795569B (zh) | 2019-10-08 | 2021-06-15 | 北京百度网讯科技有限公司 | 知识图谱的向量表示生成方法、装置及设备 |
US11475065B2 (en) * | 2019-10-29 | 2022-10-18 | Neo4J Sweden Ab | Pre-emptive graph search for guided natural language interactions with connected data systems |
CN111582152A (zh) * | 2020-05-07 | 2020-08-25 | 微特技术有限公司 | 一种识别图像中复杂事件的方法及系统 |
WO2021256184A1 (en) * | 2020-06-18 | 2021-12-23 | Nec Corporation | Method and device for adaptively displaying at least one potential subject and a target subject |
CN111967467B (zh) * | 2020-07-24 | 2022-10-04 | 北京航空航天大学 | 图像目标检测方法、装置、电子设备和计算机可读介质 |
US12045278B2 (en) | 2020-09-18 | 2024-07-23 | Google Llc | Intelligent systems and methods for visual search queries |
CN114282545A (zh) * | 2021-09-23 | 2022-04-05 | 中国银联股份有限公司 | 生成对象简称的方法和系统、存储介质以及程序产品 |
CN117610105B (zh) * | 2023-12-07 | 2024-06-07 | 上海烜翊科技有限公司 | 一种面向系统设计结果自动生成的模型视图结构设计方法 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6038333A (en) * | 1998-03-16 | 2000-03-14 | Hewlett-Packard Company | Person identifier and management system |
EP1129417A4 (en) * | 1998-12-04 | 2004-06-30 | Technology Enabling Company Ll | DATA ORGANIZATION SYSTEMS AND METHODS |
GB2375212B (en) * | 1999-04-29 | 2003-06-11 | Mitsubishi Electric Inf Tech | Method and apparatus for searching for an object using shape |
US6598043B1 (en) * | 1999-10-04 | 2003-07-22 | Jarg Corporation | Classification of information sources using graph structures |
KR100353798B1 (ko) * | 1999-12-01 | 2002-09-26 | 주식회사 코난테크놀로지 | 영상 객체 모양 정보 추출 방법 및 그를 이용한 내용기반 이미지 검색 시스템 및 그 방법 |
JP2001222586A (ja) * | 2000-02-09 | 2001-08-17 | Sony Corp | オンラインショッピング装置、オンラインショピング方法とそのシステムおよびその端末装置 |
US6691126B1 (en) * | 2000-06-14 | 2004-02-10 | International Business Machines Corporation | Method and apparatus for locating multi-region objects in an image or video database |
US7624337B2 (en) * | 2000-07-24 | 2009-11-24 | Vmark, Inc. | System and method for indexing, searching, identifying, and editing portions of electronic multimedia files |
TW501035B (en) * | 2001-03-20 | 2002-09-01 | Ulead Systems Inc | Interactive image searching method based on local object |
US7773800B2 (en) * | 2001-06-06 | 2010-08-10 | Ying Liu | Attrasoft image retrieval |
US7512612B1 (en) * | 2002-08-08 | 2009-03-31 | Spoke Software | Selecting an optimal path through a relationship graph |
US7788260B2 (en) | 2004-06-14 | 2010-08-31 | Facebook, Inc. | Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation |
US7672911B2 (en) * | 2004-08-14 | 2010-03-02 | Hrl Laboratories, Llc | Graph-based cognitive swarms for object group recognition in a 3N or greater-dimensional solution space |
JP2009504222A (ja) * | 2005-08-09 | 2009-02-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ブラインドデコンボリューションによりノイズの多い画像の構造を空間的に強調するシステム及び方法 |
JP2007264718A (ja) * | 2006-03-27 | 2007-10-11 | Yafoo Japan Corp | ユーザ興味分析装置、方法、プログラム |
US8085995B2 (en) * | 2006-12-01 | 2011-12-27 | Google Inc. | Identifying images using face recognition |
US20080201206A1 (en) * | 2007-02-01 | 2008-08-21 | 7 Billion People, Inc. | Use of behavioral portraits in the conduct of E-commerce |
JP2010525431A (ja) * | 2007-04-19 | 2010-07-22 | ディー−ウェイブ システムズ,インコーポレイテッド | 自動画像認識用のシステム、方法、および装置 |
JP2010530998A (ja) * | 2007-05-08 | 2010-09-16 | アイトゲネーシッシュ テヒニッシュ ホーホシューレ チューリッヒ | 画像ベース情報検索の方法およびシステム |
JP5154975B2 (ja) * | 2008-02-26 | 2013-02-27 | 日本電信電話株式会社 | 興味体系グラフ形成装置、興味体系グラフ形成方法、および、興味体系グラフ形成プログラム |
US8364528B2 (en) * | 2008-05-06 | 2013-01-29 | Richrelevance, Inc. | System and process for improving product recommendations for use in providing personalized advertisements to retail customers |
US8417698B2 (en) * | 2008-05-06 | 2013-04-09 | Yellowpages.Com Llc | Systems and methods to provide search based on social graphs and affinity groups |
US8386486B2 (en) * | 2008-07-02 | 2013-02-26 | Palo Alto Research Center Incorporated | Method for facilitating social networking based on fashion-related information |
US8145521B2 (en) * | 2008-07-15 | 2012-03-27 | Google Inc. | Geographic and keyword context in embedded applications |
WO2010006367A1 (en) * | 2008-07-16 | 2010-01-21 | Imprezzeo Pty Ltd | Facial image recognition and retrieval |
US8972410B2 (en) * | 2008-07-30 | 2015-03-03 | Hewlett-Packard Development Company, L.P. | Identifying related objects in a computer database |
US8391615B2 (en) * | 2008-12-02 | 2013-03-05 | Intel Corporation | Image recognition algorithm, method of identifying a target image using same, and method of selecting data for transmission to a portable electronic device |
US8320617B2 (en) | 2009-03-27 | 2012-11-27 | Utc Fire & Security Americas Corporation, Inc. | System, method and program product for camera-based discovery of social networks |
JP5199939B2 (ja) * | 2009-04-15 | 2013-05-15 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
US20110145275A1 (en) * | 2009-06-19 | 2011-06-16 | Moment Usa, Inc. | Systems and methods of contextual user interfaces for display of media items |
US9135277B2 (en) * | 2009-08-07 | 2015-09-15 | Google Inc. | Architecture for responding to a visual query |
US8670597B2 (en) * | 2009-08-07 | 2014-03-11 | Google Inc. | Facial recognition with social network aiding |
US8781231B1 (en) * | 2009-08-25 | 2014-07-15 | Google Inc. | Content-based image ranking |
KR101657565B1 (ko) * | 2010-04-21 | 2016-09-19 | 엘지전자 주식회사 | 증강 원격제어장치 및 그 동작 방법 |
US8818049B2 (en) * | 2011-05-18 | 2014-08-26 | Google Inc. | Retrieving contact information based on image recognition searches |
-
2011
- 2011-06-23 JP JP2013521387A patent/JP5830784B2/ja active Active
- 2011-06-23 WO PCT/JP2011/064463 patent/WO2012176317A1/ja active Application Filing
- 2011-06-23 US US14/129,005 patent/US9600499B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2012176317A1 (ja) | 2012-12-27 |
US9600499B2 (en) | 2017-03-21 |
JPWO2012176317A1 (ja) | 2015-02-23 |
US20140149376A1 (en) | 2014-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5830784B2 (ja) | 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム | |
KR101768521B1 (ko) | 이미지에 포함된 객체에 대한 정보 데이터를 제공하는 방법 및 시스템 | |
Liu et al. | Classifying urban land use by integrating remote sensing and social media data | |
US8837831B2 (en) | Method and system for managing digital photos | |
US7917514B2 (en) | Visual and multi-dimensional search | |
US9563623B2 (en) | Method and apparatus for correlating and viewing disparate data | |
US11036790B1 (en) | Identifying visual portions of visual media files responsive to visual portions of media files submitted as search queries | |
CN111125422A (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
CN106255968A (zh) | 自然语言图像搜索 | |
WO2008002638A1 (en) | Visual and multi-dimensional search | |
US10740385B1 (en) | Identifying visual portions of visual media files responsive to search queries | |
JP6787831B2 (ja) | 検索結果による学習が可能な対象検出装置、検出モデル生成装置、プログラム及び方法 | |
Cho et al. | Classifying tourists’ photos and exploring tourism destination image using a deep learning model | |
CN114329069A (zh) | 视觉搜索查询的智能系统和方法 | |
Maihami et al. | Automatic image annotation using community detection in neighbor images | |
Ma et al. | An application of metadata-based image retrieval system for facility management | |
Zhang et al. | Automatic latent street type discovery from web open data | |
Kitamura et al. | Tourist spot recommendation applying generic object recognition with travel photos | |
US20220198771A1 (en) | Discovery, Management And Processing Of Virtual Real Estate Content | |
Lei et al. | A new clothing image retrieval algorithm based on sketch component segmentation in mobile visual sensors | |
Guo et al. | Object discovery in high-resolution remote sensing images: a semantic perspective | |
US10783398B1 (en) | Image editor including localized editing based on generative adversarial networks | |
CN114489434A (zh) | 一种显示方法、显示装置及计算机存储介质 | |
Tseng et al. | Crowdsourced object-labeling based on a game-based mobile application | |
Song | Large‐Scale Image Retrieval of Tourist Attractions Based on Multiple Linear Regression Equations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151002 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5830784 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |