JP5234469B2 - 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム - Google Patents
対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム Download PDFInfo
- Publication number
- JP5234469B2 JP5234469B2 JP2009532255A JP2009532255A JP5234469B2 JP 5234469 B2 JP5234469 B2 JP 5234469B2 JP 2009532255 A JP2009532255 A JP 2009532255A JP 2009532255 A JP2009532255 A JP 2009532255A JP 5234469 B2 JP5234469 B2 JP 5234469B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- data
- variable
- probability
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000012545 processing Methods 0.000 claims description 125
- 239000011159 matrix material Substances 0.000 claims description 90
- 230000009466 transformation Effects 0.000 claims description 88
- 239000013598 vector Substances 0.000 claims description 80
- 238000010219 correlation analysis Methods 0.000 claims description 67
- 238000006243 chemical reaction Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 31
- 238000000605 extraction Methods 0.000 claims description 30
- 230000014509 gene expression Effects 0.000 claims description 25
- 238000013500 data storage Methods 0.000 claims description 21
- 238000000354 decomposition reaction Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 11
- 238000000844 transformation Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000003491 array Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 96
- 241000282472 Canis lupus familiaris Species 0.000 description 27
- 235000008314 Echinocereus dasyacanthus Nutrition 0.000 description 24
- 240000005595 Echinocereus dasyacanthus Species 0.000 description 24
- 238000007726 management method Methods 0.000 description 22
- 241000282326 Felis catus Species 0.000 description 17
- 238000012986 modification Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000000007 visual effect Effects 0.000 description 8
- 238000005286 illumination Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
実世界情報と該実世界情報に対応したシンボルとの関係を学習する対応関係学習装置であって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量を複数記憶する第1特徴量記憶手段と、
前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量を複数記憶する第2特徴量記憶手段と、
前記第1および第2特徴量の組み合わせを複数用いた正準相関分析を実行し、前記第1および第2特徴量の少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するための変換を取得する正準相関分析手段と、
前記正準相関分析手段により取得された前記変換を記憶すると共に、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数を記憶する分析結果記憶手段と、
前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する確率と該隠れ変数から任意の第2特徴量が出現する確率とを得るために必要な情報を導出する情報導出手段と、
前記情報導出手段により導出された情報を記憶する情報記憶手段と、
を備えるものである。
実世界情報と該実世界情報に対応したシンボルとの関係を学習するための対応関係学習方法であって、
(a)実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との組み合わせを複数用いた正準相関分析を実行し、前記第1および第2特徴量の少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するための変換を取得するステップと、
(b)ステップ(a)にて取得した変換を用いて前記第1および第2特徴量の組み合わせごとに隠れ変数を取得するステップと、
(c)前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する確率と該隠れ変数から任意の第2特徴量が出現する確率とを得るために必要な情報を導出するステップと、
を含むものである。
コンピュータを実世界情報と該実世界情報に対応したシンボルとの関係を学習する装置として機能させる対応関係学習用プログラムであって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との組み合わせを複数用いた正準相関分析を実行し、前記第1および第2特徴量の少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するための変換を取得する変換取得モジュールと、
前記取得された変換を用いて前記第1および第2特徴量の組み合わせごとに隠れ変数を取得する隠れ変数取得モジュールと、
前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する確率と該隠れ変数から任意の第2特徴量が出現する確率とを得るために必要な情報を導出する情報導出モジュールと、
を備えるものである。
実世界情報にメタデータとしてのシンボルを付与するアノテーション装置であって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する確率および該隠れ変数から任意の第2特徴量が出現する確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段と、
新奇第1データの入力を受け付ける入力受付手段と、
前記受け付けられた新奇第1データに基づいて該新奇第1データの特徴を示す新奇第1特徴量を抽出する第1特徴量抽出手段と、
前記学習情報記憶手段に記憶された学習情報を用いて、前記抽出された新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する確率を算出する確率算出手段と、
前記確率算出手段により算出された確率に基づいて前記新奇第1データに対してシンボルを割り付けるシンボル割付手段と、
を備えるものである。
実世界情報にメタデータとしてのシンボルを付与するためのアノテーション方法であって、
(a)実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する確率および該隠れ変数から任意の第2特徴量が出現する確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶手段に記憶させるステップと、
(b)前記学習情報を用いて、新奇第1データの特徴として抽出された新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する確率を算出するステップと、
(c)ステップ(b)にて算出した確率に基づいて前記新奇第1データに対してシンボルを割り付けるステップと、
を含むものである。
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する確率および該隠れ変数から任意の第2特徴量が出現する確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段を備えたコンピュータを実世界情報にメタデータとしてのシンボルを付与する装置として機能させるアノテーション用プログラムであって、
前記学習情報を用いて、新奇第1データの特徴として抽出された新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する確率を算出する確率算出モジュールと、
前記算出された確率に基づいて前記新奇第1データに対してシンボルを割り付けるシンボル割付モジュールと、
を備えるものである。
メタデータとしてのシンボルが付与されていない実世界情報を該シンボルに基づいて取り出し可能とするリトリーバル装置であって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する確率および該隠れ変数から任意の第2特徴量が出現する確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段と、
第2データとの対応付けがなされていない第1データである未注釈第1データを少なくとも1つ記憶する未注釈第1データ記憶手段と、
前記未注釈第1データから該未注釈第1データの特徴として抽出された未注釈第1特徴量を記憶する未注釈第1特徴量記憶手段と、
検索クエリとしての少なくとも1つのシンボルの入力を受け付ける入力受付手段と、
前記受け付けられた少なくとも1つのシンボルに基づいて、該少なくとも1つのシンボルを示す前記第2データの第2特徴量を検索用第2特徴量として設定する検索用第2特徴量設定手段と、
前記学習情報記憶手段に記憶された学習情報を用いて、前記未注釈第1特徴量から前記設定された検索用第2特徴量が出現する確率を算出する確率算出手段と、
前記確率算出手段により算出された確率に基づいて前記未注釈第1データ記憶手段から前記未注釈第1データを取り出すデータ取出手段と、
を備えるものである。
メタデータとしてのシンボルが付与されていない実世界情報を該シンボルに基づいて取り出し可能とするリトリーバル方法であって、
(a)実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する確率および該隠れ変数から任意の第2特徴量が出現する確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶手段に記憶させるステップと、
(b)指定された少なくとも1つのシンボルに基づいて、該少なくとも1つのシンボルを示す前記第2データの第2特徴量を検索用第2特徴量として設定するステップと、
(c)前記学習情報を用いて、第2データとの対応付けがなされていない第1データである未注釈第1データの特徴として抽出された未注釈第1特徴量から前記設定された検索用第2特徴量が出現する確率を算出するステップと、
(d)ステップ(c)にて算出した確率に基づいて前記記憶手段から前記未注釈第1データを取り出すステップと、
を含むものである。
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する確率および該隠れ変数から任意の第2特徴量が出現する確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段を備えたコンピュータをメタデータとしてのシンボルが付与されていない実世界情報を該シンボルに基づいて取り出し可能とする装置として機能させるリトリーバル用プログラムであって、
指定された少なくとも1つのシンボルに基づいて、該少なくとも1つのシンボルを示す前記第2データの第2特徴量を検索用第2特徴量として設定する検索用第2特徴量設定モジュールと、
前記学習情報を用いて、第2データとの対応付けがなされていない第1データである未注釈第1データの特徴として抽出された未注釈第1特徴量から前記設定された検索用第2特徴量が出現する確率を算出する確率算出モジュールと、
前記算出された算出した確率に基づいて前記未注釈第1データを取り出すデータ取出モジュールと、
を備えるものである。
初期学習ルーチンの具体的な説明に先立って、まず、初期学習ルーチンの基となる基本的な考え方について説明する。かかる初期学習ルーチンは、画像データに対するアノテーションや未注釈画像データのリトリーバルを可能とするために、実世界情報を示す第1データとしての画像データとシンボルを示す第2データとしての単語群データとの対応関係の学習処理として予め実行されるものである。そして、ここでは、画像データと単語群データとの対応関係すなわち画像とシンボルとの対応関係が、画像データから抽出される画像特徴量と単語群データから抽出される単語特徴量とが同時に出現する確率(Probability)の問題として取り扱われる。このように画像と単語との関係を確率の問題として取り扱うこととすれば、ある画像と単語とが同時に出現する確率を求めることにより、確率が高い順にメタデータとしての単語を画像に割り付けたり、確率が高い順に所望の単語に対応した画像を取り出したりすることが可能となる。ここで、画像データからその特徴として抽出される画像特徴量をxとし、画像に現れているものを示す少なくとも1つの単語(シンボル)を示す単語群データからその特徴として抽出された画像特徴量をyとし、画像特徴量xと単語特徴量yとが同時に出力する確率をP(x,y)と表す。
“P(白,チワワ)=P(白|犬概念)×P(チワワ|犬概念)×P(犬概念)”
と表すこともできる。ただし、世の中には「犬」という概念のみならず、「猫」という概念や「ねずみ」という概念といったさまざまな概念が存在していることから、確率P(白,チワワ)としては、例えば「猫」という概念から「白」や「チワワ」が出現する確率や、「ねずみ」という概念から「白」や「チワワ」が出現する確率も考慮しておく必要がある。このような他の抽象的概念をも考慮すれば、確率P(白,チワワ)は、
“P(白,チワワ)=P(白|犬概念)×P(チワワ|犬概念)×P(犬概念)+P(白|猫概念)×P(チワワ|猫概念)×P(猫概念)+P(白|ねずみ概念)×P(チワワ|ねずみ概念)×P(ねずみ概念)…”
と表されることになる。このような観点から、式(0)は、判明している抽象的概念のすべてについての確率を積分計算するものとして定義される。もちろん、「猫」という概念から「チワワ」が出現する確率P(チワワ|猫概念)や「ねずみ」という概念から「チワワ」が出現する確率P(チワワ|ねずみ概念)は極めて小さいことから、これらの「犬」以外の抽象的概念に関連した確率自体は、確率P(白、チワワ)の値には、ほとんど貢献しない。
引き続き、管理コンピュータ30のアノテーション処理部36により実行されるアノテーションルーチンについて説明する。ここでも、アノテーションルーチンの具体的な説明に先立って、まずアノテーションルーチンの基となる基本的な考え方について説明する。上述のように、例えば新奇な未注釈画像データから抽出された画像特徴量(HLAC)を新奇画像特徴量xnewとしたときに、新奇画像特徴量xnewから単一の単語のみを示す単語群データの単語特徴量wが出現する確率P(w|xnew)を求め、確率が高い順に単語特徴量wに対応した単語を新奇画像特徴量xnewに対応した未注釈画像データに対して割り付けていけば、未注釈画像データに対して適切な単語群を割り付けることが可能となる。ここで、新奇画像特徴量xnewから単語特徴量wが出現する確率P(w|xnew)は、ベイズの定理より、次式(20)のように表すことが可能であり、式(16)を用いれば式(20)は、次式(21)のように変形することができる。また、式(21)において、確率P(xnew)は、どの単語特徴量wに対しても同じ値をとることから、これを定数とみなせば、画像特徴量xnewから単語wが出現する確率P(w|xnew)は、結局、上記式(13)のように表すことができる。
P(犬|xnew)=h1×P(犬|si)+h2×P(犬|s2)+h3×P(犬|s3)+h4×P(犬|s4 )+h5×P(犬|s5)+h6×P(犬|s6)…
P(猫|xnew)=h1×P(猫|si)+h2×P(猫|s2)+h3×P(猫|s3)+h4×P(猫|s4 )+h5×P(猫|s5)+h6×P(猫|s6)…
P(ねずみ|xnew)=h1×P(ねずみ|si)+h2×P(ねずみ|s2)+h3×P(ねずみ|s3)+h4×P(ねずみ|s4 )+h5×P(ねずみ|s5)+h6×P(ねずみ|s6)…
といったように算出することができる。
引き続き、管理コンピュータ30のリトリーバル処理部38により実行されるリトリーバルルーチンについて説明する。ここでも、リトリーバルルーチンの具体的な説明に先立って、まずリトリーバルルーチンの基となる基本的な考え方について説明する。上述のように、複数の未注釈画像データの中から所望の単語群に対応した画像データを取り出すリトリーバルを実行するためには、未注釈画像データの画像特徴量から当該単語群に基づく単語特徴量が出現する確率を求めればよい。すなわち、多数の未注釈画像データが存在する場合、未注釈画像データの画像特徴量ごとに当該画像特徴量から上記単語群に基づく単語特徴量が出現する確率を求めると共に当該確率が高い順に未注釈画像データを取り出すことにより、多数の未注釈画像データの中から所望の単語群に対応したものを取り出すことが可能となる。ここで、単語群データとの対応付けがなされていない未注釈画像データから抽出された未注釈画像特徴量をxjとし(ただし、j=1,…,Nであり、“N”は未注釈画像データの総数を示す。)、画像データを取り出すための検索クエリに相当する単語群に基づく単語特徴量を検索用単語特徴量ynewとすれば、未注釈画像特徴量xiから検索用単語特徴量ynewが出現する確率P(ynew|xi)は、ベイズの定理や上記式(0)等を利用すると、次式(22)のように表すことができる。そして、抽象的概念Lとして隠れ変数{si}n i=1を利用すると共に、P(si)=1/nとすれば、式(22)を更に変形させた次式(23)から確率P(ynew|xi)を求めることが可能となる。
引き続き、実施例の画像データ処理システム20において実行される学習情報更新ルーチンについて説明する。ここで、画像データ処理システム20において取り扱われる実世界情報を示す第1データとしての画像データと、それに対応した第2データである単語群データとの組み合わせ、すなわち画像特徴量xiと単語特徴量yiとの組み合わせは、基本的に無限に増加し得るものである。このため、新奇画像特徴量と当該新奇画像特徴量に対応した新奇単語特徴量との組み合わせが出現するたびに、当該新奇画像特徴量と新奇単語特徴量との組み合わせを含むすべての組み合わせについて正準相関分析等を実行して上記変換や隠れ変数、確率を得るための情報を求めるとすれば、管理コンピュータ30の処理負担が多大なものとなってしまう。このため、実施例の画像データ処理システム20では、新奇画像特徴量と当該新奇画像特徴量に対応した新奇単語特徴量との組み合わせが出現するたびに、新奇画像特徴量と新奇単語特徴量とに基づいて射影行列AおよびBや隠れ変数si等を更新する学習情報更新ルーチンが実行されるのである。
以下、本発明の変形例について説明する。なお、重複した説明を回避するために、上記画像データ処理システム20に関連して説明した要素(ステップ番号を含む)と同一の要素に対しては同一の符号を用いるものとし、詳細な説明を省略する。
上記実施例では、図4および図5に示したように、変換fにより画像特徴量xを正準空間に射影して得られる第1変量sと、変換gにより単語特徴量yを正準空間に射影して得られる第2変量tとのうちの一方(第1変量s)が抽象的概念Lを示す隠れ変数として用いられ、変換fおよびgとしては、上記式(3)の固有値問題の解である射影行列AおよびBが用いられる。ただし、射影行列AおよびBは、第1変量sと第2変量tとの相関を最大とするものの、基本的に互いに対応し合う第1および第2変量sおよびt同士を完全に一致させるものとはなり得ない。従って、第1変量sおよび第2変量tの一方を隠れ変数として用いる上記実施例には、アノテーションやリトリーバルの精度向上という面でなお改善の余地がある。ここで、確率的正準相関分析の枠組みにおいて、1組の画像特徴量x(第1変量s)と単語特徴量y(第2変量t)とは、図18に示すように、正準空間上である中心zと分散Φとをもった正規分布を形成する。従って、第1変量sと第2変量tとの何れか一方を隠れ変数とする代わりに、画像特徴量xと単語特徴量yとの組み合わせごとに取得される正規分布の中心zを隠れ変数として利用すれば、実世界情報と当該実世界情報に対応したシンボルとを結びつける抽象的概念をより一層適正なものとすることができる。
上述のアノテーションルーチンやリトリーバルルーチンの実行に際して、1つの未注釈画像データのアノテーションやリトリーバルに要する計算コストは、学習済みの画像データ(画像特徴量)の数に比例する。従って、画像データ処理システム20の規模が大きくなり、取り扱い対象となる画像データ数が増加すればするほど、アノテーションやリトリーバルに要する計算コストが増大化することになる。ここで、図10のアノテーションルーチンや図12のリトリーバルルーチンでは、1つの未注釈画像データについて、すべての単語特徴量(全単語)やすべての隠れ変数(si)との類似度を求めているが(ステップS230,S320)、実際のところ、多数の単語特徴量や隠れ変数のうちの大部分は、正準空間上で学習済みの画像データから遠く離れており、アノテーションやリトリーバルの精度に寄与しないものと考えられる。従って、初期学習に際して正準空間を予めベクトル量子化して構造化を図っておくことで、アノテーションやリトリーバルの精度を低下させることなく計算速度を大幅に向上させることが可能となるであろう。
図25は、変形例に係る学習情報更新ルーチンを示すフローチャートである。同図に示す学習情報更新ルーチンは、図14の学習情報更新ルーチンにおけるステップS440〜S470の処理を以下に説明するステップS445およびS475の処理に置き換えたものに相当し、図25の学習情報更新ルーチンの実行に際して、学習処理部35は、まずステップS400〜S430の処理を実行する。ここでは、ステップS430の処理が完了した段階で、n−1個の画像特徴量x(1),…,x(i),…,x(n−1)および単語特徴量y(1),…,y(i),…,y(n−1)の組み合わせと、n番目の新奇画像特徴量x(n)および新奇単語特徴量y(n)の組み合わせが存在しているものとする。
上述の画像データ処理システム20において取り扱われる画像データは、基本的には、アノテーションやリトリーバルといった用途のために作成されたものではなく、様々な照明条件下で取得(撮影)されたものであり、画像の画素値(RGB値)は、周囲の明るさや照明による影響を受けているものと考えられる。従って、より精度の高い初期学習やアノテーション、リトリーバルを実行するためには、画像特徴量から照明条件等の影響をできるだけ取り除くことが要求される。ここで、画像特徴量に対する照明条件等の影響を緩和するためには、例えばカラー画像からカラーHLACを画像特徴量として抽出する場合、オリジナルの画像データに加えて、各画素値に次式(119)に示すようなシグモイド関数を用いた閾値処理が施された画像データを用意するとよい。式(119)は、画素値が255階調であるときのシグモイド関数であり、式(119)において、fnewは、処理後の画素値であり、fは各画素値であり、ftは閾値であり、γは平滑化の程度を決定するためのパラメータである。このような閾値処理は、閾値の前後に平滑化を加えた二値化処理として解釈され得るものであり、かかる閾値処理を採用することにより、照明条件等による画素値の変化により頑健な加工画像データを得ることができる。そして、オリジナルの画像データから抽出されるカラーHLACと、閾値処理を施した加工画像データから抽出されるカラーHLACとの双方を画像特徴量xとして用いればよい。この場合、オリジナルの画像データから抽出されるカラーHLACをxoとし、加工画像データから抽出されるカラーHLACをxpとすれば、画像特徴量xを次式(120)のように得ることができる。これにより、オリジナルの画像データから抽出されたカラーHLACのみを画像特徴量として用いた場合に比べて、アノテーション/リトリーバルにおける性能をより向上させることができる。
Claims (37)
- 実世界情報と該実世界情報に対応したシンボルとの関係を学習する対応関係学習装置であって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量を複数記憶する第1特徴量記憶手段と、
前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量を複数記憶する第2特徴量記憶手段と、
前記第1および第2特徴量の組み合わせを複数用いた正準相関分析を実行し、前記第1および第2特徴量の少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するための変換を取得する正準相関分析手段と、
前記正準相関分析手段により取得された前記変換を記憶すると共に、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数を記憶する分析結果記憶手段と、
前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する条件付き確率と該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために必要な情報を導出する情報導出手段と、
前記情報導出手段により導出された情報を記憶する情報記憶手段と、
を備え、
前記情報導出手段は、少なくとも、前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する条件付き確率を示す確率密度分布を設定する確率密度分布設定手段と、
すべての第2データ中の互いに異なるシンボルのそれぞれについて前記隠れ変数から該シンボルが出現する条件付き確率であるシンボル生起確率を算出するシンボル生起確率算出手段とを含み、
前記情報記憶手段は、前記隠れ変数ごとに、少なくとも前記確率密度分布と前記シンボル生起確率とを前記情報として記憶する対応関係学習装置。 - 請求の範囲1に記載の対応関係学習装置において、
前記正準相関分析手段は、前記第1特徴量を正準空間に射影して得られる変量を第1変量とすると共に前記第1特徴量から前記第1変量を得るための変換を第1変換とし、前記第2特徴量を正準空間に射影して得られる変量を第2変量とすると共に前記第2特徴量から前記第2変量を得るための変換を第2変換としたときに、正準相関分析により前記第1変量と前記第2変量との相関を最大にする第1および第2変換を取得し、
前記分析結果記憶手段は、前記取得された第1および第2変換を記憶すると共に、該第1または第2変換により前記第1または第2特徴量を正準空間に射影して得られる第1または第2変量を前記隠れ変数として記憶する対応関係学習装置。 - 請求の範囲2に記載の対応関係学習装置において、
前記正準相関分析手段は、前記第1特徴量をxi(ただし、i=1,…,nである。以下同様)とし、前記第2特徴量をyiとし、前記第1変量をsiとし、前記第2変量をtiとしたときに、前記第1変換が次式(1)を満たすと共に前記第2変換が次式(2)を満たすものとし、次式(3)の固有値問題を解くことにより式(1)における射影行列Aを前記第1変換として求めると共に式(2)における射影行列Bを前記第2変換として取得する対応関係学習装置。ただし、式(3)において、Λ2は固有値を対角要素とする対角行列であり、Iは単位行列であり、共分散行列Cxx,Cyy,Cxy,Cyxは、式(4)に示すとおりである。
- 請求の範囲1に記載の対応関係学習装置において、
前記正準相関分析手段は、前記第1特徴量を正準空間に射影して得られる変量を第1変量とすると共に前記第1特徴量から前記第1変量を得るための変換を第1変換とし、前記第2特徴量を正準空間に射影して得られる変量を第2変量とすると共に前記第2特徴量から前記第2変量を得るための変換を第2変換としたときに、正準相関分析により前記第1変量と前記第2変量との相関を最大にする第1および第2変換を取得すると共に、1組の前記第1および第2特徴量が正準空間において形成する正規分布の中心を取得し、
前記分析結果記憶手段は、前記取得された第1および第2変換を記憶すると共に、前記第1特徴量と前記第2特徴量との組み合わせごとに取得される前記正規分布の中心を前記隠れ変数として記憶する対応関係学習装置。 - 請求の範囲4に記載の対応関係学習装置において、
前記正準相関分析手段は、前記第1特徴量をxiとし、前記第2特徴量をyiとし、前記第1変量をsiとし、前記第2変量をtiとしたときに、前記第1変換が次式(1)を満たすと共に前記第2変換が次式(2)を満たすものとし、次式(3)の固有値問題を解くことにより式(1)における射影行列Aを前記第1変換として求めると共に式(2)における射影行列Bを前記第2変換として取得し、前記正規分布の中心をziとしたときに、次式(101)に従って前記第1特徴量xiと前記第2特徴量yiとの組み合わせごとに前記正規分布の中心ziを取得する対応関係学習装置。ただし、式(3)において、Λ2は固有値を対角要素とする対角行列であり、Iは単位行列であり、共分散行列Cxx,Cyy,Cxy,Cyxは、式(4)に示すとおりであり、式(101)において、Λ2は固有値を対角要素とする対角行列であり、MxおよびMyは、MxMy T=Λを満たすと共にスペクトルノルムが値1未満となる任意の行列である。
- 請求の範囲1に記載の対応関係学習装置において、
前記確率密度分布設定手段は、前記隠れ変数を中心とした正規分布を前記確率密度分布として設定する対応関係学習装置。 - 請求の範囲4に記載の対応関係学習装置において、
前記確率密度分布設定手段は、任意の第1特徴量をxとし、任意の第2特徴量をyとすると共に前記隠れ変数をziとし、1組の前記第1および第2特徴量x,yが正準空間において形成する正規分布の分散をΦxyとしたときに、次式(102)に従って分散Φxyを取得すると共に、次式(103)に従って前記隠れ変数ziごとに該隠れ変数ziから任意の第1特徴量xが出現する条件付き確率を示す確率密度分布P(x|zi)を設定し、
前記情報記憶手段は、前記隠れ変数ごとに、前記確率密度分布P(x|zi)と前記シンボル生起確率とを前記情報として記憶する対応関係学習装置。ただし、式(103)において、“K”は、確率の総和を値1にするための規格化定数であり、Φxは任意の第1特徴量xが正準空間において形成する正規分布の分散であり、zcは、当該正規分布の中心であり、それぞれ式(104)に示すとおりである。
- 請求の範囲1または9に記載の対応関係学習装置において、
前記シンボル生起確率算出手段は、単一のシンボルのみを示す前記第2データの第2特徴量をwとし、前記隠れ変数siまたはziをsziと表したときに、すべての第2データ中の互いに異なるシンボルのそれぞれについて次式(7)に従って隠れ変数sziから第2特徴量wが出現する条件付き確率P(w|szi)を前記シンボル生起確率として算出する対応関係学習装置。ただし、式(7)において、“n”は第2データに出現するシンボルの総数であり、“nw”はすべての第2データにおける第2特徴量wに対応したシンボルの出現回数であり、“nszi”は隠れ変数sziに対応した第2特徴量に含まれるシンボルの総数であり、δW,sziは特徴量wに対応したシンボルが隠れ変数sziに対応した第2特徴量に含まれていれば値1とされ、含まれていなければ値0とされる変数であり、“μ”は値0から値1までの範囲から選択される実数値である。
- 請求の範囲1に記載の対応関係学習装置において、
新奇第1特徴量と該新奇第1特徴量に対応した新奇第2特徴量との組み合わせが出現したときに、前記新奇第1特徴量と前記新奇第2特徴量とに基づいて少なくとも前記隠れ変数を導出するための前記変換を更新する情報更新手段を更に備える対応関係学習装置。 - 請求の範囲12に記載の対応関係学習装置において、
前記情報更新手段は、
任意の第1特徴量を主成分分析により無相関化して得られる成分を第1無相関化成分としたときに、前記新奇第1特徴量についての第1無相関化成分である新奇第1無相関化成分の取得処理を実行する第1無相関化成分取得手段と、
任意の第2特徴量を主成分分析により無相関化して得られる成分を第2無相関化成分としたときに、前記新奇第2特徴量についての第2無相関化成分である新奇第2無相関化成分の取得処理を実行する第2無相関化成分取得手段と、
前記取得された新奇第1無相関化成分および新奇第2無相関化成分に基づいて、前記第1および第2無相関化成分の共分散行列についての特異値分解処理を実行する特異値分解実行手段と、
前記第1および第2無相関化成分取得手段による前記取得処理の結果と前記特異値分解実行手段による前記特異値分解処理の結果とに基づいて前記隠れ変数を導出するための前記変換を更新する変換更新手段とを含み、
前記分析結果記憶手段は、前記更新された変換を記憶すると共に、該更新された変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数を記憶し、
前記情報導出手段は、前記取得された隠れ変数ごとに前記情報を更新する対応関係学習装置。 - 請求の範囲13に記載の対応関係学習装置において、
n−1個の第1特徴量x(1),…,x(i),…,x(n−1)および第2特徴量y(1),…,y(i),…,y(n−1)の組み合わせが存在している状態でn番目の新奇第1特徴量x(n)および新奇第2特徴量y(n)の組み合わせが出現したとすると共に、第1特徴量x(i)の次元をpとし、第2特徴量y(i)の次元をqとし、min{p,q}をrとし、忘却率をlとし、新奇第1無相関化成分をu(n)とし、新奇第2無相関化成分をv(n)としたときに、
前記第1無相関化成分取得手段は、新奇第1特徴量x(n)を含むn個の第1特徴量x(i)についての固有値問題CxxEx=ExΛxの解である次式(9)に示す行列Ex(n)および対角行列Λx(n)と新奇第1無相関化成分u(n)とを取得し(ただし、式(9)において、j=1,…,pであり、x1〜(n)=x(n)−mx(n)であり、mx(n)はn個の第1特徴量x(i)の平均である。)、
前記第2無相関化成分取得手段は、新奇第2特徴量y(n)を含むn個の第2特徴量y(i)についての固有値問題CyyEy=EyΛyの解である次式(10)に示す行列Ey(n)および対角行列Λy(n)と新奇第2無相関化成分v(n)とを取得し(ただし、式(10)において、j=1,…,qであり、y1〜(n)=y(n)−my(n)であり、my(n)はn個の第1特徴量x(i)の平均である。)、
前記特異値分解実行手段は、前記取得された新奇第1無相関化成分u(n)および新奇第2無相関化成分v(n)に基づいて次式(11)に示す行列Eu(n)およびEv(n)を取得し(ただし、式(11)において、j=1,…,rであり、Zuj(n)はn個の第1および第2無相関化成分の組み合わせに基づく第1無相関化成分についてのj番目の正準相関係数ベクトルであり、Zvj(n)はn個の第1および第2無相関化成分の組み合わせに基づく第2無相関化成分についてのj番目の正準相関係数ベクトルである。)、
前記分析結果更新手段は、前記第1および第2無相関化成分取得手段により取得された行列Ex(n),Ey(n)および対角行列Λx(n),Λy(n)と、前記特異値分解実行手段により取得された行列Eu(n),Ev(n)とに基づいて前記第1特徴量x(i)を正準空間に射影するための第1変換A(n)と前記第2特徴量y(i)を正準空間に射影するための第2変換B(n)とを次式(12)に従って新たな前記変換として取得する対応関係学習装置。
- 請求の範囲3または5に記載の対応関係学習装置において、
n−1個の第1特徴量x(1),…,x(i),…,x(n−1)および第2特徴量y(1),…,y(i),…,y(n−1)の組み合わせが存在している状態でn番目の新奇第1特徴量x(n)および新奇第2特徴量y(n)の組み合わせが出現したときに、次式(105)に従って共分散行列Cxx,Cyy,Cxy,Cyxを更新すると共に、前記式(3)の固有値問題を解くことにより前記隠れ変数を導出するための前記変換を更新する情報更新手段を更に備える対応関係学習装置。ただし、n≧2であり、“l”は、忘却率であり、x〜(n)およびy〜(n)は、次式(106)に示すとおりであり、mx(n)およびmy(n)は、次式(107)に示すとおりである。
- 請求の範囲1に記載の対応関係学習装置において、
前記第1特徴量は、前記第1データの高次局所自己相関特徴を示す対応関係学習装置。 - 請求の範囲1に記載の対応関係学習装置において、
前記第1データは画像データであり、前記第1特徴量は、前記画像データの各画素の輝度勾配方向に基づいて定められる対応関係学習装置。 - 請求の範囲1に記載の対応関係学習装置において、
前記第2特徴量は、すべての第2データから抽出される互いに異なるシンボルの配列に対して、対象となる第2データに対象となるシンボルが含まれていれば値0以外の所定値を付与すると共に、含まれていなければ値0を付与することにより設定される対応関係学習装置。 - 請求の範囲1に記載の対応関係学習装置において、
前記第1データは画像データであり、前記第2データは、前記画像データの画像に現れているものを示す少なくとも1つの単語を前記シンボルとして含む対応関係学習装置。 - 請求の範囲1に記載の対応関係学習装置において、
前記第1および第2特徴量の組み合わせごとに取得される複数の隠れ変数をクラスタリングして複数のクラスタに分類すると共に前記複数のクラスタごとに代表ベクトルを取得するクラスタリング手段を更に備え、
前記情報記憶手段は、前記代表ベクトルと、前記隠れ変数の所属クラスタを示す情報とを記憶する対応関係学習装置。 - 実世界情報と該実世界情報に対応したシンボルとの関係を学習するための対応関係学習方法であって、
(a)実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との組み合わせを複数用いた正準相関分析を実行し、前記第1および第2特徴量の少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するための変換を取得して分析結果記憶手段に記憶させるステップと、
(b)ステップ(a)にて取得した変換を用いて前記第1および第2特徴量の組み合わせごとに隠れ変数を取得して分析結果記憶手段に記憶させるステップと、
(c)前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する条件付き確率と該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために必要な情報を導出して情報記憶手段に記憶させるステップと、
を含み、
ステップ(c)は、少なくとも、前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する条件付き確率を示す確率密度分布を設定すると共に、すべての第2データ中の互いに異なるシンボルのそれぞれについて前記隠れ変数から該シンボルが出現する条件付き確率であるシンボル生起確率を算出し、前記隠れ変数ごとに、少なくとも前記確率密度分布と前記シンボル生起確率とを前記情報として前記情報記憶手段に記憶させる対応関係学習方法。 - コンピュータを実世界情報と該実世界情報に対応したシンボルとの関係を学習する装置として機能させる対応関係学習用プログラムであって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との組み合わせを複数用いた正準相関分析を実行し、前記第1および第2特徴量の少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するための変換を取得して分析結果記憶手段に記憶させる変換取得モジュールと、
前記取得された変換を用いて前記第1および第2特徴量の組み合わせごとに隠れ変数を取得して分析結果記憶手段に記憶させる隠れ変数取得モジュールと、
前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する条件付き確率と該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために必要な情報を導出して情報記憶手段に記憶させる情報導出モジュールと、
を備え、
前記情報導出モジュールは、少なくとも、前記隠れ変数ごとに該隠れ変数から任意の第1特徴量が出現する条件付き確率を示す確率密度分布を設定すると共に、すべての第2データ中の互いに異なるシンボルのそれぞれについて前記隠れ変数から該シンボルが出現する条件付き確率であるシンボル生起確率を算出し、前記隠れ変数ごとに、少なくとも前記確率密度分布と前記シンボル生起確率とを前記情報として前記情報記憶手段に記憶させる対応関係学習用プログラム。 - 実世界情報にメタデータとしてのシンボルを付与するアノテーション装置であって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する条件付き確率および該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段と、
新奇第1データの入力を受け付ける入力受付手段と、
前記受け付けられた新奇第1データに基づいて該新奇第1データの特徴を示す新奇第1特徴量を抽出する第1特徴量抽出手段と、
前記学習情報記憶手段に記憶された学習情報を用いて、前記抽出された新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する条件付き確率を算出する確率算出手段と、
前記確率算出手段により算出された確率に基づいて前記新奇第1データに対してシンボルを割り付けるシンボル割付手段と、
を備えるアノテーション装置。 - 請求の範囲24に記載のアノテーション装置において、
前記隠れ変数は、前記第1または第2変換により前記第1または第2特徴量を正準空間に射影して得られる第1または第2変量であり、
前記確率算出手段は、前記隠れ変数をsiとし、前記抽出された新奇第1特徴量をxnewとし、単一のシンボルのみを示す前記第2データの第2特徴量をwとし、新奇第1特徴量xnewから第2特徴量wが出現する条件付き確率をP(w|xnew)としたときに、確率P(w|xnew)を次式(13)に従って算出するアノテーション装置。ただし、式(13)において、P(xnew|si)は隠れ変数siから新奇第1特徴量xnewが出現する条件付き確率であり、P(w|si)は隠れ変数siから第2特徴量wが出現する条件付き確率である。
- 請求の範囲24に記載のアノテーション装置において、
前記隠れ変数は、1組の前記第1および第2特徴量が正準空間において形成する正規分布の中心であり、
前記確率算出手段は、前記隠れ変数をziとし、前記抽出された新奇第1特徴量をxnewとし、単一のシンボルのみを示す前記第2データの第2特徴量をwとし、新奇第1特徴量xnewから第2特徴量wが出現する条件付き確率をP(w|xnew)としたときに、確率P(w|xnew)を次式(110)に従って算出するアノテーション装置。ただし、式(110)において、P(xnew|zi)は隠れ変数ziから新奇第1特徴量xnewが出現する条件付き確率であり、P(w|zi)は隠れ変数ziから第2特徴量wが出現する条件付き確率である。
- 請求の範囲24に記載のアノテーション装置において、
前記第1および第2特徴量の組み合わせごとに取得される複数の隠れ変数はクラスタリングにより複数のクラスタに分類されると共に、前記複数のクラスタごとに代表ベクトルが取得されており、
前記学習情報記憶手段は、前記代表ベクトルと前記隠れ変数の所属クラスタを示す情報とを学習情報として記憶し、
前記確率算出手段は、前記複数の隠れ変数のうち、前記代表ベクトルから前記新奇第1特徴量が出現する条件付き確率が所定の閾値以上となる前記クラスタに所属する前記隠れ変数を用いて、前記新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する条件付き確率を算出するアノテーション装置。 - 請求の範囲24に記載のアノテーション装置において、
前記シンボル割付手段は、所定の基準に従って前記確率が高い順に前記単一のシンボルのみを示す前記第2データの第2特徴量により示されるシンボルを抽出すると共に、抽出したシンボルに基づいて前記新奇第1特徴量に対応した新奇第2特徴量を設定するアノテーション装置。 - 請求の範囲24に記載のアノテーション装置において、
前記新奇第1特徴量と前記新奇第2特徴量とに基づいて前記学習情報を更新する情報更新手段を更に備えるアノテーション装置。 - 実世界情報にメタデータとしてのシンボルを付与するためのアノテーション方法であって、
(a)実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する条件付き確率および該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶手段に記憶させるステップと、
(b)前記記憶手段に記憶された前記学習情報を用いて、新奇第1データの特徴として抽出された新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する条件付き確率を算出するステップと、
(c)ステップ(b)にて算出した確率に基づいて前記新奇第1データに対してシンボルを割り付けるステップと、
を含むアノテーション方法。 - 実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する条件付き確率および該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段を備えたコンピュータを実世界情報にメタデータとしてのシンボルを付与する装置として機能させるアノテーション用プログラムであって、
前記学習情報記憶手段に記憶された前記学習情報を用いて、新奇第1データの特徴として抽出された新奇第1特徴量から単一のシンボルのみを示す前記第2データの第2特徴量が出現する条件付き確率を算出する確率算出モジュールと、
前記算出された確率に基づいて前記新奇第1データに対してシンボルを割り付けるシンボル割付モジュールと、
を備えるアノテーション用プログラム。 - メタデータとしてのシンボルが付与されていない実世界情報を該シンボルに基づいて取り出し可能とするリトリーバル装置であって、
実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する条件付き確率および該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段と、
第2データとの対応付けがなされていない第1データである未注釈第1データを少なくとも1つ記憶する未注釈第1データ記憶手段と、
前記未注釈第1データから該未注釈第1データの特徴として抽出された未注釈第1特徴量を記憶する未注釈第1特徴量記憶手段と、
検索クエリとしての少なくとも1つのシンボルの入力を受け付ける入力受付手段と、
前記受け付けられた少なくとも1つのシンボルに基づいて、該少なくとも1つのシンボルを示す前記第2データの第2特徴量を検索用第2特徴量として設定する検索用第2特徴量設定手段と、
前記学習情報記憶手段に記憶された学習情報を用いて、前記未注釈第1特徴量から前記設定された検索用第2特徴量が出現する条件付き確率を算出する確率算出手段と、
前記確率算出手段により算出された確率に基づいて前記未注釈第1データ記憶手段から前記未注釈第1データを取り出すデータ取出手段と、
を備えるリトリーバル装置。 - 請求の範囲32に記載のリトリーバル装置において、
前記隠れ変数は、前記第1または第2変換により前記第1または第2特徴量を正準空間に射影して得られる第1または第2変量であり、
前記確率算出手段は、前記隠れ変数をsiとし、前記検索用第2特徴量をynewとし、前記未注釈第1特徴量をxjとし(ただし、j=1,…,Nであり、Nは未注釈第1データの総数である。)、未注釈第1特徴量xjから検索用第2特徴量ynewが出現する条件付き確率をP(ynew|xj)としたときに、確率P(ynew|xj)を次式(14)に従って算出するリトリーバル装置。ただし、式(14)において、P(xj|si)は隠れ変数siから未注釈第1特徴量xjが出現する条件付き確率であり、P(ynew|si)は隠れ変数siから検索用第2特徴量ynewが出現する条件付き確率である。
- 請求の範囲32に記載のリトリーバル装置において、
前記隠れ変数は、1組の前記第1および第2特徴量が正準空間において形成する正規分布の中心であり、
前記確率算出手段は、前記隠れ変数をziとし、前記検索用第2特徴量をynewとし、前記未注釈第1特徴量をxjとし(ただし、j=1,…,Nであり、Nは未注釈第1データの総数である。)、未注釈第1特徴量xjから検索用第2特徴量ynewが出現する条件付き確率をP(ynew|xj)としたときに、確率P(ynew|xj)を次式(111)に従って算出するリトリーバル装置。ただし、式(111)において、P(xj|zi)は隠れ変数ziから未注釈第1特徴量xjが出現する条件付き確率であり、P(ynew|zi)は隠れ変数ziから検索用第2特徴量ynewが出現する条件付き確率である。
- 請求の範囲32に記載のリトリーバル装置において、
前記第1および第2特徴量の組み合わせごとに取得される複数の隠れ変数はクラスタリングにより複数のクラスタに分類されると共に、前記複数のクラスタごとに代表ベクトルが取得されており、
前記学習情報記憶手段は、前記代表ベクトルと前記隠れ変数の所属クラスタを示す情報とを学習情報として記憶し、
前記確率算出手段は、前記複数の隠れ変数のうち、前記代表ベクトルから前記未注釈第1特徴量が出現する条件付き確率が所定の閾値以上となる前記クラスタに所属する前記隠れ変数を用いて、前記未注釈第1特徴量から前記設定された検索用第2特徴量が出現する条件付き確率を算出するリトリーバル装置。 - メタデータとしてのシンボルが付与されていない実世界情報を該シンボルに基づいて取り出し可能とするリトリーバル方法であって、
(a)実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する条件付き確率および該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶手段に記憶させるステップと、
(b)指定された少なくとも1つのシンボルに基づいて、該少なくとも1つのシンボルを示す前記第2データの第2特徴量を検索用第2特徴量として設定するステップと、
(c)前記記憶手段に記憶された前記学習情報を用いて、第2データとの対応付けがなされていない第1データである未注釈第1データの特徴として抽出された未注釈第1特徴量から前記設定された検索用第2特徴量が出現する条件付き確率を算出するステップと、
(d)ステップ(c)にて算出した確率に基づいて前記記憶手段から前記未注釈第1データを取り出すステップと、
を含むリトリーバル方法。 - 実世界情報を示す第1データから該第1データの特徴として抽出された第1特徴量と前記第1データに対応付けられて前記実世界情報に対応した少なくとも1つのシンボルを示す第2データから該第2データの特徴として抽出された第2特徴量との少なくとも何れか一方に基づいて前記実世界情報と該実世界情報に対応したシンボルとを結びつける抽象的概念を示す隠れ変数を導出するために前記第1特徴量と前記第2特徴量との組み合わせを複数用いた正準相関分析により取得される変換と、該変換を用いて前記第1および第2特徴量の組み合わせごとに取得される隠れ変数と、前記隠れ変数から任意の第1特徴量が出現する条件付き確率および該隠れ変数から任意の第2特徴量が出現する条件付き確率とを得るために該隠れ変数ごとに導出される情報とを含む学習情報を記憶する学習情報記憶手段を備えたコンピュータをメタデータとしてのシンボルが付与されていない実世界情報を該シンボルに基づいて取り出し可能とする装置として機能させるリトリーバル用プログラムであって、
指定された少なくとも1つのシンボルに基づいて、該少なくとも1つのシンボルを示す前記第2データの第2特徴量を検索用第2特徴量として設定する検索用第2特徴量設定モジュールと、
前記学習情報記憶手段に記憶された前記学習情報を用いて、第2データとの対応付けがなされていない第1データである未注釈第1データの特徴として抽出された未注釈第1特徴量から前記設定された検索用第2特徴量が出現する条件付き確率を算出する確率算出モジュールと、
前記算出された算出した確率に基づいて前記未注釈第1データを取り出すデータ取出モジュールと、
を備えるリトリーバル用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009532255A JP5234469B2 (ja) | 2007-09-14 | 2008-09-12 | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007240272 | 2007-09-14 | ||
JP2007240272 | 2007-09-14 | ||
JP2009532255A JP5234469B2 (ja) | 2007-09-14 | 2008-09-12 | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム |
PCT/JP2008/066597 WO2009035108A1 (ja) | 2007-09-14 | 2008-09-12 | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009035108A1 JPWO2009035108A1 (ja) | 2010-12-24 |
JP5234469B2 true JP5234469B2 (ja) | 2013-07-10 |
Family
ID=40452114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009532255A Active JP5234469B2 (ja) | 2007-09-14 | 2008-09-12 | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8423485B2 (ja) |
JP (1) | JP5234469B2 (ja) |
WO (1) | WO2009035108A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200001111A (ko) * | 2018-06-26 | 2020-01-06 | 에스케이텔레콤 주식회사 | 준지도 학습 방법 |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10210179B2 (en) * | 2008-11-18 | 2019-02-19 | Excalibur Ip, Llc | Dynamic feature weighting |
JP5131863B2 (ja) * | 2009-10-30 | 2013-01-30 | 独立行政法人産業技術総合研究所 | Hlac特徴量抽出方法、異常検出方法及び装置 |
CA2786727C (en) * | 2010-02-01 | 2017-08-29 | Google, Inc. | Joint embedding for item association |
JP5462748B2 (ja) * | 2010-09-03 | 2014-04-02 | 日本電信電話株式会社 | データ可視化装置、データ変換装置、方法、及びプログラム |
JP5802916B2 (ja) * | 2011-02-28 | 2015-11-04 | 株式会社豊田中央研究所 | 感覚データ識別装置及びプログラム |
KR101438114B1 (ko) | 2013-02-01 | 2014-11-03 | 국방과학연구소 | 정준상관분석을 이용한 수중표적 식별방법 및 수중표적 식별장치 |
US20140341443A1 (en) * | 2013-05-16 | 2014-11-20 | Microsoft Corporation | Joint modeling for facial recognition |
CN104572651B (zh) * | 2013-10-11 | 2017-09-29 | 华为技术有限公司 | 图片排序方法及装置 |
US10319035B2 (en) | 2013-10-11 | 2019-06-11 | Ccc Information Services | Image capturing and automatic labeling system |
JP5644934B2 (ja) * | 2013-12-09 | 2014-12-24 | 独立行政法人産業技術総合研究所 | 信号特徴抽出装置および信号特徴抽出方法 |
US9614724B2 (en) | 2014-04-21 | 2017-04-04 | Microsoft Technology Licensing, Llc | Session-based device configuration |
US9639742B2 (en) | 2014-04-28 | 2017-05-02 | Microsoft Technology Licensing, Llc | Creation of representative content based on facial analysis |
US9773156B2 (en) | 2014-04-29 | 2017-09-26 | Microsoft Technology Licensing, Llc | Grouping and ranking images based on facial recognition data |
US9430667B2 (en) | 2014-05-12 | 2016-08-30 | Microsoft Technology Licensing, Llc | Managed wireless distribution network |
US10111099B2 (en) | 2014-05-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Distributing content in managed wireless distribution networks |
US9384334B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content discovery in managed wireless distribution networks |
US9384335B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content delivery prioritization in managed wireless distribution networks |
US9874914B2 (en) | 2014-05-19 | 2018-01-23 | Microsoft Technology Licensing, Llc | Power management contracts for accessory devices |
US10037202B2 (en) | 2014-06-03 | 2018-07-31 | Microsoft Technology Licensing, Llc | Techniques to isolating a portion of an online computing service |
US9367490B2 (en) | 2014-06-13 | 2016-06-14 | Microsoft Technology Licensing, Llc | Reversible connector for accessory devices |
US9460493B2 (en) | 2014-06-14 | 2016-10-04 | Microsoft Technology Licensing, Llc | Automatic video quality enhancement with temporal smoothing and user override |
US9373179B2 (en) | 2014-06-23 | 2016-06-21 | Microsoft Technology Licensing, Llc | Saliency-preserving distinctive low-footprint photograph aging effect |
WO2016026135A1 (en) * | 2014-08-22 | 2016-02-25 | Microsoft Technology Licensing, Llc | Face alignment with shape regression |
US11062229B1 (en) * | 2016-02-18 | 2021-07-13 | Deepmind Technologies Limited | Training latent variable machine learning models using multi-sample objectives |
CN105808752B (zh) * | 2016-03-10 | 2018-04-10 | 大连理工大学 | 一种基于cca和2pknn的自动图像标注方法 |
US10157332B1 (en) * | 2016-06-06 | 2018-12-18 | A9.Com, Inc. | Neural network-based image manipulation |
US10489923B2 (en) * | 2017-12-13 | 2019-11-26 | Vaisala, Inc. | Estimating conditions from observations of one instrument based on training from observations of another instrument |
CN108228845B (zh) * | 2018-01-09 | 2020-10-27 | 华南理工大学 | 一种手机游戏分类方法 |
US11669746B2 (en) * | 2018-04-11 | 2023-06-06 | Samsung Electronics Co., Ltd. | System and method for active machine learning |
US10824909B2 (en) * | 2018-05-15 | 2020-11-03 | Toyota Research Institute, Inc. | Systems and methods for conditional image translation |
JP7014086B2 (ja) * | 2018-08-02 | 2022-02-01 | 日本電信電話株式会社 | 解析装置、解析方法及びプログラム |
CN113627176B (zh) * | 2021-08-17 | 2024-04-19 | 北京计算机技术及应用研究所 | 一种利用主元分析计算汉语词向量的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11213131A (ja) * | 1998-01-26 | 1999-08-06 | Minolta Co Ltd | オブジェクト−キー関連度付与方法およびオブジェクト−キー関連度自動付与装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6070161A (en) | 1997-03-19 | 2000-05-30 | Minolta Co., Ltd. | Method of attaching keyword or object-to-key relevance ratio and automatic attaching device therefor |
US7343296B2 (en) * | 2001-03-14 | 2008-03-11 | Puppetools, Inc. | Puppetry based communication system, method and internet utility |
US7120626B2 (en) * | 2002-11-15 | 2006-10-10 | Koninklijke Philips Electronics N.V. | Content retrieval based on semantic association |
CN100371952C (zh) | 2003-04-21 | 2008-02-27 | 日本电气株式会社 | 识别视频图像对象及应用视频图像注释的设备和方法 |
US20060195858A1 (en) | 2004-04-15 | 2006-08-31 | Yusuke Takahashi | Video object recognition device and recognition method, video annotation giving device and giving method, and program |
DE102005003001B4 (de) * | 2005-01-21 | 2009-10-08 | Qimonda Ag | Verfahren zur Korrektur des optischen Proximity-Effektes |
KR100664964B1 (ko) * | 2005-10-11 | 2007-01-04 | 삼성전자주식회사 | 휴대 기기를 제어하는 장치 및 방법 |
US7536371B2 (en) * | 2005-12-05 | 2009-05-19 | Insyst Ltd. | Apparatus and method for the analysis of a process having parameter-based faults |
-
2008
- 2008-09-12 WO PCT/JP2008/066597 patent/WO2009035108A1/ja active Application Filing
- 2008-09-12 US US12/733,561 patent/US8423485B2/en active Active
- 2008-09-12 JP JP2009532255A patent/JP5234469B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11213131A (ja) * | 1998-01-26 | 1999-08-06 | Minolta Co Ltd | オブジェクト−キー関連度付与方法およびオブジェクト−キー関連度自動付与装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200001111A (ko) * | 2018-06-26 | 2020-01-06 | 에스케이텔레콤 주식회사 | 준지도 학습 방법 |
KR102511996B1 (ko) | 2018-06-26 | 2023-03-20 | 에스케이텔레콤 주식회사 | 준지도 학습 방법 |
Also Published As
Publication number | Publication date |
---|---|
US8423485B2 (en) | 2013-04-16 |
WO2009035108A1 (ja) | 2009-03-19 |
JPWO2009035108A1 (ja) | 2010-12-24 |
US20110010319A1 (en) | 2011-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5234469B2 (ja) | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム | |
CN110163258B (zh) | 一种基于语义属性注意力重分配机制的零样本学习方法及系统 | |
JP7317050B2 (ja) | 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法 | |
CN109919183B (zh) | 一种基于小样本的图像识别方法、装置、设备及存储介质 | |
CN110889865B (zh) | 一种基于局部加权稀疏特征选择的视频目标跟踪方法 | |
CN111597298A (zh) | 一种基于深度对抗离散哈希学习的跨模态检索方法及装置 | |
CN112541458A (zh) | 基于元学习的域自适应的人脸识别方法、系统、装置 | |
US11250295B2 (en) | Image searching apparatus, classifier training method, and recording medium | |
CN110942108A (zh) | 人脸图像聚类方法、装置及计算机可读存储介质 | |
CN113780245B (zh) | 一种多场景下的物品检索方法及系统 | |
CN114863407A (zh) | 一种基于视觉语言深度融合的多任务冷启动目标检测方法 | |
Zarbakhsh et al. | Low-rank sparse coding and region of interest pooling for dynamic 3D facial expression recognition | |
CN109558882B (zh) | 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置 | |
CN113076905B (zh) | 一种基于上下文交互关系的情绪识别方法 | |
Perronnin et al. | A probabilistic model of face mapping with local transformations and its application to person recognition | |
CN113762005B (zh) | 特征选择模型的训练、对象分类方法、装置、设备及介质 | |
CN111950592B (zh) | 一种基于监督最小二乘多类核典型相关分析的多模态情感特征融合方法 | |
WO2010134539A1 (ja) | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム | |
CN112560712B (zh) | 基于时间增强图卷积网络的行为识别方法、装置及介质 | |
CN114943862A (zh) | 一种基于结构性解析字典学习的两阶段图像分类方法 | |
JP2009295130A (ja) | 画像解析装置、画像登録装置および画像検索装置 | |
Lee et al. | Ensemble Algorithm of Convolution Neural Networks for Enhancing Facial Expression Recognition | |
CN111967513B (zh) | 一种基于注意力的零样本图像分类方法 | |
JP7221892B2 (ja) | 学習装置、学習方法、および学習プログラム | |
CN115565051B (zh) | 轻量级人脸属性识别模型训练方法、识别方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5234469 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |