JP5463873B2 - マルチメディア分類システム及びマルチメディア検索システム - Google Patents
マルチメディア分類システム及びマルチメディア検索システム Download PDFInfo
- Publication number
- JP5463873B2 JP5463873B2 JP2009265490A JP2009265490A JP5463873B2 JP 5463873 B2 JP5463873 B2 JP 5463873B2 JP 2009265490 A JP2009265490 A JP 2009265490A JP 2009265490 A JP2009265490 A JP 2009265490A JP 5463873 B2 JP5463873 B2 JP 5463873B2
- Authority
- JP
- Japan
- Prior art keywords
- occurrence probability
- image
- matrix
- media
- latent topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims description 305
- 239000011159 matrix material Substances 0.000 claims description 255
- 238000004364 calculation method Methods 0.000 claims description 41
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 238000013139 quantization Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims 2
- 230000000007 visual effect Effects 0.000 description 14
- 238000013507 mapping Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Description
画像と、その画像に関連する情報を示す画像以外のメディアデータからなる標本データを複数まとめた標本データセットを分類するマルチメディア分類システムであって、
標本データセットの各画像において、局所領域の画像特徴量を抽出するとともに、抽出された画像特徴量を多次元の画像特徴量ベクトルにベクトル量子化する画像特徴量ベクトル量子化手段と、
画像特徴量ベクトル量子化手段によりベクトル量子化された、多次元の画像特徴量ベクトルにおける各々の画像特徴量ベクトル要素の生起確率を算出する画像特徴量ベクトル生起確率算出手段と、
標本データセットの各メディアデータから特徴量を抽出し、抽出されたメディア特徴量を多次元のメディア特徴量ベクトルにベクトル量子化するメディア特徴量ベクトル量子化手段と、
メディア特徴量ベクトル量子化手段によりベクトル量子化された、多次元のメディア特徴量ベクトルにおける各々のメディア特徴量ベクトル要素の生起確率を算出するメディア特徴量ベクトル生起確率算出手段と、
標本データセットに含まれる個々の標本データに関して、画像特徴量ベクトル要素の生起確率とメディア特徴量ベクトル要素の生起確率とを用いて、画像特徴量ベクトル要素とメディア特徴量ベクトル要素との共起確率を算出するとともに、標本データセットに含まれる複数の標本データの、画像特徴量ベクトル要素とメディア特徴量ベクトル要素との共起確率を行列要素とする共起確率行列を算出する共起確率算出手段と、
共起確率行列を標本データのデータ数よりも少ない数の潜在トピックにおける共起確率を示す潜在トピック共起確率行列と、各潜在トピックのそれぞれの共起確率に対する重みを示す潜在トピック重み行列とに分解する分解手段と、
分解手段により算出された潜在トピック共起確率行列の各潜在トピックにおける共起確率から、各潜在トピックにおける画像特徴量ベクトル要素の生起確率を抽出して、各々の潜在トピックに関して画像特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出する画像特徴量ベクトルの潜在トピック生起確率行列算出手段と、
分解手段により算出された潜在トピック共起確率行列の各潜在トピックにおける共起確率から、各潜在トピックにおけるメディア特徴量ベクトル要素の生起確率を抽出して、各々の潜在トピックに関してメディア特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出するメディア特徴量ベクトルの潜在トピック生起確率行列算出手段と、を備え、
共起確率算出手段は、合計が1となる第1の重み係数及び第2の重み係数を定め、個々の標本データに関して、多次元の画像特徴量ベクトルにおける各々の画像特徴量ベクトル要素の生起確率に第1の重み係数を乗算し、多次元のメディア特徴量ベクトルにおける各々のメディア特徴量ベクトル要素の生起確率に第2の重み係数を乗算して、画像特徴量ベクトル要素とメディア特徴量ベクトル要素との共起確率を算出した上で、第1の重み係数が乗算された画像特徴量ベクトル要素の生起確率と第2の重み係数が乗算されたメディア特徴量ベクトル要素の生起確率を各列に並べることにより、共起確率行列を算出することを特徴とする。
請求項2に記載したように、画像特徴量ベクトルの潜在トピック生起確率行列算出手段は、各々の潜在トピックに関して画像特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出する際に、各列の成分の総和であるL1ノルムで正規化し、各列の全成分の総和が1となるようにすることが好ましい。さらに、請求項3に記載したように、メディア特徴量ベクトルの潜在トピック生起確率行列算出手段は、各々の潜在トピックに関してメディア特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出する際に、各列の成分の総和であるL1ノルムで正規化し、各列の全成分の総和が1となるようにすることが好ましい。
未知画像が入力された場合、画像特徴量の抽出、ベクトル量子化、及び画像特徴量ベクトル要素の生起確率の算出を行い、算出した未知画像の画像特徴量ベクトル要素の生起確率を成分とする入力行列を、画像特徴量ベクトル要素の潜在トピック生起確率行列を変化させることなく、当該画像特徴量ベクトル要素の潜在トピック生起確率行列と、潜在トピック重み行列とに分解することにより、入力行列に対する潜在トピック重み行列を算出する潜在トピック重み行列算出手段と、
メディア特徴量ベクトル要素の潜在トピック生起確率行列と、潜在トピック重み行列算出手段により算出された潜在トピック重み行列とを掛け合わせて、未知画像に対応するメディア特徴量ベクトル要素の生起確率行列を算出するメディア特徴量ベクトル生起確率行列算出手段と、
メディア特徴量ベクトル生起確率行列算出手段によって算出されたメディア特徴量ベクトル要素の生起確率行列に基づいて、入力された未知画像に付与すべきメディアデータを抽出し、検索結果として出力する検索結果出力手段と、を備えることを特徴とする。
未知メディアデータが入力された場合、メディア特徴量の抽出、ベクトル量子化、及びメディア特徴量ベクトル要素の生起確率の算出を行い、算出した未知画像のメディア特徴量ベクトル要素の生起確率を成分とする入力行列を、メディア特徴量ベクトル要素の潜在トピック生起確率行列を変化させることなく、当該メディア特徴量ベクトル要素の潜在トピック生起確率行列と、潜在トピック重み行列とに分解することにより、入力行列に対する潜在トピック重み行列を算出する潜在トピック重み行列算出手段と、
画像特徴量ベクトル要素の潜在トピック生起確率行列と、潜在トピック重み行列算出手段により算出された潜在トピック重み行列とを掛け合わせて、未知メディアデータに対応する画像特徴量ベクトル要素の生起確率行列を算出する画像特徴量ベクトル生起確率行列算出手段と、
画像特徴量ベクトル生起確率行列算出手段によって算出された画像特徴量ベクトル要素の生起確率行列に基づいて、標本データの中から類似する画像特徴量ベクトル要素の生起確率を有する画像を抽出し、検索結果として出力する検索結果出力手段と、を備えることを特徴とする。
以下、本発明の第1実施形態によるマルチメディア分類システム及びマルチメディア検索システムについて、図面に基づいて説明する。図1は、マルチメディア分類システム100の構成を示す構成図である。なお、本実施形態においては、画像に関連する情報を示すメディアデータとして、文章を適用した例について説明する。また、本実施形態によるマルチメディア分類システム及びマルチメディア検索システムは、コンピュータもしくは専用の演算処理回路を用いて実現されるものである。従って、以下に説明するマルチメディア分類システム及びマルチメディア検索システムの構成は、コンピュータもしくは専用演算処理回路によって実行される各種の機能に相当するものである。
分割されたすべての単語数を次元数(N2次元)とするメディア特徴量ベクトルによりベクトル量子化される。これにより、各画像とセットになった各文章Tnについても、N2個の単語がそれぞれいくつ含まれているかを示すヒストグラムとして表現される。
図11は、上述したマルチメディア分類システム100を除く、マルチメディア検索システム200のその他の構成を示している。
次に本発明の第2実施形態によるマルチメディア分類システムについて説明する。なお、本実施形態によるマルチメディア分類システムの構成は、その大部分が上述した第1実施形態のマルチメディア分類システムと共通するため、以下、異なる構成についてのみ説明する。
30,130…画像用生起確率算出部
40,140…メディア用特徴変換部
50,150…メディア用生起確率算出部
60…共起確率算出部
70、160…潜在トピック分解部
80…画像ベクトル要素の潜在トピック生起確率算出部
90…メディアベクトル要素の潜在トピック生起確率算出部
100…マルチメディア分類システム
170…生起確率算出部
180…検出部
200…マルチメディア検索システム
Claims (7)
- 画像と、その画像に関連する情報を示す画像以外のメディアデータからなる標本データを複数まとめた標本データセットを分類するマルチメディア分類システムであって、
前記標本データセットの各画像において、局所領域の画像特徴量を抽出するとともに、抽出された画像特徴量を多次元の画像特徴量ベクトルにベクトル量子化する画像特徴量ベクトル量子化手段と、
前記画像特徴量ベクトル量子化手段によりベクトル量子化された、多次元の画像特徴量ベクトルにおける各々の画像特徴量ベクトル要素の生起確率を算出する画像特徴量ベクトル生起確率算出手段と、
前記標本データセットの各メディアデータから特徴量を抽出し、抽出されたメディア特徴量を多次元のメディア特徴量ベクトルにベクトル量子化するメディア特徴量ベクトル量子化手段と、
前記メディア特徴量ベクトル量子化手段によりベクトル量子化された、多次元のメディア特徴量ベクトルにおける各々のメディア特徴量ベクトル要素の生起確率を算出するメディア特徴量ベクトル生起確率算出手段と、
前記標本データセットに含まれる個々の標本データに関して、画像特徴量ベクトル要素の生起確率とメディア特徴量ベクトル要素の生起確率とを用いて、画像特徴量ベクトル要素とメディア特徴量ベクトル要素との共起確率を算出するとともに、前記標本データセットに含まれる複数の標本データの、画像特徴量ベクトル要素とメディア特徴量ベクトル要素との共起確率を行列要素とする共起確率行列を算出する共起確率算出手段と、
前記共起確率行列を標本データのデータ数よりも少ない数の潜在トピックにおける共起確率を示す潜在トピック共起確率行列と、各潜在トピックのそれぞれの共起確率に対する重みを示す潜在トピック重み行列とに分解する分解手段と、
前記分解手段により算出された潜在トピック共起確率行列の各潜在トピックにおける共起確率から、各潜在トピックにおける画像特徴量ベクトル要素の生起確率を抽出して、各々の潜在トピックに関して画像特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出する画像特徴量ベクトルの潜在トピック生起確率行列算出手段と、
分解手段により算出された潜在トピック共起確率行列の各潜在トピックにおける共起確率から、各潜在トピックにおけるメディア特徴量ベクトル要素の生起確率を抽出して、各々の潜在トピックに関してメディア特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出するメディア特徴量ベクトルの潜在トピック生起確率行列算出手段と、を備え、
前記共起確率算出手段は、合計が1となる第1の重み係数及び第2の重み係数を定め、個々の標本データに関して、多次元の画像特徴量ベクトルにおける各々の画像特徴量ベクトル要素の生起確率に第1の重み係数を乗算し、多次元のメディア特徴量ベクトルにおける各々のメディア特徴量ベクトル要素の生起確率に第2の重み係数を乗算して、特徴量ベクトル要素とメディア特徴量ベクトル要素との共起確率を算出した上で、前記第1の重み係数が乗算された画像特徴量ベクトル要素の生起確率と前記第2の重み係数が乗算されたメディア特徴量ベクトル要素の生起確率を各列に並べることにより、前記共起確率行列を算出することを特徴とするマルチメディア分類システム。 - 前記画像特徴量ベクトルの潜在トピック生起確率行列算出手段は、各々の潜在トピックに関して画像特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出する際に、各列の成分の総和であるL1ノルムで正規化し、各列の全成分の総和が1となるようにすることを特徴とする請求項1に記載のマルチメディア分類システム。
- 前記メディア特徴量ベクトルの潜在トピック生起確率行列算出手段は、各々の潜在トピックに関してメディア特徴量ベクトル要素の生起確率をまとめた潜在トピック生起確率行列を算出する際に、各列の成分の総和であるL1ノルムで正規化し、各列の全成分の総和が1となるようにすることを特徴とする請求項1に記載のマルチメディア分類システム。
- 前記メディアデータは、1つ以上の単語から構成される文章、位置情報、時刻情報の中から一つ以上を用いて構成されたデータであることを特徴とする請求項1乃至3のいずれかに記載のマルチメディア分類システム。
- 前記標本データは、インターネットを介して収集されることを特徴とする請求項1乃至4のいずれかに記載のマルチメディア分類システム。
- 請求項1乃至請求項5のいずれかに記載のマルチメディア分類システムを備え、当該マルチメディア分類システムにより算出された画像特徴量ベクトル要素の潜在トピック生起確率行列及びメディア特徴量ベクトル要素の潜在トピック生起確率行列を用いて、未知の画像が入力された場合に、前記標本データに基づいて、その未知画像の内容に相応しいメディアデータを検索するマルチメディア検索システムであって、
前記未知画像が入力された場合、画像特徴量の抽出、ベクトル量子化、及び画像特徴量ベクトル要素の生起確率の算出を行い、算出した未知画像の画像特徴量ベクトル要素の生起確率を成分とする入力行列を、前記画像特徴量ベクトル要素の潜在トピック生起確率行列を変化させることなく、当該画像特徴量ベクトル要素の潜在トピック生起確率行列と、潜在トピック重み行列とに分解することにより、前記入力行列に対する潜在トピック重み行列を算出する潜在トピック重み行列算出手段と、
前記メディア特徴量ベクトル要素の潜在トピック生起確率行列と、前記潜在トピック重み行列算出手段により算出された潜在トピック重み行列とを掛け合わせて、前記未知画像に対応するメディア特徴量ベクトル要素の生起確率行列を算出するメディア特徴量ベクトル生起確率行列算出手段と、
前記メディア特徴量ベクトル生起確率行列算出手段によって算出されたメディア特徴量ベクトル要素の生起確率行列に基づいて、前記未知画像に付与すべきメディアデータを抽出し、検索結果として出力する検索結果出力手段と、を備えることを特徴とするマルチメディア検索システム。 - 請求項1乃至請求項5のいずれかに記載のマルチメディア分類システムを備え、当該マルチメディア分類システムにより算出された画像特徴量ベクトル要素の潜在トピック生起確率行列及びメディア特徴量ベクトル要素の潜在トピック生起確率行列を用いて、未知のメディアデータが入力された場合に、前記標本データに基づいて、その未知メディアデータの内容に相応しい画像を検索するマルチメディア検索システムであって、
前記未知メディアデータが入力された場合、メディア特徴量の抽出、ベクトル量子化、及びメディア特徴量ベクトル要素の生起確率の算出を行い、算出した未知画像のメディア特徴量ベクトル要素の生起確率を成分とする入力行列を、前記メディア特徴量ベクトル要素の潜在トピック生起確率行列を変化させることなく、当該メディア特徴量ベクトル要素の潜在トピック生起確率行列と、潜在トピック重み行列とに分解することにより、前記入力行列に対する潜在トピック重み行列を算出する潜在トピック重み行列算出手段と、
前記画像特徴量ベクトル要素の潜在トピック生起確率行列と、前記潜在トピック重み行列算出手段により算出された潜在トピック重み行列とを掛け合わせて、前記未知メディアデータに対応する画像特徴量ベクトル要素の生起確率行列を算出する画像特徴量ベクトル生起確率行列算出手段と、
前記画像特徴量ベクトル生起確率行列算出手段によって算出された画像特徴量ベクトル要素の生起確率行列に基づいて、前記標本データの中から類似する画像特徴量ベクトル要素の生起確率を有する画像を抽出し、検索結果として出力する検索結果出力手段と、を備えることを特徴とするマルチメディア検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009265490A JP5463873B2 (ja) | 2009-11-20 | 2009-11-20 | マルチメディア分類システム及びマルチメディア検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009265490A JP5463873B2 (ja) | 2009-11-20 | 2009-11-20 | マルチメディア分類システム及びマルチメディア検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011108192A JP2011108192A (ja) | 2011-06-02 |
JP5463873B2 true JP5463873B2 (ja) | 2014-04-09 |
Family
ID=44231548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009265490A Active JP5463873B2 (ja) | 2009-11-20 | 2009-11-20 | マルチメディア分類システム及びマルチメディア検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5463873B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5462748B2 (ja) * | 2010-09-03 | 2014-04-02 | 日本電信電話株式会社 | データ可視化装置、データ変換装置、方法、及びプログラム |
WO2018235177A1 (ja) | 2017-06-21 | 2018-12-27 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び、記録媒体 |
CN110532329B (zh) * | 2019-09-02 | 2022-06-21 | 智慧谷(厦门)物联科技有限公司 | 一种基于区块链技术的智能手环数据处理与共享方法 |
CN112861670B (zh) * | 2021-01-27 | 2022-11-08 | 华北电力大学(保定) | 一种输电线路金具检测方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1959358A4 (en) * | 2005-12-05 | 2010-04-07 | Sony Corp | APPARATUS, METHOD AND PROGRAM FOR INFORMATION PROCESSING |
JP4175390B2 (ja) * | 2006-06-09 | 2008-11-05 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
JP2008181296A (ja) * | 2007-01-24 | 2008-08-07 | Osaka Prefecture Univ | 画像検索方法および画像検索プログラム |
-
2009
- 2009-11-20 JP JP2009265490A patent/JP5463873B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011108192A (ja) | 2011-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5458815B2 (ja) | マルチメディア検索システム | |
Choudhury et al. | Figure metadata extraction from digital documents | |
US10528609B2 (en) | Aggregating procedures for automatic document analysis | |
KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
CN108228541A (zh) | 生成文档摘要的方法和装置 | |
JP5463873B2 (ja) | マルチメディア分類システム及びマルチメディア検索システム | |
Bafna et al. | Hindi multi-document word cloud based summarization through unsupervised learning | |
CN109960730B (zh) | 一种基于特征扩展的短文本分类方法、装置以及设备 | |
Ashok Kumar et al. | An efficient text-based image retrieval using natural language processing (NLP) techniques | |
CN111368126A (zh) | 一种面向图像检索的生成方法 | |
JP4143234B2 (ja) | 文書分類装置、文書分類方法及び記憶媒体 | |
CN111199801A (zh) | 一种用于识别病历的疾病类型的模型的构建方法及应用 | |
CN116629258B (zh) | 基于复杂信息项数据的司法文书的结构化分析方法及系统 | |
US11676231B1 (en) | Aggregating procedures for automatic document analysis | |
JP5569698B2 (ja) | 類型化装置、類型化方法及び類型化プログラム | |
JP4359075B2 (ja) | 概念抽出システム、概念抽出方法、概念抽出プログラム及び記憶媒体 | |
JP2004206391A (ja) | 文書情報分析装置 | |
CN114756617A (zh) | 一种工程档案结构化数据提取方法、系统、设备和存介质 | |
CN113516202A (zh) | Cbl特征提取与去噪的网页精准分类方法 | |
Girdhar et al. | Benchmarking nas for article separation in historical newspapers | |
Lin et al. | A music retrieval method based on hidden markov model | |
JP4125951B2 (ja) | テキスト自動分類方法及び装置並びにプログラム及び記録媒体 | |
Sun et al. | Analysis of English writing text features based on random forest and Logistic regression classification algorithm | |
Sailaja et al. | Rough set based feature selection approach for text mining | |
WO2015029158A1 (ja) | データ変換装置およびデータ変換方法ならびにデータ変換プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120508 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140106 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5463873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |