JP4937578B2 - 情報処理方法 - Google Patents
情報処理方法 Download PDFInfo
- Publication number
- JP4937578B2 JP4937578B2 JP2005356537A JP2005356537A JP4937578B2 JP 4937578 B2 JP4937578 B2 JP 4937578B2 JP 2005356537 A JP2005356537 A JP 2005356537A JP 2005356537 A JP2005356537 A JP 2005356537A JP 4937578 B2 JP4937578 B2 JP 4937578B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- feature vector
- feature data
- information processing
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・ユーザが、関連したコンテンツがあることを知らない。
・ユーザが、関連したコンテンツがあることを知っているが、そのコンテンツがどこにあるかを知らない。
・ユーザが、コンテンツがあることを知っているが、そのコンテンツが関連したコンテンツであることを知らない。
・ユーザが、関連したコンテンツがあり、そのコンテンツを見つける方法も知っているが、コンテンツを見つけ出すのに時間がかかる。
・縮退された特徴ベクトルの作成のためにどの基本特徴ベクトルを用いることが適当であるか。
・基本特徴ベクトルを結合して縮退された特徴ベクトルを形成する最良の手法は何であるか。
・基本特徴ベクトル及び縮退された特徴ベクトルが何らかの冗長データを含んでいるか、及び冗長データが含まれている場合、それを取り除くことができるか。
・アニメーション
・ゲームショー
・ニュース
・ドラマ
・スポーツ
・トークショー
DVジャンル
・自動車
・ダイビング
・ファッション
・セーリング
・南極
・電車
SOMの各ノードは、複数のオブジェクトに対応することがあり、これらのオブジェクトは、同じジャンルからのオブジェクトである場合もあれば、異なるジャンルからのオブジェクトである場合もある。ここでは、各ノードを1つの種類のジャンルのみに対応付けることを目的とする。成功を測定するために、SOM内の各ノードを、主なジャンル(そのノードへの既知の所望のマッピングとみなされる)によって分類し、ノードに関連するアイテムの総数におけるその主なジャンルの割合を算出する。そして、SOM内の全てのノードに亘ってこの割合を平均し、これにより得られる平均値を以後「組織化精度」と呼ぶ。
この実験の第1の部分で用いた基本特徴ベクトルには、5つの種類があり、これらは、色、形状、オーディオ、顔及びエッジ/プレーンに基づく特徴ベクトルである。以下に示す結果の多くは、エッジ/プレーンベクトルなしで導出されたものであるが、後述する順列に加えて(又は順列内の1又は複数のベクトルに代えて)エッジ/プレーンベクトルを用いて同様の原理を適用してもよい。更に、以下に示す順列は、単に例示的なものであり、ベクトルの他の順列を用いてもよい。
用いることができる幾つかの色モデルがある。この実験の目的に最適な色モデルを見出すために、幾つかの色モデルを試した。
・平均
・標準偏差
・組合せ(結合された平均及び標準偏差ベクトル)
・明度ヒストグラム
・平均
・標準偏差
・組合せ(結合された平均及び標準偏差ベクトル)
・赤ヒストグラム
・平均
・標準偏差
・組合せ(結合された平均及び標準偏差ベクトル)
・緑ヒストグラム
・平均
・標準偏差
・組合せ(結合された平均及び標準偏差ベクトル)
・青ヒストグラム
・平均
・標準偏差
・組合せ(結合された平均及び標準偏差ベクトル)
・RGBヒストグラム(60ビン、3つの異なるヒストグラムの組合せ)
・平均
・標準偏差
・組合せ(結合された平均及び標準偏差ベクトル)
2つの異なる種類の形状記述子を検査した。これらの間の差異は、第4のステップにおける高速フーリエ変換(FFT)の後に得られる。全ての形状記述子は、以下の手法で抽出される。
1.例えば、双線形補間によって、各フレームを64×64画像サイズに変更する。
2.サイズ変更されたフレームに対してFFTを実行する。
3.各方向の最初の10個の周波数(最低周波数)を100値の長さの特徴ベクトルに結合する。
4.2つの異なる種類の特徴ベクトルをここで生成する。
i.ベクトルに対しては如何なる処理も施さない通常のFFT
ii.特徴ベクトルの各値を以下の式によって処理する拡張されたFFT(Magnified FFT)
D(u,v)=10*log(1+|F(u,v)|)
5.メディアアイテム全体に亘って、ベクトルの各列についての平均及び標準偏差を算出し、これは、ポストプロセッシングメソッドあたり3つの特徴ベクトルを提供する。
i.平均
ii.標準偏差
iii.組合せ(結合された平均及び標準偏差特徴ベクトル)
2つの異なる種類の顔の特徴ベクトルを検査した。一方を「顔特徴」と呼び、他方を「顔統計」と呼ぶ。
・顔カウント、すなわち、フレーム内にある顔の数
・フレーム内の全ての顔の平均した顔のサイズ
・フレーム内の全ての顔の平均x(水平)位置
2.そして、メディアアイテム内の全てのフレームに亘って、3つの全ての変数について、平均及び標準偏差を算出する。
3.顔カウント、サイズ及びx−位置に関する平均及び標準偏差は、6個の変数を有する特徴ベクトルを形成する。
顔分類器は、以下のように動作する。
a.顔のサイズが(例えば、幅について)21画素以上の場合、その顔をサブクラスAとして分類し、顔のサイズが21画素より小さい場合、その顔をサブクラスBとして分類する。
b.顔のx−位置について、例えば、左端からの画素数が74画素(例えば、左端からの画素数)未満である場合、74〜114画素である場合、114画素を上回る場合等に基づいて、サブクラスA及びBの両方を3つの異なるサブクラスに分類する。
2.各メディアアイテムは、7ビンのヒストグラムを有し、第1のビンは、顔がないフレームを表し、他の各ビンは、6つの異なる顔クラスを表す。解析された各フレームについて、顔が検出されると、その顔の分類に属するビンを1ずつ大きくする。
3.ヒストグラムは、メディアアイテムを表す7ビンの基本特徴ベクトルを形成する。
利用可能なオーディオ情報は、48kHzのサンプルレートを有し、このオーディオ情報は、16msのオーバラップを有する32msのウィンドウでサンプリングされ、これにより合計N=1536個のサンプルが得られる。rms振幅は、以下のように定義される。
1.各オーディオフレームについて、パワースペクトルを算出する。
2.パワースペクトルピークを、離散的な演算子{0.25f、0.75f、1.0f、0.75f、0.25f}によって強調する。
3.オーディオウィンドウの高調波を以下のように算出する。
a.50Hzのピッチから1000Hzのピッチに達するまで、櫛形フィルタのフィルタリング周波数を連続的に高める。各ステップにおいて、櫛形フィルタによってフィルタリングされた信号「C」と、雑音「N」との間の差分を取る。
i.櫛形フィルタ値を以下のように算出する。
Ci=2.25*Si−1+1.5*Si+2.25*Si+1
ここで、「i」は、ピッチ周波数であり、「S」は、強調された信号である。[i−1,i,i+1]について、S=1のとき、C=6となるかを観測する。
ii.雑音を以下のように算出する。
次に、他の基本特徴ベクトルを定義する。この特徴ベクトルを、エッジ/プレーンフィールドヒストグラム(edge/plain field histogram:以下、EPFHという。)特徴ベクトルと呼ぶ。この特徴ベクトルは、以下のような2つの基本的な手順によって生成される。
2.EPFHの生成
処理は、0≦H≦360、0≦S≦1、0≦V≦1として、HSV(Hue Saturation Value:色相・彩度・明度)符号化された画像から開始される。検討される画像がこのフォーマットで提供されていない場合、マッピング処理によって画像をこのフォーマットに変換することは容易(且つ、既知)である。
次に、画像内の各画素毎に、各画素(中心画素)を周囲の画素(8つの画素のグループ)と順次比較する。周囲の画素のいずれかが現在の中心画素とは異なる色インデクス値を有する場合、その中心画素は、「エッジ」画素とみなされ、これ以外の場合、プレーンフィールド画素であるとみなされる。
エッジヒストグラム及びプレーンフィールドヒストグラムは、長さが1になるように、それぞれ個別に正規化される。また、画像内のエッジ画素の総画素に対する比率(「エッジ比率」)も算出する。
主な目的は、個々の基本特徴ベクトルがジャンルと如何に高い相関性を有するかを調べることである。
列2:平均組織化精度は、100個の混同マトリクスからの組織化精度OAの平均である(このパラメータは、分類がどれ程優れいているかを示す)。これは、百分率で表現される。
列3:組織化精度の標準偏差は、100個の混同マトリクスからの組織化精度の標準偏差である(このパラメータは、分類がどれ程安定しているかを示す)。
列4:標準偏差精度は、100個の混同マトリクスからの標準偏差の平均である(このパラメータは、分類がどれ程一般性を有するかを示す)。
列5: 標準偏差精度の標準偏差は、100個の混同マトリクスからの標準偏差の標準偏差である(このパラメータは、分類がどれ程安定しているかを示す)。
列6:検算された全ての特徴ベクトルから平均組織化精度の平均を算出し、この平均を平均組織化精度から減算する。これにより、各特徴ベクトルの成功の度合いが良好に示される。
TV及びDVマテリアルに関するそれぞれの結果を以下の2つの表として示す。第1の表は、検査内で用いられたデータを示し、第2の表は、前章に示した結果を示している。
TV検査データは、表3に示すジャンルからの697個の5分のクリップからなる。表4は、総合的な結果を示している。
この技術の目的は、縮退された特徴ベクトルで用いる基本特徴ベクトルを選択することである。この実験では、以下のような、4つの主な種類の基本特徴ベクトルクラスがある。
・FFTベースの特徴ベクトル
・オーディオベースの特徴ベクトル
・顔ベースの特徴ベクトル
縮退された特徴ベクトルは、この実験では検査しなかったデータ集合にも機能するように多角的(diversified)で安定している必要があると同時に、平均特徴ベクトルより良好に機能することが理想的である。したがって、縮退された特徴ベクトルは、全ての主な基本特徴ベクトルクラスからのデータを含む必要がある。
TVマテリアル及びDVマテリアルからの結果を総合すると、この目的に適した色モデルはRGBであることがわかる。なお、RGBの平均値だけを用いた特徴ベクトルよりも2倍の長さになるが、RGBの組合せヒストグラムを用いた方が僅かに優れているだけであっても、ここではRGBの組合せヒストグラムを使用する。RGBの組合せヒストグラムを用いる理由は、組合せヒストグラムが平均値だけより遙かに広範囲に亘る情報を提供し、後述するホテリング変換(Hotelling transform)により、特徴ベクトルが著しく短くなるからである。
拡張されたFFTの平均及び標準偏差は、TV及びDVマテリアルの両方について良好に機能する。なお、これらの組合せは、平均及び標準偏差自身程は良好に機能しない。なお、「色ベースの特徴ベクトル」の場合と同様の理由から、ここでは組合せベクトルを用いる。
オーディオの特徴ベクトルは、全てのマテリアルについて良好に機能し、良い選択である。
TVマテリアルについて、2つの異なる種類の顔特徴ベクトルである「顔特徴」及び「顔統計」を検査した。「顔統計」は、「顔特徴」より僅かに良好であり、演算も比較的簡単であった。DVマテリアルについては、「顔特徴」を検査していないが、TVマテリアルからの結果から、基本特徴ベクトル「顔統計」を用いることを判断した。
特徴ベクトルのコンパクト性は、特徴ベクトルの非常に重要な側面である。この実験の主な目的は、特徴ベクトルをより少ない変数で表現できるかを調査することである。
1.平均標準偏差正規化法によって、列毎に特徴ベクトル集合を正規化した。
2.集合内の全ての特徴ベクトルをホテリング変換によって変換した。
3.以下のような評価ループを開始し、特徴ベクトルに残る変数が1つだけになるまでこの評価ループを継続的に実行した。
a.ベクトル内に残る最後(最下位)の変数を除外又は削除する。
b.特徴ベクトルを10回評価し、平均組織化精度をグラフにする。
・120変数のRGB組合せベクトルの最初の7個の変数
・200変数の拡張されたFFT組合せベクトルの最初の10個の変数
・6変数の顔統計ベクトルの全ての6個の変数
SOM(後述)は、トレーニング及び特徴ベクトルの組織化のためにユークリッド距離を用いる。結合された特徴ベクトルの如何なる部分も、他の如何なる部分より大きな影響を有さないようにするために、「基本特徴ベクトル」の各値が同じ値範囲内になるように各値を正規化することが望ましい。正規化については、以下のような3つの主な手法がある。
2.基本特徴ベクトルの各変数は、等しく貢献し、したがって、平均標準偏差正規化又は1次変換によって特徴ベクトルを列毎に正規化する。
3.上の2つ手法の組合せ(例えば、列の正規化の後にそれ自身の長さの正規化を行う。)
結合の前後のベクトル正規化は、いずれも、結果をより劣化させているだけであることは明らかである。線形正規化は、DVマテリアルについては、結果を改善しているが、TVマテリアルについては、結果を劣化させており、したがって、異なるデータ集合間で不安定であることがわかる。一方、平均標準偏差正規化は、TVマテリアル及びDVマテリアルの両方について良好に機能し、したがって、好適な正規化法であると言える。
前章では、幾つかの異なる方法及び処理を用いて縮退された特徴ベクトルを生成した。今までのところ、最良と考えられる手法は、基本特徴ベクトルを用いて、これらを結合し、平均標準偏差正規化法によってこれらを正規化する手法である。
色
基本的な色特徴ベクトルは、メディアアイテム全体に対する60ビンRGBヒストグラム(1色あたり20ビン)の平均及び標準偏差からなる。これにより、120変数の特徴ベクトルが得られる。
各映画フレームを、双線形補間によって、720×576から64×64にサイズ変更する(これにより、エイリアシング問題が生じる)。ここでは、64×64の画像をFFTによって変換し、以下のように、10個の最低周波数のパワーに1を加算した値の対数を保存した。
D(u,v)=10*log(1+|F(u,v)|)
これにより、100値の長いベクトルが生成される。これらのベクトルは、各フレームについて生成され、メディアアイテム全体に亘る平均及び標準偏差を特徴ベクトルとして用いた。これは、200値の長さの特徴ベクトルが得られることを意味する。
上述のようにオーディオ特徴ベクトルを作成し、これにより、41値の特徴ベクトルを得た。
上述のように、顔特徴ベクトルを作成し、これにより、それは6値の特徴ベクトルを得た。
サブ特徴ベクトルを平均標準偏差正規化によって正規化し、結合した。これにより、以下のような実証的な組織化精度を有する30値の長さの特徴ベクトルが得られた。
本明細書及び参考文献の任意の部分におけるSOMに関する説明も参照される。
ホテリング変換は、主要成分、固有ベクトル及び離散カーネン−レーベ変換としても知られている。ホテリング変換は、特徴ベクトル内の冗長性を低減するための非常に有用な手法である。
そして、ホテリング変換は、以下の式で記述することができる。
ここで、xはyに変換される。yベクトルの第1の次元は、分散が最も大きく、第2の次元は、次に分散が大きく、以下同様に、次元が高くなるにつれて分散が小さくなる。これは、固有値のサイズに関して固有ベクトルを組織化したためである。
ベクトル正規化とは、ベクトルをそれ自身のノルムで除算する標準の代数的演算である。これにより、長さが1のベクトルが得られる。
各列について、最小及び最大を見出し、これらを新たな最小及び最大に変換する。
平均及び標準偏差正規化は、一種の列正規化である。列毎に平均及び標準偏差を取る。そして、各値を平均によって変換し、その列の標準偏差で除算する。
ホテリング変換によってベクトル集合を変換し、ベクトルによって短くし、ベクトルを結合した場合と、ベクトルを結合し、ホテリング変換によって変換し、最終的な特徴ベクトルを短くした場合とを比較する実験を行い、このような手法に何らかの利点があるかを調べた。
この実験では、結合前に短縮された特徴ベクトルと、結合後に短縮された特徴ベクトルの2つの種類の特徴ベクトルを互いに比較した。これらの特徴ベクトルは、以下のようにして導出した。
各基本特徴ベクトルをホテリング変換によって変換し、(上述のように)その冗長性「折点」で切り捨て、平均標準偏差正規化によって正規化した。そして、全ての基本特徴ベクトルを結合し、1つの大きい特徴ベクトルを形成した。
各基本特徴ベクトルを平均標準偏差正規化によって正規化し、結合して1つの大きい特徴ベクトルを形成した。そして、大きい特徴ベクトルをホテリング変換によって変換し、結合前に短縮された特徴ベクトルと同じ長さに切り捨てた。
Claims (22)
- 情報アイテムの特徴データ間相互の類似性に基づき、上記特徴データが類似する情報アイテムがノード配列内の近接する位置にマッピングされるように、該情報アイテムを該ノード配列内の各ノードにマッピングする情報処理方法において、
(a)プロセッサが、情報アイテムのグループの各情報アイテムについて、該情報アイテムのプロパティの集合を抽象的表現として示す特徴データをそれぞれ生成し、当該生成された特徴データから、所定の統計手法を用いて、重要度が高いプロパティ及び重要度が低いプロパティを検出し、当該検出された重要度が高いプロパティを有する複数の特徴データから、それぞれ縮退された複数の特徴ベクトルを生成し、当該生成された複数の特徴ベクトルを結合し、当該情報アイテムについて1つの縮退された特徴ベクトルを生成するステップと、
(b)上記プロセッサが、上記生成された縮退された特徴ベクトルを、上記ノード配列内のノードにマッピングするステップと
を有する情報処理方法。 - 上記情報アイテムは、オーディオ及び/又はビデオマテリアルアイテムを含み、上記プロパティは、マテリアルアイテムのオーディオ及び/又はビデオプロパティを含むことを特徴とする請求項1記載の情報処理方法。
- 上記検出された重要度が低いプロパティを示すデータを保存するステップを更に有する請求項1又は2記載の情報処理方法。
- ノードに新たにマッピングされる情報アイテムに関して、情報アイテムの現在のグループに関連するマッピングを用いるステップと、
少なくとも、上記情報アイテムの現在のグループに関して上記縮退された特徴ベクトルに用いられた情報アイテムのプロパティを表す特徴データを検出するステップと、
検出された特徴データを関連付け、新たにマッピングされる情報アイテムに対応する縮退された特徴ベクトルを形成するステップとを有する請求項3記載の情報処理方法。 - 新たにマッピングされた情報アイテムと、該情報アイテムがマッピングされるノードとの間のマッピング誤差に基づいて、誤差量を導出するステップと、
上記誤差量が閾値誤差を上回っているか否かを判定するステップと、
上記誤差量が閾値誤差量を上回っている場合、上記新たにマッピングされた情報アイテムを含む情報アイテムの集合体の再マッピングを開始するステップとを更に有する請求項4記載の情報処理方法。 - 上記誤差量は、上記新たにマッピングされたノードに対応する上記縮退された特徴ベクトルと、上記情報アイテムが新たにマッピングされたノードとの間のユークリッド距離に依存することを特徴とする請求項5記載の情報処理方法。
- 所定数の新たにマッピングされた情報アイテムに関連する誤差量が閾値誤差量を上回った場合のみ再マッピングを開始するステップを更に有する請求項5又は6記載の情報処理方法。
- 所定数の新たにマッピングされた情報アイテムに関連する誤差量が閾値誤差量を超え、及びこれらの情報アイテムが、全体として、閾値期間内にマッピングされた場合のみ再マッピングを開始するステップを更に有する請求項7記載の情報処理方法。
- 上記再マッピング動作は、上記重要度が高い及び重要度が低いプロパティを検出するステップを繰り返すステップを含むことを特徴とする請求項5乃至8いずれか1項記載の情報処理方法。
- 上記情報アイテムのグループから生成された縮退された特徴ベクトルについて実行されたマッピングを用いてノードに新たにマッピングされる検索クエリに関して、
上記検索クエリの一部として、少なくとも、上記縮退された特徴ベクトルの生成に用いられた、上記情報アイテムの上記重要度が高いプロパティを有する特徴データを記憶するステップと、
上記記憶された特徴データを用いて、上記新たにマッピングされる検索クエリに対応する縮退された特徴ベクトルを生成するステップとを有することを特徴とする請求項3乃至9いずれか1項記載の情報処理方法。 - 上記重要度が高い及び重要度が低いプロパティを検出するステップは、主成分解析法を用いることを特徴とする請求項1乃至10いずれか1項記載の情報処理方法。
- 上記重要度が高い及び重要度が低いプロパティを検出するステップは、ホテリング変換技術を用いることを特徴とする請求項11記載の情報処理方法。
- 上記重要度が高い及び重要度が低いプロパティを検出するステップは、個々のプロパティ又はプロパティのサブグループに関して実行されることを特徴とする請求項1乃至12いずれか1項記載の情報処理方法。
- 上記一組のプロパティは、色相統計的分布、明度統計的分布、明度統計的分布、色成分統計的分布、画像形状、顔検出統計、オーディオのパワー、オーディオサブバンドのパワー、オーディオの明るさ、オーディオの帯域幅、オーディオのピッチ、オーディオのメル周波数プロパティから選択された1つ以上のプロパティを含むことを特徴とする請求項1乃至13いずれか1項記載の情報処理方法。
- 重要度が低いプロパティに関連する特徴データを削除するステップを更に有する請求項1乃至14いずれか1項記載の情報処理方法。
- どのプロパティの重要度が高いか、又は重要度が低いかを判定するために、
(1)上記ノード配列内のノードに既知の望ましいマッピングが行われた所定の情報アイテムの検査グループについて、該情報アイテムのプロパティの集合のそれぞれを表す特徴データを検出するステップと、
(2)上記情報アイテムの検査グループについて検出された上記特徴データの集合体について、該特徴データ内又は該特徴データのサブカテゴリ内で重要度の順序を検出し、
nを少なくとも2として、上記特徴データの集合体において重要度が高い順に上位n個の最も重要なプロパティを有する特徴データを結合して、各情報アイテムについて1つの縮退された特徴ベクトルを生成し、
上記生成された縮退された特徴ベクトルを、上記ノード配列内のノードにマッピングし、
上記n個の特徴データから生成された縮退された特徴ベクトルにより実行されたマッピングと、上記既知の望ましいマッピングとの間の差異の度合いを検出するステップと
を更に有する請求項1乃至15いずれか1項記載の情報処理方法。 - nにおける上記差異の度合いと、n+1における上記差異の度合いとの差分が、上記差異の度合いに関する閾値を下回るnの値を検出することによって、上記重要度が高い特徴データと、上記重要度が低い特徴データとの間の境界を検出するステップを含むことを特徴とする請求項16記載の情報処理方法。
- コンピュータに、請求項1乃至17いずれか1項記載の情報処理方法における各ステップを実行させるためのプログラム。
- 請求項18記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
- 情報アイテムの特徴データ間相互の類似性に基づき、上記特徴データが類似する情報アイテムがノード配列内の近接する位置にマッピングされるように、該情報アイテムを該ノード配列内の各ノードにマッピングする情報処理装置において、
情報アイテムのグループの各情報アイテムについて、該情報アイテムのプロパティの集合を抽象的表現として示す特徴データをそれぞれ生成し、当該生成された特徴データから、所定の統計手法を用いて、重要度が高いプロパティ及び重要度が低いプロパティを検出する検出手段と、
上記検出された重要度が高いプロパティを有する複数の特徴データから、それぞれ縮退された複数の特徴ベクトルを生成し、当該生成された複数の特徴ベクトルを結合し、当該情報アイテムについて1つの縮退された特徴ベクトルを生成する生成手段と、
上記生成された縮退された特徴ベクトルを、上記ノード配列内のノードにマッピングするマッピング手段と
を備える情報処理装置。 - 請求項20記載の情報処理装置を含む携帯型データ処理装置。
- 請求項20記載の情報処理装置を含むビデオ取得処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0427041A GB2421094A (en) | 2004-12-09 | 2004-12-09 | Generating reduced feature vectors for information retrieval |
GB0427041.9 | 2004-12-09 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006236311A JP2006236311A (ja) | 2006-09-07 |
JP2006236311A5 JP2006236311A5 (ja) | 2008-12-25 |
JP4937578B2 true JP4937578B2 (ja) | 2012-05-23 |
Family
ID=34073470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005356537A Expired - Fee Related JP4937578B2 (ja) | 2004-12-09 | 2005-12-09 | 情報処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8311100B2 (ja) |
EP (1) | EP1669897A3 (ja) |
JP (1) | JP4937578B2 (ja) |
CN (1) | CN1786966A (ja) |
GB (1) | GB2421094A (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004068414A1 (ja) * | 2003-01-27 | 2004-08-12 | Fujitsu Limited | 注目物体の出現位置表示装置 |
US20070185857A1 (en) * | 2006-01-23 | 2007-08-09 | International Business Machines Corporation | System and method for extracting salient keywords for videos |
GB2444535A (en) | 2006-12-06 | 2008-06-11 | Sony Uk Ltd | Generating textual metadata for an information item in a database from metadata associated with similar information items |
EP2524324B1 (fr) | 2010-01-11 | 2019-04-24 | InterDigital Madison Patent Holdings | Procede de navigation parmi des identificateurs places dans des zones et recepteur mettant en oeuvre le procede |
CN107169526B (zh) * | 2012-11-09 | 2020-10-16 | 加州理工学院 | 自动特征分析、比较和异常检测的方法 |
US9843623B2 (en) | 2013-05-28 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for selecting media items |
CN105791906A (zh) * | 2014-12-15 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 信息推送的方法和系统 |
US10650068B2 (en) | 2017-01-09 | 2020-05-12 | Google Llc | Search engine |
JP6856567B2 (ja) * | 2018-02-28 | 2021-04-07 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
GB2578574B (en) * | 2018-10-30 | 2021-03-10 | Advanced Risc Mach Ltd | Circuitry and method |
CN112786050B (zh) * | 2019-11-07 | 2024-02-02 | 王皓 | 一种语音识别的方法、装置及设备 |
US11507770B2 (en) * | 2020-05-01 | 2022-11-22 | EMC IP Holding Company LLC | Precomputed similarity index of files in data protection systems with neural network |
CN113627176B (zh) * | 2021-08-17 | 2024-04-19 | 北京计算机技术及应用研究所 | 一种利用主元分析计算汉语词向量的方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4959870A (en) * | 1987-05-26 | 1990-09-25 | Ricoh Company, Ltd. | Character recognition apparatus having means for compressing feature data |
JPH0469780A (ja) * | 1990-07-10 | 1992-03-04 | N T T Data Tsushin Kk | 次元圧縮方法 |
US6466926B1 (en) * | 1996-03-06 | 2002-10-15 | Hewlett-Packard Company | Method for optimizing a recognition dictionary to distinguish between patterns that are difficult to distinguish |
US6038337A (en) * | 1996-03-29 | 2000-03-14 | Nec Research Institute, Inc. | Method and apparatus for object recognition |
US5999893A (en) * | 1997-05-02 | 1999-12-07 | The United States Of America As Represented By The Secretary Of The Navy | Classification system and method using combined information testing |
JPH1139325A (ja) * | 1997-07-22 | 1999-02-12 | Matsushita Electric Ind Co Ltd | 類似検索方法及び類似検索システム |
US6774917B1 (en) * | 1999-03-11 | 2004-08-10 | Fuji Xerox Co., Ltd. | Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video |
US6397200B1 (en) * | 1999-03-18 | 2002-05-28 | The United States Of America As Represented By The Secretary Of The Navy | Data reduction system for improving classifier performance |
US6789070B1 (en) * | 2000-06-14 | 2004-09-07 | The United States Of America As Represented By The Secretary Of The Navy | Automatic feature selection system for data containing missing values |
US7123783B2 (en) * | 2002-01-18 | 2006-10-17 | Arizona State University | Face classification using curvature-based multi-scale morphology |
CA2493105A1 (en) * | 2002-07-19 | 2004-01-29 | British Telecommunications Public Limited Company | Method and system for classification of semantic content of audio/video data |
GB2395806A (en) * | 2002-11-27 | 2004-06-02 | Sony Uk Ltd | Information retrieval |
GB2395805A (en) * | 2002-11-27 | 2004-06-02 | Sony Uk Ltd | Information retrieval |
-
2004
- 2004-12-09 GB GB0427041A patent/GB2421094A/en not_active Withdrawn
-
2005
- 2005-05-16 US US11/129,816 patent/US8311100B2/en not_active Expired - Fee Related
- 2005-11-15 EP EP05257042A patent/EP1669897A3/en not_active Withdrawn
- 2005-12-09 JP JP2005356537A patent/JP4937578B2/ja not_active Expired - Fee Related
- 2005-12-09 CN CNA2005101370469A patent/CN1786966A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20060143230A1 (en) | 2006-06-29 |
US8311100B2 (en) | 2012-11-13 |
CN1786966A (zh) | 2006-06-14 |
GB0427041D0 (en) | 2005-01-12 |
EP1669897A3 (en) | 2006-11-08 |
EP1669897A2 (en) | 2006-06-14 |
JP2006236311A (ja) | 2006-09-07 |
GB2421094A (en) | 2006-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4937578B2 (ja) | 情報処理方法 | |
JP4540970B2 (ja) | 情報検索装置及びその方法 | |
US7493340B2 (en) | Image retrieval based on relevance feedback | |
US7809185B2 (en) | Extracting dominant colors from images using classification techniques | |
JP4569955B2 (ja) | 情報格納及び検索方法 | |
JP5518301B2 (ja) | 情報処理装置 | |
US8117183B2 (en) | Accurate content-based indexing and retrieval system | |
US20040107221A1 (en) | Information storage and retrieval | |
JP2008276768A (ja) | 情報検索装置及び方法 | |
WO2000048397A1 (fr) | Procede de traitement de signal et dispositif de traitement video/audio | |
US7627820B2 (en) | Information storage and retrieval | |
KR20030029410A (ko) | 웹 기반 영상 데이터 검색 시스템 및 그 방법 | |
JP2006127484A (ja) | 情報処理方法 | |
Wang et al. | Relevance feedback technique for content-based image retrieval using neural network learning | |
CN101589387B (zh) | 信息处理 | |
US20040130569A1 (en) | Information storage and retrieval | |
Aparna | Retrieval of digital images based on multi-feature similarity using genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080418 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081112 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110816 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111017 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120222 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |