JP5257071B2 - 類似度計算装置及び情報検索装置 - Google Patents
類似度計算装置及び情報検索装置 Download PDFInfo
- Publication number
- JP5257071B2 JP5257071B2 JP2008527785A JP2008527785A JP5257071B2 JP 5257071 B2 JP5257071 B2 JP 5257071B2 JP 2008527785 A JP2008527785 A JP 2008527785A JP 2008527785 A JP2008527785 A JP 2008527785A JP 5257071 B2 JP5257071 B2 JP 5257071B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- media data
- query
- metatext
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 179
- 238000000034 method Methods 0.000 claims description 15
- 230000007423 decrease Effects 0.000 claims 3
- 238000013500 data storage Methods 0.000 description 40
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 15
- 239000013598 vector Substances 0.000 description 8
- 235000010724 Wisteria floribunda Nutrition 0.000 description 6
- LKAPTZKZHMOIRE-KVTDHHQDSA-N (2s,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolane-2-carbaldehyde Chemical compound OC[C@H]1O[C@H](C=O)[C@@H](O)[C@@H]1O LKAPTZKZHMOIRE-KVTDHHQDSA-N 0.000 description 4
- LKAPTZKZHMOIRE-UHFFFAOYSA-N chitose Natural products OCC1OC(C=O)C(O)C1O LKAPTZKZHMOIRE-UHFFFAOYSA-N 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000010006 flight Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Description
入力手段601から入力された実際の音声が
「昨夜からの寒波の訪れで、北海道は大雪となり、新千歳空港発の便など交通機関が大幅に乱れました」であるとき、
音声認識手段602による認識結果が
「咲く世からの寒波の訪れで北海道は大雪となら新地都政空港発の便など交通機関が大ハブに乱れまして」となった場合を考える。
その理由は、音声認識誤りの結果として、ある音声データのメタテキスト中にその音声データとは無関係なテキストが存在するため、その音声データと無関係なクエリでもメタテキストとの類似度が大きくなることがあるためである。
上述した例においては、音声認識誤りの結果として、「都政」や「ハブ」などの誤ったテキストがメタテキスト中に存在する。従って、音声データとは無関係な「都政」や「ハブ」などのクエリによって検索した場合でも、クエリとメタテキストとの類似度が大きくなり、この音声データは、これらのクエリとは無関係であるにも関わらず検索されてしまう。
ここで、本明細書および特許請求の範囲では、「クエリ」とは、検索対象となるメディアデータあるいはそのメタデータなどと比較してメディアデータとの類似度を求めるためのデータ、およびそれらの論理的な組み合わせ(論理積や論理和など)を意味する。
一のメディアデータとは異なる他のメディアデータに対して前記クエリとの類似度を表す単独スコアを計算し、
前記他のメディアデータに対して前記一のメディアデータとの類似度を表すメディア間類似度を計算し、
前記メディア間類似度と前記単独スコアとを用いて、前記一のメディアデータと前記クエリとの類似度を求めることを特徴とするものである。
前記類似度に基づいて前記クエリに対する検索結果を生成することを特徴とするものである。
前記類似度計算装置が検索対象となるメディアデータのそれぞれを前記あるメディアデータとして前記クエリとの類似度を計算する機能と、
前記類似度に基づいて前記クエリに対する検索結果を生成する機能とを実行させることを特徴とするものである。
(実施形態1)
本発明の実施形態1に係る類似度計算装置100は図1に示すように、あるメディアデータとクエリとの類似度を求める装置であって、前記あるメディアデータとは異なる第2のメディアデータに対して前記クエリとの類似度を表す単独スコアを計算する単独スコア計算手段104と、前記第2のメディアデータに対して前記あるメディアデータとの類似度を表すメディア間類似度を計算するメディア間類似度計算手段103と、前記第2のメディアデータの前記メディア間類似度と前記単独スコアとを用いて、前記あるメディアデータと前記クエリとの類似度を求めるクエリ類似度計算手段105、とから構成されている。
本実施の形態の説明では、メディアデータ記憶手段101は画像データを記憶し、メタテキスト記憶手段102は各画像データを説明するメタテキストを記憶しているものとする。このようなメタテキストは、例えば、人手によって付与することができる。
図9は、画像の内容を表すメタテキストが付与された6枚の画像を、メディア間類似度計算手段103により計算される画像間の類似度に基づいて模式的に平面上に配置した図である。すなわち、図9において、互いに近くに配置されている画像1〜4同士(例えば山に関する画像)や、画像5と画像6(例えば花に関する画像)は画像がそれぞれ類似していることを表す。一方で、画像1と画像5などは画像が類似していない(図中では類似した画像間を実線で結び、類似していない画像間を破線で結んでいる)。また、画像の下に記述されているテキスト「山」や「花」が、各画像に付与されたメタテキストを表す。ここで、画像1のメタテキストは本来「山」となるべきところを、誤って「花」が付与されているとする(図9では、メタテキストのうち誤っている部分に「×」を付してある、図12または図13も同様)。これは人手によるメタテキスト作成の誤りや、画像認識などによりメタテキストを自動生成した際の誤りなどと考えることができる。
また、f(i,j)は、例えば次の数式2のように計算しても良い。
このように、画像データiとの類似度がある程度大きい画像データの単独スコアのみを用いることで、画像データiとの類似度が低い画像データの使用による類似度計算の劣化を抑えることができる。また、重みf(i,j)は、必ずしも数式2のようにメディア間類似度dijそのものである必要はなく、dijに応じて重みを調節する関数であっても良い。
また、画像データiとクエリqとの類似度を計算するときに、画像データi自身の単独スコアs(q,i)を含めても含めなくても良い。画像データi自身の単独スコアの信頼性が高いときには画像データi自身の単独スコアs(q,i)に大きな重みをつけて考慮したほうが良い場合もある。
本実施の形態では、あるメディアデータとクエリとの類似度を求める際に、前記あるメディアデータに類似する他のメディアデータのクエリに対する類似度を用いるため、前記あるメディアデータのメタテキストが誤っていても、前記あるメディアデータとクエリとが無関係であれば、類似度が小さいと判定できる(図9の例で、クエリ「花」の場合)。すなわち、前記あるメディアデータとクエリとが無関係であれば、前記あるメディアデータに類似する他の多くのメディアデータのクエリに対する類似度は小さいと期待できることを利用している。
なお、本実施の形態で説明した類似度計算装置100を用いて、クエリによるメディアデータの検索精度を向上したり、メディアデータに付与されているメタテキストを半自動で修正したりすることが可能となることはもちろんである。
その理由は、あるメディアデータとクエリとが無関係であれば、前記あるメディアデータに類似する他のメディアデータとクエリとの類似度は小さいと考えられるため、前記あるメディアデータに類似する他のメディアデータに対する単独スコアを用いることで、前記あるメディアデータとクエリとの類似度が小さいと判定することができるためである。
その理由は、あるメディアデータとクエリとが関連していれば、前記あるメディアデータに類似する他のメディアデータとクエリとの類似度は大きいと考えられるため、前記あるメディアデータに類似する他のメディアデータに対する単独スコアを用いることで、前記あるメディアデータとクエリとの類似度が大きいと判定することができるためである。
その理由は、メディアデータあるいはそのメタデータに何らかの誤りが含まれていても、メディアデータとクエリとが無関係であれば、メディアデータとクエリとの類似度が小さくなる類似度計算装置を用いてメディアデータを検索するためである。
その理由は、メディアデータあるいはそのメタデータに何らかの誤りが含まれていても、メディアデータとクエリとが関連していれば、メディアデータとクエリとの類似度が大きくなる類似度計算装置を用いてメディアデータを検索するためである。
(実施形態2)
本発明の実施形態2に係る類似度計算装置200は図2に示すように、あるメディアデータとクエリとの類似度を求める装置であって、前記あるメディアデータとは異なる第2のメディアデータに対して前記クエリとの類似度を表す単独スコアを計算する単独スコア計算手段204と、前記第2のメディアデータに対して前記あるメディアデータとの類似度を表すメディア間類似度を計算するメディア間類似度計算手段203と、前記第2のメディアデータの前記メディア間類似度と前記単独スコアとを用いて、前記あるメディアデータと前記クエリとの類似度を求めるクエリ類似度計算手段205、とから構成されている。
本実施の形態の説明では、メディアデータ記憶手段201は画像データを記憶し、メタテキスト記憶手段202は各画像データを説明するメタテキストを記憶しているものとする。また、ここではメタテキストは画像を説明する文書であるとする。このようなメタテキストは、例えば、人手によって画像データに付与することができる。
まず、メディア間類似度計算手段203は、メディアデータ記憶手段201が記憶する画像データのそれぞれに対して、画像データiとの類似度を表すメディア間類似度を計算する(図6のステップ704)。本実施の形態では、画像データ間の類似度はメタテキスト記憶手段202が記憶するメタテキスト間の類似度を計算することによって求める。メタテキスト間の類似度は、文書ベクトルのコサイン類似度などのよく知られた汎用の技術によって計算することができる。
最後に、クエリ類似度計算手段205は、類似度計算装置100のクエリ類似度計算手段105と同様の処理を行うことで、画像データiとクエリとの類似度を求める(図6のステップ703)。
本実施の形態では、あるメディアデータとクエリとの類似度を求める際に、前記あるメディアデータに類似する他のメディアデータのクエリに対する類似度を用いるため、前記あるメディアデータ自身に誤りが含まれていても、前記あるメディアデータとクエリとが無関係であれば、類似度が小さいと判定できる(画像クエリ1の場合)。
また、同様の理由により、前記あるメディアデータ自身に誤りが含まれていても、前記あるメディアデータとクエリとが関連していれば、類似度が大きいと判定できる(画像クエリ2の場合)。
さらに、メディアデータ間の類似度をメタテキスト間の類似度によって計算するため、あるメディアデータとクエリとの類似度を意味内容の近さに基づいて求めることができる。
(実施形態3)
図12において、映像1〜3は日本の神話の一つである「因幡の白うさぎ」に関する映像(音声付の動画データ)を表し、それぞれに対して音声認識によって得られた認識結果テキストがメタテキストとして付与されている。ただし、映像1では、「(正)因幡」を「(誤)イナバウアー」と誤認識してしまっている。映像1は「因幡」を正しく認識できていないものの、認識結果テキスト中には「白うさぎ」「鳥取」「伝説」「お土産」などの単語が映像2〜3と共通に出現しているため、映像1と映像2〜3とは類似していると判定される。
本実施の形態では、あるメディアデータとクエリとの類似度を求める際に、前記あるメディアデータに類似する他のメディアデータのクエリに対する類似度を用いるため、前記あるメディアデータから生成されたメタテキストに誤りが含まれていても、前記あるメディアデータとクエリとが無関係であれば、類似度が小さいと判定できる(図12の例)。
また、同様の理由により、前記あるメディアデータから生成されたメタテキストに誤りが含まれていても、前記あるメディアデータとクエリとが関連していれば、類似度が大きいと判定できる(図13の例)。
本実施の形態のようにメディアデータからメタテキストを自動で生成する場合にはメタテキストに誤りが含まれることを避けることができないため、本発明による効果は非常に大きい。
なお、本実施の形態で説明した類似度計算装置を用いることで、メディアデータから自動でメタテキストを生成してテキストクエリによって検索する場合の検索精度を向上したり、メディアデータから自動で生成されたメタテキストを半自動で修正したりすることが可能となることはもちろんである。
(実施形態4)
まず、メディアデータ記憶手段301、メタテキスト記憶手段302、クエリ類似度計算手段305は、それぞれ類似度計算装置300の各手段と同様の動作を行うため、説明を省略する。
本実施の形態では、メタテキストの正確さを表す信頼度が大きい、すなわち誤りの少ないメタテキストに重みをつけてメディアデータの単独スコアやメディアデータ間の類似度を計算するため、それぞれの精度が高まり、メディアデータとクエリとの類似度をより正確に計算することができる。
(実施形態5)
まず、メディアデータ記憶手段401、メタテキスト生成手段406、メタテキスト記憶手段402は、それぞれ図3に示した各手段と同様の動作を行うため、説明を省略する。
最後に、クエリ類似度計算手段405は、関連テキストのメディア間類似度と単独スコアも用いて、メディアデータとクエリとの類似度を計算する。
本実施の形態では、メディアデータに関連するテキストデータを用意するため、音声認識や文字認識や自動翻訳などを用いてメディアデータから自動で生成されたメタテキストには絶対に出力されない未知語などをクエリとしても、メディアデータとクエリとの類似度を計算することができる。
(実施形態6)
クエリ類似度計算手段505は、前記生成難度が大きい場合に前記あるメディアデータとの類似度が小さなメディアデータにも大きな重みをつけて前記単独スコアの和をとることで、前記あるメディアデータと前記クエリとの類似度を計算する。
まず、メディアデータ記憶手段501、メタテキスト生成手段506、メタテキスト記憶手段502、メディア間類似度計算手段503、単独スコア計算手段504は、それぞれ図3に示した類似度計算装置300の各手段と同様の動作を行うため、説明を省略する。
また、類似度計算装置400では、関連テキストを用意することで、メタテキスト生成手段の未知語をクエリとしてもメディアデータとの類似度を求めることが可能となったが、このとき、クエリ生成難度計算手段507は、未知語をクエリとしたときには生成難度が大きいと判定することができる。
本実施の形態では、メタテキスト生成手段506によってなかなか生成されないクエリとあるメディアデータとの類似度を求める際に、前記あるメディアデータとの類似度が小さなメディアデータにも大きな重みをつけて前記単独スコアの和をとるため、このような生成難度の大きいクエリに対しても前記あるメディアデータとの類似度を求めることができるようになる。
(実施形態7)
このとき、他のメディアデータとしては、ウェブサーバ1100に記憶されている検索対象メディアデータを用いてもよいし、類似度計算装置100のメディアデータ記憶手段に記憶されているメディアデータやその関連テキストを用いるようにしてもよい。
第1の効果は、クエリによりメディアデータを検索する際に、メディアデータあるいはそのメタデータに何らかの誤りが含まれている場合でも、クエリとは無関係なメディアデータを誤って検索しないことにある。
その理由は、メディアデータあるいはそのメタデータに何らかの誤りが含まれていても、メディアデータとクエリとが無関係であれば、メディアデータとクエリとの類似度が小さくなる類似度計算装置を用いてメディアデータを検索するためである。
その理由は、メディアデータあるいはそのメタデータに何らかの誤りが含まれていても、メディアデータとクエリとが関連していれば、メディアデータとクエリとの類似度が大きくなる類似度計算装置を用いてメディアデータを検索するためである。
101 メディアデータ記憶手段
102 メタテキスト記憶手段
103 メディア間類似度計算手段
104 単独スコア計算手段
105 クエリ類似度計算手段
200 類似度計算装置
201 メディアデータ記憶手段
202 メタテキスト記憶手段
203 メディア間類似度計算手段
204 単独スコア計算手段
205 クエリ類似度計算手段
300 類似度計算装置
300a 類似度計算装置
301 メディアデータ記憶手段
302 メタテキスト記憶手段
303 メディア間類似度計算手段
304 単独スコア計算手段
305 クエリ類似度計算手段
306 メタテキスト生成手段
400 類似度計算装置
401 メディアデータ記憶手段
402 メタテキスト記憶手段
403 メディア間類似度計算手段
404 単独スコア計算手段
405 クエリ類似度計算手段
406 メタテキスト生成手段
407 関連テキスト記憶手段
500 類似度計算装置
501 メディアデータ記憶手段
502 メタテキスト記憶手段
503 メディア間類似度計算手段
504 単独スコア計算手段
505 クエリ類似度計算手段
506 メタテキスト生成手段
507 クエリ生成難度計算手段
600 情報検索装置
601 入力手段
602 音声認識手段
603 拡張キー抽出手段
604 拡張単語抽出手段
605 関連情報検索手段
606 外部データベース
607 音声ドキュメント記述生成手段
608 出力手段
900 コンピュータ
910 データ処理装置
920 記憶装置
921 メディアデータ記憶手段
922 メタテキスト記憶手段
923 関連テキスト記憶手段
930 類似度計算用プログラム
1000 情報検索装置
1010 検索結果生成手段
1100 ウェブサーバ
1110 検索対象メディアデータ記憶手段
1200 クライアント
Claims (9)
- メディアデータとクエリとの類似度を求める装置であって、
前記クエリがテキストクエリであり、
一のメディアデータに、前記一のメディアデータの内容を表す複数の単語から構成されるメタテキストが付与されており、
前記一のメディアデータとは異なる他のメディアデータに、前記他のメディアデータの内容を表す複数の単語から構成されるメタテキストが付与されており、
前記他のメディアデータに対して、前記他のメディアデータのメタテキストと前記テキストクエリとを比較することで、前記テキストクエリとの類似度を表す単独スコアを計算する単独スコア計算手段と、
前記他のメディアデータに対して、前記他のメディアデータのメタテキストと前記一のメディアデータのメタテキストとの類似度を、それぞれのメタテキストに含まれる複数の単語から構成される集合間の類似度として計算することで、前記一のメディアデータとの類似度を表すメディア間類似度を計算するメディア間類似度計算手段と、
前記メタテキストを前記メディアデータから自動的に生成するメタテキスト生成手段と、
前記メタテキスト生成手段による前記メタテキストと同一のテキストの生成されにくさを表す生成難度を計算するクエリ生成難度計算手段と、
前記生成難度が大きいほど値が小さくなるような閾値以上の前記メディアデータ間類似度をもつ他のメディアデータの前記メディア間類似度と前記単独スコアとを用いて前記一のメディアデータと前記テキストクエリとの類似度を求めるクエリ類似度計算手段と、を有することを特徴とする類似度計算装置。 - 前記メタテキスト生成手段は辞書を用いて前記メタテキストを生成し、
前記クエリ生成難度計算手段は、前記テキストクエリが前記辞書に登録されていない未知語である場合に前記生成難度を大きくする、請求項1に記載の類似度計算装置。 - 請求項1又は2のいずれか一つに記載の類似度計算装置を備え、
この類似度計算装置が検索対象となるメディアデータのそれぞれを前記あるメディアデータとして前記テキストクエリとの類似度を計算し、
前記類似度に基づいて前記テキストクエリに対する検索結果を生成する検索結果生成手段を備えた情報検索装置。 - メディアデータとクエリとの類似度を求める類似度計算方法であって、
前記クエリがテキストクエリであり、
一のメディアデータに、前記一のメディアデータの内容を表す複数の単語から構成されるメタテキストが付与されており、
前記一のメディアデータとは異なる他のメディアデータに、前記他のメディアデータの内容を表す複数の単語から構成されるメタテキストが付与されており、
前記他のメディアデータに対して、前記他のメディアデータのメタテキストと前記テキストクエリとを比較することで、前記テキストクエリとの類似度を表す単独スコアを計算し、
前記他のメディアデータに対して、前記他のメディアデータのメタテキストと前記一のメディアデータのメタテキストとの類似度を、それぞれのメタテキストに含まれる複数の単語から構成される集合間の類似度として計算することで、前記一のメディアデータとの類似度を表すメディア間類似度を計算し、
前記メタテキストを前記メディアデータから自動的に生成し、
前記生成された前記メタテキストと同一のテキストの生成されにくさを表す生成難度を計算し、
前記生成難度が大きいほど値が小さくなるような閾値以上の前記メディアデータ間類似度をもつ他のメディアデータの前記メディア間類似度と前記単独スコアとを用いて前記一のメディアデータと前記テキストクエリとの類似度を求めることを特徴とする類似度計算方法。 - 辞書を用いて前記メタテキストを生成し、
前記テキストクエリが前記辞書に登録されていない未知語である場合に前記生成難度を大きくする、請求項4に記載の類似度計算方法。 - 請求項1又は2のいずれか一つに記載の類似度計算装置を用い、
この類似度計算装置が検索対象となるメディアデータのそれぞれを前記あるメディアデータとして前記テキストクエリとの類似度を計算し、
前記類似度に基づいて前記テキストクエリに対する検索結果を生成する検索結果生成手段を備えた情報検索方法。 - メディアデータとクエリとの類似度を求める類似度計算プログラムであって、
前記クエリとしてテキストクエリを用い、
一のメディアデータに、前記一のメディアデータの内容を表す複数の単語から構成されるメタテキストが付与されており、
前記一のメディアデータとは異なる他のメディアデータに、前記他のメディアデータの内容を表す複数の単語から構成されるメタテキストが付与されており、
コンピュータに、
前記他のメディアデータに対して、前記他のメディアデータのメタテキストと前記テキストクエリとを比較することで、前記テキストクエリとの類似度を表す単独スコアを計算する機能と、
前記他のメディアデータに対して、前記他のメディアデータのメタテキストと前記一のメディアデータのメタテキストとの類似度を、それぞれのメタテキストに含まれる複数の単語から構成される集合間の類似度として計算することで、前記一のメディアデータとの類似度を表すメディア間類似度を計算する機能と、
前記メタテキストを前記メディアデータから自動的に生成する機能と、
前記生成された前記メタテキストと同一のテキストの生成されにくさを表す生成難度を計算する機能と、
前記生成難度が大きいほど値が小さくなるような閾値以上の前記メディアデータ間類似度をもつ他のメディアデータの前記メディア間類似度と前記単独スコアとを用いて前記一のメディアデータと前記テキストクエリとの類似度を求める機能とを実行させることを特徴とする類似度計算プログラム。 - 前記コンピュータに、
辞書を用いて前記メタテキストを生成する機能と、
前記テキストクエリが前記辞書に登録されていない未知語である場合に前記生成難度を大きくする機能と、を実行させる、請求項7に記載の類似度計算プログラム。 - コンピュータに、請求項1又は2のいずれか一項に記載の類似度計算プログラムを組込み、
前記コンピュータに前記類似度計算プログラムを実行させることにより、前記コンピュータに、検索対象となるメディアデータのそれぞれとテキストクエリとの類似度を計算し、前記類似度に基づいて前記テキストクエリに対する検索結果を生成する機能を実行させることを特徴とする情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008527785A JP5257071B2 (ja) | 2006-08-03 | 2007-08-02 | 類似度計算装置及び情報検索装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006212659 | 2006-08-03 | ||
JP2006212659 | 2006-08-03 | ||
JP2008527785A JP5257071B2 (ja) | 2006-08-03 | 2007-08-02 | 類似度計算装置及び情報検索装置 |
PCT/JP2007/065140 WO2008016102A1 (fr) | 2006-08-03 | 2007-08-02 | dispositif de calcul de similarité et dispositif de recherche d'informations |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008016102A1 JPWO2008016102A1 (ja) | 2009-12-24 |
JP5257071B2 true JP5257071B2 (ja) | 2013-08-07 |
Family
ID=38997276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008527785A Active JP5257071B2 (ja) | 2006-08-03 | 2007-08-02 | 類似度計算装置及び情報検索装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8140530B2 (ja) |
JP (1) | JP5257071B2 (ja) |
WO (1) | WO2008016102A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2008114811A1 (ja) * | 2007-03-19 | 2010-07-08 | 日本電気株式会社 | 情報検索システム、情報検索方法及び情報検索用プログラム |
EP2031819A1 (en) * | 2007-09-03 | 2009-03-04 | British Telecommunications Public Limited Company | Distributed system |
WO2010041744A1 (ja) * | 2008-10-09 | 2010-04-15 | 国立大学法人 北海道大学 | 動画検索装置および動画検索プログラム |
US8171043B2 (en) * | 2008-10-24 | 2012-05-01 | Yahoo! Inc. | Methods for improving the diversity of image search results |
GB0905562D0 (en) * | 2009-03-31 | 2009-05-13 | British Telecomm | Electronic resource storage system |
US20110313762A1 (en) * | 2010-06-20 | 2011-12-22 | International Business Machines Corporation | Speech output with confidence indication |
US20130091437A1 (en) * | 2010-09-03 | 2013-04-11 | Lester F. Ludwig | Interactive data visulization utilizing hdtp touchpad hdtp touchscreens, advanced multitouch, or advanced mice |
US8204890B1 (en) | 2011-09-26 | 2012-06-19 | Google Inc. | Media content voting, ranking and playing system |
US9460390B1 (en) * | 2011-12-21 | 2016-10-04 | Emc Corporation | Analyzing device similarity |
CN102890700B (zh) * | 2012-07-04 | 2015-05-13 | 北京航空航天大学 | 一种基于体育比赛视频的相似视频片段检索方法 |
JP5963609B2 (ja) * | 2012-08-23 | 2016-08-03 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
CN103000173B (zh) * | 2012-12-11 | 2015-06-17 | 优视科技有限公司 | 一种语音交互方法及装置 |
JP6446987B2 (ja) * | 2014-10-16 | 2019-01-09 | 日本電気株式会社 | 映像選択装置、映像選択方法、映像選択プログラム、特徴量生成装置、特徴量生成方法及び特徴量生成プログラム |
US10289733B2 (en) * | 2014-12-22 | 2019-05-14 | Rovi Guides, Inc. | Systems and methods for filtering techniques using metadata and usage data analysis |
CN107273389A (zh) * | 2016-04-08 | 2017-10-20 | 北京国双科技有限公司 | 庭审录像的查询方法和装置 |
CN106778686A (zh) * | 2017-01-12 | 2017-05-31 | 深圳职业技术学院 | 一种基于深度学习和图论的拷贝视频检测方法和系统 |
US10719702B2 (en) * | 2017-11-08 | 2020-07-21 | International Business Machines Corporation | Evaluating image-text consistency without reference |
CN110959157B (zh) | 2018-05-01 | 2024-03-12 | 谷歌有限责任公司 | 加速大规模相似性计算 |
JP7160099B2 (ja) * | 2018-07-30 | 2022-10-25 | 富士通株式会社 | 表示制御プログラム、装置、及び方法 |
CN110210904A (zh) * | 2019-05-31 | 2019-09-06 | 深圳市云歌人工智能技术有限公司 | 基于信息发布的奖励方法、装置及存储介质 |
CN110472499B (zh) * | 2019-07-09 | 2024-01-30 | 平安科技(深圳)有限公司 | 一种行人重识别的方法及装置 |
CN112104892B (zh) * | 2020-09-11 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 一种多媒体信息处理方法、装置、电子设备及存储介质 |
CN112085120B (zh) * | 2020-09-17 | 2024-01-02 | 腾讯科技(深圳)有限公司 | 多媒体数据的处理方法、装置、电子设备及存储介质 |
CN112699272B (zh) * | 2021-01-06 | 2024-01-30 | 北京有竹居网络技术有限公司 | 信息输出方法、装置和电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301727A (ja) * | 1993-04-16 | 1994-10-28 | Toshiba Corp | 概念階層における類似度テーブル作成装置 |
JPH0869475A (ja) * | 1994-08-30 | 1996-03-12 | Nec Corp | 類似データ検索装置 |
JPH10289240A (ja) * | 1997-04-14 | 1998-10-27 | Canon Inc | 画像処理装置及びその制御方法 |
JP2004348607A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検索方法、コンテンツ検索システム、コンテンツ検索用プログラムおよびコンテンツ検索用プログラムが記録された記録媒体 |
JP2005070919A (ja) * | 2003-08-20 | 2005-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 想起型情報記憶装置 |
JP2005122324A (ja) * | 2003-10-14 | 2005-05-12 | Canon Sales Co Inc | 書類電子化装置、方法、プログラム、及び該装置を備える書類電子化システム |
JP2005250558A (ja) * | 2004-03-01 | 2005-09-15 | Nippon Telegr & Teleph Corp <Ntt> | 連鎖型記録探索装置 |
JP2005267171A (ja) * | 2004-03-18 | 2005-09-29 | Ntt Comware Corp | 動画コンテンツ提供システム |
JP2005352861A (ja) * | 2004-06-11 | 2005-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子データ処理方法、電子データ処理装置、および、電子データ処理プログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240423B1 (en) * | 1998-04-22 | 2001-05-29 | Nec Usa Inc. | Method and system for image querying using region based and boundary based image matching |
US6366296B1 (en) * | 1998-09-11 | 2002-04-02 | Xerox Corporation | Media browser using multimodal analysis |
KR20040041082A (ko) * | 2000-07-24 | 2004-05-13 | 비브콤 인코포레이티드 | 멀티미디어 북마크와 비디오의 가상 편집을 위한 시스템및 방법 |
US6826316B2 (en) * | 2001-01-24 | 2004-11-30 | Eastman Kodak Company | System and method for determining image similarity |
KR100451649B1 (ko) * | 2001-03-26 | 2004-10-08 | 엘지전자 주식회사 | 이미지 검색방법과 장치 |
GB2377046A (en) * | 2001-06-29 | 2002-12-31 | Ibm | Metadata generation |
US7043474B2 (en) * | 2002-04-15 | 2006-05-09 | International Business Machines Corporation | System and method for measuring image similarity based on semantic meaning |
US20030229896A1 (en) * | 2002-06-10 | 2003-12-11 | Koninklijke Philips Electronics N.V. | Decision fusion of recommender scores through fuzzy aggregation connectives |
US20040003403A1 (en) * | 2002-06-19 | 2004-01-01 | Marsh David J. | Methods and systems for reducing information in electronic program guide and program recommendation systems |
US20030237093A1 (en) * | 2002-06-19 | 2003-12-25 | Marsh David J. | Electronic program guide systems and methods for handling multiple users |
US20040001081A1 (en) * | 2002-06-19 | 2004-01-01 | Marsh David J. | Methods and systems for enhancing electronic program guides |
US7107520B2 (en) * | 2002-11-18 | 2006-09-12 | Hewlett-Packard Development Company, L.P. | Automated propagation of document metadata |
GB0229625D0 (en) * | 2002-12-19 | 2003-01-22 | British Telecomm | Searching images |
JP2004246824A (ja) | 2003-02-17 | 2004-09-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声ドキュメント検索方法及び装置及び音声ドキュメント検索プログラム |
US20040267693A1 (en) * | 2003-06-30 | 2004-12-30 | Darryn Lowe | Method and system for evaluating the suitability of metadata |
US7321852B2 (en) * | 2003-10-28 | 2008-01-22 | International Business Machines Corporation | System and method for transcribing audio files of various languages |
US7814085B1 (en) * | 2004-02-26 | 2010-10-12 | Google Inc. | System and method for determining a composite score for categorized search results |
US7406462B2 (en) * | 2004-10-19 | 2008-07-29 | International Business Machines Corporation | Prediction of query difficulty for a generic search engine |
WO2006127660A2 (en) * | 2005-05-23 | 2006-11-30 | Picateers, Inc. | System and method for collaborative image selection |
US20070106653A1 (en) * | 2005-10-12 | 2007-05-10 | Yu Sun | Search engine |
-
2007
- 2007-08-02 JP JP2008527785A patent/JP5257071B2/ja active Active
- 2007-08-02 US US12/374,035 patent/US8140530B2/en active Active
- 2007-08-02 WO PCT/JP2007/065140 patent/WO2008016102A1/ja active Search and Examination
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06301727A (ja) * | 1993-04-16 | 1994-10-28 | Toshiba Corp | 概念階層における類似度テーブル作成装置 |
JPH0869475A (ja) * | 1994-08-30 | 1996-03-12 | Nec Corp | 類似データ検索装置 |
JPH10289240A (ja) * | 1997-04-14 | 1998-10-27 | Canon Inc | 画像処理装置及びその制御方法 |
JP2004348607A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検索方法、コンテンツ検索システム、コンテンツ検索用プログラムおよびコンテンツ検索用プログラムが記録された記録媒体 |
JP2005070919A (ja) * | 2003-08-20 | 2005-03-17 | Nippon Telegr & Teleph Corp <Ntt> | 想起型情報記憶装置 |
JP2005122324A (ja) * | 2003-10-14 | 2005-05-12 | Canon Sales Co Inc | 書類電子化装置、方法、プログラム、及び該装置を備える書類電子化システム |
JP2005250558A (ja) * | 2004-03-01 | 2005-09-15 | Nippon Telegr & Teleph Corp <Ntt> | 連鎖型記録探索装置 |
JP2005267171A (ja) * | 2004-03-18 | 2005-09-29 | Ntt Comware Corp | 動画コンテンツ提供システム |
JP2005352861A (ja) * | 2004-06-11 | 2005-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子データ処理方法、電子データ処理装置、および、電子データ処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20090319513A1 (en) | 2009-12-24 |
WO2008016102A1 (fr) | 2008-02-07 |
JPWO2008016102A1 (ja) | 2009-12-24 |
US8140530B2 (en) | 2012-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US10963499B2 (en) | Generating command-specific language model discourses for digital assistant interpretation | |
US10176804B2 (en) | Analyzing textual data | |
KR102241972B1 (ko) | 환경 콘텍스트를 이용한 질문 답변 | |
US11144729B2 (en) | Summary generation method and summary generation apparatus | |
US8600752B2 (en) | Search apparatus, search method, and program | |
US10997223B1 (en) | Subject-specific data set for named entity resolution | |
US10896222B1 (en) | Subject-specific data set for named entity resolution | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
US20070100814A1 (en) | Apparatus and method for detecting named entity | |
US10929613B2 (en) | Automated document cluster merging for topic-based digital assistant interpretation | |
US8688725B2 (en) | Search apparatus, search method, and program | |
US20190205325A1 (en) | Automated Discourse Phrase Discovery for Generating an Improved Language Model of a Digital Assistant | |
KR20090130028A (ko) | 분산 음성 검색을 위한 방법 및 장치 | |
JP2004005600A (ja) | データベースに格納された文書をインデックス付け及び検索する方法及びシステム | |
KR20090111825A (ko) | 언어 독립적인 음성 인덱싱 및 검색 방법 및 장치 | |
US10592542B2 (en) | Document ranking by contextual vectors from natural language query | |
JP2004133880A (ja) | インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法 | |
JP2014186372A (ja) | 図絵描画支援装置、方法、及びプログラム | |
KR20200087977A (ko) | 멀티모달 문서 요약 시스템 및 방법 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
CN117043859A (zh) | 查找表循环语言模型 | |
JP2020016784A (ja) | 認識装置、認識方法及び認識プログラム | |
US20190095525A1 (en) | Extraction of expression for natural language processing | |
JP4175093B2 (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120719 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130226 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130408 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5257071 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |