JP2008287698A - 索引付けシステム及び索引付けプログラム - Google Patents

索引付けシステム及び索引付けプログラム Download PDF

Info

Publication number
JP2008287698A
JP2008287698A JP2007333334A JP2007333334A JP2008287698A JP 2008287698 A JP2008287698 A JP 2008287698A JP 2007333334 A JP2007333334 A JP 2007333334A JP 2007333334 A JP2007333334 A JP 2007333334A JP 2008287698 A JP2008287698 A JP 2008287698A
Authority
JP
Japan
Prior art keywords
segments
segment
similarity
index
indexing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007333334A
Other languages
English (en)
Inventor
Gene Golovchinsky
ゴロブチンスキー ジーン
Jeremy Pickens
ピケンズ ジェレミー
Laurent Denoue
ドゥヌ ローラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2008287698A publication Critical patent/JP2008287698A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】視覚情報やテキスト情報を含むメディア・ストリームのセグメントについて、セグメント間の多次元内容の類似性に基づいて索引付けを行うことができる、索引付けシステム及び索引付けプログラムを提供する。
【解決手段】認識モジュール101は、メディア・ストリームの複数のセグメントから複数の索引タームを抽出する。各々のセグメントについて、重みモジュール102は、特定セグメントとその近隣セグメントとの間の視覚、テキスト、時間、及び音声の類似性に基づいて、重みベクトルを計算する。次に、インデクサ103は、特定セグメントの索引ターム、及び重みベクトルによって調整された重みを有する近隣セグメントからの索引タームの双方を含めることによって、特定セグメントの索引を構築する。
【選択図】図1

Description

本発明は、索引付けシステム及び索引付けプログラムに関し、特に、ストリーミング・メディア(stream media)の分野でストリーム類似性に基づいてメディア・ストリームを索引付けする索引付けシステム及び索引付けプログラムに関する。
メディアのストリーム、例えば、キャプチャされたプレゼンテーションのスライドは、索引付け及び後続のフルテキスト検索を目的として、セグメントに分ける必要がある。従来、この索引付けは、視覚的な類似性に基づいて行われてきた。スライドがセグメントに分けられると、光学式文字認識(OCR)により各々のスライドからテキストが抽出され、各々のスライドのためにフルテキストの索引項目(文書)が構築された。
BOGURAEV, B et al., Lexical Cohesion, Discourse Segmentation and Document Summarization, Proceedings of the RIAO 2000 Conference on Content-Based Multimedia Information Access, 2000, pp. 962-979, Paris. URL: citeseer.ist.psu.edu/407600.html
BREUEL, T.M., Character Recognition by Adaptive Statistical Similarity, Proceedings of the 7th International Conference for Document Analysis and Recognition (ICDAR), 2003, pp. 158-162, Edinburgh.
DENOUE, L., et al., ProjectorBox: Seamless presentation capture for classrooms, Proceedings of World Conference on E-Learning in Corporate, Government, Healthcare, and Higher Education, ("E-Learn 2005"in Vancouver, B.C.), 2005, pp. 1986-1991, Chesapeake, VA: AACE
HEARST, M.A., et al., Subtopic structuring for full-length document access. SIGIR '93 proceedings of the 16th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, June 27-July 1, 1993, pages 59-68, Pjttsburgh, PA
従来の索引付けの手法は、かなり良好に機能したが、少なくとも2つの点で限界を有していた。第1に、OCRは認識エラーを取り込んで、後続のフルテキスト・クエリ(query:検索質問)のパフォーマンスを低下させ、スライド当り比較的少量のテキストは、効果的なクエリ・パフォーマンスを可能にするタームの共起出現(co-occurrence)を識別することを困難にした。
第2に、セグメントに分けられたデータ・ストリームは、各々のセグメントに関連付けられたテキスト情報が制限されて雑音に近い場合には、索引付けが困難である。データ・ストリームのセグメントをアドホック検索(ad-hoc retrieval)するには、正確なテキスト情報が重要となる。
本発明は、上記事情に鑑み成されたもので、本発明の目的は、視覚情報やテキスト情報を含むメディア・ストリームのセグメントについて、セグメント間の多次元内容の類似性に基づいて索引付けを行うことができる、索引付けシステム及び索引付けプログラムを提供することにある。
上記目的を達成するために請求項1に記載の発明は、類似性に基づいてメディア・ストリームを索引付けする索引付けシステムであって、メディア・ストリームの複数のセグメントの各々から複数の索引タームを抽出するように動作可能な認識モジュールと、メディア・ストリーム内の特定セグメントと当該特定セグメントの近隣にある近隣セグメントとの間の類似性に基づいて、少なくとも1つの特定セグメントについて重みベクトルを計算するように動作可能な重みモジュールと、少なくとも、特定セグメント上で検出された複数の索引ターム、及び前記重みベクトルによって調整された重みを有する前記近隣セグメント由来の複数の索引タームを組み入れて、特定セグメントの索引を作成するように動作可能なインデクサと、を含むことを特徴としている。
請求項2に記載の発明は、請求項1に記載の発明において、前記特定セグメントと前記近隣セグメントとの間の類似性が、視覚類似性、テキスト類似性、時間類似性、及び音声類似性からなる群から選択された1つ又は複数を含むことを特徴としている。
請求項3に記載の発明は、請求項2に記載の発明において、前記認識モジュールが、以下の(1)〜(3)の少なくとも1つのテキスト分割手法を用いて、複数のセグメントの各々からテキストによる索引タームを生成し、前記テキスト類似性を評価するように動作可能であることを特徴としている。
(1)セグメントのテキスト上に配置された固定長窓の上で首尾一貫性の尺度を測定し、測定結果として得られた値を閾値として使用する手法
(2)段落又は文である語彙単位を利用する手法、
(3)セグメントのテキストを固定語数の一節へ分割する手法
請求項4に記載の発明は、請求項3に記載の発明において、前記首尾一貫性の尺度が、記号的尺度又は確率的尺度であることを特徴としている。
請求項5に記載の発明は、請求項1に記載の発明において、前記特定セグメントと前記近隣セグメントとの間の類似性が、以下の(1)〜(4)からなる群から選択された1つ又は複数を含むことを特徴としている。
(1)セグメント上で検出された複数の索引タームの重なり
(2)セグメントの時間近接性、セグメントの順序近接性
(3)セグメントの視覚類似性
(4)セグメントの音響特徴の類似性
請求項6に記載の発明は、請求項1に記載の発明において、前記重みベクトルが、ユークリッド空間及び統計空間の少なくとも一方である特徴空間内の距離に基づいて計算されることを特徴としている。
請求項7に記載の発明は、請求項1に記載の発明において、前記重みモジュールが、以下の(1)〜(5)からなる群から選択された少なくとも1つに基づいて、前記重みベクトルを計算するように動作可能であることを特徴としている。
(1)セグメント上にあるセグメント特有の索引タームの類似性の程度
(2)セグメントを分ける時間
(3)セグメントの順序
(4)セグメントの視覚的特徴
(5)セグメントの音声・音色・韻律的類似性
請求項8に記載の発明は、請求項7に記載の発明において、前記セグメントの視覚的特徴が、以下の(1)〜(4)からなる群から選択された1つ又は複数を含むことを特徴としている。
(1)共通の見出し又はフッタ
(2)共通の視覚要素
(3)共通の色彩及び/又は色彩配合
(4)中点付きリストにおけるテキスト階層のパターン
請求項9に記載の発明は、請求項1に記載の発明において、前記インデクサが、更に、前記重みベクトル及び検索時ユーザ指定クエリの双方によって調整された重みを有する近隣セグメント由来の複数の索引タームを索引の中に組み入れて、特定セグメントの索引を作成するように動作可能であることを特徴としている。
請求項10に記載の発明は、請求項1に記載の発明において、前記インデクサは、類似性に基づいて計算された重みベクトルを、類似するセグメントをグループ化して索引付けする索引付け時グループ化、及びセグメント毎に索引付けし類似するセグメントをグループ化して検索する検索時グループ化の少なくとも一方を介して、索引に反映させることを特徴としている。
上記目的を達成するために請求項11に記載の発明は、類似性に基づいてメディア・ストリームを索引付けする索引付けプログラムであって、コンピュータを、メディア・ストリームの複数のセグメントの各々から複数の索引タームを抽出する手段と、メディア・ストリーム内の特定セグメントと当該特定セグメントの近隣にある近隣セグメントとの間の類似性に基づいて、少なくとも1つの特定セグメントについて重みベクトルを計算する手段と、少なくとも、特定セグメントから上で検出された複数の索引ターム、及び前記重みベクトルによって調整された重みを有する前記近隣セグメント由来の複数の索引タームを組み入れて、特定セグメントの索引を作成する手段と、として機能させるための索引付けプログラムであることを特徴としている。
以上説明したように本発明によれば、以下の効果がある。
請求項1、請求項11に係る発明によれば、視覚情報やテキスト情報を含むメディア・ストリームのセグメントについて、セグメント間の多次元内容の類似性に基づいて索引付けを行うことができる、という効果がある。
特定セグメントの索引ターム、及びその近隣セグメントの重みを調整された索引タームの双方を「索引」に含めることによって、特定セグメントの索引を「カーネル(kernel)」又は「重みづけられたプロファイル(weighted profile)」として構築することができる。簡単に言えば、重み付けの手法によって、同じメディア・ストリームの近隣セグメントは、特定セグメントに関連付けられた索引タームに影響を与えることができる。
例えば、セグメントの視覚的特徴、テキスト的特徴、聴覚的特徴、及び時間的特徴の組み合わせを用いて、トピックとなる文脈に対応する複数のセグメントを論理グループにグループ化することによって、視覚情報やテキスト情報を含むメディア・ストリームのセグメントを索引付けするアプローチを可能にする。
請求項2に係る発明によれば、各々のセグメントについて、その近隣セグメントに対するセグメント間での視覚、テキスト、時間、及び音声の類似性に基づいて、重みベクトルが計算される。
請求項3、請求項4に係る発明によれば、従来、文書を複数の断片に分割するため使用されていたテキスト分割手法を、逆に使用して、近隣セグメントに関連付けられたテキストを、単一の重みベクトルへ結び付けることができる。
請求項5に係る発明によれば、特定セグメントと近隣セグメントとの間の類似性に基づいて計算され、拡張され且つ再重み付けされたタームベクトルは、各々のセグメントを索引付けするために使用される。これによって近隣セグメント間に分散された概念の検索(the retrieval of concepts)を可能にする。また、複数セグメントの上でタームの出現頻度に基づくメトリクス(term frequency-based metrics)を平滑化することによって、それを改善する。
請求項6、請求項7、請求項8に係る発明によれば、種々の因子から得られた特徴を有する或る特徴空間内の距離に基づいて、重みベクトルを計算することができる。
請求項9に係る発明によれば、検索時に、類似性の尺度及びユーザによって指定されたクエリの双方に基づいて調整された重みを有する近隣セグメント由来の複数の索引タームを含めることができる。
請求項10に係る発明によれば、一度、索引タームの重みベクトルが計算されると、それを索引の中へ組み入れることができる。
索引付け時グループ化では、十分な類似性を有する近隣セグメントのグループに基づいて、首尾一貫した文書(coherent documents)を作成することを含むので、2つ以上の近隣セグメントを単一の文書へグループ化することができる。それらのセグメントは、それらに含められた索引タームの全部によって索引付けされ、1つの単位として検索される。
一方、検索時グループ化においては、セグメントは個々に索引付けされ、クエリ評価の後にグループ化されて、クエリ偏向グループ化(query-biased grouping)が達成される。クエリ偏向グループ化では、グループ化の計算においてクエリ用語又は他の関連用語の重みが考慮される。
本発明の様々な実施形態は、セグメントの視覚的特徴、テキスト的特徴、聴覚的特徴、及び時間的特徴の組み合わせを用いて、トピックとなる文脈に対応する複数のセグメントを論理グループにグループ化することによって、視覚情報やテキスト情報を含むメディア・ストリームのセグメントを索引付けするアプローチを可能にする。
視覚的/時間的/聴覚的/テキスト的な重み付けの手法が採用される。この手法によって、同じプレゼンテーションのどこかにあるセグメントは、特定セグメントに関連付けられた索引タームに影響を与えることができる。
本発明の好ましい実施形態は、下記の図面に基づいて詳細に説明される。本発明は、添付の図面において、限定ではなく一例として説明される。図面における同様の符番は、類似の要素を示す。この開示における「1つ」又は「幾つかの」実施形態への参照は、必ずしも同じ実施形態への参照ではなく、そのような参照は少なくとも1つを意味することに注意すべきである。
図1は、本発明の1つの実施形態において、類似性に基づいてメディア・ストリームを索引付けするシステムの一例を示す図である。この図は、構成要素を機能的に分別して示しているが、それは単に例示を目的とするためである。この図に示される構成要素は任意的に組み合わせられてよく、又は別個のソフトウェア、ファームウェア、及び/又はハードウェア構成要素へ分割されてよいことが、当業者には明らかであろう。更に、そのような構成要素は、どのように組み合わされ又は分割されるかに関係なく、同一のコンピューティング・デバイス又は複数のコンピューティング・デバイスの上で実行可能であり、複数のコンピューティング・デバイスは1つ又は複数のネットワークによって接続可能であることが、当業者には明らかであろう。
図1を参照すると、認識モジュール101は、入力されたメディア・ストリームの複数のセグメントから複数の索引ターム(terms)を抽出するように動作することができる。ここで、メディア・ストリームは、これに限定される訳ではないが、キャプチャされたパワーポイント・プレゼンテーション内のスライドであってもよい。
各々のセグメントについて、重みモジュール102は、特定セグメントとその近隣セグメントとの間の、視覚、テキスト、時間、及び音声の類似性に基づいて、重みベクトル(weight vector)を計算するように動作することができる。特定セグメントに対する近隣セグメントは、時間に連続したセグメントには限られない。理論的には、メディア・ストリーム内の任意のセグメントが、特定セグメントの近隣セグメントである。
次に、インデクサ103は、特定セグメントの索引ターム、及びその近隣セグメントの重みを調整された索引タームの双方を含めることによって、特定セグメントの索引(カーネル(kernel)又は重みづけられたプロファイル(weighted profile))を構築することができる。
図2は、本発明の1つの実施形態において、類似性に基づきメディア・ストリームを索引付けるフローチャートの一例を示す。この図は、例示を目的として特定の順序の機能ステップを示すが、プロセスは、ステップの特定の順序又は配列へ限定されない。この図で示された様々なステップは、様々なやり方で省略、再配列、結合、及び/又は適合化されてよいことを、当業者は理解するであろう。
図2を参照すると、ステップ201において、キャプチャされたプレゼンテーションの各々のセグメントは、複数の索引ターム及び特徴(features)を抽出するように処理される。ステップ202では、各々のセグメントについて、その近隣セグメントに対するセグメント間での視覚、テキスト、時間、及び音声の類似性に基づいて、重みベクトルが計算される。
次に、ステップ203では、特定セグメントの索引が構築される。索引は、そのセグメントの表現(representation)の中に、セグメント内で検出された全部の索引タームを含む。索引付け時には、ステップ204において、索引は、更に、セグメント間の類似性に基づいて調整された重みを有する近隣セグメント由来の索引タームを含む。検索時には、ステップ205において、類似性の尺度及びユーザによって指定されたクエリの双方に基づいて調整された重みを有する近隣セグメント由来の複数の索引タームを含めることができる。
幾つかの実施形態において、索引付けされた特定セグメントとその近隣セグメントとの間の類似性は、これに限定される訳ではないが、近隣セグメント上で検出された索引ターム間の重なり(overlap)、セグメントの時間及び順序近接性、及びセグメントの視覚特徴の類似性を含む。索引ターム間の重なりは、これに限定される訳ではないが、統語論的、意味論的、言語的、又は統計的類似性であってもよい。
この拡張され且つ再重み付けされたタームベクトルは、各々のセグメントを索引付けするために使用される。これによって近隣セグメント間に分散された概念の検索(the retrieval of concepts)を可能にする。また、複数セグメントの上でタームの出現頻度に基づくメトリクス(term frequency-based metrics)を平滑化することによって、それを改善する。
幾つかの実施形態において、セグメント内のテキストによる索引ターム(textual terms)を生成して、多くのやり方で、近隣セグメントとのテキスト類似性を評価することができる。1つの標準的テキスト分割手法は、テキストの上で固定長の窓を走らせ、窓の上で首尾一貫性(coherence;内容的な連関性)の尺度を計算し、計算結果の値を閾値として首尾一貫した一節(passage)を生成することである。首尾一貫性の尺度は、これに限定される訳ではないが、統計的、記号的、確率的、その他であってよい。
上記手法に代えて、例えば、段落(paragraphs)または文(sentences)などの語彙単位(lexical units)を使用して、一節を生成することができる。最後に、固定された語数の一節へテキストを分割してもよい。従来、これらのテキスト分割手法は、文書を複数の断片に分割するため使用されていたが、これらの手法を逆に使用して、近隣セグメントに関連付けられたテキストを、単一の重みベクトルへ結び付けることができる。
幾つかの実施形態では、以下に列挙する因子(1)〜(5)の1つ又は複数から得られた特徴を有する或る特徴空間内の距離に基づいて、重みベクトルを計算することができる。なお、特徴空間は、これに限定される訳ではないが、ユークリッド空間及び統計空間であってもよい。因子は次のとおりである。
(1)セグメント特有の索引タームの類似性の程度
2つのセグメントの語彙(vocabulary)が近似するほど、それだけ大きい尤度で、近隣セグメント由来の索引タームが使用されて、ターゲットが検索される。正確な関数は経験的に決定可能である。
(2)2つのセグメントを分ける時間
比較的に近接して一緒にプレゼンテーションされたセグメントは、関連している尤度が大きいと考えられる。機械学習アルゴリズムをトレーニングして、各々のセグメントが表示された時間量に基づいて近隣セグメント間の関連性を推定することができる。この得点(score)を使用して、上記で計算された類似性の程度を調整することができる。
(3)セグメントの順序
他の因子(例えば、テキスト類似性又は視覚類似性)が関係する場合を除いて、近隣セグメントが有意味的にグループ化される尤度が大きい。従って、セグメント間の距離が増加するときのテキスト類似性の割引(discounting:低い見積り)は、索引タームの重み因子にしなければならない。
(4)視覚類似性の特徴
これに限定される訳ではないが、共通の見出し(headings)又はフッタ(footers)、共通の視覚要素(例えば、アイコン(icons)又は画像(images))、共通の色彩(colors)及び/又は色彩配合(color schemes)、及び中点付きリスト(bulleted lists)におけるテキスト階層パターンを含む特徴は、視覚的特徴の全ての例であり、それらに基づいてセグメント間の類似性を測定することができる。セグメント間で計算された類似性の得点を使用して、近隣セグメントに由来する索引タームの出現頻度情報を調整することができる。
(5)記録されたスピーカの声(voice)の音声(audio)/音色(timbre)/韻律(prosodic)の類似性の使用
換言すれば、もしセグメントに対応する音声が記録されていたならば、その音声から得られた音響的特徴(acoustic features)を使用して、類似性を評価することができる。
索引タームの重みを決定する他のスキームも可能である。非限定的な例として、複数の特徴次元に順応するベイズ統計に基づく類似性メトリクス(Bayesian statistically-based similarity metric)を採用することができる。これに代えて、最大エントロピ・アプローチを使用して、前述した特徴を組み合わせることができる。
幾つかの実施形態において、一度、索引タームの重みベクトルが計算されると、それを索引の中へ組み入れることができる。索引タームの重みベクトルを組み入れる2つの例示的な手順は、索引付け時グループ化(index-time grouping)及び検索時グループ化(query-time grouping)である。
索引付け時グループ化は、十分な類似性を有する近隣セグメントのグループに基づいて、首尾一貫した文書(coherent documents)を作成することを含む。2つ以上の近隣セグメントを単一の文書へグループ化することができる。それらのセグメントは、それらに含められた索引タームの全部によって索引付けされ、1つの単位として検索される。
検索時グループ化においては、セグメントは個々に索引付けされ、クエリ評価の後にグループ化されて、クエリ偏向グループ化(query-biased grouping)が達成される。クエリ偏向グループ化では、グループ化の計算においてクエリ用語又は他の関連用語の重みが考慮される。
幾つかの実施形態において、セグメント・グループ・アプローチは、正しく認識された索引タームがセグメントのグループに関連付けられる尤度を増加させることによって、OCRエラーを埋め合わせすることができる。非限定的な例として、1つの索引ターム(特徴)が3つの連続したセグメントで出現し、3つの場合の2つで誤った認識を生じると仮定する。セグメントがグループ化されていないと、正しく認識された語(word)を含むセグメントのみが検索される。セグメントがグループ化されていると、正しい綴りの変形(variant)が近隣セグメントへ伝搬され、検索尤度を増加させる。
コンピュータ技術の当業者には明らかなように、この開示の教示に従ってプログラムされた従来の汎用又は特殊ディジタル・コンピュータ又はマイクロプロセッサを使用して、1つの実施形態が実現されてもよい。ソフトウェア技術の当業者に明らかであるように、適切なソフトウェア・コーディングは、この開示の教示に基づいて、熟練したプログラマによって容易に準備可能である。当業者に容易に分かるように、本発明は、更に、集積回路を準備することによって、又は従来の部品回路網を適切に相互接続することによって実現されてもよい。
1つの実施形態は、命令を記憶された機械読み取り可能メディアであるコンピュータ・プログラムプロダクトを含む。このプログラムプロダクトを使用して、1つ又は複数のコンピューティング・デバイスをプログラムし、本明細書で呈示された特徴の任意のものを達成することができる。
機械読み取り可能メディアは、これに限定される訳ではないが、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロ・ドライブ、及び光磁気ディスクを含む1つ又は複数のタイプのディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュ・メモリ・デバイス、磁気又は光学カード、ナノシステム(分子メモリICを含む)、又は命令及び/又はデータを記憶するのに適した任意のタイプのメディア又はデバイスを含むことができる。
コンピュータ読み取り可能メディアの任意の1つに記憶されることで、本発明はソフトウェアを含む。このソフトウェアは、汎用/特殊コンピュータのハードウェア又はマイクロプロセッサを制御し、コンピュータ又はマイクロプロセッサが、本発明の結果を利用する人間のユーザ又は他の機構と対話できるようにする。そのようなソフトウェアは、これに限定される訳ではないが、デバイス・ドライバ、オペレーティング・システム、実行環境/コンテナ、及びアプリケーションを含んでよい。
本発明の好ましい実施形態の記述は、例示及び説明を目的として提供された。本発明が、開示された形態によって包括されていること、又は限定されていることは意図されない。多くの修正及び変形が、実施する当業者には明らかであろう。特に、前述したシステム及び方法の実施形態では「モジュール(module)」の概念が使用されたが、そのような概念は、同等の概念、例えば、ビーン(bean)、クラス(class)、メソッド(method)、タイプ(type)、コンポーネント(component)、インタフェース(interface)、オブジェクト・モデル(object model)、及び他の適切な概念と互換的に使用可能であることが明らかである。
本発明の原理及びその実用的応用を最良に説明し、それによって本発明、様々な実施形態、及び想定される特定の使用に適した様々な修正を他の当業者に理解させるため、実施形態が選択及び説明された。本発明の範囲は、特許請求の範囲及びその同等物によって定められることが意図される。
本発明の実施の形態に係る、類似性に基づいてメディア・ストリームを索引付けするシステムの一例を示す図である。 本発明の実施の形態に係る、類似性に基づきメディア・ストリームを索引付けするフローチャートの一例を示す図である。

Claims (11)

  1. 類似性に基づいてメディア・ストリームを索引付けする索引付けシステムであって、
    メディア・ストリームの複数のセグメントの各々から複数の索引タームを抽出するように動作可能な認識モジュールと、
    メディア・ストリーム内の特定セグメントと当該特定セグメントの近隣にある近隣セグメントとの間の類似性に基づいて、少なくとも1つの特定セグメントについて重みベクトルを計算するように動作可能な重みモジュールと、
    少なくとも、特定セグメント上で検出された複数の索引ターム、及び前記重みベクトルによって調整された重みを有する前記近隣セグメント由来の複数の索引タームを組み入れて、特定セグメントの索引を作成するように動作可能なインデクサと、
    を含む索引付けシステム。
  2. 前記特定セグメントと前記近隣セグメントとの間の類似性が、視覚類似性、テキスト類似性、時間類似性、及び音声類似性からなる群から選択された1つ又は複数を含む、請求項1に記載の索引付けシステム。
  3. 前記認識モジュールが、以下の(1)〜(3)の少なくとも1つのテキスト分割手法を用いて、複数のセグメントの各々からテキストによる索引タームを生成し、前記テキスト類似性を評価するように動作可能である、請求項2に記載の索引付けシステム。
    (1)セグメントのテキスト上に配置された固定長窓の上で首尾一貫性の尺度を測定し、測定結果として得られた値を閾値として使用する手法
    (2)段落又は文である語彙単位を利用する手法、
    (3)セグメントのテキストを固定語数の一節へ分割する手法
  4. 前記首尾一貫性の尺度が、記号的尺度又は確率的尺度である、請求項3に記載のシステム。
  5. 前記特定セグメントと前記近隣セグメントとの間の類似性が、以下の(1)〜(4)からなる群から選択された1つ又は複数を含む、請求項1に記載の索引付けシステム。
    (1)セグメント上で検出された複数の索引タームの重なり
    (2)セグメントの時間近接性、セグメントの順序近接性
    (3)セグメントの視覚類似性
    (4)セグメントの音響特徴の類似性
  6. 前記重みベクトルが、ユークリッド空間及び統計空間の少なくとも一方である特徴空間内の距離に基づいて計算される、請求項1に記載の索引付けシステム。
  7. 前記重みモジュールが、以下の(1)〜(5)からなる群から選択された少なくとも1つに基づいて、前記重みベクトルを計算するように動作可能である、請求項1に記載の索引付けシステム。
    (1)セグメント上にあるセグメント特有の索引タームの類似性の程度
    (2)セグメントを分ける時間
    (3)セグメントの順序
    (4)セグメントの視覚的特徴
    (5)セグメントの音声・音色・韻律的類似性
  8. 前記セグメントの視覚的特徴が、以下の(1)〜(4)からなる群から選択された1つ又は複数を含む、請求項7に記載の索引付けシステム。
    (1)共通の見出し又はフッタ
    (2)共通の視覚要素
    (3)共通の色彩及び/又は色彩配合
    (4)中点付きリストにおけるテキスト階層のパターン
  9. 前記インデクサが、更に、前記重みベクトル及び検索時ユーザ指定クエリの双方によって調整された重みを有する近隣セグメント由来の複数の索引タームを索引の中に組み入れて、特定セグメントの索引を作成するように動作可能である、請求項1に記載の索引付けシステム。
  10. 前記インデクサは、類似性に基づいて計算された重みベクトルを、類似するセグメントをグループ化して索引付けする索引付け時グループ化、及びセグメント毎に索引付けし類似するセグメントをグループ化して検索する検索時グループ化の少なくとも一方を介して、索引に反映させる、請求項1に記載の索引付けシステム。
  11. 類似性に基づいてメディア・ストリームを索引付けする索引付けプログラムであって、
    コンピュータを、
    メディア・ストリームの複数のセグメントの各々から複数の索引タームを抽出する手段と、
    メディア・ストリーム内の特定セグメントと当該特定セグメントの近隣にある近隣セグメントとの間の類似性に基づいて、少なくとも1つの特定セグメントについて重みベクトルを計算する手段と、
    少なくとも、特定セグメントから上で検出された複数の索引ターム、及び前記重みベクトルによって調整された重みを有する前記近隣セグメント由来の複数の索引タームを組み入れて、特定セグメントの索引を作成する手段と、
    として機能させるための索引付けプログラム。
JP2007333334A 2007-05-16 2007-12-25 索引付けシステム及び索引付けプログラム Pending JP2008287698A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/749,398 US20080288537A1 (en) 2007-05-16 2007-05-16 System and method for slide stream indexing based on multi-dimensional content similarity

Publications (1)

Publication Number Publication Date
JP2008287698A true JP2008287698A (ja) 2008-11-27

Family

ID=40028608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007333334A Pending JP2008287698A (ja) 2007-05-16 2007-12-25 索引付けシステム及び索引付けプログラム

Country Status (2)

Country Link
US (1) US20080288537A1 (ja)
JP (1) JP2008287698A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011248228A (ja) * 2010-05-28 2011-12-08 Brother Ind Ltd 光走査装置
WO2017087003A1 (en) * 2015-11-20 2017-05-26 Hewlett Packard Enterprise Development Lp Segments of data entries

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101141627A (zh) * 2007-10-23 2008-03-12 深圳市迅雷网络技术有限公司 一种流媒体文件的存储系统及方法
JP5247311B2 (ja) * 2008-08-29 2013-07-24 キヤノン株式会社 電子文書処理装置および電子文書処理方法
US8631040B2 (en) * 2010-02-23 2014-01-14 Sas Institute Inc. Computer-implemented systems and methods for flexible definition of time intervals
US9047559B2 (en) 2011-07-22 2015-06-02 Sas Institute Inc. Computer-implemented systems and methods for testing large scale automatic forecast combinations
US20130138654A1 (en) * 2011-11-30 2013-05-30 Nokia Corporation Methods and apparatuses for generating semantic signatures for media content
CN103294684B (zh) * 2012-02-24 2016-08-24 浙江易网科技股份有限公司 关联词汇搜索系统及方法
US20130346385A1 (en) * 2012-06-21 2013-12-26 Revew Data Corp. System and method for a purposeful sharing environment
US9244887B2 (en) 2012-07-13 2016-01-26 Sas Institute Inc. Computer-implemented systems and methods for efficient structuring of time series data
US9087306B2 (en) 2012-07-13 2015-07-21 Sas Institute Inc. Computer-implemented systems and methods for time series exploration
US9244923B2 (en) 2012-08-03 2016-01-26 Fuji Xerox Co., Ltd. Hypervideo browsing using links generated based on user-specified content features
US9147218B2 (en) 2013-03-06 2015-09-29 Sas Institute Inc. Devices for forecasting ratios in hierarchies
US9122681B2 (en) 2013-03-15 2015-09-01 Gordon Villy Cormack Systems and methods for classifying electronic information using advanced active learning techniques
US9934259B2 (en) 2013-08-15 2018-04-03 Sas Institute Inc. In-memory time series database and processing in a distributed environment
US10169720B2 (en) 2014-04-17 2019-01-01 Sas Institute Inc. Systems and methods for machine learning using classifying, clustering, and grouping time series data
US9892370B2 (en) 2014-06-12 2018-02-13 Sas Institute Inc. Systems and methods for resolving over multiple hierarchies
US9208209B1 (en) 2014-10-02 2015-12-08 Sas Institute Inc. Techniques for monitoring transformation techniques using control charts
US10289733B2 (en) * 2014-12-22 2019-05-14 Rovi Guides, Inc. Systems and methods for filtering techniques using metadata and usage data analysis
US9418339B1 (en) 2015-01-26 2016-08-16 Sas Institute, Inc. Systems and methods for time series analysis techniques utilizing count data sets
US10229117B2 (en) 2015-06-19 2019-03-12 Gordon V. Cormack Systems and methods for conducting a highly autonomous technology-assisted review classification
US10983682B2 (en) 2015-08-27 2021-04-20 Sas Institute Inc. Interactive graphical user-interface for analyzing and manipulating time-series projections
US11321372B2 (en) * 2017-01-03 2022-05-03 The Johns Hopkins University Method and system for a natural language processing using data streaming
US10331490B2 (en) 2017-11-16 2019-06-25 Sas Institute Inc. Scalable cloud-based time series analysis
US10338994B1 (en) 2018-02-22 2019-07-02 Sas Institute Inc. Predicting and adjusting computer functionality to avoid failures
US10255085B1 (en) 2018-03-13 2019-04-09 Sas Institute Inc. Interactive graphical user interface with override guidance
US10560313B2 (en) 2018-06-26 2020-02-11 Sas Institute Inc. Pipeline system for time-series data forecasting
US10685283B2 (en) 2018-06-26 2020-06-16 Sas Institute Inc. Demand classification based pipeline system for time-series data forecasting

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216443A1 (en) * 2000-07-06 2005-09-29 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
JP2005535018A (ja) * 2002-07-29 2005-11-17 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. メディアオブジェクトのコレクションの提示

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100357261B1 (ko) * 1999-12-30 2002-10-18 엘지전자 주식회사 멀티미디어 데이터의 의미적/구조적 정보 생성방법 및 그 정보의 기록매체와 멀티미디어 검색 및 브라우징 방법
US6675174B1 (en) * 2000-02-02 2004-01-06 International Business Machines Corp. System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams
US6578040B1 (en) * 2000-06-14 2003-06-10 International Business Machines Corporation Method and apparatus for indexing of topics using foils
CN100437561C (zh) * 2003-12-17 2008-11-26 国际商业机器公司 电子文档的处理方法和装置及其系统
US20060224584A1 (en) * 2005-03-31 2006-10-05 Content Analyst Company, Llc Automatic linear text segmentation
BRPI0708456A2 (pt) * 2006-03-03 2011-05-31 Koninkl Philips Electronics Nv método para prover um sumário de diversas imagens, dispositivo adaptado para gerar um sumário de diversas imagens, sistema, código de programa executável por computador, e, portador de dados
EP2044772A4 (en) * 2006-07-07 2010-03-31 Redlasso Corp SEARCH ENGINE FOR AUDIO DATA

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216443A1 (en) * 2000-07-06 2005-09-29 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
JP2005535018A (ja) * 2002-07-29 2005-11-17 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. メディアオブジェクトのコレクションの提示

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNG200900289150; 岡本拓明: 'プレゼンテーション蓄積検索システムにおける講義・講演音声情報を利用した適合度の改善' DEWS2006論文集 [online] , 20060630, 電子情報通信学会データ工学研究専門委員会 *
CSNG200900341008; 岡本拓明: 'プレゼンテーション蓄積検索システムにおける適合度計算の改善' 第15回データ工学ワークショップ(DEWS2004)論文集 [online] , 20040618, 電子情報通信学会データ工学研究専門委員会 *
JPN6012045775; YOKOTA Haruo: 'UPRISE : Unified Presentation Slide Retrieval by Impression Search Engine' IEICE transactions on information and systems Vol.E87-D, No.2, 20040201, pp.397-406, 社団法人電子情報通信学会情報・システムソサイエティ *
JPN6012045776; 岡本拓明: 'プレゼンテーション蓄積検索システムにおける適合度計算の改善' 第15回データ工学ワークショップ(DEWS2004)論文集 [online] , 20040618, 電子情報通信学会データ工学研究専門委員会 *
JPN6012045777; 岡本拓明: 'プレゼンテーション蓄積検索システムにおける講義・講演音声情報を利用した適合度の改善' DEWS2006論文集 [online] , 20060630, 電子情報通信学会データ工学研究専門委員会 *
JPN6012045778; Okamoto, H.: 'Presentation Retrieval Method Considering the Scope of Targets and Outputs' Web Information Retrieval and Integration, 2005. WIRI '05. Proceedings. International Workshop on Ch , 2005 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011248228A (ja) * 2010-05-28 2011-12-08 Brother Ind Ltd 光走査装置
WO2017087003A1 (en) * 2015-11-20 2017-05-26 Hewlett Packard Enterprise Development Lp Segments of data entries

Also Published As

Publication number Publication date
US20080288537A1 (en) 2008-11-20

Similar Documents

Publication Publication Date Title
JP2008287698A (ja) 索引付けシステム及び索引付けプログラム
Annett et al. A comparison of sentiment analysis techniques: Polarizing movie blogs
KR101672579B1 (ko) 키워드 추출에 관한 시스템 및 방법
Lossio-Ventura et al. Yet another ranking function for automatic multiword term extraction
Newman et al. Bayesian text segmentation for index term identification and keyphrase extraction
Deschacht et al. Text analysis for automatic image annotation
Martinez-Romo et al. Web spam identification through language model analysis
WO2006001906A2 (en) Graph-based ranking algorithms for text processing
Chen et al. Plagiarism detection using ROUGE and WordNet
Okumura et al. Semeval-2010 task: Japanese wsd
Alami et al. Hybrid method for text summarization based on statistical and semantic treatment
Galanopoulos et al. Temporal lecture video fragmentation using word embeddings
Wu et al. Leveraging social Q&A collections for improving complex question answering
Roy et al. Discovering and understanding word level user intent in web search queries
Cimino et al. Linguistic profiling based on general–purpose features and native language identification
Chen et al. A boundary assembling method for Chinese entity-mention recognition
Gupta et al. Plagiarism detection in text documents using sentence bounded stop word n-grams
Tsai Chinese text segmentation: A hybrid approach using transductive learning and statistical association measures
Chaibi et al. Topic segmentation for textual document written in arabic language
Izquierdo et al. An empirical study on class-based word sense disambiguation
Lee Text-based video genre classification using multiple feature categories and categorization methods
Heu et al. Multi-document summarization exploiting semantic analysis based on tag cluster
Peng et al. SIR-NERD: a chinese named entity recognition and disambiguation system using a two-stage method
JP4175093B2 (ja) トピック境界決定方法及び装置及びトピック境界決定プログラム
Welch Addressing the challenges of underspecification in web search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120904

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121022

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130226