JP2004265097A - プレゼンテーション資料検索システムおよびその方法並びにプログラム - Google Patents

プレゼンテーション資料検索システムおよびその方法並びにプログラム Download PDF

Info

Publication number
JP2004265097A
JP2004265097A JP2003054217A JP2003054217A JP2004265097A JP 2004265097 A JP2004265097 A JP 2004265097A JP 2003054217 A JP2003054217 A JP 2003054217A JP 2003054217 A JP2003054217 A JP 2003054217A JP 2004265097 A JP2004265097 A JP 2004265097A
Authority
JP
Japan
Prior art keywords
slide
keyword
presentation material
search
presentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003054217A
Other languages
English (en)
Other versions
JP3887685B2 (ja
Inventor
Haruo Yokota
治夫 横田
Takashi Kobayashi
隆志 小林
Taichi Muraki
太一 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Institute of Technology NUC
Original Assignee
Tokyo Institute of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Institute of Technology NUC filed Critical Tokyo Institute of Technology NUC
Priority to JP2003054217A priority Critical patent/JP3887685B2/ja
Publication of JP2004265097A publication Critical patent/JP2004265097A/ja
Application granted granted Critical
Publication of JP3887685B2 publication Critical patent/JP3887685B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】膨大なプレゼンテーション資料に対してキーワードに対する適合の度合いを数値化し、順位付けをして利用者に提供することで、利用者に検索結果を効率的に提供することを目的とする。
【解決手段】プレゼンテーション資料検索システム100は、所望のキーワード入力を受け、これに基づき検索手段130において前記メタデータを検索する。第1の適合度算出手段131では単一スライド内でのキーワードの出現位置などに基づき適合度を計算し、第2の適合度算出手段132では各スライドの提示時間に基づき適合度を計算し、第3の適合度算出手段133では前後複数のスライドに含まれるキーワードに基づく適合度を計算し、最後に第4の適合度算出手段134では複数キーワードの共起に基づき適合度を計算し、これらの適合度を用いて順位付け手段138は、ヒットしたスライドを順位付け、提示手段140は、順位付けに従って、適合度の高い順にヒットしたスライドを提示する。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、膨大なスライド形式のプレゼンテーション資料から、所望のキーワードに基づき、このキーワードに最も適合する資料を効率良く絞り込んで検索するシステム、およびその方法並びにプログラムに関する。さらに、プレゼンテーション資料のみならず、それを用いたプレゼンテーションを撮影した映像データを同期させた検索システムおよびその方法並びにプログラムに関する。
【0002】
【従来の技術】
IT技術の発達に伴って様々な情報がインターネットを介して配信されるようになり、多様かつ大量の情報の入手が可能となってきている。特に非定型データやマルチメディアデータが増大し、そのような膨大なデータから、いかにして所望のデータにアクセスするかが重要となっている。e−ラーニング(遠隔学習システム)は、そのような大量の非定型のデータやマルチメディアデータの発信・検索の格好な例の1つである。
【0003】
インターネットを介した教育コンテンツの配信の試みは、MITの「Open Course Ware」(非特許文献1を参照されたい。)や「University of Phoenix Online」(http://online.uophx.edu)等々の米国の多数の大学、或いは、日本国内の多くの大学、さらには、WIDEプロジェクトの「SOIWG」(http://www.soi.wide.ad.jp)などで多数試みられてきた。しかし、これらで配信される教育コンテンツは、シラバス、講義ビデオ、プレゼンテーション資料などの教育素材がほぼそのままの形で提供されるにとどまっている。
また、何らかの形で講義ビデオとプレゼンテーション資料が統合される場合には、その作業コストが問題となる。例えば、オーサリングツールなどを用いて講義ビデオとプレゼンテーション資料とを統合する場合は非常に手間がかかり、資料の一部か更新されたときは、再度これらの統合作業が必要になる。
【0004】
このような教育素材などの非定型データとしては、スライド(ページ)形式のプレゼンテーション資料が非常に多い。また、このようなスライド形式のプレゼンテーション資料は、e−ラーニングのみならず、教育資料を用いた通常の講義資料、営業活動のときの提案資料、或いは、学術会議などでの発表資料などとしても大量に作製され続けてきた。
【0005】
さらに、このようなスライドからなる電子的プレゼンテーション資料を作成し提示するプレゼンテーションソフトとしては、マイクロソフト社の「PowerPoint」が広く普及しており、このソフトを用いたスライド(ページ)を含むプレゼンテーション資料が大量に作製されている。
【0006】
しかしながら、上述したようにプレゼンテーション資料は膨大であり、これら資料のなかから、ユーザが所望のスライドを含む資料に効率良くかつ迅速にアクセスすることは困難である。例えば、上述したような従来のe−ラーニングシステムでは、単純な文字列検索のみ、即ち、所望のキーワードを入力してこのキーワードを含むものがヒットするというような単純な検索手段しか提供していない。従って、ヒットした資料(即ちキーワードを含む資料)には、重要なものと重要でないものがあるはずであるが、これらの従来の検索手段は、その優劣を判定する手段を持っていない。
【0007】
【非特許文献1】
「Open Course Ware」(サイト管理者:米国マサチューセッツ工科大学、平成14年9月公開、[online]、平成14年9月検索、インターネット、URL:http://web.mit.edu/ocw)
【0008】
【発明が解決しようとする課題】
本発明は、格納された膨大なプレゼンテーション資料に対してキーワードに対する適合の度合いを数値化し、その数値によって順位付けをして利用者に提供することで、利用者に検索結果を効率的に提供することを目的とする。
【0009】
【課題を解決するための手段】
上述した諸課題を達成するために、本発明によるプレゼンテーション資料検索システムは、スライド形式のプレゼンテーション資料を検索するプレゼンテーション資料検索システムであって、
利用者からのキーワードを入力する入力手段と、
前記入力されたキーワードで前記スライド形式のプレゼンテーション資料を検索し、所定のポイントテーブルを参照して或いは所定の計算式を用いて、スライド内において前記キーワードが出現する位置、前記キーワードの文字サイズ、および、前記キーワードが置かれているレベル(レイヤー)のインデント情報や編集情報、のうちの少なくとも1つに応じて、スライドごとの適合度を計算し(例えば、ポイントをスライドごとに集計し、この集計したポイントを適合度とする)、この適合度に基づきヒットしたスライドを順位付ける検索手段と、
前記適合度が高いスライドの順に検索結果を利用者に提示する提示手段と、
を含むシステムである。
本発明によれば、スライド内の文章構造、即ち、スライド内のキーワードの位置、文字サイズ、或いは、キーワードの属するレベル或いはレイヤーのインデント情報や編集情報(例えば、タイトルインデント、本文インデントなど)を考慮した適合度を数値化して、それを利用して検索を行うことができるため、より検索キーワードへの適合度が高いスライドから順に利用者へ提示することが可能となる。即ち、利用者は、膨大な資料のなかから、より当該キーワードへの重要度が高い情報へ容易かつスピーディにアクセスすること可能となる。例えば、あるキーワードで膨大な数のスライドがヒットした場合は、本システムで算出した適合度の上位何件かを提示するなどという形式で、適正な絞り込みが可能となる。
【0010】
また、本発明によるプレゼンテーション資料検索システムは、
前記プレゼンテーション資料のスライドに含まれる文字列から、形態素解析手段で単語を切り出し、この切り出した各単語をインデックスとするメタデータを作成するメタデータ作成手段、をも含み、
前記検索手段は、前記プレゼンテーション資料ではなく前記メタデータを検索する、
ことを特徴とする。
本発明によれば、既知の形態素解析技術などで切り出した各単語を用いて予め構築されたメタデータを利用するため、検索スピードを顕著に速くすることが可能である。特に、資料が膨大になればなるほど、メタデータ化による迅速化のメリットをより多く享受することが可能である。さらに、コンテンツ自体には手を加えていないため、コンテンツ自体が更新された場合は、簡易かつ効率的にメタデータに反映させることが可能である。
【0011】
また、本発明によるプレゼンテーション資料検索システムは、
前記プレゼンテーション資料と、その資料を用いたプレゼンテーションを撮影した映像データとを関連付ける同期手段、をも含み、
前記検索手段は、前記映像データ中の各スライドの提示時間に応じて、前記適合度に修正を加える、
ことを特徴とする。
本発明によれば、各スライド別のプレゼンテーションの実提示時間を把握して、例えば、各スライドの提示時間に応じたポイントをも、前記スライドの集計ポイント(即ち適合度)に加算するなどして、この提示時間をも考慮した適合度を算出できるため、順位付け(適合度)の精度がさらに向上した検索を可能とする。すなわち、ユーザの所望するキーワードに、よりマッチした資料を検索することが可能となる。このようにして関連付けたものを前記メタデータに統合すると、迅速化の面でさらに好適である。また、これらの検索用データは、メタデータであるため、コンテンツ自体に変更を加える必要がないことも利点である。なお、映像データとの同期の詳細については、本願の発明者の1人である横田治夫による「マルチメディア同期検索方法(特願2001−319143号、現在未公開)」を参照されたい。
【0012】
また、本発明によるプレゼンテーション資料検索システムは、
前記検索手段は、前記検索結果のスライドを提示するときに、このスライドと関連付けられた映像データの映像も併せて提示する、
ことを特徴とする。
本発明によれば、利用者は、検索結果のスライドと、これを用いたプレゼンテーションとを同時に見ることができるため、プレゼンテーション内容を容易かつスピーディに理解することが可能となる。
【0013】
また、本発明によるプレゼンテーション資料検索システムは、
前記ヒットしたスライド、および、そのスライドに隣接する複数枚のスライドをサムネイル表示し、それぞれのサムネイルを、前記映像データ中の各スライドの提示時間、および/または適合度に応じたサイズに設定する提示手段、
を含むことを特徴とする。
本発明によれば、映像データにおけるスライドの実提示時間は当該スライドの重要度を示す一定の尺度に成り得るため、実提示時間が長いスライドほど、より大きなサイズでサムネイル表示することで、ユーザが直感的にスライドの重要度を認識し得るようなユーザインターフェイスを提供することが可能となる。このことは、適合度に応じてサムネイルのサイズを設定した場合も同様である。即ち、ユーザは、サイズの異なる一連のスライド群(ヒットしたスライド、およびその前語数枚のスライド)を見て、容易かつ迅速に各スライドの重要度を理解することが可能となる。
【0014】
また、本発明によるプレゼンテーション資料検索システムは、
前記検索手段は、前記キーワードが含まれるスライドに隣接する複数枚のスライド(即ち前後複数枚のスライド)にも前記キーワードが含まれる場合は、前記キーワード間の距離に応じて、前記適合度に修正を加える、
ことを特徴とする。
本発明によれば、前後複数枚のスライドでも当該キーワードが出現する場合は、それに隣接したスライドは当該キーワードをより詳細に説明しているものと想定され、このことを適合度に反映できるため、例えば、前記キーワード間の距離に応じたポイントをも、該当するスライドの集計ポイント(即ち適合度)に加算するなどして、さらに順付けの精度を向上させることが可能となる。
【0015】
また、本発明によるプレゼンテーション資料検索システムは、
前記検索手段は、前記キーワードが複数ある場合、各キーワード間の距離に応じて、前記適合度に修正を加える、
ことを特徴とする。
本発明によれば、複数キーワードが共起する場合の、例えば、キーワード間の近接の程度に応じたポイントを集計ポイント(即ち適合度)に加算できるため、順付けの精度をさらに向上させることが可能となる。
【0016】
また、本発明は、システム(装置)の形態だけでなく、これらシステムに相当する方法、プログラム、そのプログラムを格納した記録媒体などの形態でも実施し得る。
例えば、本発明による、プレゼンテーション資料検索方法は、
スライド形式のプレゼンテーション資料を検索するプレゼンテーション資料検索方法であって、
キーワードで、記憶手段に格納されている前記スライド形式のプレゼンテーション資料を検索し、演算手段を用いてスライド内において前記キーワードが出現する位置、前記キーワードの文字サイズ、および、前記キーワードが置かれるレイヤーのインデント情報や編集情報、のうちの少なくとも1つに応じて、スライドごとの適合度を計算し(例えば、ポイントをスライドごとに集計し、この集計したポイントを適合度とする)、この適合度に基づきヒットしたスライドを順位付ける検索ステップと、
前記適合度が高いスライドの順に検索結果を表示装置に提示する提示ステップと、
を含む方法としても実現することができる。
或いは、本発明による、プレゼンテーション資料検索方法は、
前記方法は、前記プレゼンテーション資料のスライドに含まれる文字列から、単語を切り出し、この切り出した各単語をインデックスとするメタデータを作成するメタデータ作成ステップをも含み、
前記検索ステップは、前記プレゼンテーション資料ではなく前記メタデータを検索する、
ことを特徴とする。
【0017】
例えば、本発明によるプログラムは、
スライド形式のプレゼンテーション資料を検索するプレゼンテーション資料検索方法をコンピュータに実行させるためのプログラムであって、
前記方法が、
キーワードで、記憶手段に格納されている前記スライド形式のプレゼンテーション資料を検索し、スライド内において前記キーワードが出現する位置、前記キーワードの文字サイズ、および、前記キーワードが置かれるレイヤーのインデント情報や編集情報、のうちの少なくとも1つに応じて、スライドごとの適合度を計算し(例えば、ポイントをスライドごとに集計し、この集計したポイントを適合度とする)、この適合度に基づきヒットしたスライドを順位付ける検索ステップと、
前記適合度が高いスライドの順に検索結果を表示装置に提示する提示ステップと、を含む、
ことを特徴とする。
【0018】
【発明の実施の形態】
以下、諸図面を参照しつつ本発明の実施態様を詳細に説明する。
図1は、本発明のアプローチ手法を示す概念図である。図に示すように、本発明では、プレゼンテーション資料を用いた講義を録画したビデオや、講義に使用したプレンテーション資料を格納し、それら多様な教育コンテンツをメタデータで緩く統合するアプローチを取る。本発明における検索の対象は、基本的にはこのメタデータとなる。まず、統合のための情報をメタデータとして保持し、これによってひとつのコンテンツに他のコンテンツを埋め込まず、コンテンツ自体には何ら変更を加えない形でのコンテンツの統合と検索を実現する。このためメタデータには、動画のどの時刻にスライド(ページ)の切替えが起こったのかという同期情報や、スライドに含まれる文字列へのインデックス、キーワードに対する適合度を含める。
【0019】
動画とスライドとの同期情報は、録画時のクリック情報などを使うことはもちろん、動画とスライドとのパターン認識などを利用することできる。動画とスライドの対応関係を保持することで、スライドのIDが変更されない限りは、スライドの前後の修正も可能である。また、このようにして構成されたメタデータにより、講義ビデオだけ、或いは、スライド形式のプレゼンテーション資料だけでは不可能であった統合的な検索機能が実現可能となる。ここで、メタデータの記述にはXMLを用いることが好適である。XMLベースのメタデータとしては、LOM(Learning Object Metadata)やSCORM(Sharable Content Object Reference Model)などの規格化が進んでいるがこれらを用いても良い。
【0020】
重要な資料を膨大な資料から効率良く検索できるユーザインターフェイスを実現するにあたっては、検索にヒットした多量の講義資料をどのように表示するのかという点が重要である。本発明では、キーワードに対するスライドの適合度を提案し、この適合度の高いスライドに絞り込んで優先的に表示するというアプリローチを取る。適合度の算出には、動画と統合されたプレゼンテーション資料に特有の情報を利用する。
【0021】
図2は、本発明によるプレゼンテーション資料検索システムの一例を示すブロック図である。図に示すように、本発明によるプレゼンテーション資料検索システム100は、メタデータ作成手段110、同期手段120、検索手段130、および提示(表示)手段140を含む。はじめに、メタデータ作成手段110は、記憶手段に格納された膨大な量のコンテンツデータベースから電子化されたスライド形式のプレゼンテーション資料を読み出し、これに基づきメタデータを作成し、メタデータデータベースを構築し記憶手段上に格納する。次に、同期手段120は、コンテンツデータベースから映像(撮影)データを読み出し、これを対応するプレゼンテーション資料の各スライドに関連付けるなどして同期化し、これを前記メタデータに統合する。
【0022】
ユーザ(利用者)は、直接的に或いは図に示すようにネットワーク(インターネットが好適である)を介して本検索システム100にアクセスし、所望のキーワードを入力する。本検索システム100はこの入力されたキーワードを受け、これに基づき検索手段130において前記メタデータを検索する。検索手段130は、第1の適合度算出手段131、第2の適合度算出手段132、第3の適合度算出手段133、第4の適合度算出手段134、および順位付け手段138を含む。第1の適合度算出手段131では単一スライド内でのキーワードの出現位置などに基づき適合度を計算し、第2の適合度算出手段132では各スライドの提示時間に基づき適合度を計算し、第3の適合度算出手段133では前後複数のスライドに含まれるキーワードに基づく適合度を計算し、最後に第4の適合度算出手段134では複数キーワードの共起に基づき適合度を計算する。これらの少なくとも1つの適合度を用いて順位付け手段138は、ヒットしたスライドを順位付ける。提示手段140は、順位付けに従って、適合度の高い順にヒットしたスライドをユーザへ提示(この図の場合は、ネットワークを介して送信する)する。
【0023】
図3は、プレゼンテーション資料に含まれる典型的なスライドの文章構造を示す図である。図に示すように、スライドの文章構造としては、それぞれ何段階か字下げが行われた箇条書きの文章で構成されていること、そして字下げが行われている下位のレベルの文章によってその上位のレベルの文章が補足・説明・展開されていることが多い。このことから、上位のレベルに位置する文章であればあるほど、スライドの内容を把握するために重要な文章である、そのためこのような重要度が高い上位レベルに置かれた単語(キーワード)は、より適合度が高いと考えられる。特に、表題や見出しなどはスライドを代表するもので、キーワードとマッチすることはスライドとしての適合度が高いと考えられる。本発明によるシステムでは、このような文章構造の特性に着目してそれを利用した順位付けを実現する。
【0024】
スライドと動画とが対応付けられていることから、スライドの検索において、そのスライドを説明するのに実際にどれだけの時間がかかったかという時間情報を利用することが可能である。例えば、説明時間が長いスライドであればあるほど、説明が詳しくなされているスライドであり、つまり重要度が高いスライドであると。よって、そのスライドに含まれるキーワードは適合度が高いという推測が成り立つ。本発明によるシステムでは、このようなスライドの実際の説明時間の特性に着目してそれを利用した順位付けを実現する。
【0025】
あるキーワードに対して、単一のスライドのむでなく、前後にまたがるスライドで説明されている場合には、そのキーワードに対する適合度が高いと考えられる。図4は、プレゼンテーション資料のスライド、および、それに隣接する複数枚のスライドの一例を示すブロック図であり、キーワードが前後にまたがる場合(資料A)とまたがない場合(資料B)を示したものである。図に示すように、左から右にプレゼンテーションの説明順にそれぞれのスライドを並べてある。図において、キーワードを含む文章部分をハッチングで示してある。資料Aでは、ある検索キーワードを含むスライドが連続していることから、特定の検索キーワードを連続して説明していることがわかる。これは、資料Bにおいて単独のスライド(真中のもの)のみがキーワードを含んでいることと対照的である。これら2つの資料(スライド群)を比べると、上の資料Aのような連続して検索キーワードを含むスライド群の方が、下の資料Bのようなスライド群よりも当該キーワードに対する適合度が高いと考えられる。本発明によるシステムでは、このようなスライドの前後複数枚を含めたスライドに含まれるキーワードに着目してそれを利用した順位付けを実現する。
【0026】
複数の検索キーワード間の距離に基づいても適合度を定めることが可能である。即ち、キーワード間の距離が短ければそれらのキーワードは関連付けて説明されている傾向が強いことから適合度は高く、逆に、距離が長ければ関連なく独立して説明されている傾向が強いことから相対的に適合度が低いと判断することができる。
図5は、検索キーワード間の距離が短いスライド群と、長いスライド群とを対比させたブロック図である。図に示すように、「縦のハッチング」と「斜めのハッチング」とは異なるキーワードを含む文である。資料Cは、破線の矢印で示してあるように、異なるキーワード同士の距離が近く、これに比べて資料Dは、異なるキーワード同士が離れて位置している。資料Cのように、複数のキーワード間の距離が短ければ短いほどキーワード同士が密接に関係した形で説明されているものと推測でき、よってこれらキーワードに対する適合度が高いと考えられる。本発明によるシステムでは、このような複数キーワードの関係に着目してそれを利用した順位付けを実現する。
【0027】
次に、上述の着目点に基づく適合度の算出式をそれぞれ説明する。
はじめに、単一スライド内での適合度の算出式を説明する。スライドsの適合度P(s)を、
【数1】
Figure 2004265097
と定義する。ここで「K,…,K」は検索キーワード(mは検索キーワードの種類)、lはスライド中に含まれる文字列のライン番号、f(l)はラインlに対するポイントを与える関数、g(s,l,k)はスライドsでラインlにキーワードKが含まれる個数である。
図6は、単一スライド内での適合度の算出式を適用する場合の一例を示すブロック図である。例えば、lがレベル1のときf(l)=5、lがレベル2のときf(l)=4、lがレベル3のときf(l)=3となるような関数を用意し、図に示すように、キーワードKがレベル1に1つ、レベル2に1つ、レベル3に2つ(図中のハッチング箇所)あったとき、P(s)=5+4++3+3=15ポイントとなる。適合度の計算は、前記のような関数を用いても良いが、図中のように、文章の各レベル別にポイントを規定したポイントテーブルを用意して計算することも可能である。
【0028】
次に、スライドの提示時間を加味した適合度の算出式を説明する。スライドsの説明時間をTs[sec]とすると、スライドsの時間情報を加味した適合度P(s)を、
【数2】
Figure 2004265097
と定義する。図7は、時間情報を加味した適合度の算出式を適用する場合の一例を示すブロック図である。図において、ハッチング箇所が検索キーワードを含む箇所である。図に示すように、例えば、スライドsの説明時間が20秒、sの説明時間が30秒、sの説明時間が15秒の場合を考えると、上述した式により、P(s)=11、P(s)=0、P(s)=7のときは、P(s)=325となる。
【0029】
次に、前後関係を含めたスライドの適合度の算出式を説明する。前後関係を含めたスライドの適合度P(s,e)を、スライド「s−e」からスライド「s+e」までのP(s)を合計した、
【数3】
Figure 2004265097
と定義する。なお、この適合度P(s,e)が時間を加味した適合度に基づかせる方が望ましい場合も考えられ、その際は合計の対象をP(s)とする。このように、プレゼンテーション資料のs番目のスライドに注目し、前後e枚のスライドまでの適合度を加味するとする。
【0030】
次に、複数キーワードの共起に基づく適合度の算出式を説明する。この適合度は、複数の検索キーワードが与えられた場合、それらが互いのどれだけ近接して存在しているのかを示すものであり、あるキーワードからそれを異なるキーワードまでの距離の逆数を合計したものとして定義される。即ち、複数キーワードの共起に基づく適合度P(s,e)を、
【数4】
Figure 2004265097
と定義する。ここで、h(s,l,i)はスライドs中のラインlに現れるi番目のキーワードである。キーワード間の距離を行数として定義するが、ページをまたいだ場合には、間に挟まれるページ数もある比率で加える。即ち、d(h(s,x,i),h(s,y,j))=α|s−s|+|x−y|+1とする(但し、Kがx中にあり、かつ、Kがy中にあり、かつ、i=j)。
【0031】
上述の諸式で定義したスライドのキーワードに対する適合度を利用した、総合的なスライドの適合度P(s,e)を、
P(s,e)=w(s)+ w(s)+ w(s)+ w(s,e)+ w(s,e)
と定義する。ここで重み付けwは、ユーザの検索の目的や資料の特性に合わせて変更や調整が可能である。
【0032】
次に、本発明によるプレゼンテーション資料検索システムにおけるデータの登録手順(メタデータ作成および同期付け)を説明する。本システムでは、あるプレゼンテーションを撮影した映像データ(ビデオテープなど)と、そのプレゼンテーションで使用されたプレゼンテーション資料の2つを一組として登録する。映像データとプレゼンテーション資料の組が与えられると、まず映像データの映像に現れるスライドのパターン認識や、手動入力などによる、同期タイミングの時間列の抽出を行う。
【0033】
次に、プレゼンテーション資料の文字列からキーワードを抽出し、インデックスを作成しメタデータとする。続いて、時間情報を含めた、プレゼンテーション資料に特有の情報を利用して適合度P、P、P、を計算する。但し、この際には、複数の検索キーワードによって算出される、共起に関する適合度Pは、組み合わせ爆発を起こすので計算せずに、検索時に絞り込みに用いる。上記の処理で得られた、同期情報、検索キーワードへのインデックス、キーワードに対するそれぞれの適合度は、以下に示すメタデータとして保存する。
【0034】
図8は、本発明によるプレゼンテーション資料検索システムで作成したメタデータの構造の一例を示すブロック図である。図に示すように、メタデータは、映像データとの同期情報を格納するためのものと、キーワードへのインデックスおよび適合度を格納したものとの2つに分かれる。映像データ(この図の場合は講義ビデオ)と、それに対応するプレゼンテーション資料とは、スライドの切替タイミングと、そのタイミングでのページ遷移という同期情報の列を格納したメタデータによって統合され、一組のデータとして扱われる。
【0035】
もう一方の種類のメタデータには、プレゼンテーション資料中に現れるキーワードと、そのキーワードに対して張られたインデックスとが格納されている。さらに、一つ一つのキーワードについて図に示すような、スライド中のキーワードへのポインタと適合度とを格納したテーブルが対応しており、メタデータに記述されている。スライド中のキーワードへのポインタは、
1.プレゼンテーション資料のID:PrID、
2.プレゼンテーション資料中のスライドのページ番号:Page、
3.スライドの文字列における位置:Position、
という3つの情報からなっており、これによって全プレゼンテーション資料中の検索キーワードの位置が一意に特定できる。キーワードに対する適合度は、予め算出しておくことが可能なP、P、Pを格納しておく。
【0036】
次に、本発明によるプレゼンテーション資料検索システムにおける検索手順の一例を説明する。検索に際しては、キーワードが1つの場合と複数の場合とでその手順が分かれる。キーワードが1つの場合は、予めメタデータに計算され格納されている適合度P、P、Pと、利用者の検索目的に合わせた重みw、w、wから、これらをまとめた総合的な適合度を計算する。
【0037】
キーワードが複数ある場合は、メタデータに格納されていない、キーワードの共起に基づく適合度Pを動的に算出し、これとメタデータに格納されているP、P、Pと合わせ、重みw、w、wで結合して前述した式を用いて全体の適合度を計算する。
【0038】
こうして計算されたキーワードに対する適合度順に、プレゼンテーション資料をサムネイル表示する。このとき、サムネイルのサイズは、適合度に応じた大きさとし、ユーザによる適合度の視覚的な把握を助ける。或いは、サムネイルのサイズは、図9のように各スライドのプレゼンテーション時間に応じた大きさとすることも可能である。
【0039】
図10、本発明によるプレゼンテーション資料検索システムがユーザに提供するユーザインターフェイスの一例を示す図である。図に示すように、本システムは、適合度を用いて、検索キーワードにヒットしたスライドと、その前後e枚についてその適合度を算出し、適合度の順にサムネイル表示する。サムネイルをマウスなどでクリックすると、選択されたスライドの対応する時点から、選択されたスライド(プレゼンテーション資料)と講義ビデオを同期させ、1つのコンテンツとして統合して再生する。さらに、ユーザの検索の目的に応じて、適合度、および/または、プレゼンテーション時間に応じたサイズのサムネイル表示が選択可能であるとする。これによって、多量の講義資料の視認性の向上をはかる。
【0040】
本発明によるプレゼンテーション資料検索システムを用いて、適合度P、Pについて評価実験を行った。
検索対象資料は、24枚(ページ)のスライド群から成る、本発明に関連したプレゼンテーション資料であり、検索キーワードは「スライド」および「適合」である。スライドごとの適合度Pを算出した。なお、Pの算出に用いる関数f(l)はラインlの位置の文章レベルlebelを用いて「f(l)=5−level」と定義した。
【0041】
【表1】
Figure 2004265097
【0042】
【表2】
Figure 2004265097
【0043】
それぞれのキーワード別に評価結果を適合度Pのポイントの高い順に表1および表2に示す。この結果から、ページ番号18が、キーワード「スライド」および「適合」の双方でポイント即ち適合度が高いスライドであることがわかる。このページ番号18のスライドを図11に示す。図に示すように、このスライドは、「スライドのキーワードに対する適合度」の定義についての説明を完成させたスライドであり、このキーワードの検索の目的に良く合致しているといえる。
【0044】
また、キーワード「検索」については高いポイントであるが、キーワード「スライド」でポイントの低いスライドとしては、ページ番号21(図11)が挙げられる。図に示すように、このぺージ(スライド)は、「スライド」という言葉については特に説明しておらず、これは、このキーワード「スライド」に対するポイントが低いものにとどまっていることと合致している。
次に、説明時間に応じた適合度Pを求め、Pと比較した。適合度の順位は若干の変化はあったがほぼ同様の傾向が示された。
このように、本発明による検索システムは、実際の文書資料から、所望のキーワードに最も良く合致する、即ち最も適合度の高い資料を的確に検索することができ、さらに、キーワードへの適合度を数値化して適合の度合いを適正に順位付けすることが可能である。
【0045】
本明細書では、様々な実施態様で本発明の原理を説明してきたが、本発明は上述した実施例に限定されず幾多の変形および修正を施すことが可能であり、これら変形および修正されたものも本発明に含まれることを理解されたい。例えば、実施態様で挙げた適合度の算出式は、例示であり、様々に変形し得る。また、上述したように、「適合度のポイント値」は所定の関数を用いて計算することもできるが、その他の関数や予め用意した種々のポイントテーブルを用いて適合度を計算することも可能である。
【図面の簡単な説明】
【図1】本発明のアプローチ手法を示す概念図である。
【図2】本発明によるプレゼンテーション資料検索システムの一例を示すブロック図である。
【図3】プレゼンテーション資料に含まれる典型的なスライドの文章構造を示す図である。
【図4】プレゼンテーション資料のスライド、および、それに隣接する複数枚のスライドの一例を示すブロック図である。
【図5】検索キーワード間の距離が短いスライド群と、長いスライド群とを対比させたブロック図である。
【図6】単一スライド内での適合度の算出式を適用する場合の一例を示すブロック図である。
【図7】時間情報を加味した適合度の算出式を適用する場合の一例を示すブロック図である。
【図8】本発明によるプレゼンテーション資料検索システムで作成したメタデータの構造の一例を示すブロック図である。
【図9】サムネイルのサイズを各スライドのプレゼンテーション時間に応じた大きさとした場合の表示画面の一例を示すブロック図である。
【図10】本発明によるプレゼンテーション資料検索システムがユーザに提供するユーザインターフェイスの一例を示す図である。
【図11】本発明によるプレゼンテーション資料検索システムで検索してヒットしたスライド画面である。
【図12】本発明によるプレゼンテーション資料検索システムで検索してヒットしたスライド画面である。
【符号の説明】
100 プレゼンテーション資料検索システム
110 メタデータ作成手段
120 同期手段
130 検索手段
131 第1の適合度算出手段
132 第2の適合度算出手段
133 第3の適合度算出手段
134 第4の適合度算出手段
138 順位付け手段
140 提示手段

Claims (10)

  1. スライド形式のプレゼンテーション資料を検索するプレゼンテーション資料検索システムであって、
    キーワードで前記スライド形式のプレゼンテーション資料を検索し、スライド内において前記キーワードが出現する位置、前記キーワードの文字サイズ、および、前記キーワードが置かれるレベルのインデント情報や編集情報、のうちの少なくとも1つに応じて、スライドごとの適合度を計算し、この適合度に基づきヒットしたスライドを順位付ける検索手段、
    を含むプレゼンテーション資料検索システム。
  2. 請求項1に記載のプレゼンテーション資料検索システムにおいて、
    前記プレゼンテーション資料のスライドに含まれる文字列から、単語を切り出し、この切り出した各単語をインデックスとするメタデータを作成するメタデータ作成手段、をも含み、
    前記検索手段は、前記プレゼンテーション資料ではなく前記メタデータを検索する、
    ことを特徴とするプレゼンテーション資料検索システム。
  3. 請求項1または2に記載のプレゼンテーション資料検索システムにおいて、
    前記プレゼンテーション資料と、その資料を用いたプレゼンテーションを撮影した映像データとを関連付ける同期手段、をも含み、
    前記検索手段は、前記映像データ中の各スライドの提示時間に応じて、前記適合度に修正を加える、
    ことを特徴とするプレゼンテーション資料検索システム。
  4. 請求項3に記載のプレゼンテーション資料検索システムにおいて、
    前記検索手段は、前記検索結果のスライドを提示するときに、このスライドと関連付けられた映像データの映像も併せて提示する、
    ことを特徴とするプレゼンテーション資料検索システム。
  5. 請求項3または4に記載のプレゼンテーション資料検索システムにおいて、
    前記ヒットしたスライド、および、そのスライドに隣接する複数枚のスライドをサムネイル表示し、それぞれのサムネイルを、前記映像データ中の各スライドの提示時間、および/または前記適合度に応じたサイズに設定する提示手段、
    を含むことを特徴とするプレゼンテーション資料検索システム。
  6. 請求項1〜5のずれか1項に記載のプレゼンテーション資料検索システムにおいて、
    前記検索手段は、前記キーワードが含まれるスライドに隣接する複数枚のスライドにも前記キーワードが含まれる場合は、前記キーワード間の距離に応じて、前記適合度に修正を加える、
    ことを特徴とするプレゼンテーション資料検索システム。
  7. 請求項1〜6のずれか1項に記載のプレゼンテーション資料検索システムにおいて、
    前記検索手段は、前記キーワードが複数ある場合、各キーワード間の距離に応じて、前記適合度に修正を加える、
    ことを特徴とするプレゼンテーション資料検索システム。
  8. スライド形式のプレゼンテーション資料を検索するプレゼンテーション資料検索方法であって、
    キーワードで、記憶手段に格納されている前記スライド形式のプレゼンテーション資料を検索し、演算手段を用いてスライド内において前記キーワードが出現する位置、前記キーワードの文字サイズ、および、前記キーワードが置かれるレベルのインデント情報や編集情報、のうちの少なくとも1つに応じて、スライドごとの適合度を計算し、この適合度に基づきヒットしたスライドを順位付ける検索ステップ、
    を含むプレゼンテーション資料検索方法。
  9. 請求項8に記載のプレゼンテーション資料検索方法であって、
    前記方法は、前記プレゼンテーション資料のスライドに含まれる文字列から、単語を切り出し、この切り出した各単語をインデックスとするメタデータを作成するメタデータ作成ステップをも含み、
    前記検索ステップは、前記プレゼンテーション資料ではなく前記メタデータを検索する、
    ことを特徴とするプレゼンテーション資料検索方法。
  10. スライド形式のプレゼンテーション資料を検索するプレゼンテーション資料検索方法をコンピュータに実行させるためのプログラムであって、
    前記方法が、
    キーワードで、記憶手段に格納されている前記スライド形式のプレゼンテーション資料を検索し、スライド内において前記キーワードが出現する位置、前記キーワードの文字サイズ、および、前記キーワードが置かれるレイヤーのインデント情報や編集情報、のうちの少なくとも1つに応じて、スライドごとの適合度を計算し、この適合度に基づきヒットしたスライドを順位付ける検索ステップと、
    前記適合度が高いスライドの順に検索結果を表示装置に提示する提示ステップと、を含む、
    ことを特徴とするプログラム。
JP2003054217A 2003-02-28 2003-02-28 プレゼンテーション資料検索システムおよびその方法並びにプログラム Expired - Lifetime JP3887685B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003054217A JP3887685B2 (ja) 2003-02-28 2003-02-28 プレゼンテーション資料検索システムおよびその方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003054217A JP3887685B2 (ja) 2003-02-28 2003-02-28 プレゼンテーション資料検索システムおよびその方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2004265097A true JP2004265097A (ja) 2004-09-24
JP3887685B2 JP3887685B2 (ja) 2007-02-28

Family

ID=33118625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003054217A Expired - Lifetime JP3887685B2 (ja) 2003-02-28 2003-02-28 プレゼンテーション資料検索システムおよびその方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP3887685B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106902A (ja) * 2004-09-30 2006-04-20 Fuji Xerox Co Ltd スライドコンテンツ処理装置、スライドコンテンツ処理方法およびプログラム
JP2007080099A (ja) * 2005-09-15 2007-03-29 Ricoh Co Ltd 画像処理装置、画像検索方法および画像検索プログラム
JP2009282937A (ja) * 2008-05-26 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 情報自動編成提示装置および情報自動編成提示処理プログラム
JP2010186370A (ja) * 2009-02-13 2010-08-26 Nippon Telegr & Teleph Corp <Ntt> テキスト検索結果ランキング装置、テキスト検索結果ランキング方法、テキスト検索結果ランキングプログラムおよびそのプログラムを記録した記録媒体
JP2012208774A (ja) * 2011-03-30 2012-10-25 Casio Comput Co Ltd 検索方法、検索装置、ならびに、コンピュータプログラム
JP2012256204A (ja) * 2011-06-09 2012-12-27 Dainippon Printing Co Ltd 記事配信システム、記事配信方法、サーバ及びプログラム
JP2017084240A (ja) * 2015-10-30 2017-05-18 株式会社インタラクティブソリューションズ スライド検索装置、スライド検索システム、スライド検索方法及びスライド検索プログラム
JP2020154777A (ja) * 2019-03-20 2020-09-24 株式会社野村総合研究所 プレゼンテーションデータ作成支援システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106902A (ja) * 2004-09-30 2006-04-20 Fuji Xerox Co Ltd スライドコンテンツ処理装置、スライドコンテンツ処理方法およびプログラム
JP4639734B2 (ja) * 2004-09-30 2011-02-23 富士ゼロックス株式会社 スライドコンテンツ処理装置およびプログラム
JP2007080099A (ja) * 2005-09-15 2007-03-29 Ricoh Co Ltd 画像処理装置、画像検索方法および画像検索プログラム
JP2009282937A (ja) * 2008-05-26 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 情報自動編成提示装置および情報自動編成提示処理プログラム
JP2010186370A (ja) * 2009-02-13 2010-08-26 Nippon Telegr & Teleph Corp <Ntt> テキスト検索結果ランキング装置、テキスト検索結果ランキング方法、テキスト検索結果ランキングプログラムおよびそのプログラムを記録した記録媒体
JP2012208774A (ja) * 2011-03-30 2012-10-25 Casio Comput Co Ltd 検索方法、検索装置、ならびに、コンピュータプログラム
JP2012256204A (ja) * 2011-06-09 2012-12-27 Dainippon Printing Co Ltd 記事配信システム、記事配信方法、サーバ及びプログラム
JP2017084240A (ja) * 2015-10-30 2017-05-18 株式会社インタラクティブソリューションズ スライド検索装置、スライド検索システム、スライド検索方法及びスライド検索プログラム
JP2020154777A (ja) * 2019-03-20 2020-09-24 株式会社野村総合研究所 プレゼンテーションデータ作成支援システム
JP7171480B2 (ja) 2019-03-20 2022-11-15 株式会社野村総合研究所 プレゼンテーションデータ作成支援システム

Also Published As

Publication number Publication date
JP3887685B2 (ja) 2007-02-28

Similar Documents

Publication Publication Date Title
US11513998B2 (en) Narrowing information search results for presentation to a user
US20230078155A1 (en) Narrowing information search results for presentation to a user
US9846744B2 (en) Media discovery and playlist generation
JP5511292B2 (ja) 表示方法、システムおよびプログラム
US9600533B2 (en) Matching and recommending relevant videos and media to individual search engine results
US9355178B2 (en) Methods of and systems for searching by incorporating user-entered information
US7725451B2 (en) Generating clusters of images for search results
US6256648B1 (en) System and method for selecting and displaying hyperlinked information resources
US7657504B2 (en) User interface for displaying images of sights
US7958128B2 (en) Query-independent entity importance in books
Hider Information resource description: creating and managing metadata
US20160179931A1 (en) System And Method For Supplementing Search Queries
US20150370833A1 (en) Visual refinements in image search
JP2007334502A (ja) 検索装置、方法およびプログラム
CN109952571B (zh) 基于上下文的图像搜索结果
JP3887685B2 (ja) プレゼンテーション資料検索システムおよびその方法並びにプログラム
JP2012008874A (ja) 画像選定装置、方法及びプログラム
Sukovic E-texts in research projects in the humanities
JP2006228059A (ja) ポインタの位置情報を利用するプレゼンテーションコンテンツ検索システムおよびその方法、ならびにコンピュータ読み取り可能な記録媒体
Zavalina Collection-level subject access in aggregations of digital collections: metadata application and use
Xue et al. Improve Web search using image snippets
Yang et al. Click-Search: Supporting information search with crowd-powered image-to-keyword query formulation
Thao et al. A relevance model for Web image search
TW201011572A (en) Plug-in type method for searching network objects

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20030228

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20030319

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040712

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061031

R150 Certificate of patent or registration of utility model

Ref document number: 3887685

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

EXPY Cancellation because of completion of term