JPWO2004034282A1 - コンテンツ再利用管理装置およびコンテンツ再利用支援装置 - Google Patents

コンテンツ再利用管理装置およびコンテンツ再利用支援装置 Download PDF

Info

Publication number
JPWO2004034282A1
JPWO2004034282A1 JP2004542804A JP2004542804A JPWO2004034282A1 JP WO2004034282 A1 JPWO2004034282 A1 JP WO2004034282A1 JP 2004542804 A JP2004542804 A JP 2004542804A JP 2004542804 A JP2004542804 A JP 2004542804A JP WO2004034282 A1 JPWO2004034282 A1 JP WO2004034282A1
Authority
JP
Japan
Prior art keywords
content
reuse
information
determination
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004542804A
Other languages
English (en)
Inventor
太郎 藤本
太郎 藤本
有馬 淳
淳 有馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2004034282A1 publication Critical patent/JPWO2004034282A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules

Abstract

コンピュータを利用したデータベースに保存されるコンテンツに対して,コンテンツ間の再利用関係の有無を判定するコンテンツ再利用管理装置において,コンテンツに現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する再利用判定手段とを備え,コンテンツ間での表層情報の一致の程度によりコンテンツ間での再利用関係の有無を判定する構成をもつ。

Description

本発明はシナリオ,テキスト,文書,テンプレート,文例,図例,画像,音声等のコンピュータを利用したデータベースに保存されているコンテンツ間での再利用の程度を判定するコンテンツ再利用管理装置およびコンテンツ再利用支援装置に係るものである。本発明のコンテンツ管理再利用装置は,コンテンツの表層情報やキーワード等からコンテンツの再利用度を判定し,再利用という観点でコンテンツ類似度とコンテンツに付随する情報から再利用関係の有無,再利用されている程度を求めるものである。また,本発明のコンテンツ再利用支援装置は,コンテンツが再利用されている程度をもとに,コンテンツの重要度を表す推薦情報をユーザに提供し,ユーザが重要度の高いコンテンツを容易に選択できるようにする等で,コンテンツの再利用をし易いように支援するものである。
従来のコンテンツ同士の類似度判定は,キーワードの出現度合いなどによるコンテンツ同士の類似度判定は行われていたが,キーワードが偶然両方の文書に出現したものか,それとも再利用によって両方のコンテンツに出現したものかについては検討されていなかった。
また二文書中から最長の一致文字列を抽出することにより類似度を判定するものもある。
特開2002−118736号公報(第7頁−第11頁)
上記文献には,電子透かしにより,複製品を調査することが記載されている。
従来は電子透かしなどの手法により,文書や画像,音声などのコンテンツ再利用を「yes」,と「no」の二値で判定することが行われていたが,この手法では電子透かしを特別に挿入する複雑な処理が必要となる。
したがって本発明の目的は,このような電子透かしを使用することなく,テキスト文書や画像文書等のコンテンツのテキスト列またはバイト列などの表層情報や辞書を用いたパターン情報から再利用の程度を判定し,コンテンツの派生関係を把握して,再利用を促進/制御可能にするコンテンツ再利用管理装置を提供するものである。
さらに,本発明はコンテンツがどの程度再利用されているかを判定し,再利用されている程度をもとにコンテンツ推薦情報を生成してユーザに提供することによりユーザが重要度の高いコンテンツを容易に選択できるようにする等で,コンテンツの再利用をしやすいように支援するコンテンツ再利用支援装置を提供するものである。
本発明は.コンテンツ間の再利用の有無を判定するコンテンツ再利用管理装置において,コンテンツに現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する再利用判定手段とを備え,コンテンツ間での表層情報の一致の程度によりコンテンツ間での利用関係の有無を判定するものである。
また,本発明は,コンテンツ間の利用の有無を判定するコンテンツ再利用管理装置において,コンテンツに含まれるキーワードを生成し,キーワードに基づいて再利用度を判定する再利用判定手段とを備え,コンテンツ間でのキーワードの一致の程度によりコンテンツの利用関係の有無を判定するものである。
また,本発明は,コンテンツ間の再利用の有無を判定するコンテンツ再利用管理装置において,コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用してコンテンツ間の再利用関係の有無を判定する再利用判定手段およびキーワードに基づいて再利用度を判定する再利用判定手段との双方もしくは,少なくとも一方を備え,コンテンツに関する属性情報であるメタデータを保持するメタデータ保持部と,メタデータを使用して前記再利用判定手段の判定結果を補助するメタデータ利用判定手段とを備え,前記再利用判定手段の再利用判定結果をもとに,さらにメタデータに基づいて再利用を判定するものでる。
また,本発明は,コンテンツ再利用管理装置において,再利用された可能性がある被参照コンテンツと,この被参照コンテンツを再利用して作成された可能性かある判定対象コンテンツと,コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段と,前記再利用判定手段で出力される情報を表示する表示手段を具備するものである。
これにより,コンテンツが二つあれば,これらのコンテンツより表層情報を作成し,これら表層情報をつき合わせるだけで再利用関係をチェックすることができるので,電子透かしのような事前に大きな処理を必要とせず,またキーワードとかメタデータのような情報を事前に用意することなく,再利用状態を検知することができる。
また,本発明のコンテンツ再利用管理装置は,再利用された可能性がある被参照コンテンツと,この被参照コンテンツを再利用して作成された可能性がある判定対象コンテンツと,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,前記再利用判定手段で出力される情報を表示する表示手段を具備したものである。
これにより,コンテンツの中からパターンを抽出する必要がないので,高速に再利用関係を検知することができる。
また,本発明のコンテンツ再利用管理装置は,再利用された可能性がある被参照コンテンツと,この被参照コンテンツに関する作者やその補完元等のメタデータと,前記被参照コンテンツを再利用して作成された可能性がある判定対象コンテンツと,この判定対象コンテンツに関するメタデータと,コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段,または,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,メタデータを使用して前記再利用判定手段の判定結果を補助する判定補助手段と,前記判定補助手段で使用されるメタデータを保持するメタ情報辞書と,前記再利用判定手段より出力される情報を表示する表示手段を具備するものである。
これにより,コンテンツ同士の表層情報,キーワード情報だけではなく,メタデータを使用するので,同じ人が二つの文書を作成している場合には再利用している可能性が高いなどの,もう少しレベルの高い正確な再利用判定ができる。
また,本発明のコンテンツ再利用管理装置は,再利用された可能性がある複数の被参照コンテンツが格納された参照コンテンツデータベースと,この参照コンテンツデータベースに格納されたコンテンツを再利用して作成された可能性のある判定対象コンテンツと,コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段,または,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,前記再利用判定手段より出力される情報を表示する表示手段を具備したものである。
これにより,データベース中に複数のコンテンツを格納して再利用判定を行うので,会社内の全コンテンツとか,会社内の部署内の全コンテンツとか複数のコンテンツと照合でき,一コンテンツ毎に照合するよりも,判定対象コンテンツが社内のどのコンテンツを再利用しているのか等の判定が早くできる。
本発明のコンテンツ再利用管理装置は,再利用された可能性がある複数の被参照コンテンツ及びそれらのメタデータが格納されたメタデータ付参照コンテンツデータベースと,このメタデータ付参照コンテンツデータベースに格納されたコンテンツを再利用して作成された可能性のある判定対象コンテンツと,この判定対象コンテンツに関するメタデータと,コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段,または,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,メタデータを使用して前記再利用判定手段の判定結果を補助する判定補助手段と,前記判定補助手段で使用されるメタデータを保持するメタ情報辞書と,前記再利用判定手段より出力される情報を表示する表示手段を具備するものである。
これにより,データベース中に複数のコンテンツを格納するのみならずそれぞれのコンテンツのメタデータを加えて格納しているので,複数のコンテンツと,メタデータを利用して正確に再利用関係を判定することができる。
本発明のコンテンツ再利用支援装置は,コンテンツを保持するコンテンツ保持部と,コンテンツが再利用されている程度を表す管理情報を管理するコンテンツ管理部と,コンテンツの利用情報をもとにコンテンツを推薦するためのコンテンツ推薦情報を生成するコンテンツ推薦部を備えるものである。
また,本発明のコンテンツ再利用支援装置は,コンテンツ推薦部で生成した推薦情報に基づいて,ユーザによるコンテンツの編集支援を行なうコンテンツ作成支援部とを備えるものである。
このような本発明の再利用支援装置によれば,利用度の高いコンテンツを容易に選択できるようになり,それをもとに容易にコンテンツを再利用することができる。
第1図は,本発明の第1の実施の形態を示す図である。
第2図は,本発明の一致文字列,キーワード生成の説明図である。
第3図は,本発明のコンテンツ再利用管理装置のシステム構成を示す図である。
第4図は,本発明の再利用判定手段の構成を示す図である。
第5図は,本発明の第1の実施の形態の一致文字列生成のフローチャートを示す図である。
第6図は,本発明の第1の実施の形態の再利用判定のフローチャートを示す図である。
第7図は,本発明の第1の実施の形態の再利用判定の別のフローチャートを示す図である。
第8図は,本発明の第2の実施の形態を示す図である。
第9図は,本発明の第2の実施の形態の再利用判定手段の構成を示す図である。
第10図は,本発明の第2の実施の形態の再利用判定のフローチャートである。
第11図は,本発明の再利用判定手段の特殊キーワードによる再利用判定のフローチャートである。
第12図は,本発明の第3の実施の形態を示す図である。
第13図は,本発明の第3の実施の形態の再利用判定手段の構成を示す図である。
第14図は,本発明の第3の実施の形態の再利用判定手段のフローチャートを示す図である。
第15図は,本発明の第4の実施の形態を示す図である。
第16図は,本発明の第4の実施の形態の再利用判定手段の構成を示す図である。
第17図は,本発明の第4の実施の形態の再利用判定手段のフローチャートを示す図である。
第18図は,本発明の第5の実施の形態を示す図である。
第19図は,本発明の第5の実施の形態の再利用判定手段の構成を示す図である。
第20図(A),(B)は,それぞれ本発明の第5の実施の形態の再利用判定手段のフローチャート(1),(2)を示す図である。
第21図は,本発明の第5の実施の形態のフローチャート(3)を示す図である。
第22図は,本発明の第6の実施の形態を示す図である。
第23図は,本発明の第6の実施の形態の動作説明図である。
第24図は,本発明のコンテンツ再利用支援装置のシステム構成図である。
第25図は,本発明のコンテンツ再利用支援装置の構成を示す図である。
第26図は,本発明のコンテンツデータベースの構成を示す図であ。
第27図は,本発明のシナリオの例である。
第28図は,本発明のテンプレートの例である。
第29図は,本発明のオリジナルコンテンツと派生関係の説明図である。
第30図は,本発明のコンテンツ再利用関係の検索結果,参考コンテンツ表示と派生コンテンツ表示の説明である。
第31図は,本発明のコンテンツ再利用支援装置の動作説明図である。
第32図は,本発明のコンテンツ推薦部の推薦情報作成手段のフローチャートである。
第33図は,本発明のコンテンツ再利用関係生成の検索結果と参考コンテンツ表示用情報生成のフローチャートである。
第34図は,本発明の派生コンテンツ表示のフローチャートを示す図である。
第35図は,本発明のドラフト作成支援部の構成を示す図である。
第36図は,本発明のドラフト作成支援部のコンテンツ編集の処理とドラフト作成支援部の差分抽出手段のフローチャートを示す図である。
第37図は,本発明のコンテンツ部品切り出し支援部の構成と動作説明図である。
第38図は,本発明のコンテンツ部品切り出し支援部の共通点取得手段のフローチャートとコンテンツ境界情報作成手段のフローチャートを示す図である。
第39図は,本発明で抽出された共通点の例を示す図である。
第40図は,本発明のコンテンツ管理支援部のコンテンツ部品管理手段のフローチャートとコンテンツ境界情報に基づくコンテンツ部品作成のフローチャートを示す図である。
第41図は,本発明のコンテンツ再利用管理装置とコンテンツ作成支援装置により構成したシステムの例を示す図である。
本発明の第1の実施の形態を第1図に基づき説明する。第1図(A)において,1は再利用管理装置,101は被参照コンテンツ,102は判定対象コンテンツである。201は表層情報ベース再利用判定エンジン,206は表層情報作成手段,210は再利用判定手段A,301は表示手段である。
第1図(B)は本発明の再利用判定手段210がアクセスするデータベースを示す。第1図(B)において,コンテンツデータベース420は後述する本発明のコンテンツ作成支援装置のコンテンツデータベースである。115は,それ以外の一般的なコンテンツを保存して管理しているデータベースである。本発明のコンテンツ再利用管理装置はそれぞれのデータベースに保存されている被参照コンテンツ101,判定対象コンテンツ102を対象にすることができる。
第1図(A)において,コンテンツ再利用管理装置1は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものか否かを表層情報に基づき判定を行うものである。
被参照コンテンツ101は,このコンテンツを再利用されて他のコンテンツが作成されたか否かを判定されるものである。判定対象コンテンツ102は,このコンテンツが他のコンテンツを再利用して作成されたものであるか否かを判定されるものである。第1図(A)では判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものであるか否かを判定する状態を示す。
表層情報ベース再利用判定エンジン201は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものであるか否かを,被参照コンテンツ101と判定対象コンテンツ102の表層情報を使用して判定するものであり,CPUにより構成される。
表層情報作成手段206は,被参照コンテンツ101及び判定対象コンテンツ102からそれらのコンテンツ中に現れる文字列(句読点も含む)などの表層情報を作成するものであり,テキスト文書や画像文書のテキスト列またはバイト列などを作成するものである。
再利用判定手段210は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものか否かを表層情報を使用して判定するものであり,例えば(1)全般的に再利用,(2)部分的に再利用,(3)参照可能性有り,(4)再利用の可能性無し等に判定される。
ここで判定(1)は,判定対象コンテンツ102の表層情報が被参照コンテンツ101の表層情報とコンテンツの全体にわたってほぼ一致している場合,判定(2)は判定対象コンテンツ102の表層情報が被参照コンテンツ101の表層情報と例えば前半部分がほぼ一致しているとか後半部分がほぼ一致している場合,判定(3)は表層情報がある程度の数またはある程度の長さの表層情報が一致した場合,判定(4)は判定(1)〜(3)のいずれにも該当しない場合を示す。そして判定(1)におけるほぼ一致の程度,判定(2)の部分一致の程度,判定(3)の一致数あるいは長さの閾値はあらかじめ適宜設定しておく。そして複数の表層情報が一致した場合には,その一致した表層情報の存在する順番が同一順序であることが再利用度の判定に対して必要である。
表示手段301は再利用判定手段210における判定結果を,例えば判定(1)〜(4)の如く表示するものであり,利用者はこれをみて判定対象コンテンツ102が被参照コンテンツ101に対する再利用状態を判定することができる。
第1図(A)の動作について説明する。判定対象コンテンツ102が被参照コンテンツ101を再利用したものか否かを判定する場合,再利用判定手段210が動作して先ず被参照コンテンツ101を読み取り,表層情報作成手段206がこれを解読してその表層情報を作成しこれを保持し,次に判定対象コンテンツ102を読み取りこれを解読してその表層情報を作成し,保持する。
それから表層情報ベース再利用判定エンジン201が動作して,被参照コンテンツ101の表層情報と判定対象コンテンツ102の表層情報とを順次比較する。そしてその一致したものを順次判別する。一致した表層情報が存在するとき,複数一致すれば同じ順序で一致したのか,また判定対象コンテンツ102のどの位置で一致したのかを判定する。
そして表層情報ベース再利用判定エンジン201は,これに基づき,前記の判定(1)〜(4)の判定結果を出力し,表示手段301にこれを表示する。
利用者はこれをみて,判定対象コンテンツ102が被参照コンテンツ101を再利用したものであるかどうかを認識することができる。
第2図(A),(B)は,二つのコンテンツの間で一致する文字列,キーワードの説明図である。50はコンテンツA,51はコンテンツBである。コンテンツAの文字列とコンテンツBの文字列のうち文字列1,文字列2,文字列3,文字列4が一致したことを表している。例えば,一致文字列1が2回現れた場合には,一致文字列1に対応付けて,文字列長,出現位置1,出現位置2,出現回数2のように一致文字列管理情報をつけて保持する。
第2図(C)は一致文字列情報であって,例えば,一致した文字列とその長さ,出現位置,出現回数を対応付けてもつものである。同じ一致文字列が生成された場合には,一致文字列とそれに対応付けて出現毎の位置(出現位置1,出現位置2等)および出現回数を保持する。出現位置は,例えば,コンテンツの先頭文字からの文字数等であらわす。
第2図(D)はキーワード情報であって,キーワードでコンテンツの再利用を判定する場合のものであり,キーワードとその出現位置を対応付けてもつものである。同じキーワードが複数回出願する場合には,そのキーワードとその出現毎の位置,および出現回数を保持する。
第3図は本発明のコンテンツ再利用管理装置のシステム構成図である。第3図において,11はCPUである。12はメモリである。13は表示装置である。14はプリンタである。15は記憶装置であって,コンテンツを保持するものである。20は記憶装置であって,本発明を実施するための各種プログラムを保持するものである。17はキーワード辞書である。18はメタ情報辞書であって,会社組織の部署,プロジェクト,部署の所属メンバーの氏名等のメタ情報を保持するものである。
記憶装置15において,420はコンテンツデータベースである。21はコンテンツである。103はメタデータであってコンテンツの作成日,作成者等のコンテンツに関するデータである。106はコンテンツデータベースである。記憶装置20において,206は表層情報作成手段であって,コンテンツの文字列を生成するものである。204は判定補助手段であって,メタ情報辞書を使用してコンテンツの再利用を判定するものである。再利用判定手段23はコンテンツの再利用の有無を判定するものである。
再利用判定手段23において,210は再利用判定手段Aであって,表層情報によりコンテンツ再利用を判定する表層情報ベース再利用手段である。220は再利用判定手段Bであって,キーワード辞書を使用して再利用判定をする辞書ベース再利用判定手段である。
第4図は,本発明の再利用判定手段の構成を示す。210は再利用判定手段A(第1図の再利用判定手段210に同じ)であって,表層情報ベース再利用判定手段である。201は表層情報ベース再利用判定エンジンである。
再利用判定手段210において,31はコンテンツ入力部であって,コンテンツを入力するものである。32は文字列解析部であって,コンテンツの文字列を解析するものである。33はコンテンツ保持部であって,入力されたコンテンツを保持するものである。37は生成文字列保持部であって,生成された文字列を保持するものである。
表層情報ベース再利用判定エンジン201において,61は一致判定部であって,コンテンツAとコンテンツBの文字列の一致判定を行なうものである。一致文字列は,一致文字列長,コンテンツAおよびコンテンツBでの一致文字列の位置,出現回数を一致文字列情報として保持する。42は一致文字列保持部であって,一致文字列を保持するものである。43は一致文字列数保持部である。44は再利用判定しきい値保持部であって,再利用判定のためのしきい値を保持するものであって,一致判定のための一致文字しきい値,文字列の出現順序一致のしきい等を保持するものである。45は再利用判定部であって,一致文字列数とそのしき値,一致文字列の出現順序の一致数とそのしきい値等により再利用関係の程度を判定するものである。70は判定結果保持部であって,コンテンツの再利用関係の有無,再利用の程度等をコンテンツ毎に保持するものである。
第5図は本発明の第1の実施の形態の一致文字列生成のフローチャートである。一致文字列生成の一例を示すものであり,他の方法でも本発明は実現できる。
コンテンツAの文字列を生成し,保持する(S1,S2)。コンテンツBの文字列を生成し,保持する(S3,S4)。コンテンツAの文字列とコンテンツBの文字列を比較する(S5,S6)。一致していなければ,直前に一致した一致文字列について,その文字列長,出現位置,出現回数,インデックスを付けて保持する(S7,S8)。全て終了しているか判定し(S10),全て判定していれば,処理を終了し,判定していなければ,次の文字列生成のための処理をし(S11),S1以降の処理を繰り返す。S6で文字列の一致がなければ,全ての文字列について判定したか判定し(S10),全て終了していれば処理を終了し,全て終了していなければ次の文字列生成の処理をし(S11),S1以降の処理を繰り返す。
第6図は本発明の第1の実施の形態の再利用の有無の判定のフローチャートである。再利用の有無の判定は,例えば,一致文字列の文字数のコンテンツの総文字数に対する割合により判定する。さらにその割合いが一定の程度以上でない場合には,出現順の一致する文字列数を判定し,出現する順番が一致する文字列の割り合いに応じて,利用関係の有無の程度を判定する。
一致する文字列の長さのしきい値をLとする(S1)。一致する文字列の長さがL以上の文字列を求める(S2)。一致する文字列のコンテンツ全体に占める程度,および一致文字列の出現順序の一致する程度を求める(S3)。一致文字列の総文字数のコンテンツの総文字数に対する割合を求め,しきい値と比較する(S4,S5)。一致する文字列の文字数の割合がK以上であればコンテンツAとコンテンツBで再利用関係があるとする。一致する文字列の文字数の割合がK以上でなければ,文字列の出現順序の一致する程度をコンテンツAとコンテンツBで比較する(S6,S7)。一致文字列の出現位置および出現回数から,一致文字列の出現順序の一致数,もしくは割合を求め,その値がしきい値P以上であれば再利用関係があるとする(S9)。出現順序の一致する割合がしきい値P以下であれば再利用関係が無しとする(S8)。判定結果を保持する(S10)。
第7図は本発明の第1の実施の形態の再利用判定の例であって,一致文字列数のしきい値を25文字とし,コンテンツAとコンテンツBの双方での一致文字列数の割合(一致文字列の文字数の合計のコンテンツ全体の文字数に対する割合)が9割以上の場合に全面利用有りと判定し,コンテンツAとコンテンツBの少なくとも一方が9割以上であれば部分的再利用有りと判定するようにしたものである(第7図ではコンテンツを文書として説明している)。さらに,双方の一致文字列数の総計の割合が9割以下の場合には,一致文字列の出現順序を判定し,文字列の出現順序が一致していれば部分的再利用関係有りと判定する。出現順序が一致していなければ一方が他方を参考程度に利用したと判定する。25文字以上で一致する文字列がなければ,再利用無しと判定するようにしたものである。
一致文字列の長さが25文字以上か判定する(S1)。25文字以上で一致していなければ再利用無しと判定する(S9)。コンテンツA(第7図では文書A)において,25文字以上で一致する文字列の一致文字列合計長が9割以上であれば(S2),コンテンツB(第7図では文書B)での一致文字列合計長の割合を判定する(S3)。さらに,コンテンツBにおいて9割以上一致していれば,コンテンツAとコンテンツBとの間で全面的再利用関係があると判定する(S6)。コンテンツBでの割合が9割以下であれば,コンテンツAとコンテンツBの間の再利用関係は部分的再利用であると判定する(S7)。
S2でコンテンツAの一致文字列合計長が9割以下であれば,コンテンツBにおいて一致文字列合計長が9割以上あるか判定する(S4)。文字列長の合計の割合が9割以上であればコンテンツAとコンテンツBとの再利用関係は部分的再利用であるとする(S7)。S4で文字列長の合計の割合が9割以上でなければ,一致文字列が正しい出現順序か判定する(文字列の出現順序の一致判定)をする(S5)。一致文字列の出現順序が正しければ(一致していれば),コンテンツAとコンテンツBは部分的再利用の関係にあると判定する(S7)。一致文字列の出現順序が正しくなければ(一致していなければ),コンテンツAとコンテンツBとの再利用関係は参考程度であると判定する(S8)。
第8図は本発明の第2の実施の形態を第8図に基づき説明する。第8図において第1図と同符号は同一部を示し,2はコンテンツ再利用管理装置,202は辞書ベース再利用判定エンジン,203はキーワード辞書,220は再利用判定手段である。
コンテンツ再利用管理装置2は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものか否かをキーワード辞書203に格納されたキーワードや文字列等の辞書データベースに基づき判定を行うものである。
辞書ベース再利用判定エンジン202は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものか否かを,キーワード辞書203に格納されたキーワード情報,文字列,シソーラス等の辞書情報を使用して判定するものであり,CPUにより格納される。
キーワード辞書203は,被参照コンテンツ101中に記載されているキーワード情報や文字列情報,シソーラス等の辞書情報を格納したものであり,そのキーワードや文字列の記載位置例えばページ数等も記入されている。
再利用判定手段220は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものであるか否かをキーワード情報や文字列情報を使用して判定するものであり,第1図に示す再利用判定手段210と同様に,判定(1)〜(4)のように再利用の程度の判定を行うものである。複数の一致した辞書情報が存在するとき,その順序が一致することも再利用判定の重要な根拠となる。
第8図の動作について説明する。まずキーワード辞書203に,被参照コンテンツ101中に存在するキーワード情報や文字列情報を,その存在位置とともに格納する。
次に辞書ベース再利用判定エンジン202は判定対象コンテンツ102を読み取り,キーワード辞書203に格納されたキーワードや文字列等の存在を検出する。そしてそのキーワードや文字列等の出現順序の一致も含めた検出状態に基づき前記判定(1)〜(4)の如き判定を行い,表示手段301に出力し,利用者に判定結果を表示する。
被参照コンテンツ101において,その被参照コンテンツ101においてのみ記載されているような特殊なキーワードが存在するとき,そのキーワードが判定対象コンテンツ102で検出されたとき,これに基づき判定対象コンテンツ102がこの特殊キーワードの存在する被参照コンテンツ101を再利用したものと判定することも可能である。
第9図は本発明の第2の実施の形態の再利用判定手段の構成を示す。第9図において,220は再利用判定手段Bであって,キーワードによりコンテンツの再利用の有無を判定するものである。33はコンテンツ保持部であって,コンテンツを保持するものである。55はキーワード生成部であって,キーワード辞書203を参照して,コンテンツのキーワードを生成するものである。56は文字列生成手段であって,コンテンツの文字列を生成するものである。57はキーワード生成手段であって,生成された文字列をもとにキーワード辞書を参照し,キーワードを生成するものである。58’はシソーラス生成手段であって,生成したキーワードをもとにそのシソーラスを生成するものである。59はシソーラス辞書である。シソーラスは必要に応じて生成するものである。
58はキーワード保持部であって,生成されたコンテンツのキーワード,およびキーワードに対するシソーラスを保持するものである。
202は辞書ベース再利用判定エンジンである。60はキーワード入力部である。61は一致判定部であって,コンテンツAのキーワードとコンテンツBのキーワードの一致判定をするものである。62は一致キーワード保持部であって,コンテンツAとコンテンツBとで一致するキーワードの出現位置,出現順序を保持するものである。44は再利用判定しきい値保持部であって,再利用の有無,利用の程度を判定するためのしきい値を保持するものである。65は再利用判定部であって,キーワードの一致数,出現順序をもとにコンテンツAとコンテンツBの再利用の有無を判定するものである。
70は判定結果保持部であって,一致キーワード,キーワードのコンテンツでの位置,出現順序を保持するものである。また,判定結果保持部70は,再利用の有無,再利用の程度等の判定結果を保持する。
第10図は本発明の第2の実施の形態の再利用判定のフローチャートであって,再利用判定手段Bの実施の形態のフローチャートである。コンテンツAを入力する(S1)。文字列を生成し,キーワード辞書を参照してキーワード作成し,保持する(S2)。キーワードについてシソーラス辞書を参照し,シソーラスを生成し,保持する(S3)。コンテンツBを入力し,文字列の生成,シソーラスの生成をし,保持する(S4,S5)。コンテンツAとコンテンツBとで一致するキーワードを求める。さらに一致したキーワードの出現数,出現率,出現順序の一致の程度を求める(S6)。一致キーワードの出現率をしきい値と比較し,コンテンツ全体に対する一致の程度を判定する(S7,S8)。一致するキーワードの割合が一定値以上であればコンテンツAとコンテンツBとで再利用関係有りと判定する(S10)。一定値以上でなければ,一致するキーワードの出現順序の一致の程度を判定する(S9,S11)。出現順序の一致するキーワードの割合が一定値以上であれば再利用関係有りと判定する(S10,S11)。一定値以下であれば再利用関係無しと判定する(S11,S12)。判定結果を保持する(S13)。
第11図は,本発明の特殊キーワードによる再利用判定のフローチャートであって,コンテンツAとコンテンツBとに,他のコンテンツでは使用されない特殊キーワードが存在すれば,コンテンツAとコンテンツBとで再利用関係があると判定する場合のフローチャートである。
コンテンツAとコンテンツBについて,一致文字列,一致キーワードにより再利用関係を判定する(S1)。S1で再利用関係の有無が確定できない場合,もしくは再利用関係無しと判定された場合,一致キーワードに特殊キーワードが含まれているか判定する(S2,S3)。一致キーワードに特殊キーワードがあれば再利用関係有りとする(S4)。特殊キーワードがなければ再利用関係無しとする(S5)。判定結果を保持する(S6)。
なお,上記において,特殊キーワードにより再利用関係の有無を判定したが,コンテンツに特定の情報を表すようにスペースを挿入しておき,スペースの出現順序を解析することにより再利用関係を判定するようにしてもよい。例えば,1スペースと連続する2スペースを挿入する。1スペースは0,2スペースは1を表すものとして,1スペースと2スペースの挿入順序を2ビットの情報で特定の意味をもつようにしておく。コンテンツAとコンテンツBに含まれるスペースを解析し,スペースにより得られる2ビットの情報が一致した場合には再利用関係有り,一致しなければ再利用関係無しとするようにしても良い。
本発明の第3の実施の形態を第12図に基づき説明する。第12図において第1図,第8図と同符号は同一部を示し,3はコンテンツ再利用管理装置,103,103′はメタデータ,204は判定補助手段,205はメタ情報辞書,230は再利用判定手段である。
コンテンツ再利用管理装置3は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものか否かを,コンテンツの作成者,コンテンツの修正者,コンテンツの作成日等のメタデータと,前記表層情報またはキーワード情報に基づき判定を行うものである。
判定補助手段204は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものか否かの判定を行うときの判定補助情報を再利用判定手段230に提供するものであり,例えば被参照コンテンツ101の作者がA,判定対象コンテンツ102の作者がBである場合,作者A,Bの関係,例えば同じ部署であるとか,同じプロジェクトであるとか等の情報をメタ情報辞書205より抽出して提供するものである。
メタ情報辞書205は,被参照コンテンツ101や判定対象コンテンツ102のメタデータに対する関連情報があらかじめ格納されるものであって,各作者の関連情報,例えば作者の今迄の所属部署,所属プロジェクト,友人関係等が記入されている。再利用判定手段230は,判定対象コンテンツ102が被参照コンテンツ101を再利用して作成されたものであるか否かを判定するものであり,第1図に示す再利用判定手段210または第8図に示す再利用判定手段220により構成されている。したがって再利用判定手段230が第1図に示す再利用判定手段210により構成される場合は表層情報ベース再利用判定エンジン201及び表層情報作成手段206を具備しており,また第8図に示す再利用判定手段220により構成される場合は辞書ベース再利用判定エンジン202及びキーワード辞書203を具備している。
第12図の動作について,再利用判定手段230が,第8図に示す再利用判定手段220により構成される場合について説明する。
あらかじめ被参照コンテンツ101中に記載されているキーワードや文字列等の辞書情報をキーワード辞書に格納する。再利用判定手段230はメタデータ103,103′の作成日を読み取り,判定対象コンテンツ102の作成日が被参照コンテンツ101の作成日より以前の場合には,再利用されたものでないと判定し,前記判定(4)の判定を表示手段301に表示させる。
しかし,前記第8図の動作説明の如く,キーワードや文字列に基づき前記判定(3)の如き判定に相当する場合,再利用判定手段230は,判定補助手段204に対し,被参照コンテンツ101の作者Aと,判定対象コンテンツ102の作者Bとの関係をメタ情報辞書205により検索する。
この結果作者AとBとが同一プロジェクトに所属していた等の,作者Aの作成コンテンツを作者Bが認識できる可能性が非常に高い関係にあるとか,作者Aと作者Bとは社内で同一部署や同一プロジェクトに所属したことがなく作者Aの作成コンテンツを作者Bが認識できる可能性が全くない関係である等の関係情報が再利用判定手段230に判定補助手段204から通知される。
これにより再利用判定手段230は,例えば前記判定(1),(2)に相当する場合か否かはっきり判定ができないような場合に,前記認識できる可能性の高いときは前記判定(3)に,可能性がない場合は判定(4)に,すなわち,前記判定(1),(2),(3)または(4)のいずれかに明確に判定することができる。
再利用判定手段230が,前記第1図に示す再利用判定手段210により構成される場合においても,同様にして明確な判定が可能となる。
上記の説明では,再利用関係が確定できない場合にメタ情報を使用して,再利用関係を判定するようにしたが,メタ情報を利用して,予め再利用の有無の可能性を判定し,メタ情報により再利用の可能性があるとされた場合に,キーワード,文字列の一致により再利用関係を判定するようにしても良い。以下はこのような方法による場合を説明する。
第13図は本発明の第3の実施の形態の再利用判定手段の構成である。第13図の構成は,メタ情報を利用して,あらかじめ再利用関係の有無を判定するコンテンツを限定し,限定したコンテンツにおいて,前述の文字列解析,キーワードを使用してコンテンツの再利用を判定するようにしたものである(このコンテンツを限定する操作を,以下絞り込みと称する)。さらに,メタデータを使用して,再利用関係のあるコンテンツに対して,他方に再利用されたコンテンツであるか他方を再利用したコンテンツであるかを判定するようにしたものである。
第13図において,103はメタデータであって,コンテンツ作成日,コンテンツ作成者,コンテンツ利用者等のメタデータである。205はメタ情報辞書であって,コンテンツデータベース利用メンバの所属部署,登録メンバの所属部署における役職,プロジェクト名とその構成員の氏名,所属等を保持するものである。204は判定補助手段であって,メタ情報を使用して再利用関係を判定するものである。88は利用可能性判定部であって,例えば,コンテンツ作成者の所属部署等のメタ情報を利用して,コンテンツ再利用の可能性を判定するものである。76は一次判定結果保持部であって,メタ情報を利用して再利用の有無を判定した結果を保持するものである。
33はコンテンツ保持部である。230は再利用判定手段であって,再利用関係を判定するコンテンツを入力するものである。34はコンテンツ選択部であって,一次判定の結果でコンテンツ再利用の可能性有りと判定されたコンテンツを選択するものである。210は再利用判定手段Aであって,表層文字情報によりコンテンツ再利用を判定するものである。220は再利用判定手段Bであって,キーワードによりコンテンツ再利用を判定するものである。82は二次判定結果保持部であって,再利用の有無の判定結果を保持するものである。83はメタデータ利用判定部であって,再利用判定手段Aおよび再利用判定手段Bにより再利用があると判定されたコンテンツについてその作成日を比較することにより,再利用された側のコンテンツと再利用した側のコンテンツの判定をするものである。84’はメタデータ入力部であって,コンテンツ作成日を入力するものである。85はメタデータ保持部である。86はメタデータ比較部であって,作成日の前後関係を判定するものである。87は三次判定結果保持部であって,メタデータ比較部86の比較結果を保持するものである。
コンテンツの絞り込みのためのメタ情報としてコンテンツ作成者の所属部署を使用する場合を例とし第13図の構成の動作を説明する。コンテンツ保持部33に再利用を判定するコンテンツを保持する。判定補助手段204は,判定対象のコンテンツの作成者をメタデータ103から選択する。利用可能性判定部88はメタ情報辞書205を参照して作成者の所属部署を求める。その結果,所属からそのコンテンツが再利用される可能性があるコンテンツであるか,再利用可能性のないコンテンツであるかを判定する。被参照コンテンツおよび判定対象コンテンツの所属が同じでない場合には,コンテンツ再利用の関係は生じないものとして,以後の再利用関係の判定は行なわない。複数コンテンツを被参照コンテンツとする場合には,このように判定補助手段204により再利用の可能性があるコンテンツを絞り込み,その判定結果を一次判定結果保持部76に保持する。
コンテンツ選択手段34は,メタ情報を使用した一次判定の結果から再利用の可能性有りと判定されたコンテンツを選択して入力する。再利用判定手段A210は,文字列により表層情報ベース再利用エンジンによりコンテンツの再利用を判定する。また,再利用判定手段B220によりキーワードによりコンテンツの再利用を判定する。再利用判定手段Aと再利用判定手段Bの双方もしく一方の結果をもとにコンテンツの再利用の二次判定結果を求め,二次判定結果保持手段82に保持する。再利用判定手段Aと再利用判定手段Bの両方の結果が再利用有りと判定した場合に,判定結果を再利用有りとするか,あるいはいずれか一方が再利用有りとした場合に,二次判定結果を再利用有りとするか等のようにそれぞれの判定結果をどのように使用するかは必要に応じて選択する。二次判定結果は判定結果保持部70に保持する。
二次判定結果のうち,再利用有りと判定されたコンテンツについて,再利用された側のコンテンツか,再利用した側のコンテンツであるかを,メタデータを使用して判定する。二次判定の結果で再利用有りと判定されたコンテンツの作成日がメタデータ入力部84’によりメタデータ103から選択されて,メタデータ利用判定部83に入力される。メタデータ比較部86は比較対象のコンテンツ(コンテンツAとコンテンツB)の作成日を比較する。作成日が前のコンテンツは再利用された側のコンテンツであり,作成日が後のコンテンツは再利用した側のコンテンツであることを判定する。この三次判定結果はコンテンツに対応つけて三次判定結果保持部87に保持する。
第14図は本発明の第3の実施の形態の再利用判定のフローチャートを示す図である。コンテンツAとコンテンツBを入力し(S1),コンテンツの作成者の所属部署を判定する(S2,S3)。作成者の所属部署が再利用関係(一方が他方に再利用されるもしくは一方が他方を再利用した関係)の可能性のある部署か判定する(S3)。再利用可能性のない部署であれば,再利用の可能性無しとし(S13),処理を終了する。作成者の所属が再利用関係の可能性のある部署であれば,再利用関係の可能性有りとして一次判定結果保持部に保持する(S4)。一次判定結果で再利用関係の可能性有りとされたコンテンツAとコンテンツBの再利用関係の有無を文字列,キーワードとの比較で判定する(S5)。判定結果を二次判定結果として保持する(S6)。次に,二次判定結果で再利用関係が有りと判定されたものであるか判定し(S7,S8),全面的再利用関係もしくは部分的再利用関係がある場合(前記判定(3)の参考程度の再利用関係も含む)には,メタデータを利用してコンテンツAとコンテンツBの作成日の前後の関係を判定する(S9)。作成日の前後関係を判定し,作成日が前のコンテンツは再利用されたコンテンツであると判定し,作成日が後のコンテンツは再利用したコンテンツであると確定する(三次判定結果)(S10)。S8で二次判定結果が再利用無しと判定されたコンテンツはメタデータでの判定を行なうことなく再利用関係無しとし(S12),処理を終了する。
なお,上記において,コンテンツの絞り込みに,コンテンツ作成者の所属部署により再利用の可能性を判定するようにしたが,コンテンツを絞り込むためのメタ情報は,他のメタ情報でも良い。あるいは,コンテンツのジャンル(科学技術論文,特許明細書等)等をファイル名に対応付けてメタ情報としてもつようにし,同一ジャンルのものは再利用可能性があるが,異種のジャンルのものは再利用の可能性がないとする等でも良い。
本発明の第4の実施の形態を第15図に基づき説明する。第15図において他図と同符号は同一部を示し,4はコンテンツ再利用管理装置,104は被参照コンテンツ群である。
再利用管理装置4は,判定対象コンテンツ102が被参照コンテンツ群104に格納されている複数の被参照コンテンツのいずれかを再利用して作成されたものか否かを判定するものである。
被参照コンテンツ群104は,再利用されて他のコンテンツが作成されたか否か判定される複数の被参照コンテンツ群であり,例えばサーバにより構成される。
第15図の動作について,再利用判定手段230が,第8図に示す再利用判定手段220により構成される場合について説明する。
あらかじめ,データベースに格納されている被参照コンテンツ群104に格納されているキーワードや文字列等をその被参照コンテンツデータとともにキーワード辞書に格納する。
再利用判定手段230は,判定対象コンテンツ102を読み取り,キーワード辞書に格納された第1の被参照コンテンツのキーワードや文字列等の存在を検出し,前記判定(1)〜(4)の判定を行い,次に第2の被参照コンテンツのキーワードや文字列等の存在を検出し,前記判定(1)〜(4)の判定を行う。このようにしてキーワード辞書に格納された,全被参照コンテンツのキーワードや文字列との照合が行われ,その判定結果を順次表示手段301に表示することができる。
このようにして複数の被参照コンテンツ群のコンテンツに対する再利用判定を効率よく行うことができる。
第16図は,本発明の第4の実施の形態の再利用判定手段の構成である。キーワード保持部58は,キーワード入力部60により複数コンテンツのキーワードを入力し,コンテンツ毎に保持する。一致文字列入力部68は被参照コンテンツと判定対象コンテンツの一致文字列を入力する。一致文字列はコンテンツ毎に保持する。
再利用判定手段Aは一致文字列に基づき,前述の判定方法によりコンテンツの再利用の有無を判定する。再利用判定手段Bはコンテンツの再利用の有無を判定する。それぞれの結果はコンテンツ毎に判定結果保持部70に保持される。本実施の形態によれば,複数の被参照コンテンツに対して判定対象コンテンツの再利用関係の有無を効率的に判定することができる。また,再利用判定手段Aもしくは再利用判定手段Bで判定したもの全て,もしくは一部について,必要に応じてさらに他方の再利用判定手段で判定することにより再利用の有無を確実に判定することができる。
第17図は,本発明の第4の実施の形態の再利用判定手段のフローャートである。被参考コンテンツ(コンテンツi)と判定対象コンテンツのキーワードもしくは一致文字列を入力する(S1)。判定対象コンテンツと被参照コンテンツとの一致文字列があらかじめ生成されている場合には,作成されているものを使用できる。コンテンツiと判定対象コンテンツのキーワードもしくは一致文字列情報の一致の程度に応じて再利用関係を判定する。一致文字列が生成されていないコンテンツの場合には,再利用判定手段Aにより一致文字列を生成し,一致文字列の一致の程度によりコンテンツiと判定対象コンテンツとの間の再利用の有無を判定する。また,キーワードの生成されていないコンテンツの場合には,再利用判定手段Bによりキーワードを生成し,コンテンツiと判定対象コンテンツとの間の再利用判定をする(S2)。再利用を判定した再利用の有無の判定結果を保持する(S3)。全てのコンテンツについて判定したか判断し,全てのコンテンツについて判定されていなければ,次のコンテンツについてS1以降の処理を繰り返す(S5)。全てのコンテンツについて判定したら処理を終了する。
本発明の第5の実施の形態を第18図に基づき説明する。第18図において他図と同符号は同一部を示し,5はコンテンツ再利用管理装置,105はメタデータ付被参照コンテンツ群。
コンテンツ再利用管理装置5は,判定対象コンテンツ102がメタデータ付被参照コンテンツ群105に格納されている複数の被参照コンテンツのいずれかを再利用して作成されたものか否かを判定するものである。
メタデータ付被参照コンテンツ群105は,再利用されて他のコンテンツが作成されたか否か判定される複数の被参照コンテンツがそれぞれのメタデータとともにデータベースに格納されているものであり,例えばサーバに保持されるものである。
第18図の動作について,再利用判定手段230が,第8図に示す再利用判定手段220により構成される場合について説明する。
あらかじめメタデータ付被参照コンテンツ群105に格納されている複数の被参照コンテンツに関するキーワードや文字列等の辞書情報をキーワード辞書に格納する。
再利用判定手段230は,メタデータ付被参照コンテンツ群に格納された第1の被参照コンテンツのメタデータと,判定対象コンテンツ102のメタデータ103′を読み取り,判定対象コンテンツ102の作成日が第1の被参照コンテンツの作成日より以前の場合には,再利用されたものでないと判定し,前記判定(4)の判定を表示手段301に表示させる。
しかし,前記第8図の動作説明の如く,キーワードや文字列にもとづく判定では前記判定(3)の如き判定に相当する場合,再利用判定手段230は,判定補助手段204に対し,第1の被参照コンテンツの作者と判定対象コンテンツ102の作者との関係をメタ情報辞書205より検索させる。
この結果前記第12図について説明の如く,判定対象コンテンツの作者が第1の被参照コンテンツの内容を認識できる状態にあったか否かを再利用判定手段230が判定し,前記判定(1),(2)または(4)のいずれかに明確に判定することができる。
このようなことをメタデータ付被参照コンテンツデータベースに格納された各被参照コンテンツについて順次行われ,その判定結果が順次表示手段301に表示することができる。
このようにして,メタデータを使用して,複数の被参照コンテンツに対する再利用判定を効率よく行うことができる。なお,上記において,文字列もくしはキーワードによるコンテンツ再利用の判定の後にメタ情報を使用して,再利用関係を確認するように説明したが,メタ情報を使用して予め,再利用関係の可能性の高いコンテンツのみにコンテンツを絞り込み,その後にキーワード,文字列での再利用の判定をするようにしても良い。以下の説明はこのような方法による場合を説明するものである。
第19図は本発明の第5の実施の形態の再利用判定手段の構成である。第19図は,複数のコンテンツについて再利用関係を判定する場合に,キーワードもしくは一致文字列により判定する前に,コンテンツ作成者の所属部署を判定し,作成者の所属部署がコンテンツ再利用関係を生じる可能性のある部署であるものについてのみ,キーワードおよび一致文字列でのコンテンツ再利用関係の有無を判定するようにしたものである。
第19図において,230は再利用判定手段である。46は一致文字列情報保持部であって,判定対象コンテンツと一致する被参考コンテンツの一致文字列情報を保持するものである。
601はメタ情報入力部であって,コンテンツ作成者の所属部署の情報等のメタ情報を入力するものである。204は判定補助手段であって,メタ情報に基づいてコンテンツの再利用の可能性の有無を判定するものである。例えば,コンテンツ作成者の所属部署が同じコンテンツは再利用の可能性が高いので,作成者の所属部署が同一のコンテンツのみ,キーワードもしくは一致文字列で判定するようにするためにコンテンツを絞るものである。76は一次判定結果保持部であって,メタ情報を使用して得られた再利用関係の有無の可能性についての判定結果を保持するものである。
60はキーワード入力部であって,予めキーワードが生成されているコンテンツの場合に,コンテンツのキーワードを入力するものである。68は一致文字列入力部であって,一致文字列を入力するものであり,判定対象コンテンツに対して一致文字列があらかじめ生成されているコンテンツの場合に,一致文字列を入力するものである。58はキーワード保持部であって,コンテンツのキーワードを保持するものである。
220は再利用判定手段Bである。210は再利用判定手段Aである。82は二次判定結果保持部であって,再利用判定手段Aおよび再利用判定手段Bの判定結果を保持するものである。84はコンテンツ選択部であって,二次判定結果のうち再利用関係があると判定されたコンテンツを選択するものである。
602はメタデータ入力部であって,コンテンツ作成日を入力するものである。83はメタデータ利用判定部であって,再利用関係有りと判定されたコンテンツについてコンテンツ作成日を比較し,作成日が前のコンテンツは他方に再利用されたものであり,作成日が後のコンテンツは他方を再利用したものであることを判定するものである。87は三次判定結果保持である。70は判定結果保持部であって,再利用判定結果を保持するものである。
第19図の構成において,再利用判定手段Aと再利用判定手段Bの双方の結果に基づいて再利用の有無を判定する,あるいは一方の判定結果の優先度を高くし,一方で判定が明確に判定できない程度の場合に他方の結果を参照する等,いろいろな使用方法が選択できる。
第20図(A),(B)はそれぞれ本発明の第5の実施の形態のフローチャート(1)および(2)である。第20図(A)はメタ情報を利用してコンテンツ再利用関係の有無を判定する処理のフローチャートである。例えば,コンテンツの作成者の所属部署が同じ,あるいは似たような業務を行なう部署であれば,そのようなコンテンツは互いに再利用される可能性があるとし,作成者の業務の異なる所属部署どうしは再利用関係を生じることがないとして,所属部署を特定して再利用関係のあるコンテンツを絞り込む場合のフローチャートである。 コンテンツiを入力する(S1)。コンテンツiの作成者の所属部署を判定する(S2,S3)。所属部署が再利用を生じる可能性のある部署であれば再利用可能性有りとして一次判定結果保持部に判定結果を保持する(S4)。例えば,判定対象のコンテンツに対して再利用可能性のある部署を予めきめておいて,被判定対象コンテンツの作成者がその部署に所属するものであるかないかを判定する。S6で全てのコンテンツについてメタ情報を使用しての再利用の可能性を判定し,全て終了していなければS7で次のコンテンツを選択し,S1以降の処理を繰り返す。S6の判定で全てのコンテンツについて処理したことを判定したら処理を終了する。S3でコンテンツiの作成者の所属が再利用のある可能性のない部署であれば,再利用の可能性無しとして(S5),S6でコンテンツの所属判定を全て終了したか判定し,全て終了していなければ,S7で次のコンテンツを選択し,S1以降の処理を繰り返す。S6の判定で全てのコンテンツについて処理したことを判定したら処理を終了する。
第20図(B)は,一次判定結果で再利用の可能性有りとされた複数コンテンツについて,前述のキーワードと一致文字列の程度によりコンテンツの再利用を判定するフローチャートである。
一次判定結果で再利用関係の可能性があるとされたコンテンツi,jを入力する(S1)。キーワード,一致文字列により再利用の有無を判定する(S2,S3)。このとき,キーワードおよび判定対象コンテンツ間での一致文字列がすでに作成されているコンテンツについてはそのキーワード,一致文字列を使用する。キーワード,一致文字列が生成されていないコンテンツについては,キーワード生成,一致文字列を生成し,前述の方法に従って再利用の有無を判定する。再利用有り,または再利用無しの判定結果を,二次判定結果保持部に保持する(S4,S5,S6)。全てのコンテンツについて判定したか判断し(S7),全て終了していなければ,コンテンツjを変更するか判断し,変更するのであれば次のコンテンツjを選択し(S9,S10),S11で次のコンテンツiを選択する。コンテンツjを変更しないのであれば,コンテンツjを変更しないで次のコンテンツiを選択する(S11)。S1以降の処理を繰り返し,S7で必要とする全てのコンテンツについて判断したら処理を終了する。
第21図は本発明の第5の実施の形態のフローチャート(3)である。第21図は,キーワードもしくは一致文字列解析に基づき再利用関係有りと判定されたコンテンツに対して,メタデータを参照して再利用されたコンテンツと再利用したコンテンツを判定するものである。
メタデータを参照して再利用関係の詳細判定処理を開始する(S1)。二次判定結果が再利用有りのコンテンツi,jを選択する(S2)。コンテンツiの作成日をDi,コンテンツjの作成日をDjとする(S3)。DiとDjの大小を判定し,作成日の前後関係を判定する(S4)。DiがDjの前でなければ,コンテンツiはコンテンツjを再利用していると判定する(S5)。DiがDjの前であれば,コンテンツjはコンテンツiを再利用していると判定する(S6)。詳細再利用関係を三次結果領域に保持する(S7)。必要なコンテンツについて全て判定したか判断し(S8),全て終了していなければ,コンテンツjを変更するか判定し,コンテンツjを変更するのであればS10で次のコンテンツjをする。S11で次のコンテンツiを選択し,S2以降の処理を繰り返す。
なお,上記において,コンテンツの絞り込みをコンテンツ作成者の所属部署で判定することで説明したが,コンテンツの絞り込みは他のメタ情報(例えば,コンテンツの分野等)を使用することもできる。
本発明の第6の実施の形態を第22図に基づき説明する。第22図において他図と同符号は同一部を示し,6はコンテンツ再利用管理装置,106はデータベース管理装置である。データベース管理装置106は一般的なデータベースにおいて,コンテンツを管理しているものである。
コンテンツ再利用管理装置6は,判定対象コンテンツ102がデータベース管理装置106に保管されているコンテンツを再利用して作成されたものか否かを判定するものである。
データベース管理装置106は,会社の各部署に存在するグループウェアなどのコンテンツ管理システム内に保管されているコンテンツを,その中のディレクトリ情報,作者,作成年月日などのメタデータとともに格納されたものであり,例えばサーバで構成されている。
キーワード辞書203には,キーワード,文字列などの一般的な辞書情報や部署内独自のシソーラス等が予め格納されている。
第22図の動作については,前記のものと同様であり説明は省略するが,再利用判定結果をメタ情報辞書205に格納してゆくことにより部署内のコンテンツ再利用履歴を次第に明らかにすることができ,再利用の観点からのコンテンツの整理が可能となる。
例えばコンテンツA,B,CがありコンテンツBがAと再利用したものであることが判定されてこれをメタ情報辞書205に格納してあるとき,コンテンツCがコンテンツBを再利用したことが判定されると,コンテンツCはコンテンツAも利用したものとなるので,コンテンツAの価値が高いことがわかり,このコンテンツAの再利用,重要性を認識できる。
このように本発明を利用することにより,社内に散在するコンテンツ群をその再利用の観点から関係を整理することが可能となる。そして本発明により再利用の観点から重要なコンテンツを抽出し,そのコンテンツをひな型とすることができる。部署の管理者は部署内のメンバーにこのひな型を利用して新規コンテンツを作成することを勧めるなどの施策をとることにより,各メンバーが一定品質以上のコンテンツを容易に作成することができる。
第23図は本発明の第6の実施の形態の動作説明図である。第23図において,106はデータベース管理装置である。コンテンツA,コンテンツB,コンテンツC,コンテンツDが存在する。再利用判定手段220を利用して,コンテンツBはコンテンツAを90%利用したものであることを判定する。コンテンツCはコンテンツBを60%利用したコンテンツであることを判定する。コンテンツDはコンテンツAを30%利用したコンテンツであることを判定する。メタ情報作成手段221はデータベース管理装置106に管理されているコンテンツについて,再利用関係を検索し,再利用関係をコンテンツ名ととともにメタ情報辞書205に保持する。再利用関係は作成者の所属部署の関係で密接な関係をもつので,メタ情報辞書に保持することが有効である。
上記のような本発明のコンテンツ再利用管理装置によれば,多量のコンテンツの中から,他のコンテンツを再利用したもの,もしくは他に再利用されたコンテンツを容易に判定することが可能になる。
次に,上記のようにして得られたコンテンツ再利用結果を利用してコンテンツの再利用を容易に行なうようにした本発明のコンテンツ再利用支援装置について説明する。
コンテンツとは,上記において説明したように,例えばシナリオ,テンプレート,一般文書(シナリオと異なる内容の文書),文例・図例等のコンピュータで処理できる情報を表すものである。あるいは,動画,音声等のマルチメディアデータを含むものでも良い。シナリオは,例えば特許文書のようにフォーマットがある程度定型化されている文書を表す。テンプレートは,例えば文書の様式の見出しのみを配列したものを表し,テンプレートに従って一定の様式の文書を作成できるものである。文書は,書式が不特定な一般的文書を表す。文例は,例えば,定型的な挨拶文,頻繁に引用される定型文のようなものである。図例は良く使用されるカットのようなものである。
従来のコンテンツ管理システムは作成されたコンテンツをディレクトリまたはライブラリに登録する。コンテンツを再利用する際にはキーワード検索や辞書を用いた検索を行うことによって必要なコンテンツを取り出し,コピー&ペーストするなどして再利用を行っていた。
本発明のコンテンツ再利用支援装置によれば,多くの業務コンテンツに対してその再利用が容易になり,多くのコンテンツが再利用されることにより低コストに質の揃ったコンテンツにすることができる。コンテンツの再利用を行いたいユーザは,本発明によってコピーすべきコンテンツの一部または全部の評価を得ることで質の高いコンテンツを選択することができ,それをもとに高品質のコンテンツを容易に作成することができる。
本発明のコンテンツ再利用支援装置は,データベースに備えられているコンテンツに評価を与える。与えられた評価に基づいてユーザはコンテンツを選択してコンテンツのドラフトを作成する。さらに,その過程を記録することによってコンテンツの評価を更新することを可能にする。そのようにして,評価が与えられたコンテンツとそれらの部分から構成されるコンテンツを管理することで,データベースに蓄積されるコンテンツの質を向上させることができる。
第24図は本発明のコンテンツ再利用支援装置のシステム構成を示す。第24図において,11はCPUである。12はメモリである。13は表示装置である。14はプリンタである。20は記憶装置であって,前記の本発明の再利用判定手段210等を保持するものである。25は記憶装置であって,コンテンツ再利用支援装置の各種手段としてのブログラムを格納する記憶装置である。26は記憶装置であって,コンテンツ再利用支援装置で使用するコンテンツデータベースを格納する記憶装置である。205はメタ情報辞書である。250は前記の本発明のコンテンツ再利用管理装置である。
記憶装置25において,500はコンテンツ推薦部であって,例えば,ユーザに利用頻度,利用程度の高いコンテンツ等について重要度の高いことをユーザが判断できるように推薦情報を作成する手段である。600はドラフト作成支援部であって,推薦情報に従って,ユーザがコンテンツを変更,編集する等の支援をする手段である。700はコンテンツ部品を切り出し支援部であって,ユーザが複数のコンテンツをもとにその共通部分を取り出す等の処理の支援をするものである。800はコンテンツ管理支援部であって,コンテンツの利用頻度等をもとにコンテンツ評価の修正もしくは,コンテンツの評価をもとにコンテンツを新たなコンテンツ部品に加工する,もしくは新たなコンテンツ部品を生成する等の処理の支援を行なうものである。
記憶装置26において,420はコンテンツデータベースであってコンテンツを保持するものである。
第25図は本発明のコンテンツ再利用支援装置の構成を示す。第25図において,400はコンテンツ再利用支援装置であり,コンテンツ管理装置410,ドラフト作成支援部600,コンテンツ部品切り出し部700,コンテンツ管理支援部800により構成されるものである。コンテンツ管理装置410はコンテンツデータベース420,コンテンツ推薦部500により構成されるものである。
コンテンツデータベース420は,コンテンツ管理部430とコンテンツ保持部440,修正点保持部445,共通点保持部470,推薦情報保持部460,コンテンツ境界情報保持部472により構成される。コンテンツ管理部430はコンテンツ毎にダウンロード回数,利用度,修正点保持部へのポインタ等のコンテンツ管理情報を保持するコンテンツ管理情報保持部431,コンテンツ間の差分を管理する修正点管理情報を保持する修正点管理情報保持部432,コンテンツ間の共通点を管理する共通点管理情報を保持する共通点管理情報保持部等を備えるものである。その他,推薦情報の管理情報,コンテンツ境界情報の管理情報等のその他の管理情報を保持するその他の管理情報保持部434を備えるものである。440はコンテンツ保持部であって,文書,シナリオ,テンプレート,文例/図例等の各種コンテンツを保持するものである。445は修正点保持部であって,コンテンツ間の修正点を保持するものである。470は共通点保持部であって,複数コンテンツの共通点を保持するものである。460は推薦情報保持部であって,推薦情報を保持するものである。
500はコンテンツ推薦部であって,コンテンツ推薦情報を生成するものである。コンテンツ推薦部500において,501は推薦情報生成部であって,コンテンツ利用回数,利用程度,前述のコンテンツ再利用管理装置の検索結果,参考コンテンツ表示用情報(後述する),派生コンテンツ表示用情報(後述する)を生成するものである。455はダウンロード情報管理部であって,コンテンツ保持部440に保持されているコンテンツ部品のダウンロード管理,ダウンロード回数のカウント,修正履歴の生成等をするものである。その管理情報はコンテンツ管理部に送られ,保持される。修正履歴のデータは修正点保持部445に保持される。250はコンテンツ再利用管理装置であって,前述の本発明のコンテンツ再利用管理装置ある。
第26図は,コンテンツデータベースの構成の詳細を例示したものである。430はコンテンツ管理部である。431はコンテンツ管理情報保持部であって,コンテンツ名,作成者,作成日,ダウンロード回数,派生コンテンツの場合にそのオリジナルコンテンツ名,利用度,利用者,キーワード情報,オリジナルコンテンツとの一致文字列情報,,コンテンツ保持部へのポインタ等を保持するものである。
432は修正点管理情報保持部であって,インデックス,差分をとったコンテンツAとコンテンツB,修正点保持部432へのポインタ等を保持するものである。433は共通点管理情報保持部であって,インデックス,共通点をとったコンテンツ名(コンテンツAとコンテンツB),共通点保持部430へのポインタ等を保持するものである。
440はコンテンツ保持部であって,コンテンツ名,コンテンツデータ,コンテンツ管理情報保持部へのポインタをもつものである。445は修正点保持部であって,インデックス,修正点のデータ,修正点管理情報保持部へのポインタをもつものである。ここに保持されている修正点はコンテンツ部品名を付けることでコンテンツ部品にすることができる。470は共通点保持部であって,インデックス,共通点データ,共通点管理情報保持部へのポインタをもつものである。共通点はコンテンツ部品名を付けることによりコンテンツ部品にすることができる。
460は推薦情報保持部であって,コンテンツ推薦情報521を保持するものである。コンテンツ推薦情報は,コンテンツの利用回数(ダウンロード回数),全面的に利用された,部分的に利用された等の利用程度(前述の本発明のコンテンツ再利用管理装置250によりコンテンツデータベースを検索することにより求めることができる),利用者情報,前述の本発明のコンテンツ再利用管理装置を検索して得たコンテンツの利用関係を表す検索結果,コンテンツ利用関係の系統等を保持するものである。
472はコンテンツ境界情報保持部であって,コンテンツが利用された場合に,その利用された箇所の前後の関係を表す情報を保持するものである。例えば,シナリオが特許文献である場合,オリジナル文献の実施の形態のみが変更された場合にその変更されなかった部分と変更した部分の境界を表す「課題を解決するための手段」・「発明の実施の形態」および「発明の実施の形態」・「発明の効果」等のように境界情報を保持するものである。
第27図はシナリオの例であり,特許出願明細書を例として示したものである。シナリオは様式が定型化されている文書である。610はシナリオの例である。
第28図はテンプレートの例であり,テンプレート611において,文書名,序等の見出しを表し,テンプレートは順番の決められた見出しのみをもつものであり,ユーザはその見出しに従って文章等を記入することにより,一定の様式を備えた文書等のコンテンツを作成するものである。
第29図は本発明のオリジナルコンテンツと派生関係の説明図である。第29図において,620はコンテンツ名A0のオリジナルコンテンツである。621はコンテンツ名A1のコンテンツであり,オリジナルコンテンツA0を修正したものである。コンテンツA1は,修正点情報としてオリジナルコンテンツA0との差分を管理する修正点情報A1を保持するものである。また修正点の修正程度を情報として保持するものである。例えば,オリジナルコンテンツの60%を修正した等の情報をもつものである。622はコンテンツA2であり,オリジナルコンテンツA0を修正したものである。623はコンテンツ名A11のコンテンツであり,オリジナルコンテンツA1を修正したものである。624はコンテンツ名A12であり,オリジナルコンテンツA11を修正したものである。
第30図は,コンテンツが文書である場合のコンテンツ再利用管理装置の検索結果と参考コンテンツ表示と派生コンテンツ表示の説明図である。250はコンテンツ再利用管理装置である。前述したように,例えばキーワード入力等により文献の再利用関係を検索するものである。251はコンテンツ再利用関係の検索結果を表す。第30図は文書1から文書5までの文書の利用関係を表している。文書2と文書3はを文書1を再利用したことを示す。さらに文書5と文書4は文書3を再利用したことを示す。
252は参考コンテンツ表示であって,表示装置に表示するものである。参考コンテンツ表示は検索結果のコンテンツ再利用関係251をもとに,ターゲット文書を指定し,その文書が利用した文書A,さらに文書Aが利用した文書等の利用関係を系統的に表示するものである。第30図の例の場合,文書5をターゲット文書として指定し,文書5が利用した文書3,文書3が利用した文書1を求め,その関係を表示装置に表示したものである。
派生コンテンツ表示253は,指定したターゲット文書から派生したコンテンツの利用関係を検索結果251から求め,系統的に表示するものである。第30図の例では,文書1を指定し,文書1が文書2と文書3に利用され,文書3が文書4と文書5に利用された場合を示し,その関係を派生コンテンツ表示として表示装置に表示したものである。
第31図は,本発明のコンテンツ管理装置の構成と動作説明図である。第31図において,420はコンテンツデータベースであり,430はコンテンツ管理部である。コンテンツ管理部430において,431はコンテンツ管理情報保持部,432は修正点管理情報保持部,433は共通点管理情報保持部,434は推薦情報管理情報保持部,435はコンテンツ境界情報管理情報保持部である。460は推薦情報保持部である。
440はコンテンツ保持部,445は修正点保持部,470は共通点保持部,472はコンテンツ境界情報保持部である。
コンテンツ推薦部500において,455はダウンロード情報管理部,551は推薦情報作成手段,553は参考コンテンツ表示情報作成手段である。250は前述の本発明のコンテンツ再利用管理装置である。210は再利用判定手段である。116は他のシステムであり,データベースを利用するシステムである。115は他のデータベースである。
第31図のコンテンツ管理装置の動作を説明する。コンテンツ再利用装置250はダウンロード情報管理部455を介してコンテンツ保持部440のコンテンツ部品をダウンロードし,再利用関係を判定する。判定結果はコンテンツ管理情報保持部に保持される。
推薦部500において,推薦情報作成手段551はコンテンツ管理情報保持部431に保持されているコンテンツ管理情報(ダウンロード回数,再利用関係,利用度等)をもとに推薦情報を作成し,推薦情報保持部460に保持する。参考コンテンツ表示情報作成手段553はコンテンツ再利用関係をもとに参考コンテンツ表示用情報を作成し,推薦情報保持部460の参考コンテンツ表示用情報保持部に保持する。派生コンテンツ表示用情報作成手段はコンテンツ再利用関係保持部に保持されているコンテンツ再利用関係をもとに派生コンテンツ表示用情報を作成し,派生コンテンツ表示用情報保持部に保持する。
他システム116はダウンロード情報管理部455を介してコンテンツ部品をダウロードして利用できる。コンテンツが利用されてその内容が修正されたような場合には,ダウンロード情報管理部455で修正履歴を生成し,そのデータ管理情報をコンテンツ管理情報保持部431に保持し,修正データはその差分を修正点として修正点保持部445に保持する。また,本発明のコンテンツ再利用支援装置のユーザはダウンロード情報管理部455を介して他のデータベース115にアクセスし,コンテンツ管理データベースのコンテンツ部品として保持することができる。
第32図は,本発明のコンテンツ推薦部のコンテンツ推薦情報作成手段のフローチャートである。コンテンツ推薦情報生成の処理を開始する(S1)。コンテンツを求め,コンテンツ管理情報保持部を検索し,コンテンツ部品の再利用回数,利用程度,利用者等のコンテンツ推薦に必要な情報を求める(S2)。コンテンツ推薦情報管理情報を生成する(S3)。コンテンツ推薦情報を表示する(S4)。コンテンツ推薦情報およびコンテンツ推薦情報管理情報をそれぞれの保持領域に保持する(S5)。
第33図は,コンテンツ再利用関係の検索結果と参考コンテンツ表示用情報生成のフローチャートである。
第33図(A)はコンテンツ再利用関係の検索結果のフローチャートである。再利用関係を求める処理を開始する(S1)。再利用関係を求めるコンテンツを定める(S2)。前述の本発明のコンテンツ再利用管理装置の再利用判定手段を使用して再利用関係のあるコンテンツを検索する(S3)。再利用コンテンツの検索結果で得られるコンテンツ名,一致文字列,キーワード,再利用程度,再利用関係等の情報を求め,再利用関係情報として再利用関係保持部に保持する(S4)。
なお,再利用関係保持部に保持された再利用関係をもとに,一致文字列,キーワード,再利用程度等の情報はコンテンツ管理部に保持される。
第33図(B)は参考コンテンツ表示用情報作成のフローチャートである。参考コンテンツ表示情報生成の処理を開始する(S1)。コンテンツ再利用関係保持部に保持されているコンテンツ再利用の検索結果を入力する(S2)。ターゲットコンテンツを定める(S3)。ターゲットコンテンツから逆上ってオリジナルコンテンツまでの派生関係コンテンツを求める(S4)。参考コンテンツ関係を表示し,保持する(S5)。
第34図は,本発明の派生コンテンツ表示のフローチャートである。派生コンテンツ表示用情報生成の処理を開始する(S1)。コンテンツ再利用の検索結果を入力する(S2)。オリジナルコンテンツを定め,オリジナルコンテンツを利用しているコンテンツ(派生コンテンツ)を求める(S3)。派生コンテンツのコンテンツ名等のコンテンツ管理情報を保持する(S4)。全てのコンテンツを求めたか判定する(S5,S6)。全て求めていなければオリジナルコンテンツからの派生コンテンツを派生元コンテンツ(オリジナルコンテンツ)としてS4以降の処理を繰り返す(S7)。S6で全てのコンテンツについて処理をしたら終了する。
第35図は本発明のドラフト作成支援部の構成である。第35図において600はドラフト作成支援部である。ドラフト作成支援部600はドラフト作成支援手段620によりメモリを編集作業領域650として使用してコンテンツ部品の編集を支援する。本発明のドラフト作成支援手段620を使用してコンテンツを編集する時は,コンテンツ推薦情報取得手段621によりコンテンツ推薦部の推薦情報を取得する。さらに,推薦情報をもとにコンテンツ選択手段622によりコンテンツを選択し,入力する。ユーザは画面表示されたコンテンツをもとにコンテンツを編集する。コンテンツの編集は,コンテンツの一部抽出,一部削除,複数コンテンツの組合せ(抽出したコンテンツの結合,組み込み等),コンテンツの一部の置換,コンテンツの内容の追加,複数コンテンツの差分の抽出等を編集作業領域650を使用して行なうことができる。
第36図(A)発明のドラフト作成支援部のコンテンツ編集のフローチャートである。ドラフト作成支援部におけるコンテンツ編集処理を開始する(S1)。推薦情報取得手段により推薦情報を取得し,コンテンツ推薦情報を表示する(S2)。コンテンツを選択し,入力する(S3)。コンテンツをもとに組合せ,置換,追加,削除等でユーザが編集する(S4)。編集したコンテンツにコンテンツ管理情報もしくは修正点管理情報を生成し,コンテンツ保持部もしくは修正点保持部に保持し,そのコンテンツ管理情報もしくは修正点管理情報をコンテンツ管理情報保持部もしくは修正点管理情報保持部に保持する(S5)。
第36図(B)は本発明のドラフト作成支援部の編集したコンテンツの差分抽出のフローチャートである。差分をとるコンテンツを入力する(S1)。コンテンツどうしの差分をとる(S2)。差分をコンテンツ部品にする場合には,コンテンツ管理情報を生成し,コンテンツ部品保持部に保持し,修正点にする場合には修正点管理情報を生成して修正点保持部に保持する(S3)。また,修正点保持部に保持されている修正点をコンテンツ部品にする場合には,その修正点にコンテンツ部品管理情報を生成し,コンテンツ保持部に保持することによりコンテンツ部品になる。
第37図は本発明のコンテンツ部品切り出し支援部の構成とその動作説明図である。第37図において,700はコンテンツ部品切り出し支援部である。710はコンテンツ推薦情報取得手段である。711はコンテンツ選択手段である。712はコンテンツ共通点取得手段である。713はコンテンツ境界情報作成手段である。420はコンテンツデータベースである。
本発明のコンテンツ再利用支援装置により,複数コンテンツの共通点(即ち共通部分)を取得する方法について,第37図を参照して説明する。コンテンツ推薦情報取得手段710はコンテンツ推薦情報保持部460からコンテンツ推薦情報を取得し,表示する。ユーザはコンテンツ推薦情報をもとにコンテンツ選択手段711によりコンテンツを選択する。例えば,第37図の場合,コンテンツAとコンテンツBを選択する。コンテンツ共通点取得手段712はコンテンツAとコンテンツBの共通点を取得する。共通点はインデックス,共通点管理情報保持部へのポインタを付けて共通点保持部に保持される。共通点管理情報にはその共通点のインデックス,共通点を切り出すもととなったコンテンツ名,共通点保持部へのポインタを付けて保持する。共通点保持部470に保持された共通点は,コンテンツ部品管理情報(コンテンツ部品名,コンテンツ保持部へのポインタ等)を付けることによりコンテンツ部品にして,コンテンツ保持部に保存することができる。また,そのように生成したコンテンツ部品にはファイル名とコンテンツ管理情報保持部へのポインタをつけることによりコンテンツ管理情報保持部とのリンクをとる。
次に本発明のコンテンツ境界情報作成手段713の動作について説明する。コンテンツ境界情報作成手段713は複数コンテンツの共通点をもとにそれぞれのコンテンツにおいて共通点の前後の領域についての領域情報である境界情報をもとめる。即ち,共通点の前後の領域が,それぞれのコンテンツにおいてどのような領域であったかを判定する。例えば,コンテンツAとコンテンツBが第28図のようなテンプレートであった場合に,編集領域のみが共通であるとすると,共通点の境界情報として「文字入力・編集」および「編集・ファイルの保存」をもつ。境界情報はコンテンツ境界情報保持部472に保存する。あるテンプレートにより生成された多数のコンテンツについて,この境界情報の分布を調べることにより,そのテンプレートがどような使われ方をするかを容易に判定できるようになる。そのコンテンツ境界情報を分析することにより,新たなテンプレート部品を生成する際にどのようなテンプレート生成するのが有効であるか等を判断でき,コンテンツ境界情報は,新しいコンテンツ部品を生成する際の有効な参考情報になる。
第38図(A)は,本発明のコンテンツ部品切り出し支援部のコンテンツ共通点取得手段のフローチャートである。複数コンテンツを入力する(S1)。各コンテンツの共通点を求める(S2)。コンテンツの共通点を表示する(S3)。コンテンツの共通点に共通点管理情報(共通点のインデックス,共通点を抽出した各コンテンツ名,共通点保持領域へのポインタ等)を付け,共通点にはインデックス,共通点管理情報保持部へのポインタ等をつけることにより互いに結ばれるようにリンクをはり,それぞれ共通点管理情報保持部,共通点保持部に保持する(S4)。
第38図(B)は,本発明のコンテンツ境界情報作成手段のフローチャートである。コンテンツの共通部分の情報を入力する(S1)。共通部分のコンテンツにおける自身の領域名(例えば,第28図のテンプレートの編集等の見出し)と前後の領域名(例えば,第28図のテンプレートの文字入力,ファイルの保存等の見出し)を求める(S2)。コンテンツ境界情報を生成する(例えば,文字入力領域と編集領域の間にその境界があることを表す「文字入力・編集」および編集領域とファイルの保存領域の間にその境界があることを表す「編集・ファイルの保存」等)(S3)。求めたコンテンツ境界情報にコンテンツ境界情報管理情報(インデックス,コンテンツ名,コンテンツ境界情報保持部へのポインタ等)を付けてコンテンツ境界情報管理情報を生成する。またコンテンツ境界情報にはインデックスとコンテンツ境界情報管理情報保持部へのポインタを生成し,互いにポインタでリンクされるようにする(S4)。コンテンツ境界情報管理情報,コンテンツ境界情報をそれぞれコンテンツ境界情報管理情報保持部,コンテンツ管理データーベースの境界情報保持部に保持する(S5)。なお,上記においては,コンテンツの共通点の領域をもとにコンテンツ境界情報を求めたが,コンテンツの修正点の領域をもとにコンテンツ境界情報を求めることもできる。
第39図は本発明においてコンテンツから切り出した共通点(共通部分)の例である。第39図において,AはコンテンツAであり,BはコンテンツBである。CはコンテンツAとコンテンツBの共通点である。
第40図(A)は本発明のコンテンツ管理支援部のコンテンツ部品管理手段のフローチャートを示す。ユーザ(コンテンツ管理担当者)はコンテンツのダウンロード回数,コンテンツ利用程度,コンテンツ利用者情報,コンテンツ推薦情報等を入力する(S1)。ダウンロード回数,コンテンツ利用程度,コンテンツ利用者情報等をもとにコンテンツの重要度を評価し,コンテンツの変更,追加等で新しいコンテンツ部品を生成する(S2)。新たに生成されたコンテンツ部品にコンテンツ部品管理情報を生成する(S3)。コンテンツ部品管理情報はコンテンツ部品管理情報保持部に保持され,コンテンツ部品はコンテンツ部品保持部に保持される(S4)。コンテンツ管理情報とコンテンツ部品はコンテンツ部品名とポインタにより互いに結ばれるようにリンクをはる。
ダウンロード回数が多いのは重要コンテンツであり,その利用される部分が偏在している場合に,その利用される部分の重要度が高いと考えられる。そのような場合には,その部分をオリジナルコンテンツ部品にする等で利用しやすい部品を生成することができる。また,特定のグループの利用者で利用されるコンテンツの場合,そのグループに適したコンテンツ部品に加工する等で利用しやすい部品を生成することができる。例えば,コンテンツ境界情報をもとに見出しを作りなおす等で新しいテンプレートを生成する等である。また,コンテンツ境界情報はコンテンツ部品管理手段で部品を生成する場合の参考情報にもなる。
第40図(B)は本発明のコンテンツ境界情報に基づいてコンテンツ部品作成のフローチャートである。部品作成支援部820はコンテンツ境界情報に基づいてコンテンツ部品の生成,修正等を行なうものである。但し,コンテンツ境界情報を利用したコンテンツ生成の一例を示したものであり,コンテンツ境界情報を利用したコンテンツ生成方法には様々な態様が考えられる。例えばあるテンプレートを変更してテンプレート部品を生成する場合,着目テンプレートを使用したコンテンツのコンテンツ境界情報を求める(S1)。コンテンツ境界情報の統計等によりその発生頻度等を求める(S2)。コンテンツ境界情報の頻度等を参考にして,新しいコンテンツ部品を生成する(S3)。例えば,頻繁に変更される領域の見出し等は残し,利用されない部分は削除する等で,新しいテンプレート等のコンテンツ部品を生成する。新しいコンテンツ部品にコンテンツ管理情報を生成する(S4)。コンテンツ部品はコンテンツデータベースのコンテンツ保持部に保存し,コンテンツ管理情報はコンテンツ管理情報保持部に保存する(S5)。
第41図は,本発明のコンテンツ再利用管理装置とコンテンツ作成支援装置により構成した総合システムの例を示す。シナリオデータベース910は,本発明のシステムによりシナリオ管理をするものである。文書データベース920は本発明のシステムで文書(一般文書)を管理するものである。テンプレートデーデータベース930は本発明のシステムでテンプレートを管理するものである。文/図例データベース940は本発明のシステムで文/図例を管理するものである。また,文/図例切り出し支援部950は本発明のコンテンツ部品切り出し支援部のコンテンツとして文/図例について共通コンテンツを求めるものである。テンプレート切り出し支援部951は本発明のコンテンツ部品切り出し支援部のコンテンツとしてテンプレートについて共通コンテンツを求めるものである。文書切り出し支援部952は本発明のコンテンツ部品切り出し支援部のコンテンツとして文書について共通コンテンツを求めるものである。シナリオ切り出し支援部953は本発明のコンテンツ部品切り出し支援部のコンテンツとしてシナリオについて共通コンテンツを求めるものである。
シナリオ管理支援部960は本発明のコンテンツ管理支援部でコンテンツとしてシナリオを管理するものである。文書管理支援部970は本発明のコンテンツ管理支援部でコンテンツとして文書を管理するものである。テンプレート管理支援部980は本発明のコンテンツ管理支援部でコンテンツとしてテンプレートを管理するものである。文/図例管理支援部990は本発明のコンテンツ管理支援部でコンテンツとして文/図例を管理するものである。
コンテンツ推薦部500はシナリオ,文書,テンプレートおよび文/図例についてそれぞれシナリオデータベース910,文書データベース920,テンプレートデータベース930および文/図例データベース940と交信してコンテンツ推薦情報を作成するのに必要な情報を受取し,推薦情報を生成してそれぞれのデータベースに提供する。また,コンテンツ推薦部500はコンテンツ再利用管埋装置250の作成したコンテンツの再利用関係,再利用程度,利用者等の情報をもとにコンテンツ推薦情報を作成して各データベースに提供する。
シナリオ管理者,文書管理者,テンプレート管理者および文/図例管理者はそれぞれ,コンテンツ推薦部500を利用して,推薦情報を参照し,コンテンツ管理をし,それぞれのシナリオ管理支援部960,文書管理支援部970,テンプレート管理支援部980および文/図例管理支援部990を使用してそれぞれの管理するコンテンツ部品の生成等の管理をする。
本発明のコンテンツ再利用管理装置は,本発明のコンテンツ再利用支援装置の各データベースにアクセスして,コンテンツの再利用関係を判定し,判定結果をそれぞれのデータベースに保存する。また,本発明の再利用管理装置250は他のデータベースシステム115にアクセスしてそのコンテンツ再利用関係を判定することもできる。又本発明のコンテンツ再利用支援装置は他のデータベースシステム115にアクセスし,そのコンテンツ部品を本発明のコンテンツ再利用支援装置のデータベースのコンテンツ部品として保存することもできる。又,他のシステム116も本発明のコンテンツ再利用支援装置のコンテンツデータベースにアクセスし,利用することができる。
本発明のコンテンツ再利用管理装置によれば,複数コンテンツについてコンテンツより表層情報を作成し,これら表層情報を比較するだけで再利用関係をチェックすることができる。また,コンテンツ同士の表層情報,キーワード情報だけではなく,再利用判定にメタデータを使用することもできるので,再利用関係の詳細を容易に判定することができる。さらに,メタ情報を利用して再利用判定ができるので,データベース中の多数のコンテンツのうち,会社内の全コンテンツとか,会社内の部署内の全コンテンツ等に再利用判定を絞り込むことができるので,多数のコンテンツについての再利用判定を高速に行なうことができる。
本発明のコンテンツ再利用支援装置によれば,コンテンツ推薦情報をもとに利用度の高いコンテンツを容易に選択することができる。そのため,重要度の高いコンテンツを選択して再利用することにより質の高いコンテンツを容易に作成できる。また,そのようにして本発明のコンテンツ作成支援装置を使用することによりデータベースのコンテンツを質の高いものにすることができる。

Claims (18)

  1. コンピュータを利用したデータベースに保存されるコンテンツに対して,
    被参照コンテンツと,
    この被参照文書を再利用して作成された可能性がある判定対象コンテンツと,
    コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段と,
    前記再利用判定手段で出力される情報を表示する表示手段を具備したことを特徴とするコンテンツ再利用管理装置。
  2. コンピュータを利用したデータベースに保存されるコンテンツに対して,
    再利用された可能性がある被参照コンテンツと,
    この被参照コンテンツを再利用して作成された可能性がある判定対象コンテンツと,
    キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,
    前記再利用判定手段で出力される情報を表示する表示手段を具備したことを特徴とするコンテンツ再利用管理装置。
  3. コンピュータを利用したデータベースに保存されるコンテンツに対して,
    再利用された可能性がある被参照コンテンツと,
    この被参照コンテンツに関する作者やその補完元等のメタデータと,
    前記被参照コンテンツを再利用して作成された可能性がある判定対象コンテンツと,
    この判定対象コンテンツに関するメタデータと,
    文書中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段,または,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,
    メタデータを使用して前記再利用判定手段の判定結果を補助する判定補助手段と,
    前記判定補助手段で使用されるメタデータを保持するメタ情報辞書と,
    前記再利用判定手段より出力される情報を表示する表示手段を具備したことを特徴とするコンテンツ再利用管理装置。
  4. コンピュータを利用したデータベースに保存されるコンテンツに対して,
    再利用された可能性がある複数の被参照コンテンツが格納された参照データベースと,
    この参照データベースに格納されたコンテンツを再利用して作成された可能性のある判定対象コンテンツと,
    コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段,または,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,
    前記再利用判定手段より出力される情報を表示する表示手段を具備したことを特徴とするコンテンツ再利用管理装置。
  5. コンピュータを利用したデータベースに保存されるコンテンツに対して,
    再利用された可能性がある複数の被参照コンテンツ及びそれらのメタデータが格納されたメタデータ付参照データベースと,
    このメタデータ付参照データベースに格納されたコンテンツを再利用して作成された可能性のある判定対象コンテンツと,
    この判定対象コンテンツに関するメタデータと,
    コンテンツ中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する表層情報ベース再利用判定エンジンを有する再利用判定手段,または,キーワードや文字列等を保持するキーワード辞書と,キーワードや文字列などの辞書情報に基づいて再利用度を判定する辞書ベース再利用判定エンジンを有する再利用判定手段と,
    メタデータを使用して前記再利用判定手段の判定結果を補助する判定補助手段と,
    前記判定補助手段で使用されるメタデータを保持するメタ情報辞書と,
    前記再利用判定手段より出力される情報を表示する表示手段を具備したことを特徴とするコンテンツ再利用管理装置。
  6. コンピュータを利用したデータベースに保存されるコンテンツに対して,コンテンツ間の利用の有無を判定するコンテンツ再利用管理装置において,
    コンテンツに現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用して再利用度を判定する再利用判定手段とを備え,
    コンテンツ間での表層情報の一致の程度によりコンテンツ間での再利用関係の有無を判定することを特徴とするコンテンツ再利用管理装置。
  7. コンピュータを利用したデータベースに保存されるコンテンツに対して,コンテンツ間の利用の有無を判定するコンテンツ再利用管理装置において,
    コンテンツに含まれるキーワードを生成し,キーワードに基づいて再利用度を判定する再利用判定手段とを備え,
    コンテンツ間でのキーワードの一致の程度によりコンテンツの再利用関係の有無を判定することを特徴とするコンテンツ再利用管理装置。
  8. コンピュータを利用したデータベースに保存されるコンテンツに対して,コンテンツ間の利用の有無を判定するコンテンツ再利用管理装置において,
    文書中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用してコンテンツ間の利用関係の有無を判定する再利用判定手段およびキーワードに基づいて再利用度を判定する再利用判定手段との双方もしくは,少なくとも一方を備え,
    コンテンツに関する属性情報であるメタデータを保持するメタデータ保持部と,メタデータを使用して前記再利用判定手段の判定結果を補助するメタデータ利用判定手段とを備え,
    前記再利用判定手段の再利用判定結果をもとに,さらにメタデータに基づいて再利用関係を判定することを特徴とするコンテンツ再利用管理装置。
  9. コンピュータを利用したデータベースに保存されるコンテンツに対して前記メタデータはコンテンツ作成日であり,再利用判定手段により再利用関係有りと判定されたコンテンツAとコンテンツBについて,コンテンツAとコンテンツBの作成日の前後を判定することによりコンテンツを利用したコンテンツと利用されたコンテンツを判定することを特徴とする請求の範囲第8項に記載のコンテンツ再利用管理装置。
  10. コンピュータを利用したデータベースに保存されるコンテンツに対して,コンテンツ間の利用の有無を判定するコンテンツ再利用管理装置において,
    文書中に現れる文字列などの表層情報を作成する表層情報作成手段と,表層情報を使用してコンテンツ間の利用関係の有無を判定する再利用判定手段およびキーワードに基づいて再利用度を判定する再利用判定手段との双方もしくは,少なくとも一方を備え,
    一般情報であるメタ情報を保持するメタ情報保持部と,メタ情報に基づいて再利用の有無を判定する補助判定手段とを備え,
    複数コンテンツについて再利用の可能性をメタ情報をもとに判定し,メタ情報に基づき再利用の可能性有りと判定されたコンテンツについて表層情報もしくはキーワードに基づいて再利用判定手段により再利用判定をすることを特徴とするコンテンツ再利用管理装置。
  11. コンピュータを利用したデータベースに保存されるコンテンツに対してコンテンツ作成支援を行なうコンテンツ作成支援装置において,
    コンテンツ保持部と,コンテンツ利用を管理するコンテンツ管理部と,該コンテンツ管理部のコンテンツ管理情報に基づいてコンテンツの有用性を表すコンテンツ推薦情報を生成し,ユーザに提供するコンテンツ推薦部とを備えることを特徴とするコンテンツ再利用支援装置。
  12. コンテンツの編集支援を行なうドラフト作成支援部とを備えることを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
  13. 複数コンテンツの共通部分を抽出するコンテンツ部品切り出し支援部を備えることを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
  14. コンテンツを部品として管理し,コンテンツの利用情報に基づいてコンテンツ部品を管理するコンテンツ管理支援部を備えることを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
  15. コンテンツの修正点を修正前と修正後コンテンツの差分として管理することを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
  16. 該コンテンツ推薦情報はコンテンツのダウンロード回数および文書が再利用された程度であることを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
  17. コンテンツ推薦部はコンテンツの再利用関係をもとにコンテンツの派生の系統を求め,該派生系統をコンテンツ推薦情報にすることを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
  18. コンテンツの変更された領域と,変更された領域に隣接する変更されない領域についての情報を求め,該情報に基づいてコンテンツ境界情報を作成するコンテンツ境界情報作成手段を備え,該コンテンツ境界情報に基づいてコンテンツ部品を管理することを特徴とする請求の範囲第11項に記載のコンテンツ再利用支援装置。
JP2004542804A 2002-10-10 2003-06-03 コンテンツ再利用管理装置およびコンテンツ再利用支援装置 Pending JPWO2004034282A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002296862 2002-10-10
JP2002296862 2002-10-10
PCT/JP2003/007019 WO2004034282A1 (ja) 2002-10-10 2003-06-03 コンテンツ再利用管理装置およびコンテンツ再利用支援装置

Publications (1)

Publication Number Publication Date
JPWO2004034282A1 true JPWO2004034282A1 (ja) 2006-02-09

Family

ID=32089247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004542804A Pending JPWO2004034282A1 (ja) 2002-10-10 2003-06-03 コンテンツ再利用管理装置およびコンテンツ再利用支援装置

Country Status (3)

Country Link
US (1) US20050171965A1 (ja)
JP (1) JPWO2004034282A1 (ja)
WO (1) WO2004034282A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011947A (ja) * 2004-06-28 2006-01-12 Nec Corp 文書管理システム
US7809695B2 (en) * 2004-08-23 2010-10-05 Thomson Reuters Global Resources Information retrieval systems with duplicate document detection and presentation functions
JP4872079B2 (ja) * 2006-05-19 2012-02-08 国立大学法人長岡技術科学大学 文章更新量評価プログラム
US7840388B2 (en) * 2006-06-26 2010-11-23 Yokogawa Electric Corporation Engineering device
US8082233B2 (en) * 2007-03-29 2011-12-20 Microsoft Corporation Comparing data sets through identification of matching blocks
JP5301862B2 (ja) * 2008-03-28 2013-09-25 株式会社野村総合研究所 著作物比較システム
JP4550939B1 (ja) * 2009-09-17 2010-09-22 株式会社野村総合研究所 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム
JP5653199B2 (ja) * 2010-12-09 2015-01-14 キヤノン株式会社 情報処理装置及びプログラム
JP5669638B2 (ja) * 2011-03-17 2015-02-12 キヤノン株式会社 文書管理装置、文書管理方法、プログラム。
US10089017B2 (en) 2011-07-20 2018-10-02 Futurewei Technologies, Inc. Method and apparatus for SSD storage access
US9128915B2 (en) * 2012-08-03 2015-09-08 Oracle International Corporation System and method for utilizing multiple encodings to identify similar language characters
US20140281850A1 (en) * 2013-03-14 2014-09-18 Citta LLC System and method of content stream utilization
JP6080649B2 (ja) * 2013-03-29 2017-02-15 キヤノン株式会社 レコメンド装置、レコメンド方法及びプログラム
US9628551B2 (en) 2014-06-18 2017-04-18 International Business Machines Corporation Enabling digital asset reuse through dynamically curated shared personal collections with eminence propagation
JP6351177B2 (ja) * 2015-03-30 2018-07-04 Kddi株式会社 学習単元間の親子関係を特定する学習教材分析プログラム、装置及び方法
US9898202B2 (en) 2015-11-30 2018-02-20 Samsung Electronics Co., Ltd. Enhanced multi-streaming though statistical analysis
US9880780B2 (en) 2015-11-30 2018-01-30 Samsung Electronics Co., Ltd. Enhanced multi-stream operations
US10108615B2 (en) 2016-02-01 2018-10-23 Microsoft Technology Licensing, Llc. Comparing entered content or text to triggers, triggers linked to repeated content blocks found in a minimum number of historic documents, content blocks having a minimum size defined by a user
JPWO2021039129A1 (ja) * 2019-08-29 2021-03-04

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309319A (ja) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd 文書処理装置
JP2000215238A (ja) * 1999-01-21 2000-08-04 Hitachi Ltd 不正著作物検出方法
JP2001076000A (ja) * 1999-09-09 2001-03-23 Nippon Telegr & Teleph Corp <Ntt> コンテンツ不正利用探索装置およびコンテンツ不正利用探索方法
JP2001256043A (ja) * 2000-03-10 2001-09-21 Toshiba Corp プログラムソースの修正履歴管理方法および修正履歴管理システム
JP2001312490A (ja) * 2000-04-28 2001-11-09 Nec Corp テンプレート自動生成システム及びプログラムを記録した機械読み取り可能な記録媒体
JP2002189754A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd 文書検索装置及び文書検索方法
JP2002251311A (ja) * 2001-02-22 2002-09-06 Nippon Telegr & Teleph Corp <Ntt> コンテキストデータ生成・利用方法、プログラム及び記録媒体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539388B1 (en) * 1997-10-22 2003-03-25 Kabushika Kaisha Toshiba Object-oriented data storage and retrieval system using index table
US6598052B1 (en) * 1999-02-19 2003-07-22 Sun Microsystems, Inc. Method and system for transforming a textual form of object-oriented database entries into an intermediate form configurable to populate an object-oriented database for sending to java program
US6542899B1 (en) * 1999-02-19 2003-04-01 Sun Microsystems, Inc. Method and system for expressing information from an object-oriented database in a grammatical form
CA2281331A1 (en) * 1999-09-03 2001-03-03 Cognos Incorporated Database management system
US7178129B2 (en) * 2001-12-07 2007-02-13 Dbase, Inc. Drag-and drop dynamic distributed object model
US7174507B2 (en) * 2003-02-10 2007-02-06 Kaidara S.A. System method and computer program product for obtaining structured data from text
US7293005B2 (en) * 2004-01-26 2007-11-06 International Business Machines Corporation Pipelined architecture for global analysis and index building
US7305389B2 (en) * 2004-04-15 2007-12-04 Microsoft Corporation Content propagation for enhanced document retrieval
US20070276813A1 (en) * 2006-05-23 2007-11-29 Joshua Rosen Online Advertisement Selection and Delivery Based on Search Listing Collections
US20070276811A1 (en) * 2006-05-23 2007-11-29 Joshua Rosen Graphical User Interface for Displaying and Organizing Search Results

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309319A (ja) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd 文書処理装置
JP2000215238A (ja) * 1999-01-21 2000-08-04 Hitachi Ltd 不正著作物検出方法
JP2001076000A (ja) * 1999-09-09 2001-03-23 Nippon Telegr & Teleph Corp <Ntt> コンテンツ不正利用探索装置およびコンテンツ不正利用探索方法
JP2001256043A (ja) * 2000-03-10 2001-09-21 Toshiba Corp プログラムソースの修正履歴管理方法および修正履歴管理システム
JP2001312490A (ja) * 2000-04-28 2001-11-09 Nec Corp テンプレート自動生成システム及びプログラムを記録した機械読み取り可能な記録媒体
JP2002189754A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd 文書検索装置及び文書検索方法
JP2002251311A (ja) * 2001-02-22 2002-09-06 Nippon Telegr & Teleph Corp <Ntt> コンテキストデータ生成・利用方法、プログラム及び記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
前川 彰,川越 恭二: "Webページ類似度による権利侵害著作物探索方式の提案", 第64回(平成14年)全国大会講演論文集(3) データベースとメディア ネットワーク, JPN6008024310, 12 March 2002 (2002-03-12), JP, pages 3 - 135, ISSN: 0001047050 *
門脇 憲治: "知識情報管理によるソフトウェア再利用方式の一提案", 情報処理学会研究報告, vol. 第2002巻,第23号, JPN6009002590, 8 March 2002 (2002-03-08), JP, pages 141 - 146, ISSN: 0001232021 *

Also Published As

Publication number Publication date
US20050171965A1 (en) 2005-08-04
WO2004034282A1 (ja) 2004-04-22

Similar Documents

Publication Publication Date Title
US20050171965A1 (en) Contents reuse management apparatus and contents reuse support apparatus
US5745745A (en) Text search method and apparatus for structured documents
JP2896634B2 (ja) 全文登録語検索装置および全文登録語検索方法
US6869018B2 (en) Transcript management software and methods therefor
US7921116B2 (en) Highly meaningful multimedia metadata creation and associations
US7107520B2 (en) Automated propagation of document metadata
CN109344230B (zh) 代码库文件生成、代码搜索、联结、优化以及移植方法
US20060080361A1 (en) Document information processing apparatus, document information processing method, and document information processing program
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
KR101174057B1 (ko) 인덱스 분석장치와 인덱스 검색장치 및 그 방법
CN102682055A (zh) 管理电子书内容的方法和设备
JPH0628403A (ja) 文書検索装置
JP2007279978A (ja) 文書検索装置及び文書検索方法
JP2005107931A (ja) 画像検索装置
JP2001357045A (ja) 画像管理装置,画像管理方法および画像管理プログラムの記録媒体
JP2004240488A (ja) 文書管理装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
CN115687566A (zh) 一种全文检索及显示检索结果的方法及装置
JP3531344B2 (ja) 情報検索装置
JP2009123067A (ja) 用語辞書生成方法、用語辞書生成装置、プログラム、および記録媒体
JP2004206571A (ja) 文書情報提示方法及び装置並びにプログラム及び記録媒体
US20100057691A1 (en) Method, server extensionand database management system for storing annotations of non-XML documents in an XML database
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JP2005301855A (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080728

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080728

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090609