JP2006146873A - データ検索方法、装置及びプログラム - Google Patents

データ検索方法、装置及びプログラム Download PDF

Info

Publication number
JP2006146873A
JP2006146873A JP2005212919A JP2005212919A JP2006146873A JP 2006146873 A JP2006146873 A JP 2006146873A JP 2005212919 A JP2005212919 A JP 2005212919A JP 2005212919 A JP2005212919 A JP 2005212919A JP 2006146873 A JP2006146873 A JP 2006146873A
Authority
JP
Japan
Prior art keywords
data
search
document
version
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005212919A
Other languages
English (en)
Inventor
Hiroyuki Nagai
宏之 長井
Daisuke Tanaka
大介 田中
Shiro Ito
史朗 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005212919A priority Critical patent/JP2006146873A/ja
Priority to US11/253,331 priority patent/US20060095421A1/en
Publication of JP2006146873A publication Critical patent/JP2006146873A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 あるデータから派生したことを示すバージョン情報を持つ複数のデータに対する検索をバージョン情報を考慮して行う。
【解決手段】 検索条件にヒットしたデータそれぞれに対してバージョン情報を用いて検索結果のスコアを計算する。バージョン情報はデータのバージョン番号、更新時間情報などである。そして、それぞれのスコアを統合して派生前のデータ群に対して検索順位決定を行う。
【選択図】 図1

Description

本発明は、蓄積されたデータのバージョンを考慮したデータ検索方法、装置、プログラムに関する。
文書管理装置に特有の検索として、複数のバージョンを持つ文書の検索が挙げられる。文書の更新を考慮したバージョン管理などの機能が提案されている(例えば特許文献1参照)。
特開平9−128380号公報
上記従来の技術では、検索時にバージョンを指定しての検索は考慮されているが、異なるバージョンに対する検索が考慮されていないために同じ文書でもバージョンが異なる文書について、バージョンを考慮せずに結果を返すため、検索精度が落ちるという問題点があった。
また、同一文書から派生したバージョン違いの文書は、内容が類似しているため、類似した内容が重複して検索にヒットすることになり、各バージョンの文書一つ一つをそれぞれバラバラに検索結果として表示すると、視認性が悪いという問題点があった。
上記の課題を解決するため、本発明によるデータ検索方法は以下の構成を備える。即ち、あるデータから派生したことを示すバージョン情報を持つ複数のデータに対して検索を行う方法であって、検索にヒットしたデータのうち、同一データから派生したデータ群に含まれるデータそれぞれに対して前記バージョン情報に基づいて検索結果のスコアを計算する計算工程と、前記スコアに基づいて検索結果の順位を決定する順位決定工程。
上記の課題を解決するため、本発明によるデータ検索装置は以下の構成を備える。即ち、あるデータから派生したことを示すバージョン情報を持つ複数のデータに対して検索を行う装置であって、検索にヒットしたデータのうち、同一データから派生したデータ群に含まれるデータそれぞれに対して前記バージョン情報に基づいて検索結果のスコアを計算する計算手段と、前記スコアに基づいて検索結果の順位を決定する順位決定手段。
上記の課題を解決するため、本発明によるプログラムは以下の構成を備える。即ち、あるデータから派生したことを示すバージョン情報を持つ複数のデータに対して検索を行う手順を記録するプログラムであって、検索にヒットしたデータのうち、同一データから派生したデータ群に含まれるデータそれぞれに対して前記バージョン情報に基づいて検索結果のスコアを計算する計算手順と、前記スコアに基づいて検索結果の順位を決定する順位決定手順。
あるデータから派生したバージョンの異なる複数のデータに対して、検索結果のスコア付けを行い、視認性の高い結果を得ることができる。
<実施形態1>
まず、第一の実施の形態を図1から図12に基づき説明する。
第一の実施の形態は、ナレッジベース等、ユーザが検索したい情報が特定のジャンルに多く含まれる様な文書管理装置の検索に適用できる。本実施形態の文書データには、文書、静止画像、動画像、音声等のデータを含む。
図1は本発明の実施の形態に掛かる装置の全体構成例を示すブロック図である。
図1において、複数のバージョンの文書を保持する文書データ保持部101、文書データがどの文書のどのバージョンであるかを管理する文書データ管理部102、検索条件を保持する検索条件保持部103、検索条件を満たす文書データを検索する文書データ検索部104、適合した文書データの文書情報とバージョン情報から検索結果をまとめる検索結果統合部105、適合文書、バージョンの提示順を決定するランキング部106、検索結果を保持する検索結果保持部107から構成される。
文書データ保持部101は文書の各バージョンをデータとして格納する。各データがどの文書のどのバージョンであるかは文書データ管理部102が保持する。
文書管理装置に新たな文書が登録されたり、文書の新たなバージョンが登録されたりすると、新たな文書または新たなバージョンの文書にIDを付け、文書データとして文書データ保持部に保持する。また、その文書データがどの文書のどのバージョンであったかわかるように、文書データIDと文書情報IDとバージョン番号と文書名とを関連付けて文書データ管理部102が保持する。その保持内容は図2(a)のようになる。
図2(a)では、文書A(文書情報ID:I00002)と文書B(文書情報ID:I00001)と文書C(文書情報ID:I00003)の3文書が登録されており、文書Aにはバージョン:1(データID:V00002)とバージョン:2(データID:V00006)、文書Bにはバージョン:1(データID:V00001)とバージョン:2(データID:V00003)とバージョン:3(データID:V00004)、文書Cにはバージョン:1(データID:V00005)登録されている。
図3は文書Aの2つのバージョンの内容を示したものである。文書データ301(データID:V00002、バージョン:1)を更新して文書データ302(データID:V00006、バージョン:2)が登録されている。図4、図5においても同様に文書B、文書Cのそれぞれのバージョンの情報を表している。
なお、本実施形態ではバージョン番号は1.0から始まり、更新されるたびに1増加するものとしているが、これに限られず文書データの更新が分かる番号体系を適宜用いる。文書のファイル名・メタデータに、バージョンを番号として振る方法の他には、文書を更新した時刻、日付、時間間隔などもバージョン情報とみなす方法などがある。
文書管理装置におけるバージョン管理は、CVS(Concurrent Versions System)で行われているような一般的な方法を用いる。すなわち、文書の変更を行う際には、ユーザは文書管理装置に事前に宣言(チェックアウト)し、その後、内容を変更した文書を文書管理装置に登録(チェックイン)することで、バージョンを管理する方法である。
図2(b)は複数のバージョンの文書を格納する管理体系の概念図である。フォルダ201は各文書を保存するフォルダであり、フォルダバージョンが振られている。フォルダバージョンは、内包する文書の更新に合わせて更新される。図2(c)に示すように、文書データ管理部102では、フォルダバージョン203に関連付けて、各フォルダ下の文書のバージョン204を管理していても良い。
検索条件保持部103は、ユーザから検索装置に送信された検索条件を保持し、データ検索部104に検索条件を渡す。図6は、ユーザが検索装置に検索要求を送る際に用いるインターフェース図である。検索条件は601と602より設定する。601は検索語を入力する部分である。602は検索結果提示形式を指定する部分である。検索結果提示形式については後述する。ユーザは、検索条件を設定した後、603のボタンを押下することによって検索装置に検索要求を行う。
データ検索部104は、検索条件保持部103に保持された検索条件にて、データを検索する。この検索の実現には、一般的な文書全文検索手法が用いられる。パターンマッチング手法でも良いし、あらかじめデータ登録時にインデクスを作成しておくインデクス検索手法でも良い。インデクス検索手法の場合は、データ管理部でインデクスも管理する。検索した結果としては、その内容に検索語が含まれる文書データのID、及びその文書データの検索条件に対する適合度(スコア)が得られる。この文書データのスコアは、検索語の出現頻度や文章中の出現位置などから求められる。図7は検索語が「捏造」のときのデータ検索結果例である。文書データIDがV00001、V00002、V00004の3つのデータが適合し、それらのスコアが得られている。
検索結果統合部105は、データ検索部104で得られた適合文書データのIDと、データ管理部102が保持している表から、適合したデータの文書データID、バージョン番号を得る。先の例の場合、その結果は図8となる。適合した文書、バージョンは、文書Aのバージョン番号1.0と、文書Bのバージョン番号1.0と3.0である。
ランキング部106は、検索統合部105で得られた適合文書データ、バージョンの提示順を定めるために、バージョンを考慮したスコアを与え、ランキングを行う。
新しいバージョンが検索にヒットした文書ほどスコアが高くなるようにするスコア付けとランキングについて述べる。これは、検索するユーザの重要な要望のひとつとして、新しい情報を優先することが挙げられるためである。ここでは、バージョンスコアは以下の式で得る。
バージョンスコア=データスコア×バージョン番号÷最新バージョン番号
例えば、文書Bバージョン1.0のバージョンスコアは、
10×1.0÷3.0≒3.3
となる。同様にして他のバージョンスコアを求めた結果が図9である。新しいバージョンほどスコアが高くなるようなバージョンスコアの決定方法は上記の方法に関わらず適用可能である。
次に、検索条件のひとつである検索結果提示形式にあわせて結果の融合を行う。検索結果提示形式には、検索結果としてバージョン毎のリストを表示するもの、バージョンの情報を出さず適合したバージョンが含まれる文書のリストを表示するものがある。文書毎の表示は検索結果全体の状態が把握しやすく、類似性の高いバージョンの違う文書データを一つ一つチェックする手間が省けるという利点がある。バージョン毎の表示は、個々の文書データの詳細な情報が得やすいという利点がある。
文書毎の検索結果を提示する場合は、バージョン毎の結果を文書毎にまとめるため、文書毎のスコアを計算する。文書スコアは以下の式で得る。
文書スコア=(Σバージョンスコア)÷その文書の全バージョン数
例えば、文書Bの文書スコアは
(3.3+20)÷3≒7.8
となる。同様にして他の文書スコアを求めた結果が図10である。検索結果提示形式がバージョン毎の場合はここでは何もしない。
検索結果保持部107はランキング部106から渡されるスコアに従い、検索結果を作成する。図11は検索結果提示形式がバージョン毎の場合の検索結果画面例、図12は検索結果提示形式が文書毎の場合の検索結果画面例である。
このように、個々のバージョンの文書データの検索条件に対する適合度と、新しいバージョンの文書データに対する重み付けとを総合的に評価した結果を得ることができる。
<実施形態2>
実施形態1では、ランキング部においてスコアを算出する際、新しい情報を優先するため、新しいバージョンのスコアが高くなる重み付けを行った。本実施形態では、検索結果提示形式に合わせた重み付けを行う。
具体的には、検索結果提示形式がバージョン毎の場合は、前のバージョンが検索条件に適合しない、もしくは次のバージョンが検索条件に適合しないバージョンのスコアが高くなる重み付けを行う。バージョン1または3が検索条件に適合しないときにバージョン2が検索条件に適合した場合である。これは、検索語を含む情報の記述が、変化したバージョンを重視するためである。
また、検索結果提示形式が文書毎の場合は、多くのバージョンが適合するほどスコアが高くなる重み付けを行う。これは、常に検索語を含む情報の記述がなされている文書を重視するためである。
具体的な実現方法としては、ランキング部106の処理が実施形態1と異なる。ランキング部では、まず検索結果提示形式によって処理を分岐する。検索結果提示形式がバージョン毎の場合は、データスコアに対して、前後のバージョンが存在しないものに重み付けをしてバージョンスコアを算出する。前のバージョンが検索結果中に存在しないか、検索にヒットした文書データが最古のバージョンである場合はデータスコアを1.5倍する。また、次のバージョンが検索結果中に存在しないか、検索にヒットした文書データが最新のバージョンである場合はデータスコアを1.5倍する。
例えば、前のバージョンも次のバージョンも検索結果に含まれていなければ、バージョンスコアはデータスコアの1.5×1.5=2.25倍となる。逆に、前のバージョンも次のバージョンも検索結果に含まれているときは、データスコアと個々のバージョン文書に対して与えられるバージョンスコアは等しくなる。
図13のように文書X,Yの2文書、各5バージョンが登録されていて、図14のように、データ検索部104での結果が得られているとすると、バージョンスコアは図15のようになる。途中の1バージョンだけ適合している文書Yバージョン3.0のスコアが高い。一方、検索結果提示形式が文書毎の場合は、適合しているバージョンが多い文書に重み付けをして文書スコアを算出する。具体的には、文書に含まれる全適合バージョンのデータスコアの合計を全バージョン数で割ったものに、適合バージョン数をかけて全バージョン数で割ったものを文書スコアとする。図14の結果に対する文書スコアは図16のようになる。多くのバージョンが適合している文書Xのスコアが高くなる。
<実施形態3>
上記実施例においては,各部を同一の計算機上で構成する場合について説明したが,これに限定されるものではなく,複数の計算機上で実現してもよい。
なお,本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。コンピュータとしては図17のように、中央処理装置1701、主記憶装置1702、表示装置1703、入力装置1704、補助記憶装置1705を備えた一般的なコンピュータで実現可能である。
この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
プログラムコードを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部または全部を行ない、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の第1実施形態に係る検索装置のブロック図である。 (a)データ管理部が有する文書、バージョン情報の一例を示す図である。(b)本発明の実施形態1の文書の管理体系の例である。(c)データ管理部が有するフォルダバージョン管理情報の一例を示す図である。 文書の内容例を示す図である。 文書の内容例を示す図である。 文書の内容例を示す図である。 検索のインターフェース画面の一例を示す図である。 データ検索部の出力情報の例である。 検索結果統合部の出力情報の例である。 ランキング部におけるバージョンスコアの算出例である。 ランキング部における文書スコアの算出例である。 検索結果提示形式がバージョン毎の場合の検索結果画面例である。 検索結果提示形式が文書毎の場合の検索結果画面例である。 データ管理部が有する文書、バージョン情報の一例を示す図である。 データ検索部の出力情報の例である。 ランキング部におけるバージョンスコアの算出例である。 ランキング部における文書スコアの算出例である。 ソフトウェアによる実現の際、実行するコンピュータの例である。
符号の説明
101 データ保持部
102 データ管理部
103 検索条件保持部
104 データ検索部
105 検索結果統合部
106 ランキング部
107 検索結果保持部

Claims (6)

  1. あるデータから派生したことを示すバージョン情報を持つ複数のデータに対して検索を行う方法であって、
    検索にヒットしたデータのうち、同一データから派生したデータ群に含まれるデータそれぞれに対して前記バージョン情報に基づいて検索結果のスコアを計算する計算工程と、
    前記スコアに基づいて検索結果の順位を決定する順位決定工程と、
    を備えるデータ検索方法。
  2. 前記計算工程では、前記データ群に含まれるデータそれぞれに対して検索条件に適合したバージョンの新旧に基づいてスコアの計算を行うことを特徴とする請求項1記載のデータ検索方法。
  3. 前記計算工程では、前記データ群に含まれるデータそれぞれに対して検索条件に対する適合度とバージョンの新旧とに基づいてスコアの計算を行うことを特徴とする請求項1記載のデータ検索方法。
  4. 前記順位決定工程では、前記データ群に含まれるデータそれぞれのスコアを統合して前記データ群の順位決定を行うことを特徴とする請求項1記載のデータ検索方法。
  5. あるデータから派生したことを示すバージョン情報を持つ複数のデータに対して検索を行う装置であって、
    検索にヒットしたデータのうち、同一データから派生したデータ群に含まれるデータそれぞれに対して前記バージョン情報に基づいて検索結果のスコアを計算する計算手段と、
    前記スコアに基づいて検索結果の順位を決定する順位決定手段と、
    を備えるデータ検索装置。
  6. あるデータから派生したことを示すバージョン情報を持つ複数のデータに対して検索を行う手順を記録するプログラムであって、
    検索にヒットしたデータのうち、同一データから派生したデータ群に含まれるデータそれぞれに対して前記バージョン情報に基づいて検索結果のスコアを計算する計算手順と、
    前記スコアに基づいて検索結果の順位を決定する順位決定手順と、
    をコンピュータに実行させるためのプログラム。
JP2005212919A 2004-10-22 2005-07-22 データ検索方法、装置及びプログラム Withdrawn JP2006146873A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005212919A JP2006146873A (ja) 2004-10-22 2005-07-22 データ検索方法、装置及びプログラム
US11/253,331 US20060095421A1 (en) 2004-10-22 2005-10-19 Method, apparatus, and program for searching for data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004308331 2004-10-22
JP2005212919A JP2006146873A (ja) 2004-10-22 2005-07-22 データ検索方法、装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2006146873A true JP2006146873A (ja) 2006-06-08

Family

ID=36263294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005212919A Withdrawn JP2006146873A (ja) 2004-10-22 2005-07-22 データ検索方法、装置及びプログラム

Country Status (2)

Country Link
US (1) US20060095421A1 (ja)
JP (1) JP2006146873A (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505964B2 (en) 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US8316292B1 (en) 2005-11-18 2012-11-20 Google Inc. Identifying multiple versions of documents
US8095876B1 (en) * 2005-11-18 2012-01-10 Google Inc. Identifying a primary version of a document
US8015165B2 (en) * 2005-12-14 2011-09-06 Oracle International Corporation Efficient path-based operations while searching across versions in a repository
US7730032B2 (en) * 2006-01-12 2010-06-01 Oracle International Corporation Efficient queriability of version histories in a repository
US8131719B2 (en) * 2006-08-16 2012-03-06 International Business Machines Corporation Systems and methods for utilizing organization-specific classification codes
US8200690B2 (en) * 2006-08-16 2012-06-12 International Business Machines Corporation System and method for leveraging historical data to determine affected entities
US20110173033A1 (en) * 2006-08-16 2011-07-14 Pss Systems, Inc. Systems and methods for utilizing an enterprise map to determine affected entities
US8626727B2 (en) * 2006-08-29 2014-01-07 International Business Machines Corporation Systems and methods for providing a map of an enterprise system
US9110975B1 (en) 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US8694374B1 (en) 2007-03-14 2014-04-08 Google Inc. Detecting click spam
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US7895229B1 (en) 2007-05-24 2011-02-22 Pss Systems, Inc. Conducting cross-checks on legal matters across an enterprise system
US20080294492A1 (en) * 2007-05-24 2008-11-27 Irina Simpson Proactively determining potential evidence issues for custodial systems in active litigation
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US20090132262A1 (en) * 2007-09-14 2009-05-21 Pss Systems Proactively determining evidence issues on legal matters involving employee status changes
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US8572043B2 (en) * 2007-12-20 2013-10-29 International Business Machines Corporation Method and system for storage of unstructured data for electronic discovery in external data stores
US8112406B2 (en) * 2007-12-21 2012-02-07 International Business Machines Corporation Method and apparatus for electronic data discovery
US8140494B2 (en) * 2008-01-21 2012-03-20 International Business Machines Corporation Providing collection transparency information to an end user to achieve a guaranteed quality document search and production in electronic data discovery
US8275720B2 (en) * 2008-06-12 2012-09-25 International Business Machines Corporation External scoping sources to determine affected people, systems, and classes of information in legal matters
US9830563B2 (en) * 2008-06-27 2017-11-28 International Business Machines Corporation System and method for managing legal obligations for data
US7792945B2 (en) * 2008-06-30 2010-09-07 Pss Systems, Inc. Method and apparatus for managing the disposition of data in systems when data is on legal hold
US8484069B2 (en) * 2008-06-30 2013-07-09 International Business Machines Corporation Forecasting discovery costs based on complex and incomplete facts
US8073729B2 (en) * 2008-09-30 2011-12-06 International Business Machines Corporation Forecasting discovery costs based on interpolation of historic event patterns
US20100017239A1 (en) * 2008-06-30 2010-01-21 Eric Saltzman Forecasting Discovery Costs Using Historic Data
US8327384B2 (en) * 2008-06-30 2012-12-04 International Business Machines Corporation Event driven disposition
US8515924B2 (en) * 2008-06-30 2013-08-20 International Business Machines Corporation Method and apparatus for handling edge-cases of event-driven disposition
US8489439B2 (en) * 2008-06-30 2013-07-16 International Business Machines Corporation Forecasting discovery costs based on complex and incomplete facts
US8204869B2 (en) * 2008-09-30 2012-06-19 International Business Machines Corporation Method and apparatus to define and justify policy requirements using a legal reference library
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8455990B2 (en) * 2009-02-25 2013-06-04 Conexant Systems, Inc. Systems and methods of tamper proof packaging of a semiconductor device
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US20110040600A1 (en) * 2009-08-17 2011-02-17 Deidre Paknad E-discovery decision support
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US20110106775A1 (en) * 2009-11-02 2011-05-05 Copyright Clearance Center, Inc. Method and apparatus for managing multiple document versions in a large scale document repository
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8250041B2 (en) * 2009-12-22 2012-08-21 International Business Machines Corporation Method and apparatus for propagation of file plans from enterprise retention management applications to records management systems
US8655856B2 (en) 2009-12-22 2014-02-18 International Business Machines Corporation Method and apparatus for policy distribution
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US8832148B2 (en) 2010-06-29 2014-09-09 International Business Machines Corporation Enterprise evidence repository
US8566903B2 (en) 2010-06-29 2013-10-22 International Business Machines Corporation Enterprise evidence repository providing access control to collected artifacts
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8402359B1 (en) 2010-06-30 2013-03-19 International Business Machines Corporation Method and apparatus for managing recent activity navigation in web applications
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
JP5656563B2 (ja) * 2010-11-02 2015-01-21 キヤノン株式会社 文書管理システム、文書管理システムの制御方法、プログラム
US9002867B1 (en) * 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US9075847B2 (en) * 2012-11-28 2015-07-07 Sap Se Methods, apparatus and system for identifying a document
US9183499B1 (en) 2013-04-19 2015-11-10 Google Inc. Evaluating quality based on neighbor features
US10176193B2 (en) 2014-06-23 2019-01-08 International Business Machines Corporation Holding specific versions of a document
CN110751204A (zh) * 2019-10-16 2020-02-04 北京明略软件系统有限公司 数据融合的方法及装置、存储介质和电子装置
US11561947B2 (en) * 2020-09-17 2023-01-24 EMC IP Holding Company LLC File lifetime tracking for cloud-based object stores

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724567A (en) * 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
US5619295A (en) * 1995-11-08 1997-04-08 Sanyo Harz Co. Camera cover for taking a self-portrait and a method of making the same
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6728704B2 (en) * 2001-08-27 2004-04-27 Verity, Inc. Method and apparatus for merging result lists from multiple search engines
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data

Also Published As

Publication number Publication date
US20060095421A1 (en) 2006-05-04

Similar Documents

Publication Publication Date Title
JP2006146873A (ja) データ検索方法、装置及びプログラム
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
CN106095738B (zh) 推荐表单片段
US20080208829A1 (en) Method and apparatus for managing files and information storage medium storing the files
JP2008003721A (ja) 情報検索システムおよび情報検索方法およびプログラムおよび記録媒体
JPWO2010026900A1 (ja) 関係性発見装置、関係性発見方法および関係性発見プログラム
US9646585B2 (en) Information processing apparatus, information processing method, and program
JP3878518B2 (ja) データ検索装置
JP2001084256A (ja) データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2009277015A (ja) 入力支援プログラム、入力支援装置および入力支援方法
JP6571053B2 (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
JPH10307835A (ja) 情報処理装置及びその方法
JP2009271671A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP6753190B2 (ja) 文書検索装置及びプログラム
JP2019125025A (ja) システム、文書データの管理方法、及びプログラム
JP2006031209A (ja) 全文検索システム、全文検索方法、プログラムおよび記録媒体
JP7180128B2 (ja) 資料管理プログラム,資料管理システム及び資料管理方法
JP4754332B2 (ja) 解説システムおよび解説表示プログラム
JP2004110589A (ja) 情報検索方法および情報検索システム
JP2008243155A (ja) 歌詞検索装置及び歌詞検索プログラム
JP2007286852A (ja) 画像検索方法及び画像検索プログラム
JP2022148368A (ja) 検索サジェスト管理装置、検索サジェスト管理システム、検索サジェスト管理方法、及びプログラム
JP3508842B2 (ja) データベース検索システムおよびデータベース検索プログラムを記録した記録媒体
JP2004118233A (ja) 文書管理方法及び文書管理プログラム並びにそれを記録した記録媒体
JP2009223852A (ja) 検索装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007