JP2010079613A - データファイル検索プログラム及びデータファイル検索装置 - Google Patents

データファイル検索プログラム及びデータファイル検索装置 Download PDF

Info

Publication number
JP2010079613A
JP2010079613A JP2008247370A JP2008247370A JP2010079613A JP 2010079613 A JP2010079613 A JP 2010079613A JP 2008247370 A JP2008247370 A JP 2008247370A JP 2008247370 A JP2008247370 A JP 2008247370A JP 2010079613 A JP2010079613 A JP 2010079613A
Authority
JP
Japan
Prior art keywords
search
data file
profile
recorded
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008247370A
Other languages
English (en)
Inventor
Minoru Naoi
稔 直井
Etsuhisa Asai
悦久 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008247370A priority Critical patent/JP2010079613A/ja
Publication of JP2010079613A publication Critical patent/JP2010079613A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】任意の検索条件の利用を可能としつつデータファイルの検索時間を短縮する。
【解決手段】検索要求があったときに、データファイルに関連付けられつつ検索条件の特徴が記録され得るプロファイルを順次参照し、検索条件の特徴が記録されているか否かを判定する(S14、15)。そして、プロファイルに特徴が記録されているときに、その特徴が付属情報の検索条件を満たしていればプロファイルに関連付けられたデータファイルの検索を実行する一方、その特徴が付属情報の検索条件を満たしていなければそのデータファイルの検索をスキップする(S16,17)。また、プロファイルに特徴が記録されていないと判定されたときに、そのプロファイルに関連付けられたデータファイルを検索し、その検索結果に基づいてプロファイルを更新する(S15,22,23)。その後、データファイルを検索した検索結果を返信する(S19)。
【選択図】図4

Description

本発明は、データファイルを検索する技術に関する。
データファイルを検索する方法として、各種データを保持しているすべてのデータファイルにアクセスし、検索キーに適合するデータのみを抽出する方法が採用されている。この検索方法では、大量のデータファイルが存在し、かつ、各データファイルのサイズが大きいデータウエアハウスなどを対象とすると、すべてのデータファイルを読み込まなければならないことから、検索にある程度の時間がかかっていた。これを解決する方法として、データファイルに検索キーを埋め込み、指定した検索キーが存在するデータファイルのみを検索対象とすることで、検索時間の短縮を図った技術が提案されている。
特開2002−278987号公報
しかしながら、従来提案技術では、データファイルに埋め込まれた検索キーとは異なる検索キーを用いた場合には、検索時間の短縮が図れないばかりか、所望するデータが抽出されないおそれがあった。また、この方法で検索時間の短縮を図ろうとすると、検索キーの選定など業務に応じた設計が必要となり、データベースを構築する場合と同様なスキルが必要であった。
そこで、従来の問題点に鑑み、データファイル検索時に抽出した検索条件の特徴をプロファイルとして記録し、これを用いて検索対象となるデータファイルを絞り込むことで、任意の検索キーの利用を可能としつつ検索時間を短縮したデータファイル検索技術を提供することを目的とする。
検索条件を付属情報とした検索要求があったときに、複数のデータファイルに夫々関連付けられつつ検索条件の特徴が記録され得るプロファイルを順次参照し、そこに検索条件の特徴が記録されているか否かを判定する。そして、プロファイルに検索条件の特徴が記録されていると判定したときに、その特徴が付属情報の検索条件を満たしていれば、そのプロファイルに関連付けられたデータファイルの検索を実行する一方、その特徴が付属情報の検索条件を満たしていなければ、そのデータファイルの検索をスキップする。また、プロファイルに検索条件の特徴が記録されていないと判定されたときに、そのプロファイルに関連付けられたデータファイルを検索すると共に、その検索結果に基づいてプロファイルを更新する。その後、データファイルを検索した検索結果を返信する。
データファイルを実際に検索する前に、検索条件の特徴を記録したプロファイルを参照して検索実行の要否を判定するため、検索対象となるデータファイルが絞り込まれ、検索時間を短縮することができる。また、プロファイルにおける検索条件の特徴は、データファイルを検索した結果に基づいて自動的に記録されるため、データファイルなどに事前に検索キーなどを埋め込んでおく必要がなく、管理者の労力軽減に加え、任意の検索条件を利用することができる。
以下、添付された図面を参照して本発明を詳述する。
図1は、本発明を具現化したデータファイル検索装置の一実施形態を示す。
データファイル検索装置10は、LAN(Local Area Network),インターネットなどのネットワークを介して、データファイル検索サービスを利用するクライアント20に接続される。また、データファイル検索装置10は、サーバなどの汎用コンピュータからなり、ハードディスクなどの外部記憶装置にインストールされたデータ検索プログラムを実行することで、制御部12及びデータファイル検索部14を夫々具現化する。制御部12は、クライアント20に対してデータファイル検索サービスを提供する窓口となると共に、データファイル検索部14に対する検索要求及び検索結果の送受信を行う。データファイル検索部14は、データウエアハウスなどを構築する複数のデータファイル16を検索すると共に、各データファイル16に対して1対1に関連付けられたプロファイル18を管理する。なお、プロファイル18は、例えば、ハードディスクなどの記録装置にファイルとして格納される。
ここで、制御部12及びデータファイル検索部14が協働することにより、データファイル検索プログラムに係る各ステップ、及び、データファイル検索装置に係る各手段が夫々実現される。
プロファイル18には、図2に示すように、これに関連付けられているデータファイル名及びデータファイル最終更新日時に加え、検索条件の特徴として、検索項目名,検索値データ型及び特徴記述が関連付けられた状態で記録される。ここで、検索項目名が「日時型」,「数値型」及び「文字型」の場合、その検索値データ型及び特徴記述は、夫々、「DATE,最古日時・最新日時」,「NUMBER,最小値・最大値」及び「STRING,検索値・データの有無(T又はF)」と表記される。
図3は、制御部12において、クライアント20から、検索キーなどの検索条件を付属情報とした検索要求を受信したことを契機として実行される検索処理を示す。なお、検索条件は、検索項目名と検索値(特徴)を含んで構成される。
ステップ1(図では「S1」と略記する。以下同様)では、データファイル検索部14に対して、クライアント20から受信した検索要求を送信する。
ステップ2では、データファイル検索部14からデータファイル16の検索結果を受信したか否かを判定する。そして、検索結果を受信したならばステップ3へと進む一方(Yes)、検索結果を受信していなければ待機する(No)。
ステップ3では、データファイル検索部14から受信した検索結果を集計し、これをクライアント20に返信する。
図4は、データファイル検索部14において、制御部12から検索要求を受信したことを契機として実行される検索処理を示す。
ステップ11では、OS(Operating System)の機能などを利用し、データファイル16の一覧を取得する。
ステップ12では、データファイル一覧を参照し、その先頭から順番にデータファイル16に関連付けられたプロファイル(以下「対応プロファイル」という)18が存在するか否かを判定する。そして、対応プロファイル18が存在すればステップ13へと進む一方(Yes)、対応プロファイル18が存在しなければステップ20へと進む(No)。
ステップ13では、データファイル16と対応プロファイル18が整合、即ち、対応プロファイル18の更新日時がこれに関連付けられたデータファイル16の更新日時より古くないか否かを判定する。そして、データファイル16と対応プロファイル18が整合していればステップ14へと進む一方(Yes)、データファイル16と対応プロファイル18が整合していなければステップ21へと進む(No)。なお、データファイル16及び対応プロファイル18の更新日時は、例えば、そのタイムスタンプを適用すればよい。
ステップ14では、対応プロファイル18を読み込む。
ステップ15では、対応プロファイル18に検索条件の特徴が記録されているか否かを判定する。そして、検索条件の特徴が記録されていればステップ16へと進む一方(Yes)、検索条件の特徴が記録されていなければステップ22へと進む(No)。
ステップ16では、対応プロファイル18に記録されている検索条件の特徴が、検索要求に付随する付属情報の検索条件を満たしているか否かを判定する。そして、検索条件の特徴が付属情報の検索条件を満たしていればステップ17へと進み(Yes)、付属情報の検索条件により、対応プロファイル18に関連付けられているデータファイル16を検索する。一方、検索条件の特徴が付属情報の検索条件を満たしていなければデータファイル16の検索をスキップしてステップ18へと進む(No)。
ステップ18では、データファイル一覧に含まれるすべてのデータファイル16を処理したか否かを判定する。そして、すべてのデータファイル16を処理したならばステップ19へと進む一方(Yes)、すべてのデータファイル16を処理していなければステップ12へと戻る(No)。
ステップ19では、データファイル16の検索結果を制御部12へと返信する。
ステップ20では、対応プロファイル18が存在していないので、データファイル16に関連付けられるプロファイル18を新たに作成する。なお、プロファイル18を新たに作成するときには、これと関連付けられるデータファイル16を特定するデータファイル名がそこに記録される。
ステップ21では、データファイル16と整合がとれていない対応プロファイル18、又は、新たに作成されたプロファイル18を初期化、即ち、データファイル名とデータファイルの最終更新日時を除き、何も記録されていない状態にする。
ステップ22では、検索要求に付随する付属情報の検索条件により、検索条件の特徴が記録されていない対応プロファイル18、又は、初期化されたプロファイル18に関連付けられたデータファイル16を検索する。
ステップ23では、データファイル16の検索結果に基づいて、これに関連付けられたプロファイル18における検索条件の特徴を更新する。そして、これらの更新後、ステップ18へと進む。
このようなデータファイル検索装置によれば、クライアント20から検索条件を付属情報とした検索要求があったときに、データファイル16を実際に検索する前に、これに関連付けられたプロファイル18が順次参照される。そして、プロファイル18に検索条件の特徴が記録され、かつ、その特徴が付属情報の検索条件を満たしていれば、そのプロファイル18に関連付けられたデータファイル16の検索が初めて実行される。一方、プロファイル18に検索条件の特徴が記録され、かつ、その特徴が付属情報の検索条件を満たしていなければ、そのプロファイル18に関連付けられたデータファイル16の検索がスキップされる。また、プロファイル18に検索条件の特徴が記録されていなければ、そのプロファイル18に関連付けられたデータファイル16が検索されると共に、その検索条件に基づいてプロファイル18に記録された検索条件の特徴が更新される。その後、クライアント20に対して、データファイル16を検索した検索結果が返信される。
従って、データファイル16を実際に検索する前に、検索条件の特徴を記録したプロファイル18を参照して検索実行の要否が判定されるため、検索対象となるデータファイル16が絞り込まれ、検索時間を短縮することができる。また、プロファイル18における検索条件の特徴は、データファイル16を検索した結果に基づいて自動的に記録されるため、データファイル16などに事前に検索キーなどを埋め込んでおく必要がなく、管理者の労力軽減に加え、任意の検索条件を利用することができる。なお、データウエアハウスなどでは、データファイル16の数が膨大であると共に、各データファイル16のサイズが大きいため、これを読み込む時間に比較してプロファイル18を参照する時間は微々たるものである。
このとき、データファイル16に関連付けられたプロファイル18が存在しなければ、そのプロファイル18が新たに作成され、これがデータファイル16の検索結果に基づいて更新される。このため、新たなデータファイル16を追加したときでも、これに関連付けられたプロファイル18が自動的に作成され、その後の検索に資することができる。また、プロファイル18の更新日時がこれに関連付けられたデータファイル16の更新日時より古いとき、そのデータファイル16の検索結果に基づいてプロファイル18が更新される。このため、データファイル16の更新が行われたときにも、これとプロファイル18の整合を自動的にとることができる。
次に、データファイル検索装置10の理解を容易ならしめるべく、2つの具体例について説明する。
[第1具体例]
クライアント20からデータファイル検索装置10に対して、図5に示すように、2008年6月3日〜6月5日の売上高合計を要求する検索要求があると、データファイルDATA001.CSV〜DATA003.CSVに夫々関連付けられたプロファイルが順次参照される。そして、これらの中から、取引日が2008年6月3日〜6月5日の売上データを含むプロファイルが選択され、これに関連付けられたデータファイルDATA002.CSV及びDATA003.CSVのみ検索が実行される。このとき、データファイルDATA001.CSVに関連付けられたプロファイルは、取引日が2008年6月1日〜6月2日であり、検索要求に付随する検索条件を満たさないため、そのデータファイルDATA001.CSVの検索がスキップされる。
従って、図示の検索条件では、データファイルDATA002.CSV及びDATA003.CSVのみが検索対象となり、データファイルDATA001.CSVの検索が実行されないことから、検索時間の短縮を図ることができる。
[第2具体例]
クライアント20からデータファイル検索装置10に対して、図6に示すように、店舗コードが001かつ取引日が2008年6月3日の売上高合計を要求する検索要求があると、データファイルDATA001.CSV〜DATA003.CSVに夫々関連付けられたプロファイルが順次参照される。そして、これらの中から、店舗コードが001かつ取引日が2008年6月3日の売上データを含むプロファイルが選択されるが、データファイルDATA002.CSVに関連付けられたプロファイルの店舗コード001に対応する売上げデータは存在しないので、検索条件に適合したプロファイルは存在しない。しかし、データファイルDATA003.CSVに関連付けられたプロファイルについては、取引日が2008年6月3日の売上データを含むが、店舗コード001に対応する特徴が記録されていないため、これを自動更新すべく検索対象として選択される。そして、データファイルDATA003.CSVのみ検索が実行され、その検索結果に基づいて、図7に示すように、データファイルDATA003.CSVに関連付けられたプロファイルにおける検索条件の特徴が更新される。
従って、図示の検索条件では、データファイルDATA003.CSVのみが検索対象となり、データファイルDATA001.CSV及びDATA002.CSVの検索が実行されないことから、検索時間の短縮を図ることができる。また、データファイルDATA003.CSVに関連付けられたプロファイルには、店舗コード001の売上データに関する検索条件の特徴が記録されていないが、データファイルDATA003.CSVの検索結果に基づいてこれが更新される。このため、その後の検索処理において、店舗コード001を検索条件とすると、データファイルDATA003.CSVが検索対象として選択されなくなる。
データファイル検索装置の一実施形態を示す全体構成図 プロファイルの説明図 制御部で実行される検索処理のフローチャート データファイル検索部で実行される検索処理のフローチャート データファイル検索装置の作用を説明するための第1具体例の説明図 データファイル検索装置の作用を説明するための第2具体例の説明図 第2具体例により更新されたプロファイルの説明図
符号の説明
10 データファイル検索装置
12 制御部
14 データファイル検索部
16 データファイル
18 プロファイル

Claims (4)

  1. 複数のデータファイルを検索するコンピュータに、
    検索条件を付属情報とした検索要求があったときに、各データファイルに関連付けられつつ検索条件の特徴が記録され得るプロファイルを順次参照し、該プロファイルに検索条件の特徴が記録されているか否かを判定するステップと、
    前記プロファイルに検索条件の特徴が記録されていると判定したときに、該特徴が付属情報の検索条件を満たしていれば、そのプロファイルに関連付けられたデータファイルの検索を実行する一方、該特徴が付属情報の検索条件を満たしていなければ、そのプロファイルに関連付けられたデータファイルの検索をスキップするステップと、
    前記プロファイルに検索条件の特徴が記録されていないと判定したときに、該プロファイルに関連付けられたデータファイルを検索すると共に、その検索結果に基づいてプロファイルを更新するステップと、
    前記データファイルを検索した検索結果を返信するステップと、
    を実現させるためのデータファイル検索プログラム。
  2. 前記コンピュータに、前記データファイルに関連付けられたプロファイルが存在しないとき、該プロファイルを新たに作成するステップを更に実現させるための請求項1記載のデータファイル検索プログラム。
  3. 前記コンピュータに、前記プロファイルの更新日時がこれに関連付けられたデータファイルの更新日時より古いとき、該データファイルの検索結果に基づいてプロファイルを更新するステップを更に実現させるための請求項1又は請求項2に記載のデータファイル検索プログラム。
  4. 複数のデータファイルに夫々関連付けられつつ検索条件の特徴が記録され得るプロファイルを格納する記録装置と、
    検索条件を付属情報とした検索要求があったときに、前記記録装置に格納されたプロファイルを順次参照し、該プロファイルに検索条件の特徴が記録されているか否かを判定する判定手段と、
    前記判定手段によりプロファイルに検索条件の特徴が記録されていると判定されたときに、該特徴が付属情報の検索条件を満たしていれば、そのプロファイルに関連付けられたデータファイルの検索を実行する一方、該特徴が付属情報の検索条件を満たしていなければ、そのプロファイルに関連付けられたデータファイルの検索をスキップする第1の検索手段と、
    前記判定手段によりプロファイルに検索条件の特徴が記録されていないと判定されたときに、該プロファイルに関連付けられたデータファイルを検索すると共に、その検索結果に基づいてプロファイルを更新する第2の検索手段と、
    前記第1の検索手段又は第2の検索手段によるデータファイルの検索結果を返信する返信手段と、
    を含んで構成されたことを特徴とするデータファイル検索装置。
JP2008247370A 2008-09-26 2008-09-26 データファイル検索プログラム及びデータファイル検索装置 Pending JP2010079613A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008247370A JP2010079613A (ja) 2008-09-26 2008-09-26 データファイル検索プログラム及びデータファイル検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008247370A JP2010079613A (ja) 2008-09-26 2008-09-26 データファイル検索プログラム及びデータファイル検索装置

Publications (1)

Publication Number Publication Date
JP2010079613A true JP2010079613A (ja) 2010-04-08

Family

ID=42209978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008247370A Pending JP2010079613A (ja) 2008-09-26 2008-09-26 データファイル検索プログラム及びデータファイル検索装置

Country Status (1)

Country Link
JP (1) JP2010079613A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016153972A (ja) * 2015-02-20 2016-08-25 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145284A (ja) * 1997-07-28 1999-02-16 Just Syst Corp プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001075983A (ja) * 1999-09-03 2001-03-23 Fuji Photo Film Co Ltd データベース検索システムおよび方法
JP2001236362A (ja) * 2000-02-25 2001-08-31 Hitachi Ltd 情報検索出力装置及び方法
JP2003281182A (ja) * 2002-03-19 2003-10-03 Seiko Epson Corp 情報検索装置、情報検索方法、プログラムおよび記録媒体
JP2005275550A (ja) * 2004-03-23 2005-10-06 Nissan Motor Co Ltd 車載用情報提示装置
JP2006302136A (ja) * 2005-04-22 2006-11-02 Fujitsu Ltd 情報検索依頼装置
JP2008176545A (ja) * 2007-01-18 2008-07-31 Cosmotec Patent Information Systems Inc データ検索のためのコンピュータシステムとそれを実現するためのコンピュータプログラムとその方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145284A (ja) * 1997-07-28 1999-02-16 Just Syst Corp プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001075983A (ja) * 1999-09-03 2001-03-23 Fuji Photo Film Co Ltd データベース検索システムおよび方法
JP2001236362A (ja) * 2000-02-25 2001-08-31 Hitachi Ltd 情報検索出力装置及び方法
JP2003281182A (ja) * 2002-03-19 2003-10-03 Seiko Epson Corp 情報検索装置、情報検索方法、プログラムおよび記録媒体
JP2005275550A (ja) * 2004-03-23 2005-10-06 Nissan Motor Co Ltd 車載用情報提示装置
JP2006302136A (ja) * 2005-04-22 2006-11-02 Fujitsu Ltd 情報検索依頼装置
JP2008176545A (ja) * 2007-01-18 2008-07-31 Cosmotec Patent Information Systems Inc データ検索のためのコンピュータシステムとそれを実現するためのコンピュータプログラムとその方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016153972A (ja) * 2015-02-20 2016-08-25 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム

Similar Documents

Publication Publication Date Title
US20140164391A1 (en) Data block saving system and method
JP2015181059A5 (ja) 情報をユーザに送る方法、コンピュータ読み取り可能な記録媒体、および情報収集方法
JP2008226061A (ja) 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム
JP6870466B2 (ja) 制御プログラム、制御方法、制御装置、及びデータベースサーバ
US9135266B1 (en) System and method for enabling electronic discovery searches on backup data in a computer system
US8595190B2 (en) Methods and apparatus related to completion of large objects within a DB2 database environment
JP2011191862A (ja) ファイル管理装置、ファイル管理システム、およびファイル管理プログラム
US20240152498A1 (en) Data storage using vectors of vectors
JP4237813B2 (ja) 構造化文書管理システム
JP5106062B2 (ja) ファイル検索方法、ファイル検索装置、検索システム、及び、ファイル検索プログラム
US20170316017A1 (en) Multi hard-disk file management system and method thereof
JP2005242904A (ja) 文書群分析装置、文書群分析方法、文書群分析システム、プログラムおよび記録媒体
JP4612834B2 (ja) 文書管理システム、文書検索方法、コンピュータプログラム、文書検索装置
JP2010079613A (ja) データファイル検索プログラム及びデータファイル検索装置
KR20190129474A (ko) 데이터 검색 장치 및 방법
US11126592B2 (en) Rapid indexing of document tags
JP6349682B2 (ja) 情報管理プログラム、装置、及び方法
JP6916136B2 (ja) 検索支援装置、検索支援方法、及び検索支援プログラム
JP2010003051A (ja) 文書情報処理装置、及びプログラム
JP5943991B2 (ja) ファイル誤削除防止プログラム及びファイル誤削除防止機能を備えたWebサーバ
US11853325B2 (en) Data storage using vectors of vectors
JP6881124B2 (ja) 検索制御プログラム、検索制御方法および検索制御装置
JP4455068B2 (ja) 情報検索システム
JP5316015B2 (ja) 情報処理装置及びプログラム
JP4304226B2 (ja) 構造化文書管理システム、構造化文書管理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130507

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130723