JP3429225B2 - Storage medium storing data search program - Google Patents
Storage medium storing data search programInfo
- Publication number
- JP3429225B2 JP3429225B2 JP20748599A JP20748599A JP3429225B2 JP 3429225 B2 JP3429225 B2 JP 3429225B2 JP 20748599 A JP20748599 A JP 20748599A JP 20748599 A JP20748599 A JP 20748599A JP 3429225 B2 JP3429225 B2 JP 3429225B2
- Authority
- JP
- Japan
- Prior art keywords
- file
- data
- degree
- information acquisition
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】[0001]
【発明の属する技術分野】この発明は、データ検索装置
に関し、特にデータ格納部の更新に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data search device, and more particularly to updating a data storage unit.
【0002】[0002]
【従来の技術】今日、インターネットに接続されたコン
ピュータには膨大な情報が記憶されている。かかる膨大
な情報から操作者が欲する情報を取得するために、出願
人は情報発掘プログラム「インターネットブーメラン
(TM)」を開発した。2. Description of the Related Art Today, a vast amount of information is stored in computers connected to the Internet. In order to obtain the information that the operator wants from such enormous amount of information, the applicant has discovered the information excavation program “Internet Boomerang.
(TM) "was developed.
【0003】かかるプログラムをインストールしたコン
ピュータの動作について、簡単に説明する。操作者は、
取得希望のデータが記憶されている情報源として、特定
のURL(Uniform Resource Locatior)および情報取
得時刻を入力する。例えば、情報源としては、”http:/
/www.justsystem.co.jp/news/taro/”というように特定
する。これにより、特定されたURL”http://www.jus
tsystem.co.jp/news/taro/”が、情報源として記憶され
る。情報取得時刻は、例えば、毎日03時00分と入力
する。これにより、かかるプログラムがインストールさ
れたコンピュータは、設定された情報取得時刻”03時
00分”になると、この情報源に記憶されたファイルを
読み出し、ハードディスクに記憶する。なお、ハードデ
ィスクにファイル毎、データが記憶される場合には、検
索のための検索タームも生成される。前記検索タームお
よびファイルを記憶する領域は情報ボックスと呼ばれ
る。なお、情報ボックスに記憶する情報源としては、U
RLだけでなく、自己のメールボックスやフォルダを特
定することもできる。The operation of the computer in which such a program is installed will be briefly described. The operator
A specific URL (Uniform Resource Locatior) and information acquisition time are input as the information source in which the data desired to be acquired is stored. For example, the information source is "http: /
It is specified as "/www.justsystem.co.jp/news/taro/". By this, the specified URL "http: //www.jus
tsystem.co.jp/news/taro/ ”is stored as an information source. For the information acquisition time, for example, enter 03:00 every day. With this, the computer on which such a program is installed is set. When the information acquisition time "03:00" is reached, the file stored in this information source is read out and stored in the hard disk. If data is stored for each file in the hard disk, a search for search is performed. An area for storing the search terms and files is called an information box, and the source of information stored in the information box is U.
Not only the RL but also its own mailbox or folder can be specified.
【0004】データ検索処理について説明する。操作者
は、自己の情報ボックスに記憶されたデータから所望の
データを取り出すために、問い合わせ文を入力する。こ
の問い合わせ文に基づいて検索用のキーワードが決定さ
れ、検索タームとの類似度が演算され、検索が行われ
る。検索結果は、図11に示すように、リスト表示部1
54に各文書が評価順に表示される。操作者によって、
いずれかの文書が特定されると、ビュー領域152に選
択された文書の内容が表示される。The data search process will be described. The operator inputs an inquiry sentence to retrieve desired data from the data stored in his / her information box. A keyword for search is determined based on this inquiry sentence, the degree of similarity with the search term is calculated, and the search is performed. As shown in FIG. 11, the search results are displayed in the list display unit 1
Each document is displayed at 54 in the order of evaluation. Depending on the operator
When any document is specified, the content of the selected document is displayed in the view area 152.
【0005】このように、操作者は、自分が興味あるU
RLを特定するだけで、自動的にそのURLに存在する
情報が自己のコンピュータに記憶される。そして、所望
の時刻に所望の情報を検索して取り出すことができる。
さらに、前記情報ボックスは、前記情報取得時期を設定
することにより、所定の時刻に自動更新することもでき
る。したがって、前記情報ボックスは、操作者にとって
カスタマイズされた情報源となる。In this way, the operator is interested in the U
The information existing in the URL is automatically stored in the own computer only by specifying the RL. Then, desired information can be searched and retrieved at a desired time.
Further, the information box can be automatically updated at a predetermined time by setting the information acquisition time. Therefore, the information box is a customized source of information for the operator.
【0006】[0006]
【発明が解決しようとする課題】前記情報ボックスに記
憶されるデータは、操作者の指定または自動巡回によっ
て、どんどん膨大なものとなる。これにより、ハードデ
ィスクへは情報源として価値のある情報か、そうでない
かにかかわらずに、データが蓄積される。したがって、
膨大な記憶領域が必要となるとともに、検索にも時間が
かかるという問題があった。特に、自動巡回先の階層を
複数階層とし、さらに同一サイト以外のファイルも取り
込むようにした場合には、上記問題が深刻となる。The data stored in the information box becomes more and more huge by the operator's designation or automatic patrol. As a result, data is accumulated in the hard disk regardless of whether the information is valuable as an information source or not. Therefore,
There is a problem that a huge storage area is required and that searching also takes time. In particular, when the hierarchy of the automatic patrol destination is a plurality of hierarchies and the files other than the same site are taken in, the above problem becomes serious.
【0007】かかる問題を解決するために、操作者が1
つ1つの情報源をブラウザで確認して、不要なものは削
除することも考えられる。しかし、情報源が多数ある場
合にはかかる作業は非常に煩雑である。In order to solve such a problem, the operator has
It is possible to check each information source with a browser and delete unnecessary ones. However, when there are many information sources, such work is very complicated.
【0008】この発明は上記問題を解決し、情報取得元
データおよびスケジュールデータに基づいて、自動更新
されるファイルを収集したデータ格納部を簡易にかつ、
的確に更新できるデータ検索装置またはその方法を提供
することを目的とする。The present invention solves the above problems and simplifies a data storage unit that collects files that are automatically updated based on information acquisition source data and schedule data, and
It is an object of the present invention to provide a data retrieving apparatus or method that can be updated accurately.
【0009】[0009]
【課題を解決するための手段および発明の効果】1)本
発明にかかるプログラムを記憶した記録媒体において
は、前記データ格納部に記憶された各ファイルは、当該
ファイルが取得された元所在位置を示す情報取得元デー
タおよび、前記データ格納部に記憶されたファイルを更
新するスケジュールデータに基づいて、自動更新され、
前記検索条件に対するヒット履歴に基づいて、前記各フ
ァイルの検索時における不利用度が演算され、前記デー
タ格納部のデータが洗練される。このように、前記自動
更新されるデータを、与えられた検索条件に対する不利
用度に基づいて、洗練することにより、前記データ格納
部のデータを操作者の意図に合致したデータに洗練する
ことができる。したがって、操作者が全ファイルの中身
を確認することなく、データの洗練が可能となる。これ
により、自動更新されるデータ格納部であっても、無駄
なデータがつぎつぎに追加記憶されることが防止でき
る。Means for Solving the Problems and Effects of the Invention 1) In the recording medium storing the program according to the present invention, each file stored in the data storage unit has the original location where the file is acquired. Based on the information acquisition source data shown and schedule data for updating the file stored in the data storage unit,
The degree of non-use at the time of searching each of the files is calculated based on the hit history for the search condition, and the data in the data storage unit is refined. As described above, by refining the automatically updated data based on the degree of non-use with respect to a given search condition, the data in the data storage unit can be refined into data that matches the intention of the operator. it can. Therefore, the operator can refine the data without checking the contents of all the files. As a result, it is possible to prevent unnecessary data from being additionally stored one after another even in the data storage unit that is automatically updated.
【0010】また、本発明にかかるプログラムを記憶し
た記録媒体においては、前記洗練処理は、操作者への前
記不利用度を報知した後、前記操作者からの指示に応じ
て実行される。したがって、操作者が洗練処理の内容を
確認することができる。In the recording medium storing the program according to the present invention, the refining process is executed in response to an instruction from the operator after notifying the operator of the degree of non-use. Therefore, the operator can confirm the details of the refinement processing.
【0011】また、本発明にかかるプログラムを記憶し
た記録媒体においては、前記洗練処理は、所定の規則に
基づいた自動洗練処理である。したがって、操作者が洗
練内容を確認することなく、洗練処理が行われる。In the recording medium storing the program according to the present invention, the refinement process is an automatic refinement process based on a predetermined rule. Therefore, the refinement processing is performed without the operator confirming the refinement content.
【0012】2)本発明にかかるプログラムを記憶した
記録媒体においては、前記検索条件に対する各ファイル
毎のヒット履歴に基づいて、前記各ファイルの不利用度
を演算する。したがって、前記ファイル毎に前記洗練処
理が可能となる。2) In the recording medium storing the program according to the present invention, the degree of non-use of each file is calculated based on the hit history of each file with respect to the search condition. Therefore, the refinement processing can be performed for each file.
【0013】3)本発明にかかるプログラムを記憶した
記録媒体においては、前記情報取得元データ毎のヒット
履歴に基づいて、前記各ファイルの不利用度を演算す
る。3) In the recording medium storing the program according to the present invention, the degree of non-use of each file is calculated based on the hit history of each information acquisition source data.
【0014】したがって、前記情報取得源データ毎に前
記洗練処理が可能となる。Therefore, the refinement processing can be performed for each of the information acquisition source data.
【0015】4)本発明にかかるプログラムを記憶した
記録媒体においては、前記洗練処理は、操作者からの指
示または前記自動削除ファイル決定処理によって特定し
たファイルの削除である。このように、検索に利用され
ないファイルを削除することにより、データ格納部のデ
ータを、操作者の検索条件にマッチしたデータとするこ
とができる。4) In the recording medium storing the program according to the present invention, the refinement processing is deletion of a file specified by an operator's instruction or the automatic deletion file determination processing. In this way, by deleting the files that are not used for the search, the data in the data storage unit can be made the data that matches the search condition of the operator.
【0016】5)本発明にかかるプログラムを記憶した
記録媒体においては、前記洗練処理は、操作者からの指
示または前記自動削除ファイル決定処理によって特定し
たファイルを更新しないための、前記情報取得元データ
の削除である。したがって、検索に利用されない情報源
のデータについてはデータ取得されなくなり、前記デー
タ格納部から、操作者の検索条件にマッチしないデータ
が更新されることがない。5) In the recording medium storing the program according to the present invention, the refining process does not update the file specified by the operator's instruction or the automatic deletion file determination process, and the information acquisition source data. Deleted. Therefore, the data of the information source that is not used for the search is not acquired, and the data that does not match the search condition of the operator is not updated from the data storage unit.
【0017】6)本発明にかかるプログラムを記憶した
記録媒体においては、前記削除するファイルとともに、
これに対応する情報取得元データも削除する。したがっ
て、検索に利用されない情報源からはデータ取得されな
くなるとともに、前記データ格納部から操作者の検索条
件にマッチしたデータを削除することができる。6) In the recording medium storing the program according to the present invention, together with the file to be deleted,
The information acquisition source data corresponding to this is also deleted. Therefore, the data is not acquired from the information source that is not used for the search, and the data that matches the search condition of the operator can be deleted from the data storage unit.
【0018】7)本発明にかかるプログラムを記憶した
記録媒体においては、前記情報取得元データとともに、
対応するファイルを削除する。これにより、前記データ
格納部から操作者の検索条件にマッチしたデータを削除
することができるとともに、検索に利用されない情報源
からもデータ取得されなくなる。7) In the recording medium storing the program according to the present invention, together with the information acquisition source data,
Delete the corresponding file. This makes it possible to delete the data matching the operator's search condition from the data storage unit, and prevent the data from being acquired even from the information source not used for the search.
【0019】8)本発明にかかるプログラムを記憶した
記録媒体においては、前記検索条件に対する各ファイル
毎のヒット履歴に基づいて、前記各ファイルの不利用度
を演算し、操作者から指示されたファイルを削除すると
ともに、当該ファイルが更新されないための更新不可情
報を与える。したがって、したがって、前記データ格納
部から操作者の検索条件にマッチしないデータは削除す
るとともに、その情報源からのデータが前記データ格納
部に記憶されることがない。8) In the recording medium storing the program according to the present invention, the degree of non-use of each file is calculated based on the hit history of each file with respect to the search condition, and the file instructed by the operator is calculated. And the non-updatable information for not updating the file. Therefore, therefore, the data that does not match the operator's search condition is deleted from the data storage unit, and the data from the information source is not stored in the data storage unit.
【0020】9)本発明にかかるデータ検索装置におい
ては、1)複数のファイルを記憶するファイル記憶手段、
2)操作者が、検索条件を入力する検索条件入力手段、3)
前記ファイル記憶手段に記憶されたファイルのうち、前
記検索条件に合致するタームを含むファイルを検索する
検索手段、4)前記ファイル記憶手段に記憶されたファイ
ルが取得された元所在位置を示す情報取得元データおよ
び、前記ファイルを更新するスケジュールデータを記憶
する更新情報記憶手段、5)前記情報取得元データおよび
スケジュールデータに基づいて、前記ファイルを更新す
る更新手段、6)前記検索条件に対するヒット履歴に基づ
いて、前記各ファイルの検索時における不利用度を演算
する検索不利用度演算手段、7)前記不利用度に基づい
て、前記ファイル記憶手段のデータを洗練する洗練手段
を備えている。このように、前記自動更新されるデータ
を、与えられた検索条件に対するヒット履歴に基づい
て、洗練することにより、前記ファイル記憶手段のデー
タを操作者の意図に合致したデータに洗練することがで
きる。したがって、操作者が全ファイルの中身を確認す
ることなく、データの洗練が可能となる。これにより、
前記ファイル記憶手段のデータが自動更新される場合で
あっも、無駄なデータがつぎつぎに記憶されることが防
止できる。9) In the data search device according to the present invention, 1) file storage means for storing a plurality of files,
2) Search condition input means for the operator to input search conditions, 3)
Retrieval means for retrieving a file containing a term that matches the retrieval condition among the files stored in the file storage means, 4) Obtaining information indicating the original location of the file stored in the file storage means Original data and update information storage means for storing schedule data for updating the file, 5) update means for updating the file based on the information acquisition source data and schedule data, 6) hit history for the search condition Based on the above, the search non-use degree calculating means for calculating the non-use degree at the time of searching each file, and 7) a refining means for refining the data in the file storage means based on the non-use degree. As described above, by refining the automatically updated data based on the hit history for a given search condition, the data in the file storage means can be refined into data that matches the intention of the operator. . Therefore, the operator can refine the data without checking the contents of all the files. This allows
Even when the data in the file storage means is automatically updated, useless data can be prevented from being stored one after another.
【0021】10)本発明にかかるデータ検索方法にお
いては、検索条件が与えられると、データ格納部に記憶
されたファイルのうち、前記検索条件に合致するターム
を含むファイルを特定するデータ検索方法であって、前
記データ格納部に記憶された各ファイルは、当該ファイ
ルが取得された元所在位置を示す情報取得元データおよ
び、前記データ格納部に記憶されたファイルを更新する
スケジュールデータに基づいて、自動更新され、前記検
索条件に対するヒット履歴に基づいて、前記各ファイル
の検索時における不利用度を演算し、前記データ格納部
のデータを洗練する。10) In the data search method according to the present invention, when a search condition is given, a file search method that specifies a file including a term that matches the search condition among the files stored in the data storage unit. Then, each file stored in the data storage unit, based on the information acquisition source data indicating the original location where the file was acquired, and the schedule data for updating the file stored in the data storage unit, It is automatically updated, and the degree of non-use at the time of searching each of the files is calculated based on the hit history for the search condition, and the data in the data storage unit is refined.
【0022】このように、前記自動更新されるデータ
を、与えられた検索条件に対するヒット履歴に基づい
て、洗練することにより、前記データ格納部のデータを
操作者の意図に合致したデータに洗練することができ
る。したがって、操作者が全ファイルの中身を確認する
ことなく、データの洗練が可能となる。これにより、自
動更新されるデータ格納部であっても、無駄なデータが
つぎつぎに記憶されることが防止できる。As described above, by refining the automatically updated data based on the hit history for the given search condition, the data in the data storage unit is refined into the data that matches the intention of the operator. be able to. Therefore, the operator can refine the data without checking the contents of all the files. As a result, useless data can be prevented from being stored one after another even in the data storage unit that is automatically updated.
【0023】11)本発明にかかるデータ検索方法にお
いては、検索条件が与えられると、データ格納部に記憶
されたファイルのうち、前記検索条件に合致するターム
を含むファイルを特定するデータ検索方法であって、前
記検索条件に対するヒット履歴に基づいて、前記各ファ
イルの検索時における不利用度を演算し、前記データ格
納部のデータを洗練処理する。このように、データを、
与えられた検索条件に対するヒット履歴に基づいて、洗
練することにより、前記データ格納部のデータを操作者
の意図に合致したデータに洗練することができる。した
がって、操作者が全ファイルの中身を確認することな
く、データの洗練が可能となる。11) In the data search method according to the present invention, when a search condition is given, the data search method specifies a file containing a term that matches the search condition among the files stored in the data storage unit. Then, the degree of non-use at the time of searching each of the files is calculated based on the hit history for the search condition, and the data in the data storage unit is refined. In this way, the data
By refining based on the hit history for a given search condition, the data in the data storage unit can be refined into data that matches the intention of the operator. Therefore, the operator can refine the data without checking the contents of all the files.
【0024】12)本発明にかかるプログラムを記憶し
た記録媒体においては、前記検索条件に対するヒット履
歴に基づいて、前記各ファイルの検索時における不利用
度が演算され、前記データ格納部のデータが洗練され
る。このように、データを、与えられた検索条件に対す
るヒット履歴に基づいて、洗練することにより、前記デ
ータ格納部のデータを操作者の意図に合致したデータに
洗練することができる。したがって、操作者が全ファイ
ルの中身を確認することなく、データの洗練が可能とな
る。12) In the recording medium storing the program according to the present invention, the degree of non-use at the time of searching each of the files is calculated based on the hit history for the search condition, and the data in the data storage unit is refined. To be done. As described above, by refining the data based on the hit history for the given search condition, the data in the data storage unit can be refined into the data that matches the intention of the operator. Therefore, the operator can refine the data without checking the contents of all the files.
【0025】以下に、特許請求の範囲に用いた用語と実
施形態との対応について説明する。The correspondence between the terms used in the claims and the embodiments will be described below.
【0026】「ファイル」:コンピュータがデータの入
出力を行う際に1つのまとまりとして把握するいわゆる
ファイルはもちろん、検索条件に合致するタームを取り
出して表示されるまとまりの最小単位のユニットも含む
概念である。"File": This is a concept that includes not only so-called files that a computer grasps as one group when data is input and output, but also the smallest unit of the group that is displayed by extracting terms that match the search conditions. is there.
【0027】「検索条件に合致するターム」:キーワー
ド検索の場合、直接入力されたキーワードと一致するタ
ームはもちろん、当該キーワードと関連するタームであ
ってもよい。さらに、自然文検索の場合、例えば、抽出
されたキーワードや、構文または意味解析によって特定
されたキーワードであってもよい。[Terms that match the search conditions]: In the case of keyword search, not only terms that match the directly input keyword but also terms that are related to the keyword may be used. Furthermore, in the case of a natural sentence search, for example, it may be an extracted keyword or a keyword specified by syntax or semantic analysis.
【0028】「洗練」とは、データの削除、データを非
検索対象とするなどの処理を含み、さらに、洗練前のデ
ータ格納部を残存させる場合、残存させない場合いずれ
をも含む。The term "refining" includes processing of deleting data, making data non-searchable, and the like, and further includes the case where the pre-refining data storage unit is left and the case where it is not left.
【0029】「ファイル記憶手段」:実施形態において
は、情報ボックス記憶部26bが該当する。"File storage means": In the embodiment, the information box storage unit 26b corresponds to this.
【0030】「データ格納部」:実施形態においては、
情報ボックス記憶部26bが該当する。"Data storage unit": In the embodiment,
The information box storage unit 26b corresponds to this.
【0031】「情報取得元データ」:実施形態において
は、図5の情報源特定データが該当する。"Information acquisition source data": In the embodiment, the information source specifying data of FIG. 5 is applicable.
【0032】「スケジュールデータ」:実施形態におい
ては、図6のスケジュールデータが該当する。"Schedule data": In the embodiment, the schedule data of FIG. 6 corresponds.
【0033】「更新不可情報」:実施形態においては、
作成禁止情報が該当する。"Unupdateable information": In the embodiment,
Creation prohibition information is applicable.
【0034】[0034]
【発明の実施の形態】1.機能ブロック図の説明
本発明の一実施形態を図面に基づいて説明する。図1に
示すデータ検索装置1は、ファイル記憶手段3、検索条
件入力手段5、検索手段7、更新情報記憶手段9、更新
手段11、検索不利用度演算手段13、および洗練手段
15を備えている。BEST MODE FOR CARRYING OUT THE INVENTION 1. Description of Functional Block Diagram One embodiment of the present invention will be described with reference to the drawings. The data search device 1 shown in FIG. 1 includes a file storage unit 3, a search condition input unit 5, a search unit 7, an update information storage unit 9, an update unit 11, a search disuse degree calculation unit 13, and a refinement unit 15. There is.
【0035】ファイル記憶手段3は、複数のファイルを
記憶する。検索条件入力手段5は、操作者が、検索条件
を入力する。検索手段7は、ファイル記憶手段3に記憶
されたファイルのうち、前記検索条件に合致するターム
を含むファイルを検索する。更新情報記憶手段9は、フ
ァイル記憶手段3に記憶されたファイルが取得された元
所在位置を示す情報取得元データおよび、前記ファイル
を更新するスケジュールデータを記憶する。更新手段1
1は、前記情報取得元データおよびスケジュールデータ
に基づいて、前記ファイルを更新する。検索不利用度演
算手段13は、前記検索条件に対するヒット履歴に基づ
いて、前記各ファイルの検索時における不利用度を演算
する。洗練手段15は、前記不利用度に基づいて、前記
ファイル記憶手段3のデータを洗練する。The file storage means 3 stores a plurality of files. The operator inputs the search condition to the search condition input means 5. The search unit 7 searches the files stored in the file storage unit 3 for a file including a term that matches the search condition. The update information storage means 9 stores information acquisition source data indicating the original location where the file stored in the file storage means 3 was acquired, and schedule data for updating the file. Update means 1
1 updates the file based on the information acquisition source data and the schedule data. The search disuse degree calculating means 13 calculates the degree of disuse at the time of searching each of the files based on the hit history for the search condition. The refining means 15 refines the data in the file storage means 3 based on the degree of non-use.
【0036】このように、前記自動更新されるデータ
を、与えられた検索条件に対するヒット履歴に基づい
て、洗練することにより、ファイル記憶手段3のデータ
を操作者の意図に合致したデータに洗練することができ
る。したがって、操作者が全ファイルの中身を確認する
ことなく、データの洗練が可能となる。これにより、前
記ファイル記憶手段3のデータが自動更新される場合で
あっも、無駄なデータがつぎつぎに記憶されることが防
止できる。As described above, by refining the automatically updated data based on the hit history for the given search condition, the data in the file storage means 3 is refined into the data that matches the intention of the operator. be able to. Therefore, the operator can refine the data without checking the contents of all the files. Thereby, it is possible to prevent useless data from being stored one after another even when the data in the file storage means 3 is automatically updated.
【0037】なお、情報取得元データとしては、TCP
/IPにおけるURLを採用したが、ネットワークに接
続されたコンピュータにおけるファイル配置位置を示す
ものであればどのようなものであってもよい。As the information acquisition source data, TCP is used.
Although the URL in / IP is adopted, any URL may be used as long as it indicates a file arrangement position in a computer connected to the network.
【0038】また、報知手段として表示手段を採用した
が、これ以外の報知手段を採用してもよい。Although the display means is adopted as the notification means, other notification means may be adopted.
【0039】2.ハードウェア構成
図1に示すデータ検索装置1のハードウェア構成につい
て説明する。図2に、図1に示すデータ検索装置1をC
PUを用いて実現したハードウェア構成の一例を示す。2. Hardware Configuration The hardware configuration of the data search device 1 shown in FIG. 1 will be described. FIG. 2 shows the data search device 1 shown in FIG.
An example of the hardware configuration realized using PU is shown.
【0040】データ検索装置1は、CPU23、メモリ
27、ハードディスク26、CRT30、FDD25、
キーボード28、マウス31およびバスライン29を備
えている。CPU23は、ハードディスク26に記憶さ
れた制御プログラムにしたがいバスライン29を介し
て、各部を制御する。The data retrieval device 1 includes a CPU 23, a memory 27, a hard disk 26, a CRT 30, an FDD 25,
A keyboard 28, a mouse 31, and a bus line 29 are provided. The CPU 23 controls each unit via the bus line 29 according to the control program stored in the hard disk 26.
【0041】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク(F
D)25aから読み出されてハードディスク26にイン
ストールされたものである。なお、フレキシブルディス
ク以外に、CD−ROM、ICカード等のプログラムを
実体的に一体化したコンピュータ可読の記録媒体から、
ハードディスクにインストールさせるようにしてもよ
い。さらに、通信回線を用いてダウンロードするように
してもよい。This control program is stored on the flexible disk (F
D) It is read from 25a and installed in the hard disk 26. In addition to the flexible disk, from a computer-readable recording medium in which programs such as a CD-ROM and an IC card are substantially integrated,
It may be installed on the hard disk. Furthermore, you may make it download using a communication line.
【0042】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。In this embodiment, the program is installed from the flexible disk to the hard disk 26 so that the program stored in the flexible disk is indirectly executed by the computer. However, the program stored in the flexible disk is not limited to this.
It may be directly executed from. Note that programs that can be executed by a computer include programs that can be directly executed simply by installing them as they are, and programs that need to be converted to another form (for example,
It also includes those that can be executed in combination with other module parts, such as decompressing data compressed data).
【0043】ハードディスク26には、プログラム記憶
部26a、情報ボックス記憶部26b、情報ボックス作
成データ記憶部26cを有する記憶装置である。プログ
ラム記憶部26aには、後述するプログラムが記憶され
ている。The hard disk 26 is a storage device having a program storage unit 26a, an information box storage unit 26b, and an information box creation data storage unit 26c. The program storage unit 26a stores a program to be described later.
【0044】情報ボックス記憶部26bには、情報ボッ
クス「私の趣味」、および情報ボックス「釣情報」とい
う2つの情報ボックスが記憶されている。各情報ボック
スは、データ検索用のデータを記憶したファイルおよ
び、このファイルから検索用に生成した抽出タームで構
成されている。なお、各情報ボックスは、CPU23は
1つのファイルとして取り扱う。図3に、各ファイルの
データ構造を示す。例えば、ファイル「http://www.tur
i.co.jp/news/A.html」は、「・・・釣りは・・・鮎に
・・・」という内容と、このファイルから抽出されたタ
ーム番号と、ヒット回数とが記憶されている。図4に抽
出タームのデータ構造を示す。1番目の抽出ターム「釣
り」は、抽出ファイル名と、その抽出位置が記憶されて
いる。これにより、あるタームがいずれのファイルのど
この位置に存在するかを特定することができるととも
に、各ファイルからいずれのタームが抽出されたかを特
定することができる。なお、ヒット回数については後述
する。The information box storage section 26b stores two information boxes: an information box "My hobby" and an information box "fishing information". Each information box is composed of a file storing data for data search and an extraction term generated from this file for search. Note that each information box is handled by the CPU 23 as one file. FIG. 3 shows the data structure of each file. For example, the file "http: //www.tur
"i.co.jp/news/A.html" stores the contents of "... fishing ... ayu ...", the term numbers extracted from this file, and the number of hits. There is. FIG. 4 shows the data structure of the extraction term. The first extraction term "fishing" stores the extraction file name and its extraction position. This makes it possible to specify in which file and in which position a certain term exists, and to specify which term was extracted from each file. The number of hits will be described later.
【0045】また、新しいファイルが記憶されると、そ
のファイルのデータから所定の抽出規則にてタームを抽
出し、既に他のファイルから抽出されたタームであれ
ば、抽出ファイル名および抽出位置を追加し、新しいタ
ームであれば図4の抽出タームテーブルに追加される。
これにより、各文書から抽出されるタームの管理が容易
となるとともに、各ファイル毎に抽出タームを記憶する
場合と比べて、全データ容量を削減することができる。When a new file is stored, a term is extracted from the data of the file according to a predetermined extraction rule, and if it is a term already extracted from another file, the extraction file name and extraction position are added. However, if it is a new term, it is added to the extracted term table of FIG.
This facilitates the management of terms extracted from each document, and can reduce the total data volume as compared with the case where the extracted terms are stored for each file.
【0046】情報ボックス作成データ記憶部26cに
は、情報ボックス記憶部26bに記憶された各情報ボッ
クスについて、対応する情報ボックス作成データが記憶
されている。情報ボックス作成データは、情報取得元デ
ータである情報源特定データおよび、スケジュールデー
タで構成されている。情報ボックス「釣情報」の情報源
特定データのデータ構造を図5に示す。図5には、情報
ボックス「釣情報」を構成する複数の情報源が記憶され
ている。The information box creation data storage unit 26c stores information box creation data corresponding to each information box stored in the information box storage unit 26b. The information box creation data is composed of information source specifying data, which is information acquisition source data, and schedule data. The data structure of the information source specifying data of the information box "fishing information" is shown in FIG. In FIG. 5, a plurality of information sources forming the information box “fishing information” are stored.
【0047】情報源のデータ構造について説明する。
「情報源id」は情報源のidを示しており、図5で
は、No1の情報源は、「http://www.turi.co.jp/news
/index.html」とウェブサイトのURL(以下、URL
と略す)で示されている。No2の情報源は、ローカル
ディスクのフォルダ「D:\DOCS/fishing」が情報源であ
る。No3の情報源は、「Mail-OLX:///受信トレイ/」
とメールボックス名で示されている。なお、OLXとは、
マイクロソフト社製のメールソフト「アウトルックエク
スプレス(商標)」を示す。No4の情報源は、ブラウ
ザのブックマークを示している。「NS4://user/nishi」
とは、ブラウザ「ネットスケープ4」の「user/nishi」
のブックマークフォルダを示している。No5、6の情
報源はNo1の情報源と同様にURLで示されている。The data structure of the information source will be described.
The “information source id” indicates the id of the information source. In FIG. 5, the No. 1 information source is “http://www.turi.co.jp/news”.
/index.html "and the URL of the website (hereinafter, URL
Abbreviated). The information source of No. 2 is the folder "D: \ DOCS / fishing" on the local disk. No3 information source is "Mail-OLX: /// Inbox /"
And the mailbox name. What is OLX?
Indicates the email software "Outlook Express (trademark)" manufactured by Microsoft Corporation. The information source of No. 4 indicates the bookmark of the browser. "NS4: // user / nishi"
Is "user / nishi" of browser "Netscape 4"
Shows the bookmark folder. The information sources of Nos. 5 and 6 are indicated by URLs like the information source of No. 1.
【0048】「タイプ」とは情報源の種類を示し、「ウ
ェブ(www)」、「ファイル(file)」、または
「メール(Mail)」のいずれかである。ウェブタイ
プとは情報源がウェブである場合に、ブックマーク(=
2)かURL(=1)のいずれで特定されているかを示
している。「サブフォルダ」とは、情報源がフォルダで
ある場合に、その下部階層のサブフォルダを対象とする
(=1)か、対象としない(=0)を示している。例え
ば、No2の情報源はフォルダ「D:\DOCS/」に格納され
ているファイルおよびその全サブフォルダに格納されて
いる全ファイルが対象となる。「階層」とは、リンク先
のファイルをどの階層まで情報源とするかを示してい
る。例えば、No1の情報源は「階層」=1であるの
で、「http://www.turi.co.jp/news/index.html」が、
図6に示すようなデータである場合には、当該ファイル
からのリンク先であるファイルhttp://www.turi.co.jp/
news/index.html/A.html、ファイルhttp://www.turi.c
o.jp/news/index.html/B.html,ファイルhttp://www.tu
ri.co.jp/news/index.html/C.htmlの3つのファイルが
対象となる。「同一サイトのみ」とは、リンク先を同一
サイトに限定する(=0)か限定しない(=1)かをこ
とを示す。例えば、リンク先が同一サイトに限定されて
いる場合には、仮に指定された階層内のファイルでも、
他のサイトのファイルは情報源にはならない。The "type" indicates the type of information source, and is one of "web", "file", and "mail". A web type is a bookmark (=
It indicates whether it is specified by 2) or URL (= 1). The “subfolder” indicates that when the information source is a folder, the subfolder in the lower hierarchy is targeted (= 1) or not targeted (= 0). For example, the No. 2 information source is the files stored in the folder “D: \ DOCS /” and all the files stored in all its subfolders. The “hierarchy” indicates up to which hierarchy the linked file is used as an information source. For example, the number 1 information source is "layer" = 1, so "http://www.turi.co.jp/news/index.html"
If the data is as shown in Fig. 6, the file linked from the file is http://www.turi.co.jp/
news / index.html / A.html, file http: //www.turi.c
o.jp/news/index.html/B.html, file http: //www.tu
Three files of ri.co.jp/news/index.html/C.html are targeted. “Only same site” indicates whether the link destination is limited to the same site (= 0) or not (= 1). For example, if the link destination is limited to the same site, even if the file in the temporarily specified hierarchy,
Files on other sites are not sources.
【0049】このように、情報源idは、URLを直接
的に特定することはもちろん、ブックマークのフォルダ
のようにURLを間接的に特定することもできる。ま
た、ファイルもファイルを直接または所属しているフォ
ルダを指定することにより間接的に指定することかでき
る。As described above, the information source id can directly specify the URL as well as indirectly specify the URL like a bookmark folder. Also, the file can be designated directly or indirectly by designating the folder to which the file belongs.
【0050】図7にスケジュール情報を示す。図7A
は、情報ボックス「釣情報」のスケジュール情報であ
り、更新タイプは「毎週土曜日」で、更新時刻は「0
3:00」、更新手法は「追加」であることを示す。更
新手法「追加」とは、更新するデータについて、追加さ
れたデータは図3に示すテーブルに追加し、削減された
データは消去フラグをセットして、実際上は検索対象と
しないようにする手法をいう。 以上説明したように、
情報ボックス作成データは、対応する情報ボックスのデ
ータの収集元およびその収集手法が設定されており、情
報ボックス作成データが新たに設定されると、これに基
づいて、新たな情報ボックスが生成される。情報ボック
ス作成データは、格納データ復元情報としての機能を有
する。FIG. 7 shows schedule information. Figure 7A
Is schedule information in the information box "fishing information", the update type is "every Saturday", and the update time is "0".
3:00 ”, indicating that the updating method is“ addition ”. The update method "addition" is a method of adding the added data to the table shown in FIG. 3 and setting the deletion flag for the reduced data so that the updated data is not actually a search target. Say. As explained above,
In the information box creation data, the collection source and the collection method of the corresponding information box data are set, and when the information box creation data is newly set, a new information box is generated based on this. . The information box creation data has a function as stored data restoration information.
【0051】なお、情報ボックス「私の趣味」と、情報
ボックス作成データ「私の趣味」についても、同様のデ
ータ構造でデータが記憶されている。なお、情報ボック
ス作成データ「私の趣味」のスケジュール情報につい
て、図7Bを用いて説明する。このスケジュール情報で
は、更新手法「再作成」である。更新手法「再作成」と
は、既に存在する図3、図4のテーブルを破棄し、新た
に作成し直すことを意味する。再作成する場合には、デ
ータ量は無駄な領域が発生しないが、更新終了までの時
間が長くなる。一方、図7Aに示すように、追加する場
合には、データ量は無駄な領域が発生するが、更新終了
までの時間が短くなる。The information box "my hobby" and the information box creation data "my hobby" are also stored in the same data structure. The schedule information of the information box creation data “my hobby” will be described with reference to FIG. 7B. In this schedule information, the update method is “recreate”. The update method “re-creation” means that the existing tables in FIGS. 3 and 4 are discarded and re-created. In the case of re-creation, a wasteful area does not occur in the data amount, but the time until the end of updating becomes long. On the other hand, as shown in FIG. 7A, when data is added, a wasteful area is generated in the data amount, but the time until the end of the update becomes short.
【0052】メモリ27にはその他、各種の演算結果等
が記憶される。The memory 27 also stores various calculation results and the like.
【0053】図3に示すヒット回数の記録について説明
する。ヒット回数は、操作者の問い合わせにどの程度合
致したファイルであるかを示す。検索時には、操作者
は、自己の情報ボックスに記憶されたデータから所望の
データを取り出すために、例えば、問い合わせ文「6月
の磯釣りの推奨ポイントを知りたい」と入力する。この
問い合わせ文に基づいて検索用のキーワード「6月、磯
釣り、ポイント」が決定され、各ファイルから抽出して
いる検索タームとの類似度が演算され、検索が行われ
る。各ファイルから抽出した抽出タームと前記検索用の
キーワードが1つ以上一致すれば、そのファイルのヒッ
ト回数は、1だけインクリメントされる。Recording of the number of hits shown in FIG. 3 will be described. The hit count indicates how well the file matches the operator's inquiry. At the time of search, the operator inputs, for example, an inquiry sentence “I want to know recommended points for surf fishing in June” in order to retrieve desired data from the data stored in the information box of the operator. Based on this inquiry sentence, the keyword "June, surf fishing, points" for search is determined, the similarity with the search term extracted from each file is calculated, and the search is performed. If the extracted terms extracted from each file match one or more of the search keywords, the hit count of the file is incremented by one.
【0054】3.フローチャート
つぎに、ハードディスク26のプログラム記憶部26a
に記憶されているプログラムについて、図8〜図9を用
いて説明する。以下では、情報ボックス「釣り情報」の
データを洗練する場合について説明する。3. Flowchart Next, the program storage unit 26a of the hard disk 26
The programs stored in will be described with reference to FIGS. Hereinafter, a case of refining the data of the information box “fishing information” will be described.
【0055】操作者は、洗練開始スイッチ(図示せず)
をマウスでクリックする。これにより、CPU23は、
図3に示すヒット回数の多い順に各ファイルをソート
し、CRT30に表示する(図8ステップS5)。表示
の一例を図9に示す。The operator operates the refinement start switch (not shown).
Click with the mouse. As a result, the CPU 23
The files are sorted in descending order of the number of hits shown in FIG. 3 and displayed on the CRT 30 (step S5 in FIG. 8). An example of the display is shown in FIG.
【0056】CPU23は、あるファイルについて詳細
表示命令が与えられるか否か判断しており(ステップS
7)。CPU23は、詳細表示命令が与えられると、特
定されたファイルの内容をビュー領域(図示せず)に表
示する(ステップS9)。本実施形態においては、ファ
イル名が表示されている領域の上で、マウスの左ボタン
をダブルクリックすることにより、詳細表示命令を与え
るようにした。The CPU 23 determines whether or not a detailed display command is given to a certain file (step S
7). When the detailed display command is given, the CPU 23 displays the content of the specified file in the view area (not shown) (step S9). In the present embodiment, the detailed display command is given by double-clicking the left mouse button on the area where the file name is displayed.
【0057】また、CPU23は、あるファイルについ
て削除命令が与えられるか否か判断しており(ステップ
S11)、あるファイルについて削除命令が与えられる
と、CPU23は、指定されたファイルを削除するとと
もに、作成禁止状態であることを示す作成禁止情報をハ
ードディスク26に記憶する(ステップS13)。作成
禁止情報については後述する。CPU3は、終了命令が
与えられるか否か判断しており(ステップS15)、終
了命令が与えられると、手動削除処理は終了する。CP
U23は、終了命令が与えられなければ、ステップS7
以下の処理を繰り返す。Further, the CPU 23 determines whether or not a deletion instruction is given for a certain file (step S11). When the deletion instruction is given for a certain file, the CPU 23 deletes the designated file and Creation prohibition information indicating that the creation is prohibited is stored in the hard disk 26 (step S13). The creation prohibition information will be described later. The CPU 3 determines whether or not an end instruction is given (step S15), and when the end instruction is given, the manual deletion process ends. CP
If the end command is not given, U23 carries out step S7.
The following processing is repeated.
【0058】このようにして、操作者の検索意図に沿わ
ないデータを記憶したファイルについては、ヒット回数
順にソートされたファイル一覧を参考にして簡易にこれ
を削除することができる。これにより情報ボックスを自
分の検索意図に合致した状態に洗練することができる。
すなわち、個人の興味に沿う情報を格納する情報ボック
スを、操作者の意図に沿って洗練するための洗練補助ツ
ールを提供することができる。As described above, with respect to the file storing the data which does not meet the operator's search intention, the file can be easily deleted with reference to the file list sorted in the order of the number of hits. This allows the information box to be refined to match the user's search intention.
That is, it is possible to provide a refinement assisting tool for refining an information box that stores information that is in line with an individual's interest, according to the operator's intention.
【0059】なお、図9に示す一覧表示には、あらかじ
めしきい値を定めておいて、これを超えるものは表示対
象からはずすようにしてもよい。このように、しきい値
以下のファイルだけを表示することにより、削除対象で
あるか否かの判断が迅速にできる。例えば、所定ヒット
回数以下のファイルのみを表示するようにしてもよい。
上記実施形態においては、操作者が内容を確認しなが
ら、不要なファイルを削除する場合について説明した
が、自動的にこれを削除することもできる。図10に自
動削除を行うフローチャートを示す。Note that threshold values may be set in advance in the list display shown in FIG. 9, and those exceeding the threshold values may be excluded from the display target. In this way, by displaying only the files that are equal to or less than the threshold value, it is possible to quickly determine whether or not the files are to be deleted. For example, only files with a predetermined hit count or less may be displayed.
In the above embodiment, the case where the operator deletes unnecessary files while checking the contents has been described, but it is also possible to automatically delete the unnecessary files. FIG. 10 shows a flowchart for performing automatic deletion.
【0060】CPU23は、ヒット回数の多い順に各フ
ァイルをソートする(図10ステップS21)。処理フ
ァイル番号iを初期化し(ステップS23)、i番目の
ファイルのヒット回数があらかじめ定められたしきい値
よりも小さいか否か判断する(ステップS25)。しき
い値は例えば、5回とする。i番目のファイルのヒット
回数があらかじめ定められたしきい値以下の場合には、
そのファイルを削除するとともに、作成禁止状態とする
(ステップS27)。そして、判断していないファイル
が存在するか否か判断する(ステップS29)
一方、i番目のファイルのヒット回数があらかじめ定め
られたしきい値以下でない場合には、ステップS27の
処理は行わずに、判断していないファイルが存在するか
否か判断する(ステップS29)。判断していないファ
イルが存在する場合には、処理ファイル番号iをインク
リメントし(ステップS31)、ステップS25以下の
処理を繰り返す。The CPU 23 sorts the files in descending order of the number of hits (step S21 in FIG. 10). The processed file number i is initialized (step S23), and it is determined whether the number of hits of the i-th file is smaller than a predetermined threshold value (step S25). The threshold value is, eg, 5 times. If the number of hits for the i-th file is less than or equal to a predetermined threshold,
The file is deleted and the creation is prohibited (step S27). Then, it is determined whether or not there is an undetermined file (step S29). On the other hand, if the hit count of the i-th file is not less than or equal to a predetermined threshold value, the process of step S27 is not performed. Then, it is determined whether or not there is an undetermined file (step S29). If there is a file that has not been determined, the processing file number i is incremented (step S31), and the processing from step S25 onward is repeated.
【0061】このようにあらかじめしきい値を設定して
おくことにより、ヒット回数の少ないファイルを自動的
に情報ボックスから削除することができる。By thus setting the threshold value in advance, it is possible to automatically delete a file having a small number of hits from the information box.
【0062】前記削除したファイルに関する作成禁止情
報について説明する。情報ボックスは、図5に示す情報
源特定データおよび図7に示すスケジュール情報に基づ
いて、設定された時刻に更新がなされる。ここで、情報
源idとして直接、URLやファイルを指定している場
合には、情報ボックスのファイルを削除する際に、対応
する情報源についてこれを削除すれば、一旦削除したフ
ァイルが情報ボックスに再作成されることはない。しか
し、情報源idをブックマークフォルダや、ローカルデ
ィスクのフォルダで間接的に特定している場合には、削
除したファイルだけが更新されないように情報源特定デ
ータを変更することは容易ではない。そこで、本実施形
態においては、一旦情報源特定データに基づいて全ファ
イルを収集した後、情報ボックスに格納する際に、フィ
ルタリング条件として、作成禁止のファイル名として選
別し、これと一致するファイルについては、情報ボック
スには書き込まないようにしている。これにより、情報
元idが間接的にファイルを特定している場合でも、必
要なファイルだけを更新することができる。The creation prohibition information regarding the deleted file will be described. The information box is updated at the set time based on the information source specifying data shown in FIG. 5 and the schedule information shown in FIG. 7. Here, if the URL or file is directly specified as the information source id, when deleting the file in the information box, if you delete this for the corresponding information source, the deleted file will be in the information box. It will not be recreated. However, when the information source id is indirectly specified by the bookmark folder or the folder on the local disk, it is not easy to change the information source specifying data so that only the deleted file is not updated. Therefore, in the present embodiment, once all the files are collected based on the information source specifying data and then stored in the information box, the file names that are prohibited to be created are selected as the filtering condition, and the files that match this are selected. Tries not to write in the info box. As a result, even if the information source id indirectly specifies the file, only the necessary file can be updated.
【0063】なお、情報源idとして直接、URLやフ
ァイルを指定している場合には、情報ボックスの各情報
源を削除するようにしてもよい。When a URL or a file is directly specified as the information source id, each information source in the information box may be deleted.
【0064】なお、上記各しきい値についてはこれを操
作者が指定できるようにすればよい。The operator may specify each of the above threshold values.
【0065】以上説明したように、自動巡回でウェブサ
イトを巡回して作成される情報ボックスについて、その
情報ボックスの検索する者の検索処理には無意味なファ
イルが記憶されていても、全ファイルについて操作者が
内容を検討することなる、削除される。As described above, regarding an information box created by patrol a website by automatic patrol, even if a meaningless file is stored in the retrieval process of the person who searches the information box, all files are stored. The operator will consider the content and will be deleted.
【0066】また、上記実施形態においてはヒット回数
の少ない場合を削除対象としたが、ヒット回数が多い場
合も、削除対象となる場合がある。例えば、リンク集の
ような目次ページである。必ず、毎回検索結果に表示さ
れる場合には、この可能性がもある。このような場合に
も、これを表示し、操作者に注意を喚起することができ
る。例えば、「このファイルは常時参照されています
が、不要ファイルではありませんか?」と表示するよう
にすればよい。これにより、そのファイルを前記作成禁
止ファイルとして設定することにより、操作者が必要な
その下位階層のファイルだけを情報ボックスに記憶する
ことができる。In the above embodiment, the case where the number of hits is small is targeted for deletion, but the case where the number of hits is large may be targeted for deletion. For example, a table of contents page such as a link collection. Whenever it is displayed in the search result every time, this possibility may occur. Even in such a case, this can be displayed and the operator can be alerted. For example, "This file is always referenced, but is it an unnecessary file?" May be displayed. As a result, by setting that file as the creation-prohibited file, it is possible to store only the files in the lower hierarchy required by the operator in the information box.
【0067】本実施形態においては、検索時に、各ファ
イルについてヒットしたタームが存在するか否か判断
し、存在する場合はヒット回数を加算しておき、手動洗
練命令が与えられると、情報ボックスに記憶された各フ
ァイルをヒット回数順にソートして表示し、操作者から
削除命令があると、これを削除するようにしている。こ
れにより、削除するほうが好ましい可能性のあるファイ
ルを操作者に報知することができ、全ファイルについて
操作者がいちいち内容を確認することなく、不要なファ
イルを削除することができる。したがって、自動更新さ
れる情報ボックスについて、操作者の興味に合致した情
報が収集されるように情報ボックスを洗練することがで
きる。In the present embodiment, at the time of search, it is judged whether or not there is a hit term for each file, and if there is, the hit count is added up. When a manual refinement command is given, the information box is displayed. The stored files are sorted and displayed in the order of the number of hits, and when the operator gives a deletion command, the files are deleted. As a result, it is possible to notify the operator of files that may be preferable to be deleted, and unnecessary files can be deleted without the operator having to check the contents of all files. Therefore, with respect to the automatically updated information box, the information box can be refined so that the information that matches the interest of the operator is collected.
【0068】5.他の実施形態
なお、上記実施形態においては、各ファイル毎のヒット
履歴に基づいて、前記各ファイルの検索時における不利
用度を演算するようにしたが、図5に示す情報現特定デ
ータ毎にヒット履歴を求め、これに基づいて、削除対象
とするファイルとするか否かを決定するようにしてもよ
い。5. Other Embodiments In the above embodiment, the degree of non-use at the time of searching each file is calculated based on the hit history of each file. However, for each information present specific data shown in FIG. The hit history may be obtained, and based on this, it may be determined whether or not the file is to be deleted.
【0069】また、本実施形態においては、洗練処理と
して、情報ボックスのファイルを直接削除するようにし
たが、情報源特定データを削除することにより、間接的
に削除するようにしてもよい。特に、更新手法として、
再作成(図7B参照)を行う場合には、更新により自動
的に古いデータは削除されるので、情報ボックスのデー
タをあえて削除する必要もない。再作成を行わない場合
には、情報源特定データとともに、対応するファイルを
削除するようにすればよい。Further, in the present embodiment, as the refining process, the file in the information box is directly deleted, but it may be deleted indirectly by deleting the information source specifying data. Especially as an update method,
When the data is recreated (see FIG. 7B), the old data is automatically deleted by the update, so it is not necessary to delete the data in the information box. When the re-creation is not performed, the corresponding file may be deleted together with the information source specifying data.
【0070】また、情報ボックスのファイルを直接削除
するだけでなく、これに対応する情報源特定データも削
除するようにしてもよい。Further, not only the file in the information box but also the information source specifying data corresponding thereto may be deleted.
【0071】なお、本実施形態においてはヒット履歴と
して、ヒット回数を用いたが、操作者の検索傾向に合致
しているか否かを示すデータであればどのようなもので
あってもよく、例えば、ヒット率を加算した総ヒット率
を採用してもよい。また、本実施形態においては、ヒッ
ト回数は1の問い合わせについて、ヒットしたタームの
数に関係なく、1としたが、複数のタームがヒットした
ファイルについては、1つしかヒットしなかった場合と
比べて、ヒット回数を多くするようにしてもよい。Although the number of hits is used as the hit history in this embodiment, any data may be used as long as it indicates whether or not it matches the search tendency of the operator. Alternatively, the total hit rate obtained by adding the hit rates may be adopted. Further, in the present embodiment, the number of hits is 1 for an inquiry regardless of the number of hit terms. However, in the case of a file in which a plurality of terms are hit, only one hit is made. The number of hits may be increased.
【0072】なお、ヒット履歴とは、操作者の問い合わ
せ文に対する各ファイルの情報関連度を示すものであっ
てもよい。The hit history may indicate the information relevance of each file with respect to the operator's inquiry text.
【0073】また、前記手動削除処理と自動削除処理の
双方を取り入れて、削除候補はしきい値により自動的に
決定し、操作者がこれを確認しながら、削除するように
してもよい。It is also possible to adopt both the manual deletion process and the automatic deletion process to automatically determine the deletion candidate by a threshold value, and to delete the deletion candidate while the operator confirms it.
【0074】なお、既に述べたように、各情報ボックス
は1つのファイルとして取り扱われるので、ヒット回数
の少ないファイルの情報ボックスから削除については、
レコード単位で不要なレコードを削除するようにすれば
よい。本実施形態においては、各情報ボックスは1つの
ファイルとして取り扱うようにしたが、各レコードを1
のファイルとした複数のファイルの集合体としてもよ
い。As already described, since each information box is handled as one file, deletion from the information box of a file with a small number of hits
You can delete unnecessary records in record units. In this embodiment, each information box is treated as one file, but each record is treated as one file.
The file may be a collection of a plurality of files.
【0075】また、本実施形態においては、メールボッ
クスを情報源として用いる場合には、つぎのようにし
た。通常のメールソフトは、1つ1つのメールをそれぞ
れファイルとして管理しているのではなく、受信箱(受
信ボックス)、送信箱(送信ボックス)、ごみ箱等をそ
れぞれ1つのファイルとして取り扱っている。したがっ
て、情報ボックスに格納する際に、1つ1つのメールを
それぞれをファイルに分割して、ファイル名を付けて格
納するようにした。そして、検索されたメールを表示す
るのは、各ファイルのテキストデータをビューアプログ
ラムで表示するようにした。すなわち、本実施形態にお
いては各ファイルは、コンピュータが管理するファイル
概念と一致する。しかし、これに限定されずに、コンピ
ュータが通常管理するファイルよりも小さなまとまりの
最小単位をもファイルとして把握することもできる。例
えば、情報ボックスには、複数のメールを格納した受信
箱を1つのファイルとして記憶しておき、検索の際に
は、各メール単位で検索および表示を行えばよい。この
ように、本明細書においては、ファイルとは、検索条件
に合致するタームを取り出して表示されるまとまりの最
小単位のユニットも含む。Further, in this embodiment, when the mailbox is used as the information source, the following is done. Ordinary mail software does not manage each mail as a file, but handles an inbox (inbox), an outbox (outbox), a trash can, etc. as one file. Therefore, when storing in the information box, each mail is divided into files, and the files are named and stored. Then, the retrieved mails are displayed by displaying the text data of each file in a viewer program. That is, in the present embodiment, each file matches the file concept managed by the computer. However, the present invention is not limited to this, and it is also possible to grasp as a file a minimum unit of a group smaller than a file normally managed by a computer. For example, an inbox storing a plurality of emails may be stored in the information box as a single file, and the retrieval and display may be performed for each email when searching. As described above, in the present specification, a file also includes a unit of the minimum unit of a unit in which terms that match the search condition are extracted and displayed.
【0076】なお、通信ログについても同様である。The same applies to the communication log.
【0077】なお、本実施形態においては、HTMLフ
ァイルについては、図11に示すように、リスト表示部
154表示された文書をクリックすれば対応するブラウ
ザが起動して、ビュー領域152にファイルの内容が表
示される。これに対して、メールボックスが情報源とし
て設定されている場合に、各メールを1つのファイルと
して記憶し、表示命令があればそのファイル化されたメ
ールのテキストデータが表示される。したがって、テキ
スト変換時に対応していない表示形式(例えば、罫線
等)については、内容確認は次のように行われる。当該
メールソフトを起動して、当該メールを自分で探し出し
て、そのメールをオープンする。このようにメールソフ
トの場合は通常のHTMLファイルと異なり、作業が煩
雑となる。しかし、本発明にかかる検索装置において
は、予め検索結果に基づいて操作者がチェックすべきメ
ールが絞られるので、このような煩雑処理を回避するこ
とができる。In the present embodiment, regarding the HTML file, as shown in FIG. 11, when the document displayed in the list display section 154 is clicked, the corresponding browser is activated and the contents of the file are displayed in the view area 152. Is displayed. On the other hand, when the mailbox is set as the information source, each mail is stored as one file, and if there is a display command, the text data of the filed mail is displayed. Therefore, regarding the display format (for example, ruled lines, etc.) that is not supported at the time of text conversion, the content confirmation is performed as follows. Start the mail software, find the mail yourself, and open the mail. As described above, in the case of the mail software, the work is complicated unlike the normal HTML file. However, in the search device according to the present invention, since the mails to be checked by the operator are narrowed down based on the search result in advance, such complicated processing can be avoided.
【0078】また、洗練するための検索条件は、ある情
報源が追加された場合に、その後の検索結果ではなく、
追加時までの過去の問い合わせ文を記憶しておき、これ
を用いて検討するようにしてもよい。また、本実施形態
においては、洗練処理として洗練前のデータ格納部を残
存させない場合について説明したが、残存させて別の情
報ボックスを生成するようにしてもよい。Further, the search condition for refining is not a search result after a certain information source is added, but
It is also possible to store past inquiry texts up to the time of addition and use this for examination. Further, in the present embodiment, the case where the pre-refining data storage unit is not left as the refining process has been described, but another data box may be generated by leaving it.
【0079】本実施形態においては、日本語の文書の場
合について説明したが、他の言語、例えば、英語、ドイ
ツ語、中国語、韓国語等についても同様に適用すること
ができる。In this embodiment, the case of a Japanese document has been described, but the present invention can be similarly applied to other languages such as English, German, Chinese, and Korean.
【0080】本実施形態においては、図1に示す機能を
実現する為に、CPU23を用い、ソフトウェアによっ
てこれを実現している。しかし、その一部もしくは全て
を、ロジック回路等のハードウェアによって実現しても
よい。In this embodiment, in order to realize the function shown in FIG. 1, the CPU 23 is used and this is realized by software. However, some or all of them may be realized by hardware such as a logic circuit.
【図1】本発明にかかるデータ検索装置1の機能ブロッ
ク図である。FIG. 1 is a functional block diagram of a data search device 1 according to the present invention.
【図2】図1に示すデータ検索装置のハードウエア構成
の一例を示す図である。FIG. 2 is a diagram showing an example of a hardware configuration of the data search device shown in FIG.
【図3】情報ボックスに記憶されるファイルのデータ構
造を示す。FIG. 3 shows a data structure of a file stored in an information box.
【図4】情報ボックスに記憶される検索用の抽出ターム
のデータ構造を示す。FIG. 4 shows a data structure of an extraction term for search stored in an information box.
【図5】情報源特定データのデータ構造を示す。FIG. 5 shows a data structure of information source specifying data.
【図6】情報ボックスに記憶されたHTMLファイルの
内容を示す。FIG. 6 shows the contents of an HTML file stored in an information box.
【図7】情報ボックスの更新のスケジュール情報であ
る。FIG. 7 is schedule information for updating an information box.
【図8】手動削除処理のフローチャートである。FIG. 8 is a flowchart of a manual deletion process.
【図9】手動削除処理における各ファイルのヒット回数
を示すの表示一例である。FIG. 9 is a display example showing the number of hits of each file in the manual deletion process.
【図10】自動削除処理のフローチャートである。FIG. 10 is a flowchart of automatic deletion processing.
【図11】情報検索ツール「インターネットブーメラ
ン」の表示画面の一例である。FIG. 11 is an example of a display screen of an information search tool “Internet boomerang”.
23・・・CPU 27・・・メモリ 23 ... CPU 27 ... Memory
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 - 17/30 419 G06F 12/00 546 JICSTファイル(JOIS)─────────────────────────────────────────────────── ─── Continuation of front page (58) Fields surveyed (Int.Cl. 7 , DB name) G06F 17/30-17/30 419 G06F 12/00 546 JISST file (JOIS)
Claims (11)
記憶されたファイルのうち、前記検索条件に合致するタ
ームを含むファイルを特定するデータ検索装置を、コン
ピュータを用いて実現するプログラムを記憶した記録媒
体であって、 前記データ格納部に記憶された各ファイルは、当該ファ
イルが取得された元所在位置を示す情報取得元データお
よび、前記データ格納部に記憶されたファイルを更新す
るスケジュールデータに基づいて、自動更新され、 前記検索条件に対するヒット履歴に基づいて、前記各フ
ァイルの検索時における不利用度を演算し、 前記不利用度に基づき、前記情報取得元データを洗練す
る、 処理を前記コンピュータに実行させるためのプログラム
を記憶した記録媒体。1. When a search condition is given, a program for realizing, using a computer, a data search device that specifies a file containing a term that matches the search condition among files stored in a data storage unit is stored. In the recording medium, each file stored in the data storage unit includes information acquisition source data indicating an original location from which the file is acquired, and schedule data for updating the file stored in the data storage unit. Based on the hit history for the search condition, the degree of nonuse of each file at the time of retrieval is calculated, and the information acquisition source data is refined based on the degree of nonuse. A recording medium storing a program to be executed by the computer.
において、 前記検索条件に対する各ファイル毎のヒット履歴に基づ
いて、前記各ファイルの不利用度を演算するもの。2. A recording medium storing the program according to claim 1, wherein the degree of non-use of each file is calculated based on the hit history of each file with respect to the search condition.
において、 前記情報取得元データ毎のヒット履歴に基づいて、前記
各ファイルの不利用度を演算するもの。3. A recording medium storing the program according to claim 1, wherein the degree of non-use of each file is calculated based on the hit history for each information acquisition source data.
ムを記憶した記録媒体において、 前記情報取得元データを洗練する処理は、 前記不利用度を操作者に報知し、 当該報知した不利用度に対する操作者からの指示に基づ
き、前記データ格納部に記憶されたファイルから削除す
るファイルを特定し、 当該特定したファイルを更新しないために前記情報取得
元データを削除すること、 を特徴とするもの。4. A recording medium storing the program according to claim 1, wherein the process of refining the information acquisition source data notifies the operator of the degree of non-use and A file to be deleted is specified from the files stored in the data storage unit based on an instruction from the operator regarding the degree of use, and the information acquisition source data is deleted so as not to update the specified file. What to do.
ムを記憶した記録媒体において、 前記データ格納部に記憶されたファイルを洗練する処理
は、 前記不利用度に基づき、前記データ格納部に記憶された
ファイルから削除するファイルを特定し、 当該特定したファイルを更新しないために前記情報取得
元データを削除すること、 を特徴とするもの。5. A recording medium storing the program according to any one of claims 1 to 3, wherein the processing for refining the file stored in the data storage unit is based on the degree of non-use. The file to be deleted is specified from the files stored in, and the information acquisition source data is deleted so as not to update the specified file.
憶した記録媒体において、 前記削除する情報取得元データとともに、これに対応す
るファイルも削除すること、 を特徴とするもの。6. A recording medium storing the program according to claim 4, wherein the information acquisition source data to be deleted and the corresponding file are deleted.
において、 前記情報取得元データを洗練する処理は、 前記不利用度を操作者に報知し、 当該報知した不利用度に対する操作者からの指示に基づ
き、前記データ格納部に記憶されたファイルから削除す
るファイルを特定し、 当該特定したファイルを削除し、 さらに、 当該ファイルが更新されないための更新不可情報を記憶
し、 次回以降の自動更新を、前記更新不可情報、前記情報取
得元データおよび前記スケジュールデータに基づいて行
うこと、 を特徴とするもの。7. A recording medium storing the program according to claim 1, wherein the processing for refining the information acquisition source data notifies the operator of the degree of non-use, and the operator responds to the notified degree of non-use. Based on the instruction, specify the file to be deleted from the files stored in the data storage unit, delete the specified file, and store the non-updatable information to prevent the file from being updated, and the automatic update after the next time. Is performed based on the non-updatable information, the information acquisition source data, and the schedule data.
段、 操作者が、検索条件を入力する検索条件入力手段、 前記ファイル記憶手段に記憶されたファイルのうち、前
記検索条件に合致するタームを含むファイルを検索する
検索手段、 前記ファイル記憶手段に記憶されたファイルが取得され
た元所在位置を示す情報取得元データおよび、前記ファ
イルを更新するスケジュールデータを記憶する更新情報
記憶手段、前記情報取得元データおよびスケジュールデータに基づ
いて、前記ファイルを更新する更新手段、 前記検索条件に対するヒット履歴に基づいて、前記各フ
ァイルの検索時における不利用度を演算する検索不利用
度演算手段、 前記不利用度に基づき、前記情報取得元データを洗練す
る洗練手段、 を備えたデータ検索装置。8. A file storage unit for storing a plurality of files, a search condition input unit for an operator to input a search condition, and a term stored in the file storage unit that matches the search condition. Retrieval means for retrieving a file, information acquisition source data indicating the original location where the file stored in the file storage means was acquired, and update information storage means for storing schedule data for updating the file, the information acquisition source Based on data and schedule data
An update means for updating the file, a search disuse degree calculating means for calculating a degree of nonuse at the time of searching each of the files based on a hit history for the search condition, and the information acquisition based on the degree of nonuse. A data retrieval device equipped with a refining means for refining the original data.
記憶されたファイルのうち、前記検索条件に合致するタ
ームを含むファイルを特定する、コンピュータを用いた
データ検索方法であって、 前記データ格納部に記憶された各ファイルは、当該ファ
イルが取得された元所在位置を示す情報取得元データお
よび、前記データ格納部に記憶されたファイルを更新す
るスケジュールデータに基づいて、自動更新され、 前記検索条件に対するヒット履歴に基づいて、前記各フ
ァイルの検索時における不利用度を演算し、 前記不利用度に基づき、前記情報取得元データを洗練す
ること、 を特徴とするコンピュータを用いたデータ検索方法。9. A data search method using a computer, which specifies a file containing a term that matches the search condition among files stored in a data storage unit when the search condition is given. Each file stored in the storage unit is automatically updated based on information acquisition source data indicating the original location from which the file was acquired and schedule data for updating the file stored in the data storage unit, A data search using a computer, which calculates a degree of non-use at the time of searching each file based on a hit history for a search condition, and refines the information acquisition source data based on the degree of non-use. Method.
に記憶されたファイルのうち、前記検索条件に合致する
タームを含むファイルを特定する、コンピュータを用い
たデータ検索方法であって、 前記検索条件に対するヒット履歴に基づいて、前記各フ
ァイルの検索時における不利用度を演算し、 前記不利用度に基づき、前記ファイルを更新するための
情報取得元データであって、当該ファイルが取得された
元所在位置を示す情報取得元データを洗練すること、 を特徴とするコンピュータを用いたデータ検索方法。10. A data search method using a computer, which specifies a file containing a term that matches the search condition among files stored in a data storage unit when the search condition is given. Based on the hit history for the condition, the degree of non-use at the time of searching each of the files is calculated, and the file is updated based on the degree of non-use .
Information acquisition source data, and the file was acquired
A data retrieval method using a computer, characterized by refining information acquisition source data indicating the original location .
に記憶されたファイルのうち、前記検索条件に合致する
タームを含むファイルを特定するデータ検索装置を、コ
ンピュータを用いて実現するプログラムを記憶した記録
媒体であって、 前記検索条件に対するヒット履歴に基づいて、前記各フ
ァイルの検索時における不利用度を演算し、 前記不利用度に基づき、前記ファイルを更新するための
情報取得元データであって、当該ファイルが取得された
元所在位置を示す情報取得元データを洗練する処理、 を前記コンピュータに実行させるためのプログラムを記
憶した記録媒体。11. A program for realizing, using a computer, a data search device that specifies a file including a term that matches the search condition among files stored in a data storage unit when the search condition is given. A recording medium, which calculates a degree of non-use at the time of searching each of the files based on a hit history for the search condition, and updates the file based on the degree of non-use .
Information acquisition source data, and the file was acquired
A recording medium storing a program for causing the computer to execute a process of refining information acquisition source data indicating the original location .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20748599A JP3429225B2 (en) | 1999-07-22 | 1999-07-22 | Storage medium storing data search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20748599A JP3429225B2 (en) | 1999-07-22 | 1999-07-22 | Storage medium storing data search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001034629A JP2001034629A (en) | 2001-02-09 |
JP3429225B2 true JP3429225B2 (en) | 2003-07-22 |
Family
ID=16540528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20748599A Expired - Fee Related JP3429225B2 (en) | 1999-07-22 | 1999-07-22 | Storage medium storing data search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3429225B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003303200A (en) * | 2002-04-10 | 2003-10-24 | Toshiba Corp | Knowledge information collecting system and knowledge information collecting method |
JP3708894B2 (en) * | 2002-04-10 | 2005-10-19 | 株式会社東芝 | Knowledge information collecting system and knowledge information collecting method |
JP3725088B2 (en) * | 2002-04-10 | 2005-12-07 | 株式会社東芝 | Knowledge information collecting system and knowledge information collecting method |
JP3725837B2 (en) * | 2002-04-10 | 2005-12-14 | 株式会社東芝 | Knowledge information collecting system and knowledge information collecting method |
JP3725836B2 (en) * | 2002-04-10 | 2005-12-14 | 株式会社東芝 | Knowledge information collecting system and knowledge information collecting method |
JP3708893B2 (en) * | 2002-04-10 | 2005-10-19 | 株式会社東芝 | Knowledge information collecting system and knowledge information collecting method |
JP2007079745A (en) * | 2005-09-12 | 2007-03-29 | Sharp Corp | Network connection device, server device, terminal equipment, system, reception method, character input method, transmission method, program, and computer readable recording medium |
-
1999
- 1999-07-22 JP JP20748599A patent/JP3429225B2/en not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
中野淳,インターネット情報検索ソフト活用法,日経パソコン,日本,日経BP社,1999年 2月22日,第331号,第192−197頁 |
Also Published As
Publication number | Publication date |
---|---|
JP2001034629A (en) | 2001-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6411924B1 (en) | System and method for linguistic filter and interactive display | |
US5913215A (en) | Browse by prompted keyword phrases with an improved method for obtaining an initial document set | |
US5721897A (en) | Browse by prompted keyword phrases with an improved user interface | |
US20020143797A1 (en) | File classification management system and method used in operating systems | |
US20060015509A1 (en) | Bookmark management apparatus for dynamic categorization | |
JP2000029906A (en) | System for managing document information | |
US20020083045A1 (en) | Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program | |
JP3673111B2 (en) | Document management method, document management apparatus, and storage medium | |
JP2001290843A (en) | Device and method for document retrieval, document retrieving program, and recording medium having the same program recorded | |
JP3429225B2 (en) | Storage medium storing data search program | |
JP4469432B2 (en) | INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD | |
US8612431B2 (en) | Multi-part record searches | |
JPH1145284A (en) | Preparation method for profile and computer readable recording medium recording program for making computer execute respective processes of the method | |
JP4719921B2 (en) | Data display device and data display program | |
JP3186960B2 (en) | Information retrieval method and apparatus | |
JPH06250950A (en) | Mail box management method | |
JP2002149668A (en) | Internet auxiliary software and recording medium having the same software recorded | |
JP2004046870A (en) | Information unit group operation device | |
JP2000231569A (en) | Internet information retrieving device, internet information retrieving method and computer readable recording medium with program making computer execute method recorded therein | |
CN113742291A (en) | File saving method and device and computer storage medium | |
JPH10162011A (en) | Information retrieval method, information retrieval system, information retrieval terminal equipment, and information retrieval device | |
JP2004234582A (en) | Dictionary construction method, system, and screen | |
JP3059710B1 (en) | INFORMATION SEARCH SYSTEM, DATABASE MANAGEMENT DEVICE, DATABASE MANAGEMENT METHOD, AND COMPUTER-READABLE RECORDING MEDIUM RECORDING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD | |
JP2000067126A (en) | Schedule information processor, display information processor and medium stored with schedule and display information processing control program | |
JPH09245046A (en) | Information retrieval device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |