JP2000268048A - Index preparing device and index preparing program storage medium - Google Patents

Index preparing device and index preparing program storage medium

Info

Publication number
JP2000268048A
JP2000268048A JP11072103A JP7210399A JP2000268048A JP 2000268048 A JP2000268048 A JP 2000268048A JP 11072103 A JP11072103 A JP 11072103A JP 7210399 A JP7210399 A JP 7210399A JP 2000268048 A JP2000268048 A JP 2000268048A
Authority
JP
Japan
Prior art keywords
data
index
search
unit
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11072103A
Other languages
Japanese (ja)
Inventor
Aoshi Okamoto
青史 岡本
Taro Fujimoto
太郎 藤本
Nobuhiro Yugami
伸弘 湯上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11072103A priority Critical patent/JP2000268048A/en
Publication of JP2000268048A publication Critical patent/JP2000268048A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To easily generate desired data by selecting at least one piece of data from a collected data group based on a prescribed first algorithm and preparing the index of a selected data group consisting of the selected data. SOLUTION: The data collecting part 320 of a retrieving server 300 is connected to the Internet 500 being a data source storing a source data group consisting of many pieces of data. Then, the part 320 collects data from the Internet 500 in accordance with an instruction via a terminal 100, and at least one piece of data is selected from in a collected data group consisting of the collected data by a data selecting part 321 according to operation or based on a prescribed first algorithm. An index preparing part 322 prepares the index of a selected data group consisting of the selected data. Thus, data desired by a user is easily obtained.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、データを検索する
ための索引(検索インデックス)を作成する索引作成装
置、およびそのような索引作成装置としてコンピュータ
を動作させる索引作成プログラム記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an index creating apparatus for creating an index (search index) for searching data, and an index creating program storage medium for operating a computer as such an index creating apparatus.

【0002】[0002]

【従来の技術】近年、インターネットやイントラネット
などのコンピュータネットワークの整備が進み、また、
計算機の能力が発達するのに伴って、ネットワークのユ
ーザは、ネットワークを構成している多くのコンピュー
タに記憶されている膨大な数のデータにアクセスするこ
とができるようになってきている。また、そのような膨
大な数のデータの中から、ユーザが所望するデータを取
得するための道具として、従来より、検索キーワードな
どに基づいてデータを検索する検索エンジンが知られて
いる。
2. Description of the Related Art In recent years, computer networks such as the Internet and an intranet have been improved.
As the capabilities of computers have evolved, network users have been able to access a vast amount of data stored on many computers that make up the network. As a tool for obtaining data desired by a user from such a huge number of data, a search engine for searching data based on a search keyword or the like has been conventionally known.

【0003】[0003]

【発明が解決しようとする課題】しかし、上述したよう
な膨大な数のデータには、多種多様な分野のデータが混
在しているので、検索エンジンによってデータが検索さ
れて検索結果の一覧が得られる場合、例えば、単純な検
索キーワードなどが用いられると、ユーザの興味や嗜好
に合った分野以外の分野に属するいわゆるゴミデータを
たくさん含んだ一覧が得られる。このため、検索結果の
一覧のなかから所望のデータを見つけだすためには、一
覧の上位から下位までに至る全体的なデータチェック
や、検索キーワードなどを追加した再検索が必要であ
り、ユーザにとっての負担が大きいという問題がある。
また、そのような再検索や、複数の検索キーワードの組
み合わせを用いた検索等を行う場合には、データ検索に
精通したユーザなら、所望のデータが得られるような追
加検索キーワードや組み合わせなどを容易に思いつくこ
とができるが、検索に不慣れなユーザは、そのような追
加検索キーワードなどを思いつくことができない場合も
ある。
However, since the huge number of data described above contains data in various fields, the data is searched by a search engine and a list of search results is obtained. When a simple search keyword or the like is used, for example, a list including a lot of so-called garbage data belonging to a field other than a field that matches the interests and preferences of the user is obtained. For this reason, in order to find desired data from the search result list, it is necessary to perform an overall data check from the top to the bottom of the list and to perform a re-search by adding a search keyword, etc. There is a problem that the burden is large.
Further, when performing such a re-search or a search using a combination of a plurality of search keywords, a user who is familiar with data search can easily perform additional search keywords and combinations that can obtain desired data. , But a user unfamiliar with the search may not be able to come up with such additional search keywords.

【0004】このため、ユーザが所望のデータを容易に
取得することができる技術が待ち望まれており、そのよ
うな技術の一種として、ユーザの興味や嗜好に合った分
野のデータを検索結果の一覧の上位に掲げられることを
目的とする技術が提案されている。そのようなデータが
上位に掲げられた一覧によれば、ユーザが一覧の上位だ
けをチェックすることで容易に所望のデータが得られる
こととなるからである。
[0004] For this reason, there is a long-awaited need for a technology that allows a user to easily obtain desired data. As one type of such technology, data in a field that matches the user's interests and preferences is listed in a search result list. There is proposed a technology aiming to be placed at a higher rank. This is because according to the list in which such data is listed at the top, the user can easily obtain desired data by checking only the top of the list.

【0005】ところで、ユーザの興味や嗜好に合った分
野のデータが上位に掲げられた一覧を得るための技術と
しては、例えば、以下説明するような、キーワードに関
する統計情報を用いるランキング検索技術や、ユーザか
らの情報をフィードバックさせる適合性フィードバック
等が知られている。ランキング検索技術は、ある検索キ
ーワードが1つのデータ中に含まれる数の多さを表すT
F(Text Frequency)という統計情報
や、ある検索キーワードを含むデータの数の多さを表す
IDF(Inverse Document Freq
uency)という統計情報が用いられて、ユーザが入
力した検索キーワードのうちIDFが小さい検索キーワ
ードに基づくTFが大きいデータが一覧の高いランクに
掲げられる技術である。また、適合性フィードバック
は、検索結果の一覧に掲げられたデータがユーザの興味
や嗜好に基づいて評価され評価結果を表す情報が入力さ
れて、その情報が検索にフィードバックされ再度一覧が
得られるという課程が繰り返される技術である。
[0005] By the way, as a technique for obtaining a list in which data in a field suited to the interests and preferences of the user are listed at the top, for example, a ranking search technique using statistical information on keywords as described below, Suitability feedback or the like for feeding back information from a user is known. The ranking search technique uses a T value that represents the number of times a certain search keyword is included in one piece of data.
Statistical information called F (Text Frequency) or IDF (Inverse Document Freq) indicating a large number of data including a certain search keyword
(Uency) is used, and data having a large TF based on a search keyword having a small IDF among search keywords input by a user is listed in a high rank in a list. The relevance feedback means that the data listed in the search result list is evaluated based on the user's interests and preferences, information representing the evaluation result is input, and the information is fed back to the search and the list is obtained again. This is a technique where the course is repeated.

【0006】しかし、上述したランキング検索技術で
は、TFやIDFという統計情報がユーザ固有の興味や
嗜好を必ずしも反映しておらず、一覧の上位には相変わ
らず多くのゴミデータが存在することとなる。また、適
合性フィードバックでは、ユーザの興味や嗜好に合った
分野のデータが一覧の上位に掲げられるまでに、ユーザ
が何度もデータを評価してフィードバックさせなければ
ならない場合も多く、検索効率が悪い。
However, in the above-described ranking search technique, the statistical information such as TF and IDF does not necessarily reflect the user's unique interests and preferences, and there is still a lot of garbage data at the top of the list. In addition, relevance feedback often requires the user to evaluate and feed back data many times before data in a field that matches the user's interests and preferences is listed at the top of the list. bad.

【0007】このように、検索結果の一覧の上位に、ユ
ーザの興味や嗜好に合った分野のデータを掲げることは
困難であり、従来提案されている技術では、ユーザが所
望のデータを取得するためには多くの労力や知識や経験
等が必要である。
[0007] As described above, it is difficult to list data in a field that matches the interests and preferences of the user at the top of the list of search results. In the technology proposed in the related art, the user obtains desired data. In order to do so, much labor, knowledge and experience are required.

【0008】本発明は、上記事情に鑑み、所望のデータ
を容易に取得することができる索引を作成することがで
きる索引作成装置を提供することを目的とする。
The present invention has been made in view of the above circumstances, and has as its object to provide an index creation device capable of creating an index from which desired data can be easily obtained.

【0009】[0009]

【課題を解決するための手段】上記目的を達成する本発
明の索引作成装置は、多数のデータからなる源データ群
を記憶しているデータ源に接続され、そのデータ源に記
憶されている源データ群の中からデータを操作に応じて
収集するデータ収集手段と、データ収集手段によって収
集されたデータからなる収集データ群の中から1つ以上
のデータを、操作に応じてあるいは所定の第1アルゴリ
ズムに基づいて選別するデータ選別手段と、データ選別
手段によって選別されたデータからなる選別データ群の
索引を作成する索引作成手段とを備えたことを特徴とす
る。
According to a first aspect of the present invention, there is provided an index creating apparatus which is connected to a data source storing a source data group including a large number of data, and which is stored in the data source. A data collection unit that collects data from the data group according to an operation; and one or more data from a collection data group including data collected by the data collection unit according to an operation or a predetermined first data. Data selection means for selecting based on an algorithm, and index creation means for creating an index of a selection data group composed of data selected by the data selection means are provided.

【0010】ここでデータ収集手段は、データそのもの
を収集するものであってもよく、あるいは、データのタ
イトルや概要などを収集することによって実質的にデー
タを収集するものであってもよい。
Here, the data collecting means may be a means for collecting the data itself, or may be a means for substantially collecting the data by collecting a title or an outline of the data.

【0011】本発明の索引作成装置によれば、データ選
別手段に対する操作として、ユーザの興味や嗜好を反映
した選別操作が施され、あるいは、上記第1アルゴリズ
ムとして、そのような選別操作に替わるアルゴリズムが
用いられることによって、ユーザの興味や嗜好に合う分
野のデータの割合が高くゴミデータの割合が低い選別デ
ータ群が得られ、そのような選別データ群の索引が作成
される。このような索引が用いられて検索が行われる
と、検索によって見つかるデータにはゴミデータが少な
く、すなわち高い検索精度が実現できる。そして、ユー
ザはそのような検索結果から所望のデータを容易に取得
することができ、すなわち高い検索効率が実現される。
According to the index creation apparatus of the present invention, a selection operation reflecting the interests and preferences of the user is performed as an operation on the data selection means, or an algorithm replacing the selection operation is used as the first algorithm. Is used, a selection data group having a high ratio of data in a field that matches the interests and preferences of the user and a low ratio of garbage data is obtained, and an index of such a selection data group is created. When a search is performed using such an index, garbage data is small in data found by the search, that is, high search accuracy can be realized. Then, the user can easily obtain desired data from such a search result, that is, high search efficiency is realized.

【0012】本発明の索引作成装置は、上記選別データ
群の中から所定の第2アルゴリズムに基づいてさらにデ
ータを選別して提示するデータ提示手段を備えることが
望ましい。
[0012] It is preferable that the index creation device of the present invention further comprises a data presentation means for further selecting and presenting data from the selected data group based on a predetermined second algorithm.

【0013】このようなデータ提示手段を備えた索引作
成装置では、上記第2アルゴリズムとして、例えば、ユ
ーザの興味や嗜好に合う分野のデータの中で、ユーザが
現在所望しているデータだけが選別されるような厳格な
条件に基づくアルゴリズムが用いられ、データが自動的
に提示される。これによって、ユーザは、検索を行わな
くても、所望のデータの提示を受けて取得することがで
きる。
In the index creation apparatus provided with such data presentation means, as the second algorithm, for example, only data that the user currently desires is selected from among data in a field that matches the interests and preferences of the user. An algorithm based on stringent conditions is used, and the data is presented automatically. Thus, the user can receive and obtain desired data without performing a search.

【0014】また、本発明の索引作成装置は、上記デー
タ源が、他のデータを示すリンクを含むデータを記憶し
ているものであって、上記データ収集手段が、リンクを
辿りながらデータを収集するものであるとともに、デー
タ源に記憶されているデータのうちの1つのデータを特
定する情報と、リンクを辿る回数とが入力され、その情
報により特定されるデータを起点としてその回数だけリ
ンクを辿りながらデータを収集するものであることが好
適である。
In the index creation apparatus of the present invention, the data source stores data including a link indicating another data, and the data collection means collects the data while following the link. And information for specifying one of the data stored in the data source and the number of times of tracing the link are input, and the link specified as the number of times starting from the data specified by the information is entered. It is preferable to collect data while tracing.

【0015】例えばインターネットなどでは、データ中
に、そのデータと関連が深い他のデータを示すリンクが
書き込まれている場合が多い。従って、ユーザの興味や
嗜好にあった分野に属する1つのデータを見つけた場合
などに、その1つのデータを起点として何回かリンクを
辿りながら一連の関連データを収集することによって、
ユーザの興味や嗜好にあった分野のデータを効率よく収
集することができる。
For example, in the Internet or the like, a link indicating another data closely related to the data is often written in the data. Therefore, when finding one piece of data belonging to a field that matches the interests and preferences of the user, for example, by collecting a series of related data while following a link several times starting from that one piece of data,
It is possible to efficiently collect data in a field that meets the interests and preferences of the user.

【0016】また、本発明の索引作成装置は、上記デー
タ源が、自分が記憶しているデータを検索する手段を備
え、検索キーの入力を受けその検索キーを用いてデータ
を検索するものであって、上記データ収集手段が、操作
に応じた検索キーをデータ源に入力しその検索キーに応
じた検索によって得られたデータを収集するものである
ことも好適である。
Further, in the index creation apparatus of the present invention, the data source includes a means for searching for data stored therein, and receives a search key and searches for data using the search key. Preferably, the data collection means is configured to input a search key corresponding to an operation to a data source and collect data obtained by a search corresponding to the search key.

【0017】インターネットなどには検索能力が高い検
索手段が備えられていることが多く、そのような検索手
段を利用してデータを収集することによって、効率よく
データを収集することができる。
In many cases, the Internet or the like is provided with search means having a high search capability, and data can be efficiently collected by collecting data using such search means.

【0018】さらに、本発明の索引作成装置は、上記デ
ータ選別手段が、操作に応じてデータを選別するもので
あって、データ選別手段によるデータ選別の履歴に基づ
いて、選別されたデータの特色を学習する学習手段と、
上記データ収集手段によって収集された各データが、学
習手段によって学習された特色を備えたデータであるか
否かを判定するデータ判定手段とを備えることが好まし
い。
Further, in the index creation apparatus of the present invention, the data selection means selects data in accordance with an operation, and the characteristic of the data selected based on the data selection history by the data selection means. Learning means for learning
It is preferable to include a data determination unit that determines whether each data collected by the data collection unit is data having a spot color learned by the learning unit.

【0019】このような学習手段等を備えた索引作成装
置によれば、学習手段によって学習された特色に基づく
判定の結果をユーザが参考として用いることによってデ
ータ選択を容易に行うことができ、あるいは、特色が充
分に学習された後で、その特色に基づく判定を上述した
第1アルゴリズムとして用いることによって自動的なデ
ータ選択を行うこともできる。
According to the index creating apparatus provided with such learning means, the user can easily select data by using the result of the judgment based on the spot color learned by the learning means as a reference, or After the spot color has been sufficiently learned, automatic data selection can be performed by using the determination based on the spot color as the above-described first algorithm.

【0020】上記目的を達成する本発明の索引作成プロ
グラム記憶媒体は、多数のデータからなる源データ群の
中から操作に応じたデータを収集するデータ収集手段
と、データ収集手段によって収集されたデータからなる
収集データ群の中から1つ以上のデータを、操作に応じ
てあるいは所定の第1アルゴリズムに基づいて選別する
データ選別手段と、データ選別手段によって選別された
データからなる選別データ群の索引を作成する索引作成
手段とを備えた索引作成プログラムが記憶されてなるこ
とを特徴とする。
According to the present invention, there is provided an index creation program storage medium for collecting data according to an operation from a source data group consisting of a large number of data, and data collected by the data collection means. Data selecting means for selecting one or more data from the collected data group according to an operation or based on a predetermined first algorithm, and an index of the selected data group consisting of the data selected by the data selecting means. And an index creation program including an index creation means for creating the index.

【0021】なお、上記本発明の索引作成装置と、上記
索引作成プログラムとでは、それらを構成する構成要素
名として、データ選別手段等といった互いに同一の名称
を付しているが、索引作成装置の場合は、そのような作
用をなすソフトウェアとハードウェアとの結合を指し、
索引作成プログラムの場合は、そのような作用をなすソ
フトウェアの部分のみを指している。
In the index creation apparatus of the present invention and the above-mentioned index creation program, the same names as the constituent elements constituting them, such as data selection means, are given. If so, refers to the combination of software and hardware that performs such actions,
In the case of an indexing program, it refers only to the part of the software that performs such an action.

【0022】[0022]

【発明の実施の形態】以下、本発明の実施形態について
説明する。
Embodiments of the present invention will be described below.

【0023】図1は、本発明の索引作成装置の第1実施
形態が組み込まれたデータ検索システムを示す図であ
る。
FIG. 1 is a diagram showing a data search system in which a first embodiment of an index creation device according to the present invention is incorporated.

【0024】ここには、例示的に、それぞれがコンピュ
ータシステムからなる2台の端末100,200および
検索サーバ300によって構成された検索システムが示
されており、これらのコンピュータ100,200,3
00はネットワーク400を介して互いに接続されてい
る。
FIG. 2 shows, by way of example, a search system constituted by two terminals 100 and 200 each comprising a computer system and a search server 300. These computers 100, 200 and 3 are shown.
00 are connected to each other via a network 400.

【0025】各コンピュータ100,200,300
は、CPU、主記憶装置、磁気ディスク、通信用ボード
等が内蔵された本体部101,201,301、本体部
101,201,301からの指示により表示画面10
2a,202a,302a上に画像や文字列を表示する
表示部102,202,302、コンピュータ100,
200,300に指示を入力するためのキーボード10
3,203,303、表示画面102a,202a,3
02a上の任意の位置を指定することにより、その指定
時にその位置に表示されていたアイコン等に応じた指示
を入力するマウス104,204,304を備えてい
る。但し、検索サーバ(コンピュータ)300の表示部
やキーボード等は、検索システムの管理者だけが使用す
るものであり、検索システムの通常のユーザは、端末
(コンピュータ)100,200の表示部やキーボード
等を介して検索サーバ300と対話する。
Each computer 100, 200, 300
Is a main unit 101, 201, 301 in which a CPU, a main storage device, a magnetic disk, a communication board and the like are built, and a display screen 10 in response to an instruction from the main unit 101, 201, 301
2a, 202a, 302a, display units 102, 202, 302 for displaying images and character strings,
Keyboard 10 for inputting instructions to 200 and 300
3, 203, 303, display screens 102a, 202a, 3
The mouse 104, 204, or 304 is provided for inputting an instruction corresponding to an icon or the like displayed at the position at the time of specifying an arbitrary position on the 02a. However, the display unit and the keyboard of the search server (computer) 300 are used only by the administrator of the search system, and ordinary users of the search system can use the display unit and the keyboard of the terminals (computers) 100 and 200. Interacts with the search server 300 via.

【0026】端末100,200の本体部101,20
1には、さらに外観上、フロッピィディスク、CDRO
M(図示せず)が装填されるFD装填口101a,20
1a;CDROM装填口101b,201bが設けられ
ており、それらの内部には、それらの装填口101a,
101b;201a,201bから装填されたフロッピ
ィディスクやCDROMをドライブしてアクセスする、
フロッピィディスクドライバ、CDROMドライバも内
蔵されている。また、検索サーバの本体部301には、
フロッピィディスク、MO(光磁気ディスク)が装填さ
れるFD装填口301a、MO装填口301cが設けら
れており、それらの内部には、それらの装填口301
a,301cから装填されたフロッピィディスクやMO
をドライブしてアクセスする、フロッピィディスクドラ
イバ、MOドライバも内蔵されている。
Main units 101 and 20 of terminals 100 and 200
1 also has a floppy disk, CDRO
FD loading ports 101a and 20 into which M (not shown) is loaded.
1a: CDROM loading ports 101b, 201b are provided, and inside these loading ports 101a,
101b; access by driving a floppy disk or CDROM loaded from 201a, 201b;
A floppy disk driver and a CDROM driver are also built-in. Also, in the main body 301 of the search server,
An FD loading port 301a and an MO loading port 301c into which a floppy disk and an MO (magneto-optical disk) are loaded are provided.
a, floppy disk or MO loaded from 301c
It also has a floppy disk driver and MO driver for accessing the drive.

【0027】本発明にいう索引作成プログラムは、FD
装填口101a,201a;CDROM装填口101
b,201bに装填されるフロッピィディスク,CDR
OMや、FD装填口301a,MO装填口301cに装
填されるフロッピィディスク,MOや、ネットワーク4
00から、検索サーバ300の磁気ディスク内にインス
トールされる。このインストールされた索引作成プログ
ラムがCPUによって実行されることにより、検索サー
バ300が、本発明の索引作成装置の一実施形態として
動作する。従って、索引作成プログラムが格納されたフ
ロッピィディスクやCDROMやMOは本発明の索引作
成プログラム記憶媒体の一実施形態であり、索引作成プ
ログラムがインストールされた磁気ディスクも本発明の
索引作成プログラム記憶媒体の一実施形態である。
The index creation program referred to in the present invention is an FD
Loading ports 101a, 201a; CDROM loading port 101
b, Floppy disk loaded in 201b, CDR
OM, floppy disk, MO loaded in FD loading port 301a, MO loading port 301c, network 4
From 00, it is installed in the magnetic disk of the search server 300. When the installed index creation program is executed by the CPU, the search server 300 operates as one embodiment of the index creation device of the present invention. Therefore, a floppy disk, CDROM, or MO storing an index creation program is one embodiment of the index creation program storage medium of the present invention, and a magnetic disk on which the index creation program is installed is also included in the index creation program storage medium of the present invention. It is one embodiment.

【0028】以下では、2つの端末100,200のう
ち端末100を代表させて説明する。
Hereinafter, the terminal 100 will be described as a representative of the two terminals 100 and 200.

【0029】図2は、検索サーバのハードウェア構成図
である。
FIG. 2 is a hardware configuration diagram of the search server.

【0030】このハードウェア構成図には、中央演算処
理装置(CPU)311、RAM312、磁気ディスク
コントローラ313、フロッピィディスクドライバ31
4、MOドライバ315、マウスコントローラ316、
キーボードコントローラ317、ディスプレイコントロ
ーラ318、および通信用ボード319が示されてお
り、それらはバス310で相互に接続されている。
The hardware configuration diagram includes a central processing unit (CPU) 311, a RAM 312, a magnetic disk controller 313, a floppy disk driver 31
4, MO driver 315, mouse controller 316,
Shown are a keyboard controller 317, a display controller 318, and a communication board 319, which are interconnected by a bus 310.

【0031】フロッピィディスクドライバ314、MO
ドライバ315は、図1を参照して説明したように、そ
れぞれフロッピィディスク22、MO20が装填され、
装填されたフロッピィディスク22、MO20をアクセ
スするものである。
Floppy disk driver 314, MO
The driver 315 is loaded with the floppy disk 22 and the MO 20, respectively, as described with reference to FIG.
This is for accessing the loaded floppy disk 22 and MO20.

【0032】通信用ボード319は、図1に示すネット
ワーク400に接続される。このデータ検索システム
は、通信用ボード319およびネットワーク400を介
してインターネット等にアクセスすることができる。
The communication board 319 is connected to the network 400 shown in FIG. This data search system can access the Internet or the like via the communication board 319 and the network 400.

【0033】また、図2には、磁気ディスクコントロー
ラ313によりアクセスされる磁気ディスク21、マウ
スコントローラ316により制御されるマウス304、
キーボードコントローラ317により制御されるキーボ
ード303、およびディスプレイコントローラ318に
より制御されるCRTディスプレイ(表示部)302も
示されている。
FIG. 2 shows the magnetic disk 21 accessed by the magnetic disk controller 313, the mouse 304 controlled by the mouse controller 316,
A keyboard 303 controlled by a keyboard controller 317 and a CRT display (display unit) 302 controlled by a display controller 318 are also shown.

【0034】図3は、図1に示す検索システムの機能ブ
ロック図である。
FIG. 3 is a functional block diagram of the search system shown in FIG.

【0035】この図には、端末100と、検索サーバ3
00が示されており、また、これらが、図1に示すネッ
トワーク400を介して接続されているインターネット
500も示されている。上述したようにインターネット
500には多数のデータが記憶されており、インターネ
ット500は、本発明にいうデータ源の一例である。ま
た、検索サーバ300内には、データ収集部320と、
データ選別部321と、インデックス作成部322が実
現されており、これらによって、本発明の索引作成装置
の第1実施形態が構成されている。
In this figure, the terminal 100 and the search server 3
00 are also shown, and the Internet 500 to which they are connected via the network 400 shown in FIG. 1 is also shown. As described above, the Internet 500 stores a large amount of data, and the Internet 500 is an example of a data source according to the present invention. Further, in the search server 300, a data collection unit 320,
A data selection unit 321 and an index creation unit 322 are realized, and these constitute a first embodiment of the index creation device of the present invention.

【0036】データ収集部320は、以下説明するよう
な、端末100を介した指示に応じてインターネット5
00からデータを収集する。但し、ここでは、データの
アドレスやタイトルなどを収集することによって実質的
にデータを収集している。また、ここでは、データ収集
部320に対する指示方法は、ディレクトリ名やファイ
ル名が指示される場合と、URLアドレスおよびリンク
回数が指示される場合と、インターネットの検索エンジ
ンおよび検索キーワードが指示される場合とのうちから
ユーザによって任意に選択される。
The data collection unit 320 responds to an instruction via the terminal 100 as described below.
Collect data from 00. However, in this case, data is substantially collected by collecting data addresses, titles, and the like. Here, the method of instructing the data collection unit 320 includes a case where a directory name or a file name is specified, a case where a URL address and the number of links are specified, and a case where a search engine and a search keyword of the Internet are specified. Is arbitrarily selected by the user from the following.

【0037】図4は、ディレクトリ名やファイル名が指
示される指示画面を示す図である。
FIG. 4 is a diagram showing an instruction screen on which a directory name and a file name are designated.

【0038】この指示画面610は、図1に示す表示画
面102aに表示され、この指示画面610には、ボッ
クス611が設けられており、図1に示すキーボード1
04等によってボックス611内にディレクトリ名やフ
ァイル名が入力される。それによって、図3に示すデー
タ収集部320にディレクトリ名やファイル名が指示さ
れることとなり、その指示されたディレクトリやファイ
ルに格納されているデータがデータ収集部320によっ
て取得される。
The instruction screen 610 is displayed on the display screen 102a shown in FIG. 1, and a box 611 is provided on the instruction screen 610, and the keyboard 1 shown in FIG.
04 or the like, a directory name or a file name is input in the box 611. As a result, a directory name or a file name is instructed to the data collection unit 320 shown in FIG. 3, and data stored in the specified directory or file is acquired by the data collection unit 320.

【0039】また、図4に例示したように、ボックス6
11内に入力されるディレクトリ名等は、オールマイテ
ィを表す記号「*」を含むものであってもよく、その記
号「*」を含むディレクトリ名等が入力された場合に
は、該当する全てのディレクトリやファイルからデータ
が収集される。
Further, as illustrated in FIG.
11 may include a symbol “*” representing almighty. If a directory name including the symbol “*” is input, all the corresponding directory names are entered. Data is collected from directories and files.

【0040】図5は、URLアドレスおよびリンク回数
が指示される指示画面を示す図である。
FIG. 5 is a diagram showing an instruction screen on which a URL address and the number of links are instructed.

【0041】この指示画面620は、図1に示す表示画
面102aに表示され、この指示画面620には、UR
L入力ボックス621と長さ入力ボックス622が設け
られており、URL入力ボックス621にURLアドレ
スが入力され、長さ入力ボックス622にリンク回数が
入力される。そして、図3に示すデータ収集部320に
よって、URL入力ボックス621に入力されたURL
アドレスを起点として、長さ入力ボックス622に入力
されたリンク回数だけリンクを辿りながらデータが収集
される。
The instruction screen 620 is displayed on the display screen 102a shown in FIG.
An L input box 621 and a length input box 622 are provided. A URL address is input into the URL input box 621, and the number of links is input into the length input box 622. Then, the URL collected in the URL input box 621 by the data collection unit 320 shown in FIG.
Data is collected from the address as a starting point while following the link by the number of links input to the length input box 622.

【0042】図6は、検索エンジンおよび検索キーワー
ドが指示される指示画面を示す図である。
FIG. 6 is a diagram showing an instruction screen on which a search engine and a search keyword are specified.

【0043】この指示画面630は、図1に示す表示画
面102aに表示され、この指示画面630には、検索
エンジン名ボックス631と、キーワードボックス63
2と、件数ボックス633が設けられている。検索エン
ジンボックス631に検索エンジン名が入力され、キー
ワードボックス632に検索キーワードが入力され、件
数ボックス633にデータ件数が入力されると、図3に
示すデータ収集部320によって、その検索エンジンに
その検索キーワードが入力され、検索エンジンによる検
索結果の一覧の上位から、上記データ件数分だけデータ
が取得される。
The instruction screen 630 is displayed on the display screen 102a shown in FIG. 1. The instruction screen 630 includes a search engine name box 631 and a keyword box 63.
2 and a number box 633 are provided. When the search engine name is entered in the search engine box 631, the search keyword is entered in the keyword box 632, and the number of data is entered in the number box 633, the data collection unit 320 shown in FIG. A keyword is input, and data is acquired from the top of the list of search results by the search engine for the number of data items.

【0044】このように、図3に示す端末100を介し
てデータ収集部320にユーザの指示が与えられ、デー
タ収集部320によってインターネット500からデー
タが収集されると、以下説明するように、収集されたデ
ータの一覧がデータ選別部321によって端末100の
表示画面に表示され、端末100を介したユーザの指示
に応じてデータ選別部321によってデータが選別され
る。
As described above, when the user's instruction is given to the data collection unit 320 through the terminal 100 shown in FIG. 3 and the data is collected from the Internet 500 by the data collection unit 320, the collection is performed as described below. A list of the selected data is displayed on the display screen of the terminal 100 by the data selection unit 321, and the data is selected by the data selection unit 321 according to a user's instruction via the terminal 100.

【0045】図7は、データ選別部321によってデー
タが一覧表示される選別画面を示す図である。
FIG. 7 is a view showing a selection screen on which data is displayed in a list by the data selection section 321. As shown in FIG.

【0046】この選別画面700には、各データのアド
レス710、タイトル720、概要730からなる一覧
が表示され、また、ユーザが指示を与えるためのチェッ
クボタン740がデータ毎に設けられている。
The selection screen 700 displays a list including addresses 710, titles 720, and outlines 730 of each data, and a check button 740 for giving an instruction by a user is provided for each data.

【0047】ユーザは、選別画面700に表示されたタ
イトル720や概要730を参考に、各データがユーザ
の興味や嗜好にあった分野に属するものであるか否かを
判断し、ユーザの興味や嗜好にあった分野に属するデー
タのチェックボタン740をクリックする。クリックさ
れたチェックボタン740は反転表示される。これによ
って、一覧に表示されているデータの中から、チェック
ボタン740が反転表示されているデータだけを選別す
ることが指示されたこととなる。
Referring to the title 720 and the outline 730 displayed on the selection screen 700, the user determines whether each data belongs to a field that is in the interest or preference of the user, and determines the interest or the user's interest. The user clicks a check button 740 of data belonging to the field that matches his preference. The clicked check button 740 is highlighted. As a result, it is instructed that only the data whose check button 740 is highlighted is selected from the data displayed in the list.

【0048】ここで、ユーザの判断は厳密な判断である
必要はなく、明らかに不必要なデータ以外は全て興味や
嗜好にあっていると判断するといったような大雑把な判
断でよい。インターネット上に記憶されているデータの
圧倒的な部分はユーザが興味ない不必要なデータである
ので、このような大雑把な判断であってもデータは充分
に厳選されることとなる。
Here, the judgment of the user does not need to be strict, but may be a rough judgment such as judging that all the data other than the unnecessary data is of interest or preference. Since the overwhelming part of the data stored on the Internet is unnecessary data that the user is not interested in, even with such a rough judgment, the data is sufficiently selected.

【0049】また、この選別画面700はいわゆるブラ
ウザとしての機能も備えており、タイトル720等だけ
ではユーザが判断できない場合には、アドレス710が
クリックされることによってそのアドレスからデータが
取得されて表示される。
The selection screen 700 also has a function as a so-called browser, and when the user cannot judge only by the title 720 or the like, the address 710 is clicked to acquire data from the address and display the data. Is done.

【0050】このように、図3に示す端末100を介し
てデータ選別部321にユーザの指示が与えられると、
その指示に従ってデータ選別部321によってデータが
選別される。その選別されたデータに基づいて、本発明
にいう索引に相当する検索インデックスがインデックス
作成部322によって作成される。
As described above, when the user's instruction is given to the data selection unit 321 via the terminal 100 shown in FIG.
Data is sorted by the data sorting unit 321 according to the instruction. Based on the selected data, a search index corresponding to the index according to the present invention is created by the index creation unit 322.

【0051】インデックス作成部322は、データ選別
部321によって選別されたデータに、ファイル名やU
RLのアドレスを用いてアクセスして、いわゆる形態素
解析等によりそのデータ中に出現するキーワードなどを
抽出し,その抽出されたキーワードなどを用いて、いわ
ゆるシグネチャファイル形式やインバーテッドファイル
形式といった形式の検索インデックスを作成する。
The index creation unit 322 adds a file name and a U name to the data selected by the data selection unit 321.
Access is performed using the address of the RL, and a keyword or the like appearing in the data is extracted by so-called morphological analysis or the like, and a search in a so-called signature file format or inverted file format is performed using the extracted keyword or the like. Create an index.

【0052】このようにして作成された検索インデック
スは、検索インデックスデータベース323に格納され
る。上述したようなデータ収集、データ選択、インデッ
クス作成が繰り返し実行され、検索インデックスデータ
ベース323に格納された検索インデックスが繰り返し
更新されて、例えば、データ選別部321によって新た
に選別されたデータが順次追加されると、ユーザの興味
や嗜好にあった分野のデータが高い割合で含まれるとと
もに、そのような分野のデータの大部分が含まれるデー
タ群に相当する検索インデックスが得られる。
The search index thus created is stored in the search index database 323. The above-described data collection, data selection, and index creation are repeatedly executed, and the search index stored in the search index database 323 is repeatedly updated. For example, data newly selected by the data selection unit 321 is sequentially added. Then, a search index corresponding to a data group including a large portion of data in such a field is obtained while a high percentage of data in a field that meets the interests and preferences of the user is obtained.

【0053】検索サーバ300には、検索インデックス
データベース323に格納された検索インデックスを用
いてデータ検索を行うデータ検索部324が備えられて
おり、このデータ検索部324は、端末100を介した
ユーザの指示に応じて検索を行い、検索結果を端末10
0の表示画面に表示する。検索結果は、例えば、従来の
ランキング検索技術などが用いられて一覧表示され、ユ
ーザは、この検索結果に基づきブラウザなどを用いてイ
ンターネット500上に記憶されているデータにアクセ
スする。上述したような検索インデックが用いられるこ
とにより、このデータ検索部324による検索の結果見
つけられるデータには、ユーザの興味や嗜好にあった分
野のデータが充分に高い割合で含まれており、高い検索
精度や高い検索効率が実現される。
The search server 300 is provided with a data search unit 324 for performing data search using the search index stored in the search index database 323. A search is performed according to the instruction, and the search result is transmitted to the terminal 10.
0 is displayed on the display screen. The search results are displayed as a list using, for example, a conventional ranking search technique, and the user accesses data stored on the Internet 500 using a browser or the like based on the search results. By using the search index as described above, the data that is found as a result of the search by the data search unit 324 includes a sufficiently high ratio of data in a field that matches the interests and preferences of the user. Search accuracy and high search efficiency are realized.

【0054】以上で第1実施形態の説明を終了し、以
下、第2実施形態について説明する。この第2実施形態
は、第1実施形態が含まれている検索システムと同様の
検索システムに含まれており、重複説明は省略する。
The description of the first embodiment is completed above, and the second embodiment will be described below. This second embodiment is included in a search system similar to the search system in which the first embodiment is included, and redundant description will be omitted.

【0055】図8は、第2実施形態を含む検索システム
の機能ブロック図である。
FIG. 8 is a functional block diagram of a search system including the second embodiment.

【0056】この図8の機能ブロック図に示す構成要素
のうち、図3の機能ブロック図に示す構成要素と同様の
構成要素については同一の符号を付して説明を省略す
る。
Among the components shown in the functional block diagram of FIG. 8, the same components as those shown in the functional block diagram of FIG. 3 are denoted by the same reference numerals, and description thereof is omitted.

【0057】この図8には、選別履歴データベース32
5、キーワード学習部326、学習結果データベース3
27、キーワード抽出部328、データ判定部329、
データ提示部330が示されており、これら選別履歴デ
ータベース325等と、上述した、データ収集部32
0、データ選別部321、インデックス作成部322に
よって、本発明の索引作成装置の第2実施形態が構成さ
れている。
FIG. 8 shows the sorting history database 32
5. Keyword learning unit 326, learning result database 3
27, a keyword extraction unit 328, a data determination unit 329,
The data presenting unit 330 is shown, and the sorting history database 325 and the like and the data collecting unit 32 described above are shown.
0, the data selection unit 321 and the index creation unit 322 constitute a second embodiment of the index creation device of the present invention.

【0058】この図8には、データ選別部321による
データ選別の履歴が格納される選別履歴データベース3
25が示されており、この選別履歴データベース325
には、履歴の一例として、データ収集部320によって
収集されたデータのうちデータ選別手段321により選
別されたデータから抽出されたキーワードなどと、収集
されたデータのうち選別されなかったデータから抽出さ
れたキーワードなどとが区別されて格納される。
FIG. 8 shows a sorting history database 3 in which a history of data sorting by the data sorting unit 321 is stored.
25, the sorting history database 325
As an example of a history, keywords extracted from data collected by the data collection unit 320 and extracted from data selected by the data selection unit 321 and data extracted from uncollected data among collected data are used as examples of the history. Are stored separately from the keywords.

【0059】また、キーワード学習部326は、選別履
歴データベース325に格納されたキーワードなどに基
づいて、例えば、選別されたデータ中に出現するキーワ
ードには、あるキーワードが含まれ、かつ、あるキーワ
ードと他のあるキーワードとの組み合わせが含まれない
といったような特色を学習する。また、その学習された
特色は、学習結果データベース327に格納される。
Further, the keyword learning unit 326 determines, for example, that a keyword appearing in the selected data includes a certain keyword based on the keyword stored in the selection history database 325, Learn characteristics such as not including a combination with some other keyword. The learned spot color is stored in the learning result database 327.

【0060】また、キーワード抽出部328は、データ
収集部320によって収集されたデータから形態素解析
等によりキーワード等を抽出する。また、データ判定部
329は、キーワード抽出部328によって抽出された
キーワード等が、学習結果データベース327に格納さ
れている特色を満たしているか否かを判定する。ここで
は、データ判定部329による判定結果は、データ選別
部321によるデータ表示に反映される。即ち、図7に
示すチェックボタン740のうち、データ判定部329
によって特色を満たしていると判定されたデータのチェ
ックボタンが反転表示される。このような判定結果を参
考にすることにより、ユーザは、選別されるデータの指
示を容易に行うことができ、ユーザの負担が軽減されて
いる。
The keyword extracting unit 328 extracts a keyword or the like from the data collected by the data collecting unit 320 by morphological analysis or the like. Further, the data determination unit 329 determines whether the keyword or the like extracted by the keyword extraction unit 328 satisfies the spot color stored in the learning result database 327. Here, the determination result by the data determination unit 329 is reflected on the data display by the data selection unit 321. That is, among the check buttons 740 shown in FIG.
The check button of the data determined to satisfy the spot color is highlighted. By referring to such a determination result, the user can easily specify the data to be sorted, and the burden on the user is reduced.

【0061】また、データ提示部330は、検索インデ
ックスデータベース323に格納されている検索インデ
ックスの更新状況を監視することによって、データ選別
部321により新たに選別されたデータを取得する。そ
して、端末100を介して予めユーザによって入力され
る、所望のデータが満たすべき条件に基づいて、その新
たに選別されたデータを吟味して、その条件を満たすデ
ータが存在する場合には、そのデータを、端末100を
介してユーザに提示する。このようなデータ提示部33
0によって提示されたデータに対して、ユーザが、端末
100およびインターネット500を介してアクセスす
ることによって、予め設定した条件を満たすような所望
のデータを取得することができる。つまり、データ提示
部330が備えられていることによって、ユーザは、デ
ータ検索部324を用いたデータ検索を行わなくても、
所望のデータを取得することができる。
The data presentation unit 330 acquires the data newly selected by the data selection unit 321 by monitoring the update status of the search index stored in the search index database 323. Then, based on a condition to be satisfied by the desired data, which is input in advance by the user via the terminal 100, the newly selected data is examined, and if there is data that satisfies the condition, The data is presented to the user via the terminal 100. Such a data presentation unit 33
The user can obtain desired data that satisfies a preset condition by accessing the data presented by “0” through the terminal 100 and the Internet 500. In other words, the provision of the data presentation unit 330 allows the user to perform data search without using the data search unit 324.
Desired data can be obtained.

【0062】なお、上記実施形態では、データ選別部は
ユーザの操作に応じてデータを選別するが、本発明にい
うデータ選別手段は、例えば、図8に示すデータ判定部
による判定結果に基づいて自動的にデータを選別するも
のであってもよく、あるいは、予めユーザによって選別
基準が設定されその選別基準に基づいて自動的にデータ
を選別するものであってもよい。
In the above-described embodiment, the data selection unit selects data according to the operation of the user. However, the data selection unit according to the present invention uses, for example, the data selection unit shown in FIG. Data may be automatically selected, or data may be automatically selected based on a selection criterion set in advance by a user.

【0063】[0063]

【発明の効果】以上説明したように、本発明の索引作成
装置によれば、ユーザが所望するデータを容易に取得す
ることができる索引を作成することができる。
As described above, according to the index creating apparatus of the present invention, an index can be created that allows a user to easily obtain desired data.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の索引作成装置の第1実施形態が組み込
まれたデータ検索システムを示す図である。
FIG. 1 is a diagram showing a data search system in which a first embodiment of an index creation device of the present invention is incorporated.

【図2】検索サーバのハードウェア構成図である。FIG. 2 is a hardware configuration diagram of a search server.

【図3】検索システムの機能ブロック図である。FIG. 3 is a functional block diagram of a search system.

【図4】ディレクトリ名やファイル名が指示される指示
画面を示す図である。
FIG. 4 is a diagram showing an instruction screen on which a directory name and a file name are indicated;

【図5】URLアドレスおよびリンク回数が指示される
指示画面を示す図である。
FIG. 5 is a diagram showing an instruction screen on which a URL address and the number of links are instructed.

【図6】検索エンジンおよび検索キーワードが指示され
る指示画面を示す図である。
FIG. 6 is a diagram showing an instruction screen on which a search engine and a search keyword are instructed.

【図7】データ選別部によってデータが一覧表示される
選別画面を示す図である。
FIG. 7 is a diagram illustrating a selection screen on which data is displayed in a list by a data selection unit.

【図8】第2実施形態を含む検索システムの機能ブロッ
ク図である。
FIG. 8 is a functional block diagram of a search system including a second embodiment.

【符号の説明】[Explanation of symbols]

20 MO 21 磁気ディスク 22 フロッピィディスク 100,200 端末 300 検索サーバ 320 データ収集部 321 データ選別部 322 インデックス作成部(索引作成手段) 323 検索インデックスデータベース 324 データ検索部 325 選別履歴データベース 326 キーワード学習部 327 学習結果データベース 328 キーワード抽出部 329 データ判別部 330 データ提示部 400 ネットワーク 500 インターネット(データ源) Reference Signs List 20 MO 21 Magnetic disk 22 Floppy disk 100, 200 Terminal 300 Search server 320 Data collection unit 321 Data selection unit 322 Index creation unit (index creation means) 323 Search index database 324 Data search unit 325 Selection history database 326 Keyword learning unit 327 Learning Result database 328 Keyword extraction unit 329 Data discrimination unit 330 Data presentation unit 400 Network 500 Internet (data source)

───────────────────────────────────────────────────── フロントページの続き (72)発明者 湯上 伸弘 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B075 KK07 ND36 NK32 NK44 NK49 NR12 PP03 PP13 PP22 PP25 PP30 PQ02 PR03  ────────────────────────────────────────────────── ─── Continued on the front page (72) Nobuhiro Yugami 4-1-1, Kamidadanaka, Nakahara-ku, Kawasaki City, Kanagawa Prefecture F-term within Fujitsu Limited (Reference) 5B075 KK07 ND36 NK32 NK44 NK49 NR12 PP03 PP13 PP22 PP25 PP30 PQ02 PR03

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 多数のデータからなる源データ群を記憶
しているデータ源に接続され、該データ源に記憶されて
いる源データ群の中からデータを操作に応じて収集する
データ収集手段と、 前記データ収集手段によって収集されたデータからなる
収集データ群の中から1つ以上のデータを、操作に応じ
てあるいは所定の第1アルゴリズムに基づいて選別する
データ選別手段と、 前記データ選別手段によって選別されたデータからなる
選別データ群の索引を作成する索引作成手段とを備えた
ことを特徴とする索引作成装置。
1. A data collection means connected to a data source storing a source data group consisting of a large number of data, and collecting data according to an operation from the source data group stored in the data source. A data selection unit that selects one or more data from a collection data group including data collected by the data collection unit in accordance with an operation or based on a predetermined first algorithm; An index creation device for creating an index of a sorted data group composed of the sorted data.
【請求項2】 前記選別データ群の中から所定の第2ア
ルゴリズムに基づいてさらにデータを選別して提示する
データ提示手段を備えたことを特徴とする請求項1記載
の索引作成装置。
2. The index creation device according to claim 1, further comprising a data presenting unit for further selecting and presenting data from the selected data group based on a predetermined second algorithm.
【請求項3】 前記データ源が、他のデータを示すリン
クを含むデータを記憶しているものであって、 前記データ収集手段が、前記リンクを辿りながらデータ
を収集するものであるとともに、前記データ源に記憶さ
れているデータのうちの1つのデータを特定する情報
と、リンクを辿る回数とが入力され、該情報により特定
されるデータを起点として該回数だけリンクを辿りなが
らデータを収集するものであることを特徴とする請求項
1記載の索引作成装置。
3. The data source stores data including a link indicating other data, wherein the data collection unit collects data while following the link. Information specifying one of the data stored in the data source and the number of times to follow the link are input, and data is collected while following the link by the number of times starting from the data specified by the information. 2. The index creation device according to claim 1, wherein the index creation device is an index creation device.
【請求項4】 前記データ源が、自分が記憶しているデ
ータを検索する手段を備え、検索キーの入力を受け該検
索キーを用いてデータを検索するものであって、 前記データ収集手段が、操作に応じた検索キーを前記デ
ータ源に入力し該検索キーに応じた検索によって得られ
たデータを収集するものであることを特徴とする請求項
1記載の索引作成装置。
4. The data source includes means for searching for data stored therein, receiving a search key input, and searching for data using the search key. 2. The index creation device according to claim 1, wherein a search key corresponding to an operation is input to the data source, and data obtained by a search according to the search key is collected.
【請求項5】 前記データ選別手段が、操作に応じてデ
ータを選別するものであって、 前記データ選別手段によるデータ選別の履歴に基づい
て、選別されたデータの特色を学習する学習手段と、 前記データ収集手段によって収集された各データが、前
記学習手段によって学習された特色を備えたデータであ
るか否かを判定するデータ判定手段とを備えたことを特
徴とする請求項1記載の索引作成装置。
5. A learning means for sorting data in accordance with an operation, wherein the data sorting means learns a characteristic of the selected data based on a history of data sorting by the data sorting means. 2. The index according to claim 1, further comprising: a data determination unit that determines whether each data collected by the data collection unit is data having a spot color learned by the learning unit. Creating device.
【請求項6】 多数のデータからなる源データ群の中か
ら操作に応じたデータを収集するデータ収集手段と、 前記データ収集手段によって収集されたデータからなる
収集データ群の中から1つ以上のデータを、操作に応じ
てあるいは所定の第1アルゴリズムに基づいて選別する
データ選別手段と、 前記データ選別手段によって選別されたデータからなる
選別データ群の索引を作成する索引作成手段とを備えた
索引作成プログラムが記憶されてなることを特徴とする
索引作成プログラム記憶媒体。
6. A data collection means for collecting data according to an operation from a source data group consisting of a large number of data, and at least one of a collection data group consisting of data collected by said data collection means. An index comprising: data selection means for selecting data according to an operation or based on a predetermined first algorithm; and index creation means for creating an index of a selection data group composed of data selected by the data selection means. An index creation program storage medium, wherein the creation program is stored.
JP11072103A 1999-03-17 1999-03-17 Index preparing device and index preparing program storage medium Pending JP2000268048A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11072103A JP2000268048A (en) 1999-03-17 1999-03-17 Index preparing device and index preparing program storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11072103A JP2000268048A (en) 1999-03-17 1999-03-17 Index preparing device and index preparing program storage medium

Publications (1)

Publication Number Publication Date
JP2000268048A true JP2000268048A (en) 2000-09-29

Family

ID=13479744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11072103A Pending JP2000268048A (en) 1999-03-17 1999-03-17 Index preparing device and index preparing program storage medium

Country Status (1)

Country Link
JP (1) JP2000268048A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002351912A (en) * 2001-05-25 2002-12-06 Sharp Corp Information distributing system, information collecting and creating terminal device, information providing device, information utilization terminal device and program for operating them, its storage medium and method for distributing information
JP2011018382A (en) * 2010-10-15 2011-01-27 Sharp Corp Apparatus and method for accumulating preference
KR102638265B1 (en) * 2023-09-25 2024-02-20 주식회사 로이드케이 Method and device for building a search engine based on computing environment using artifitial neural network

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002351912A (en) * 2001-05-25 2002-12-06 Sharp Corp Information distributing system, information collecting and creating terminal device, information providing device, information utilization terminal device and program for operating them, its storage medium and method for distributing information
JP2011018382A (en) * 2010-10-15 2011-01-27 Sharp Corp Apparatus and method for accumulating preference
KR102638265B1 (en) * 2023-09-25 2024-02-20 주식회사 로이드케이 Method and device for building a search engine based on computing environment using artifitial neural network

Similar Documents

Publication Publication Date Title
US6434556B1 (en) Visualization of Internet search information
US9384245B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
US8572074B2 (en) Identifying task groups for organizing search results
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
US9146999B2 (en) Search keyword improvement apparatus, server and method
US20140052709A1 (en) Document information management system
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20120078979A1 (en) Method for advanced patent search and analysis
EP1003111A1 (en) A method of searching documents and a service for searching documents
US7024405B2 (en) Method and apparatus for improved internet searching
US20010021934A1 (en) Processing device for searching information in one language using search query in another language, and recording medium and method thereof
EP1212697A1 (en) Method and apparatus for building a user-defined technical thesaurus using on-line databases
JP4075094B2 (en) Information classification device
US7043482B1 (en) Automatic and secure data search method using a data transmission network
EP1209583A2 (en) Method and device for searching for information on a data communications network
JP4469432B2 (en) INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP2008191982A (en) Retrieval result output device
KR100616152B1 (en) Control method for automatically sending to other web site news automatically classified on internet
JP2000268048A (en) Index preparing device and index preparing program storage medium
JP2000231569A (en) Internet information retrieving device, internet information retrieving method and computer readable recording medium with program making computer execute method recorded therein
JPH11154164A (en) Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same
KR20010082966A (en) Method and system for providing related web sites for the current visitting of client
JP2002278995A (en) Retrieval engine supporting method for retrieving and displaying document including retrieval word

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060725

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212