JP2000348042A - Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium - Google Patents

Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium

Info

Publication number
JP2000348042A
JP2000348042A JP11156511A JP15651199A JP2000348042A JP 2000348042 A JP2000348042 A JP 2000348042A JP 11156511 A JP11156511 A JP 11156511A JP 15651199 A JP15651199 A JP 15651199A JP 2000348042 A JP2000348042 A JP 2000348042A
Authority
JP
Japan
Prior art keywords
thesaurus
information
database
integrated
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11156511A
Other languages
Japanese (ja)
Inventor
Taro Fujimoto
太郎 藤本
Aoshi Okamoto
青史 岡本
Nobuhiro Yugami
伸弘 湯上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11156511A priority Critical patent/JP2000348042A/en
Publication of JP2000348042A publication Critical patent/JP2000348042A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an integrated thesaurus preparing device operable at a high speed and a low cost in distributed database environment, a corrected thesaurus preparing device and an each-user thesaurus preparing device capable of dealing with various user's needs, an integrated thesaurus preparing program storage medium for forming and operating these thesaurus preparing device on a computer, a corrected thesaurus preparing program storage medium and an each-user thesaurus preparing program storage medium. SOLUTION: A characteristic thesaurus obtaining means 11-1 obtains database thesauruses 17a, 17b expressing a mutual relation between words in information stored in database 15a and 15b. An integrated thesaurus preparing means 11-2 integrates the obtained thesauruses to prepare an integrated thesaurus 12 expressing a mutual relation between words corresponding to total information stored in a group of database.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、データベースに記
憶された情報中の単語相互間の関連を表すシソーラスを
作成するシソーラス作成装置、およびそのシソーラスを
作成するシソーラス作成プログラムが記憶されてなるシ
ソーラス作成プログラム記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a thesaurus creation device for creating a thesaurus representing the relationship between words in information stored in a database, and a thesaurus creation storing a thesaurus creation program for creating the thesaurus. It relates to a program storage medium.

【0002】[0002]

【従来の技術】従来、データベースを検索するために用
いられるシソーラスを作成する方法として、人手により
データベースの情報中の単語相互間の関係を調べてシソ
ーラスを作成する方法のほかに、電子化文書中の単語の
出現頻度情報などを用いてシソーラスを自動的に作成す
る方法があり、単語相互間の関係からシソーラスを自動
的に作成する手法自体についても種々の手法が開発され
ている。
2. Description of the Related Art Conventionally, as a method of creating a thesaurus used for searching a database, in addition to a method of manually examining a relationship between words in information in a database and creating a thesaurus, a method of creating a thesaurus is also available. There is a method of automatically creating a thesaurus using the appearance frequency information of a word, and various methods have been developed for automatically creating a thesaurus from the relationship between words.

【0003】[0003]

【発明が解決しようとする課題】ところで、インターネ
ット/イントラネットのように広域に分散して配置され
た複数のデータベースを統合して運用する分散データベ
ース環境において、ネットワークに接続された複数のデ
ータベースを検索するためのシソーラスを作成する際
に、ネットワークの規模が大きい場合にはこれら複数の
データベースの情報を統合して作成されるシソーラスも
また極めて大規模なものとなる。この大規模なシソーラ
スを、絶えず更新されている各データベースを反映した
状態にメンテナンスしておくためには、シソーラス管理
担当者はネットワーク上の全てのデータベースを絶えず
監視している必要があり、いずれかのデータベースで更
新が行われる度毎にシソーラスを更新しなければならな
い。しかし、従来のシソーラス作成手法では、個々のデ
ータベースの更新の度毎に複数のデータベースからなる
データベース群の大量の情報を収集してシソーラスを更
新するため、その更新処理に長時間を要しそのコストは
極めて大きなものとなる。
In a distributed database environment in which a plurality of databases distributed over a wide area such as the Internet / intranet are integrated and operated, a plurality of databases connected to the network are searched. When a large-scale network is used to create a thesaurus for use, the thesaurus created by integrating the information of the plurality of databases is also very large. In order to maintain this large thesaurus with the constantly updated databases, the thesaurus administrator must constantly monitor all the databases on the network. Each time an update is made in the database, the thesaurus must be updated. However, the conventional thesaurus creation method updates a thesaurus by collecting a large amount of information in a database group consisting of a plurality of databases each time an individual database is updated. Is extremely large.

【0004】また、一般に、データベースの利用者は常
に最新のデータベースの情報を検索できることを望んで
いるが、従来のシソーラス作成手法では、全てのデータ
ベースの情報を集めるだけでも長時間を必要とする上
に、全ての情報についての単語相互間の類似度計算を行
っているうちにデータベースの情報自体が変化してしま
いシソーラスの更新が完了した時点では利用者のニーズ
からかけ離れたものとなってしまう恐れがある。
In general, database users desire to be able to always search for the latest database information. However, in the conventional thesaurus creation method, it takes a long time to collect all database information. In addition, while calculating the similarity between words for all information, the information in the database itself changes, and when the thesaurus is updated, it may be far from the needs of the user There is.

【0005】また、インターネット/イントラネットで
は利用者が広域に分散しており、かつその数も多いため
データベース検索に対するニーズも極めて多様であり、
従来の手法で作成されたシソーラスではそのような多様
な利用者ニーズに対応することは難しい。
[0005] In the Internet / intranet, users are dispersed over a wide area, and the number of users is large.
It is difficult to respond to such diverse user needs with a thesaurus created by a conventional method.

【0006】一方、インターネット/イントラネットで
は、広域に分散した複数のサーバは、それぞれ独自のポ
リシーで運営されており、利用者の立場から見ると情報
の追加、更新等はランダムに行われている。これらのラ
ンダムに追加、更新される複数の情報源を利用者の視点
で一元化して、取り扱いやすい形にして提供するマルチ
エージェントによる横断検索システムが開発されてい
る。このマルチエージェントによる横断検索システムに
おいて、シソーラスを用いてデータベースを検索するこ
とが要望されている。しかし、そのようなシソーラスシ
ステムを実現するには、各マルチエージェントで取り扱
う全ての情報を用いて単語相互間の関連度の計算を行っ
てシソーラスを作成するとともにそのシソーラスを更新
し続けてゆく必要があるが、従来のシソーラス作成手法
を採用したのではその情報処理量は膨大なものとなり、
それを用いて行われるシソーラス更新には多大のコスト
と処理時間を必要とする。
[0006] On the other hand, in the Internet / intranet, a plurality of servers distributed over a wide area are operated according to their own policies, and from the user's point of view, information is added or updated at random. A multi-agent cross-search system has been developed which unifies a plurality of these randomly added and updated information sources from the user's point of view and provides them in an easy-to-handle form. In this multi-agent cross-searching system, there is a demand for searching a database using a thesaurus. However, in order to realize such a thesaurus system, it is necessary to calculate the relevance between words using all information handled by each multi-agent, create a thesaurus, and keep updating the thesaurus. However, if the conventional thesaurus creation method was adopted, the amount of information processing would be enormous,
Updating a thesaurus using it requires a great deal of cost and processing time.

【0007】本発明は、上記の事情に鑑み、複数のデー
タベースからなるデータベース群に記憶された情報を用
いて、迅速かつ低コストで更新することができる統合シ
ソーラスを作成する統合シソーラス作成装置、多様な利
用者ニーズに対応することが可能な修正シソーラス作成
装置および利用者別シソーラス作成装置を提供すること
を目的とする。
[0007] In view of the above circumstances, the present invention provides an integrated thesaurus creating apparatus for creating an integrated thesaurus that can be updated quickly and at low cost using information stored in a database group including a plurality of databases. It is an object of the present invention to provide a modified thesaurus creation device and a user-specific thesaurus creation device capable of meeting various user needs.

【0008】さらに、コンピュータシステムをそのよう
な統合シソーラス作成装置、修正シソーラス作成装置、
利用者別シソーラス作成装置として動作させる統合シソ
ーラス作成プログラム、修正シソーラス作成プログラ
ム、および利用者別シソーラス作成プログラムが記憶さ
れてなる統合シソーラス作成プログラム記憶媒体、修正
シソーラス作成プログラム記憶媒体、および利用者別シ
ソーラス作成プログラム記憶媒体を提供することを目的
とする。
[0008] Further, the computer system may be provided with such an integrated thesaurus creation device, a modified thesaurus creation device,
Integrated thesaurus creation program, modified thesaurus creation program, and integrated thesaurus creation program storage medium storing a user-specific thesaurus creation program to be operated as a user-specific thesaurus creation device, modified thesaurus creation program storage medium, and user-based thesaurus It is an object of the present invention to provide a program storage medium.

【0009】[0009]

【課題を解決するための手段】上記の目的を達成する本
発明の統合シソーラス作成装置は、データベースに記憶
された情報中の単語相互間の関連を表す、そのデータベ
ースに固有のシソーラスがそれぞれに用意されてなる複
数のデータベースの各シソーラスを取得する固有シソー
ラス取得手段と、上記固有シソーラス取得手段によって
取得されたシソーラスを統合することにより、上記複数
のデータベースからなるデータベース群に記憶された情
報の総体に対応する、その総体中の単語相互間の関連を
表す統合シソーラスを作成する統合シソーラス作成手段
とを備えたことを特徴とする。
According to the present invention, there is provided an integrated thesaurus creating apparatus for achieving the above object, wherein a thesaurus unique to the database is provided, which indicates the relationship between words in information stored in the database. By integrating the thesaurus acquired by the unique thesaurus acquisition means and the thesaurus acquired by the unique thesaurus acquisition means for acquiring the thesauruses of the plurality of databases, the total information stored in the database group including the plurality of databases is obtained. And integrated thesaurus creation means for creating an integrated thesaurus representing the association between the words in the whole.

【0010】また、上記の目的を達成する本発明の修正
シソーラス作成装置は、データベースに記憶された情報
中の単語相互間の関連を表すシソーラスを取得するシソ
ーラス取得手段と、上記シソーラス取得手段によって取
得されたシソーラスを、上記データベースにおける情報
検索の履歴情報、または操作によって与えられるシソー
ラス更新情報に基づいて修正することにより修正シソー
ラスを作成する修正シソーラス作成手段とを備えたこと
を特徴とする。
According to another aspect of the present invention, there is provided a modified thesaurus creating apparatus for acquiring a thesaurus representing an association between words in information stored in a database. A modified thesaurus based on information retrieval history information in the database or a thesaurus update information provided by an operation, thereby producing a modified thesaurus.

【0011】また、上記の目的を達成する本発明の情報
収集型シソーラス作成装置は、データベースに記憶され
た情報中の単語相互間の関連を表す、そのデータベース
に固有のシソーラスがそれぞれに用意されてなる複数の
データベースのシソーラスから、その複数のデータベー
スからなるデータベース群における情報検索の履歴情報
に基づいて、そのシソーラスを構成する情報を収集する
情報収集手段と、上記情報収集手段によって収集された
情報に基づいて、上記データベース群に対応する情報収
集型シソーラスを作成する情報収集型シソーラス作成手
段とを備えたことを特徴とする。
Further, the information collecting type thesaurus creating apparatus of the present invention, which achieves the above object, has a thesaurus unique to the database, which indicates the relation between words in the information stored in the database. Information collecting means for collecting information constituting the thesaurus, based on information retrieval history information in a database group comprising the plurality of databases, and information collected by the information collecting means. Information collection thesaurus creation means for creating an information collection thesaurus corresponding to the database group based on the information.

【0012】また、上記の目的を達成する本発明の統合
シソーラス作成プログラム記憶媒体は、データベースに
記憶された情報中の単語相互間の関連を表す、そのデー
タベースに固有のシソーラスがそれぞれに用意されてな
る複数のデータベースの各シソーラスを取得する固有シ
ソーラス取得手段と、上記固有シソーラス取得手段によ
って取得されたシソーラスを統合することにより、上記
複数のデータベースからなるデータベース群に記憶され
た情報の総体に対応する、その総体中の単語相互間の関
連を表す統合シソーラスを作成する統合シソーラス作成
手段とを備えた統合シソーラス作成プログラムが記憶さ
れてなることを特徴とする。
Further, the integrated thesaurus creation program storage medium of the present invention that achieves the above object has a thesaurus unique to the database, which indicates the relationship between words in the information stored in the database. By integrating the thesaurus acquired by the unique thesaurus acquisition means for acquiring each thesaurus of the plurality of databases and the thesaurus acquired by the unique thesaurus acquisition means, it corresponds to the total information stored in the database group consisting of the plurality of databases. And an integrated thesaurus creating means for creating an integrated thesaurus representing the relationship between the words in the whole.

【0013】また、上記の目的を達成する本発明の修正
シソーラス作成プログラム記憶媒体は、データベースに
記憶された情報中の単語相互間の関連を表すシソーラス
を取得するシソーラス取得手段と、上記シソーラス取得
手段によって取得されたシソーラスを、上記データベー
スにおける情報検索の履歴情報、または操作によって与
えられるシソーラス更新情報に基づいて修正することに
より修正シソーラスを作成する修正シソーラス作成手段
とを備えた修正シソーラス作成プログラムが記憶されて
なることを特徴とする。
[0013] A modified thesaurus creation program storage medium according to the present invention that achieves the above object has a thesaurus acquisition means for acquiring a thesaurus representing the relationship between words in information stored in a database, and the thesaurus acquisition means. A modified thesaurus creation means for creating a modified thesaurus by modifying the thesaurus acquired by the above based on the history information of the information search in the database or thesaurus update information given by the operation. It is characterized by being done.

【0014】また、上記の目的を達成する本発明の情報
収集型シソーラス作成プログラム記憶媒体は、データベ
ースに記憶された情報中の単語相互間の関連を表す、そ
のデータベースに固有のシソーラスがそれぞれに用意さ
れてなる複数のデータベースのシソーラスから、その複
数のデータベースからなるデータベース群における情報
検索の履歴情報に基づいて、そのシソーラスを構成する
情報を収集する情報収集手段と、上記情報収集手段によ
って収集された情報に基づいて、上記データベース群に
対応する情報収集型シソーラスを作成する情報収集型シ
ソーラス作成手段とを備えた情報収集型シソーラス作成
プログラムが記憶されてなることを特徴とする。
Further, in the information collection type thesaurus creation program storage medium of the present invention which achieves the above object, a thesaurus unique to the database, which indicates the relationship between words in the information stored in the database, is prepared. Information collecting means for collecting information constituting the thesaurus based on information retrieval history information in a database group comprising the plurality of databases, and information collected by the information collecting means. An information collection type thesaurus creation program including an information collection type thesaurus creation means for creating an information collection type thesaurus corresponding to the database group based on the information is stored.

【0015】[0015]

【発明の実施の形態】以下、本発明の実施形態について
説明する。
Embodiments of the present invention will be described below.

【0016】なお、本実施形態において「シソーラス」
とは、単に類義語が集められた辞書を意味するものでは
なく、関連度が付与された単語対の集合として定義して
いる。すなわち、検索の対象となるデータベース内にお
ける単語対に、その単語対を構成する2つの単語相互間
の関連の深さを、例えば0から1までの小数で表した関
連度として付与したものの集合を意味している。
In this embodiment, the "thesaurus"
Does not simply mean a dictionary in which synonyms are collected, but is defined as a set of word pairs to which relevance has been assigned. In other words, a set of word pairs in the database to be searched which is given the depth of association between the two words constituting the word pair as a degree of association expressed as a decimal number from 0 to 1, for example. Means.

【0017】図1は、本発明の統合シソーラス作成装
置、修正シソーラス作成装置、情報収集型シソーラス作
成装置、統合シソーラス作成プログラム記憶媒体、修正
シソーラス作成プログラム記憶媒体、および情報収集型
シソーラス作成プログラム記憶媒体が適用されるコンピ
ュータの外観図であり、図2は、本発明の統合シソーラ
ス作成装置、修正シソーラス作成装置、情報収集型シソ
ーラス作成装置、統合シソーラス作成プログラム記憶媒
体、修正シソーラス作成プログラム記憶媒体、および情
報収集型シソーラス作成プログラム記憶媒体が適用され
るコンピュータの内部構成図である。
FIG. 1 shows an integrated thesaurus creation device, a modified thesaurus creation device, an information collection type thesaurus creation device, an integrated thesaurus creation program storage medium, a modified thesaurus creation program storage medium, and an information collection type thesaurus creation program storage medium of the present invention. FIG. 2 is an external view of a computer to which the present invention is applied. FIG. 2 is an integrated thesaurus creation device, a modified thesaurus creation device, an information collection type thesaurus creation device, an integrated thesaurus creation program storage medium, a modified thesaurus creation program storage medium, and 1 is an internal configuration diagram of a computer to which an information collection type thesaurus creation program storage medium is applied.

【0018】図1に示すコンピュータ100は、一般に
ワークステーションと称されるような高速かつ大容量の
コンピュータである。
The computer 100 shown in FIG. 1 is a high-speed and large-capacity computer generally called a workstation.

【0019】図1に示すように、このコンピュータ10
0には、本体101、ディスプレイ102、キーボード
103、マウス104、通信回線105などが備えられ
ており、本体101正面にはフロッピーディスク挿入口
101a、およびCD−ROM挿入口102aが備えら
れている。
As shown in FIG. 1, this computer 10
0 includes a main body 101, a display 102, a keyboard 103, a mouse 104, a communication line 105, and the like. A floppy disk insertion slot 101a and a CD-ROM insertion slot 102a are provided on the front of the main body 101.

【0020】このコンピュータ100の内部には、図2
に示すように、内部バス110に接続された、CPU1
11、RAM112、ハードディスクコントローラ11
3、フロッピーディスクドライブ114、CD−ROM
ドライブ115、マウスコントローラ116、キーボー
ドコントローラ117、ディスプレイコントローラ11
8,通信制御装置119などが備えられている。
FIG. 2 shows the inside of the computer 100.
As shown in the figure, the CPU 1 connected to the internal bus 110
11, RAM 112, hard disk controller 11
3, floppy disk drive 114, CD-ROM
Drive 115, mouse controller 116, keyboard controller 117, display controller 11
8, a communication control device 119 and the like.

【0021】ハードディスクコントローラ113にはハ
ードディスク113aが接続されており、マウスコント
ローラ116にはマウス104が接続されており、キー
ボードコントローラ117にはキーボード103が接続
されており、ディスプレイコントローラ118にはディ
スプレイ102が接続されており,通信制御装置119
には通信回線105が接続されている。また、フロッピ
ーディスクドライブ114にはフロッピーディスク11
4aが挿入されるようになっており、CD−ROMドラ
イブ115にはCD−ROM115aが挿入されるよう
になっている。
The hard disk controller 113 is connected to a hard disk 113a, the mouse controller 116 is connected to the mouse 104, the keyboard controller 117 is connected to the keyboard 103, and the display controller 118 is connected to the display 102. Connected and the communication control device 119
Is connected to a communication line 105. Also, the floppy disk drive 114 has a floppy disk 11
4a is inserted, and the CD-ROM 115a is inserted into the CD-ROM drive 115.

【0022】このようなコンピュータ複数が通信回線1
05により相互に接続されて分散システムが形成され、
それらの複数のコンピュータのハードディスク上に形成
されたデータベースがネットワークにより結合されて分
散データベースが形成される。
A plurality of such computers are connected to the communication line 1.
05 interconnected to form a distributed system,
The databases formed on the hard disks of the plurality of computers are connected by a network to form a distributed database.

【0023】本発明の統合シソーラス作成プログラム記
憶媒体としては、例えばCD−ROM115a、フロッ
ピーディスク114aなどが用いられる。この統合シソ
ーラス作成プログラム記憶媒体には、データベースに記
憶された情報中の単語相互間の関連を表す、そのデータ
ベースに固有のシソーラスがそれぞれに用意されてなる
複数のデータベースの各シソーラスを取得するシソーラ
ス取得手段と、そのシソーラス取得手段によって取得さ
れたシソーラスを統合することにより、複数のデータベ
ースからなるデータベース群に記憶された情報の総体に
対応する、その総体中の単語相互間の関連を表す統合シ
ソーラスを作成する統合シソーラス作成手段とを備えた
統合シソーラス作成プログラムが記憶されている。
As the integrated thesaurus creation program storage medium of the present invention, for example, a CD-ROM 115a, a floppy disk 114a or the like is used. The integrated thesaurus creation program storage medium includes a thesaurus acquisition system for acquiring the thesauruses of a plurality of databases each of which is provided with a thesaurus unique to the database, which indicates a relationship between words in information stored in the database. Means, by integrating the thesaurus acquired by the thesaurus acquisition means, an integrated thesaurus corresponding to the total information stored in the database group consisting of a plurality of databases and representing the relationship between words in the total is obtained. An integrated thesaurus creation program including an integrated thesaurus creation means to be created is stored.

【0024】また、本発明の修正シソーラス作成プログ
ラム記憶媒体としては、例えばCD−ROM115a、
フロッピーディスク114aなどが用いられる。この修
正シソーラス作成プログラム記憶媒体には、データベー
スに記憶された情報中の単語相互間の関連を表すシソー
ラスを取得するシソーラス取得手段と、そのシソーラス
取得手段によって取得されたシソーラスを、データベー
スにおける情報検索の履歴情報、または操作によって与
えられるシソーラス更新情報に基づいて修正することに
より修正シソーラスを作成する修正シソーラス作成手段
とを備えた修正シソーラス作成プログラムが記憶されて
いる。
The modified thesaurus creation program storage medium of the present invention includes, for example, a CD-ROM 115a,
A floppy disk 114a or the like is used. The modified thesaurus creation program storage medium includes a thesaurus acquisition unit for acquiring a thesaurus representing the relationship between words in the information stored in the database, and a thesaurus acquired by the thesaurus acquisition unit. A modified thesaurus creation program including a modified thesaurus creation means for creating a modified thesaurus by modifying based on history information or thesaurus update information given by an operation is stored.

【0025】本発明の情報収集型シソーラス作成プログ
ラム記憶媒体としては、例えばCD−ROM115a、
フロッピーディスク114aなどが用いられる。この情
報収集型シソーラス作成プログラム記憶媒体には、デー
タベースに記憶された情報中の単語相互間の関連を表
す、そのデータベースに固有のシソーラスがそれぞれに
用意されてなる複数のデータベースのシソーラスから、
複数のデータベースからなるデータベース群における情
報検索の履歴情報に基づいて、そのシソーラスを構成す
る情報を収集する情報収集手段と、その情報収集手段に
よって収集された情報に基づいて、データベース群に対
応する情報収集型シソーラスを作成する情報収集型シソ
ーラス作成手段とを備えた情報収集型シソーラス作成プ
ログラムが記憶されている。
As an information collection type thesaurus creation program storage medium of the present invention, for example, a CD-ROM 115a,
A floppy disk 114a or the like is used. In this information collection type thesaurus creation program storage medium, a thesaurus of a plurality of databases, each of which is provided with a thesaurus unique to the database, representing a relation between words in information stored in the database,
Information collecting means for collecting information constituting the thesaurus based on history information of information retrieval in a database group comprising a plurality of databases, and information corresponding to the database group based on the information collected by the information collecting means An information collection type thesaurus creation program including information collection type thesaurus creation means for creating a collection type thesaurus is stored.

【0026】これらの記憶媒体に記憶された本発明の統
合シソーラス作成プログラム、修正シソーラス作成プロ
グラム、または情報収集型シソーラス作成プログラム
は、図1および図2に示したCD−ROMドライブまた
はフロッピーディスクドライブを介してCPU111に
読み込まれ、ハードディスク113a上にインストール
されることにより、コンピュータ100内部に本発明の
統合シソーラス作成装置、修正シソーラス作成装置、ま
たは情報収集型シソーラス作成装置が形成される。
The integrated thesaurus creation program, the modified thesaurus creation program, or the information collection type thesaurus creation program of the present invention stored in these storage media uses the CD-ROM drive or the floppy disk drive shown in FIGS. The integrated thesaurus creation device, the modified thesaurus creation device, or the information collection type thesaurus creation device of the present invention is formed inside the computer 100 by being read into the CPU 111 via the CPU 111 and installed on the hard disk 113a.

【0027】このようにして形成された本発明の統合シ
ソーラス作成装置、修正シソーラス作成装置、および情
報収集型シソーラス作成装置の実施形態について以下に
説明する。
Embodiments of the integrated thesaurus creation device, the modified thesaurus creation device, and the information collection type thesaurus creation device of the present invention thus formed will be described below.

【0028】図3は、本発明の統合シソーラス作成装置
の一実施形態を示すブロック図であり、図4は、図3に
示した統合シソーラス作成装置による統合シソーラス作
成のアルゴリズムを示す流れ図である。
FIG. 3 is a block diagram showing an embodiment of the integrated thesaurus creating apparatus according to the present invention, and FIG. 4 is a flowchart showing an algorithm for creating an integrated thesaurus by the integrated thesaurus creating apparatus shown in FIG.

【0029】図3に示すように、複数のデータベース1
5a,15bからなるデータベース群15を統合して利
用する分散システム環境において、各データベース15
a,15bに配置されたデータベースマネージャ16
a,16bによりそれぞれのデータベース15a,15
bが絶えず更新されている。
As shown in FIG. 3, a plurality of databases 1
In a distributed system environment in which a database group 15 composed of 5a and 15b is integrated and used,
a, database manager 16 located in 15b
a and 16b, the respective databases 15a and 15b
b is constantly updated.

【0030】各データベースマネージャ16a,16b
は、それぞれのデータベース15a,15bを更新する
度毎に各データベースに記憶された情報中の単語相互間
の関連を表す、それぞれのデータベースに固有のデータ
ベースシソーラス17a,17bを更新する。すなわ
ち、それぞれのデータベースに含まれている単語対とそ
の個数を数え上げ(図4:ステップS11)、得られた
統計情報を基にそれら単語対相互間の関連度を計算して
(図4:ステップS12)、そのデータベース固有のデ
ータベースシソーラス17a,17bを再作成し、再作
成を行った旨を本実施形態の統合シソーラス作成装置1
0に通知する。同一単語対相互間の関連度は関連度どう
しの平均演算処理により行われる。
Each database manager 16a, 16b
Updates the database thesaurus 17a, 17b unique to each database, which indicates the relationship between words in the information stored in each database every time the database 15a, 15b is updated. That is, word pairs and their numbers included in each database are counted (FIG. 4: step S11), and the degree of association between the word pairs is calculated based on the obtained statistical information (FIG. 4: step S11). S12) The database thesaurus 17a, 17b unique to the database is re-created, and the fact that the re-creation was performed is described in the integrated thesaurus creating apparatus 1 of the present embodiment.
Notify 0. The degree of association between the same word pairs is performed by an average calculation process of the degrees of association.

【0031】本実施形態の統合シソーラス作成装置10
は、図3に示すように、ファシリテータ11内にシソー
ラス取得手段11_1と、統合シソーラス作成手段11
_2とを備えている。
The integrated thesaurus creating apparatus 10 of the present embodiment
As shown in FIG. 3, the thesaurus obtaining means 11_1 and the integrated thesaurus creating means 11
— 2.

【0032】シソーラス取得手段11_1は、各データ
ベースマネージャからのデータベースシソーラス更新通
知を受信する度毎に各データベース15a,15bに固
有のデータベースシソーラス17a,17bの情報を取
得し(図4:ステップS21)、統合シソーラス作成手
段11_2は、シソーラス取得手段11_1によって取
得されたデータベースシソーラス17a,17bの情報
を単語対レベルでシソーラス結合を行い(図4:ステッ
プS22)、同一単語対の関連度を平均演算などで処理
することにより求める(図4:ステップS23)。こう
して2つのデータベース15a,15bからなるデータ
ベース群15に記憶された情報の総体に対応する、その
総体中の単語相互間の関連を表す統合シソーラス12が
作成される。
Each time the database thesaurus update notification is received from each database manager, the thesaurus obtaining means 11_1 obtains information on the database thesaurus 17a, 17b unique to each of the databases 15a, 15b (FIG. 4: step S21). The integrated thesaurus creating means 11_2 performs a thesaurus combination of the information of the database thesaurus 17a, 17b acquired by the thesaurus acquiring means 11_1 at a word pair level (FIG. 4: step S22), and averages the degree of association of the same word pair by averaging or the like. It is obtained by processing (FIG. 4: step S23). In this way, an integrated thesaurus 12 corresponding to the total information stored in the database group 15 including the two databases 15a and 15b and representing the relation between the words in the total is created.

【0033】この分散システムの各利用者13a,13
bはこの統合シソーラス12を用いることにより、分散
して配置された複数のデータベースからなるデータベー
ス群15に記憶された情報を効率的に検索することがで
きる。
Each user 13a, 13 of this distributed system
b can use the integrated thesaurus 12 to efficiently retrieve information stored in a database group 15 including a plurality of databases arranged in a distributed manner.

【0034】以上説明したように、本実施形態の統合シ
ソーラス作成装置10は、分散して配置された複数のデ
ータベースからなるデータベース群15に記憶された情
報の総体に対応する、総体中の単語相互間の関連を表す
統合シソーラス12を再作成することにより、分散シス
テムにおけるシソーラスの構造は、データベースシソー
ラス17a,17bと統合シソーラス12との2層構造
となり、従来の単層構造のシソーラスに比べて、個々の
データベースシソーラスの更新および統合シソーラスの
更新をともに迅速化することが可能となりシソーラスの
更新時間とコストを大幅に低減することができる。
As described above, the integrated thesaurus creation device 10 of the present embodiment is a system in which the words in the total correspond to the total information stored in the database group 15 composed of a plurality of databases arranged in a distributed manner. By re-creating the integrated thesaurus 12 representing the relationship between the two, the structure of the thesaurus in the distributed system becomes a two-layer structure of the database thesaurus 17a, 17b and the integrated thesaurus 12, and compared to a conventional single-layer thesaurus. The update of each database thesaurus and the update of the integrated thesaurus can both be accelerated, and the update time and cost of the thesaurus can be significantly reduced.

【0035】次に、本発明の修正シソーラス作成装置の
実施形態について説明する。
Next, an embodiment of the modified thesaurus creating apparatus of the present invention will be described.

【0036】図5は、本発明の修正シソーラス作成装置
の一実施形態を示すブロック図である。
FIG. 5 is a block diagram showing an embodiment of a modified thesaurus creating apparatus according to the present invention.

【0037】図5に示すように、複数のデータベース1
5a,15bからなるデータベース群15を統合して利
用する分散システム環境において、各データベース15
a,15bに配置されたデータベースマネージャ16
a,16bによりそれぞれのデータベース15a,15
bが更新されている。各データベースマネージャ16
a,16bは、それぞれのデータベース15a,15b
を更新する度毎にその更新されたデータベースに含まれ
ている単語対とその個数を数え上げ、得られた統計情報
を基に単語対相互間の関連度を計算してそのデータベー
ス固有のデータベースシソーラス17a,17bを再作
成し、再作成を行った旨をファシリテータ21を介して
本実施形態の修正シソーラス作成装置20a,20bに
通知する。
As shown in FIG. 5, a plurality of databases 1
In a distributed system environment in which a database group 15 composed of 5a and 15b is integrated and used,
a, database manager 16 located in 15b
a and 16b, the respective databases 15a and 15b
b has been updated. Each database manager 16
a and 16b are the respective databases 15a and 15b
Each time is updated, the number of word pairs and the number of words included in the updated database are counted, and the degree of association between the word pairs is calculated based on the obtained statistical information, and the database thesaurus 17a unique to the database is calculated. , 17b are re-created, and the fact that the re-creation has been performed is notified to the modified thesaurus creating apparatuses 20a, 20b of the present embodiment via the facilitator 21.

【0038】ファシリテータ21内には、固有シソーラ
ス取得手段21_1および統合シソーラス作成手段21
_2が備えられており、固有シソーラス取得手段21_
1は、各データベースマネージャからの更新通知を受信
する度毎に2つのデータベース15a,15bに固有の
データベースシソーラス17a,17bを取得する。統
合シソーラス作成手段21_2は、固有シソーラス取得
手段21_1によって取得されたデータベースシソーラ
ス17a,17bを統合することにより、2つのデータ
ベース15a,15bからなるデータベース群15に記
憶された情報の総体に対応する、その総体中の単語相互
間の関連を表す統合シソーラス22を作成する。
The facilitator 21 has a unique thesaurus acquisition unit 21_1 and an integrated thesaurus creation unit 21
_2 is provided, and the unique thesaurus acquisition means 21_
1 obtains database thesauruses 17a and 17b unique to the two databases 15a and 15b each time an update notification is received from each database manager. The integrated thesaurus creating means 21_2 integrates the database thesaurus 17a, 17b acquired by the unique thesaurus acquiring means 21_1, thereby corresponding to the total information stored in the database group 15 including the two databases 15a, 15b. An integrated thesaurus 22 representing the relation between words in the whole is created.

【0039】本実施形態の修正シソーラス作成装置20
a,20bは、図5に示すように、2つのインターフェ
ースマネージャ23a,23b内にそれぞれシソーラス
取得手段23_1a、修正シソーラス作成手段23_2
a、およびシソーラス取得手段23_1b、修正シソー
ラス作成手段23_2bを備えている。
The modified thesaurus creating apparatus 20 of the present embodiment
As shown in FIG. 5, a and 20b are respectively provided in two interface managers 23a and 23b in a thesaurus acquisition unit 23_1a and a modified thesaurus creation unit 23_2.
a, a thesaurus acquisition unit 23_1b, and a modified thesaurus creation unit 23_2b.

【0040】シソーラス取得手段23_1a,23_1
bは、統合シソーラス作成手段21_2によって作成さ
れた統合シソーラス22を取得し、修正シソーラス作成
手段23_2a,23_2bは、シソーラス取得手段2
3_2a,23_2bによって取得された統合シソーラ
ス22を、データベース15a,15bにおける情報検
索の履歴情報、または操作によって与えられるシソーラ
ス更新情報に基づいて修正することにより修正シソーラ
ス24a,24bをそれぞれ作成する。
Thesaurus acquisition means 23_1a, 23_1
b acquires the integrated thesaurus 22 created by the integrated thesaurus creating means 21_2, and the modified thesaurus creating means 23_2a and 23_2b acquire the thesaurus acquiring means 2
The modified thesauruses 24a and 24b are created by modifying the integrated thesaurus 22 acquired by the 3_2a and 23_2b based on the history information of the information search in the databases 15a and 15b or thesaurus update information given by the operation.

【0041】修正シソーラス作成手段23_2a,23
_2bは、利用者25a,25b,25c,25dがキ
ーワード入力を行った時に修正シソーラス24a,24
bの修正処理を開始する。ここで、「キーワード」と
は、シソーラスを構成する単語対のうちの第1の単語を
いう。また、単語対のうちの第2の単語はサブキーワー
ドという。
Modified thesaurus creating means 23_2a, 23
_2b is the modified thesaurus 24a, 24a when the user 25a, 25b, 25c, 25d inputs a keyword.
The correction processing of b is started. Here, the “keyword” refers to a first word of a word pair forming a thesaurus. The second word in the word pair is called a sub-keyword.

【0042】図6は、本実施形態の修正シソーラス作成
手段の3つの動作モードを示す図である。
FIG. 6 is a diagram showing three operation modes of the modified thesaurus creating means of this embodiment.

【0043】図6に示すように、本実施形態の修正シソ
ーラス作成手段23_2には、履歴学習モード23_2
_1、ユーザカスタマイズモード23_2_2、および
外部シソーラス統合モード23_2_3の3つの動作モ
ードがある。
As shown in FIG. 6, the modified thesaurus creating means 23_2 of this embodiment has a history learning mode 23_2.
_1, a user customization mode 23_2_2, and an external thesaurus integration mode 23_2_3.

【0044】履歴学習モード23_2_1は、データベ
ースにおける情報検索の履歴情報に基づいて修正シソー
ラスを作成する動作モードであり、ユーザカスタマイズ
モード23_2_2は、利用者による入力/削除などの
直接操作によって与えられるシソーラス更新情報に基づ
いて修正シソーラスを作成する動作モードであり、外部
シソーラス統合モード23_2_3は、外部から与えら
れるシソーラス更新情報、例えば市販の各種辞書や他の
事業部門で作成した専門用語集などを修正シソーラスに
マージすることにより修正シソーラスを作成する動作モ
ードである。
The history learning mode 23_2_1 is an operation mode for creating a modified thesaurus based on the history information of the information search in the database, and the user customizing mode 23_2_2 is a thesaurus updating provided by a direct operation such as input / deletion by the user. The external thesaurus integration mode 23_2_3 is an operation mode for creating a modified thesaurus based on the information. The external thesaurus integrated mode 23_2_3 is a modified thesaurus for updating thesaurus information provided from the outside, for example, various commercially available dictionaries and glossaries created by other business departments. This is an operation mode in which a modified thesaurus is created by merging.

【0045】図7は、修正シソーラス作成手段による修
正処理のアルゴリズムを示す流れ図である。
FIG. 7 is a flowchart showing the algorithm of the correction process by the correction thesaurus creating means.

【0046】図7には、例えば、修正シソーラス作成手
段23_2a(図5参照)に、利用者25aが検索に用
いるサブキーワードをシソーラスを用いて得るために、
あるキーワードを入力(ステップS31)した場合の例
が示されている。この場合の修正処理は、図6に示した
修正シソーラス作成手段23_2に備えられた履歴学習
モード23_2_1により実行される。すなわち、入力
されたキーワードが修正シソーラス24aの中に含まれ
ているか否かを判定し(ステップS32)、そのキーワ
ードが修正シソーラス24aの中に含まれている場合は
修正シソーラス24aの情報を用いてシソーラス展開を
行い(ステップS33)、サブキーワードの候補を表示
し利用者にその候補の中から検索キーワードとして適し
たサブキーワードを選択するよう要求する。利用者がサ
ブキーワードを選択すると(ステップS34)、修正シ
ソーラス作成手段は利用者が入力したキーワードとサブ
キーワードとの関連度を変更し(ステップS35)、修
正シソーラス24aのデータを更新する(ステップS3
6)。
FIG. 7 shows, for example, that the modified thesaurus creation means 23_2a (see FIG. 5) uses the thesaurus to obtain sub-keywords used by the user 25a for search.
An example in which a certain keyword is input (step S31) is shown. The correction process in this case is executed by the history learning mode 23_2_1 provided in the correction thesaurus creating unit 23_2 shown in FIG. That is, it is determined whether or not the input keyword is included in the modified thesaurus 24a (step S32), and if the keyword is included in the modified thesaurus 24a, the information is used using the information of the modified thesaurus 24a. Thesaurus development is performed (step S33), and candidates for the sub-keyword are displayed, and the user is requested to select a sub-keyword suitable as a search keyword from the candidates. When the user selects a sub-keyword (step S34), the modified thesaurus creating means changes the degree of association between the keyword input by the user and the sub-keyword (step S35), and updates the data of the modified thesaurus 24a (step S3).
6).

【0047】ここで、キーワードとサブキーワードとの
関連度を変更する際に、利用者による1回の操作で所定
の増加量ずつ関連度を増加させ、選択されたキーワード
とサブキーワードの組合せ以外の組合せの関連度を自動
的に減少させるようにしてもよいし、あるいは利用者が
関連度の増減量を指定するようにしてもよい。
Here, when changing the degree of relevance between a keyword and a sub-keyword, the degree of relevancy is increased by a predetermined amount by a single operation by a user, and the degree of relevance other than the combination of the selected keyword and sub-keyword is changed The relevance of the combination may be automatically reduced, or the user may specify the amount of increase or decrease of the relevance.

【0048】一方、ステップS32において、利用者が
入力したキーワードが修正シソーラス24aの中に含ま
れていない場合、およびステップS32において、キー
ワードが入力された時点で修正シソーラス23_2その
ものがまだ作成されていない場合はステップS37に進
む。ステップS37では、統合シソーラス22からその
キーワードに関する情報を取得し、統合シソーラス22
の情報を用いてシソーラス展開を行い(ステップS3
8)、サブキーワードの候補を表示し利用者にその候補
の中から所望のサブキーワードを選択するよう要求す
る。利用者がサブキーワードを選択する(ステップS3
9)と、利用者が入力したキーワードとサブキーワード
との関連度を変更し(ステップS40)、修正シソーラ
ス24aにキーワードに関する情報を登録する(ステッ
プS41)。
On the other hand, in step S32, when the keyword input by the user is not included in the correction thesaurus 24a, and in step S32, the correction thesaurus 23_2 itself has not yet been created when the keyword is input. In this case, the process proceeds to step S37. In step S37, information about the keyword is acquired from the integrated thesaurus 22, and
Thesaurus development is performed using the information of (Step S3)
8) Display sub-keyword candidates and request the user to select a desired sub-keyword from the candidates. The user selects a sub-keyword (step S3
9), the degree of association between the keyword and the sub-keyword input by the user is changed (step S40), and information about the keyword is registered in the modified thesaurus 24a (step S41).

【0049】次に、本実施形態の修正シソーラス作成装
置による修正シソーラス作成処理の過程を具体例により
説明する。
Next, the process of the modified thesaurus creation processing by the modified thesaurus creation apparatus of the present embodiment will be described with a specific example.

【0050】図8は、本実施形態の修正シソーラス作成
装置により修正シソーラスを作成する過程を示す図であ
る。
FIG. 8 is a diagram showing a process of creating a modified thesaurus by the modified thesaurus creating apparatus of this embodiment.

【0051】図8に示すように、2つのデータベースシ
ソーラス17a,17bがあり、例えばデータベースシ
ソーラス17aには、「川崎・・浦和0.7」のように
単語「川崎」と単語「浦和」の対、およびこの単語対相
互間の関連度「0.7」からなるシソーラス情報その他
のシソーラス情報が記憶されており、データベースシソ
ーラス17bには、「川崎・・浦和0.4」その他のシ
ソーラス情報が記憶されている。
As shown in FIG. 8, there are two database thesauruses 17a and 17b. For example, the database thesaurus 17a includes a pair of a word "Kawasaki" and a word "Urawa" such as "Kawasaki... Urawa 0.7". , And thesaurus information and other thesaurus information composed of the degree of association "0.7" between the word pairs are stored, and "Kawasaki ... Urawa 0.4" and other thesaurus information are stored in the database thesaurus 17b. Have been.

【0052】固有シソーラス取得手段21_1(図5参
照)は、これら2つのデータベースシソーラス17a,
17bを取得し、統合シソーラス作成手段21_2は、
固有シソーラス取得手段21_1によって取得された2
つのデータベースシソーラス17a,17bを統合し
て、例えばデータベースシソーラス17aのシソーラス
情報「川崎・・浦和0.7」と、データベースシソーラ
ス17bのシソーラス情報「川崎・・浦和0.4」とか
ら、関連度どうしの平均演算処理により新たな関連度
0.55を求め、新たなシソーラス情報「川崎・・浦和
0.55」を作成し統合シソーラス22に記憶する。な
お、データベースシソーラス17aのシソーラス情報
「川崎・・市長0.5」に対応するシソーラス情報はデ
ータベースシソーラス17bには存在しないので、統合
シソーラス22には、データベースシソーラス17aの
シソーラス情報「川崎・・市長0.5」がそのまま登録
される。このようにして、データベースシソーラス17
a,17bが統合されて統合シソーラス22が作成され
る。
The unique thesaurus acquisition means 21_1 (see FIG. 5) is configured to use these two database thesauruses 17a,
17b, and the integrated thesaurus creation means 21_2 acquires
2 acquired by the unique thesaurus acquisition unit 21_1
The two database thesauruses 17a and 17b are integrated, and for example, the degree of relevance is determined based on the thesaurus information "Kawasaki Urawa 0.7" of the database thesaurus 17a and thesaurus information "Kawasaki Urawa 0.4" of the database thesaurus 17b. , A new degree of association 0.55 is obtained, new thesaurus information “Kawasaki... Urawa 0.55” is created and stored in the integrated thesaurus 22. Since the thesaurus information corresponding to the thesaurus information “Kawasaki... Mayor 0.5” of the database thesaurus 17a does not exist in the database thesaurus 17b, the integrated thesaurus 22 stores the thesaurus information of the database thesaurus 17a “Kawasaki. .5 "is registered as it is. In this way, the database thesaurus 17
a and 17b are integrated to create an integrated thesaurus 22.

【0053】ここで、この修正シソーラス作成装置に、
利用者が、「川崎」というキーワードに関連するサブキ
ーワードを検索するためにキーワード「川崎」を入力し
たとすると、そのキーワード「川崎」が修正シソーラス
24aの中に含まれている場合は、修正シソーラス作成
手段23_2aは、修正シソーラス24aの情報を用い
てシソーラス展開を行い、サブキーワードの候補を表示
しその中から利用者にサブキーワードの選択を要求す
る。
Here, this modified thesaurus creating apparatus includes:
If the user enters the keyword “Kawasaki” to search for a sub-keyword related to the keyword “Kawasaki”, if the keyword “Kawasaki” is included in the modified thesaurus 24a, the modified thesaurus is The creating unit 23_2a expands the thesaurus using the information of the modified thesaurus 24a, displays sub-keyword candidates, and requests the user to select a sub-keyword from among them.

【0054】上記の利用者によるサブキーワードの選択
の段階で、シソーラス展開の結果得られたサブキーワー
ドの候補の中に利用者が望むサブキーワードが存在しな
い場合には、利用者が入力したサブキーワードによる新
たな単語対によるシソーラスを作成することができるよ
うになっている。
If the sub-keyword desired by the user does not exist in the sub-keyword candidates obtained as a result of the thesaurus expansion at the sub-keyword selection stage by the user, the sub-keyword input by the user is selected. Can create a thesaurus with new word pairs.

【0055】例えば、表示されたサブキーワードの中に
利用者が検索に使用したい「幸区」が存在しない場合に
は、ユーザカスタマイズモードにより「川崎・・幸区
0.96」のように新たなシソーラス情報を入力しても
よい。また、外部シソーラス統合モードにより外部のシ
ソーラス更新情報を修正シソーラスにマージして「川崎
・・鹿島0.89」のように新たなシソーラス情報を追
加することもできる。また、表示されたサブキーワード
の中に利用者が望むサブキーワード「市長」を含むシソ
−ラス情報「川崎・・市長0.5」が存在する場合に、
何回かの検索が繰り返される間に履歴学習モードにより
シソ−ラス情報「川崎・・市長0.75」に修正された
例を図8に示した。
For example, if there is no “Sachi Ward” that the user wants to use for the search in the displayed sub-keywords, a new customizing mode such as “Kawasaki. Thesaurus information may be input. In addition, external thesaurus update information can be merged with the modified thesaurus by the external thesaurus integration mode, and new thesaurus information such as “Kawasaki... Kashima 0.89” can be added. Also, when there is a thesaurus information “Kawasaki... Mayor 0.5” including the sub-keyword “Mayor” desired by the user among the displayed sub-keywords,
FIG. 8 shows an example in which the thesaurus information is corrected to "Kawasaki... Mayor 0.75" by the history learning mode while the search is repeated several times.

【0056】このようにして、修正シソーラス作成手段
23_2aは、シソーラス取得手段23_1aによって
取得された修正シソーラス24aを、図6に示した修正
シソーラス作成手段23の3つの動作モードで修正する
ことができるので、本実施形態の修正シソーラス作成装
置20a,20bにより利用者のニーズに適合したシソ
ーラスを作成することができる。
As described above, the modified thesaurus creating means 23_2a can modify the modified thesaurus 24a acquired by the thesaurus acquiring means 23_1a in the three operation modes of the modified thesaurus creating means 23 shown in FIG. The modified thesaurus creation apparatuses 20a and 20b according to the present embodiment can create a thesaurus that meets the needs of the user.

【0057】また、本実施形態の修正シソーラス作成装
置20a,20bを用いることにより、このように、デ
ータベースシソーラス17a,17b、統合シソーラス
22、修正シソーラス24a,24bの3層構造のシソ
ーラスシステムが作成されるので、シソーラス更新の処
理時間の短縮と低コスト化を達成することができる。ま
た、分散データベース環境における一部の利用者、ある
いは一部の専門分野の利用者たちだけが利用することの
できる修正シソーラスを作成することができるので、そ
のような一部の利用者間での知識の共有化を図ることも
できる。
Also, by using the modified thesaurus creating apparatuses 20a and 20b of the present embodiment, a thesaurus system having a three-layer structure of the database thesaurus 17a and 17b, the integrated thesaurus 22, and the modified thesaurus 24a and 24b is created. Therefore, it is possible to reduce the processing time and cost of updating the thesaurus. It is also possible to create a modified thesaurus that can be used only by some users in a distributed database environment or by users in some specialized fields. Sharing knowledge is also possible.

【0058】なお、図5に示した本実施形態の修正シソ
ーラス作成装置20a,20bは、インターフェースマ
ネージャ23a,23b内のシソーラス取得手段23_
1a,23_1bが、統合シソーラス22の情報を取得
するように構成されているが、本発明の修正シソーラス
作成装置は、このように構成する以外に、シソーラス取
得手段が、データベース群の中の所望のデータベースシ
ソーラスからシソーラス情報を直接取得するように構成
してもよい。
The modified thesaurus creating devices 20a and 20b according to the present embodiment shown in FIG. 5 include a thesaurus acquisition unit 23_ in the interface managers 23a and 23b.
1a and 23_1b are configured to acquire the information of the integrated thesaurus 22, but the modified thesaurus creation device of the present invention is configured in this way. You may comprise so that thesaurus information may be acquired directly from a database thesaurus.

【0059】また、本発明の修正シソーラス作成装置
を、上記のシソーラス取得手段がデータベースシソーラ
スの一部分を取得し、上記の修正シソーラス作成手段が
シソーラス取得手段によって取得された一部分の中を修
正して修正シソーラスを作成するように構成してもよ
い。
Further, in the modified thesaurus creating apparatus of the present invention, the above-mentioned thesaurus acquiring means acquires a part of the database thesaurus, and the modified thesaurus creating means modifies and corrects the part acquired by the thesaurus acquiring means. You may be comprised so that a thesaurus may be created.

【0060】次に、本発明の修正シソーラス作成装置の
他の実施形態について説明する。
Next, another embodiment of the modified thesaurus creating apparatus of the present invention will be described.

【0061】図9は、本発明の修正シソーラス作成装置
の他の実施形態を示すブロック図である。
FIG. 9 is a block diagram showing another embodiment of the modified thesaurus creating apparatus of the present invention.

【0062】図9に示すように、複数のデータベース1
5a,15bからなるデータベース群15を統合して利
用する分散システム環境において、各データベース15
a,15bに配置されたデータベースマネージャ16
a,16bによりそれぞれのデータベース15a,15
bが更新されている。各データベースマネージャ16
a,16bは、それぞれのデータベース15a,15b
を更新する度毎にその更新されたデータベースに含まれ
ている単語対とその個数を数え上げ、得られた統計情報
を基に単語対相互間の関連度を計算してそのデータベー
ス固有のデータベースシソーラス17a,17bを再作
成し、再作成を行った旨をファシリテータ31を介して
本実施形態の修正シソーラス作成装置30a,30bに
通知する。ファシリテータ31内には、図5におけると
同様、固有シソーラス取得手段31_1と統合シソーラ
ス作成手段31_2、シソーラス取得手段33_1a,
33_1bが備えられている。
As shown in FIG. 9, a plurality of databases 1
In a distributed system environment in which a database group 15 composed of 5a and 15b is integrated and used,
a, database manager 16 located in 15b
a and 16b, the respective databases 15a and 15b
b has been updated. Each database manager 16
a and 16b are the respective databases 15a and 15b
Each time is updated, the number of word pairs and the number of words included in the updated database are counted, and the degree of association between the word pairs is calculated based on the obtained statistical information, and the database thesaurus 17a unique to the database is calculated. , 17b are re-created, and the fact that the re-creation has been performed is notified to the modified thesaurus creating apparatuses 30a, 30b of the present embodiment via the facilitator 31. In the facilitator 31, as in FIG. 5, the unique thesaurus acquisition unit 31_1, the integrated thesaurus creation unit 31_2, and the thesaurus acquisition unit 33_1a,
33_1b is provided.

【0063】本実施形態の修正シソーラス作成装置30
a,30bは、図9に示すように、2つのインターフェ
ースマネージャ33a,33b内に、それぞれシソーラ
ス取得手段33_1a、修正シソーラス作成手段33_
2a、利用者別シソーラス作成手段33_3a、および
シソーラス取得手段33_1b、修正シソーラス作成手
段33_2b、利用者別シソーラス作成手段33_3b
を備えている。
The modified thesaurus creating device 30 of the present embodiment
As shown in FIG. 9, a and 30b are respectively provided in the two interface managers 33a and 33b in a thesaurus acquisition unit 33_1a and a modified thesaurus creation unit 33_
2a, user-specific thesaurus creation means 33_3a, thesaurus acquisition means 33_1b, modified thesaurus creation means 33_2b, user-specific thesaurus creation means 33_3b
It has.

【0064】この実施形態の修正シソーラス作成装置3
0a,30bは、図5に示した実施形態の修正シソーラ
ス作成装置20a,20bに、利用者別シソーラス作成
手段33_2a,33_3bを付加したものであり、シ
ソーラス取得手段33_1bおよび修正シソーラス作成
手段33_2a,33_2bは、修正シソーラス作成装
置20a,20bにおける同種の各手段と本質的に同じ
ものであるので、以下の説明では、利用者別シソーラス
作成手段33_3a,33_3bについてのみ説明す
る。
The modified thesaurus creating device 3 of this embodiment
Reference numerals 0a and 30b are obtained by adding user-specific thesaurus creation units 33_2a and 33_3b to the modified thesaurus creation devices 20a and 20b of the embodiment shown in FIG. 5, and include a thesaurus acquisition unit 33_1b and modified thesaurus creation units 33_2a and 33_2b. Are essentially the same as those of the same type in the modified thesaurus creation apparatuses 20a and 20b, and therefore, in the following description, only the user-specific thesaurus creation means 33_3a and 33_3b will be described.

【0065】利用者別シソーラス作成手段33_3a,
33_3bは、修正シソーラス作成手段33_2a,3
3_2bによって作成された修正シソーラス34a,3
4bを更にデータベース15a,15bの各利用者36
a,36b,36c,36d毎に、各利用者による情報
検索の履歴情報あるいは各利用者によって与えられたシ
ソーラス更新情報に基づいて修正することにより、利用
者別シソーラス35a,35b,35c,35dを作成
する。
User-specific thesaurus creation means 33_3a,
33_3b is a modified thesaurus creating means 33_2a, 33_2
Modified thesaurus 34a, 3 created by 3_2b
4b and the users 36 of the databases 15a and 15b.
The user-specific thesauruses 35a, 35b, 35c, and 35d are corrected for each of a, 36b, 36c, and 36d based on the history information of information search by each user or thesaurus update information given by each user. create.

【0066】利用者別シソーラス作成手段33_3a,
33_3bによる利用者別シソーラス35a,35b,
35c,35dの作成処理のアルゴリズムは図7に示し
た流れ図と本質的に同一であるので説明は省略する。
User-specific thesaurus creation means 33_3a,
33_3b, user-specific thesaurus 35a, 35b,
The algorithm of the creation processing of 35c and 35d is essentially the same as the flowchart shown in FIG.

【0067】このように、本実施形態の修正シソーラス
作成装置30a,30bは利用者別シソーラス作成手段
33_3a,33_3bを備えたことにより、各利用者
個人のニーズが反映された利用者別シソーラス35a,
35b,35c,35dを作成することができる。
As described above, the modified thesaurus creating devices 30a and 30b of the present embodiment are provided with the user-specific thesaurus creating means 33_3a and 33_3b, so that the user-specific thesaurus 35a, which reflects the individual needs of each user, is provided.
35b, 35c, and 35d can be created.

【0068】次に、本発明の情報収集型シソーラス作成
装置の実施形態について説明する。
Next, an embodiment of the information collecting type thesaurus creating apparatus of the present invention will be described.

【0069】図10は、本発明の情報収集型シソーラス
作成装置の一実施形態を示すブロック図である。
FIG. 10 is a block diagram showing an embodiment of the information collecting type thesaurus creating apparatus according to the present invention.

【0070】図10に示すように、複数のデータベース
15a,15bからなるデータベース群15を統合して
利用する分散システム環境において、各データベース1
5a,15bに配置されたデータベースマネージャ16
a,16bによりそれぞれのデータベース15a,15
bが更新されている。各データベースマネージャ16
a,16bは、それぞれのデータベース15a,15b
を更新する度毎にその更新されたデータベースに含まれ
ている単語対とその個数を数え上げ、得られた統計情報
を基に単語対相互間の関連度を計算してそのデータベー
ス固有のデータベースシソーラス17a,17bを再作
成し、再作成を行った旨をファシリテータ41を介して
本実施形態の情報収集型シソーラス作成装置40a,4
0bに通知する。
As shown in FIG. 10, in a distributed system environment in which a database group 15 including a plurality of databases 15a and 15b is integrated and used,
Database manager 16 located in 5a, 15b
a and 16b, the respective databases 15a and 15b
b has been updated. Each database manager 16
a and 16b are the respective databases 15a and 15b
Each time is updated, the number of word pairs and the number of words included in the updated database are counted, and the degree of association between the word pairs is calculated based on the obtained statistical information, and the database thesaurus 17a unique to the database is calculated. , 17b are re-created, and the fact that the re-creation has been performed is transmitted via the facilitator 41 to the information collection type thesaurus creating apparatus 40a, 4 of the present embodiment.
0b.

【0071】本実施形態の情報収集型シソーラス作成装
置40a,40bは、図10に示すように、2つのイン
ターフェースマネージャ43a,43b内に、それぞれ
情報収集手段43_1a、情報収集型シソーラス作成手
段43_2a、および情報収集手段43_1b、情報収
集型シソーラス作成手段43_2bを備えている。
As shown in FIG. 10, the information collecting type thesaurus creating devices 40a and 40b of the present embodiment include information collecting means 43_1a, information collecting thesaurus creating means 43_2a, and two interface managers 43a and 43b, respectively. An information collecting unit 43_1b and an information collecting type thesaurus creating unit 43_2b are provided.

【0072】情報収集手段43_1a,43_1bは、
データベース15a,15bに記憶された情報中の単語
相互間の関連を表すデータベースシソーラス17a,1
7bに固有のシソーラスがそれぞれに用意されてなるデ
ータベース15a,15bのデータベースシソーラス1
7a,17bから、これらのデータベース15a,15
bからなるデータベース群15における利用者45a,
45b,45c,45dによる情報検索の履歴情報に基
づいて、データベースシソーラス17a,17bを構成
するシソーラス情報を収集する。
The information collecting means 43_1a, 43_1b
A database thesaurus 17a, 1 representing the relationship between words in the information stored in the databases 15a, 15b
Database thesaurus 1 of databases 15a and 15b in which a thesaurus specific to 7b is prepared respectively.
7a, 17b, these databases 15a, 15
b in the database group 15 composed of
Thesaurus information forming the database thesaurus 17a, 17b is collected based on the history information of the information search by 45b, 45c, 45d.

【0073】情報収集型シソーラス作成手段43_2
a,43_2bは、情報収集手段43_1a,43_1
bによって収集されたシソーラス情報に基づいて、デー
タベース群15に対応する情報収集型シソーラス44
a,44bを作成する。
Information collection type thesaurus creating means 43_2
a, 43_2b are information collecting means 43_1a, 43_1
b, the information collection type thesaurus 44 corresponding to the database group 15 based on the thesaurus information collected by the
a, 44b are created.

【0074】このように、本実施形態の情報収集型シソ
ーラス作成装置40a,40bでは、情報収集型シソー
ラス作成手段43_2a,43_2bがデータベースシ
ソーラス17a,17bを単にマージするのではなく、
各利用者が情報検索を行った情報についてのみシソーラ
ス作成を行うので、情報収集型シソーラス44a,44
bの規模は不必要に大規模になることがなく、しかも、
データベースシソーラス17a,17b、および情報収
集型シソーラス44a,44bの2層構造のシソーラス
が作成されるので、シソーラス更新処理の迅速化と低コ
スト化が図られ、また、利用者のニーズに適合したシソ
ーラスを作成することができる。
As described above, in the information collection type thesaurus creation devices 40a and 40b of this embodiment, the information collection type thesaurus creation means 43_2a and 43_2b do not simply merge the database thesauruses 17a and 17b.
Since a thesaurus is created only for information on which each user has searched for information, the information collection type thesaurus 44a, 44
The size of b is not unnecessarily large, and
Since a thesaurus having a two-layer structure of the database thesaurus 17a, 17b and the information collecting thesaurus 44a, 44b is created, the speed of the thesaurus updating process is reduced, the cost is reduced, and the thesaurus that meets the needs of the user is achieved. Can be created.

【0075】次に、本発明の情報収集型シソーラス作成
装置の他の実施形態について説明する。
Next, another embodiment of the information collecting type thesaurus creating apparatus of the present invention will be described.

【0076】図11は、本発明の情報収集型シソーラス
作成装置の他の実施形態を示すブロック図である。
FIG. 11 is a block diagram showing another embodiment of the information collecting type thesaurus creating apparatus according to the present invention.

【0077】本実施形態の情報収集型シソーラス作成装
置50a,50bは、図10に示した実施形態の情報収
集型シソーラス作成装置40a,40bに、以下に説明
する利用者別シソーラス作成手段53_3a,53_3
bを付加したものであり、インターフェースマネージャ
53a,53b内の情報収集手段53_1a,53_1
b、および情報収集型シソーラス作成手段53_2a,
53_2bは、情報収集型シソーラス作成装置40a,
40bにおける同種の各手段と本質的に同じものである
ので、以下の説明では、利用者別シソーラス作成手段5
3_3a,53_3bについてのみ説明する。
The information collection type thesaurus creation devices 50a and 50b of the present embodiment are different from the information collection type thesaurus creation devices 40a and 40b of the embodiment shown in FIG. 10 in that the user-specific thesaurus creation means 53_3a and 53_3 described below are used.
b, and information collecting means 53_1a, 53_1 in the interface managers 53a, 53b.
b, and information collection type thesaurus creation means 53_2a,
53_2b is an information collection type thesaurus creation device 40a,
40b, which are essentially the same as those of the same kind in the following description.
Only 3_3a and 53_3b will be described.

【0078】この利用者別シソーラス作成手段53_3
a,53_3bは、図9に示した修正シソーラス作成装
置30a,30bにおける利用者別シソーラス作成手段
33_3a,33_3bと同様、情報収集型シソーラス
作成手段53_2a,53_2bによって作成された情
報収集型シソーラス54a,54bを更にデータベース
15a,15bの利用者56a,56b,56c,56
d毎に、各利用者による情報検索の履歴情報あるいは各
利用者によって与えられたシソーラス更新情報に基づい
て修正することにより、利用者別シソーラス55a,5
5b,55c,55dを作成する。
This user-specific thesaurus creation means 53_3
a, 53_3b are information collection thesauruses 54a, 54b created by the information collection type thesaurus creation means 53_2a, 53_2b, like the user-specific thesaurus creation means 33_3a, 33_3b in the modified thesaurus creation devices 30a, 30b shown in FIG. To the users 56a, 56b, 56c, 56 of the databases 15a, 15b.
For each d, correction is performed based on the history information of information search by each user or thesaurus update information given by each user, so that the thesaurus for each user 55a, 55
5b, 55c, and 55d are created.

【0079】この利用者別シソーラス作成手段53_3
a,53_3bによる利用者別シソーラス55a,55
b,55c,55dの作成処理のアルゴリズムは図7に
示した流れ図と本質的に同一であるので説明は省略す
る。 このように、本実施形態の情報収集型シソーラス
作成装置50a,50bは、利用者別シソーラス作成手
段53_3a,53_3bを備えたことにより、分散デ
ータベース環境におけるシソーラスを、データベースシ
ソーラス、情報収集型シソーラス、および利用者別シソ
ーラスからなる3層構造のシソーラスとして作成するの
で、情報収集型シソーラス54a,54bを各利用者個
人のニーズが反映されたものとして作成することができ
るとともに、シソーラス更新の迅速化と低コスト化を達
成することができる。
This user-specific thesaurus creation means 53_3
a, 53_3b, user-specific thesaurus 55a, 55
The algorithm for the creation processing of b, 55c, 55d is essentially the same as the flow chart shown in FIG. As described above, the information collection type thesaurus creation devices 50a and 50b of the present embodiment are provided with the user-specific thesaurus creation means 53_3a and 53_3b, so that the thesaurus in the distributed database environment can be converted into a database thesaurus, an information collection type thesaurus, and the like. Since the thesaurus is created as a three-layer thesaurus composed of the thesauruses for each user, the information collecting thesauri 54a and 54b can be created as reflecting the individual needs of each user, and the thesaurus can be updated quickly and in low cost. Cost reduction can be achieved.

【0080】[0080]

【発明の効果】以上説明したように、本発明の統合シソ
ーラス作成装置、修正シソーラス作成装置、利用者別シ
ソーラス作成装置は、分散データベース環境におけるデ
ータベース検索用のシソーラスを多層構造のシソーラス
として作成するものであるため、迅速かつ低コストで更
新することができる統合シソーラスを作成する統合シソ
ーラス作成装置、多様な利用者ニーズに対応することが
可能な修正シソーラス作成装置および利用者別シソーラ
ス作成装置を実現することができる。
As described above, the integrated thesaurus creation device, the modified thesaurus creation device, and the user-specific thesaurus creation device of the present invention create a thesaurus for database search in a distributed database environment as a multilayer thesaurus. Therefore, an integrated thesaurus creation device that creates an integrated thesaurus that can be updated quickly and at low cost, a modified thesaurus creation device that can respond to various user needs, and a user-specific thesaurus creation device are realized. be able to.

【0081】また、本発明の統合シソーラス作成プログ
ラム記憶媒体、修正シソーラス作成プログラム記憶媒
体、および利用者別シソーラス作成プログラム記憶媒体
を用いることにより、コンピュータシステム上に、上記
の本発明の統合シソーラス作成装置、修正シソーラス作
成装置、利用者別シソーラス作成装置を容易に形成する
ことができる。
By using the integrated thesaurus creation program storage medium, the modified thesaurus creation program storage medium, and the user-specific thesaurus creation program storage medium of the present invention, the integrated thesaurus creation apparatus of the present invention can be installed on a computer system. A modified thesaurus creation device and a user-specific thesaurus creation device can be easily formed.

【0082】以上の説明に関して更に以下の項を開示す
る。 (1)上記データベースが、分散して配置された複数の
個別データベースからなる分散データベースであって、
上記シソーラスが、上記複数の個別データベースそれぞ
れに固有のシソーラスが統合されてなる統合シソーラス
である修正シソーラス作成装置。 (2)上記シソーラス取得手段が、上記シソーラスの一
部分を取得するものであり、上記修正シソーラス作成手
段が、上記シソーラス取得手段によって取得された一部
分の中を修正するものである修正シソーラス作成装置。 (3)この修正シソーラス作成装置が、上記修正シソー
ラス作成手段によって作成された修正シソーラスを更に
上記データベースの利用者毎に、各利用者による情報検
索の履歴情報あるいは各利用者によって与えられたシソ
ーラス更新情報に基づいて修正することにより、利用者
別シソーラスを作成する利用者別シソーラス作成手段を
備えたものである修正シソーラス作成装置。 (4)この収集型シソーラス作成装置が、上記収集型シ
ソーラス作成手段によって作成された収集型シソーラス
を更に上記分散データベース環境の利用者毎に、各利用
者による情報検索の履歴情報あるいは各利用者によって
与えられたシソーラス更新情報に基づいて修正すること
により、利用者別シソーラスを作成する利用者別シソー
ラス作成手段を備えたものである収集型シソーラス作成
装置。
With respect to the above description, the following items are further disclosed. (1) The database is a distributed database including a plurality of individual databases arranged in a distributed manner,
A modified thesaurus creation device, wherein the thesaurus is an integrated thesaurus in which the thesaurus unique to each of the plurality of individual databases is integrated. (2) A modified thesaurus creation device, wherein the thesaurus acquisition means acquires a part of the thesaurus, and the modified thesaurus creation means modifies the part acquired by the thesaurus acquisition means. (3) The modified thesaurus creating device further updates the modified thesaurus created by the modified thesaurus creating means for each user of the database and records history information of information search by each user or updates the thesaurus given by each user A modified thesaurus creation device comprising a user-specific thesaurus creation means for creating a user-specific thesaurus by modifying based on information. (4) The collection-type thesaurus creation device further collects the collection-type thesaurus created by the collection-type thesaurus creation means for each user of the distributed database environment, by using history information of information search by each user or by each user. A collection-type thesaurus creation device comprising a user-specific thesaurus creation means for creating a user-specific thesaurus by correcting based on given thesaurus update information.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の統合シソーラス作成装置、修正シソー
ラス作成装置、情報収集型シソーラス作成装置、統合シ
ソーラス作成プログラム記憶媒体、修正シソーラス作成
プログラム記憶媒体、および情報収集型シソーラス作成
プログラム記憶媒体が適用されるコンピュータの外観図
である。
FIG. 1 shows an integrated thesaurus creation device, a modified thesaurus creation device, an information collection type thesaurus creation device, an integrated thesaurus creation program storage medium, a modified thesaurus creation program storage medium, and an information collection thesaurus creation program storage medium of the present invention. 1 is an external view of a computer.

【図2】本発明の統合シソーラス作成装置、修正シソー
ラス作成装置、情報収集型シソーラス作成装置、統合シ
ソーラス作成プログラム記憶媒体、修正シソーラス作成
プログラム記憶媒体、および情報収集型シソーラス作成
プログラム記憶媒体が適用されるコンピュータの内部構
成図である。
FIG. 2 shows an integrated thesaurus creation device, a modified thesaurus creation device, an information collection type thesaurus creation device, an integrated thesaurus creation program storage medium, a modified thesaurus creation program storage medium, and an information collection thesaurus creation program storage medium of the present invention. 1 is an internal configuration diagram of a computer.

【図3】本発明の統合シソーラス作成装置の一実施形態
を示すブロック図である。
FIG. 3 is a block diagram showing an embodiment of the integrated thesaurus creation device of the present invention.

【図4】図3に示した統合シソーラス作成装置による統
合シソーラス作成のアルゴリズムを示す流れ図である。
4 is a flowchart showing an algorithm for creating an integrated thesaurus by the integrated thesaurus creating apparatus shown in FIG. 3;

【図5】本発明の修正シソーラス作成装置の一実施形態
を示すブロック図である。
FIG. 5 is a block diagram showing an embodiment of the modified thesaurus creation device of the present invention.

【図6】本実施形態の修正シソーラス作成手段の3つの
動作モードを示す図である。
FIG. 6 is a diagram showing three operation modes of the modified thesaurus creation means of the embodiment.

【図7】修正シソーラス作成手段による修正処理のアル
ゴリズムを示す流れ図である。
FIG. 7 is a flowchart showing an algorithm of a correction process by a correction thesaurus creating unit.

【図8】本実施形態の修正シソーラス作成装置により修
正シソーラスを作成する過程を示す図である。
FIG. 8 is a diagram illustrating a process of creating a modified thesaurus by the modified thesaurus creating device of the present embodiment.

【図9】本発明の修正シソーラス作成装置の他の実施形
態を示すブロック図である。
FIG. 9 is a block diagram showing another embodiment of the modified thesaurus creation device of the present invention.

【図10】本発明の情報収集型シソーラス作成装置の一
実施形態を示すブロック図である。
FIG. 10 is a block diagram showing one embodiment of an information collection type thesaurus creation device of the present invention.

【図11】本発明の情報収集型シソーラス作成装置の他
の実施形態を示すブロック図である。
FIG. 11 is a block diagram showing another embodiment of the information collection type thesaurus creation device of the present invention.

【符号の説明】[Explanation of symbols]

10 統合シソーラス作成装置 11 ファシリテータ 11_1 シソーラス取得手段 11_2 統合シソーラス作成手段 12 統合シソーラス 13a,13b 利用者 15 データベース群 15a,15b データベース 16a,16b データベースマネージャ 17a,17b データベースシソーラス 20a,20b 修正シソーラス作成装置 21 ファシリテータ 21_1 固有シソーラス取得手段 21_2 統合シソーラス作成手段 23a,23b インターフェースマネージャ 23_1a,23_1b シソーラス取得手段 23_2,23_2a,23_2b 修正シソーラス
作成手段 23_2_1 履歴学習モード 23_2_2 ユーザカスタマイズモード 23_2_3 外部シソーラス統合モード 24a,24b 修正シソーラス 25a,25b,25c,25d 利用者 30a,30b 修正シソーラス作成装置 31 ファシリテータ 31_1 固有シソーラス取得手段 31_2 統合シソーラス作成手段 33a,33b インターフェースマネージャ 33_1a,33_1b シソーラス取得手段 33_2a,33_2b 修正シソーラス作成手段 33_3a,33_3b 利用者別シソーラス作成手
段 34a,34b 修正シソーラス 35a,35b,35c,35d 利用者別シソーラ
ス 36a,36b,36c,36d 利用者 40a,40b 情報収集型シソーラス作成装置 41 ファシリテータ 43a,43b インターフェースマネージャ 43_1a,43_1b 情報収集手段 43_2a,43_2b 情報収集型シソーラス作成
手段 44a,44b 情報収集型シソーラス 45a,45b,45c,45d 利用者 50a,50b 情報収集型シソーラス作成装置 53a,53b インターフェースマネージャ 53_1a,53_1b 情報収集手段 53_2a,53_2b 情報収集型シソーラス作成
手段 53_3a,53_3b 利用者別シソーラス作成手段 54a,54b 情報収集型シソーラス 55a,55b,55c,55d 利用者別シソーラ
ス 56a,56b,56c,56d 利用者 100 コンピュータ 101 本体 101a フロッピーディスク挿入口 101b CD−ROM挿入口 102 ディスプレイ 103 キーボード 104 マウス 105 通信回線 110 内部バス 111 CPU 112 RAM 113 ハードディスクコントローラ 113a ハードディスク 114 フロッピーディスクドライブ 114a フロッピーディスク 115 CD−ROMドライブ 115a CD−ROM 116 マウスコントローラ 117 キーボードコントローラ 118 ディスプレイコントローラ 119 通信制御装置
DESCRIPTION OF SYMBOLS 10 Integrated thesaurus creation device 11 Facilitator 11_1 Thesaurus acquisition means 11_2 Integrated thesaurus creation means 12 Integrated thesaurus 13a, 13b User 15 Database group 15a, 15b Database 16a, 16b Database manager 17a, 17b Database thesaurus 20a, 20b Modified thesaurus creation device 21 21_1 Unique Thesaurus Acquisition Means 21_2 Integrated Thesaurus Creation Means 23a, 23b Interface Manager 23_1a, 23_1b Thesaurus Acquisition Means 23_2, 23_2a, 23_2b Modified Thesaurus Creation Means 23_2_1 History Learning Mode 23_2_2 User Customization Mode 23_2_3 External Thesaurus, Modification of External Thesaurus 24b 2 b, 25c, 25d Users 30a, 30b Modified thesaurus creation device 31 Facilitator 31_1 Unique thesaurus acquisition means 31_2 Integrated thesaurus creation means 33a, 33b Interface managers 33_1a, 33_1b Thesaurus acquisition means 33_2a, 33_2b Modified thesaurus creation means 33_b, 33_a Thesaurus creating means 34a, 34b Modified thesaurus 35a, 35b, 35c, 35d Thesaurus for each user 36a, 36b, 36c, 36d Users 40a, 40b Information collecting type thesaurus creating device 41 Facilitator 43a, 43b Interface manager 43_1a, 43_1b Information collecting means 43_2a, 43_2b Information collection type thesaurus creation means 44a, 44b Information collection type thesaurus 5a, 45b, 45c, 45d Users 50a, 50b Information collection type thesaurus creation devices 53a, 53b Interface managers 53_1a, 53_1b Information collection means 53_2a, 53_2b Information collection type thesaurus creation means 53_3a, 53_3b User-specific thesaurus creation means 54a, 54b Information collecting thesaurus 55a, 55b, 55c, 55d User-specific thesaurus 56a, 56b, 56c, 56d User 100 Computer 101 Main unit 101a Floppy disk insertion slot 101b CD-ROM insertion slot 102 Display 103 Keyboard 104 Mouse 105 Communication line 110 Internal Bus 111 CPU 112 RAM 113 Hard disk controller 113a Hard disk 114 Floppy disk drive 114a Floppy disk 115 CD-ROM drive 115a CD-ROM 116 Mouse controller 117 Keyboard controller 118 Display controller 119 Communication controller

フロントページの続き (72)発明者 湯上 伸弘 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B075 KK03 KK07 KK40 ND20 NK02 NK35 NR06 NR20 PP02 PP03 PP22 PQ02 UU01 UU40 (54)【発明の名称】 統合シソーラス作成装置、修正シソーラス作成装置、情報収集型シソーラス作成装置、統合シソ ーラス作成プログラム記憶媒体、修正シソーラス作成プログラム記憶媒体、および情報収集型シ ソーラス作成プログラム記憶媒体Continuation of the front page (72) Inventor Nobuhiro Yugami 4-1-1, Kamiodanaka, Nakahara-ku, Kawasaki-shi, Kanagawa F-term within Fujitsu Limited 5B075 KK03 KK07 KK40 ND20 NK02 NK35 NR06 NR20 PP02 PP03 PP22 PQ02 UU01 UU40 (54) [Title of the Invention] Integrated thesaurus creation device, modified thesaurus creation device, information collection type thesaurus creation device, integrated thesaurus creation program storage medium, modified thesaurus creation program storage medium, and information collection type thesaurus creation program storage medium

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 データベースに記憶された情報中の単語
相互間の関連を表す、そのデータベースに固有のシソー
ラスがそれぞれに用意されてなる複数のデータベースの
各シソーラスを取得する固有シソーラス取得手段と、 前記固有シソーラス取得手段によって取得されたシソー
ラスを統合することにより、前記複数のデータベースか
らなるデータベース群に記憶された情報の総体に対応す
る、該総体中の単語相互間の関連を表す統合シソーラス
を作成する統合シソーラス作成手段とを備えたことを特
徴とする統合シソーラス作成装置。
1. A unique thesaurus acquisition means for acquiring each thesaurus of a plurality of databases, each of which is provided with a thesaurus unique to the database, representing a relation between words in information stored in the database, By integrating the thesaurus acquired by the unique thesaurus acquisition means, an integrated thesaurus corresponding to the total of information stored in the database group including the plurality of databases and representing the relation between words in the total is created. An integrated thesaurus creation device, comprising: an integrated thesaurus creation means.
【請求項2】 データベースに記憶された情報中の単語
相互間の関連を表すシソーラスを取得するシソーラス取
得手段と、 前記シソーラス取得手段によって取得されたシソーラス
を、前記データベースにおける情報検索の履歴情報、ま
たは操作によって与えられるシソーラス更新情報に基づ
いて修正することにより修正シソーラスを作成する修正
シソーラス作成手段とを備えたことを特徴とする修正シ
ソーラス作成装置。
2. A thesaurus acquisition means for acquiring a thesaurus representing a relation between words in information stored in a database; and a thesaurus acquired by the thesaurus acquisition means, wherein information on history of information retrieval in the database; A modified thesaurus creating means for creating a modified thesaurus by modifying based on thesaurus update information given by an operation.
【請求項3】 データベースに記憶された情報中の単語
相互間の関連を表す、そのデータベースに固有のシソー
ラスがそれぞれに用意されてなる複数のデータベースの
シソーラスから、該複数のデータベースからなるデータ
ベース群における情報検索の履歴情報に基づいて、その
シソーラスを構成する情報を収集する情報収集手段と、 前記情報収集手段によって収集された情報に基づいて、
前記データベース群に対応する情報収集型シソーラスを
作成する情報収集型シソーラス作成手段とを備えたこと
を特徴とする情報収集型シソーラス作成装置。
3. A database group consisting of a plurality of databases each provided with a thesaurus unique to the database and representing a relation between words in information stored in the database. Information collection means for collecting information constituting the thesaurus based on the history information of the information search, based on the information collected by the information collection means,
An information collection type thesaurus creation device, comprising: an information collection type thesaurus creation unit that creates an information collection type thesaurus corresponding to the database group.
【請求項4】 データベースに記憶された情報中の単語
相互間の関連を表す、そのデータベースに固有のシソー
ラスがそれぞれに用意されてなる複数のデータベースの
各シソーラスを取得する固有シソーラス取得手段と、 前記固有シソーラス取得手段によって取得されたシソー
ラスを統合することにより、前記複数のデータベースか
らなるデータベース群に記憶された情報の総体に対応す
る、該総体中の単語相互間の関連を表す統合シソーラス
を作成する統合シソーラス作成手段とを備えた統合シソ
ーラス作成プログラムが記憶されてなることを特徴とす
る統合シソーラス作成プログラム記憶媒体。
4. A unique thesaurus acquisition means for acquiring each thesaurus of a plurality of databases each prepared with a thesaurus unique to the database and representing the relation between words in the information stored in the database; By integrating the thesaurus acquired by the unique thesaurus acquisition means, an integrated thesaurus corresponding to the total of information stored in the database group including the plurality of databases and representing the relation between words in the total is created. An integrated thesaurus creation program storage medium, wherein an integrated thesaurus creation program including an integrated thesaurus creation means is stored.
【請求項5】 データベースに記憶された情報中の単語
相互間の関連を表すシソーラスを取得するシソーラス取
得手段と、 前記シソーラス取得手段によって取得されたシソーラス
を、前記データベースにおける情報検索の履歴情報、ま
たは操作によって与えられるシソーラス更新情報に基づ
いて修正することにより修正シソーラスを作成する修正
シソーラス作成手段とを備えた修正シソーラス作成プロ
グラムが記憶されてなることを特徴とする修正シソーラ
ス作成プログラム記憶媒体。
5. A thesaurus acquisition means for acquiring a thesaurus representing the relationship between words in information stored in a database; and a thesaurus acquired by the thesaurus acquisition means, the history information of information retrieval in the database, or A modified thesaurus creation program storage medium, characterized by storing a modified thesaurus creation program including a modified thesaurus creation means for creating a modified thesaurus by modifying based on thesaurus update information given by an operation.
【請求項6】 データベースに記憶された情報中の単語
相互間の関連を表す、そのデータベースに固有のシソー
ラスがそれぞれに用意されてなる複数のデータベースの
シソーラスから、該複数のデータベースからなるデータ
ベース群における情報検索の履歴情報に基づいて、その
シソーラスを構成する情報を収集する情報収集手段と、 前記情報収集手段によって収集された情報に基づいて、
前記データベース群に対応する情報収集型シソーラスを
作成する情報収集型シソーラス作成手段とを備えた情報
収集型シソーラス作成プログラムが記憶されてなること
を特徴とする情報収集型シソーラス作成プログラム記憶
媒体。
6. A database group consisting of a plurality of databases each provided with a thesaurus unique to the database and representing a relation between words in information stored in the database. Information collection means for collecting information constituting the thesaurus based on the history information of the information search, based on the information collected by the information collection means,
An information collection type thesaurus creation program storage medium, comprising: an information collection type thesaurus creation program including information collection type thesaurus creation means for creating an information collection type thesaurus corresponding to the database group.
JP11156511A 1999-06-03 1999-06-03 Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium Pending JP2000348042A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11156511A JP2000348042A (en) 1999-06-03 1999-06-03 Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11156511A JP2000348042A (en) 1999-06-03 1999-06-03 Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium

Publications (1)

Publication Number Publication Date
JP2000348042A true JP2000348042A (en) 2000-12-15

Family

ID=15629380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11156511A Pending JP2000348042A (en) 1999-06-03 1999-06-03 Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium

Country Status (1)

Country Link
JP (1) JP2000348042A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454303C (en) * 2005-01-07 2009-01-21 松下电器产业株式会社 Association dictionary creation apparatus
US7483921B2 (en) 2004-10-29 2009-01-27 Panasonic Corporation Information retrieval apparatus
JP2011503681A (en) * 2007-09-28 2011-01-27 インターナショナル・ビジネス・マシーンズ・コーポレーション Method and system for analysis of systems for matching data records
JP2011221877A (en) * 2010-04-13 2011-11-04 Yahoo Japan Corp Related word extraction device
US8510338B2 (en) 2006-05-22 2013-08-13 International Business Machines Corporation Indexing information about entities with respect to hierarchies
US8589415B2 (en) 2006-09-15 2013-11-19 International Business Machines Corporation Method and system for filtering false positives
US8713434B2 (en) 2007-09-28 2014-04-29 International Business Machines Corporation Indexing, relating and managing information about entities
JP2015517155A (en) * 2012-05-08 2015-06-18 シェンツェン・シ・ジ・ガン・ス・インフォメーション・テクノロジー・カンパニー・リミテッド A system, apparatus, and method for recommending a thesaurus in an input method.
JP2015125584A (en) * 2013-12-26 2015-07-06 Kddi株式会社 Mining analysis device, method and program

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483921B2 (en) 2004-10-29 2009-01-27 Panasonic Corporation Information retrieval apparatus
US7725486B2 (en) 2004-10-29 2010-05-25 Panasonic Corporation Information retrieval apparatus
CN100454303C (en) * 2005-01-07 2009-01-21 松下电器产业株式会社 Association dictionary creation apparatus
US8280720B2 (en) 2005-01-07 2012-10-02 Panasonic Corporation Association dictionary creation apparatus
US8510338B2 (en) 2006-05-22 2013-08-13 International Business Machines Corporation Indexing information about entities with respect to hierarchies
US8589415B2 (en) 2006-09-15 2013-11-19 International Business Machines Corporation Method and system for filtering false positives
US9286374B2 (en) 2007-09-28 2016-03-15 International Business Machines Corporation Method and system for indexing, relating and managing information about entities
US8713434B2 (en) 2007-09-28 2014-04-29 International Business Machines Corporation Indexing, relating and managing information about entities
US8799282B2 (en) 2007-09-28 2014-08-05 International Business Machines Corporation Analysis of a system for matching data records
JP2011503681A (en) * 2007-09-28 2011-01-27 インターナショナル・ビジネス・マシーンズ・コーポレーション Method and system for analysis of systems for matching data records
US9600563B2 (en) 2007-09-28 2017-03-21 International Business Machines Corporation Method and system for indexing, relating and managing information about entities
US10698755B2 (en) 2007-09-28 2020-06-30 International Business Machines Corporation Analysis of a system for matching data records
JP2011221877A (en) * 2010-04-13 2011-11-04 Yahoo Japan Corp Related word extraction device
JP2015517155A (en) * 2012-05-08 2015-06-18 シェンツェン・シ・ジ・ガン・ス・インフォメーション・テクノロジー・カンパニー・リミテッド A system, apparatus, and method for recommending a thesaurus in an input method.
US9984328B2 (en) 2012-05-08 2018-05-29 Shenzhen Shi Ji Guang Su Information Technology Co., Ltd. System, apparatus and method for recommending thesaurus in input method
JP2015125584A (en) * 2013-12-26 2015-07-06 Kddi株式会社 Mining analysis device, method and program

Similar Documents

Publication Publication Date Title
AU736753B2 (en) System and method for storing and manipulating data in an information handling system
US7574423B2 (en) Partial data model exposure through client side caching
JP3023441B2 (en) Database division management method and parallel database system
US6785869B1 (en) Method and apparatus for providing a central dictionary and glossary server
US6289337B1 (en) Method and system for accessing information using keyword clustering and meta-information
US6820085B2 (en) Web system having clustered application servers and clustered databases
US20010016846A1 (en) Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages
EP1840772A1 (en) Hierarchical clustering with real-time updating
US20120179683A1 (en) Method and System for Attribute Management in a Namespace
JPH0769922B2 (en) Memory space reuse management method and system
JP2002230021A (en) Information retrieval device and method, and storage medium
MX2010012866A (en) Paging hierarchical data.
US7281014B2 (en) Method and apparatus for moving data between storage devices
JP3499105B2 (en) Information search method and information search device
JP2000348042A (en) Integrated thesaurus preparing device, corrected thesaurus preparing device, information collectable thesaurus preparing device, integrated thesaurus preparing program storage medium, corrected thesaurus preparing program storing medium and information collectable thesaurus preparing program storage medium
US20070106767A1 (en) Database device database search device, and method thereof
JP2001101042A (en) System and method for managing data
JP3356519B2 (en) Document information retrieval device
WO2006059249A2 (en) Cache for an enterprise software system
JP2000200205A (en) Method and device for selecting file
Restorick Novel filing systems applicable to an automated office: a state-of-the-art study
JP3387172B2 (en) Information management device
JP3172793B1 (en) Database management method
JP3599055B2 (en) Storage device management method and system
JP3060225B2 (en) Database management method and system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212