JPH11149484A - シソーラス検索合成システム - Google Patents

シソーラス検索合成システム

Info

Publication number
JPH11149484A
JPH11149484A JP9333489A JP33348997A JPH11149484A JP H11149484 A JPH11149484 A JP H11149484A JP 9333489 A JP9333489 A JP 9333489A JP 33348997 A JP33348997 A JP 33348997A JP H11149484 A JPH11149484 A JP H11149484A
Authority
JP
Japan
Prior art keywords
thesaurus
node
page
arc
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9333489A
Other languages
English (en)
Other versions
JP3166689B2 (ja
Inventor
Tadanobu Miyauchi
忠信 宮内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP33348997A priority Critical patent/JP3166689B2/ja
Priority to US09/169,002 priority patent/US6282509B1/en
Publication of JPH11149484A publication Critical patent/JPH11149484A/ja
Application granted granted Critical
Publication of JP3166689B2 publication Critical patent/JP3166689B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Abstract

(57)【要約】 【課題】 利用者の目的に応じたシソーラスを種々な演
算処理によって適宜生成する。 【解決手段】 検索対象のシソーラスを保持する複数の
外部シソーラス2ネットワーク1を介してシソーラス検
索合成装置3を接続し、シソーラス検索合成装置3は、
合成すべきシソーラスを定義する要求を入力部5から受
け付けると、検索部32により要求に対応した部分シソ
ーラスを外部シソーラス2から検索する。そして、合成
部33により、検索された複数の部分シソーラスから要
求に対応する積演算、和演算等の演算処理を行って新た
なシソーラス合成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、利用者の目的に応
じたシソーラスを種々な演算処理によって適宜生成する
ことができるシステムに関する。
【0002】
【従来の技術】従来より、自然言語処理技術の一環とし
てテキスト検索や自動分類の研究が活発に行われてい
る。こうした分野において、いわゆる知識ベース、その
なかでもとくにシソーラスと呼ばれる概念間の関係を上
位/下位関係を基本として階層的に定義した知識ベース
の重要性がますます高まっている。従来から提案されて
いる知識処理の流れは、ルールベースのアプローチと、
事例ベースのアプローチとに大きく分けられる。
【0003】ルールベースのアプローチは、現実世界を
規定したルールの組み合わせにマッピングすることによ
り知識処理を行おうとするものである。代表的な形態で
あるプロダクションシステムにおいては、ルールベース
を推論エンジンが参照することで問題解決を行う。この
アプローチは、ルールのモジュール性、一様性、知識表
現としての自然さなどの特徴があるが、反面、例外を扱
おうとすると結局ルールが増えてしまい効率が低下する
上、そもそもルール化が困難であるなど、作成および保
守が困難であるという問題をもっている。これに対し、
事例ベースのアプローチは、実際に存在する表現・事例
に基づき知識ベースを構築するものである。
【0004】事例ベースのアプローチの方法は、汎用
と、特定用途向けとに更に大別される。汎用の方法は、
世界知識を実例に基づきすべて記述しようという試みで
あり、日本電子化辞書研究所(EDR)の辞書構築のア
プローチに代表される。この方法は、辞書記述などの方
法が特定の文法規則に依存しないため、専門家でなくて
も人手をかけることで大量の知識ベースを構築できると
いう利点があり、実例が存在するものについてはルール
ベースと同様に一様性と正確さを保証できる。ただし、
それぞれの概念は一般に多義性を持つため、実際に実例
が使用されたのと同様の状況でなければ正確さを保証で
きず、子細な部分まで現実を反映することが難しい。ま
た、数十万以上の概念を持つ非常に大規模なものとなる
ため、個々のデータ入力は容易でも全体をメンテナンス
することが困難を極めるという問題点がある。
【0005】このようなシソーラス構築・生成に関する
発明としては、特開平4−237332号公報に記載さ
れる「知識構造作成方法」、特開平4−39769号公
報に記載される「シソーラス生成装置」、特開平8−1
6620号公報に記載される「データ分類装置/方法、
データ分類木生成装置/方法、派生語抽出装置/方法、
シソーラス構築装置/方法、データ処理システム」など
が提案されている。しかしながら、これら発明はいずれ
も解析技術の導入などにより構築を自動化したにすぎ
ず、実例ベースのアプローチのメリットを享受している
だけであり、上述の問題点を解決できていない。また、
特開平3−276369号公報に記載される「シソーラ
ス自動再編成装置」においては、シソーラスの再構築に
ついて述べているが、これはプログラム部品や電子部品
など、次に述べる特定用途のシソーラスを想定したもの
であり、汎用の大規模なシソーラスにおける多義性の問
題は解決されていない。
【0006】特定用途向けの方法は、用途に応じた小規
模な知識ベースを構築し、利用するものである。特定用
途であるため、現実を反映しつつ保守が容易であるとい
う利点がある一方、使用できる状況が限定されることに
加え、通常は存在が他者に知られることがないため他の
用途への流用や、多少の変更による再利用に際し、結局
最初から構築するのと同程度の手間を要するという問題
点がある。この用法に関連する発明として、特開平9−
6789号公報に記載される「分野別シソーラス生成装
置」が提案されている。この発明は、特定分野を定義す
る問い合わせから、汎用シソーラスに基づき特定分野に
関係しない不適切な語を除いた分野別シソーラスを構築
するという技術である。しかしながら、そもそも汎用シ
ソーラスの構築が困難であるという問題点を解決できて
いない上、再利用に関しても有効な手だてではない。
【0007】
【発明が解決しようとする課題】上記のように、従来で
は、既存のシソーラスからユーザの目的や用途に応じた
新たなシソーラスを構築することは困難であった。本発
明は上記従来の事情に鑑みなされたもので、ユーザの目
的や用途に応じて、既存のシソーラスから演算処理によ
って新たなシソーラスを生成し、これによって、シソー
ラスの拡張やメンテナンスを容易に実現することを目的
とする。また、本発明は、ネットワーク上に分散された
複数のシソーラスから、ユーザの目的や用途に応じて新
たなシソーラスを生成し、これによって、シソーラスの
拡張やメンテナンスを容易に実現することを目的とす
る。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明では、目的にそぐうシソーラスを合成するた
めに基本的な演算処理を定義し、シソーラスを構成して
いるページに対して演算処理を繰り返し行うことにより
新たなシソーラスを生成する。ここで、本発明に係るシ
ソーラスを説明しておくと、その構造を図1に示すよう
になっている。シソーラスはノードN、N1、N2、N
3・・・と該ノードの下位関係を示すアークA、A1、
A2、A3・・・とを有したページP、P1、P2、P
3・・・を単位として、これらページを複数関連付ける
ことにより構成されている。各ノードN、N1、N2、
N3・・・には概念が付されているとともに固有の識別
子IDが付されており、また、各アークA、A1、A
2、A3・・・には下位に関連付けられたノードの識別
子IDが含まれている。したがって、識別子IDによっ
てシソーラス中の個々のノード(すなわち、ページ)を
特定し得るようになっている。
【0009】本発明では、検索され或いはユーザが入力
した上記のような構成のシソーラスに対して、ユーザか
らの要求に応じて和演算、積演算、直積演算、転置演算
等の処理を施し、これによって、目的にそぐう新たなシ
ソーラスを生成する。例えば、積演算処理では、入力さ
れた複数のページ間においてアーク識別子に対応する下
位ノードの概念の一致を検出し、当該一致した概念のノ
ードを有する第2のページを生成し、この第2のページ
を新たなページのアークに関係付ける処理を行って、新
たなページを最上位ノードとした新たなシソーラスを生
成する。また、積演算処理の一態様として、入力された
複数のページ間においてアーク識別子に対応する下位ノ
ードの概念の一致を検出し、予め設定された所定の一致
度以上の概念のノードを有する第2のページを生成し、
この第2のページを新たなページのアークに関係付ける
処理を行って、新たなページを最上位ノードとした新た
なシソーラスを生成する。
【0010】また、直積演算処理では、入力された複数
のページのアークの組合せにより新たなページのアーク
を新たな識別子を付して生成し、これら新たに生成され
たアークに対して組合せ処理された元のアークに対応す
る下位ノードに基づいて生成される第2のページを関連
付け、更に組合わせ処理された元のノードの下位ノード
間で共通する概念のノードを第2のページのアークに関
係付ける処理を行って、新たなページを最上位ノードと
した新たなシソーラスを生成する。また、転置演算処理
では、着目する概念が付された着目ノードが指定される
と、着目ノードを最上位として、着目ノードの下位に関
連付けられていたノードを当該着目ノードに関係付け、
当該ノードに着目ノードの上位に関連付けられていたノ
ードを関係付ける演算処理を行って、新たなシソーラス
を生成する。
【0011】なお、本発明は、スタンドアローンのシス
テムとしても実現することができるが、ネットワーク上
にシソーラスを分散させたシステムにも勿論適用するこ
とができ、ネットワーク上に分散された複数のシソーラ
スに基づいて新たなシソーラスを生成することができ
る。この場合には、検索対象のシソーラスを保持する複
数のシソーラス管理装置にネットワークを介してシソー
ラス検索合成装置を接続し、シソーラス検索合成装置
は、合成すべきシソーラスを定義する要求を受け付ける
入力手段と、要求に対応した識別子に合致するページを
シソーラス管理装置から検索する検索手段と、検索され
た複数のページを前記要求に対応する演算処理を行って
新たな識別子を付したノードを含む新たなページへ合成
する合成手段と、を備え、合成手段によって上記のよう
な演算処理を行って、新たなページを最上位ノードとし
た新たなシソーラスを生成する。
【0012】
【発明の実施の形態】本発明の一実施形態に係るシソー
ラス合成検索システムを図面を参照して説明する。図2
には本実施形態に係るシソーラス合成検索システムの概
略構成を示してあり、ネットワーク1上に複数のシソー
ラス(外部シソーラス2)を分散させたシステムとなっ
ている。外部シソーラス2はネットワーク上にn個存在
しており、それぞれの外部シソーラス2は、シソーラス
データDB部21、シソーラス構造抽出部22、シソー
ラス仕様DB部23、シソーラス開示部24を有したシ
ソーラス管理装置として構成されている。
【0013】更に、各外部シソーラス2はネットワーク
1を介してシソーラス検索合成装置3およびシソーラス
検索サーバ4に接続されており、シソーラス検索合成装
置3は、問い合わせ処理部31、シソーラス検索部3
2、シソーラス合成部33、シソーラス保持部34、実
データ結合部35を有している。なお、シソーラス検索
合成装置3には、入力部5、出力部6、外部アプリケー
ション部7が接続されている。
【0014】外部シソーラス2は、それぞれメーカーの
製品情報や雑誌記事、専門家による分類など、個別用途
に応じて作成、メンテナンスされるシソーラスを保持し
ており、シソーラスDB部21は、シソーラスの実際の
データ、すなわち全体の木に準じたリンク構造として、
上位下位関係や、それぞれの概念、実際の単語表現など
の、シソーラスを構成するデータを一括して保持してい
る。シソーラス構造抽出部22は、シソーラスDB部2
1に保持されるデータから、外部からシソーラスを利用
するに必要な情報を抽出する処理を行う。
【0015】シソーラス仕様DB部23は、シソーラス
構造抽出部22で抽出した情報に基づき、実データと分
離したシソーラスの仕様を保持し、シソーラス検索合成
装置3からの要求に応じて出力する処理を行う。シソー
ラス開示部24は、シソーラス仕様DB部23に保持す
る仕様情報を、外部に利用可能なように開示し、要求に
応じて仕様とそれに対応する実データを返す処理を行
う。これらの外部シソーラス2をシソーラス検索合成装
置3に接続するネットワーク1については、インターネ
ットを想定してもよいし、社内LANなどのクローズド
なネットワークを想定してもよい。なお、本実施形態で
は既存技術としてhttp(Hyper Text Transfer Prot
ocol)上での実現を前提として説明する。
【0016】シソーラス検索合成装置3は、入力部5か
ら受け取った要求を問い合わせ処理部31で処理し、シ
ソーラス検索部32に渡し、シソーラス検索部32がネ
ットワーク1を介して外部シソーラス2を検索し、検索
結果として得られたシソーラスからシソーラス合成部3
3にて新たなシソーラスを合成する処理を行う。なお、
合成した新たなシソーラスは、シソーラス保持部34に
保持され、出力部6に出力される。
【0017】シソーラスサーチサーバ4は、シソーラス
開示部24にて公開された情報に基づき、外部シソーラ
ス2の仕様情報を保持する。外部アプリケーション7は
得られたシソーラスを用いた分類、類似検索などの処理
を行う部分であり、本実施形態では、仕様のみから合成
した仮想シソーラスを生成するため、実際の使用にあた
っては実データ結合部35を介して動的に実データとの
結合を行う。なお、本発明では実データとの結合を静的
に合成時に行う構成も想定しており、その場合には実デ
ータ結合部35は不要である。
【0018】以下、本実施形態における動作の一例とし
て、製品情報シソーラスの検索と合成の例を説明する。
一般に、シソーラスの構造は、概念または具体物間の上
位/下位関係とそれに付随する実際の概念や具体物を表
す情報から成っている。通常、概念や具体物には識別の
ために名前(ラベル)やID(識別子)が割り当てられ
る。図3にはある会社の製品リストを示してあり、具体
的には、製品をソフトウェア、周辺機器、サプライ、の
ような第1の分類に分け、その内の例えば周辺機器につ
いては拡張メモリ、LCD、HDDのような第2の分類
に分け、さらにLCDであればここでは駆動方式でTF
T方式、DSTN方式、XLCD方式のように細分化し
ている。さらに、それぞれの細分類には、実際の製品型
番として、LD−T12、LD−T14などの名前がリ
ンクしている。
【0019】上記製品リストの構造は、製品分類と製品
番号の上位/下位関係を規定していると見ることがで
き、一種のシソーラスであるといえる。さらに詳しく言
えば、それぞれの製品分類のノードが概念の名前を、製
品型番が具体物の名前を示し、それらの間のリンクが上
下関係を示すアークとなり、各ノードには0x1000
や0x2200などと言ったように固有の識別子(I
D)が付与されており、このシソーラス構造は、図1に
示したようにノード毎のページを単位としてその上下関
係を関連付けた構造となっている。
【0020】本実施形態では、各外部シソーラス2のシ
ソーラスデータDB部21に上記のすべてを包含するデ
ータが格納されている。なお、格納する形式としては、
独自のデータ構造などを用いてもよいが、ここでは、イ
ンターネット上に流通するデータとして一般的なHTM
L(Hyper Text Markup Language)形式で格納する例を
示す。シソーラスの構造は、データ間を関係に基づきリ
ンク構造として表現するという点で、ハイパーテキスト
と類似性が高いため、有効な方法である。図3に示した
製品情報構造の一部をHTMLで表現すると次のように
なる。
【0021】 <HTML> <HEAD> <META HTTP-EQUIV="Content-Type" CONTENT="text/html "> <META NAME="Description" CONTENT="THLBL=A社製品リスト(1997年10月)"> <TITLE>LCD</TITLE> </HEAD> <BODY> <A NAME="is-part-of" /A> LCDのページ <A NAME="attribute">駆動方式</A> <UL><LI><A HREF="TFT.html#is-part-of" >TFT方式</A></LI></UL> TFT方式は、反応速度が高く、視野角が広いのが特長で す。 <UL><LI><A HREF="DSTN.html#is-part-of ">DSTN方式</A></LI></UL> DSTN方式は、お求めやすい価格が特長です。 <UL><LI><A HREF="XLCD.html#is-part-of ">XLCD方式</A></LI></UL> XLCD方式は、当社独自の技術により明るい大型画面を 実現しました。 <P><A HREF="Perif.html">周辺機器</A>のページに戻る </BODY> </HTML>
【0022】このようなファイルを、シソーラスデータ
DB部21で例えば次のURLに保持する。 http://www.a-sya.co.jp/export/thesaurus/products/periferal/LCD.html
【0023】また、本実施形態では、パスの構造はシソ
ーラスの階層構造を反映した名前付けを与えている。シ
ソーラス構造抽出部22では、ここからキーとなる構造
情報を抽出する。抽出する情報としては、次のようなも
のがあげられる。これらについて、前述のHTMLに基づき
簡単に説明する。
【0024】シソーラス名:シソーラス全体を代表する
ラベルを各HTMLに保持する。ここでは、<METANAME
="Description" CONTENT="THLBL=A社製品リスト(1997年
10月)">のように記述し、ラベルが「A社製品リスト(1
997年10月)」であることを示す。
【0025】概念名/ID:各ノードが有する概念を表
すラベルまたは識別子を各ノードに保持する。ここで
は、ノードの<TITLE>タグに「LCD」のように記述
し、ノードが有する概念を表示する。
【0026】関係:ノード間の上位/下位の関係であ
り、ここでは、アンカーとマーカーを用いて記述する。
すなわち、「LCD」の部分関係である「TFT方式」
や「DSTN方式」については”#is-part-of”という
マーカーを用いてアンカーでリンク先の下位関係を記述
する。一方、「LCD」自身は「周辺機器」の部分関係
であるから、アンカーにより「周辺機器」への上位関係
を記述したうえで、<BODY>タグ先頭の”#is-part-of”
マーカーにより、「周辺機器」からのリンクを保持す
る。他に、例えば概念−具体物という関係であれば”#i
s-a”というマーカーにより記述する。さらに、関係に
属性の限定を与えることができる。ここでは、「駆動方
式」という属性情報を”attribute”というマーカーで
指定している。
【0027】具体物名:具体物を表すラベルであり、上
述のHTMLの例には記述されていないが、「LD−T
14」や「LD−D14」などのようにシソーラスの最
下位ノードに保持される。概念名との区別は、上述のよ
うにマーカーが”#is-a”であることによりなされる。
【0028】このように、シソーラスの構造を表すアト
ミックな情報はHTMLにより十分に記述可能であり、
シソーラス全体の構造はHTMLファイルの組み合わせ
として表現される。なお、上記データの抽出の方法とし
ては、このようにデータがHTMLで表現されていれ
ば、タグに基づいたパーザを用いることで容易に実現で
きる。
【0029】そして、シソーラス構造抽出部22が抽出
した上記の構造情報はシソーラス仕様DB部23に格納
される。通常のテキスト情報データベース(テキストD
B)でいえば、シソーラスデータDB部21がテキスト
実体データ、シソーラス仕様DB部23がキーワードの
インデックスに相当する。テキストDBと異なるのは、
シソーラスは構造を持つため、その構造までを含めてキ
ー情報とする点である。
【0030】そして、シソーラス開示部24では、得ら
れたキー情報を外部に仕様として公開し、外部からの問
い合わせに応じて仕様に対応する実体データをシソーラ
スデータDB部21から送る処理を行う。この開示の方
法としてはさまざまな手段が考えられるが、有効な方法
のひとつとして、ここではインターネット上でのテキス
ト情報サーチサービスと同様のアプローチを述べる。
【0031】近年、クローラー(crawler)またはスパ
イダー(spider)と呼ばれる技術を用いた自動収集・イ
ンデクシングが急速に発達している。これらの手法は、
http上でHTMLにより記述したデータであれば内
容によらず適用できるため、「Internetworking(アス
キー社)1997年8月号 p.23〜「特集 アーカイブの作成
と検索」」に述べられているような手法により、インタ
ーネット上で公開された情報に対して自動収集が可能で
ある。この場合、シソーラスサーチサーバ4が送出する
クローラープログラムが、インターネット上に遍在する
開示されたシソーラスを順次訪問することにより実現さ
れる。なお、上記の例では、シソーラスのひとつの階層
に対してひとつのHTMLが対応する記述法をとった
が、用途に応じてすべての階層をひとつのHTMLにま
とめて記述する方法や、データ実体と階層関係をファイ
ルとディレクトリの形式で保持する方法も勿論可能であ
る。
【0032】次に、シソーラス検索合成装置3の動作に
ついて説明する。まず、ユーザが入力部5から自分が得
たいシソーラスの要求仕様を与えることにより、シソー
ラス検索合成装置3が以下の動作を開始する。この要求
の与え方としては、専用の言語を定義する方法や、グラ
フィカルなインタフェースを用いる方法なども考えられ
るが、ここでは一般のユーザが馴染みやすい方法として
自然言語を用いた方法について述べる。例えば、要求
は、「液晶ディスプレイに関する、入力信号および代表
的な駆動方式」と言ったように表現される。
【0033】このような要求が入力されると、当該要求
を問い合わせ処理部31にて解析し、シソーラス検索部
32およびシソーラス合成部33に与えるのに適当な形
式の問い合わせを生成する。ここでは、具体的な解析方
法として、複数の概念とそれらの概念間の関係を解析す
る技術として、特開平7−319885号公報の「キー
ワード抽出装置」に述べられているように、下記のよう
な方法を用いることとする。
【0034】すなわち、概念間の関係に関し、上下関係
に適合した(1)や(2)のような特定表現に基づき解
析する。 (1)XであるY:Xという概念の具体物Y(Y is-a X)、
(2)Xに関するY:Xという上位概念を持つ概念Y(Y is
-part-of X)、さらに、例えば(3)〜(6)のような
特定の表現をシソーラス合成処理(オペレーション)の
記述のために用いることにする。これは特定のパタンマ
ッチのみにより容易に実現可能である。なお、合成処理
の詳細については後述する。(3)代表的なX、共通の
X: Xに関して検索されたシソーラスの論理積(シソー
ラス積)、(4)一般的なY、すべてのY: Yに関して
検索されたシソーラスの論理和(シソーラス和)、
(5)XおよびY:XとYに関して検索されたシソーラスの
直積(シソーラス直積)、(6)XとYを転置:XとYに関
するシソーラス転置(またはシソーラス縮退)、
【0035】この結果、「液晶ディスプレイに関する、
入力信号および代表的な駆動方式」と言う形式で表現さ
れた要求は図4に示すように解析される。すなわち、概
念間の関係としては、「入力信号」と「駆動方式」とは
共に「液晶ディスプレイ」と”is-part-of”の関係にあ
り、合成処理(オペレーション)としては、「駆動方
式」と「代表的な」との積演算の結果を、さらに、「入
力信号」と直積演算することとなる。
【0036】このような解析結果に基づいて、次のよう
にシソーラス検索および合成処理が行われる。まず、シ
ソーラス検索において利用可能なキーとしては、前述の
シソーラス構造抽出部22で抽出するものを基本とし、
これらを組み合わせたものとなる。すなわち、
【0037】1)分類名からの検索、例:「製品リス
ト」、 分類名の指定により、たとえば同じ概念をもつノードで
も特定のシソーラスだけに限定する。 2)概念名からの検索、例:「液晶モニタ」「TFT方
式」、 概念名により、たとえばある概念以下、または列挙しし
たすべての概念を含む、といったように対象となるシソ
ーラスのノード(ページ)を限定する。 3)具体名からの検索、例:「LD−T14」「MT−
V14」「L400X」、 具体名の列挙により、たとえばその具体名をすべて含む
共通概念を検索する。 4)関係を用いた検索、例:「TFT方式の液晶モニ
タ」(=TFT方式,is-part-of,液晶モニタ)、 複数の概念とその間の関係を指定し、それを満たすよう
なシソーラスの部分構造を検索する。
【0038】なお、上記の1)〜3)の検索について
は、公知のテキストベースの情報検索と同様の手法によ
り実施できる。すなわち、文字列ベースまたは展開辞書
を用いた類似検索などにより容易に実施することができ
る。また、4)の検索については、たとえば特開平8−
235194号公報の「階層項目検索装置」にも記載さ
れているように公知の方法を用いて実施することができ
る。
【0039】上記の解析の結果、「入力信号,is-part-o
f,液晶ディスプレイ」と「駆動方式,is-part-of,液晶デ
ィスプレイ」という検索要求が生成される。この検索要
求はネットワーク1を介してシソーラスサーチサーバ4
に与えられ、シソーラスの合成を行うのに必要な情報と
して、条件を満たす部分シソーラス構造がシソーラス検
索合成装置3に複数返される。ここで、返送される情報
はそれぞれのシソーラスにおいて、検索要求を満たすも
っとも上位のノードへのポインタ(本実施形態ではUR
L)であり、検索要求に即して説明すれば、「液晶ディ
スプレイ」の下位概念に「入力信号」または「駆動方
式」という属性の概念を持つような部分シソーラスが要
求されているので、返される部分シソーラスは、条件に
マッチするシソーラスにおいて、それぞれ「液晶ディス
プレイ」という概念以下の構造である。以下に説明する
実際の例として、それぞれの条件に対し次のような結果
が返ってくるものとする。
【0040】「駆動方式,is-part-of,液晶ディスプレ
イ」に対して、 ・A社の製品リスト(図5)における点線の「LCD」
以下、 http://www.a-sya.co.jp/export/thesaurus/products/p
eriferal/LCD.html、 ・B社の商品分類(図6)における点線の「液晶モニ
タ」以下、 http://www.b-inc.co.jp/export/thesaurus/shounin/mo
nitor/LCmon.html、 「入力信号,is-part-of,液晶ディスプレイ」に対して、 ・C社の雑誌記事「表示機器特集」(図7)の「液晶デ
ィスプレイ」以下、 http://www.c-mag.co.jp/export/thesaurus/dispdev/LC
D.html、
【0041】次に、シソーラス合成部33は、ユーザが
指定した要求仕様の解析結果に従って、「液晶ディスプ
レイ」の「駆動方式」として検索された部分シソーラス
群に対してシソーラス積という合成処理を行ない、この
結果をさらに「液晶ディスプレイ」の「入力方式」に関
する部分シソーラスに対してシソーラス直積という合成
処理を行なう。合成処理としては、次のような基本操作
が定義できる。
【0042】・シソーラス積:対象となるシソーラス間
の共通ノードに含まれるリンクのみ残す(図8)、 ・シソーラス和:対象となるシソーラス間のすべてのノ
ードを列挙する(図9)、 ・シソーラス直積:対象となるシソーラス間のノードの
直積を生成する(図10)、 ・シソーラス縮退:対象となるシソーラスの上下関係を
置換し、不要なリンクを縮退する(シソーラスの転置を
したものどうしの和演算とみなすことができる)(図1
1)、 ・シソーラス挿入:対象となるシソーラスの一方を他方
に挿入する(図12)、
【0043】図8には、図5中に点線で囲って示すシソ
ーラスと図6中に点線で囲って示すシソーラスとをシソ
ーラス積した結果の一例を示してある。図8から明らか
なように、シソーラス積によって生成される新たなシソ
ーラスは、入力シソーラスの最上位ノード「LCD」と
「液晶モニタ」とから合成した「液晶ディスプレイ」を
最上位ノードとし、一方の入力シソーラス(図5)の第
2位ノード「TFT方式」、「DSTN方式」、「XL
CD方式」と他方の入力シソーラス(図6)の第2位ノ
ード「TFTタイプ」、「DSTNタイプ」、「ADS
TNタイプ」の共通する概念のノード「TFT」「DS
TN」を第2位ノードとし、一方の入力シソーラスおよ
び他方の入力シソーラスの最下位ノード(リーフ)の内
で共通概念ノードとなった元の第2位ノードに関係付け
られていたものを最下位ノードとしている。
【0044】また、図9には、図5中に点線で囲って示
すシソーラスと図6中に点線で囲って示すシソーラスと
をシソーラス和した結果の一例を示してある。図9から
明らかなように、シソーラス和によって生成される新た
なシソーラスは、入力シソーラスの最上位ノード「LC
D」と「液晶モニタ」とから合成した「液晶ディスプレ
イ」を最上位ノードとし、一方の入力シソーラス(図
5)の第2位ノード「TFT方式」、「DSTN方
式」、「XLCD方式」と他方の入力シソーラス(図
6)の第2位ノード「TFTタイプ」、「DSTNタイ
プ」、「ADSTNタイプ」とのすべての概念を表すノ
ード「TFT」「DSTN」「XLCD」「ADST
N」を第2位ノードとし、一方の入力シソーラスおよび
他方の入力シソーラスの最下位ノード(リーフ)の内で
新たに第2位ノードとなった元の第2位ノードに関係付
けられていたものを最下位ノードとしている。
【0045】また、図10には、図8に示したシソーラ
ス積の結果と「VGA入力」および「RGB入力」とい
う概念ノードとをシソーラス直積した結果の一例を示し
てある。図10から明らかなように、シソーラス直積に
よって生成される新たなシソーラスは、「液晶ディスプ
レイ」を最上位ノードとし、シソーラス積の結果の第2
位ノード「TFT」、「DSTN」と「VGA入力」と
のすべて組合せ概念を表すノード「VGA入力 AND
TFT」「VGA入力 AND DSTN」「RGB
入力 AND TFT」「RGB入力 AND DST
N」を第2位ノードとし、シソーラス積の結果の最下位
ノード(リーフ)の内で新たに第2位ノードとなった元
の第2位ノードに関係付けられていたものを最下位ノー
ドとしている。
【0046】また、図11には、入力シソーラスT1の
内の「LCD」と「液晶モニタ」を着目ノードとして転
置し、この転置によって得られた新たなシソーラスT
4、T5をシソーラス和したシソーラス縮退の結果の一
例を示してある。図10から明らかなように、「LC
D」ノードの上位ノード「A社製品」と下位ノード「T
FT方式」「DSTN方式」「XLCD方式」とを置換
してシソーラスT4とし、「液晶モニタ」ノードの上位
ノード「B社商品」と下位ノード「TFT方式」「DS
TN方式」「ADSTN方式」とを置換してシソーラス
T5とし、これらシソーラスT4、T5を上記のように
シソーラス和してシソーラス縮退の結果としている。
【0047】また、図12には、「B社液晶モニタ」を
最上位ノードとした元のシソーラスに、「STN方式」
に下位ノード「DSTN方式」「ADSTN方式」を関
係付けた他のシソーラスをシソーラス挿入した結果の一
例を示してある。図12から明らかなように、ノード概
念の関連を付けて、元のシソーラスのさらに下位に他の
シソーラスを関連付けてシソーラス挿入の結果としてい
る。
【0048】ここで、上記した実際の問い合わせ(要
求)に対応する各種の合成処理はシソーラス合成部33
によって行われ、これらの合成処理をそれぞれフローチ
ャートを参照して説明する。液晶ディスプレイの駆動方
式「駆動方式,is-part-of,液晶ディスプレイ」に関し、
検索結果として得られたA社の製品リスト(図5)およ
びB社の商品分類(図6)に関し、「代表的な」という
シソーラス積による合成操作を指定する表現が指定され
ているので、対象となるシソーラス間の共通ノードに含
まれるリンクのみ残す、という合成操作を行う。この結
果として、図8に示すように、共通に含まれるTFTと
DSTNの2方式のみのリンクが残される。なお、この
際、別のシソーラスを合成しているため、名前付けルー
ルに何らかの統一的な方法が必要であるが、ここではド
メイン名を固有の識別子として用いた解決を行う。すな
わち、該当シソーラスのドメインを各ノードの概念ラベ
ルに後置することで、分散システム上でも常に唯一の名
前が保証される。
【0049】上記の積演算による合成処理を、図13に
示すフローチャートを用いてさらに詳細に説明する。な
お、ここでは2つのシソーラス間のシソーラス積につい
て記述しているが、3つ以上の場合は2つの間の演算に
帰着できる。まず、検索された2つのシソーラス(入力
シソーラス1と入力シソーラス2とする)を入力し、そ
れぞれの入力シソーラスのトップノードの名前「Th1Top
Node」および「Th2TopNode」を抽出する(ステップS
1、S2)。そして、合成される新たなシソーラスのト
ップノードとなる仮想ページComVPageを生成し(ステッ
プS3)、このページの名前として、抽出した両方のト
ップノードの名前をANDで連結した「Th1TopNode AND
Th2TopNode」を与える(ステップS4)。図8に示し
た例では、仮想ページComVPageの名前として「LCD.a
-sha.co.jp AND液晶モニタ.b-inc.co.jp」が与えられ
る。この名前付けルールにより、合成されたページも他
のページと区別可能となる。なお、図8に示した例で
は、合成ページに便宜上「液晶ディスプレイ」というラ
ベルを与えている。このラベル付けは、ユーザが任意に
指定してもよいし、別のシソーラスを用いて自動的に生
成してもよい。
【0050】次いで、それぞれの入力シソーラスの下位
ノードの要素を「Th1LowerNodeList」および「Th2Lower
NodeList」とし(ステップS5、S6)、それぞれの入
力シソーラスの下位ノードの要素同士を順次比較する
(ステップS7、S8)。シソーラス積は共通ノードに
含まれるリンクを残すという操作であるので、共通ラベ
ルを持つものを残すことになる。図8に示した例では、
前方一致で最長のものを共通とみなし、「TFT」と
「DSTN」という部分ラベルがそれぞれ共通となる。
このような共通部分ラベルを持つものについて、下位ノ
ードとしての合成名「Th1LowerNodeList[i] OR Th2Lowe
rNodeList[j]」を生成する(ステップS9)。演算全体
はシソーラス積であるが、各共通ノードの下位ノードは
実在のノードの列挙として表されるため、合成名はOR
で表現される。図8に示した例では、「TFT方式.a-s
ha.co.jp OR TFTタイプ.b-inc.co.jp」などとなる。
得られた合成名を順次AndListという中間結果に
追加していき、すべての要素について比較を繰り返し行
う(ステップS10)。
【0051】次いで、こうして共通ノードのリストAn
dListが得られると、これらのそれぞれの要素に対
して次のような処理を行う。まず、仮想ページとして合
成下位ノードnを生成し、「lowerVPage[n]」に格納し
(ステップS11、S12)、そのページの名前として
「AndList[n]」を設定する(ステップS13)。図8に
示した例では、「TFT方式.a-sha.co.jp OR TFTタ
イプ.b-inc.co.jp」である。
【0052】次いで、合成シソーラストップページComV
PageにリンクLn[n]を追加し(ステップS14)、こ
のリンク先に「AndList[n]」(実際には名前で示される
URL)を追加し(ステップS15)、さらに、「Lowe
rVPage[n]」の内容として「AndList[n]」の内容が含む
原料ページへのリンクを設定する(ステップS16)。
図8に示した例では、「TFT方式.a-sha.co.jp」と
「TFT方式.b-inc.co.jp」という2つのリンクを設定す
る。これらのページは元来実ページとして存在するの
で、このノード以下は合成シソーラスにおいても実ペー
ジの内容がたどられることになり、合成処理は不要であ
る。上記の一連の処理を要素の数だけ繰り返して行い
(ステップS17、S18)、シソーラス積に関する合
成処理を終了する。
【0053】前述のように、基本的には3つ以上のシソ
ーラス間の合成であっても1対1の演算の組合せにより
実現できる。一方、複数シソーラス間の演算を同時に行
うことにより新たなメリットが得られる場合もあるた
め、そのような例について、上記積演算を変形した演算
処理を説明する。具体的には、複数シソーラス間の一致
度をあるしきい値により決める処理であり、図14に示
すフローチャートに従って処理が行われる。
【0054】全体の流れは前述したシソーラス積や後述
するシソーラス和と同様であるが、入力シソーラスが2
つからm個に拡張され、なた、一致度の算出のために、
しきい値k(例えば70%以上)を与えた上で、一致度
演算の記号として”*”を用いている。まず、それぞれ
の入力シソーラスのトップノードの名前「Th1TopNod
e」、「Th2TopNode」・・・「ThmTopNode」を抽出する
(ステップS21、S22、S23)し、合成される新
たなシソーラスのトップノードとなる仮想ページComVPa
geを生成し(ステップS24)、このページの名前とし
て、抽出した両方のトップノードの名前を*で連結した
「Th1TopNode * Th2TopNode・・・ * ThmTopNode」を与え
る(ステップS25)。
【0055】次いで、それぞれの入力シソーラスの下位
ノードの要素を「Th1LowerNodeList」、「Th2LowerNode
List」・・・「ThmLowerNodeList」とし(ステップS2
6、S27、S28)、それぞれの入力シソーラスの下
位ノードの要素同士を順次比較する(ステップS29、
S30、S31)。この一致度の比較処理は、m個の入
力シソーラスの内で、着目ノードについて共通ラベルを
持つ要素数をcとし、mにおけるcの割合c/mを算出
する処理である。例えば、入力シソーラスが4つで着目
ノードについて共通ラベルを持つものが3つあったとす
ると、c/mは75%となり、しきい値kを超えるた
め、新たな合成名として3つを”*”で結合したリンク
を生成する。このような共通部分ラベルを持つものにつ
いて、下位ノードとしての合成名を生成し(ステップS
32)、得られた合成名を順次MatchListとい
う中間結果に追加していき、すべての要素について比較
を繰り返し行う(ステップS33)。
【0056】次いで、こうして共通ノードのリストMa
tchListが得られると、これらのそれぞれの要素
に対して次のような処理を行う。まず、仮想ページとし
て合成下位ノードnを生成し、「lowerVPage[n]」に格
納し(ステップS34、S35)、そのページの名前と
して「MatchList[n]」を設定する(ステップS36)。
そして、合成シソーラストップページComVPageにリンク
Ln[n]を追加し(ステップS37)、このリンク先に
「MatchList[n]」を追加し(ステップS38)、さら
に、「LowerVPage[n]」の内容として「MatchList[n]」
の内容が含む原料ページへのリンクを設定する(ステッ
プS39)。そして、上記の一連の処理を要素の数だけ
繰り返して行い(ステップS40、S41)、一致度を
伴う合成処理を終了する。なお、前述の積演算や後述す
る和演算について考えると、これらはそれぞれ一致度の
しきい値がそれぞれ100%、非ゼロという特別な一致
度を持つものであるといえる。
【0057】次に、要求に「…すべての駆動方式」と記
述してあれば、シソーラス和処理を行う。具体的には図
9に示したようにすべての駆動方式を列挙する処理が行
われ、より詳細には図15に示すフローチャートに従っ
て処理が行われる。なお、この和処理と前述したシソー
ラス積(図13)との相違は、共通ラベルを持たないも
のに対しても中間結果に追加することで、すべての要素
を列挙することである。すなわち、検索された2つのシ
ソーラス(入力シソーラス1と入力シソーラス2とす
る)を入力し、それぞれの入力シソーラスのトップノー
ドの名前「Th1TopNode」および「Th2TopNode」を抽出す
る(ステップS51、S52)。そして、合成される新
たなシソーラスのトップノードとなる仮想ページComVPa
geを生成し(ステップS53)、このページの名前とし
て、抽出した両方のトップノードの名前をORで連結し
た「Th1TopNode OR Th2TopNode」を与える(ステップS
54)。図9に示した例では、仮想ページComVPageの名
前として「LCD.a-sha.co.jp OR 液晶モニタ.b-inc.c
o.jp」が与えられる。
【0058】次いで、それぞれの入力シソーラスの下位
ノードの要素を「Th1LowerNodeList」および「Th2Lower
NodeList」とし(ステップS55、S56)、それぞれ
の入力シソーラスの下位ノードの要素同士を順次比較す
る(ステップS57、S58)。シソーラス和は関係す
るノードに含まれるリンクを残すという操作であるの
で、図9に示した例では、「TFT」、「DSTN」、
「XLCD」、「ADSTN」という部分ラベルがそれ
ぞれ残される。具体的には、共通部分ラベルを持つもの
については、下位ノードとしての合成名「Th1LowerNode
List[i] OR Th2LowerNodeList[j]」を生成し(ステップ
S59)、各入力シソーラスで共通していない部分ラベ
ルをもつものについては、下位ノードとしての合成名
「Th1LowerNodeList[i]」および「Th2LowerNodeList
[j]」を生成する(ステップS60、S61)。そし
て、得られた合成名を順次ORListという中間結果
に追加していき、すべての要素について比較を繰り返し
行う(ステップS62)。
【0059】次いで、こうして関係ノードのリストOR
Listが得られると、これらのそれぞれの要素に対し
て次のような処理を行う。まず、仮想ページとして合成
下位ノードnを生成し、「lowerVPage[n]」に格納し
(ステップS63、S64)、そのページの名前として
「ORList[n]」を設定する(ステップS65)。そし
て、合成シソーラストップページComVPageにリンクLn
[n]を追加し(ステップS66)、このリンク先に「ORL
ist[n]」を追加し(ステップS67)、さらに、「Lowe
rVPage[n]」の内容として「ORList[n]」の内容が含む原
料ページへのリンクを設定する(ステップS68)。上
記の一連の処理を要素の数だけ繰り返して行い(ステッ
プS69、S70)、シソーラス和に関する合成処理を
終了する。
【0060】次に、要求に応じて、前記のシソーラス積
の結果と「入力方式」とによるシソーラス直積を生成す
る処理を行う。具体的には、図10に示したように「駆
動方式」と「入力方式」という2つの観点をあわせて概
観できるシソーラスを合成する処理を行い、より詳細に
は、図16に示すフローチャートに従って処理が行われ
る。このシソーラス直積は、シソーラス積やシソーラス
和と違って、単純な木を生成するのではなく、与えられ
た2つの属性のいわばマトリックスを構成するため、す
べての組み合わせを生成する点である。組み合わせを生
成するために、下位の仮想ページではANDを行う。な
お、この例では一方の入力がすでに合成ページであるた
め、作られる仮想ページの名前も「液晶ディスプレイ.c
-mag.co.jp×(LCD.a-sha.co.jp AND液晶モニタ.b-i
nc.co.jp)」のように組み合わせによって構成される。
【0061】すなわち、検索された2つのシソーラス
(入力シソーラス1と入力シソーラス2とする)を入力
し、それぞれの入力シソーラスのトップノードの名前
「Th1TopNode」および「Th2TopNode」を抽出する(ステ
ップS71、S72)。そして、合成される新たなシソ
ーラスのトップノードとなる仮想ページComVPageを生成
し(ステップS73)、このページの名前として、抽出
した両方のトップノードの名前を”×”で連結した「Th
1TopNode × Th2TopNode」を与える(ステップS7
4)。
【0062】次いで、それぞれの入力シソーラスの下位
ノードの要素を「Th1LowerNodeList」および「Th2Lower
NodeList」とし(ステップS75、S76)、それぞれ
の入力シソーラスの下位ノードの要素が最下位のノード
であるかを順次検査し、最下位でないノードの場合には
当該ノードのすべての組合せで新たなノードを生成する
(ステップS77〜S85)。図10に示した例では、
最下位でないノードについては、入力信号の「VGA入
力」、「RGB入力」と駆動方式の「TFT」、「DS
TN」とのすべての組合せによる新たな下位ノードを合
成し、最下位のノードについては、入力シソーラスに共
通して含まれていたノード(リーフ)を新たなノードと
する。
【0063】すなわち、仮想ページとして合成下位ノー
ドを生成して、「lowerVPage」に格納し(ステップS7
8)、合成シソーラストップページComVPageにリンクL
nを追加する(ステップS79)。そして、入力シソー
ラスの下位ノードの要素が当該入力シソーラスにおいて
最下位のノードかを判断し(ステップS80)、最下位
ノードでない場合には、当該下位ノードの要素「Th1Low
erNodeList[i]」と「Th2LowerNodeList[j]」の直積を再
帰呼び出しにより合成し(ステップS81)、その結果
をリンクLnの先に設定して、当該結果の名前をLowerV
Pageに設定する(ステップS82)。一方、最下位ノー
ドの場合には、「Th1LowerNodeList[i] AND Th2LowerNo
deList[j]」の名前をLowerVPageに設定し(ステップS
83)、当該下位ノードの要素「Th1LowerNodeList
[i]」と「Th2LowerNodeList[j]」との共通して含まれる
ノードデータをリンクLnの先に設定する。
【0064】次に、要求に応じて、シソーラス縮退が行
われる。この縮退の基本演算はシソーラス転置であり、
転置演算の結果をシソーラス和演算することにより実行
される。シソーラスの分類基準として、上下の関係がユ
ーザの目的にそぐわないことはしばしばある。例えばユ
ーザは「液晶の駆動方式を会社別に見直したい」「TF
T方式やDSTN方式を含む概念を会社別に細分類した
い」といった要求を入力した場合を考える。後者の問い
合わせを検索要求として分解することにより、図5及び
図6に示すシソーラスを、図11に示したように共通の
上位関係でマージしたとき、「TFT方式」と「DST
N方式」を同時に含む部分シソーラスとしてT2、T3
が得られ、会社別の分類としてその上位のT1が得られ
たとする。このシソーラス全体は、会社別の分類が最上
位にあり、最下位に駆動方式別の分類があるが、上位下
位関係を判断するとこのままでは要求の仕様を満たして
いないので、ここでシソーラス転置を適用する。
【0065】転置演算処理は図17に示すフローチャー
トに従って行われ、それぞれの部分シソーラス(T1
(入力シソーラス1)、T2(入力シソーラス2))毎に行わ
れる。まず、それぞれの入力シソーラスのトップノード
の名前「Th1TopNode」および「Th2TopNode」を抽出し
(ステップS91、S92)、合成される新たなシソー
ラスのトップノードとなる仮想ページComVPageを生成し
(ステップS93)、このページの名前として、抽出し
た両方のトップノードの名前を<>で連結した「Th1Top
Node <> Th2TopNode」を与える(ステップS94)。図
11に示した例では、「各社製品.dnet.ne.jp <> LCD.d
net.ne.jp 」という名前を与える。
【0066】次いで、それぞれの入力シソーラスの下位
ノードの要素を「Th1LowerNodeList」および「Th2Lower
NodeList」とし(ステップS95、S96)、入力シソ
ーラスT2の仮想ページとして合成中位ノードnを生成
し(ステップS97)、入力シソーラスT1の仮想ペー
ジとして合成下位ノードmを生成し(ステップS9
8)、合成中位ノードnを「MidVPage[n]」に格納し
(ステップS99)、そのページの名前として「Th2Low
erNode[n]」を設定する(ステップS100)。すなわ
ち、T2の下位ノード群であるTh2LowerNode[n]を、そ
れぞれComVPageからリンクされるノードMidVPage[n]の
名前として与える。
【0067】次いで、T1の下位ノード群であるTh1Low
erNode[m]が子孫(T2はT1の直接の子供でなくても
よい)としてT2すなわちTh2TopNodeを持つかを判断し
(ステップS101)、持つ場合は次の一連の処理を行
う。すなわち、合成下位ノードmを「LowerVPage[m]」
に格納し(ステップS102)、そのページの名前とし
て「Th1LowerNode[m]」を設定し(ステップS10
3)、「MidVPage[n]」の内容として「LowerVPage[m]」
へのリンクを設定した上で(ステップS104)、「Lo
werVPage[m]」の内容として「Th2LowerNodeList[n]」が
指す内容へのリンクを設定する(ステップS105)。
そして、上記の処理をそれぞれの要素数m、nに関して
繰り返して行い(ステップS106〜S109)、図1
1に示したような転置シソーラスT4を得る。
【0068】そして、上記と同様にして、T3に関して
シソーラス転置T5(=T1<>T3)を計算することが
でき、最後に、前述の方法でT4とT5のシソーラス和
T6(=T4 OR T5)が計算でき、これにより、
元の要求を満たすような駆動方式をさらに会社別で分類
したシソーラスが合成できる。すなわち、結果として
「LCD」などの途中のリンクは除かれるので、シソー
ラスを縮退しているといえる。
【0069】なお、上記したシソーラスの合成に際し
て、実データまで含めて一度に静的に合成する方法と、
検索と同様に部分シソーラスへのポインタのみ保持し、
実際のアプリケーション7における使用の際に実データ
を動的に結合する方法が考えられる。どちらの方法を選
ぶかは、シソーラス自体のサイズやネットワーク速度、
保守性、結合に要する手間などの要因に影響される。上
記した例では、分散的な効用がより出しやすいため、動
的な結合を用いており、シソーラス保持部34にいった
ん合成されたシソーラスの情報を保持している。このよ
うに保持すべき情報としては、検索結果である部分シソ
ーラスへのポインタ(URL)と、合成式(シソーラス
和、シソーラス直積などの基本操作の組み合わせ)のみ
を保持すればよいため、非常にコンパクトなものとな
る。また、こうしておけば実データの結合の際に例えば
仕様変更などにより実データが変化していても、最新の
情報が結合されるので保守性が非常に高い。
【0070】そして、シソーラス保持部34に保持され
た合成シソーラスは、外部アプリケーション7から要求
があると、実データと結合される。実データとの結合
は、シソーラス保持部34に保持される部分シソーラス
の名前に基づき特定された外部シソーラス2に対してネ
ットワーク1経由で行われ、要求を受けた外部シソーラ
スでは、シソーラス仕様DB部23にて要求された仕様
との整合性をチェックする。実際には、指定されたUR
Lが存在するか否かで単純なチェックが可能である。そ
して、実データをシソーラスDB部21から取り出して
要求元へ送る。前述の例においては、シソーラスの1ノ
ードが1つのHTMLファイルとして記述されているの
で、必要なファイルをhttp経由で送出すればよい。
さらに、生成された新たな合成シソーラスは、当然なが
ら仕様を公開することで再帰的に外部シソーラスとして
ネットワーク上で利用可能になり、これにより、シソー
ラスの再利用性が飛躍的に向上する。
【0071】
【発明の効果】以上説明したように、本発明によれば、
シソーラスの構築に際して従来では困難であった、目的
に応じたシソーラスを容易に得ることができる。具体的
には、シソーラスの合成に関する基本的な操作を定義す
ることにより、検索によって或いはユーザが入力しシソ
ーラスから目的にそぐう新たなシソーラスを合成するこ
とができ、さらには、合成した新たなシソーラスから実
際の使用に際し実データを結合することにより、保守性
を向上させることができる。
【図面の簡単な説明】
【図1】 シソーラスの構造を説明する概念図である。
【図2】 本発明の一実施形態に係るシソーラス検索合
成システムの構成図である。
【図3】 シソーラスの具体的な一例を示す図である。
【図4】 要求の解析結果の一例を説明する図である。
【図5】 入力シソーラスの具体的な一例を示す図であ
る。
【図6】 入力シソーラスの具体的な一例を示す図であ
る。
【図7】 入力シソーラスの具体的な一例を示す図であ
る。
【図8】 シソーラス積の結果の一例を示す図である。
【図9】 シソーラス和の結果の一例を示す図である。
【図10】 シソーラス直積の結果の一例を示す図であ
る。
【図11】 シソーラス縮退の結果の一例を示す図であ
る。
【図12】 シソーラス挿入の結果の一例を示す図であ
る。
【図13】 シソーラス積処理の手順の一例を示すフロ
ーチャートである。
【図14】 シソーラス演算処理の手順の一例を示すフ
ローチャートである。
【図15】 シソーラス和処理の手順の一例を示すフロ
ーチャートである。
【図16】 シソーラス直積処理の手順の一例を示すフ
ローチャートである。
【図17】 シソーラス転置処理の手順の一例を示すフ
ローチャートである。
【符号の説明】
1・・・ネットワーク、 2・・・外部シソーラス、3
・・・シソーラス検索合成装置、 4・・・シソーラス
サーチサーバ、5・・・入力部、 6・・・出力部、
21・・・シソーラスDB部、22・・・シソーラス構
造抽出部、 23・・・シソーラス仕様DB部、24・
・・シソーラス開示部、 31・・・問い合せ処理部、
32・・・シソーラス検索部、 33・・・シソーラス
合成部、34・・・シソーラス保持部、 35・・・実
データ結合部、

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 概念を付したノードと該ノードの下位に
    関係するノードへのアークとを有したページを単位とし
    て、複数のノードを上下関係で関連付けて構成され、各
    ノードには固有の識別子が付され、各アークには下位ノ
    ードの識別子が対応付けられているシソーラスを保持す
    るメモリと、 合成すべきシソーラスを定義する要求を受け付ける入力
    手段と、 前記要求に対応した識別子に合致するページを前記メモ
    リから検索する検索手段と、 検索された複数のページに対して前記要求に対応する演
    算処理を行って新たな識別子を付したノードを含む新た
    なページを合成する合成手段と、を備え、 前記合成手段は、検索された各ページのアーク識別子に
    対応する下位ノードの概念に対して前記演算処理を行っ
    て前記新たなページのアークとして新たな識別子を付し
    て生成し、更に、前記検索された各ページの下位ノード
    を有するページを前記メモリから読み出して、当該ペー
    ジに対して前記演算処理を適用して第2のページを生成
    して、該第2のページを前記新たなページのアークに対
    応付ける処理を行って、前記新たなページを最上位ノー
    ドとした新たなシソーラスを生成することを特徴とする
    シソーラス検索合成システム。
  2. 【請求項2】 概念を付したノードと該ノードの下位に
    関係するノードへのアークとを有したページを単位とし
    て、複数のノードを上下関係で関連付けて構成され、各
    ノードには固有の識別子が付され、各アークには下位ノ
    ードの識別子が対応付けられているシソーラスを保持す
    るメモリと、 該メモリから読み出され、合成処理がなされる複数のペ
    ージを受け付けるシソーラス入力手段と、 合成すべきシソーラスを定義する要求を受け付ける要求
    入力手段と、 入力された複数のページに対して前記要求に対応する演
    算処理を行って新たな識別子を付したノードを含むペー
    ジを合成する合成手段と、を備え、 前記合成手段は、入力された各ページのアーク識別子に
    対応する下位ノードの概念に対して前記演算処理を行っ
    て前記新たなページのアークとして新たな識別子を付し
    て生成し、更に、前記入力された各ページの下位ノード
    を有するページを前記メモリから読み出して、当該ペー
    ジに対して前記演算処理を適用して第2のページを生成
    して、該第2のページを前記新たなページのアークに対
    応付ける処理を行って、前記新たなページを最上位ノー
    ドとした新たなシソーラスを生成することを特徴とする
    シソーラス合成システム。
  3. 【請求項3】 請求項2に記載のシソーラス合成システ
    ムにおいて、 前記演算処理は、前記入力された複数のページ間におい
    てアーク識別子に対応する下位ノードの概念の一致を検
    出し、当該一致した概念のノードを有する第2のページ
    を生成し、該第2のページを前記新たなページのアーク
    に関係付けることを特徴とするシソーラス合成システ
    ム。
  4. 【請求項4】 請求項2に記載のシソーラス合成システ
    ムにおいて、 前記演算処理は、前記入力された複数のページ間におい
    てアーク識別子に対応する下位ノードの概念の一致を検
    出し、予め設定された所定の一致度以上の概念のノード
    を有する第2のページを生成し、該第2のページを前記
    新たなページのアークに関係付けることを特徴とするシ
    ソーラス合成システム。
  5. 【請求項5】 請求項2に記載のシソーラス合成システ
    ムにおいて、 前記演算処理は、前記入力された複数のページのアーク
    の組合せにより前記新たなページのアークを新たな識別
    子を付して生成し、これら新たに生成されたアークに対
    して、組合せ処理された元のアークに対応する下位ノー
    ドに基づいて生成される第2のページを関連付け、更に
    組合わせ処理された元のノードの下位ノード間で共通す
    る概念のノードを第2のページのアークに関係付けるこ
    とを特徴とするシソーラス合成システム。
  6. 【請求項6】 請求項2に記載のシソーラス合成システ
    ムにおいて、 前記演算処理は、前記入力された複数のページ間におい
    て、アーク識別子に対応する下位ノードの概念を調べ、
    少なくとも一つの下位ノードに含まれる概念のノードを
    有する第2のページを生成し、該第2のページを前記新
    たなページのアークに関連付けることを特徴とするシソ
    ーラス合成システム。
  7. 【請求項7】 概念を付したノードと該ノードの下位に
    関係するノードへのアークとを有したページを単位とし
    て、複数のノードを上下関係で関連付けて構成され、各
    ノードには固有の識別子が付され、各アークには下位ノ
    ードの識別子が含まれているシソーラスを保持するメモ
    リと、 着目する概念が付された着目ノードの指定を受け付ける
    入力手段と、 着目ノードを最上位として、着目ノードの下位に関連付
    けられていたノードを当該着目ノードに関係付け、当該
    ノードに着目ノードの上位に関連付けられていたノード
    を関係付ける演算処理を行って新たなシソーラスを生成
    する生成手段と、 を備えたことを特徴とするシソーラス変換システム。
  8. 【請求項8】 概念を付したノードと該ノードの下位に
    関係するノードへのアークとを有したページを単位とし
    て、複数のノードを上下関係で関連付けて構成され、各
    ノードには固有の識別子が付され、各アークには下位ノ
    ードの識別子が含まれているシソーラスを保持する複数
    のシソーラス管理装置にネットワークを介してシソーラ
    ス検索合成装置を接続し、 前記シソーラス検索合成装置は、合成すべきシソーラス
    を定義する要求を受け付ける入力手段と、前記要求に対
    応した識別子に合致するページを前記シソーラス管理装
    置から検索する検索手段と、検索された複数のページを
    前記要求に対応する演算処理を行って新たな識別子を付
    したノードを含む新たなページへ合成する合成手段と、
    を備え、 前記合成手段は、検索された各ページのアーク識別子に
    対応する下位ノードの概念に対して前記演算処理を行っ
    て前記新たなページのアークとして新たな識別子を付し
    て生成し、更に、前記検索された各ページの下位ノード
    を有するページを前記シソーラス管理装置から読み出し
    て、当該ページに対して前記演算処理を適用して第2の
    ページを生成して、該第2のページを前記新たなページ
    のアークに対応付ける処理を行って、前記新たなページ
    を最上位ノードとした新たなシソーラスを生成すること
    を特徴とするシソーラス検索合成システム。
JP33348997A 1997-11-18 1997-11-18 シソーラス検索合成システム Expired - Fee Related JP3166689B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP33348997A JP3166689B2 (ja) 1997-11-18 1997-11-18 シソーラス検索合成システム
US09/169,002 US6282509B1 (en) 1997-11-18 1998-10-09 Thesaurus retrieval and synthesis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33348997A JP3166689B2 (ja) 1997-11-18 1997-11-18 シソーラス検索合成システム

Publications (2)

Publication Number Publication Date
JPH11149484A true JPH11149484A (ja) 1999-06-02
JP3166689B2 JP3166689B2 (ja) 2001-05-14

Family

ID=18266639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33348997A Expired - Fee Related JP3166689B2 (ja) 1997-11-18 1997-11-18 シソーラス検索合成システム

Country Status (2)

Country Link
US (1) US6282509B1 (ja)
JP (1) JP3166689B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011095909A (ja) * 2009-10-28 2011-05-12 Saga Univ ファイル管理装置、その方法、及びプログラム
JP5246415B2 (ja) * 2007-01-12 2013-07-24 日本電気株式会社 プロトコル翻訳システム、プロトコル翻訳方法およびプロトコル翻訳プログラム
JP2015125584A (ja) * 2013-12-26 2015-07-06 Kddi株式会社 マイニング分析装置、方法及びプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
US7246110B1 (en) * 2000-05-25 2007-07-17 Cnet Networks, Inc. Product feature and relation comparison system
US8484177B2 (en) * 2001-03-21 2013-07-09 Eugene M. Lee Apparatus for and method of searching and organizing intellectual property information utilizing a field-of-search
KR20010107810A (ko) * 2001-10-12 2001-12-07 주식회사 케이랩 웹 검색시스템 및 그 방법
US20030225787A1 (en) * 2002-03-12 2003-12-04 Songqiao Liu System and method for storing and retrieving thesaurus data
US7624117B2 (en) * 2006-06-12 2009-11-24 Sap Ag Complex data assembly identifier thesaurus
US8270612B2 (en) * 2006-12-18 2012-09-18 Sap Ag Mapping compound keys
US8788523B2 (en) * 2008-01-15 2014-07-22 Thomson Reuters Global Resources Systems, methods and software for processing phrases and clauses in legal documents
US9122673B2 (en) 2012-03-07 2015-09-01 International Business Machines Corporation Domain specific natural language normalization

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
US4972328A (en) * 1988-12-16 1990-11-20 Bull Hn Information Systems Inc. Interactive knowledge base end user interface driven maintenance and acquisition system
JPH03276369A (ja) 1990-03-27 1991-12-06 Shimadzu Corp シソーラス自動再編成装置
JPH0439769A (ja) 1990-06-06 1992-02-10 Nippon Telegr & Teleph Corp <Ntt> シソーラス生成装置
JPH04237332A (ja) 1991-01-21 1992-08-25 Nippon Telegr & Teleph Corp <Ntt> 知識構造作成方法
US5267156A (en) * 1991-12-05 1993-11-30 International Business Machines Corporation Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
JPH06176081A (ja) * 1992-12-02 1994-06-24 Hitachi Ltd 階層構造ブラウジング方法およびその装置
JPH0816620A (ja) 1994-04-28 1996-01-19 Fujitsu Ltd データ分類装置/方法、データ分類木生成装置/方法、派生語抽出装置/方法、シソーラス構築装置/方法、データ処理システム
US5644686A (en) * 1994-04-29 1997-07-01 International Business Machines Corporation Expert system and method employing hierarchical knowledge base, and interactive multimedia/hypermedia applications
JP3500698B2 (ja) 1994-05-25 2004-02-23 富士ゼロックス株式会社 キーワード抽出装置及びキーワード抽出方法
JP3579945B2 (ja) 1995-02-28 2004-10-20 富士ゼロックス株式会社 階層項目検索装置および階層項目検索方法
JPH096789A (ja) 1995-06-22 1997-01-10 Matsushita Electric Ind Co Ltd 分野別シソーラス生成装置
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5246415B2 (ja) * 2007-01-12 2013-07-24 日本電気株式会社 プロトコル翻訳システム、プロトコル翻訳方法およびプロトコル翻訳プログラム
JP2011095909A (ja) * 2009-10-28 2011-05-12 Saga Univ ファイル管理装置、その方法、及びプログラム
JP2015125584A (ja) * 2013-12-26 2015-07-06 Kddi株式会社 マイニング分析装置、方法及びプログラム

Also Published As

Publication number Publication date
US6282509B1 (en) 2001-08-28
JP3166689B2 (ja) 2001-05-14

Similar Documents

Publication Publication Date Title
JP4990431B2 (ja) 階層状に複式化されたドキュメントからの情報検索
US7236972B2 (en) Identifier vocabulary data access method and system
US6279005B1 (en) Method and apparatus for generating paths in an open hierarchical data structure
US6094649A (en) Keyword searches of structured databases
US7788287B2 (en) System and method for storing and accessing data in an interlocking trees datastore
EP0610760B1 (en) Document detection system with improved document detection efficiency
US7523095B2 (en) System and method for generating refinement categories for a set of search results
US20020038319A1 (en) Apparatus converting a structured document having a hierarchy
JP3166689B2 (ja) シソーラス検索合成システム
US7024405B2 (en) Method and apparatus for improved internet searching
Terveen et al. Finding and visualizing inter-site clan graphs
JP2008102736A (ja) 検索装置および検索方法
Haav An application of inductive concept analysis to construction of domain-specific ontologies
Yu et al. Metadata management system: design and implementation
JP3842576B2 (ja) 構造化文書編集方法及び構造化文書編集システム
JPH0981582A (ja) 値を基本としたデータ管理装置及びデータ管理方法
JP2002202973A (ja) 構造化文書管理装置
Chen et al. On visualization of cocitation networks
JP3465615B2 (ja) 検索方法ならびに装置及び同方法がプログラムされ記録された記録媒体
Greenhill et al. Noetica: A tool for semantic data modelling
JP2001331490A (ja) 構造化文書格納装置、構造化文書検索装置、構造化文書格納検索装置及びプログラム並びにプログラム記録媒体
Zarri et al. CONCERTO, an environment for the “intelligent’indexing, querying and retrieval of digital documents
Börner et al. Replicable Science of Science Studies
Sierra et al. Tagging learning objects with evolving metadata schemas
Vidra et al. Next Step in Online Querying and Visualization of Word-Formation Networks

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080309

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090309

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100309

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees