JP2001521225A - コンピュータシソーラスマネージャ - Google Patents

コンピュータシソーラスマネージャ

Info

Publication number
JP2001521225A
JP2001521225A JP2000517360A JP2000517360A JP2001521225A JP 2001521225 A JP2001521225 A JP 2001521225A JP 2000517360 A JP2000517360 A JP 2000517360A JP 2000517360 A JP2000517360 A JP 2000517360A JP 2001521225 A JP2001521225 A JP 2001521225A
Authority
JP
Japan
Prior art keywords
thesaurus
items
term
subset
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000517360A
Other languages
English (en)
Inventor
サミル、イブラヒム、アベッド
コイラ、ベル、バリー
ポール、ナサン、ベネット
デイビッド、グレゴリー、ガドボワ
キース、マイケル、グールスベイ
アルバータ、スポット、マッケイ
ケネス、エス.マリ
カレン、エリザベス、ピットマン
ニコラス、ポール、シーゲル
ルービン、クリフトン、トンプソン、ジュニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glaxo Group Ltd
Original Assignee
Glaxo Group Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glaxo Group Ltd filed Critical Glaxo Group Ltd
Publication of JP2001521225A publication Critical patent/JP2001521225A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 コンピュータ化されたシソーラスマネージャ。 【解決手段】本発明による複数の個別のシソーラスのサブセットからの情報に統合的にアクセスするためのシステムは、シソーラス照会を受け入れる入力サブシステム;リクエストに対応する項目を複数のサブセットから、これら複数のサブセットがあたかも単一の一体化されたシソーラスかのように収集するための処理サブシステム;および検索された項目を表示するサブシステムから構成される。ユーザは、HTMLユーザインタフェースを用いて、ウエブブラウザを介してシステムにアクセスする。検索された項目が表示されるが、オプションとして、関連する用語、あるいは、それら項目がそこから検索されたシソーラスサブセットの詳細も表示される。複数のシソーラスのサブセットが、単一のシソーラスとして、実際に、あるいは、仮想的に統合化される。複数のシソーラスのサブセットは、概念を用いてシソーラス内の用語の間のリレーションシップを確立することで、単一の一体化されたシソーラスに統合化される。シソーラスのサブセットに格納されている項目あるいは用語の相関(重複)が、特定のシソーラスのサブセットあるいは複数のサブセット内に、共通のあるいは高度に類似する意味を持つ項目が複数存在することを排除するために調べられる。加えて、シソーラスの完全性を維持するために、特定のシソーラスのサブセット内あるいは複数のシソーラスのサブセットの間の用語のリレーションに関する制約が適用される。

Description

【発明の詳細な説明】
【0001】
【関連する特許出願】
本発明は、1997年10月22日付けで出願された暫定の合衆国特許出願第60/063,1
36号の利益を請求するものである。
【0002】
【発明の属する技術分野】
本発明は、コンピュータ化された情報の管理、より詳細には、シソーラスの複
数のサブセットを統合的に管理するシステムおよび方法に関する。
【0003】
【従来の技術】
シソーラスは、特定の分野に関する情報の収集である。最も一般的な用途にお
いては、“シソーラス(thesaurus)”は、言葉(用語)をそれらが持つ概念に 従って編成し、類義語や階層リレーションシップなどを提供するために用いられ
る。
【0004】 多国籍企業などの多くの大企業においては、組織内で共通の言語(用語)を用
いる助けとするためにシソーラスが頻繁に用いられている。しばしば、これらシ
ソーラスは、用語集のように、頭字語(略字)に対する説明を与えたり、組織内
で用いられている技術用語の定義を与えたりする。
【0005】 組織の規模の巨大化および組織が扱う対象の複雑化に伴って、シソーラスを管
理するツールに対する必要性が増大している。閾値サイズを超える組織では、単
一の非常に大きなシソーラスを管理することは、単一のシソーラスでは組織内の
特定のグループと関係する用語は相対的に少なくなるために、実用的でなくなる
。例えば、ある組織の財務部門の管理者にとっては、その組織の研究開発チーム
によって日常的に用いられている用語はあまり必要でない。
【0006】 従って、大きな組織では、シソーラスは、全体レベルではなく、グループ毎に
作成される傾向にある。このやり方では、各グループに対してより重要なシソー
ラスを提供することができるが、ただし、ある用語が組織内の複数のグループと
関係する場合は問題が発生する。例えば、新製品に用いられることになっている
要素を表現する用語が、組織の財務部門と研究開発部門の両方に関係する場合が
ある。シソーラスを用いるグループの数の増加とともに、重複する項目の数も増
加するために、企業全体レベルでのシソーラスの管理は、すぐに、大変な作業と
なる。例えば、幾千ものサブグループを抱える多国籍企業が存在し、幾百ものサ
ブグループが、各グループのシソーラスに、同一の用語を収録するような状況を
想定する。この場合、その用語に対して新たな意味が発生したり、他の用語との
間に新たなリレーションシップが展開する度に、その新たな情報をなんらかの方
法で各グループのシソーラスに伝えることが必要となる。
【0007】 幾人かの論者によって自動化されたシソーラスの管理について言及されている
。例えば、Madel,Carol A.,“Multiple Thesauri in Online Library Bibliogra
phic Systems",United State Library of Congress 1987; Gilers-Peters,A.,“
Experiments in the Mechanical Construction of Cross-Database Thesuri",Pr
oceedings of the 17th International Online Information Meeting,London,De
cember 7-9,1993,Raitt,D.I. and Jeabes,B.eds.,Learned Information (Europe
) Ltd,1993; Silvester,June P. and Klingbiel,Paul H.,“An Operational Sys
tem for Subject Switching Between Controlled Vocabularies (Development
of the NASA Lexical Dictionary)",Information Processing & Magagement (IS
SN 0306-4573),v.29.p47-59 January/February 1996; Roulin,Corentin,“Towar
ds the European Education Metathesurus",Commision of the European Commun
ities,Brussels 1990などを参照されたい。
【0008】 実際、シソーラスの確立および開発の問題を特別に扱う国際標準も公表されて
いる。例えば、International Organization for Standardization(国際標準化
機構),Ref.No.ISO 2788-1986(E)を参照されたい。
【0009】 シソーラスを管理するための様々な市販の製品も開発されている。IBMの(商 標)Thesaurus Adminstrator/2およびThesaurus End User Toolkit/2は、専門用
語のシソーラスを作成、使用、および管理するためのコンピュータ化されたシス
テムを提供する。このタイプの製品は、通常、用語間の階層リレーションシップ
、例えば、広義の用語(broader term)、狭義の用語(narrower term)、部分 (part)、インスタンス(instance)などのリレーションシップを管理する。こ
れら、リレーションシップは、しばしば、ユーザにとって便利であり、例えば、
ユーザに、“house(家)”は、“bulding(建物)”の狭義の用語(narrower t
erm)であることや、“lens(レンズ)”は、“camera(カメラ)”の部分(par
t)であることなどを伝える。他にも、Project Management,Inc.,Bethesda,MDか
ら市販されているLexico/2TM; MultiSystems,Miami,FLから市販されているMu
ltiTes; Lui-Palmer,Los Angeles,CAから市販されているTCS [Thesaurus Const
ruction System]; Comstow Information Services.,Harvard,MAから市販されて
いるBiblio Tech(商標)PROなどの他、多数の類似の製品がある。
【0010】
【発明が解決しようとする課題】
これら従来のシステムによって十分に扱われていない一つの問題は、シソーラ
スの複数のサブセットを、統合化されたやり方で、つまり、そこから情報が得ら
れるサブセットが本質的にユーザに透過的となるようなやり方で、いかにして効
率的に管理するかの問題である。
【0011】
【課題を解決するための手段】
本発明によるシソーラスの複数の別個のサブセットからの情報に統合的にアク
セスするためのシステムは、シソーラス(シソーラス)リクエストを受け入れる
入力サブシステム;前記リクエストに対応する項目をシソーラスのサブセットか
ら集めるため、および前記シソーラスの複数のサブセットを単一の統合されたシ
ソーラスとして扱うための処理サブシステム;および検索された項目を表示する
ための出力サブシステムから構成される。
【0012】 本発明のもう一面においては、前記システムは、入力として、シソーラスリク
エストを介してリクエストされた変更および修正に関する情報を受け入れ、それ
ら変更を、シソーラスの複数のサブセット内で実行する。本発明のさらにもう一
面においては、変更に対するリクエストは、単一の統合化されたリクエストとし
て実現され、シソーラスの複数のサブセットに対する対応する変更の遂行は、ユ
ーザからは単一の統合された動作のように見える。
【0013】 さらに、本発明によると、前記処理システムは、概念を用いて前記シソーラス
の複数のサブセット内の用語間のリレーションシップを確立することで、前記シ
ソーラスの複数のサブセットを単一の一体化されたシソーラスとして統合化する
。さらに、前記処理サブシステムは、シソーラスの複数のサブシステムに、単一
の一体化されたシソーラスとして統合化が達成されるようなやり方でアドレスす
る。一つの実施例においては、この統合化は、シソーラスの複数のサブセットを
実際に併合することなく遂行される。別の実施例においては、処理サブシステム
は、シソーラスの複数のサブセットを併合することで単一の一体化されたシソー
ラスを形成する。
【0014】 さらに、前記処理システムは、アクティブなシソーラスを指定し、あるいは入
力としてその指定を受信し、指定された場合、選択された項目をアクティブなシ
ソーラスに限定して収集する。一つの実施例においては、前記出力サブシステム
は、選択された項目を、選択された各項目がどのサブセットから検索されたかに
無関係に一括してまとめて表示する。別の実施例においては、前記出力サブシス
テムは、選択された項目と共に選択された項目が検索されたサブセットの指標も
表示する。
【0015】 発明のもう一面においては、前記処理システムは、さらに、シソーラスの複数
のサブセット間の同等性(重複/相関)を調べるための相関器を備える。相関器
は、用語の意味を、それとの相関(重複)が調べられている用語と関係がある他
の用語も参照しながら決定する。
【0016】 さらに、本発明によると、更新処理システムは、完全性(インテグリィティ)
制約を適用する。この完全性制約は、シソーラスの用語間のリレーションに関す
る制約を定義し、更新処理システムに結合された入力サブシステムは、この完全
性制約に従う。
【0017】 一つの実施例においては、上述の完全性制約には:そのリレーションシップが
一対一であるか;そのリレーションシップが一対複数であるか;そのリレーショ
ンシップが複数対一であるか;そのリレーションシップがトランジティブ(tran
sitive)であるか;そのリレーションシップが対称的であるか;そのリレーショ
ンシップが再帰的(reflexive)であるか;そのリレーションシップが非再帰的 (irreflexive)であるか;そのリレーションシップが対応する推奨語を持つ項 目間のものであるか、を指定するセットの制約の少なくとも一つが含まれる。
【0018】 本発明のさらにもう一面においては、前記サブシステムは、シソーラス情報内
の完全性制約の違反を検出する。完全性制約の違反が検出されると、これに応答
して、前記出力サブシステムは、オプションとして、以下のセットの動作、すな
わち:ユーザに違反を通知する動作;違反の修正を実行する動作;および違反に
対する対策を行なう動作、の少なくとも一つを遂行する。
【0019】 さらに、本発明によると、前記処理サブシステムは、前記入力サブシステムか
らの合図に応答して、ある概念に対して推奨語(preferred term)と慣用語(no
n-preferred term)を定義し;前記処理サブシステムは、さらに、入力サブシス
テムからの合図に応答して、推奨語と慣用語を交換(スワップ)する。前記処理
システムは、前記推奨語と代替語の交換を一つのシソーラス内で行なうことも、
複数のシソーラスのサブセットの間で行なうこともできる。前記サブシステムは
、さらに一つのシソーラス内あるいは複数のシソーラスのサブセットの間の変更
を検証する。
【0020】 本発明のもう一面においては、上述の対応する方法、データ構造、およびコン
ピュータによって読み出し可能な媒体が、様々なやり方で用いられる。明細書に
おいて説明される特徴および長所は、全て、排他的なものではなく、当業者にお
いては、図面、明細書、および特許請求の範囲から、多くの他の特徴および長所
が明らかであると考える。さらに、明細書において用いられている言葉や表現は
、主として、読み易さ、理解の容易さに主眼において選択されたものであり、本
発明の主題の範囲を制限するために選択されたものではなく、本発明の範囲は、
特許請求の範囲によって定義されるものである。
【0021】
【発明の実施の形態】
図面は、本発明の好ましい実施例をもっぱら解説の目的で示す。当業者におい
ては、以下に説明する構造および方法の代替実施例を、以下に説明する本発明の
原理から逸脱することなく、利用することを容易に理解できるものと考えられる
【0022】 図1は、本発明によるシソーラス(シソーラス)マネージャ100を示す。シ
ソーラスマネージャ100は、大きな組織で用いるためのセットの用語を企業ワ
イドに維持するためのコンピュータにて実現されるシステムの好ましい実施例を
表す。機能的あるいは地理的に大きくかけ離れたな多様な事業グループから構成
される組織では、しばしば、各事業グループが、各グループの従業員がグループ
内で用いられる標準用語を参考できるように、単一あるいは複数のシソーラスを
管理する。必然的に、各グループの間には、かなりの量のやりとりが存在し、あ
るグループの研究開発を担当する社員が、別のグループの製品のマーケッティン
グを担当する社員とやりとりすることはよくある。一例として、一つの組織内で
、研究開発、製品カタログ、マーケティング、製造、法規制、などの目的で、別
個のシソーラスが管理されることがある。さらに、組織が他によって開発された
外部のシソーラスを入手することもある。従って、これらを、多様な内部シソー
ラスシステムとして、同一のやりかたで、統合的に管理する必要がある。
【0023】 ある組織の全体としてのシソーラスは、これら特定用途の個別のシソーラスの
スーパーセットと見なされるが、特定用途の個別のシソーラスの多くが、類似あ
るいは異なる複数の用語の下で類似の複数の概念を含むことや、逆に、類似の概
念および異なる概念の両方に対して複数の類似の用語を含むことが考えられる。
シソーラスマネージャ100は、用語を、これら全ての特定用途の個別のシソー
ラスを横断して、単一のステップにて管理し、これら個別の複数のシソーラスを
、個々のシソーラス間の食違いや差が容易にわかるように、統合化されたやりか
たでチェックできるようにし、特定の概念に対して組織全体を通じて使用すべき
推奨語(preferred terms)を選択すること可能にし、様々な個別のシソーラス を、単一の一体化されたシソーラスとして管理するための単一のツールおよび権
威の源を提供する。加えて、シソーラスマネージャは、複数の異なる用語を、あ
る特定の概念と対応づけることを可能にする。例えば、組織の別個のグループ内
で用いられている異なる用語を、シソーラスマネージャを用にいて、底辺に横た
わる同一の概念にリンクすることも可能となる。これは、組織の個々の部門に対
して単一の標準語を用いることを強制することなく、組織が全体として同一の物
事を同一の言葉で言及することを可能にする。
【0024】 一つの好ましい実施例においては、図1と図2に示す様々なサブシステムが、
ソフトウエアにて一つあるいは複数の汎用コンピュータを、後に説明するように
制御することで実現される。一つの好ましい実施例においては、これらソフトウ
エアは従来のデータ格納デバイス(例えば、ディスクドライブサブシステム)に
格納され、必要となときに通常のやりかたでコンピュータのランダムアクセスメ
モリに移される。
【0025】 最上位レベルにおいては、シソーラスマネージャ100は、システムコード1
10と、知能ベース120から構成される。知能ベース120は、シソーラス情
報および底辺に横たわる概念系に対するメモリとして機能し、システムコード1
10は、シソーラス情報の更新および検索、管理およびユティリティ機能、外部
エンティティとの対話などを扱う。
【0026】 シソーラスマネージャ100とは、外部の以下の幾つかのタイプのエンティテ
ィが対話する: ・許可されたユーザ150:ワールドワイドウエブブラウザをランするネット
ワーク化されたワークステーションや他のHTMLインタフェース140へのアクセ
スを持つユーザは、シソーラスマネージャ100にアクセスすることができる。
【0027】 ・シソーラスデータファイル170:これは、シソーラスマネージャ100に
ロードすることも、シソーラスのサブセットを出力することによって作成するこ
ともできる。
【0028】 ・外部プログラム160:例えば(外部プログラム)160は、シソーラスマ
ネージャ100に接続し、シソーラス情報を取り出すことができる。
【0029】 ・最後に、シソーラスマネージャ100は、ユーザリクエストおよび動作を記
録様々な外部ログ180を維持する。
【0030】 従来のシソーラスモデルでは、リレーションシップがかなり硬直な垂直(つま
り、親と子)あるいは水平(つまり、子孫)の関係に制限されるが、これとは対
照的に、本発明のシソーラスマネージャ100は、豊富な表現力に富むセットの
リレーションをサポートし、ユーザがこれらセットのリレーションを自身の必要
に合わせてカスタム化することを可能にする。さらに、従来のシソーラスモデル
では、リレーションシップは用語間でのみ発生するが、これとは対照的に、シソ
ーラスマネージャ100は、用語を、底辺に横たわる概念と関連する辞書項目と
して維持する。これら底辺に横たわる概念は、論理概念言語にて定義あるいは表
現され、知能ベース120内に格納され、リレーションシップは、これら底辺に
横たわる概念の間で確立される。例えば、シソーラスマネージャ100を用いて
いる組織が製薬会社である場合、AGENTS-WHICH-RELIVE-PAIN(痛み−解消−薬品
)なる概念と、ORALLY-ADMINISTERED-AGENTS(経口−投薬)なる概念が存在し、
対応する辞書項目として、“analgesic(鎮痛剤)”と“tablet(錠剤)”が存 在することが考えられる。このような場合、“analgesic(鎮痛剤)”と“table
t(錠剤)”とを接続するリレーションシップは、シソーラスマネージャ100 においては、これら用語自体の間ではなく、それらの底辺に横たわる概念の間に
確立される。
【0031】 このアプローチの長所は、用語間のリレーションシップに依存する場合よりも
、概念の間でより複雑なタイプのリレーションシップをモデル化することが可能
となる。例えば、従来のシソーラスの“広義の用語(borader term)”、“狭義
の用語(narrower term)”、“関連する用語(related term)”、および“用 語 の範囲(scope of term)”なるリレーションシップの代わりに、多くの他の
概念上のリレーションシップを用いることが可能になる。例えば、上述の製薬会
社の例を用いて説明を続けると、商品名と一般名との間のリレーションシップ、
商品名と使用国の間のリレーションシップ、商品名と製品名との間のリレーショ
ンシップ、製品名と症状との間のリレーションシップなどを、容易に、実現およ
び管理することが可能になる。より具体的な例を用いると、LAMIVUDINE(商品名
)なる概念は、EPIVIR(商品名)、COMBIVIR(製品名)およびANTI-VIRAL-AGENT
(抗ウイルス剤)なる関連する概念とリンクされる。そして、これら概念をリフ
ァレンスとして利用し、用途に合わせて最も適当なものを選択することが可能と
なる。
【0032】 従来のシソーラスモデルをシソーラスマネージャ100に適合化(変更)する
ためには、“推奨語(Preferred Term)”なる概念と“慣用語(Use For)”な る従来の観念が、2つのタイプの辞書項目(lexcial entry)として扱われ、お のおの一つの概念と関連付けられる。各概念は、あるシソーラスのサブセット内
では、“推奨語”は1つしか持つことができないが、ただし、“慣用語”につい
ては複数の用語を持つことができる。好ましい実施例においては、あるシソーラ
スのサブセット内では、特定の推奨語の文字列にて特定の概念が一意に識別され
るように、“推奨語”と底辺に横たわる概念とを同等に扱うインタフェースが提
供される。“慣用語”は、シソーラスマネージャ100においては、“推奨語/
概念”と関連する単純な文字列として存在する。シソーラスマネージャ100は
、“慣用語”に加えて、新たな辞書リレーションシップを導入する能力を提供す
る。辞書リレーションシップは、文字列を記録して、シソーラスマネージャ10
0内では、ある概念を探索するために、これらの文字列が用いられる。これら探
索文字列は、“推奨語”の文字列か、“代替語(Aternate Term)の文字列(“ 慣用語”あるいはユーザによって追加された任意の他の辞書リレーションを用い
て記録された文字列)のいずれから構成される。例えば、ユーザ150は、“慣
用語”に加えて、例えば、ある概念に対する使用されなくなった用語を記録する
ための“以前の用語(Former Term)”;ある概念に対するフランス語での用語 を記録するための“フランス語(French Term)”;およびある概念に対して非 公式に用いられる用語を記録するための“俗語(Slang Term)”などの辞書リレ
ーションシップを作成および使用することもできる。
【0033】 概念間のリレーションシップの使用についてさらに説明するために、シソーラ
スのサブセット内で、リレーションシップがどのように用いられるかについて考
える。シソーラスマネージャの知能ベース121内に維持されるシソーラス情報
は、複数のユーザによって定義されるシソーラスのサブセットに分割される。複
数のサブセットが同一セットの概念の間に複数のリレーションシップを含み、各
サブセットがこれら概念間のリンクを表現するために異なるリレーションシップ
を用いることも考えられる。例えば、シソーラスマネージャの知識ベース121
の企業シソーラス用のサブセットは、“Allopurinol”と“Zyloprim”を[Gener
icName-Trademark]なるリレーションシップを用いてリンクし、製品カタログ用
のサブセットは、“Allopurinol”と“Zyloprim”を[UseFor]なるリレーショ ンシップを用いてリンクし、さらに、研究開発部門用のサブセットは、“Allopu
rinol”と“Zyloprim”を[Synonym]なるリレーションシップを用いてリンクす
ることも考えられる。
【0034】 システムコード110の構成要素 システムコード110の主な構成要素は、IO層111、検索モジュール112
、更新モジュール113、報告サブシステム114、および保守管理サブシステ
ム115である。典型的な動作においては、ユーザ150あるいは外部プログラ
ム160は、シソーラス情報に対する照会、あるいはこの更新のリクエストを、
IO層111を介して、シソーラスマネージャ110に送り、IO層111を介して
、情報あるいは更新の確認を受け取る。照会の場合は、検索モジュール112が
、シソーラス知能ベース121から、照会を満たす情報を、HTML(ハイパーテキ
ストマークアップ言語)モジュール140を介してユーザ150に、あるいはAP
I(アプリケーションプログラミングインタフェース)111.2を介して外部 プログラム160に送り返す。更新の場合は、更新モジュール113が、変更の
妥当性を検証し、シソーラス知識ベース121内のシソーラス情報を変更し、変
更の確認を、HTML(ハイパーテキストマークアップ言語)モジュール140を介
してユーザ150に、あるいはAPI(アプリケーションプログラミングインタフ ェース)111.2を介して外部プログラム160に送り返す。
【0035】 更新モジュール113 更新モジュール113は、以下のような更新機能を提供する。すなわち:(a
)シソーラスデータファイル170からシソーラス知能ベース121へのシソー
ラスデータのロード、(b)シソーラス知能ベース121内に既に存在するシソ
ーラス情報の編集、(c)シソーラス知能ベース121内のあるシソーラスのサ
ブセットから別のシソーラスのサブセットへのシソーラス情報のコピー、(d)
シソーラスのサブセットの生成、名前の変更あるいは削除、(e)シソーラスリ
レーションシップの生成、名前の変更、あるいは無効化(キリング)、および(
g)あるシソーラスのサブセット内の概念と全ての他のサブセット内の概念およ
び/あるいは一般知能ベース122内の概念との間の“相関”あるいは対応の確
立を行なう。
【0036】 シソーラスのローディング ローディングにおいては、ある適当な入力フォーマットのファイルが翻訳され
、ファイル内の新たなシソーラス情報が目標のシソーラスのサブセットに追加さ
れる。
【0037】 シソーラス情報の編集 編集動作には、新たな用語の追加、現存の用語の名前の変更、用語の削除、用
語間のリレーションシップの追加あるいは削除、およびシソーラスのサブセット
の作成、名前の変更あるいは削除が含まれる。これらの動作の全ては、一つシソ
ーラス内で、あるいは複数のシソーラスのサブセット全体に渡って、単一の統合
化された動作として遂行される。複数のシソーラスのサブセット内で遂行される
べき変更を指定する場合、ユーザにが、当然、あるサブセットにおいて特定の変
更が遂行できないことを予測することはできない。例えば、ユーザが“Canine(
犬)”なる用語を、全てのサブセットにおいて“Dog(犬)”なる名前に変更す ることを要請するものと想定する。この動作は、例えば、あるサブセットにおい
ては、名前の変更を行なうべき“Canine”と同等な用語が存在しないために失敗
し、別のサブセットにおいては、“Dog”が既に推奨語としてそのサブセット内 に存在するために失敗する。このため、更新モジュールは、要請される変更を個
別に評価し、全てが遂行できる場合は、全ての変更を遂行し、任意の変更が遂行
できない場合は、許可される変更を示し、この確認を要請する。これは、編集が
人のユーザによってインタフェースを介して行なわれる場合は可能である。
【0038】 シソーラスのサブセットのコピー 一つの好ましい実施例においては、シソーラス情報が、シソーラスのあるサブ
セットから別のサブセットにコピーされる。幾つかのパラメータによって、どの
ような情報がコピーされるべきか制御される:例えば、スタートターム(Start
Terms)、カットオフターム(Cutoff Terms)、カットオフ(Cutoff Level)な どのパラメータが用いられる。これらパラメータのいずれも供給されない場合は
、ソースシソーラスの全ての内容が目標のシソーラスにコピーされる。スタート
タームパラメータが与えられた場合は、コピーは、指定される用語から開始され
、“狭義の用語(narrower term)”の階層を下方に進む。カットオフタームパ ラメータが与えられると、“狭義の用語”の階層において指定されるより狭義の
用語のコピーは中止される。カットオフタームパラメータの代わりに、ある整数
をカットオフレベル(Cutoff Level)として指定することもできる。この場合は
、用語をコピーする動作は、それぞれ、開始用語が指定されている場合はそこか
ら、開始用語が指定されてない場合は、ソースシソーラスのサブセットの最も上
の用語から“狭義の用語”の階層を下方へと、指定された整数によって表される
階層レベルまで行なわれる。
【0039】 シソーラスのサブセットに関する動作 一つの好ましい実施例においては、新たなシソーラスのサブセットが作成され
る。作成の後、これらサブセットは空となる。シソーラスのサブセットに対する
名前および略称は、それら新たな名前あるいは略称が既に用いられてない限り変
更することができる。最後に、現存のシソーラスのサブセットが削除されるが、
シソーラス情報を含むサブセットを削除すると、そこに含まれる全てのシソーラ
ス情報は削除される。
【0040】 シソーラスリレーションに関する動作 一つの好ましい実施例においては、新たなシソーラスリレーションが作成され
る。現存のリレーションの名前は、その名前が既に用いられてない限り、変更す
ることができる。最後に、シソーラスリレーションが無効化(キル)される。あ
るシソーラスリレーションが一つあるいは複数のシソーラスのサブセット内で用
いられている場合、そのリレーションを無効化すると、そのリレーションによっ
て表される全てのシソーラス情報が削除される。
【0041】 完全性(インテグリティ)違反の修復 完全性チェッカ118は、後により詳細に説明するように、セットのアクティ
ブな完全性規則に違反するシソーラス情報を検出および修復するためのツールで
ある。いったん、違反が検出されると、更新モジュール113によって違反が修
復される。
【0042】 相関 相関器116の詳細については後に説明する。いったん、相関(重複)が見つ
かり、確認されると、更新モジュール113は、2つの相関(重複)が見つかっ
た概念を一つの概念に併合する。
【0043】 検索モジュール112 検索モジュール112は、以下の検索機能を提供する。つまり、(a)シソー
ラス知能ベース121から、新たなシソーラス情報をシソーラスデータファイル
170に供給し、(b)シソーラスの概念を任意の用語(辞書項目)あるいは用
語のサブワードから開始して探索し、(c)ある用語と関係する全てのもしくは
特定のシソーラスリレーションシップを検索し、(d)全てのシソーラスのサブ
セットを検索し、あるいは(e)全てのシソーラスリレーションシップを検索す
る。(a)、(b)および(c)の動作に対しては、検索モジュール112は、
シソーラスのアクティブなサブセットなる観念を維持する。この観念はユーザに
よって、送信されるか、照会内に指定される。これら検索動作は、シソーラスの
アクティブなサブセットの情報のみを探索する。
【0044】 報告モジュール114 報告モジュール114は、後に詳細に説明するように、ユーザの動作に関する
情報、シソーラスに関する情報、ユーザの統計に関する情報、システムに関する
情報を生成したり、保存されている情報を検索したりする。
【0045】 管理モジュール115 管理モジュール115は、シソーラス情報への変更の転写、バックアップの保
存、ローディング、ユーザ管理などの管理機能を提供する。
【0046】 IO層111 IO層111はユーザおよび外部プログラムとの相互作用(対話)を扱い、これ
は、2つの部分、すなわち、ユーザ150と外部ワールドワイドウエブブラウザ
140を介して対話するためのHTML(ハイパーテキストマークアップ言語)モジ
ュール111.1と、外部プログラム160と通信するためのAPI(アプリケー ションプログラミングインタフェース)111.2から構成される。
【0047】 MTMLモジュール111.1 HTML(ハーパーテキストマークアップ言語)モジュール111.1は、人によ
るシソーラスマネージャ100との全ての対話を扱う。標準動作においては、HT
MLモジュールは、外部ウエブブラウザ140への接続を検出し、接続が確立され
ると、ユーザと対話する目的で適当なHTMLページを作成する。こうして自動的に
生成されるHTMLページには、ユーザのタスクに適する複数のボタン、タイプイン
ボックス、およびメニューが含まれる。ユーザがリンクをクリックするか、フォ
ームを供給すると、HTMLモジュールは、これを受け取り、制御を、処理に必要な
サブシステムに渡し、その後、結果を含むHTMLページを作成し、これを外部ウエ
ブブラウザに送る。
【0048】 任意の数のユーザ150が、シソーラスマネージャ100との間にセッション
を開くことができ、HTMLサブシステム111.1は、これら接続のおのおのの状
態を、ユーザが自身の対話の結果のみを見られるように管理する。
【0049】 HTMLモジュール111.1は、シソーラスマネージャ100に対する従来のウ
エブブラウザインタフェースを提供する。一つの好ましい実施例においては、HT
MLモジュール111.1は、ユーザ150に、グラフィカルユーザインタフェー
スの形式で複数の選択を提供する。HTMLモジュールは、ユーザがシステムコード
にアクセスし、その動作を制御することを可能にするが、HTMLモジュール111
.1のインタフェース機能は、システムコード110の4つの内部サブシステム
へのアクセス動作、つまり:検索(Retrieval)、更新(Update)、報告(Repor
ting)、および管理(Maintenace)機能から構成されるものとして扱うことがで
きる。
【0050】 HTMLモジュール111.1は、標準のハイパーリンクディスプレイを提供し、
ユーザは、関連するトピックへのアクティブなリンクを提供するアンダーライン
を施された、カラー情報を見ることができる。例えば、ZANTACに対するフルター
ムディスプレイ(Full Term Dispay)は、類義語の収集、広義の用語、狭義の用
語、およびその他の概念的に関係がある用語を提供し、おのおのにアンダーライ
ンが施され、ユーザが、これら用語をクリックすると、その用語に関する詳しい
情報を得られるようになっている。一つの好ましい実施例においては、さらに、
ZANTACと関連する概念を含むシソーラスのサブセットもアンダーラインを施され
た形式にて表示され、ユーザがおのおのの名称のシソーラスのサブセットをクリ
ックすると、そのサブセットに関する詳しい情報(例えば、その用語を発表した
組織や、それが意図する目的など)を得られるようになっている。加えて、HTML
モジュールによって提供されるリレーションシンボル、例えば、スコープノート
(scope note)に対して“SN”、広義の用語(broader term)に対する“BT”、
狭義の用語(narrower term)に対する“NT”などもアンダーラインを施された リンクとして提供され、必要である場合、ユーザがそれらをクリックすると、こ
れらリレーションシンボルに関する詳しい情報が得られるようになっている。
【0051】 アンダーラインを施された項目に加えて、HTMLモジュール111.1は、これ
ら項目の隣に出現する小さなアイコンを提供し、それら項目と関連する様々なタ
イプり表示に直ちにアクセスできるようにされる。例えば、ZANTACに対するアン
ダーラインを施された複数の狭義の用語の項目の一つが、“zantac chewdose ta
blet”である場合、HTMLインタフェース130は、この項目の隣に、その項目の
アルファベットと詳細な情報の表示のための小さなアイコンを出現させる。こう
して、ユーザ150は、必要である場合は、ZANTACに対するフルタームレコード
から、狭義の用語のアルファベット表示に直ちに移動することができる。
【0052】 HTMLモジュール111.1の検索機能 HTMLモジュール111.1の検索機能は、シソーラス情報を、一連の自動的に
生成されたHTMLページとして供給する。一つの好ましい実施例においては、この
ページは、ユーザが調べる用語を指定するタイプインボックス、および用語を表
示するための4つのモード、すなわち、階層ディスプレイ(Hierarchical Displ
ay)、フルタームディスプレイ(Full Term Display)、アルファベットディス プレイ(Alphabetical Display)、子孫(シブリング)ディスプレイ(Show Sib
lings Display)の一つを含む。さらに、シソーラスの全てのサブセットに渡っ て用 語を探索するための“ファインドオール(Find All)”機能、利用可能な リレーションを調べるための“ビューリレーション(View Relations)”機能、
全てのアクセス可能なシソーラスのサブセットをリストする“シソーラス(Thes
auri)”ページ、およびユーザによってHTMLモジュール111.1の探索機能の
モードを制御するために用いられる“プレファレンス(Prefernces)”ページも
用意されている。
【0053】 一般的に、メインの用語ディスプレイ(階層ディスプレイ、フルタームディス
プレイ、子孫(シブリング)ディスプレイ、アルファベットディスプレイ)のお
のおのは、選択された用語に関するシソーラス情報と、ユーザによって選択され
た全ての“アクティブなシソーラス”からの関連する情報へのハイパーリンクを
示す。アクティブでない他のシソーラスのサブセットからのシソーラス情報は表
示されない。上述の4つのタイプの各ディスプレイは、全てのアクティブなシソ
ーラスの総和を、単一の結合されたディスプレイにて、それらがあたかも単一の
(モノリシックな)シソーラスであるかのように表示する。
【0054】 これらディスプレイは、潜在的に多数のシソーラスからの情報を一度に表示す
るために、これらディスプレイは、同一の物を意味する(つまり、同一の底辺に
横たわる概念を持つ)が、ただし、幾つかのアクティブなシソーラスにおいて異
なる推奨語の文字列を持つ用語を表示するためには特別な規約を用いる。例えば
、同一の概念の物が、顧客情報(CI)用のシソーラスにおいては、推奨語として
“Zantac”として呼ばれ、研究開発(RD)用のシソーラスにおいては、“raniti
dine hydrochloride”と呼ばれるており、顧客情報(CI)用のシソーラスと研究
開発(RD)用のシソーラスが両方ともアクティブである場合、この規約によると
、この用語は以下のように表示される。
【0055】 Zantac|ranitidine hydrochloride(CI,RD) つまり、異なる推奨語がプリントされ、垂直バーによって他の用語と分離され
、最後(末尾)に、シソーラスのサブセットの注釈のリストがプリントされる。
【0056】 階層ディスプレイは、あるシソーラスの階層リレーションシップに従ってより
一般的な用語からより具体的な用語の順に配列される階層内の、選択された用語
の位置を示す。デフォルトとして、“広義の用語(borader term)”なるリレー
ションをこの階層を決定するために用いることもできる。ただし、この目的のた
めに、他の階層リレーションを用いることもできる。一般的な用語からより具体
的な用語の順に配列された階層内の各用語は、ハイパーリンクを構成し、その用
語をクリックすると、その用語に焦点を置く階層ディスプレイが呼び出される。
加えて、オプションとして、この階層ディスプレイは、選択された用語と関係す
る他のリレーションシップを表示することもできる。これらリレーションシップ
自身は、それらリレーションシップに関する情報のページへのリンクを構成し、
関連する各用語は、各用語に焦点を置かれた階層ディスプレイへのリンクを構成
する。さらに、階層ディスプレイは、選択された用語がその中に存在するシソー
ラスの“最上位の用語(top terms)”、あるいは、大きな区分を示す。さらに 、階層ディスプレイページ上に表示される各用語には、それが出現するシソーラ
スのサブセットの注釈を与えられる。これら注釈もハイパーリンクを構成し、特
定のサブセットをクリックすると、関連する用語に関する情報が、選択されたサ
ブセットからに限定して、表示される。最後に、他のメインの用語ディスプレイ
と同様に、階層ディスプレイも、各表示された用語の隣に、小さなアイコンを表
示し、これをクリックすると、その用語のフルタームディスプレイとアルファベ
ットディスプレイにアクセスすることができる。
【0057】 フルタームディスプレイは、ある単一の用語に関して全てのシソーラスのサブ
セットから情報を集める。このディスプレイは、その用語と関連する個々のリレ
ーションシップに加えて、各リレーションシップに対して、そのリレーションシ
ップによって表示される用語と関連する他の用語あるいは文字列のリストも表示
する。これらリレーションシップは、そのリレーションに関する情報のページへ
のハイパーリンクを構成し、関連する用語は、その関連する用語についての階層
ディスプレイへのハイパーリンクを構成する。加えて、各関連する用語と共に、
その用語に対するフルタームディスプレイとアルファベットディスプレイへのワ
ンクリックアクセスを提供する小さなアイコンも提供される。
【0058】 フルタームディスプレイは、個別シソーラス(Thesauri Separate)モードと 、併合シソーラス(Thesauri Merged)モードの2つのモードにて動作する。個 別モードでは、用語が存在するシソーラスの各サブセットを個別に選択すること
ができる。選択すると、そのシソーラスのサブセット内のその用語に関する情報
が表示される。併合モード(省略時)のときは、表示された用語と関連する各用
語とともに、シソーラスのサブセットのシンボルの注釈が付けられ、これによっ
て、そのリレーションシップがシソーラスのどのサブセット内に存在するか示さ
れる。これら注釈はリンクを構成し、ある一つをクリックすると、表示された用
語に関する情報が、そのサブセットのみからに限定して、表示される。
【0059】 フルタームディスプレイは、さらに、HTMLモジュール111.1の幾つかの更
新機能、すなわち:“フルターム編集(Full Term Edit)”、“概念の相関(Co
rrelate Concept)”、“相関除去(Uncorrelate)”、“推奨語から慣用語への
変換(Convert Preferred Terms to Use Fors)”、“慣用語の移入(Import Us
e Fors)”、“推奨語と慣用語の交換(Swap Preferred Term and Use For)” へのリンクを持つ。
【0060】 アルファベットディスプレイは、KWIC(Key Word In Context)フォーマット に基づいてアルファベット順に配列された用語のリストを表示する。ユーザによ
って選択された用語あるいは文字列が中央に表示され、その前後に、幾つかのア
ルファベット順で前の用語と、アルファベット順で後の用語が表示される。シソ
ーラス内の用語は、複数のワードとその用語の各サブワードのKWICアルファベッ
トから構成される。例えば、ユーザが“analegesic agent”と“oral analegesi
c”なる用語を含む一つのアクティブなシソーラスにて“analegesic”を表示す ることを選択するものと想定する。“analegesic”なるワード自身は、アクティ
ブなシソーラス内の用語ではなく、このため、アルファベットディスプレイは、
その中央付近に、“analegesic would appear here”なるフレーズを表示する。
このラインの後には、“oral analegesic”に対するラインが続き、次に、“ana
legesic agent”に対するラインが来る。“analegesic would appear here”の 前のラインは、アルファベット順で“analegesic”より前の用語、例えば、(そ
の第二のワードに基づいてアルファベット順に配列された)“gastrointestinal
agent”や(その第一のワードに基づいてアルファベット順に配列された)“al
uminum hydroxide”などの用語が来る。加えて、用語は水平方向にも配列され、
アルファベット順に配列する際に用いられるサブワードが各ライン上で同一の文
字位置から始まるようにされる。アルファベットディスプレイ上に表示される各
用語は、用語の階層ディスプレイ表示へのハイパーリンクを構成する。さらに、
各用語と関連して、その用語のフルターム表示へのハイパーリンクを提供する小
さなアイコンも表示される。この好ましい実施例においては、アルファベットデ
ィスプレイは、代替語の表示にトグルさせるためのボタンを備え、これが、ター
ンオフされている場合は、推奨語が検索できるようにされ、ターンオンされてい
る場合は、全てのユーザによって選択された代替語が検索できるようにされる。
上述のように、代替語は、慣用語(Use For)あるいは任意のユーザによって定 義された辞書リレーションシップを用いて記録された文字列から構成される。
【0061】 子孫(シブリング)ディスプレイは、選択された用語を、全てのアクティブな
シソーラス内のその全ての子孫用語と共に表示する。子孫の用語(Sibling Term
s)は、それらが表示された用語と共有する親用語(“広義の用語”)に従って グループ化される。各子孫用語は、その子孫用語に関する階層ディスプレイペー
ジへのハイパーリンクを構成する。加えて、各用語と共に、その子孫用語に関す
るフルタームディスプレイとアルファベットディスプレイへのワンクリックアク
セスを提供する小さなアイコンも表示される。最後に、各用語に続いて、これも
ハイパーリンクを構成するシソーラスの注釈のリストが表示される。これら注釈
は、子孫用語が存在するシソーラスのサブセットを示し、これら注釈の一つをク
リックすると、子孫用語に関するフルターム情報のページが、クリックされた注
釈によって表されるシソーラスのサブセットに限定して、表示される。
【0062】 子孫(シブリング)ディスプレイは、1ページの上に、これがない場合は、す
くなくとも2クリックあるいはそれ以上離れている情報を集める。例えば、“ma
n”なる用語は、2つの異なるより広義の“male”および“human”なる用語を持
つ。そして、“man”の子孫用語は、親用語が“human”の場合は、“woman”と “child”を含み、親用語が“male”の場合は、“bull”、“stallion”などを 含む。このため、必ずしも厳密なトリーではないが、ただし、用語が1つ以上の
親を持つことを許すシソーラスシステムの場合、子孫(シブリング)ディスプレ
イを用いなければ、全ての子孫用語を見つけることは、しばしば、大変な作業と
なる。
【0063】 HTMLモジュール111.1の更新機能 HTMLモジュール111.1の更新機能は、従来のHTMLフォームを含む複数の自
動的に作成されるHTMLページとして提供され、ユーザは、シソーラス情報の変更
を行なう場合、これらフォームに記入して提出する。殆どの更新機能では、シス
テムは、複数のシソーラスのサブセットを一度に更新する能力を持つ。一つの実
施例においては、“クイック編集(Quick Edit)”、“用語追加(Add Term)”
、“用語削除(Delete Term)”、“用語名変更(Rename Term)”、“シソーラ
ス作成(Create Thesaurus)”、“シソーラス削除(Delete Thesaurus)”、“
シソーラス名変更(Rename Thesaurus)”、“シソーラスコピー(Copy Thesaur
us)”、“リレーション定義(Define Relation)”、“フルターム編集(Full
Term Edit)”、“狭義の用語の慣用語への変換(Convert Narrower Terms to U
se Fors)”、“慣用語の移入(Import Use Fors)”、推奨語と慣用語の交換(
Swap Preferred Term with Use For)”、“シソーラスの完全性チェック(Inte
grity Check Thesaurus)”、“用語の完全性チェック(Integrity Check Term )”、“相関(Correlate)”、“概念の相関(Correlate Concept)”、および
“シソーラスのロード(Load Thesaurus)”などの機能に対するボタンが存在す
る。これらボタンをクリックすると、適当なブランク、ラジオボタンあるいはチ
ェックボックスを含むHTMLページがロードされ、ユーザは、これに変更内容を指
定する。このフォームを提出すると、変更が処理される。これらの各機能につい
て以下により詳細に説明する。
【0064】 クイック編集(Quick Edit)のページは、シソーラス情報に用語の追加したり
、用語を削除したり、既に存在する用語を編集する動作をサポートする。これは
、編集すべき用語、その変更が適用されるべきセットのシソーラス、シソーラス
リレーション、および動作のタイプ(追加、削除、あるいは編集)をリクエスト
する。クイック編集機能は、更新モジュール113の“シソーラス情報編集(Ed
iting Thesaurus Information)”サブシステムを用いて、変更を検証し、それ を遂行する。
【0065】 用語追加(Add Term)機能は、用語を、その用語をまだ含まない一つあるいは
複数のシソーラスのサブセットに追加する動作をサポートする。これは、推奨語
の文字列、その用語が追加されるべきセットのシソーラス、および(オプション
として)その新たな用語に対する“広義の用語”として機能する現存の用語をリ
クエストする。用語追加機能は、更新モジュール113の“シソーラス情報編集
”サブシステムを用いて、変更を検証し、これを遂行する。
【0066】 用語削除(Delete Term)機能は、用語を、一つあるいは複数のシソーラスの サブセットから除去する動作をサポートする。これは、ユーザの選択に依存して
、用語とその全ての狭義の用語を削除するか、あるいは、単に用語を、以前の用
語の狭い用語を、その前の広義の用語まで接続することで、“スプライスアウト
(splice out)”する。これは、削除すべき用語と、その削除が適用されるべき
一つあるいは複数のシソーラスをリクエストする。用語削除機能は、更新モジュ
ール113の“シソーラス情報編集”サブシステムを用いて、変更を検証し、こ
れを遂行する。
【0067】 用語名変更(Rename Term)機能は、一つあるいは複数のシソーラス内のある 概念に対する推奨語の文字列の変更する動作をサポートする。用語名変更機能は
、更新モジュール113の“シソー ラス情報編集”サブシステムを用いて、変 更を検証し、これを遂行する。
【0068】 シソーラス作成(Create Thesaurus)機能は、新たな空のシソーラスのサブセ
ットを導入する動作をサポートする。これは、新たなシソーラスに対する名前お
よび省略語をリクエストする。シソーラスの作成機能は、更新モジュール113
の“シソー ラス情報編集”サブシステムを用いて、変更を検証し 、これを遂行
する。
【0069】 シソーラス削除(Delete Thesaurus)機能は、あるシソーラスのサブセット全
体を、その内容と共に、シソーラスマネージャ100から除去するのをサポート
する。ユーザは、この機能を用いて存在するシソーラスのメニューから削除され
るべきシソーラスをピックアップし、更新モジュール113の“シソー ラス情 報編集”サブシステムを用いて、変更を検証し これを遂行する。
【0070】 シソーラス名変更(Rename Thesaurus)機能は、あるシソーラスのサブセット
に対する名前および/あるいは省略名を変更する動作をサポートする。これは、
新たな名前あるいは新たな省略名、もしくはこれらの両方をリクエストし、更新
モジュール113の“シソー ラス情報編集”サブシステムを用いて、変更を検 証し、これを遂行する。
【0071】 シソーラスコピー(Copy Thesaurus)機能は、シソーラス情報をシソーラスの
あるサブセットから別のサブセットにコピーする動作をサポートする。これは、
ソースシソーラスと目標シソーラスを(ピックメニューから)リクエストする。
オプションとして、これは、また、スタートターム(開始用語)パラメータ、カ
ットオフターム(打切用語)パラメータ、あるいはカットオフ(打切)レベルパ
ラメータもサポートする。これらパラメータについては、シソーラスのサブセッ
トのコピーの項目で既に説明した通りである。シソーラスコピー機能は、更新モ
ジュール113の“シソーラスサブセットコピー” サブシステムを用いて、変 更を検証し、これを遂行する。
【0072】 リレーション定義(Define Relation)機能は、新たなリレーションを、シソ ーラス報を表現するために利用できるセットのリレーションに追加する動作をサ
ポートする。辞書リレーション、階層リレーション、ドキュメンテーションリレ
ーション、およびカスタムリレーションを作成することができる。リレーション
のタイプに依存して、様々なタイプの情報がリクエストされる。例えば、リレー
ション名、逆リレーションの名前、リレーションが一対一であるか、一対複数で
あるか、あるいは複数対複数であるか、リレーションが再帰的であるか、リレー
ションが非再帰的であるか、リレーションが対称的であるか、リレーションがト
ランザティブ(transitive)であるか、そのリレーションが2つの推奨語(つま
り、概念)を関連付けるか、あるいは推奨語を文字列と関連付けるか、などの情
報がリクエストされる。リレーションの定義機能は、更新モジュール113の“
シソーラスリレーションに関する動作”サブシステムを用いて、変更を検証し、
これを遂行する。
【0073】 フルタームの編集(Full Term Edit)機能は、現存する用語間および現存する
用語と文字列の間のリレーションの追加、削除および編集を、全サブセットに渡
って、1つの動作にて、サポートする。これは、自由形式テキストボックスをユ
ーザに表示する。これは、全てのアクティブなシソーラス内の用語に対する現在
のシソーラス情報をプログラムにて理解できるシンタックスにて含む。ユーザは
、このテキストを編集することで、用語を既に存在するリレーションに追加した
り、用語の間に新たなリレーションシップをそれら用語が存在する各シソーラス
内に、追加したりすることができる。フルタームの編集機能は、更新モジュール
113の“シソーラス情報編集”サブシステムを用いて、変更を検証し、これを
遂行する。
【0074】 狭義の用語の慣用語への変換(Convert Narrower Terms to Use Fors)機能は
、ユーザが、一つの動作にて、これを用いなければ非常に時間がかかる、特定の
用語を、推奨語として指定したり、全てのその現在の狭義の用語を慣用語に変換
したりするタスクをサポートする。この機能は、更新モジュール113の“シソ
ーラス情報編集”サブシステムを用いて、変更を検証し、これを遂行する。この
機能は、シソーラスのサブセットに渡って用語の粒度を管理する能力を増強する
【0075】 慣用語の移入(Import Use Fors)機能は、ユーザが他のシソーラスから素早 く慣用語を移入することを可能にする。この機能は、更新モジュール113の“
シソーラス情報編集”サブシステムを用いて、変更を検証し、これを遂行する。
【0076】 語彙が進化するにつれて、しばしば、推奨語が使用されなくなり、以前は、代
替語として用いられていたものが一般的に用いられるようになることがある。こ
のような場合は、ユーザは、推奨語と慣用語の交換(Swap Preferred Term with
Use For )機能を用いて、交換すべき用語を簡単に選択することができる。こ の機能は、更新モジュール113の“シソーラス情報編集”サブシステムを用い
て、変更を検証し、これを遂行する。
【0077】 シソーラスの完全性チェック(Integrity Check Thesaurus)機能は、選択さ れたシソーラス内のファクト(情報)について、更新モジュール113の“完全
性チェッカ”サブシステムを呼び出す。これは、問題が見つかるまで、時間制限
に達するまで、あるいは、シソーラス全体のチェックが終わるまでランする。問
題が見つかった場合、その問題は、可能である場合は、更新モジュール113の
“完全性チェッカ”サブシステムによって自動的に修復され、修復できない場合
は、ユーザにセットのオプションが提示される。
【0078】 “完全性チェッカ”118は、単一の用語に関して呼び出すこともできる。こ
の場合は、その用語に関する各シソーラスのファクト(情報)が、それが出現す
る全てのシソーラスのサブセット内で、チェックされる。自動的に修復できる問
題は修復され、修復できない問題については、複数の修復オプションがユーザに
提示される。各ケースにおいて、修復は、更新モジュール113の“完全性チェ
ッカ”サブシステムによって遂行される。
【0079】 相関(Correlate)機能は、(比較する)シソーラスのサブセット内の全ての 用語と、他のシソーラスのサブセット内の用語間並びに一般知能ベース112内
の概念の間の対応(重複)を調べる動作をサポートする。相関機能は、後に説明
する相関器116とシステムコード110のサブシステムを用いる。
【0080】 概念相関(Correlate Concept)機能は、相関器116を単一の推奨語(つま り、概念)に関して呼出し、その用語と他のシソーラス内の用語との間あるいは
一般知能ベース122内の概念との間の対応(重複)を調べる。
【0081】 相関除去(Uncorrelate)機能は、二つあるいはそれ以上のシソーラス内に出 現する、あるいは、一般知能ベース122と一つあるいは複数のシソーラス内に
出現する概念が与えられたとき、これら概念を個別の概念に分割する。これは、
不当な相関が事故的に生成された場合に有効である。
【0082】 シソーラスロード(Load Thesaurus)機能は、シソーラス情報をシソーラスデ
ータファイル170からシソーラスのサブセットにローディングする動作をサポ
ートする。これは、更新モジュール113の“シソーラスのサブセットローディ
ング”機能を用いてローディングを遂行する。
【0083】 HTMLモジュール111.1の報告機能 HTMLモジュール111.1の報告機能は、セットの自動的に作成されるHTMLペ
ージとして提供され、“ユティリティ(Utilities)”ページからアクセスされ る。この機能は、シソーラス統計、ユーザ統計、動作報告などの情報を供給する
。シソーラス統計は、各シソーラス内の推奨語その他の辞書項目数、各シソーラ
ス内の用語の底辺に横たわる概念の数、各シソーラス内のファクトの数、および
各シソーラスのクリエータ(creator)および作成時間を含む。シソーラス統計 は、さらに、全 体として一つに統合されたシソーラス内の概念、用語およびフ ァクトの数を含む。ユーザ統計は、各月毎に以下の情報を含む。つまり、各月に
行なわれた、シソーラス当たりと、全体での、ログインの数、およびリクエスト
されたページの数を含む。動作報告(Operation reports)機能は、シソーラス 情報に加えられた変更のログ(記録)を示す。動作報告は、様々なやり方で(例
えば、ユーザ、日付、時間、あるいはシソーラス別に)分類される。
【0084】 HTMLモジュール111.1の保守機能 HTMLモジュール111.1の保守機能は、セットの自動的に作成されるHTMLペ
ージとして提供される。好ましい実施例においては、保守モジュール115の全
機能の一部のみがユーザの制御下に置かれ、この実施例においては、これら機能
は、ユティリティ(Utilities)ページからのリンクを介してアクセスされる。 管理者の制御下に置かれる保守機能には、“状態のクイックスナップショット(
Quick State Snapshot)”、“シソーラス情報のファイルへのバックアップ(Ba
ckup Thesaurus Information to File)”、“ユーザ管理(Manage Users)”、
“システム情報(System Information)”などの機能が含まれる。
【0085】 APIモジュール111.2 APIモジュール111.2は、アプリケーションプログラミングインタフェー スを提供し、外部プログラムは、これを介して、シソーラスマネージャ100に
照会および更新のリクエストを提出する。一つの実施例においては、APIモジュ
ール111.2は、検索のみを遂行するが、別の実施例においては、検索に加え
て、更新も遂行する。
【0086】 APIモジュール111.2の一般動作 APIモジュール111.2は、TCPやSMTP様のコマンドおよび応答などのストリ
ーム接続を用いるサーバである。クライアントプログラムは、情報あるいは更新
をリクエストするコマンドをサーバに送り、サーバは、これに応答して、情報、
変更の承認、あるいはコマンドが実行できない理由の指標を送り返す。
【0087】 APIモジュール111.2の検索機能 好ましい実施例においては、APIモジュール111.2の検索機能には、(a )ある文字列があるシソーラスのサブセットにおいて既知の用語であるか否かを
テストする機能、(b)全てのシソーラスのサブセットを検索する機能、(c)
全てのリレーションを検索する機能、(d)ある用語に関するシソーラス情報を
含むシソーラスのサブセットを検索する機能、(e)幾つかのセットのシソーラ
スのサブセット内の、ある用語、その狭義の全て用語、全ての同等な用語、およ
びある用語とリレーションによって関連付けられている全ての用語の、狭義の用
語、慣用語、全ての再帰的用語を検索する機能、および(f)ある与えられたセ
ットのシソーラスのサブセットの全ての最上位の用語(大きなシソーラス分割)
を検索する機能が含まれる。例えば、シソーラス情報を用いてキーワード照会を
拡張しながらドキュメントを検索するアプリケーションプログラムでは、APIモ ジュール111.2に接続し、ユーザによって提供された元のキーワードに基づ
いて、その全ての狭義の用語の慣用語を検索し、これら情報をさせら探索に組み
入れることで、関連する検索の数を増加してゆくことができる。
【0088】 APIモジュール111.2の更新機能 一つの実施例においては、APIモジュール111.2の更新機能は、(a)シ ソーラスのサブセットを作成、名前を変更、あるいは削除する機能、(b)用語
を、一度にたった一つのコマンドで、シソーラスの単一のサブセットあるいはオ
プションとして複数のサブセットに追加、あるいはこれらの中で名前を変更、あ
るいはこれらから用語を削除する機能、(c)現存するシソーラスのサブセット
(オプションとして複数のサブセット)内の現存の用語のシソーラス情報を編集
する機能を含む。例えば、シソーラスのサブセットをオンラインテキストにアク
セスすることで自動的に拡張してゆくアプリケーションプログラムでは、APIモ ジュール111.2に接続することで、ある用語が既知であるか否かをテストし
、それが既知でない場合は、それをシソーラスに追加することができる。
【0089】 ロギングモジュール117 ロギングモジュール117は、ログ180を管理する役割を担う。これらログ
は、2つのタイプのレコード、つまり:(a)更新モジュール113によって遂
行されたシソーラス情報に対する変更、および(b)ユーザ150によってHTML
モジュール111.1にて実現されるウエブインタフェースを介してアクセスさ
れたシソーラスのサブセットを記録する。報告モジュール114によってこれら
ログが読み出される。
【0090】 完全性チェッカ118 完全性チェッカ118は、セットのアクティブな完全性規則に違反するシソー
ラス情報を検出および修復するためのツールである。一つの好ましい実施例にお
いては、以下の規則が用いられる: ・広義の用語(BT)/狭義の用語(NT)なるサイクルは許可されず、階層リレ
ーションを用いるサイクルも許可されない。プログラムは、広義の用語(BT)/
狭義の用語(NT)あるいは任意の他の階層リレーションリンクから形成される連
鎖のループあるいはサイクルを識別する。
【0091】 ・いかなる用語も(任意の非再帰的なリレーションによって)自身と関連付け
られるべきではない。プログラムは、禁止されている場合、自己ループを識別す
る。
【0092】 ・いかなる用語も、同時に、推奨語および代替の慣用語として指定されるべき
ではない。プログラムは、推奨語および代替の慣用語の両方として使用されてい
る文字列を識別する。
【0093】 ・いかなる2つの底辺に横たわる概念も、同一の推奨語を持つべきではない。
プログラムは、一つの共通の推奨語を共有する個々の概念を識別する。
【0094】 ・いかなる2つの別個の推奨語も、同一の代替語あるいは慣用語を持つべきで
いない。プログラムは、共通の慣用語文字列を共有する個々の概念を識別する。
【0095】 ・“最上位”の用語は、広義の用語(BT)を持つべきではない。プログラムは
、主張された広義の用語を持つ最上位の概念を識別する。
【0096】 ・停止リスト上の用語は、推奨語あるいは代替の慣用語のいずれであってもな
らない。プログラムは、停止リスト語を、推奨語あるいは慣用語として持つ概念
を識別する。
【0097】 ・シソーラス内の全ての用語、文字列およびリレーションは、既知の推奨語に
リンクされていなければならない。プログラムは、実際にそれらシソーラス内に
存在しない概念を伴うシソーラス主張を識別する。存在しない推奨語へのリンク
(リレーション)は、エラーとして標識を建てられる。
【0098】 ・リレーションが、一対一、複数対一、あるいは一対複数の関係を指定する場
合は、一つの用語のみがそのリレーションによって関連付けられることを許され
る。プログラムは、禁止されている場合は、ある与えられたリレーションに対し
て複数の用語が関連付けられている場合それらを識別する。
【0099】 ・底辺に横たわる概念は、一つの推奨語のみを持ち、複数の推奨語は許されな
い。プログラムは、ある与えられたシソーラス概念に対して複数の推奨語文字列
が存在する場合それらを識別する。
【0100】 ・広義の用語(BT)と関連する用語(RT)は、ある用語を両方とも同一の用語
と関連付けるべきではない。プログラムは、広義の用語(BT)と関連する用語(
RT)の両方によって関連付けられているペアの概念を識別する。
【0101】 ・ある用語とその広義の語(BT)は、両方とも同一の用語へのRTリレーション
を持つべきではない(RT-BT-RTトライアングルは許されない)。プログラムは、
広義の用語(BT)/狭義の用語(NT)によって関連付けられており、両方とも関
連する用語(RT)によって共通の第三の用語に関連付けられているペアの概念を
識別する。
【0102】 ・いかなる用語も、推奨語と代替の慣用語の両方であってはならない。プログ
ラムは、ある与えられた文字列を推奨語と代替の慣用語の両方として持つ概念を
識別する。
【0103】 ・ある用語が広義の用語(BT)を持たない場合、その用語は“最上位(top) ”であるべきである(つまり、両親を持たない子孫は許されない)。プログラム
は、広義の用語(BT)を持たず、しかも、“最上位”でもない概念を識別する。
【0104】 一つの好ましい実施例においては、これら全ての完全性規則がアクティブとさ
れ、別の実施例においては、適用すべき規則はユーザによって選択される。
【0105】 完全性チェッカ118は、シソーラス情報を表現するために用いられるシソー
ラスリレーションの定義とは関係なく動作する。後に説明されるHTMLモジュール
111.1のリレーション定義サブシステムを用いて新たなシソーラスリレーシ
ョンが作成されると、完全性チェッカ118は、その新たなリレーションの定義
から、それら新たなリレーションにどの完全性規則が適用されるべきかを知り、
これを適用する。
【0106】 知能ベース120の構成要素 知能ベース120は、一つの好ましい実施例においては、Cycorp,Inc.,of Aus
tin,Texasから市販されているCyc(商標)知能ベース(Knowledge Base)を用い
て実現される。この知能ベースは、ヒューマンコンセンサスリアリティノレッジ
(human consensus reality knowledge)の一部である5千万の入力されたフォ ーミュラ(あるいは“規則”)から成る一般知能ベース112を含む。好ましい
実施例においては、一般知能ベース122とシソーラス知能ベース121が併用
される。
【0107】 知能ベース120の機能 形式言語(Formal language) 知能ベース120のフォーミュラは、CycL形式言語にてコード化される。ある
形式言語内の概念は、シンボルによって表され、これらシンボルを意味のあるや
り方で結合することで、論理フォーミュラが形成される。フォーミュラは、セン
テンスのようなもので、おのおのがワードに関する幾つかのファクトを記述する
。例えば、TREE,OUTDOOR-REGION,AND PROERTY-OF-BEING-LOCATED-IN-PLACEなる 概念から、我々は“trees are located outdoors(木は戸外にある)”と述べる
フォーミュラを形成することができる。また、TO-MEAN-SOMTHING,STRING-OF-CHR
ACTERS,およびAUTOMOBILEなる概念から、我々は“one meaning for the string,
‘car',is the concept automobile.(‘くるま’なる文字列に対する一つの意 味は自動車なる概念である)”と述べるフォーミュラを形成することができる。 コンテクスト(Contexts) 一つの好ましい実施例においては、知能ベース120は、多数のコンテクスト
に分割される。各コンテクストは、本質的に共通のセットの想定を共有し、互い
に一貫性のあるフォーミュラの束から形成される。コンテクスト機構が提供され
るが、これは、知能ベース120が、一見した所、矛盾するフォーミュラを、異
なるコンテクスト内で独立的に用いることを可能にする。例えば、英国に関する
コンテクスト内で、運転は道路の左側を利用して行なわれることを記述するフォ
ーミュラが存在し、場所として合衆国を想定するコンテクスト内で、運転は道路
の右側を利用して行なわれることを記述するフォーミュラが存在する場合、これ
ら2つのフォーミュラ内で同一の概念(DRIVING-EVENT,ROADWAY,etc)が用いら れていることとなる。これら概念が同一のコンテクストで用いられている場合、
あるいはコンテクスト機構を備えない機能ベースにおいて用いられてる場合は、
これら概念は矛盾することになることに注意する。
【0108】 レクシカン(Lexicon) 一つの好ましい実施例においては、知能ベース120は、12,000ワードを超え
る英語の基幹ワードのレクシカン(Lexicon)を含む。これらワードは、知能ベ ース120内でワードの意味に当たるコンセプト(Concepts)を形成するように
関連付けられる。英語のワードは複数の意味を持ち、知能ベース120のレクシ
カンは、これらを説明する。レクシカンは、ワードの形式を認識する。例えば、
“swim”なる基幹ワードに対して維持されるレクシカン辞書情報を用いることで
、“swim",swims",“swam",“swimming"などの任意の文字列をSWIMMINGに対する
概念にマッピングすることができる。レクシカン情報は相関器116によって用
いられる。
【0109】 機能の要約 好ましい実施例においては、知能ベース120はCyc(商標)知能ベース(Kno
wledge Base)を用いて実現されるが、ただし、別の実施例として、知能ベース 120は、それらが形式表現言語を使用し、それがコンセプトを結合することで
フォーミュラを形成し、コンセプトおよびそれら概念に関する知識の豊富な蓄積
を有するする限り、任意の知識ベースを用いて実現することができる。
【0110】 一般知能ベース122 一般知能ベース122は、一つの好ましい実施例においては、ヒューマンコン
センサスリアリティノレッジの一部であるコンセプトおよび規則の豊富な蓄積を
含む。一つの好ましい実施例においては、一般知能ベース122は何千もの概念
を含み、これら概念には、様々なタイプの知能エージェント、例えば、人;紙ク
リップから航空機母艦に至までの日常的な物体;解剖学上の概念、水から木、医
薬品に至までの物質;測定の単位、例えば、インチ;および引っ掻く動作から、
講義、雷、衝突、手術などの無数の動作が含まれる。当業者においては理解でき
るように、これらコンセプトおよび規則の具体的な選択は、設計上の選択の問題
であり、シソーラスマネージャ100の実現にとっては本質的ではない。
【0111】 シソーラス知能ベース121 シソーラス知能ベース121は、コンセプトおよびフォーミュラを用いて表現
され、知能ベース120の形式言語にてコード化されたシソーラス情報を含む。
好ましい実施例においては、シソーラス情報は、CycLにて表現される。
【0112】 コンテクストの使用 動作においては、シソーラス知能ベース121は、ユーザによって定義される
一つあるいは複数のシソーラスのサブセット211から構成され、各シソーラス
のサブセットは、知能ベース120のコンテクストとして表現される。これらコ
ンテクストのフォーミュラはそのシソーラスのサブセットのシソーラス情報を表
現する。
【0113】 加えて、以下のタイプのセットの一般フォーミュラが存在し、これらは、通常
、シソーラス知能ベース121内に存在し、各シソーラスのサブセット内で利用
される: ・各シソーラスのサブセットについて、名前および省略形、コメント文字列お
よび他の定義およびブックキーピング上の情報を記述するフォーミュラ ・シソーラスリレーションを定義し、あるリレーションがインバースを持つか
、複数対複数であるか、複数対一であるか、一対複数であるか、一対一であるか
、トランジティブ(transitive)であるか、対称的であるか、再帰的であるか、
非再帰的であるか、いわゆる関連する用語間に他のタイプのリレーションが適用
するか、辞書(文字列にて探索可能な)リレーションであるか、階層リレーショ
ンであるか、および/あるいはそのリレーションのシーケンスがサイクルを形成
することができるか否かなどを記述するフォーミュラ ・ユーザ、例えば、150について、ユーザIDを記述し、許可を定義するフ
ォーミュラ ・各底辺に横たわる概念について、クリエータと作成時間を識別するフォーミ
ュラ 形式言語の使用 シソーラスのサブセット211に対応するコンテクスト内では、シソーラス情
報は、知能ベース120の形式言語によるフォーミュラとして表現される。各推
奨語に対して、厳格に一つの知能ベースのコンセプトが存在する。例えば、一般
製薬シソーラスのサブセット内の“Zantac”なる推奨語を考え、これが、このサ
ブセット内では、ZANTAC-THE-PRODUCTなる底辺に横たわる概念によって表現され
ているものと想定する。この場合、形式表現言語の一つのステートメントは、“
‘Zantac,the products'なる概念に対する推奨語が‘Zantac'なる文字列である ”というファクト(事実)を表現する。別のステートメントが“‘錠剤形式のZa
ntac’なる概念に対する推奨語が‘Zantac Tablet'なる文字列である”ファクト
を表現することも考えられる。これら2つのステートメントは、ユーザ150に
とってはインビジブルであるが、ただし、これらが“Zantac”および“Zantac T
ablet”なる推奨語文字列と底辺に横たわる概念との間の同義性を維持するため に用いられる。こうして、HTMLコード111.1によってサポートされるインタ
フェースにおいては、ユーザは、底辺に横たわる概念をその推奨語にて排他的に
参照することができる。
【0114】 知能ベース120の形式言語の別のセットのステートメントは、ユーザ150
にビジブルである。ただし、実際には、これらステートメントは、フォーミュラ
としてはビジブルはでなく、代わりに、これらステートメントの底辺に横たわる
形式が表示およびユーザによる操作のためにシソーラス形式に変換される。この
クラスのステートメントは、シソーラスリレーションを使用し、これらリレーシ
ョンは、“ビューリレーション(View Relations)”内に見ることができ、これ
らは、“クイック編集”あるいは“フルターム編集”において、ある推奨語に関
する新たなシソーラス情報を追加(あるいは編集あるいは削除)するために用い
られる。各シソーラスリレーションおよび存在する場合そのインバースは、単一
のコンセプトにて底辺に横たわる形式言語を用いて表現される。例えば、好まし
い実施例においては、シソーラスリレーション“NT”は、概念BROADER-TERMによ
って表現される。“Zantacの狭義の用語はZantac Tabletである”などのステー トメントは、ユーザには、[“Zantac"NT“Zantac Tablet"]および[“Zantac
Tablet"BT“Zantac"]なる両方のシソーラス形式としてビジブルとなる。これと
同一のステートメントが、底辺に横たわる形式言語においては、(BROADER-TERM
-TABLET ZANTAC-THE-PRODUCT)として表現される。前述のように、リレーション
は、シソーラスマネージャ110内では、コンセプトの間で記述され、任意のシ
ソーラスの推奨語の間では直接には記述されないことに注意する。
【0115】 シソーラス知能ベース(KB)121と一般知能ベース(KB)122の統合 図2は、知能ベース120、およびその主要な構成要素であるシソーラス知能
ベース121と、一般知能ベース122をより詳細に示す。シソーラス知能ベー
ス121は、複数のシソーラスのサブセット、図2の場合は、サブセットA21
1、サブセットB212、およびサブセットC213を含む。これらサブセット
のおのおのは、図2ではノード(概念を表現する点)間のリンク(リレーション
シップを表す実線)によって示されるように、概念間のセットのリレーションシ
ップを含む。幾つかの概念は、これらリレーションシップとの関係では、単一の
サブセット内にしか現われないが、他の幾つの概念は、複数のサブセット内に現
われる。図2において、サブセット間の点線は、各サブセット内で同一の底辺に
横たわる概念が言及されていることを示す。最後に、シソーラスの様々なサブセ
ット内でシソーラス情報を表現するために用いられている概念の幾つかは、一般
知能ベース122の部分を構成する既に現存する概念と同一であり、これらがシ
ソーラスのサブセット内の概念(点)を一般知能ベース122内の概念に接続す
る点線で示される。
【0116】 要約すると、シソーラスマネージャ100は、複数のサブセットの間で概念を
共有させることで、複数のシソーラスのサブセットを統合する。このため、これ
らの単一の概念は、異なるシソーラスのサブセットにおいては、異なる推奨語、
異なる代替語、さらには、それを表現する異なる知能を持つ。ただし、これら異
なる記述は、各サブセットが、他のサブセットから、これらシソーラスのサブセ
ットをコンテクストとして扱うことで互いに分割(分離)されているために衝突
することはない。シソーラスマネージャ100は、さらに、シソーラスのサブセ
ットを可能かつ適当な場合は、各サブセット内で同一の概念を用いることで、一
般知能ベース122と統合する。例えば、DOGなる一般概念がシソーラスの複数 のサブセットおよび一般知能ベース(KB)内に現われ、例えば、生物学用のシソ
ーラスにおいては、これは、推奨語として“Canis familiaris”を持ち、代替語
として“dog”を持ち;子供用のシソーラスにおいては、“dog”が推奨語とされ
、“doggie”が代替語として示され;さらに、一般知能ベース(KB)においては
、DOGなる概念は、“dogs are commonly kept as pets by people”、“dogs li
kes to eat meat”、“young dogs are playful”などのフォーミュラとして現 われることが考えられる。
【0117】 相関器(Correlator)116 相関器116は、シソーラスの複数のサブセットの間および一般知能ベースと
の間の概念の同等性を確立するために(重複を調べるために)用いるツールであ
る。相関器は、この役割を、シソーラスマネージャ100によって遂行される幾
つかのタイプの処理の際、つまり:(a)シソーラスのロードの際、(b)新た
な用語をロードする際、(c)ユーザ150がHTMLモジュール111.1にて実
現されるウエブインタフェースを介して相関器116を呼び出した際に、その役
割を果たす。
【0118】 ロード時の相関 シソーラスのサブセットがロードされる際、用語の定義がシソーラスデータフ
ァイル170から個別に読み出される。用語の定義は、推奨語と、それら用語が
他の用語との間に持つリレーションシップから構成される。相関器116が各推
奨語文字列に関して呼び出され、現存のシソーラスのサブセットが既にそれと同
一の推奨語文字列にてあるコンセプトを参照しているか否か決定される。一致す
る概念が既に存在する場合は、その概念がロードされた用語に対して用いられる
。これは、(“re-use concepts?”なるパラメータがターンオフされてない限り
)ユーザとの対話なしに、自動的に遂行される。
【0119】 用語を追加する際の相関 ユーザ150がHTMLモジュール111.1にて実現されるウエブインタフェー
スを介して新たな用語をシソーラスの一つのサブセットあるいはシソーラスの一
群のサブセット211に追加するとき、相関器116がユーザによって入力され
た推奨語文字列に関して呼び出され、一致する概念が既に存在しないか調べられ
る。用語が追加されているシソーラス以外のシソーラスのサブセット内に出現す
る概念および一般知能ベース122内に出現する概念が再使用の候補として見な
される。候補が見つかった場合は、ユーザに、ウエブインタフェースを介して、
その候補を承認するか、あるいは複数の候補の間で選択するか尋ねられる。ある
候補概念が選択された場合は、その概念が追加された用語を表すために用いられ
る。概念が選択されない場合は、新鮮な概念が追加された用語を表すために生成
される。 イクスプリシットな相関 好ましい実施例においては、相関器116は、HTMLコードモジュール111.
1にてサポートされるウエブインタフェースを介して呼び出される。シソーラス
のあるサブセットが与えられた場合、相関器116は、サブセットのシソーラス
情報内で言及されている個々の概念を訪問し、そのサブセット内では言及されて
ないが、一般知能ベース122あるいは訪問した概念と同等な別のシソーラスの
サブセット内で言及されている概念が存在しないか調べる。相関器116は、単
一の概念に関して呼び出すこともできる。候補概念は、ユーザ150に、HTMLコ
ードモジュール111.1を介して示される。ユーザが相関(併合)を承認した
場合は、2つの概念が一つに併合される。
【0120】 相関の方法 シソーラスのあるサブセット、例えば、シソーラスのサブセット211内に現
われるコンセプトあるいは推奨語の文字列が与えられると、相関器116は、現
在同等でないセットの概念を見つけ、これらを相関候補として考慮する(推奨す
る)。相関器116は、候補を以下のセットのヒューリティクス(発見的方法)
にて判定する: ・概念の推奨語の文字列が一致する場合は、その一致する概念を相関(併合)
候補として強く支持する。
【0121】 ・開始概念の推奨語の文字列が一致する概念の代替語の一つである場合は、そ
の一致する概念を相関候補として弱く支持する。
【0122】 ・開始概念の代替語と一致する概念の代替語の間に重複が存在する場合は、そ
の一致する概念を相関候補として弱く支持する。
【0123】 ・開始概念の推奨語の文字列が、知能ベース120内のレクション情報と比較
したとき任意の概念を与える場合、それら一致する概念を相関候補として中程度
に支持する。
【0124】 ・開始概念の代替語の文字列が、知能ベース120内のレクション情報と比較
しれたとき任意の概念を与える場合、それら一致する概念を相関候補として弱く
支持する。
【0125】 ・開始概念が関係するシソーラスリレーションと一致する概念が関係するシソ
ーラスリレーションあるいは一般知能ベースリレーションとの間にグラフ同形(
graph isomorphism)が存在する場合は、2つの概念の間の相関を弱く支持する 。
【0126】 ・概念に対する推奨語の文字列、代替語および/あるいはレクション122.
1の項目の間の文字列の類似性は、それら2つの概念の間の相関を弱く支持する
【0127】 これらヒューリティクスは、加算性であり、幾つかの弱い推奨(エンドースメ
ント)は加算されることで、相関の一致に対する強い推奨となる。
【0128】 図3は、本発明によるシソーラス情報に対するユーザ照会に応答しての処理を
流れ図にて示す。ユーザ150は、外部ウエブブラウザ140によって表示され
る標準のブラウジングページの一つをブラウジングしている際に、ステップ30
5において、(a)用語に関する階層ディスプレイページを見るために、用語名
をクリックするか、(b)用語に関するフルタームディスプレイを見るために、
フルタームアイコンをクリックするか、あるいは(c)その用語を中心とするア
ルファベット索引を見るために、アルファアイコンをクリックする。(他の動作
にて、このクリックと同一の結果を達成することもできる。例えば、標準のペー
ジの見出しの“タイプイン”ボックスに、用語の名前を入力し、それら用語につ
いて見たい主モードの一つを選択することでこれを達成することもできる。) ユーザクリックが受信されると、HTMLモジュール111.1は、ステップ31
0において、そのクリックを処理し、そのリクエストを検索モジュール112に
送る。検索モジュール112は、ステップ315において、探索手続きを遂行し
、全てのアクティブなシソーラスのサブセット、説明のケースでは、サブセット
211、212、および214から選択された用語に関するシソーラス情報を検
索する。サブセット213も示されるが、これは、アクティブなシソーラスのサ
ブセットではなく、このため、このサブセットからは情報は検索されない。次に
、検索モジュールは、ステップ320において、シソーラス情報を用いて、出力
項目を構築し、これを、フォーマット化のために、HTMLモジュール111.1に
送る。HTMLモジュール111.1は、ステップ325において、この情報をユー
ザによってリクエストされたディスプレイのタイプに対して適当なレイアウトの
標準のワールドワイドウエブページとしてフォーマット化する。次に、この情報
は外部ウエブブラウザ140に送られ、ここで、ユーザ150に表示され、ユー
ザはこの新たなブラウジングページ330を見る。
【0129】 この図面には、ロギングモジュール117の動作は示されないが、このモジュ
ールは、ユーザ150によって訪問されたシソーラスを、記録し、求められた場
合報告を作成する。
【0130】 図4は、本発明によるシソーラスの複数のサブセットを統合化されたやり方で
管理する方法を示す。ユーザ150は、外部ウエブブラウザ140によって表示
される標準のブラウジングページ405を見ている際に上述の編集手続きの一つ
を遂行するために、メニューボタンをクリックする。HTMLモジュール111.1
は、ステップ410において、このリクエストを受信および処理し、リクエスト
された編集ページをフォーマット化し、これを外部ウエブブラウザ140に送る
。ウエブブラウザ140はこの編集ページ415を表示する。このページはリク
エストされた編集手続きに必要とされるタイプインボックス、ピックメニューお
よび/あるいはボタンを備える。ユーザが選択を入力すると、ウエブブラウザ1
40は、それらを、HTMLモジュール111.1に送り、HTMLモジュールは、ステ
ップ420において、編集インストラクションを個別の動作に処理する。各動作
は、特定のシソーラスのサブセットと、特定のリレーションに関して動作し、(
シソーラスリレーションに対する)追加、削除、交換、および(シソーラスの用
語およびシソーラスのサブセットに対する)作成あるいは無効化(キリング)を
遂行する。幾つかの動作は、このインタフェースにおいてはアトミック(それ以
上分割できない原子)のように見えるが、ただし、これらは多くの動作を生成す
る場合があることに注意する。更新モジュール113は、ステップ420におい
て、関係するリレーションに関して存在する完全性制約に従って各動作を検証す
る。更新モジュールは、最初に、ステップ425において、動作が関係するリレ
ーションに関して存在する完全性制約を満たすか否か検証する。全ての動作が制
約を満たす場合は(判定430)、更新モジュール113は、ステップ435に
おいて、その変更を行なうように選択された各シソーラスの変更を遂行する。任
意の動作が完全性制約を満たさない(不当な)場合は(判定440)、HTMLモジ
ュール111.1は、ステップ445において、検証ページ450をフォーマッ
ト化し、これが、外部ウエブブラウザ140を介してユーザ150に表示される
。どの動作も制約を満たさない場合は、ここで処理は停止され、検証ページ45
0は、単に、動作が遂行されなかった理由を示す。少なくとも幾つかの動作は制
約を満たす場合は、ユーザは検証ページ450上でそれらの動作を合意(OK)す
るオプションを与えられる。しばしば、ユーザ150によって入力された指令が
別のやり方で解釈された場合、例えば、ユーザが“推奨語”の代わりに“慣用語
”を入力した場合、リクエストされた動作の幾つかが正当となる場合がある。こ
のため、検証ページ450は、このような場合は、動作を遂行する前に、必ずユ
ーザに確認を求める。
【0131】 ユーザが検証(承認)ページ上の質問に応答した後、外部ウエブブラウザ14
0は、そのページをHTMLモジュール111.1に送り、HTMLモジュールは、ステ
ップ455において、この検証入力を処理する。更新モジュール113は、ステ
ップ435において、この動作によって選択されたシソーラスのサブセット内の
各動作を遂行する。図面では、サブセット213に対しては変更はリクエストさ
れておらず、このため、これに関してはなにも遂行されない。HTMLモジュール1
11.1は、ステップ460において、結果ページ465をフォーマット化し、
これを外部ウエブブラウザ140に送る。
【0132】 この図面には示さないが、ロギングモジュール117および管理モジュール1
15も存在し、それぞれ、ロギングモジュール117は、報告を作成するために
用いられる変更のログを記録し、管理モジュール115は、障害の回復を担当す
る。
【0133】 図5は、ユーザ150からのコンセプト相関(Correlate Concept)リクエス トに応答して遂行される処理を示す。説明の例では、ユーザ150は、図におい
て灰色の点にて示されるシソーラスのサブセット211内に存在するシソーラス
の推奨語の特定の底辺に横たわる概念に対して相関を遂行する(重複がないか調
べる)ことをリクエストする。
【0134】 処理は、ユーザ150が、外部ウエブブラウザ140によって表示されるペー
ジ505を介して相関を開始するインストラクションを発行したとき開始される
。HTMLモジュール111.1は、ステップ510において、リクエストを翻訳お
よび処理し、これを相関器116に送る。相関器116は、ステップ515にお
いて、相関(併合)候補を識別することを試みる。相関(併合)候補とは、シソ
ーラスの他のサブセット内の用語を表す、あるいは、一般知能ベース内のフォー
ミュラ内に含まれる概念で、サブセット211内には存在しないが、サブセット
211内の開始概念517と同一の事物を意味する可能性が高い概念のことを言
う。(図6は、相関候補がどのように見つけられるかをより詳細に示す。)この
実施例では、2つの候補518、519が見つけられる。一つの候補519はサ
ブセット212内に見つけられ、もう一つの候補518は一般知能ベース122
内に見つけられる。相関候補518、519が見つかると、HTMLモジュール11
1.1は、ステップ520において、ページ525をフォーマット化する。ユー
ザ150は、このページ525を用いて、これら候補の一つを選択するか、ある
いは、開始概念517との相関(重複)を調べるために、もう一つのシソーラス
からの(底辺に横たわる概念を識別する)推奨語を入力する。この時点で、ユー
ザは、相関をそれ以上遂行しないことを決定し、単に別のタスクに進むこともで
きる。ユーザが示唆された概念518、519の一つと開始概念517との相関
(併合)を行なうことを希望する場合は、あるいは、代わりに、開始概念517
と相関(併合)する特定の用語を入力することを希望する場合は、それらがこの
時点で遂行され、選択が供給される。図5に示す実施例では、ユーザ150は、
サブセット212内の概念519と開始概念517との相関(併合)を選択する
【0135】 次に、HTMLモジュール111.1が、ステップ530において、供給されたペ
ージを処理し、これらインストラクションを相関器116に送る。次に、相関器
116が、ステップ535において、開始概念517を選択された概念519と
併合する。図5に示す2つの概念(点)を結ぶ太い点線は、この併合を示す。重
複する概念の併合においては、二つの概念517、519の一つが残され、他方
の概念に関するシソーラス情報を表現する全てのフォーミュラは除去され、“残
された(keeper)”概念を表現するように変更されたステートメントが知能ベー
ス120に加えられる。次に他方の概念は削除される。結果として、システム内
に存在するシソーラス情報と一般知能ベース(KB)のフォーミュラには変更はな
いが、ただし、以前は2つの別個の概念517、519が存在したものが、現在
は、単一の概念のみが存在することとなる。説明の実施例では、概念517、5
19は、両方ともシソーラスのサブセット内にのみ存在し、このため、どちらの
概念を残するかは特に問題とはならない。ただし、併合されるべき2つの概念5
17、519の一つが、一般知能ベース(KB)122内のフォーミュラとも関係
する場合は、その概念が自動的に残される。
【0136】 いったん概念が併合されたら、HTMLモジュール111.1は、ステップ540にお いて、結果ページ545をフォーマット化し、これがウエブブラウザ140に送
られ、ユーザ150に表示される。
【0137】 図面に示す例は、ユーザのリクエストに応答して、ある特定の概念を見つけ、
相関を確立する(概念を併合する)処理を示す。ただし、相関器116は、シソ
ーラスのあるサブセット全体に関して呼出し、そのサブセット全体を探索し、そ
のサブセット内に存在する全ての概念について相関(重複)を見つけることもで
きる。これら概念のおのおのに対する処理は、上述と同様に行なわれるが、ただ
し、ユーザ150との対話は異なる。より具体的には、相関器116は、一度に
、最大10個まで、あるいはある時間限度に達するまで開始概念に対する候補を
見つけ、ユーザ150は、これら全ての概念をバッチとして処理する。
【0138】 図6は、相関過程の“相関候補識別(Identify Correlation Candidates)” ステップを詳細に示す。この過程は、最初に、相関(併合)されるべき概念から
開始して、幾つかの概念のリストが得られる。これらは、必ずしも並列に得る必
要はなく、リストが検索される順番は特に問題ではない。ステップ602におい
て、シソーラスの別のサブセット内の、開始概念と同一あるいは類似の推奨語の
文字列を持つ概念のリストが検索され、強い重みが与えられる。ステップ604
において、シソーラスの別のサブセット内の、開始概念の推奨語の文字列と同一
あるいは類似の代替語(“慣用語"あるいは、他のユーザにて定義された辞書リ レーションの一つを介してある概念にリンクされている用語)を持つ概念のリス
トが検索され;これら概念に弱い重みが与えられる。次に、ステップ606にお
いて、開始概念の代替語の一つと同一あるいは類似の代替語を持つ概念のリスト
が検索され;これら概念に弱い重みが与えられる。次に、ステップ608におい
て、レクション122.1が照会され、レクション122.1内の、開始概念の
推奨語の文字列に対する意味の一つとして機能する概念のリストが探索され、こ
れら概念に中程度の重みが与えられる。最後に、ステップ610においてレクシ
ョン122.1内の、開始概念の任意の代替語に対する意味の一つとして機能す
る概念のリストが探索され、これら概念に弱い重みが与えられる。
【0139】 ステップ620において、これら5つの概念のリストが併合、あるいは、加算
的に追加される。つまり、ある概念が複数のリスト内に現われる場合は、各リス
トからの重みが一つに加算される。次に、結果としてのリスト(このリストでは
各概念は一度しか現われない)が、5つの開始リストからの重みの総和と関連づ
けられ、複数のフィルタに掛けられる。最初に、相関器116は、ステップ63
0において、シソーラスの重複がないことを確認する。任意のシソーラスのサブ
セット内に、開始概念と重複する候補概念が存在する場合は、それはリストから
削除される。これら目的に対しては、一般知能ベースも、一つのシソーラスとし
て扱われる。従って、開始概念が一般知能ベースのフォーミュラと関係する場合
は、それらも一般知能ベースフォーミュラと関係する候補概念もリストから削除
される。
【0140】 次に、ステップ640において、グラフ同形性フィルタが各候補概念に適用さ
れ、開始概念と関係するリレーションシップと、候補概念と関係するリレーショ
ンシップが比較される。最初に、グラフが各用語に対して生成される。シソーラ
ス内の用語は、様々な関係を通じて多くの他の用語とリンクされている。これら
リンクが複数のシソーラスの用語を通じてのグラフを作成するために用いられる
。このようにした場合、その中央用語から他のリンクされている用語までのリン
クは、中央用語に対するシグニチャとして機能するサブグラフを構成する。
【0141】 次に、候補のサブグラフが、相関されている用語のサブグラフと比較される。
これらサブグラフの類似度が、用語の2つのサブグラフの間のグラフ同形性問題
として扱われる。一つのサブグラフ内の、他の同形性リング上にマッピングする
ことができるリンクの数が、それら用語によって共有されるリンクあるいはリレ
ーションシップの数の指標として用いられる。
【0142】 最後に、ステップ650において、文字列類似性フィルタが各候補概念に適用
される。候補概念に対する推奨語の文字列あるいは代替語の文字列は等しくない
が、ただし、開始概念の候補語の文字列あるいは代替語の文字列に類似する場合
は、その候補に対する重みが少し増加される。一つの好ましい実施例においては
、文字列の類似性ルーチンは、失われた、代替された、あるいは転置された文字
、並びに、単数と複数、良く見かけられるスペリングのバリエーション(例えば
、英国英語とアメリカ英語の語尾)および動詞の語形変化なども考慮する。これ
らファイルが適用された後、ステップ660において、あるパラメータ化された
重みカットオフ(weight cutoff)値を超える概念が相関(併合)候補として返 される。
【0143】 上述の説明から、ここに開示された発明は、シソーラスの複数のサブセットへ
のアクセス、およびこれらの管理を、統合的に行なうことを可能にする新規で有
益なシソーラス管理システムおよび方法を提供することが明らかである。上述の
説明は、単に本発明の一例としての方法および実施例を説明するものである。当
業者においては理解できるように、本発明は、本発明の精神あるいは本質的な特
徴から逸脱することなく、他の様々な形態にて実現でき、本発明の範囲は単に解
説を目的とする上述の説明によって制限されるものではない。
【図面の簡単な説明】
【図1】 本発明によるシソーラスマネージャを示すブロック図である。
【図2】 図1に示す知能ベースを示すブロック図である。
【図3】 本発明によるユーザの照会に応答して遂行される処理を示す流れ図である。
【図4】 本発明による複数のシソーラスのサブセットを統合化して管理する動作を示す
流れ図である。
【図5】 本発明による相関処理(重複する項目を検出する動作)を示す流れ図である。
【図6】 相関(併合)候補を識別する処理を詳細に示す流れ図である。
【符号の説明】
100 シソーラスマネージャ 110 システムコード 111 IO層 111.1 HTMLモジュール 111.2 API 113 更新モジュール 114 報告モジュール 115 管理モジュール 116 相関器 118 完全性チェッカ 120 知能ベース 121 シソーラス知能ベース 122 一般知能ベース 140 HTMLインタフェース 150 ユーザ 160 外部プログラム 170 シソーラスデータファイル 180 外部ログ
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成12年4月24日(2000.4.24)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0019
【補正方法】変更
【補正内容】
【0019】 さらに、本発明によると、前記処理サブシステムは、前記入力サブシステムか
らの合図に応答して、ある概念に対して推奨語(preferred term)と慣用語(no
n-preferred term)を定義し;前記処理サブシステムは、さらに、推奨語を一つ
あるいは複数のシソーラスのサブセットの間で交換(スワップ)する。前記処理
システムは、前記推奨語と代替語の交換を行なうこともできる。前記処理システ
ムは、さらに一つのシソーラス内あるいは複数のシソーラスのサブセットの間の
変更を検証する。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】 本発明によるシソーラスマネージャを示すブロック図である。
【図2】 図1に示す知能ベースを示すブロック図である。
【図3】 本発明によるユーザの照会に応答して遂行される処理を示す流れ図である。
【図4】 本発明による複数のシソーラスのサブセットを統合化して管理する動作を示す
流れ図である。
【図5】 本発明による相関処理(重複する項目を検出する動作)を示す流れ図である。
【図6】 相関(併合)候補を識別する処理を示す流れ図である。
【手続補正書】
【提出日】平成13年2月15日(2001.2.15)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SZ,UG,ZW),EA(AM ,AZ,BY,KG,KZ,MD,RU,TJ,TM) ,AL,AM,AT,AU,AZ,BA,BB,BG, BR,BY,CA,CH,CN,CU,CZ,DE,D K,EE,ES,FI,GB,GD,GE,GH,GM ,HR,HU,ID,IL,IS,JP,KE,KG, KP,KR,KZ,LC,LK,LR,LS,LT,L U,LV,MD,MG,MK,MN,MW,MX,NO ,NZ,PL,PT,RO,RU,SD,SE,SG, SI,SK,SL,TJ,TM,TR,TT,UA,U G,US,UZ,VN,YU,ZW (71)出願人 Glaxo Wellcome Hous e,Berkeley Avenue G reenford,Middlesex UB6 0NN,Great Brita in (72)発明者 コイラ、ベル、バリー アメリカ合衆国ノースカロライナ州、チャ ペル、ヒル、ドッグウッド、ドライブ、 516 (72)発明者 ポール、ナサン、ベネット アメリカ合衆国ペンシルベニア州、ピッツ バーグ、ダーリントン、ロード、5706 (72)発明者 デイビッド、グレゴリー、ガドボワ アメリカ合衆国テキサス州、オースティ ン、ピー.オー.ボックス、49475 (72)発明者 キース、マイケル、グールスベイ アメリカ合衆国テキサス州、オースティ ン、スウィッチ、ウィロウ、4700 (72)発明者 アルバータ、スポット、マッケイ アメリカ合衆国ノースカロライナ州、リサ ーチ、トライアングル、パーク、ピー.オ ー.ボックス、13398、ファイブ、ムーア、 ドライブ、グラクソ、ウェルカム、インコ ーポレーテッド内 (72)発明者 ケネス、エス.マリ アメリカ合衆国テキサス州、オースティ ン、ラファイエット、アベニュ、3215 (72)発明者 カレン、エリザベス、ピットマン アメリカ合衆国テキサス州、オースティ ン、アクア、アズル、コート、10205 (72)発明者 ニコラス、ポール、シーゲル アメリカ合衆国テキサス州、オースティ ン、マリリン、ドライブ、5806 (72)発明者 ルービン、クリフトン、トンプソン、ジュ ニア アメリカ合衆国ノースカロライナ州、リサ ーチ、トライアングル、パーク、ピー.オ ー.ボックス、13398、ファイブ、ムーア、 ドライブ、グラクソ、ウェルカム、インコ ーポレーテッド内 Fターム(参考) 5B075 NK34 NK35

Claims (28)

    【特許請求の範囲】
  1. 【請求項1】 一つあるいは複数のシソーラスの複数のサブセットを有するシソーラスデータ
    ベースに統合的にアクセスするためのシステムであって、 シソーラスリクエストを受信する入力サブシステムと; 前記入力サブシステムに結合され、前記シソーラスデータベースに格納されて
    いる項目を見つけ、取り出すため、および前記シソーラスの複数のサブセットを
    単一の統合されたシソーラスとして管理するための処理サブシステムと; 前記処理サブシステムに結合され、取り出された項目を表示するための出力サ
    ブシステムと を備えたことを特徴とするシステム。
  2. 【請求項2】 前記シソーラスの項目は、シソーラスの概念であることを特徴とする請求項1
    記載のシステム。
  3. 【請求項3】 前記入力サブシステムは、さらに、APIモジュールを備え、このAPIモジュール
    が請求項1のシステムにとって外部の一つあるいは複数のプログラムからのシソ
    ーラスリクエストを受信するために用いられることを特徴とする請求項1記載の
    システム。
  4. 【請求項4】 前記入力サブシステムは、HTMLモジュールをさらに備え、このHTMLモジュール
    は、HTMLページを用いて伝送されるシソーラスリクエストを受信するために用い
    られることを特徴とする請求項1記載のシステム。
  5. 【請求項5】 前記処理サブシステムは、概念を用いて前記シソーラスの複数のサブセット内
    の用語間の関連性を確立することにより、前記シソーラスの複数のサブセットを
    ひとつの一体化されたシソーラスとして統合化することを特徴とする請求項1記
    載のシステム。
  6. 【請求項6】 前記処理サブシステムは、更新モジュールをさらに備え、この更新モジュール
    は、シソーラスの項目に関する変更もしくは修正に関する情報を入力として受信
    することを特徴とする請求項1記載のシステム。
  7. 【請求項7】 前記処理サブシステムは、一つあるいは複数のシソーラスのサブセットをアク
    ティブなサブセットとして指定することを特徴とする請求項6記載のシステム。
  8. 【請求項8】 前記更新モジュールは、変更を、アクティブとして指定されたシソーラスのサ
    ブセットの間でのみ遂行することを特徴とする請求項7のシステム。
  9. 【請求項9】 前記出力サブシステムは、検索された項目を、それら項目がどのシソーラスの
    サブセットから検索されたかについては無関係にまとめて表示することを特徴と
    する請求項1記載のシステム。
  10. 【請求項10】 前記出力サブシステムは、検索された項目を、その項目が検索されたシソーラ
    スのサブセットの指標と共に表示することを特徴とする請求項1記載のシステム
  11. 【請求項11】 前記出力サブシステムは、HTMLモジュールをさらに備え、このHTMLモジュール
    は、検索された項目を含むHTMLページを生成することを特徴とする請求項1記載
    のシステム。
  12. 【請求項12】 前記HTMLモジュールによって生成されるHTMLページは、表示された項目とそれ
    と関連する用語との間の関連性のリストをさらに含むことを特徴とする請求項1
    1のシステム。
  13. 【請求項13】 前記出力サブシステムは、それぞれの関連の出力の方法を指定する一つあるい
    は複数のフィルタをさらに備えることを特徴とする請求項1記載のシステム。
  14. 【請求項14】 前記HTMLモジュールは、フィルタを検索し、検索されたフィルタに従ってHTML
    ページを生成することを特徴とする請求項12あるいは13に記載のシステム。
  15. 【請求項15】 更新処理システムをさらに備え、これが完全性制約を検索することを特徴とす
    る請求項1記載のシステム。
  16. 【請求項16】 前記更新処理システムは、シソーラス項目の間の関連について以下の完全性制
    約、すなわち、一対一、一対多数、多数対一、多数対多数、トランジティブ、再
    帰的、非再帰的、あるいは対称的制約、あるいは以前の関連と関連付けることが
    できる用語のタイプを指定する制約の、任意の一つあるいは複数を適用すること
    を特徴とする請求項15記載のシステム。
  17. 【請求項17】 前記更新処理システムは、さらに、シソーラスのサブセット内の項目間の完全
    性制約の違反を検出することを特徴とする請求項16記載のシステム。
  18. 【請求項18】 前記更新処理システムは、シソーラスのサブセットの変更に応答して前記違反
    を検出することを特徴とする請求項17記載のシステム。
  19. 【請求項19】 前記出力サブシステムは、完全性制約の違反に応答して、以下の一つあるいは
    複数の動作、すなわち: 制約に違反した項目のリストとその項目の修復に関連するオプションのリスト
    から構成される違反の通知を生成する動作; ユーザからの修復のオプションの提示に応答して、選択された修復のオプショ
    ンに従って、シソーラスのサブセット内の一つあるいは複数の項目を編集する動
    作;および 自動修復を指定する標識を持つ完全性制約を見つけた場合、その完全性制約に
    従って一つあるいは複数の項目を編集する動作、を遂行することを特徴とする請
    求項17記載のシステム。
  20. 【請求項20】 シソーラスあるいはシソーラスのサブセット内の項目同士の相関づけを行なう
    ための方法であって、 相関づけをすべきシソーラスの項目を含む相関リクエストを受信するステップ
    と; 前記相関リクエスト内に提示される項目に対する相関候補を探索するステップ
    と; 相関候補が見つかった場合、ユーザに、探索において見つけられた相関候補の
    リストを提供するステップと; ユーザの選択に応答して、前記リクエスト内の項目を選択された相関候補に併
    合するステップと、 を備えたことを特徴とする方法。
  21. 【請求項21】 前記相関候補を探索するステップは、 前記相関を調べられるている項目と以下の一つあるいは複数の所定の相関関連
    性を持つ項目、すなわち: 用語が一致する; 推奨語が一致する; 代替語が一致する; 代替語間の文字列が重複あるいは類似する; 前記相関を調べられている項目の推奨語と意味が一致あるいは類似する;ある
    いは 前記相関を調べられている項目の代替語と意味が一致あるいは類似する全ての
    項目を検索するステップ;および 各相関関連性に対するリストを生成するステップを含み、このリストが、関連
    性と相関重みを満たす全ての検索された項目を含み、前記相関重みが、検索され
    た項目と相関を調べられている項目との関連性に基づいて決定され; さらに、 生成されたリストを、その中では各項目がたった一度しか現われない単一のリ
    ストに結合するステップを含み、このとき、複数のリスト内に項目が出現する場
    合は、その項目の相関重みを加算することでその用語に対する新たな相関重みが
    形成され; さらに、 関連付けられている用語間の重複を決定するために前記リスト上の各項目にグ
    ラフ同形性テストを適用するステップと; ある項目が関連付けられている概念の間に重複を持つことが見つかった場合は
    、その項目の相関重みを増加するステップと、を含み、この増加は用語間の重複
    の量に基づいて変えられ; さらに、 相関候補のリストを作成するステップを含み、ここで、相関候補は、指定され
    る重みカットオフ値より大きな重みを持つ項目を表す; ことを特徴とする請求項20記載の方法。
  22. 【請求項22】 前記単一のリストから、相関を調べられている項目と同一のシソーラスあるい
    はシソーラスのサブセット内に格納されている全ての項目を除去するステップを
    さらに含むことを特徴とする請求項20記載の方法。
  23. 【請求項23】 前記単一リスト内の用語に文字列類似性フィルタを適用するステップをさらに
    含み、このフィルタの適用によって、相関を調べられている項目の代替語あるい
    は推奨語と類似する文字列を持つ推奨語あるいは代替語を持つ項目が見つけられ
    ることを特徴とする請求項22記載の方法。
  24. 【請求項24】 前記文字列類似性フィルタの適用によって、さらに、失われた、追加された、
    あるいは転置された文字を持つ推奨語あるいは代替語を持つ項目が見つけられる
    ことを特徴とする請求項23記載の方法。
  25. 【請求項25】 前記文字列類似性フィルタの適用によって見つけられた項目の相関重み値が増
    加されることを特徴とする請求項24記載の方法。
  26. 【請求項26】 シソーラスの項目の間の意味の同等性を決定するための方法であって、この方
    法が: シソーラスの類似の意味を持つ項目のペアを見つけるステップを含み、ここで
    、これら項目のペアは、そのペアの各項目とそのペアと関係する他の項目との間
    のリレーションから、ある意味を共有する可能性があると識別されたとき、類似
    の意味を持つものと見なされ;この方法がさらに 見つけられた用語をそのシソーラス内で単一の用語に併合するステップを含む
    ことを特徴とする請求項26記載の方法。
  27. 【請求項27】 前記類似の意味を持つペアを見つけるステップは、以下の一つあるいは複数の
    所定の条件を満たすペア、すなわち: 用語が一致する; 推奨語が一致する; 代替語が一致する; 代替語の文字列が重複あるいは類似する; 相関(重複)を調べられている項目の推奨語と意味が一致あるいは類似する; あるいは 相関(重複)を調べられている項目の代替語と意味が一致あるいは類似する; ペアを見つけるとこから成ることを特徴とする請求項26記載の方法。
  28. 【請求項28】 シソーラスの複数のサブセットを管理するための、シソーラスリクエストを受
    信し、シソーラスデータベース内に格納されている項目を見つけ、これを取り出
    すためのコンピュータプログラムを搭載するコンピュータにて読み出し可能な媒
    体であって、前記プログラムが、前記のシソーラスの複数のサブセットを単一の
    統合されたシソーラスとして管理し、検索される項目を表示することを特徴とす
    るコンピュータにて読み出し可能な媒体。
JP2000517360A 1997-10-22 1998-10-20 コンピュータシソーラスマネージャ Pending JP2001521225A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US6313697P 1997-10-22 1997-10-22
US60/063,136 1997-10-22
PCT/US1998/022215 WO1999021110A1 (en) 1997-10-22 1998-10-20 Computer thesaurus manager

Publications (1)

Publication Number Publication Date
JP2001521225A true JP2001521225A (ja) 2001-11-06

Family

ID=22047163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000517360A Pending JP2001521225A (ja) 1997-10-22 1998-10-20 コンピュータシソーラスマネージャ

Country Status (4)

Country Link
EP (1) EP1023679A1 (ja)
JP (1) JP2001521225A (ja)
AU (1) AU1108199A (ja)
WO (1) WO1999021110A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014501988A (ja) * 2011-01-07 2014-01-23 プライマル フュージョン インコーポレイテッド 複合的知識表現の解析及び合成を行うシステム及び方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245070A (ja) * 2001-02-20 2002-08-30 Hitachi Ltd データ表示方法及び装置並びにその処理プログラムを記憶した媒体
US7346614B2 (en) * 2001-10-17 2008-03-18 Japan Science And Technology Corporation Information searching method, information searching program, and computer-readable recording medium on which information searching program is recorded
US10733223B2 (en) 2008-01-08 2020-08-04 International Business Machines Corporation Term-driven records file plan and thesaurus design
KR101716692B1 (ko) * 2015-05-28 2017-03-15 삼성에스디에스 주식회사 비정형 데이터 기반 룰 관리 방법 및 그 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014501988A (ja) * 2011-01-07 2014-01-23 プライマル フュージョン インコーポレイテッド 複合的知識表現の解析及び合成を行うシステム及び方法

Also Published As

Publication number Publication date
WO1999021110A1 (en) 1999-04-29
AU1108199A (en) 1999-05-10
EP1023679A1 (en) 2000-08-02

Similar Documents

Publication Publication Date Title
US6385600B1 (en) System and method for searching on a computer using an evidence set
Schek et al. Data Structures for an Integrated Data Base Management and Information Retrieval System.
US7797336B2 (en) System, method, and computer program product for knowledge management
US6256627B1 (en) System and method for maintaining a knowledge base and evidence set
US6327593B1 (en) Automated system and method for capturing and managing user knowledge within a search system
US5499359A (en) Methods for improved referential integrity in a relational database management system
US7181440B2 (en) Mapping of an RDBMS schema onto a multidimensional data model
US7257593B2 (en) Method for selecting terms from vocabularies in a category-based system
US7844633B2 (en) System and method for storage, management and automatic indexing of structured documents
US20180165253A1 (en) Information architecture for the interactive environment
CA2391750A1 (en) Information system
EP2089814A2 (en) Database system
Baeza‐Yates et al. XQL and proximal nodes
JP2001521225A (ja) コンピュータシソーラスマネージャ
Morris Relational database design and implementation for biodiversity informatics
Yu et al. Metadata management system: design and implementation
EP1158424A1 (en) A system and method for publishing and categorising documents on a network
Cotter et al. Pro Full-Text Search in SQL Server 2008
JP2002297662A (ja) 構造化文書編集方法および構造化文書編集装置および端末装置およびプログラム
Golovchinsky From information retrieval to hypertext and back again: The role of interaction in the information exploration interface
Watson Beginning C# 2005 databases
WO2003042865A2 (en) Taxonomy management
Shayan Cindi: Concordia indexing and discovery system
Sengupta DocBase: a database environment for structured documents
Bryla Oracle Database Foundations: Technology Fundamentals for IT Success

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040416

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040511

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040917