JPH05174066A - 検索システム及びその画面表示方法 - Google Patents

検索システム及びその画面表示方法

Info

Publication number
JPH05174066A
JPH05174066A JP4070593A JP7059392A JPH05174066A JP H05174066 A JPH05174066 A JP H05174066A JP 4070593 A JP4070593 A JP 4070593A JP 7059392 A JP7059392 A JP 7059392A JP H05174066 A JPH05174066 A JP H05174066A
Authority
JP
Japan
Prior art keywords
concept
phrase
search
input
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4070593A
Other languages
English (en)
Other versions
JPH0727532B2 (ja
Inventor
Hiromichi Fujisawa
浩道 藤澤
Junichi Tono
純一 東野
Atsushi Hatakeyama
敦 畠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4070593A priority Critical patent/JPH0727532B2/ja
Publication of JPH05174066A publication Critical patent/JPH05174066A/ja
Publication of JPH0727532B2 publication Critical patent/JPH0727532B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 ユーザの断片的またはあいまいな情報から、
推論的に所望の情報を検索する。 【構成】 概念を表わすための複数の語句および複数の
語句間の関係を表わすための複数の述語を記憶する知識
ベース(430)と、入力手段(220)と、表示手段
(210)と、入力手段から検索キーとなる1つの概念
を示す語句が入力されたとき、知識ベースに基づいて入
力語句と関連してユーザが選択しうる概念を検索し、入
力語句と関係をもつ少なくとも1つの語句と入力語句と
の関係を表わす少なくとも1つの述語とを表示手段に表
示するための処理手段(100)とを備え、表示された
語句と述語の中から所望の語句と述語の組を選択させ、
選択された語句に包摂される新たな語句を入力させるこ
とにより、入力語句と新たな入力語句とが選択された述
語で関連付けられた検索条件を生成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書や図面、あるいは写
真といった情報を一般ユーザが分りやすく記憶・検索・
表示できるような検索システム及びその画面表示方法に
関する。
【0002】
【従来の技術】従来は大量な情報の記憶と検索を可能と
するデータベースの管理や検索の処理は専門家に委ねら
れており、エンドユーザはその専門家を介在して情報の
入手などを行っていた。しかし、近年光ディスク記憶装
置などの小形の大容量記憶装置が実現されるに及んで、
エンドユーザが直接操作するオフィスを対象とした文書
ファイリング装置が実現されている。また、ワードプロ
セッサの普及も進んでおり、大量の文書が電子的な装置
の中に格納されることになった。
【0003】しかしながら、従来の計算機技術ではこれ
らの文書などの物件を、それぞれに付した固有名称や、
標題、著者名といった書誌的事項を表形式で表わして管
理したり、または更にキーワードや分類コードを付与し
て検索しやすくしているが、下記のような問題点があ
る。
【0004】まず、計算機のファイルシステムではほと
んどの場合、固有名称(20文字程度)でファイルを管
理しているが、思い出しやすいように名称を付すことが
難しく、更にその文字列から中身を想像しながら欲しい
ファイルを探し出すことは、作成した本人でも極めて難
しい。
【0005】書誌的事項は客観的事者であるため登録す
る場合には難しさはないが、これを検索手段に用いる状
況は少ない。引用書類・参考文献として明確に分ってい
る場合などに限られる。
【0006】文書などを引出す多くの場合は、あいまい
にしか憶えていない標題や、その文書の内容が手掛りと
なる。このために、キーワードや分類コードが用いられ
るが、まず文書を登録するときにこれらを付与すること
が難しい。すなわち、何をキーワードとすれば後で適切
に選び出せるかは難しい問題である。たとえば色々な角
度から検索可能とするために沢山のキーワードを付与す
ると、検索時に不要なものが多く出て来てしまう。少な
ければ正しく選び出されるかどうか分らなくなる。従
来、文献データベースなどでは専門家がキーワードや分
類コードを抽出し、付与している。
【0007】更に、検索するときに、キーワードを想起
することも難しい。例えば、文献検索などの場合、キー
ワードからなる検索式を作るに際して、総目録から欲し
いものと似ている文献を探し出し、それについているキ
ーワードを拾い上げて、参考にするという手順を踏むこ
とも稀ではないことからも想定することの難しさが分
る。
【0008】更にまた、分類による文書ファイリング
も、分類木(階層木)あいまい性や、細分化していった
場合の分類木の交錯(一つの文書が多重に分類される)
が発生するという問題がある。また、分類の規準は時間
と共に変って行き、数年経つと全く役に立たなくなるこ
とが多いことも問題である。
【0009】以上のように、従来技術による文書などの
ファイリング方式では、特にエンドユーザにとって管理
と検索をやりやすくすることが極めて重要な課題となっ
ている。
【0010】これらの課題に対して文献〔ジェ.エフ.
ソワ:“コンセプチュアル グラフズ フォー ア デ
タ ベース インターフェース”アイビーエム ジエ.
リサーチ アンド デベロプメント,ボル.20,19
76ピピ336〜357(J.F. Sowa:“Conceptual gr
aphs for a Data Base Interface,”IBM J. Research a
nd Development, Vol.20, 1967, pp.336-357)〕に、検
索を自然言語で行う場合の検索条件の図式化方法と形式
的検索条件式の導出方法が提案されている。また、文献
〔エフ.エヌ.トゥ.エト オル,“ラビット:アン
エンチリジェント データベース アシスタント”,プ
ロシーデングス オブ ナショナルエンフェレンス オ
ブ エエエアイ,1982,ピピ:314−318(F.
N. Tou, et al. “RABBIT : An Intelligent Database
Assistant, ”Proceedings ofNational Conference of
AAAI, 1982, pp.314-318)〕では、データベースの中
身に関する知識を計算機から提示することにより、検索
条件式を作る支援を行う方法が提案されている。これら
の方法は、データベースの検索の支援にのみ注目したも
のであり、データの入力、更新といった情報の格納に対
する支援は含まれていない。
【0011】
【発明が解決しようとする課題】エンドユーザによる文
書のファイリングにおいては、新しい文書の登録や、フ
ァイル体系の保守(分類の適切さの見直しなど)なども
検索しやすくするためには重要であり、上記の提案方法
では不十分である。
【0012】さらに、検索に際しても次のような問題が
残っている。すなわち、情報を格納した時点では明確に
なっていなかった新しい概念(見方)によって、古い情
報を見直したり、その見方で検索するための手段が与え
られていない。例えば、数年後に新しい角度から分類し
直したり、人とは違った観点で分類することが求められ
ており、情報記憶装置の使い易さを想定する重要な要素
である。
【0013】本発明の目的は、以上のような問題点を解
決し、エンドユーザがあいまいで、かつ断片的な情報か
ら欲しい文書などを容易に検索することを可能にすると
同時に、文書などの登録を容易にすることにある。
【0014】
【課題を解決するための手段】かかる目的を達成するた
め本発明の検索システムは機械における情報の記憶方式
を人間の記憶特性や意味の捉え方に合致したものとする
ことにより、エンドユーザにとって分りやすく、かつ使
い易い検索システム、例えば文書ファイリング装置など
を提供するものである。
【0015】特に本発明では、後述するような検索条件
の入力支援の目的のため、概念を表わすための複数の語
句および複数の語句間の関係を表わすための複数の述語
を記憶する知識ベースと、入力手段と、表示手段と、入
力手段から検索キーとなる1つの概念を示す語句が入力
されたとき、知識ベースに基づいて入力語句と関連して
ユーザが選択しうる概念を検索し、入力語句と関係をも
つ少なくとも1つの語句と入力語句との関係を表わす少
なくとも1つの述語とを表示手段に表示するための処理
手段とを備えた検索システムであって、表示手段に表示
された語句と述語の中から所望の語句と述語の組を表示
手段を用いて選択させ、選択された語句に包摂される新
たな語句を入力させることにより、入力語句と新たな入
力語句とが選択された述語で関連付けられた検索条件を
生成することなどを特徴とする。
【0016】
【作用】本発明は、具体的には、新しい情報の登録の容
易化、検索条件入力の容易化、あいまい、かつ意味的な
検索の実現、および物の見方の多様性に適応した検索の
実現を可能とするものである。
【0017】これらの実現のために次の新しい機能を与
えた。
【0018】(1)登録支援機能 新しい文書などを登録するには、書誌的事項(著者名,
表題,出典,など)を入力する他、主題や文書の性格な
どを入力する必要がある。また、高度な意味的な検索を
可能とするためには、それらの情報について更に詳しい
情報を追加する必要がある。
【0019】例えば、主題がコンピュータであるとする
と、それはどのようなコンピュータか、どんな特徴を持
っているか、どこの会社が開発したか、その会社はどこ
にあるか、その場所はどの国に属するのか、といった情
報が必要となる。これらの情報が記憶されていれば、
「Aという国にある会社で開発したコンピュータで、B
なる特徴をもったコンピュータに関する文書」を推論機
能を用いることにより検索することが可能となる。
【0020】本発明では、記憶装置内に「コンピュー
タ」や「会社」といった概念に関する知識を記憶させて
おき、新しい情報を追加する際に、どんな属性データを
入れるべきかをユーザに対話的に提示し、短時間で入力
できるようにするとともに、誤った情報が入らないよう
にする。
【0021】更に、既に似た情報を登録してあるときに
は、新たにすべての属性データを入力することなく、似
た物の属性と異なる点のみを入力するような機能を与え
ることにより、入力の容易化を計る。例えば、「中山太
郎」という人間が既に登録されていて、その兄弟の「中
山次郎」を登録する場合を考える。この場合、似ている
概念として「中山太郎」を選択すると、システムはその
属性リストを表示する。例えば、 ((父は中山元雄) (母は中山花子) (生年月日は1960年5月4日) (性別は男) (趣味は音楽) (1) と表示する。ユーザは、これらの内、異なるもののみ、
例えば(生年月日は1963年6月7日)、(趣味はス
ポーツ)と入れるのみでよい。
【0022】(2)検索条件入力支援機能 エンドユーザが検索を行う場合、多くはぼんやりしたイ
メージしか持っておらず、すべてを適格に自然言語など
で表現することは難しい。
【0023】本発明では、対話的に、最も重要な概念か
ら始めて、検索のための情報を逐次追加して行く。この
際に、登録支援機能と同様に、記憶装置内にファイリン
グ対象世界の知識を蓄えておき、それに基づいてユーザ
に、入力可能な属性名と、そこに入り得る概念(事物の
クラス)を提示する。
【0024】例えば、ユーザが欲しい物は「論文」であ
るとすると、まずユーザは「論文」と入力する。記憶装
置は「論文」から、それは著者,表題,主題といった属
性があることを知り、端末上に、それらの属性名称と概
念の組、例えば(著者,人名)、(表題,テキスト)、
(主題,概念)を呈示する。ユーザはそれらを見て、自
分が情報として持っているものを選択して、データを入
力する。例えば「主題」を選択して「コンピュータ」と
入力する。この過程は回帰的に繰返すことができる。例
えば、主題が「コンピュータ」であるとすると、システ
ムは(開発者,組織,会社)、(走る言語,コンピュー
タ言語)、(OS,OS)などを呈示し、ユーザは例え
ば、(走る言語,LISP)と入力し、条件を付加する
ことが出来る。
【0025】このような支援機能により、例えば「LISP
が走るコンピュータに関する論文で、A社の社員が書い
た論文」(2)といった検索条件を設定することができ
る。後に詳述するように、同検索条件を本発明方式では
形式的に以下のような表現式で表わす。
【0026】 (TECHNICAL-PAPER (SUBJECT-IS (COMPUTER (RUNS LISP))) (AUTHOR-IS (EMPLOYEE (WORKS-AT A-COMPANY)))) (3) これは日本語でも表現でき、次のように書く。
【0027】 (論文(主題は (コンピュータ (走る言語は Lisp))) (著者は (社員(所属は A社)))) (3) なお、上記の記法はLisp言語におけるS式(symbolic e
xpression)〔文献:ピー.エッチ.ウィンストン“リス
プ”アディション−ヴェスレイ パブリッシングカンパ
ニー 1981,ピー18(P. H. Winston, “LISP,”
Addison-Wesley Publishing Co., 1981, p.18)〕の書方
に準処する。
【0028】(3)意味的あいまい検索機能 ユーザがある物件を検索したいと思ったときに、普通は
断片的な情報で、かつあいまいなものしか持っていな
い。一方、記憶装置(データベースなど)には極めて具
体的な名称で記憶されている。したがって、これらのギ
ャップを解消することが求められている。
【0029】この場合、大きく分類して、あいまい性に
は次の5種類がある。
【0030】(i)名称の不完全性 事物又は概念の名称の一部分しか憶えていない。
【0031】(ii)同義語 同一の事物を異なる単語で憶えていることが多い。例え
ば、「人工知能,人工頭脳,AI」などは同一概念を指
している。
【0032】(iii)数の不完全性 数値を厳密に憶えていることは稀である。
【0033】「1980年代、85年ごろ、83年から
87年の間、1960年以前」などはその例である。
【0034】(iv)概念の抽象化(その1) 事物や概念は、その上位の概念で憶えて、その具体的な
ものは忘れることが多い。ここで、上位の概念とは、分
類(クラスタリング)によることが多い。「会社名は忘
れたが、その組織は大学や研究所ではなく、とにかく会
社であった」、あるいは「あれは電機メーカであった」
はその例である。
【0035】この場合、その電機メーカを、例えば“A
BC株式会社”とすると、 (ABC株式会社 IS−A 電気メーカ) (電気メーカ IS−A 企業) という関係式が成り立つ。図式的には、概念「ABC株
式会社」と概念「電気メーカ」が「IS−A」というリ
ンクで結ばれることになる。ここで、リンク「IS−
A」は上記二つの概念の間に定義される関係(relation
ship)で包摂関係という。
【0036】一般にすべての概念はIS−Aリンクによ
って階層的に分類されると考えられる。その階層木を概
念木と呼ぶことにする。
【0037】(v)概念の抽象化(その2) 前項の抽象化は概念の集合論的抽象化であるが、人間は
概念の部分関係における上位の部分で憶えていることも
多い。例えば、「A氏の所属はどの工場か忘れたが、と
にかくABC株式会社であった」、あるいは「あれは何
市か忘れたが埼玉県であった」ということがある。
【0038】普通、事者を格納するデータベースには
「A氏はXYZ工場の所属である」とか、「ABC株式
会社は所沢市にある」とか記憶されており、従来の情報
検索の技術では上記例のあいまいな情報からでは検索す
ることが出来ない。
【0039】この場合、 (ABC株式会社 HAS−PART−OF XYZ工場) (埼玉県 HAS−PART−OF 所沢市) という関係が重要な役割を果す。ここで注意すべきこと
は、 (所沢市 IS−A 埼玉県) ではなく (所沢市 IS−PART−OF 埼玉県) であり、概念的な包摂関係(上下関係)と明確に区別し
て把握することである。関係「IS−PART−OF」
は関係「HAS−PART−OF」の裏返しの関係であ
る。
【0040】厳密には、方向性をもった関係(IS−P
ART−OFやHAS−PART−OF)はrelationと
呼び、それらをまとめて方向性をなくした関係(そのリ
ンクとしての存在)をrelationshipと呼ぶことにする。
上記例ではIS−PART−OFとHAS−PART−
OFは「部分全体関係」(Part-whole relationship)
と呼ばれている。
【0041】人間の記憶に関する特性には、上記5種類
のあいまい性の他に、概念間の関係の方が概念自体より
も記憶に残りやすい、という特性がある。たとえば、
「ある記事の主題はオペレーティングシステムであった
が、それは米国の研究所で開発された」という断片情報
からの検索では、「開発された」という事実が重要であ
り、それは同オペレーティングシステムと同研究所とい
う二つの概念の間に定義される「関係」である。具体的
には、 (UXオペレーティングシステム IS−DEVELOPED−BY B研究所) という関係式で表わされ、IS−DEVELOPED−
BYはrelationである。意味的なあいまい検索では、こ
の「関係」が重要である。
【0042】以上述べた人間の記憶上の特性の内、名称
の不完全と数の不完全性については従来の情報検索にお
いても勘案されている。例えば、部分文字ストリングの
マッチング機能や、数値範囲指定などが知られている。
【0043】本発明の特徴とする意味的あいまい検索機
能は上記分類の内、特に抽象化概念(その1、およびそ
の2)の扱いにおいて新規性がある。すなわち、前記し
た検索条件入力支援機能を用いることにより、次のよう
な意味的あいまい検索が可能である。
【0044】検索条件:「埼玉県にある会社が開発した
コンピュータで、ある研究所が開発したオペレーティン
グシステムが走るものに関する記事」…(4) ここでは、条件文に現われている具体的な概念は「埼玉
県」のみであり、その他にキーワードになりそうな単語
は抽象的な「コンピュータ」,「研究所」,「オペレー
ティングシステム」などである。従来の情報検索方式、
たとえばキーワード検索では十分な検索情報を得ること
が出来ない。
【0045】条件文(4)には埼玉県と会社、会社とコ
ンピュータ、オペレーティングシステムとコンピュータ
などのそれぞれの間の関係をも検索情報として扱ってい
る意味で「意味的な検索」であり、また会社、コンピュ
ータ、オペレーティングシステムなどは一般名称(抽象
的概念)であるという意味で「あいまいな検索」を実現
していることになる。従来の検索方式では、キーワード
間の関係を記述していないため、例えば「埼玉県にある
研究所が導入したコンピュータで、ある会社が開発した
オペレーティングシステムが走るものに関する記事」も
同時に含まれてしまい、その意味で「意味的でない検索
方式」である。
【0046】
【実施例】以下、本発明を実施例にもとづいて説明す
る。
【0047】図1は本発明方式の一実施例である情報記
憶方式を採用した画像情報ファイリング装置の構成図で
ある。装置全体の構成と動作の概要を説明する。
【0048】まず、装置は制御装置(CPU)100、
主メモリ300、磁気ディスク装置群400、操作端末
200(CRT210、キーボード220、マウス23
0)からなるデータ処理部と、画像スキャナ700、画
像プリンタ750、光ディスク装置450、画像バッフ
ァメモリ350、高速画像処理回路(IP)600、お
よび高精細画像表示装置500からなる画像情報処理部
とから成る。また、これらはバスアダプタ805を経由
して接続されている。
【0049】主な動作は、画像情報の文書などからの登
録、欲しい情報の検索表示・出力、およびファイリング
対象となる分野に関する知識の入力・編集である。文書
画像の登録では、スキャナ700から文書画像をメモリ
350に読み込み、IP600により圧縮符号化した上
で光ディスク450に格納する。そのとき、メモリ上の
画像をCRT500上に表示し、正しく読み取られたか
否かをチェックするとともに、同文書の書誌的事項(表
題、著者、出典など)と分野知識における位置付けなど
も端末250から入力する。書誌的事項、該文書画像の
光ディスク上での物理アドレス(バックアドレス、トラ
ックアドレス、セクタアドレス)および画像の属性(大
きさ、走査密度、符号化方式など)の情報はファイル4
20に格納する。また、同文書の分野知識での位置付け
などの情報はファイル430に格納する。
【0050】検索・表示では、後述する検索のための対
話により欲しい文書を端末250上で固定することによ
り、画像表示用CRT500に表示する。ハードコピー
が欲しい場合はプリンタ750から出力する。固定され
た文書は所在情報(光ディスクの物理アドレスなど)は
ファイル420内から読み出され、光ディスクの読出し
制御コマンドとして、バスアダプタ805経由で光ディ
スク制御回路455へ送られる。読出された画像データ
は一担メモリ350に貯えられ、表示されるページの画
像がIP600により逐次復号化される。
【0051】マウス230はCRT210およびCRT
500双方に対して位置指定することが可能であり、画
像のCRT500上での表示位置を該マウスで指定でき
る。この機能を用いて、複数のページの文書をCRT5
00上の任意の位置に重ねて表示することもできる。多
数のページを同一画面に表示するために、1ページ分の
文書画像をIPで縮小して表示することもできる。CR
T上の画面の管理はCPU100で行う。
【0052】分野知識の入力・編集は、必要に応じて文
書をCRT500に表示しながら、端末200上で行
う。分野知識とは、登録する、または登録してある文書
に記述されている世界に関する概念および概念間の関係
として記述される事実の集合である。更に、概念や関係
を表現する自然言語に関する知織も含まれる。当然、上
記世界には文書自身も概念の一つとして含まれる。これ
らの知識はファイル430に格納される。
【0053】以上述べた3つの主な機能はモードレス
で、いつでも任意に呼び出すことが出来る。例えば、分
野知識の追加編集を行っている際中に、必要な情報を検
索機能を用いてCRT500上に呼び出したり、あるい
は文書画像の登録を行っている際中に、同文書内容に関
する知識を追加したりすることが出来る。
【0054】次に、分野知識データ表現形式の説明をす
る。知識は事物を含めた概念と、それらの間の関係とい
う二つの種類の要素で表現する。図2は概念的に意味ネ
ットワーク(Semantic Network)の形に表現した図式で
ある。楕円で表わすノード(節)は概念を表わし、中に
書かれている単語は同概念を表わす代表単語である。概
念名称という。楕円と楕円を結ぶリンク(実線または破
線で表わす矢印)は概念と概念の間の「関係」を表現す
る。たとえば、スーパーコンピュータ1012はコンピ
ュータ1011の「一種である」ということが、IS−
Aというリンクによって表わされている。ここでUNI
VERSAL1010は特別な概念で、すべてを包摂す
るものとして定義する。従って、すべての概念はUNI
VERSALを根(root)とした概念木(concept tre
e)を構成し、分類階層(taxonomic hierarchy)を表わ
している。IS−Aは「関係」の一種ではあるが、概念
の属性を下位概念へ継承させる道節になっており、その
意味で他の「関係」と別けて考える。したがって、図2
においても矢印を実線と破線に別けて記している。
【0055】たとえば、「コンピュータはソフトウェア
を走らせる」という一般的な属性がある。同時にそれは
裏返せば「ソフトウェアはコンピュータ上で走る」とい
う属性である。ここでは、これらを「一般関係」(gene
ric relationship)と呼ぶことにする。形式的には (コンピュータ RUNS ソフトウェア) (ソフトウェア RUNS-ON コンピュータ) (5) と表わされる。これら一般関係は次のように下位の概念
に継承される。すなわち、「スーパーコンピュータはソ
フトウェアを走らせる」、「X−800はソフトウェア
を走らせる」、あるいは「オペレーティングシステムは
コンピュータ上で走る」、「UXはコンピュータ上で走
る」と言うことができる。これらの関係は一般関係
(5)から導き出されるものであり、知識ベースには直
接記述しない。
【0056】図2において、概念「X−800」と「U
X」を結ぶ関係1005は、上記一般関係と異なり、こ
れら2つの概念間に定義される固有の関係であり、「具
体関係」(instance relationまたは単にrelation)と
言う。但し、具体関係1005は一般関係1004の具
体化したものである。
【0057】このようにして、ある記事「ART#01
8」1018の主題がスーパーコンピュータX−800
であり、同スーパーコンピュータではオペレーティング
システムUXが走るという事実が、図2に示す図式で表
わされることになる。また、すべての概念はIS−Aリ
ンクという縦糸で、また一般的関係および具体関係とい
う横糸で結ばれ、全体として概念ネットワークを構成し
ている。
【0058】ここで注目すべきことは、概念に付随する
属性をその概念の側からのみ見るのではなく、属性に現
われる概念からの見方も対等に与えている点である。こ
れは、「属性」という見方を改めて、2つの概念間に定
義される「関係」という見方を採ることによって、しか
もその関係は両側面から見ることが出来るようにするこ
とによって成されている。これにより、例えば記事AR
T#018とその主題X−800を登録すると、同時に
「X−800は記ART#018に載っている」という
ことが登録されることになる。
【0059】以上の知識表現をより形式的に図3のよう
に表現することができる。システムは、概念C、包摂関
係S、一般関係R、具体関係rという4種類のデータの
形式でこれらを記憶し、管理する。C(i)はi番目の
概念、S(k,i)はC(k)がC(i)の一種である
ことを、R(m)はm番目の一般関係、またr(m,
k,l)はR(m)の具体化した関係、すなわち具体関
係であり、C(k)とC(l)との間に定義されたもの
であることを表わす。
【0060】更に具体的には、これら4種のデータは表
形式で表わされ、実体関係モデル(Entity Relation Mo
del:ERモデル)の図式で表わすと図4の如く表現でき
る。ここで、概念Cと一般関係Rとは実体として捉え、
包摂関係Sと具体関係rをこれら実体を結ぶ関係として
捉えている。一般関係Rは具体関係rのクラスを定義す
るものであり、ここでは実体として考える。これらの具
体的な表形式を図5〜図8に示す。表の内容は図2を表
わす。
【0061】図5は概念を表わす言葉を定義する表(ta
ble)であり、基本的には概念固有番号C#と、それを
表わす言葉(単語;又は表記)CNAME、および同表
記CNAMEが基本表記(Primary)であるか二次的表
記(Secondary)であるかを表わすカラムとからなって
いる。例えば、概念#58は「コンピュータ」であり、
表記としては「計算機」も与えている。
【0062】図6は包摂関係Sを表わし、概念固有番号
C#と、該概念の上位の概念(Superclass)の固有番号
S#のカラムから成っている。特殊な場合として「UN
IVERSAL」の上位概念は「UNIVERSAL」
として定義されている。
【0063】図7は一般関係Rを定義する表である。一
般関係固有信号RS#、同関係の名称RSNAME、同
関係を左から右へ読んだときの読みLR、および右から
左へ読んだときの読みRLとからなる。但し、ここで
「左から右へ」とは、同関係が結ぶ2つの概念を左右に
並べる基本形に対してであり、その基本形は図8で説明
する具体関係rの表で定義する。表Rでは、例えば16
番の一般関係として「SUBJECT」という関係があ
り、 IS−SUBJECT−OF 又は SBUJECT−IS という具体関係として用いられることを表わしている。
【0064】ここで特記すべきことは、同じ読みの関係
が区別して異なるものとして定義されていることであ
る。例えば、図7で2つのHAS−PART−OFがあ
るが、これらは関係PART−WHOLE1とPART
−WHOLE2という異なる関係に対するものである。
この意味は、「部分全体関係」(part-wholerelationsh
ip)でも異なる概念に対するものは区別して扱うことに
ある。例えば、PART−WHOLE1は「組織」に対
する関係で (ABC株式会社 HAS−PART−OF XYZ工場 (6) という場合に適用し、PART−WHOLE2は「地
域」に適用し、 (埼玉県HAS−PART−OF 所沢市) (7) という関係を表わすのに用いる。
【0065】図8は概念間に定義される関係rを表わす
表である。同表には一般関係と具体関係の双方が登録さ
れる。カラムG/Iはそれらを区別するためのもので、
Gは一般関係、Iは具体関係であることを示す。
【0066】表rにおいて、各レコードは関係固有番号
R#、関係の種類を示す一般関係固有番号RS#、基本
形において左側に位置する概念の固有番号CL、同じく
右側に位置する概念の固有番号CRなる要素をもつ。
【0067】たとえば、関係#4は概念#58(「コン
ピュータ」)と概念#64(「ソフトウェア」)とに定
義される一般関係(G/I=G)であり、一般的関係#
7で定義される意味をもつ。より具体的には、 (コンピュータ RUNS ソフトウェア) (ソフトウェア RUNS−ON コンピュータ) (8) という表面的には2つの関係を、表rにおいては1つの
レコードが表わしている。同様に、関係#724は一般
関係#7の具体化したものであり、概念#1512と#
1051とを結んでいる。すなわち、表Cから分るよう
に (X−800 RUNS UX) (UX RUNS−ON X−800) (9) という関係を表わす。
【0068】以上説明した4つのデータ(表C,S,
R,r)が知識ベースとしてファイル430に格納され
る。
【0069】次に、文書画像を定義する表Dについて図
9で説明する。表Dは文書固有番号D#、概念固有番号
C#、文書サイズSIZE、圧縮符号化方式CODE、
画像走査密度DENS、光ディスク上の物理アドレスP
HYSA、および記録セクタ数LENGなるカラムを持
っている。図9で示すレコードは、文書#98は、概念
#313(記事ART#018;図5参照)に関するも
ので、A4サイズであり、16本/mmの走査密度でス
キャンされ、MH符号で圧縮されて、光ディスクの40
0207番地以降13セクタに格納されていることを示
す。
【0070】これから分かるように、すべての概念に対
して文書画像を付加することが可能であり、これにより
必ずしも“文書”ではなくても、例えば「コンピュー
タ」にその説明を画像で付随させることができる。また
同時に、一つの概念に複数の異なる文書を付随させるこ
とも可能である。
【0071】表Dは図1におけるファイル420に格納
し、管理する。
【0072】以上、本発明実施例の装置構成と、データ
表現形式の説明を行ったので、以下にソフトウェァ構成
と処理方式とを提示する。図10にソフトウェア構成図
を示す。ここで、該ソフトウェアは制御装置100(図
1)が処理するものであり、プログラムはファイル41
0に格納されている。
【0073】図10に示す如く、ソフトウェアは、対話
制御モジュール2001、探索・概念マッチングモジュ
ール2002、検索式生成モジュール2003、概念ネ
ットワークエディタ2004、ネットワーク跋渉モジュ
ール2005、表操作モジュール2006、画像表示モ
ジュール2010とから成っている。
【0074】基本部分である表操作モジュールの機能か
ら説明する。表操作モジュールの目的は、先に説明した
表形式のデータを高次レベルで操作したり、検索したり
する機能を提供することである。以下に主な関数を説明
する。なお、プログラムはLISP言語で書かれてお
り、以下S式を用いる。なお、理解しやすくするため、
変数と関数は小文字で、定数は基本的には大文字で表記
することにする。
【0075】まず、新しく表を作成する関数としてcrea
te-tableがある。例えば図7の表Rは次のように同関数
を呼ぶことにより、その枠組が新たに定義される。
【0076】 (create-table'R '(RS# RSNAME LA RL)) (10) ここで、第1引数は表名称、第2引数はカラム名称のリ
スト(集合)である。また、記号’(引用符号)は、次
の記号は変数ではなく定数であることを意味する。
【0077】次に、表にレコードを追加するにはinsert
関数がある。
【0078】 (insert 'R '(RS# RSNAME LR RL '((7 RUN RUNS RUNS-ON) (15 DEVELOPMENT HAS-DEVELOPED IS-DEVELOPED-BY) (16 SUBJECT IS-SUBJECT-OF SUBJECT-IS))) (11) とすることにより、図7の表Rの3レコードが追加され
ることになる。
【0079】レコードの更新はupdate関数を用いる。例
えば (update 'R 'RSNAME "THEME '(eq (v RS#) 16)) (12) とすることにより、表RにおいてカラムRS#の値が1
6であるレコードのカラムRSNAMEの値を’THE
MEにすることができる。レコードの削除は次式の如く
行う。
【0080】 (delete 'R'(eq (v RS#) 16)) (13) 第2引数は(12)式と同様条件項であり、up dateお
よびdeleteとも、任意の命題関数を書くことができる。
【0081】レコードの選択(すなわち検索)はselect
関数を用いる。
【0082】 (select '(LR RL 'R '(Smatch '*SUBJ (v RSNAME))) (14) 例(14)式では、部分文字列*SUBJと表RのカラムRSN
AMEとが部分的に一致するレコードを選択し、結果とし
て同レコードのカラムLRとLRの値のリストを返す。
ここでsmatchは部分文字列マッチングを行う命題関数で
ある。
【0083】以上、表操作モジュールの主な関数を説明
した。
【0084】次に、ネットワーク跋渉機能と、主な機能
の実現方法について説明する。
【0085】概念ネットワークは図2で説明した如く、
概念ノードと「関係」というリンクとからなっている。
システムは、ユーザの興味の中心である概念をカレント
ノード(current node)として記憶している。ユーザ
は、以下説明する機能を用いながら、ネットワーク中を
歩き回る(跋渉する)ことができる。ここで歩き回ると
いうことは、カレントノードを移動することに等しい。
【0086】ネットワーク跋渉機能の主なものを説明す
る。
【0087】カレンノードを移動させる手段の第1番目
に概念名称またはその部分文字列を入れる方法がある。
ここで、もし部分文字列にマッチングする概念が複数あ
った場合には、メニュー表を表示して、ユーザがその中
の一つを選択することができる。その結果へカレントノ
ードは移される。図11は部分文字列*DATABASEにマッ
チングする概念が表示されて、該メニュー表の7番目を
選択した例を示す。ここで*記号は以降の文字列が部分
文字列であることを示す。上記機能は、 (select'(C# CNAME) 'C '(smatch str (v CNAME))) (15) とすることにより概念を選択し、別途メニュー選択用の
関数(select-one a-list)を呼ぶことにより実現され
る。ここで、strは端末から読み込んだ文字例である。
【0088】第2番目の跋渉手段は、概念木(階層木)
をメニュー選択により順次辿っていく方法である。図1
2は最上位概念において直接下位の概念をメニューとし
てlコマンドで表示したものである。以降、図13に示
すように、番号を入力することにより階層木を下って行
くことができる。図13の例では、「6,1,1,2」
と入力することにより「組織(Organization)」という
概念に辿り付いている。この地点で、先の部分文字列を
入力すれば、カレントノードの下に含まれる概念集合の
中からのみ、同部分文字列にマッチングする概念が選ば
れることになる。例えば、図11で現われた11個の概
念の内、11番目の「RELATIONAL-DATABASE-SYSTEM-IN
C」は会社名であり、これのみが選択されることにな
る。すなわち、これだけが「組織」という概念に包摂さ
れている。
【0089】ここで、ある概念Cが包摂する概念は次の
ように得られる。まず、 (Select'(C#) 'S'(eq (v S#) c)) (16) により該概念に直接包摂される(概念木で直下に位置す
る)概念が選び出される。従って、同機能を回帰的に繰
返して呼ぶことにより、概念cにより包摂されるすべて
の概念を選びだすことができる。
【0090】次に第3番目の跋渉手段は、概念木をグラ
フィカルに表示しながら行う方法である。図14は「空
間(space)」という概念に始まる、その下位2層まで
の概念木である。図10におけるCRT210上に表示
される同概念木の任意のノードをマウス230で指示す
ることにより、指示された概念にカレントノードを移動
したり、指示された概念から始まる更に下位の概念木を
表示したりすることができる。ここでマウスで指定した
りすることができる。ここでマウスで指定したCRT上
の位置情報は図10に示す対話制御部2001が受取
る。該制御部はグラフィック表示を司どるので、CRT
の各位置に何を表示しているかを記憶しており、位置情
報を入力することにより、同地点の最近点にどの概念を
表示しているかが分る。従って、制御部2001はカー
ソル位置情報を入力して、概念名称をネットワーク跋渉
部2005へ返す。
【0091】グラフィカルな跋渉機能は、図14に示す
概念の包摂関係のみでなく、部分全体関係(part-whole
relation)によっても行える。図15は概念「地球(e
arth)」の部分を階層的に、別な意味での概念木として
表示したものである。上記例と全く同様に、部分全体関
係に沿って、歩き回ることができる。部分関係は次のよ
うに抽出することができる。まず、 (select'(RS#) 'R '(eq (v LR) 'HAS-PART-OF)) (17) は図7表Rより部分全体関係を表わす一般的関係番号R
S#の集合を返す。図7の例では(2223)を返す。
これを変数xに一時記憶させる。
【0092】いま、部分を見い出したい概念をcとする
と、cが持つ「部分」となる概念は次式で得られる。
【0093】 (select'(CR) 'r '(and (eq (v CL) c) (member (v RS#)x))) (18) ここでrは小文字であるが図8の表の名称である。
【0094】同様に、HAS−PART−OFが図7表
RのカラムPLにある場合についても、(17)式と
(18)式におけるLRとRLを交換して実行すること
により、概念cの部分概念が得られる。
【0095】第4番目の跋渉手段は、概念のフレーム表
現を介在した連鎖的跋渉である。図16の例で説明す
る。人名の部分文字列*sovaを入力し、唯一に「J. F. S
OWA」が見つかり、カレントノードが同概念に移動す
る。フレーム表示のためのfrコマンドにより同概念の
フレームが表示される(オペラント*はカレントノード
のフレームを表示することを意味する)。同フレームか
ら「J. F. SOWA」は「男(MAN)」であり、PAPER #
0012と BOOK # 0007の著者である、ということなどが
分る。ここで、例えば、PAPER # 0012は何んであるか
知りたいというときには、コマンド「fr2」を投入す
ることにより、表示されているフレームの第2行目の概
念のフレームが表示される。この例では、PAPER # 001
2は「論文(TECH-PAPER)」であり、著者が「J. F. SOW
A」、ページは336から357までで、「IBM−R
ES&DEV−76−20」に載っているなどというこ
とが分かる。図16の例では、同様な手続きでJ. F. SO
WA→PAPER # 0012→IBM−RES&DEV−76−
20→IBM−CORPとカレントノードを移動させて
いる。
【0096】フレームの表示は以上のように行う。い
ま、概念cのフレームを表示することにすると、 (select'(RS # CR) 'r '(eq (v CL) c)) (19) は、関係の基本形においてcが左にある「関係」とその
ときの右側の概念のペア(組)の集合が得られる。同様
に、 (select'(RS # CL) 'r '(eq (c CR) c)) (20) は、cが右にある「関係」とそのときの左側の概念のペ
アの集合が得られる。これらの値(集合)をそれぞれ
x,yとすると、 (select'(LR) 'R '(eq (v RS#) x1i)) (21) (select' (RL) 'R '(eq (v RS#) y1i)) (22) はそれぞれ具体関係の名称を結果として返えす。
【0097】但し、xi,yiは集合x,yのi番目の要
素で、更にx1iはxiの第1要素、y1iはyiの第1要素
である。この具体関係の名称はフレーム(図16)の第
1カラムに対応する。すなわち、フレームの各行をスロ
ットと言うときのスロット名である。フレームの第2カ
ラムはスロット値(slot value)であり、各ペアxi
iの第2要素x2i,y2iである。従って、スロット名
とスロット値のペアを作り、表形式に表示すれば、図1
6の如くなる。ここで内部的には概念は概念固有番号で
扱っているので、表示する際には表C(図5)から概念
名称に変換してから表示する。
【0098】上記例では行番号(スロット番号)を指定
して次のフレームへ飛んでいるが、マウスによって直
接、飛んで行きたい概念をCRT上で指示することが出
来るし、またフレームは次々重ねて表示することも出来
る。
【0099】次に、図10における概念ネットワークエ
ディタ2004を説明する。
【0100】概念ネットワークエディタは知識ベースの
保守を行うものであり、新しい概念・関係の定義、追
加、変更、削除を行うためのものである。
【0101】図17は新しい概念の追加の対話例であ
る。まず、manとタイプすることによりカレントノー
ドを概念MAN「男」に移し、新しい人間「スーパーマ
ン」を登録する。命令crcにより「MR. SUPERMAN」を
MANの下位に、すなわち、 (MR.SUPERMAN IS-A MAN) (23) として登録できる。次に、命令crrにより、新規に登
録した概念MR. SUPERMANの属性を、具体的な関係という
形式で定義、登録する。
【0102】システムは、一般関係という形式で「人間
は物を新しく考え出すものである」とか、「学位という
ものを持つ」とか、「何か戦をもつ」とかいう「知識」
を持っており、それらの知識を手掛りに入力すべき項目
をプロンプトとして表示する。図17に示すごとく、M
R.SUPERMAN HAS-TITLE-OF (ACADEMIC-TITLE):という
形で、MR. SUPERMANの学位の入力を促す。{ }で示す
概念ACADEMIC-TITLEは、入力されるべき属性(ここでは
一つの概念)のクラスを示している。先に説明した概念
ネットワーク跋渉機能はこの時点で有効であり、この時
点ではカレントノードは概念ACADEMIC-TITLEに移されて
いる。したがって、入力すべき属性を見い出すために任
意の跋渉機能を用いることができる。図17の例では、
直接、概念名称「phd」を入力しているが、同概念を
探し出すために、命令lによりACADEMIC-TITLEの下位の
概念をメニューとして表示(図13参照)することも出
来るし、概念木を表示(図14参照)して欲しい概念を
探し出してもよい。しかし、探索および跋渉はこの場合
は概念ACADEMIC-TITLEの下位の概念の範囲に限定する。
跋渉機能により入力したい属性を表わす概念にカレント
ノードを移動した後に、「ok」と入力することによ
り、次の属性の入力に移る。
【0103】以上のようにシステムが表示するプロンプ
トに従って入力すべき属性だけを選択しながら新規に定
義・登録することができる。
【0104】本発明方式での特徴の一つは、先に説明し
たごとく、属性を具体関係という形で捉えることによっ
て、双方の概念を同等に扱っていることであり、図17
の例でいうと、上記定義により (RED IS-GIVEN-TO MR.SUPERMAN) (AAAI HAS-MEMBER-OF MR.SUPERMAN) (JAPAN HAS-PEOPLE-OF MR.SUPERMAN) (JAPAN HAS-PEOPLE-OF MR.SUPERMAN) (HITACHI-LTD HAS-EMPLOYEE-OF MR.SUPERMAN) などの事実が同時に定義されることになる。
【0105】概念の新規登録は、内部的には以下のよう
に実現できる。いま、最大のC#(図5参照)をCmax
とすると、まず、 (insert'C '(C# CNAME P/S) (list (add1 Cmax) 'MR.SUPERMAN 'P)) (24) により表Cに概念MR.SUPERMANを登録する。ここで、要
数add1は+1する関数である。
【0106】 (insert'S '(C# S#) (list (add1 Cmax) (get-C#'MAN))) (25) により表Sに、(23)の事実が登録できる。ここで関
数get−C#は概念名称から同概念の固有番号を得る
ための関数である。
【0107】具体関係の登録は、名関係(属性)に対し
て次のように行える。
【0108】(insert'r '(R# RS# CL CR G/I) (list (add1 r#max) rs (get-C#'MR.SUPERMAN) (get-C#'PHD) 'I)) 但し、ここでrsは一般関係「ACADEMIC-TITLE」の固有
番号、r#maxは表rにおけるその時点での最大R#で
あるとする。
【0109】概念ネットワークエディタの別の機能は、
既に登録してある事実や概念の変更・修正である。具体
的には、概念名称の修正、概念木における位置の修正
(分類の修正)、具体関係の修正、一般的関係の修正な
どが行える。
【0110】図18は概念木の修正例を示す。概念PSYC
HOLOGYの位置をSOCIAL-SCIENCEからNATURAL-SCIENCEの
元へ移動する例である。
【0111】 (update'S 'S# '(get-C#'NATURAL-SCIENCE) '(eq (v C#) (get-C#'PSYCHOLOGY))) (27) を実行することで上記例の移動が行われる。
【0112】概念ネットワークエディタでは、ネットワ
ーク跋渉機能を随時用いることが可能なことを述べた
が、同様にネットワークエディタ機能自体を再帰的に用
いることができる。例えば、新規概念の定義登録中に、
別の概念を新規登録しておくことが必要となることが往
々にしてあるからである。図17の例で、「学会」(AC
ADEMIC-ASSOCIATION)の中にもし入力すべき「AAAI」が
未登録であったとすると、同時点で命令crcを入力し
て新規に概念AAAIを登録することができる。更に必要で
あれば命令crrによりAAAIの属性をその時点で登録し
てもよい。
【0113】あるいは、新規に概念を登録中に誤った
「事実」などの登録が見つかることもあり、この場合
も、修正・変更を即時に実行できる機能をもっている。
これらの再帰性により、効率よく新規な知識を追加登録
することが可能となる。
【0114】次に、図10における検索式生成部200
3および探索・概念マッチング部2002を説明する。
これらの部分は、断片的なあいまい情報から意味的な内
容検索を可能とする主要な部分である。まず、機能を説
明するために処理の流れを検索例により説明する。
【0115】 「カリフォルニア州にある会社が開発したコンピュータで、UNIX*が走るものに 関する記事」 (28) を検索することを考える *(UNIXはBell研究所の登録商
標である。)。
【0116】図19の示すごとく、まず、カレントノー
ドを概念ARTICLE(記事)に移し、命令qを入力するこ
とにより検索式生成を開始する。システムは、上位概念
から継承されるものをも含めて、概念ARTICLEに定義さ
れている一般関係を求め、フレーム形式で図19のごと
く表示する。「記事は出版物の一部である」、「記事は
何頁にある」、「記事はある記事から参照されている」
などの一般的知識から作られるフレームが表示されてい
る。ユーザは、この場合は、番号によりスロットを指定
して、同スロットに対して現在表示されているよりも具
体的な情報を追加することができる。図19の例では、
記事の主題がコンピュータであることが情報として手元
にあるので、第5番目のスロットを選択する。システム
は入力すべき項目の上位概念、この場合はUNIVERSALへ
カレントノードを移す。ユーザはこの時点で任意のネッ
トワーク跋渉機能を用いることができる(図10参
照)。図19の例では直接「Computer」と入力し、カレ
ントノードを概念COMPUTERに移している。しかし、もし
入力すべき概念名称が思い浮ばなければ、部分文字列を
入力したり、メニュー表示をしたりすることにより、選
び出すことが可能である。本例では、コンピュータに関
する情報が更に存在するので、「Computer」の後に更に
命令qを続けて入力している。
【0117】図20は次の対話画面である。概念COMPUT
ERに関する一般関係のフレーム表現が表示されている。
先と同様に、追加すべき条件のスロット、この場合4
番、を選択する。入力すべき項目のクラスは「ORGANIZA
TION. WORKPLACE」であることが表示される。ここでも
メニュー選択(図13参照)などを用いることが出来る
が、本例では単に「ある会社」という意味で、直接「Co
mpany」と入力している。「Company」に対しても更に追
加すべき情報があるので、続けて「q」を入力して検索
式生成過程を続ける。
【0118】図21は概念COMPANYに対する一般関係の
フレーム表示である。第7番目のスロットを選択し、同
会社がカリフォルニア州にある、という条件を入力して
いる。この場合は部分文字列「Cal」を入力して「Ca
lifornia」を選び出している。概念SPACE. PLACE. LOCA
TIONの下位概念は図14に示した。
【0119】条件入力の終了は「ok」と入力すること
によりシステムに伝えられる。図22は、COMPANYに対
する条件入力を終了して、再度COMPUTERに対する条件入
力を行う場面である。今回は、第13番目のスロットを
選択し、「同コンピュータはオペレーティングシステム
UNIXのもとで走る」という情報を入力する。
【0120】以上の過程をすべて終了すると、(28)
式の検索条件は次式の形式的表現に置換えられることに
なる。
【0121】 (ARTICLE (SUBJECT-IS (COMPUTER (RUNS-UNDER UNIX) (IS-DEVELOPED-AT (COMPANY (IS-LOCATED-IN CALIFORNIA)))))) (29) 検索式の自動的な生成は、上記のように一般的な関係と
して記述された一般知識によって導かれて行われる。こ
の一般的知識の多くは、上位の概念から継承されたもの
である。例えば、図21において、 (COMPANY IS-A ORGANIZATION.WORKPLACE) であるが、同フレームのほとんどのスロット(一般関
係)は上位概念ORGANIZATION.WORKPLACEに対して定義さ
れたものである。COMPANYに固有なものは、同図の例で
は(PRODUCES MACHINERY. DEVICE)のみである。このよ
うに、一般的知識としての一般関係は文字通り、より一
般的に(より上位の概念で)表現されればされる程、強
力なものとなる。すなわち、沢山の下位の概念に適用可
能となる。
【0122】概念cの一般関係は次のように求めること
ができる。いま、概念cの上位概念の集合をxとする。
【0123】(表SでIS−AリンクをUNIVERSALに突
き当るまでたどればよい。) (Select'(RS#CR) 'r '(and (member (v CL) x) (eq (v G/I) 'G))) (30) は、概念cに継承される一般関係の内、概念cが左側に
定義されているものを抽出する。(30)式において、
CR→CL,CL→CRと置換えれば、概念cが右側に
定義されている一般関係が得られる。(30)式から分
るように、得られるものはRS#とCL又はCRペア
(組)である。RS#から表Rを参照することにより、
フレームのスロット名称を得ることができる。いま、
(30)式の答えを、((y1i,y2i)…(y2i
2i)…)という形式であるとすると、 (select'(LR) 'R '(eq (v RS#) y1i)) (31) から、i番目のyに対応するスロット名称を得ることが
できる。(30)式のCRとCLを代えたものに対して
は、(31)式においてもLRをRLと置換えればよい
(図7参照)。
【0124】(31)式の答えを((z1)…(zi
…)と書くと、ペア(zi2i)はスロット名称と概念
固有番号から成っている。
【0125】 (select'(CNAME) 'C '(and (eq (v C#) y2i) (eq (v P/S) 'P))) (32) は概念名称C1を返えすので、結局、ペア(Zii)は
スロット名称とスロット値を構成することになる。リス
ト((Z11)(Z22)…(Zii)…)を表形式で
表示することにより、図21の如く一般関係のフレーム
を得ることができる。
【0126】さて、自動生成された検索条件式(例えば
(29)式)に対して、探索命令を入力すると、カレン
トノードの終端概念(部分的概念木の「葉」(leaf)に
当る概念)の集合を対象として、概念マッチングが行わ
れる。すなわち、終端概念(最も具体的な概念)のそれ
ぞれが、検索条件式で表現される「抽象的概念」と比較
され、概念的に包含される終端概念が検索結果となる。
【0127】図23は(29)式の検索条件3000に
対して探索を行った場合を示しており、条件の合致した
記事の概念フレーム表示3001と、本文のイメージ3
051の表示が可能である。同図で示すように得られた
記号ARTICLE#0014の概念フレームは、表面的には検索
条件式(29)式と全く一致していないことである。こ
れは、正に従来のデータベース等の情報検索方式で起る
事柄である。すなわち、データベースには最も具体的な
情報が記憶されているため、検索条件が抽象的である
と、全く一致しないことになる。しかしながら、本発明
方式では、分野に関する知識を用いて、概念フレームの
具体的内容と、検索条件の抽象的表現のギャップを推論
により埋めている。
【0128】次に、上記ギャップを埋めるための抽象的
概念と具体的な概念との推論を用いてマッチング方法を
説明する。ここでは、この過程を概念マッチング(conc
eptmatching)と呼ぶ。図24に、(29)式で表わさ
れる抽象的概念と概念ARTICLE#0014との概念マッチン
グの過程を示す。
【0129】探索過程では終端概念ARTICLE#0001〜ART
ICLE#0040のそれぞれが(29)式と比較されるが、こ
こではマッチングが成功するARTICLE#0014についての
み説明する。
【0130】まず、(ARTICLE)と(ARTICLE#0014)が
比較される。フレーム3001から (ARTICLE#0014 IS-A NEWS. ARTICLE) 更に (NEWS.ARTICLE IS-A ARTICLE) であることが分り、 (ARTICLE#0014 IS-A ARTICLE) なる結論が得られる。従って、条件式を一段深くして、 (ARTICLE(SUBJECT-IS COMPUTER)) (33) が成立するか否かを次に調べる。フレーム3001か
ら、まず、 (ARTICLE#0014 (SUBJECT-IS HP-9000)) であることが分る。したがって、 (HP-9000 IS-A COMPUTER) であるか否かを調べればよい。リンク3003を辿る
と、 (HP-9000 IS-A SUPERMINICOMPUTER) 更にリンク3032を辿ると (SUPERMINICOMPUTER IS-A COMPUTER) であることが、それぞれフレーム3002,3004か
ら分り、(33)式が成功する。したがって、次に、 (ARTICLE (SUBJECT-IS (COMPUTER (RUNS-UNDER UNIX) (IS-DEVELOPED-AT COMPANY)))) (34) の成立を調べる。(COMPUTER RUNS-UNDER UNIX)につい
てはフレーム3002から成立することが直接分る。
(COMPUTER IS-DEVELOPED-AT COMPANY)については、フ
レーム3002には (HP-9000 IS-DEVELOPED-AT HP.HEWLETT-PACKARD-CO) と書いてあるので、更に調べに行くことが必要である。
リンク3033を辿ると、フレーム3004に (HP.HEWLETT-PACKARD-CO IS-A COMPANY) と書いてあるので成立する。従って(34)式も成立す
る。
【0131】更に検索条件式を1段深くして(29)式
と比較する。フレーム3004は (HP.HEWLETT-PACKARD-CO IS-LOCATED-IN PALO-ALTO) (35) と書かれているので、 (COMPANY IS-LOCATED-IN CALIFORNIA) (36) であるか否かを調べる必要がある。リンク3034を辿
ると、フレーム3005に (PALO-ALTO IS-PART-OF CALIFORNIA) (37) と記録されているので、(35)式とあわせて、 (HP.HEWLETT-PACKARD-CO IS-LOCATED-IN CALIFORNIA) であることが推論される。結局、抽象的概念(29)は
具体的概念ARTICLE#0014を包摂することが分った。
【0132】以上、具体例を用いて、概念マッチングを
説明したが、この過程は再帰的に表現すると、概念の包
摂関係の成否を調べる過程と、各スロットが一致するか
否かを調べる過程とが交互に再帰的に呼ばれる過程とな
っている。また、説明からも分るように、後戻り形推論
(backward-chaining inference)となっている。従っ
て、探索時間は検索対象となる具体的物件の数に、基本
的には比例することになる。
【0133】概念マッチングではマッチングが成功した
時に具体的な概念を値として返えす。この値を抽象的概
念の中に埋め込むことにより、何故ある具体的概念がマ
ッチングしたかが、後から分る。本発明方式では、命令
whyを入力すると検索された概念のマッチング理由が
表示・出力される。(29)式の例では、 (ARTICLE#0014 (SUBJECT-IS (HP-9000 (RUNS-UNDER UNIX) (IS-DEVELOPED-AT (HP.HEWLETT-PACKARD-CO (IS-LOCATED-IN PALO-ALTO)))))) (38) が得られる。従って、抽象的に検索時に述べたコンピュ
ータとはHP−9000で、ある会社とはHP.HEWLETT-P
ACKARD-COであることが分かることになる。
【0134】さて、本発明の検索方式では、概念ネット
ワークで表現された知識を、通常ユーザが見慣れた表形
式に変換して表示し、同表の上で検索する手段をも提供
している。図25に具体例を示す。カレントノードを抽
象概念NEWS.ARTICLEに移した後、命令tabを入力する
と、システムは同概念の下位の終端概念の概念フレーム
を内部的に生成する。次に、同フレームに現われるスロ
ット名称を表にして提示する。図25の場合は、6種類
のスロットがあったことになる。ユーザは、どのスロッ
トをカラムとした表にするかを選択することができる。
同例では6番目と5番目のスロット、すなわち、TITLE-
ISとSUBJECT-ISを選択し、合計3つのカラムからなる表
が表示される。ユーザは例えばタイトルの文章から欲し
いものを探し出すことが出来る。選択した結果をカレン
トノードとして、本文イメージを表示する命令を入力す
れば、イメージ用CRT500に本文イメージが表示さ
れる。
【0135】本発明による検索方式は、必ずしも文書フ
ァイリングのみではなく、広く一般のデータや事実の情
報にも適用できる。また概念マッチングは、2つの概念
の包摂関係を自動的に検定する方式を与えており単に、
情報検索のみならず、特許のクレームの包摂関係の審査
のような情報分析技術としても応用することが出来る。
あるいは、大量な具体的概念を集めて、同概念マッチン
グを応用することにより、概念的なクラスタ分析も可能
となる。
【0136】本発明の一拡張として、知識ベースに時間
の概念を導入することができる。一般に、事実などは
「真」である時間を指定する必要があることが多い。例
えば、(MR.SUPERMAN IS-MEMBER-OF AAAI)という事実
は入会した時刻から、退会したとすればその時刻まで
「真」である。このような時間の概念は、具体関係を保
持する表rを拡張することにより実現できる。
【0137】更に別な拡張は、各事実の出所を記録する
機能である。例えば、誰がそう言ったか、どこにそれが
書いてあったか、という情報の出典を、表rを拡張する
ことにより記録し、情報の管理をすることができる。更
に、信頼度を付記することも考えられる。
【0138】本発明はシステムの実現方法に依存しな
い。たとえば、処理を高速化するために特殊なハードウ
ェアを導入してもよい。また、知識ベースが大きくなっ
た場合に実現上の変形たとえば、概念や関係を記憶する
表をクラスタに分割して記憶する方法などが考え得る
が、これらは本発明方式に含まれる。更に、日本語で概
念等を表記した場合には、日本語特有の仮名漢字変換機
能などが要求されるが、これらの拡張がなされたものも
本発明に含まれる。
【0139】
【発明の効果】以上説明したごとく、本発明によれば、
ファイルまたはデータベースの具体的な構築方法を知ら
ずとも、断片的な情報から欲しい文書などの情報を容易
に引出すことが可能になる。更に、容易に引出すること
ができるように格納することも極めて容易になる。
【0140】具体的には、ファイリングする対象に関す
る分野知識を、概念ネットワークで表現して知識ベース
化することにより、新しい知識の追加・編集や検索条件
の対話的入力が容易に行えるようになる。知識は、一般
関係と具体関係という形で表現されるが、情報の入力に
当ってシステムは、一般関係を用いてユーザが次に何を
入力すべきか、更にそれはどのクラスの概念であるべき
かを推定して、端末上に表示する機能を持つ。本機能は
基本的な原理の上に組立てられているので、概念ネット
ワークで表現される知識ベースを追加ないしは変更する
のみで、新しい世界や、より木目の細かい世界への適応
が可能である。
【0141】また、知識ベースの追加・変更などのため
に、概念ネットワークエディタがあり、4種類以上のネ
ットワーク跋渉機能を持つ知識ベースの状態を、概念木
やメニュー表、あるいはフレーム、更には関係データベ
ース形の表形式で表示する機能を与え、これらの表現の
上で次々異なる概念へ跋渉することが可能である。これ
らの豊富なデータビューが可能なことは、新しく考案し
た概念関係モデルを採ったことにある。特に、概念フレ
ームを表示しながら異なる概念へ飛んでいく機能は、人
間の思考形態とマッチしており、本機能のみでもかなり
高度な概念探索を実行することができる。
【0142】更に、本発明によれば、分野知識を用いた
推論を行うことにより、あいまいな断片情報から意味的
な内容検索が可能である。従来の技術では役に立たない
ような抽象的な情報からでも、「意味的」に内容を捉え
ることにより、精度高く検索できる。また、検索条件は
任意の項目で、かつ任意の深さまで推定することがで
き、人間が思い出すことの出来たレベルに合せて、検索
式を作ることができる。
【図面の簡単な説明】
【図1】本発明方式の一実施例のシステム構成図。
【図2】概念ネットワークを説明する図。
【図3】形式的表現による概念ネットワーク。
【図4】ER図式によった概念関係モデルのデータ表現
図。
【図5】概念関係モデルによる知識表現の具体例を示す
図。
【図6】概念関係モデルによる知識表現の具体例を示す
図。
【図7】概念関係モデルによる知識表現の具体例を示す
図。
【図8】概念関係モデルによる知識表現の具体例を示す
図。
【図9】画像データ管理用の具体例を示す図。
【図10】ソフト的な機能ブロック図。
【図11】部分文字列マッチングの説明する図。
【図12】メニューを表示する図。
【図13】メニュー選択を用いたネットワーク跋渉の説
明図。
【図14】概念木表示を示す図。
【図15】概念の部分全体関係にもとづく階層木を表示
する図。
【図16】概念フレームによるネットワーク跋渉の説明
図。
【図17】新しい概念の定義・登録方法の説明図。
【図18】概念ネットワークエディタの説明図。
【図19】対話的な検索式生成方式の説明図。
【図20】対話的な検索式生成方式の説明図。
【図21】対話的な検索式生成方式の説明図。
【図22】対話的な検索式生成方式の説明図。
【図23】意味的な内容検索の説明図。
【図24】概念マッチングの説明図。
【図25】表形式で概念ネットワークの状態を表示する
機能の説明図。
【符号の説明】
100…制御装置、200…操作端末、300…主メモ
リ、400…磁気ディスク装置群、450…光ディスク
装置、500…高精細画像表示装置、600…高速画像
処理回路、700…画像スキャナ、750…画像プリン
タ、2001…対話制御部、2002…探索・概念マッ
チング部、2003…検索式生成部、2004…概念ネ
ットワークエディタ、2005…ネットワーク跋渉部、
2006…表操作部、2010…画像表示部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】概念を表わすための複数の語句および複数
    の語句間の関係を表わすための複数の述語を記憶する知
    識ベースと、 入力手段と、 表示手段と、 上記入力手段から検索キーとなる1つの概念を示す語句
    が入力されたとき、上記知識ベースに基づいて該入力語
    句と関連してユーザが選択しうる概念を検索し、上記入
    力語句と関係をもつ少なくとも1つの語句と上記入力語
    句との関係を表わす少なくとも1つの述語とを上記表示
    手段に表示するための処理手段と、 を備えた検索システムであって、 上記表示手段に表示された語句と述語の中から所望の語
    句と述語の組を上記表示手段を用いて選択させ、選択さ
    れた語句に包摂される新たな語句を入力させることによ
    り、上記入力語句と新たな入力語句とが上記選択された
    述語で関連付けられた検索条件を生成することを特徴と
    する検索システム。
  2. 【請求項2】概念を示す複数の語句と該複数の語句間の
    関係を知識ベースとしてあらかじめ記憶しておき、 選択された語句群と該語句群の関係を示す述語群で規定
    される検索条件と、該検索条件中のある語句と関係を持
    ち上記知識ベースに記憶された複数の別の語句とその関
    係とを画面上に表示し、 表示される上記複数の別の語句とその関係から1つを選
    択し、その選択された語句とその関係に応じて上記検索
    条件を書き換えて表示することを特徴とする検索システ
    ムの画面表示方法。
  3. 【請求項3】請求項2記載において、上記検索条件中の
    ある語句を上記画面上で指定し、その指定に応じて該指
    定された語句と関係を持ち上記知識ベースに記憶された
    複数の別の語句とその関係とを上記画面上に表示するこ
    とを特徴とする検索システムの画面表示方法。
JP4070593A 1992-03-27 1992-03-27 情報検索方法及びシステム Expired - Lifetime JPH0727532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4070593A JPH0727532B2 (ja) 1992-03-27 1992-03-27 情報検索方法及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4070593A JPH0727532B2 (ja) 1992-03-27 1992-03-27 情報検索方法及びシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP60060678A Division JPS61220027A (ja) 1985-03-27 1985-03-27 文書ファイリングシステム及び情報記憶検索システム

Publications (2)

Publication Number Publication Date
JPH05174066A true JPH05174066A (ja) 1993-07-13
JPH0727532B2 JPH0727532B2 (ja) 1995-03-29

Family

ID=13436015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4070593A Expired - Lifetime JPH0727532B2 (ja) 1992-03-27 1992-03-27 情報検索方法及びシステム

Country Status (1)

Country Link
JP (1) JPH0727532B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0784859A (ja) * 1993-09-14 1995-03-31 Nec Corp データベース構成方式
JP2012053625A (ja) * 2010-08-31 2012-03-15 Canon Inc 情報処理装置、情報処理方法、及びプログラム
JP2013069092A (ja) * 2011-09-22 2013-04-18 Jvc Kenwood Corp 情報閲覧方法、情報閲覧システム、サーバ装置およびクライアント装置
JP2013069091A (ja) * 2011-09-22 2013-04-18 Jvc Kenwood Corp 情報閲覧方法、情報閲覧システム、サーバ装置およびクライアント装置
JP2023028921A (ja) * 2021-08-20 2023-03-03 zro株式会社 意味定義が意味論的メタセットとして構成される方法およびコンピューティングデバイス

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4570147B2 (ja) * 2005-03-02 2010-10-27 日本電信電話株式会社 ソフトウェアコンポーネント登録・検索方法及びそのシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0784859A (ja) * 1993-09-14 1995-03-31 Nec Corp データベース構成方式
JP2012053625A (ja) * 2010-08-31 2012-03-15 Canon Inc 情報処理装置、情報処理方法、及びプログラム
JP2013069092A (ja) * 2011-09-22 2013-04-18 Jvc Kenwood Corp 情報閲覧方法、情報閲覧システム、サーバ装置およびクライアント装置
JP2013069091A (ja) * 2011-09-22 2013-04-18 Jvc Kenwood Corp 情報閲覧方法、情報閲覧システム、サーバ装置およびクライアント装置
JP2023028921A (ja) * 2021-08-20 2023-03-03 zro株式会社 意味定義が意味論的メタセットとして構成される方法およびコンピューティングデバイス

Also Published As

Publication number Publication date
JPH0727532B2 (ja) 1995-03-29

Similar Documents

Publication Publication Date Title
JPH0584538B2 (ja)
Chang et al. A survey of web information extraction systems
Chu Information representation and retrieval in the digital age
Wang et al. A system for approximate tree matching
US6182062B1 (en) Knowledge based information retrieval system
Kowalski Information retrieval architecture and algorithms
EP1217535A2 (en) Method and apparatus for generating normalized representations of strings
US20230138014A1 (en) System and method for performing a search in a vector space based search engine
Langenhan et al. The fingerprint of architecture-sketch-based design methods for researching building layouts through the semantic fingerprinting of floor plans
JP2000276487A (ja) 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体
US5412567A (en) Augmenting a lexical transducer by analogy
JPH05174066A (ja) 検索システム及びその画面表示方法
Mesmia et al. ASRextractor: a tool extracting semantic relations between Arabic named entities
JPH1166078A (ja) 検索要求具体化方法及び装置及び検索要求具体化プログラムを格納した記憶媒体
CN117271795B (zh) 一种跨领域迁移的知识管理方法及知识库系统
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
Kaladevi et al. Development of Background Ontology for Weather Systems through Ontology Learning
Mukherjee et al. Automatic extraction of significant terms from the title and abstract of scientific papers using the machine learning algorithm: A multiple module approach
Tansley The multimedia thesaurus: An aid for multimedia information retrieval and navigation
Ahmad et al. SDRED: smart data retrieval engine for databases
Marin-Castro et al. VR-Tree: A novel tree-based approach for modeling Web Query Interfaces
JP3431618B2 (ja) データ検索装置および検索方法
Helal et al. Graph-Based Patent Mining for Mechanical Designs
KR20230100462A (ko) 다국가 임상데이터 표준화 방법 및 장치
JP4334450B2 (ja) 構造化文書検索装置及び構造化文書検索方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term