JPH05174066A

JPH05174066A - 検索システム及びその画面表示方法

Info

Publication number: JPH05174066A
Application number: JP4070593A
Authority: JP
Inventors: Hiromichi Fujisawa; 浩道藤澤; Junichi Tono; 純一東野; Atsushi Hatakeyama; 敦畠山
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1992-03-27
Filing date: 1992-03-27
Publication date: 1993-07-13
Anticipated expiration: 2010-03-29
Also published as: JPH0727532B2

Abstract

(57)【要約】【目的】ユーザの断片的またはあいまいな情報から、
推論的に所望の情報を検索する。【構成】概念を表わすための複数の語句および複数の
語句間の関係を表わすための複数の述語を記憶する知識
ベース（４３０）と、入力手段（２２０）と、表示手段
（２１０）と、入力手段から検索キーとなる１つの概念
を示す語句が入力されたとき、知識ベースに基づいて入
力語句と関連してユーザが選択しうる概念を検索し、入
力語句と関係をもつ少なくとも１つの語句と入力語句と
の関係を表わす少なくとも１つの述語とを表示手段に表
示するための処理手段（１００）とを備え、表示された
語句と述語の中から所望の語句と述語の組を選択させ、
選択された語句に包摂される新たな語句を入力させるこ
とにより、入力語句と新たな入力語句とが選択された述
語で関連付けられた検索条件を生成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文書や図面、あるいは写
真といった情報を一般ユーザが分りやすく記憶・検索・
表示できるような検索システム及びその画面表示方法に
関する。

【０００２】

【従来の技術】従来は大量な情報の記憶と検索を可能と
するデータベースの管理や検索の処理は専門家に委ねら
れており、エンドユーザはその専門家を介在して情報の
入手などを行っていた。しかし、近年光ディスク記憶装
置などの小形の大容量記憶装置が実現されるに及んで、
エンドユーザが直接操作するオフィスを対象とした文書
ファイリング装置が実現されている。また、ワードプロ
セッサの普及も進んでおり、大量の文書が電子的な装置
の中に格納されることになった。

【０００３】しかしながら、従来の計算機技術ではこれ
らの文書などの物件を、それぞれに付した固有名称や、
標題、著者名といった書誌的事項を表形式で表わして管
理したり、または更にキーワードや分類コードを付与し
て検索しやすくしているが、下記のような問題点があ
る。

【０００４】まず、計算機のファイルシステムではほと
んどの場合、固有名称（２０文字程度）でファイルを管
理しているが、思い出しやすいように名称を付すことが
難しく、更にその文字列から中身を想像しながら欲しい
ファイルを探し出すことは、作成した本人でも極めて難
しい。

【０００５】書誌的事項は客観的事者であるため登録す
る場合には難しさはないが、これを検索手段に用いる状
況は少ない。引用書類・参考文献として明確に分ってい
る場合などに限られる。

【０００６】文書などを引出す多くの場合は、あいまい
にしか憶えていない標題や、その文書の内容が手掛りと
なる。このために、キーワードや分類コードが用いられ
るが、まず文書を登録するときにこれらを付与すること
が難しい。すなわち、何をキーワードとすれば後で適切
に選び出せるかは難しい問題である。たとえば色々な角
度から検索可能とするために沢山のキーワードを付与す
ると、検索時に不要なものが多く出て来てしまう。少な
ければ正しく選び出されるかどうか分らなくなる。従
来、文献データベースなどでは専門家がキーワードや分
類コードを抽出し、付与している。

【０００７】更に、検索するときに、キーワードを想起
することも難しい。例えば、文献検索などの場合、キー
ワードからなる検索式を作るに際して、総目録から欲し
いものと似ている文献を探し出し、それについているキ
ーワードを拾い上げて、参考にするという手順を踏むこ
とも稀ではないことからも想定することの難しさが分
る。

【０００８】更にまた、分類による文書ファイリング
も、分類木（階層木）あいまい性や、細分化していった
場合の分類木の交錯（一つの文書が多重に分類される）
が発生するという問題がある。また、分類の規準は時間
と共に変って行き、数年経つと全く役に立たなくなるこ
とが多いことも問題である。

【０００９】以上のように、従来技術による文書などの
ファイリング方式では、特にエンドユーザにとって管理
と検索をやりやすくすることが極めて重要な課題となっ
ている。

【００１０】これらの課題に対して文献〔ジェ．エフ．
ソワ：“コンセプチュアルグラフズフォーアデ
タベースインターフェース”アイビーエムジエ．
リサーチアンドデベロプメント，ボル．２０，１９
７６ピピ３３６〜３５７（J.F. Sowa：“Conceptual gr
aphs for a Data Base Interface,”IBM J. Research a
nd Development, Vol.20, 1967, pp.336-357)〕に、検
索を自然言語で行う場合の検索条件の図式化方法と形式
的検索条件式の導出方法が提案されている。また、文献
〔エフ．エヌ．トゥ．エトオル，“ラビット：アン
エンチリジェントデータベースアシスタント”，プ
ロシーデングスオブナショナルエンフェレンスオ
ブエエエアイ，１９８２，ピピ：３１４−３１８（F.
N. Tou, et al. “RABBIT : An Intelligent Database
Assistant, ”Proceedings ofNational Conference of
AAAI, 1982, pp.314-318）〕では、データベースの中
身に関する知識を計算機から提示することにより、検索
条件式を作る支援を行う方法が提案されている。これら
の方法は、データベースの検索の支援にのみ注目したも
のであり、データの入力、更新といった情報の格納に対
する支援は含まれていない。

【００１１】

【発明が解決しようとする課題】エンドユーザによる文
書のファイリングにおいては、新しい文書の登録や、フ
ァイル体系の保守（分類の適切さの見直しなど）なども
検索しやすくするためには重要であり、上記の提案方法
では不十分である。

【００１２】さらに、検索に際しても次のような問題が
残っている。すなわち、情報を格納した時点では明確に
なっていなかった新しい概念（見方）によって、古い情
報を見直したり、その見方で検索するための手段が与え
られていない。例えば、数年後に新しい角度から分類し
直したり、人とは違った観点で分類することが求められ
ており、情報記憶装置の使い易さを想定する重要な要素
である。

【００１３】本発明の目的は、以上のような問題点を解
決し、エンドユーザがあいまいで、かつ断片的な情報か
ら欲しい文書などを容易に検索することを可能にすると
同時に、文書などの登録を容易にすることにある。

【００１４】

【課題を解決するための手段】かかる目的を達成するた
め本発明の検索システムは機械における情報の記憶方式
を人間の記憶特性や意味の捉え方に合致したものとする
ことにより、エンドユーザにとって分りやすく、かつ使
い易い検索システム、例えば文書ファイリング装置など
を提供するものである。

【００１５】特に本発明では、後述するような検索条件
の入力支援の目的のため、概念を表わすための複数の語
句および複数の語句間の関係を表わすための複数の述語
を記憶する知識ベースと、入力手段と、表示手段と、入
力手段から検索キーとなる１つの概念を示す語句が入力
されたとき、知識ベースに基づいて入力語句と関連して
ユーザが選択しうる概念を検索し、入力語句と関係をも
つ少なくとも１つの語句と入力語句との関係を表わす少
なくとも１つの述語とを表示手段に表示するための処理
手段とを備えた検索システムであって、表示手段に表示
された語句と述語の中から所望の語句と述語の組を表示
手段を用いて選択させ、選択された語句に包摂される新
たな語句を入力させることにより、入力語句と新たな入
力語句とが選択された述語で関連付けられた検索条件を
生成することなどを特徴とする。

【００１６】

【作用】本発明は、具体的には、新しい情報の登録の容
易化、検索条件入力の容易化、あいまい、かつ意味的な
検索の実現、および物の見方の多様性に適応した検索の
実現を可能とするものである。

【００１７】これらの実現のために次の新しい機能を与
えた。

【００１８】（１）登録支援機能新しい文書などを登録するには、書誌的事項（著者名，
表題，出典，など）を入力する他、主題や文書の性格な
どを入力する必要がある。また、高度な意味的な検索を
可能とするためには、それらの情報について更に詳しい
情報を追加する必要がある。

【００１９】例えば、主題がコンピュータであるとする
と、それはどのようなコンピュータか、どんな特徴を持
っているか、どこの会社が開発したか、その会社はどこ
にあるか、その場所はどの国に属するのか、といった情
報が必要となる。これらの情報が記憶されていれば、
「Ａという国にある会社で開発したコンピュータで、Ｂ
なる特徴をもったコンピュータに関する文書」を推論機
能を用いることにより検索することが可能となる。

【００２０】本発明では、記憶装置内に「コンピュー
タ」や「会社」といった概念に関する知識を記憶させて
おき、新しい情報を追加する際に、どんな属性データを
入れるべきかをユーザに対話的に提示し、短時間で入力
できるようにするとともに、誤った情報が入らないよう
にする。

【００２１】更に、既に似た情報を登録してあるときに
は、新たにすべての属性データを入力することなく、似
た物の属性と異なる点のみを入力するような機能を与え
ることにより、入力の容易化を計る。例えば、「中山太
郎」という人間が既に登録されていて、その兄弟の「中
山次郎」を登録する場合を考える。この場合、似ている
概念として「中山太郎」を選択すると、システムはその
属性リストを表示する。例えば、（（父は中山元雄）（母は中山花子）（生年月日は１９６０年５月４日）（性別は男）（趣味は音楽）（１）と表示する。ユーザは、これらの内、異なるもののみ、
例えば（生年月日は１９６３年６月７日）、（趣味はス
ポーツ）と入れるのみでよい。

【００２２】（２）検索条件入力支援機能エンドユーザが検索を行う場合、多くはぼんやりしたイ
メージしか持っておらず、すべてを適格に自然言語など
で表現することは難しい。

【００２３】本発明では、対話的に、最も重要な概念か
ら始めて、検索のための情報を逐次追加して行く。この
際に、登録支援機能と同様に、記憶装置内にファイリン
グ対象世界の知識を蓄えておき、それに基づいてユーザ
に、入力可能な属性名と、そこに入り得る概念（事物の
クラス）を提示する。

【００２４】例えば、ユーザが欲しい物は「論文」であ
るとすると、まずユーザは「論文」と入力する。記憶装
置は「論文」から、それは著者，表題，主題といった属
性があることを知り、端末上に、それらの属性名称と概
念の組、例えば（著者，人名）、（表題，テキスト）、
（主題，概念）を呈示する。ユーザはそれらを見て、自
分が情報として持っているものを選択して、データを入
力する。例えば「主題」を選択して「コンピュータ」と
入力する。この過程は回帰的に繰返すことができる。例
えば、主題が「コンピュータ」であるとすると、システ
ムは（開発者，組織，会社）、（走る言語，コンピュー
タ言語）、（ＯＳ，ＯＳ）などを呈示し、ユーザは例え
ば、（走る言語，ＬＩＳＰ）と入力し、条件を付加する
ことが出来る。

【００２５】このような支援機能により、例えば「LISP
が走るコンピュータに関する論文で、Ａ社の社員が書い
た論文」（２）といった検索条件を設定することができ
る。後に詳述するように、同検索条件を本発明方式では
形式的に以下のような表現式で表わす。

【００２６】（TECHNICAL-PAPER (SUBJECT-IS (COMPUTER (RUNS LISP))) (AUTHOR-IS (EMPLOYEE (WORKS-AT A-COMPANY)))) （３）これは日本語でも表現でき、次のように書く。

【００２７】（論文（主題は（コンピュータ（走る言語は Lisp))) （著者は（社員（所属はＡ社)))) （３）なお、上記の記法はLisp言語におけるＳ式（symbolic e
xpression)〔文献：ピー．エッチ．ウィンストン“リス
プ”アディション−ヴェスレイパブリッシングカンパ
ニー１９８１，ピー１８（P. H. Winston, “LISP,”
Addison-Wesley Publishing Co., 1981, p.18)〕の書方
に準処する。

【００２８】（３）意味的あいまい検索機能ユーザがある物件を検索したいと思ったときに、普通は
断片的な情報で、かつあいまいなものしか持っていな
い。一方、記憶装置（データベースなど）には極めて具
体的な名称で記憶されている。したがって、これらのギ
ャップを解消することが求められている。

【００２９】この場合、大きく分類して、あいまい性に
は次の５種類がある。

【００３０】（ｉ）名称の不完全性事物又は概念の名称の一部分しか憶えていない。

【００３１】（ii）同義語同一の事物を異なる単語で憶えていることが多い。例え
ば、「人工知能，人工頭脳，ＡＩ」などは同一概念を指
している。

【００３２】（iii）数の不完全性数値を厳密に憶えていることは稀である。

【００３３】「１９８０年代、８５年ごろ、８３年から
８７年の間、１９６０年以前」などはその例である。

【００３４】（iv）概念の抽象化（その１）事物や概念は、その上位の概念で憶えて、その具体的な
ものは忘れることが多い。ここで、上位の概念とは、分
類（クラスタリング）によることが多い。「会社名は忘
れたが、その組織は大学や研究所ではなく、とにかく会
社であった」、あるいは「あれは電機メーカであった」
はその例である。

【００３５】この場合、その電機メーカを、例えば“Ａ
ＢＣ株式会社”とすると、（ＡＢＣ株式会社ＩＳ−Ａ電気メーカ）（電気メーカＩＳ−Ａ企業）という関係式が成り立つ。図式的には、概念「ＡＢＣ株
式会社」と概念「電気メーカ」が「ＩＳ−Ａ」というリ
ンクで結ばれることになる。ここで、リンク「ＩＳ−
Ａ」は上記二つの概念の間に定義される関係（relation
ship）で包摂関係という。

【００３６】一般にすべての概念はＩＳ−Ａリンクによ
って階層的に分類されると考えられる。その階層木を概
念木と呼ぶことにする。

【００３７】（ｖ）概念の抽象化（その２）前項の抽象化は概念の集合論的抽象化であるが、人間は
概念の部分関係における上位の部分で憶えていることも
多い。例えば、「Ａ氏の所属はどの工場か忘れたが、と
にかくＡＢＣ株式会社であった」、あるいは「あれは何
市か忘れたが埼玉県であった」ということがある。

【００３８】普通、事者を格納するデータベースには
「Ａ氏はＸＹＺ工場の所属である」とか、「ＡＢＣ株式
会社は所沢市にある」とか記憶されており、従来の情報
検索の技術では上記例のあいまいな情報からでは検索す
ることが出来ない。

【００３９】この場合、（ＡＢＣ株式会社ＨＡＳ−ＰＡＲＴ−ＯＦＸＹＺ工場）（埼玉県ＨＡＳ−ＰＡＲＴ−ＯＦ所沢市）という関係が重要な役割を果す。ここで注意すべきこと
は、（所沢市ＩＳ−Ａ埼玉県）ではなく（所沢市ＩＳ−ＰＡＲＴ−ＯＦ埼玉県）であり、概念的な包摂関係（上下関係）と明確に区別し
て把握することである。関係「ＩＳ−ＰＡＲＴ−ＯＦ」
は関係「ＨＡＳ−ＰＡＲＴ−ＯＦ」の裏返しの関係であ
る。

【００４０】厳密には、方向性をもった関係（ＩＳ−Ｐ
ＡＲＴ−ＯＦやＨＡＳ−ＰＡＲＴ−ＯＦ）はrelationと
呼び、それらをまとめて方向性をなくした関係（そのリ
ンクとしての存在）をrelationshipと呼ぶことにする。
上記例ではＩＳ−ＰＡＲＴ−ＯＦとＨＡＳ−ＰＡＲＴ−
ＯＦは「部分全体関係」（Part-whole relationship）
と呼ばれている。

【００４１】人間の記憶に関する特性には、上記５種類
のあいまい性の他に、概念間の関係の方が概念自体より
も記憶に残りやすい、という特性がある。たとえば、
「ある記事の主題はオペレーティングシステムであった
が、それは米国の研究所で開発された」という断片情報
からの検索では、「開発された」という事実が重要であ
り、それは同オペレーティングシステムと同研究所とい
う二つの概念の間に定義される「関係」である。具体的
には、（ＵＸオペレーティングシステムＩＳ−ＤＥＶＥＬＯＰＥＤ−ＢＹＢ研究所）という関係式で表わされ、ＩＳ−ＤＥＶＥＬＯＰＥＤ−
ＢＹはrelationである。意味的なあいまい検索では、こ
の「関係」が重要である。

【００４２】以上述べた人間の記憶上の特性の内、名称
の不完全と数の不完全性については従来の情報検索にお
いても勘案されている。例えば、部分文字ストリングの
マッチング機能や、数値範囲指定などが知られている。

【００４３】本発明の特徴とする意味的あいまい検索機
能は上記分類の内、特に抽象化概念（その１、およびそ
の２）の扱いにおいて新規性がある。すなわち、前記し
た検索条件入力支援機能を用いることにより、次のよう
な意味的あいまい検索が可能である。

【００４４】検索条件：「埼玉県にある会社が開発した
コンピュータで、ある研究所が開発したオペレーティン
グシステムが走るものに関する記事」…(４) ここでは、条件文に現われている具体的な概念は「埼玉
県」のみであり、その他にキーワードになりそうな単語
は抽象的な「コンピュータ」，「研究所」，「オペレー
ティングシステム」などである。従来の情報検索方式、
たとえばキーワード検索では十分な検索情報を得ること
が出来ない。

【００４５】条件文（４）には埼玉県と会社、会社とコ
ンピュータ、オペレーティングシステムとコンピュータ
などのそれぞれの間の関係をも検索情報として扱ってい
る意味で「意味的な検索」であり、また会社、コンピュ
ータ、オペレーティングシステムなどは一般名称（抽象
的概念）であるという意味で「あいまいな検索」を実現
していることになる。従来の検索方式では、キーワード
間の関係を記述していないため、例えば「埼玉県にある
研究所が導入したコンピュータで、ある会社が開発した
オペレーティングシステムが走るものに関する記事」も
同時に含まれてしまい、その意味で「意味的でない検索
方式」である。

【００４６】

【実施例】以下、本発明を実施例にもとづいて説明す
る。

【００４７】図１は本発明方式の一実施例である情報記
憶方式を採用した画像情報ファイリング装置の構成図で
ある。装置全体の構成と動作の概要を説明する。

【００４８】まず、装置は制御装置（ＣＰＵ）１００、
主メモリ３００、磁気ディスク装置群４００、操作端末
２００（ＣＲＴ２１０、キーボード２２０、マウス２３
０）からなるデータ処理部と、画像スキャナ７００、画
像プリンタ７５０、光ディスク装置４５０、画像バッフ
ァメモリ３５０、高速画像処理回路（ＩＰ）６００、お
よび高精細画像表示装置５００からなる画像情報処理部
とから成る。また、これらはバスアダプタ８０５を経由
して接続されている。

【００４９】主な動作は、画像情報の文書などからの登
録、欲しい情報の検索表示・出力、およびファイリング
対象となる分野に関する知識の入力・編集である。文書
画像の登録では、スキャナ７００から文書画像をメモリ
３５０に読み込み、ＩＰ６００により圧縮符号化した上
で光ディスク４５０に格納する。そのとき、メモリ上の
画像をＣＲＴ５００上に表示し、正しく読み取られたか
否かをチェックするとともに、同文書の書誌的事項（表
題、著者、出典など）と分野知識における位置付けなど
も端末２５０から入力する。書誌的事項、該文書画像の
光ディスク上での物理アドレス（バックアドレス、トラ
ックアドレス、セクタアドレス）および画像の属性（大
きさ、走査密度、符号化方式など）の情報はファイル４
２０に格納する。また、同文書の分野知識での位置付け
などの情報はファイル４３０に格納する。

【００５０】検索・表示では、後述する検索のための対
話により欲しい文書を端末２５０上で固定することによ
り、画像表示用ＣＲＴ５００に表示する。ハードコピー
が欲しい場合はプリンタ７５０から出力する。固定され
た文書は所在情報（光ディスクの物理アドレスなど）は
ファイル４２０内から読み出され、光ディスクの読出し
制御コマンドとして、バスアダプタ８０５経由で光ディ
スク制御回路４５５へ送られる。読出された画像データ
は一担メモリ３５０に貯えられ、表示されるページの画
像がＩＰ６００により逐次復号化される。

【００５１】マウス２３０はＣＲＴ２１０およびＣＲＴ
５００双方に対して位置指定することが可能であり、画
像のＣＲＴ５００上での表示位置を該マウスで指定でき
る。この機能を用いて、複数のページの文書をＣＲＴ５
００上の任意の位置に重ねて表示することもできる。多
数のページを同一画面に表示するために、１ページ分の
文書画像をＩＰで縮小して表示することもできる。ＣＲ
Ｔ上の画面の管理はＣＰＵ１００で行う。

【００５２】分野知識の入力・編集は、必要に応じて文
書をＣＲＴ５００に表示しながら、端末２００上で行
う。分野知識とは、登録する、または登録してある文書
に記述されている世界に関する概念および概念間の関係
として記述される事実の集合である。更に、概念や関係
を表現する自然言語に関する知織も含まれる。当然、上
記世界には文書自身も概念の一つとして含まれる。これ
らの知識はファイル４３０に格納される。

【００５３】以上述べた３つの主な機能はモードレス
で、いつでも任意に呼び出すことが出来る。例えば、分
野知識の追加編集を行っている際中に、必要な情報を検
索機能を用いてＣＲＴ５００上に呼び出したり、あるい
は文書画像の登録を行っている際中に、同文書内容に関
する知識を追加したりすることが出来る。

【００５４】次に、分野知識データ表現形式の説明をす
る。知識は事物を含めた概念と、それらの間の関係とい
う二つの種類の要素で表現する。図２は概念的に意味ネ
ットワーク（Semantic Network）の形に表現した図式で
ある。楕円で表わすノード（節）は概念を表わし、中に
書かれている単語は同概念を表わす代表単語である。概
念名称という。楕円と楕円を結ぶリンク（実線または破
線で表わす矢印）は概念と概念の間の「関係」を表現す
る。たとえば、スーパーコンピュータ１０１２はコンピ
ュータ１０１１の「一種である」ということが、ＩＳ−
Ａというリンクによって表わされている。ここでＵＮＩ
ＶＥＲＳＡＬ１０１０は特別な概念で、すべてを包摂す
るものとして定義する。従って、すべての概念はＵＮＩ
ＶＥＲＳＡＬを根（root）とした概念木（concept tre
e）を構成し、分類階層（taxonomic hierarchy）を表わ
している。ＩＳ−Ａは「関係」の一種ではあるが、概念
の属性を下位概念へ継承させる道節になっており、その
意味で他の「関係」と別けて考える。したがって、図２
においても矢印を実線と破線に別けて記している。

【００５５】たとえば、「コンピュータはソフトウェア
を走らせる」という一般的な属性がある。同時にそれは
裏返せば「ソフトウェアはコンピュータ上で走る」とい
う属性である。ここでは、これらを「一般関係」（gene
ric relationship）と呼ぶことにする。形式的には（コンピュータ RUNS ソフトウェア）（ソフトウェア RUNS-ON コンピュータ）（５）と表わされる。これら一般関係は次のように下位の概念
に継承される。すなわち、「スーパーコンピュータはソ
フトウェアを走らせる」、「Ｘ−８００はソフトウェア
を走らせる」、あるいは「オペレーティングシステムは
コンピュータ上で走る」、「ＵＸはコンピュータ上で走
る」と言うことができる。これらの関係は一般関係
（５）から導き出されるものであり、知識ベースには直
接記述しない。

【００５６】図２において、概念「Ｘ−８００」と「Ｕ
Ｘ」を結ぶ関係１００５は、上記一般関係と異なり、こ
れら２つの概念間に定義される固有の関係であり、「具
体関係」（instance relationまたは単にrelation）と
言う。但し、具体関係１００５は一般関係１００４の具
体化したものである。

【００５７】このようにして、ある記事「ＡＲＴ＃０１
８」１０１８の主題がスーパーコンピュータＸ−８００
であり、同スーパーコンピュータではオペレーティング
システムＵＸが走るという事実が、図２に示す図式で表
わされることになる。また、すべての概念はＩＳ−Ａリ
ンクという縦糸で、また一般的関係および具体関係とい
う横糸で結ばれ、全体として概念ネットワークを構成し
ている。

【００５８】ここで注目すべきことは、概念に付随する
属性をその概念の側からのみ見るのではなく、属性に現
われる概念からの見方も対等に与えている点である。こ
れは、「属性」という見方を改めて、２つの概念間に定
義される「関係」という見方を採ることによって、しか
もその関係は両側面から見ることが出来るようにするこ
とによって成されている。これにより、例えば記事ＡＲ
Ｔ＃０１８とその主題Ｘ−８００を登録すると、同時に
「Ｘ−８００は記ＡＲＴ＃０１８に載っている」という
ことが登録されることになる。

【００５９】以上の知識表現をより形式的に図３のよう
に表現することができる。システムは、概念Ｃ、包摂関
係Ｓ、一般関係Ｒ、具体関係ｒという４種類のデータの
形式でこれらを記憶し、管理する。Ｃ（ｉ）はｉ番目の
概念、Ｓ（ｋ，ｉ）はＣ（ｋ）がＣ（ｉ）の一種である
ことを、Ｒ（ｍ）はｍ番目の一般関係、またｒ（ｍ，
ｋ，ｌ）はＲ（ｍ）の具体化した関係、すなわち具体関
係であり、Ｃ（ｋ）とＣ（ｌ）との間に定義されたもの
であることを表わす。

【００６０】更に具体的には、これら４種のデータは表
形式で表わされ、実体関係モデル（Entity Relation Mo
del：ERモデル）の図式で表わすと図４の如く表現でき
る。ここで、概念Ｃと一般関係Ｒとは実体として捉え、
包摂関係Ｓと具体関係ｒをこれら実体を結ぶ関係として
捉えている。一般関係Ｒは具体関係ｒのクラスを定義す
るものであり、ここでは実体として考える。これらの具
体的な表形式を図５〜図８に示す。表の内容は図２を表
わす。

【００６１】図５は概念を表わす言葉を定義する表（ta
ble）であり、基本的には概念固有番号Ｃ＃と、それを
表わす言葉（単語；又は表記）ＣＮＡＭＥ、および同表
記ＣＮＡＭＥが基本表記（Primary）であるか二次的表
記（Secondary）であるかを表わすカラムとからなって
いる。例えば、概念＃５８は「コンピュータ」であり、
表記としては「計算機」も与えている。

【００６２】図６は包摂関係Ｓを表わし、概念固有番号
Ｃ＃と、該概念の上位の概念（Superclass）の固有番号
Ｓ＃のカラムから成っている。特殊な場合として「ＵＮ
ＩＶＥＲＳＡＬ」の上位概念は「ＵＮＩＶＥＲＳＡＬ」
として定義されている。

【００６３】図７は一般関係Ｒを定義する表である。一
般関係固有信号ＲＳ＃、同関係の名称ＲＳＮＡＭＥ、同
関係を左から右へ読んだときの読みＬＲ、および右から
左へ読んだときの読みＲＬとからなる。但し、ここで
「左から右へ」とは、同関係が結ぶ２つの概念を左右に
並べる基本形に対してであり、その基本形は図８で説明
する具体関係ｒの表で定義する。表Ｒでは、例えば１６
番の一般関係として「ＳＵＢＪＥＣＴ」という関係があ
り、ＩＳ−ＳＵＢＪＥＣＴ−ＯＦ又はＳＢＵＪＥＣＴ−ＩＳという具体関係として用いられることを表わしている。

【００６４】ここで特記すべきことは、同じ読みの関係
が区別して異なるものとして定義されていることであ
る。例えば、図７で２つのＨＡＳ−ＰＡＲＴ−ＯＦがあ
るが、これらは関係ＰＡＲＴ−ＷＨＯＬＥ１とＰＡＲＴ
−ＷＨＯＬＥ２という異なる関係に対するものである。
この意味は、「部分全体関係」（part-wholerelationsh
ip）でも異なる概念に対するものは区別して扱うことに
ある。例えば、ＰＡＲＴ−ＷＨＯＬＥ１は「組織」に対
する関係で（ＡＢＣ株式会社ＨＡＳ−ＰＡＲＴ−ＯＦＸＹＺ工場（６）という場合に適用し、ＰＡＲＴ−ＷＨＯＬＥ２は「地
域」に適用し、（埼玉県ＨＡＳ−ＰＡＲＴ−ＯＦ所沢市）（７）という関係を表わすのに用いる。

【００６５】図８は概念間に定義される関係ｒを表わす
表である。同表には一般関係と具体関係の双方が登録さ
れる。カラムＧ／Ｉはそれらを区別するためのもので、
Ｇは一般関係、Ｉは具体関係であることを示す。

【００６６】表ｒにおいて、各レコードは関係固有番号
Ｒ＃、関係の種類を示す一般関係固有番号ＲＳ＃、基本
形において左側に位置する概念の固有番号ＣＬ、同じく
右側に位置する概念の固有番号ＣＲなる要素をもつ。

【００６７】たとえば、関係＃４は概念＃５８（「コン
ピュータ」）と概念＃６４（「ソフトウェア」）とに定
義される一般関係（Ｇ／Ｉ＝Ｇ）であり、一般的関係＃
７で定義される意味をもつ。より具体的には、（コンピュータＲＵＮＳソフトウェア）（ソフトウェアＲＵＮＳ−ＯＮコンピュータ）（８）という表面的には２つの関係を、表ｒにおいては１つの
レコードが表わしている。同様に、関係＃７２４は一般
関係＃７の具体化したものであり、概念＃１５１２と＃
１０５１とを結んでいる。すなわち、表Ｃから分るよう
に（Ｘ−８００ＲＵＮＳＵＸ）（ＵＸＲＵＮＳ−ＯＮＸ−８００）（９）という関係を表わす。

【００６８】以上説明した４つのデータ（表Ｃ，Ｓ，
Ｒ，ｒ）が知識ベースとしてファイル４３０に格納され
る。

【００６９】次に、文書画像を定義する表Ｄについて図
９で説明する。表Ｄは文書固有番号Ｄ＃、概念固有番号
Ｃ＃、文書サイズＳＩＺＥ、圧縮符号化方式ＣＯＤＥ、
画像走査密度ＤＥＮＳ、光ディスク上の物理アドレスＰ
ＨＹＳＡ、および記録セクタ数ＬＥＮＧなるカラムを持
っている。図９で示すレコードは、文書＃９８は、概念
＃３１３（記事ＡＲＴ＃０１８；図５参照）に関するも
ので、Ａ４サイズであり、１６本／ｍｍの走査密度でス
キャンされ、ＭＨ符号で圧縮されて、光ディスクの４０
０２０７番地以降１３セクタに格納されていることを示
す。

【００７０】これから分かるように、すべての概念に対
して文書画像を付加することが可能であり、これにより
必ずしも“文書”ではなくても、例えば「コンピュー
タ」にその説明を画像で付随させることができる。また
同時に、一つの概念に複数の異なる文書を付随させるこ
とも可能である。

【００７１】表Ｄは図１におけるファイル４２０に格納
し、管理する。

【００７２】以上、本発明実施例の装置構成と、データ
表現形式の説明を行ったので、以下にソフトウェァ構成
と処理方式とを提示する。図１０にソフトウェア構成図
を示す。ここで、該ソフトウェアは制御装置１００（図
１）が処理するものであり、プログラムはファイル４１
０に格納されている。

【００７３】図１０に示す如く、ソフトウェアは、対話
制御モジュール２００１、探索・概念マッチングモジュ
ール２００２、検索式生成モジュール２００３、概念ネ
ットワークエディタ２００４、ネットワーク跋渉モジュ
ール２００５、表操作モジュール２００６、画像表示モ
ジュール２０１０とから成っている。

【００７４】基本部分である表操作モジュールの機能か
ら説明する。表操作モジュールの目的は、先に説明した
表形式のデータを高次レベルで操作したり、検索したり
する機能を提供することである。以下に主な関数を説明
する。なお、プログラムはＬＩＳＰ言語で書かれてお
り、以下Ｓ式を用いる。なお、理解しやすくするため、
変数と関数は小文字で、定数は基本的には大文字で表記
することにする。

【００７５】まず、新しく表を作成する関数としてcrea
te-tableがある。例えば図７の表Ｒは次のように同関数
を呼ぶことにより、その枠組が新たに定義される。

【００７６】（create-table'R '(RS＃ RSNAME LA RL)) （10）ここで、第１引数は表名称、第２引数はカラム名称のリ
スト（集合）である。また、記号’（引用符号）は、次
の記号は変数ではなく定数であることを意味する。

【００７７】次に、表にレコードを追加するにはinsert
関数がある。

【００７８】（insert 'R '(RS＃ RSNAME LR RL '((7 RUN RUNS RUNS-ON) (15 DEVELOPMENT HAS-DEVELOPED IS-DEVELOPED-BY) (16 SUBJECT IS-SUBJECT-OF SUBJECT-IS))) （11）とすることにより、図７の表Ｒの３レコードが追加され
ることになる。

【００７９】レコードの更新はupdate関数を用いる。例
えば（update 'R 'RSNAME "THEME '(eq (v RS＃) 16)) （12）とすることにより、表ＲにおいてカラムＲＳ＃の値が１
６であるレコードのカラムＲＳＮＡＭＥの値を’ＴＨＥ
ＭＥにすることができる。レコードの削除は次式の如く
行う。

【００８０】（delete 'R'(eq (v RS＃) 16)) （13）第２引数は（１２）式と同様条件項であり、up dateお
よびdeleteとも、任意の命題関数を書くことができる。

【００８１】レコードの選択（すなわち検索）はselect
関数を用いる。

【００８２】（select '(LR RL 'R '(Smatch '*SUBJ (v RSNAME))) （14）例（１４）式では、部分文字列*SUBJと表ＲのカラムRSN
AMEとが部分的に一致するレコードを選択し、結果とし
て同レコードのカラムＬＲとＬＲの値のリストを返す。
ここでsmatchは部分文字列マッチングを行う命題関数で
ある。

【００８３】以上、表操作モジュールの主な関数を説明
した。

【００８４】次に、ネットワーク跋渉機能と、主な機能
の実現方法について説明する。

【００８５】概念ネットワークは図２で説明した如く、
概念ノードと「関係」というリンクとからなっている。
システムは、ユーザの興味の中心である概念をカレント
ノード（current node）として記憶している。ユーザ
は、以下説明する機能を用いながら、ネットワーク中を
歩き回る（跋渉する）ことができる。ここで歩き回ると
いうことは、カレントノードを移動することに等しい。

【００８６】ネットワーク跋渉機能の主なものを説明す
る。

【００８７】カレンノードを移動させる手段の第１番目
に概念名称またはその部分文字列を入れる方法がある。
ここで、もし部分文字列にマッチングする概念が複数あ
った場合には、メニュー表を表示して、ユーザがその中
の一つを選択することができる。その結果へカレントノ
ードは移される。図１１は部分文字列*DATABASEにマッ
チングする概念が表示されて、該メニュー表の７番目を
選択した例を示す。ここで*記号は以降の文字列が部分
文字列であることを示す。上記機能は、（select'(C＃ CNAME) 'C '(smatch str (v CNAME))) （１５）とすることにより概念を選択し、別途メニュー選択用の
関数（select-one a-list）を呼ぶことにより実現され
る。ここで、strは端末から読み込んだ文字例である。

【００８８】第２番目の跋渉手段は、概念木（階層木）
をメニュー選択により順次辿っていく方法である。図１
２は最上位概念において直接下位の概念をメニューとし
てｌコマンドで表示したものである。以降、図１３に示
すように、番号を入力することにより階層木を下って行
くことができる。図１３の例では、「６，１，１，２」
と入力することにより「組織（Organization）」という
概念に辿り付いている。この地点で、先の部分文字列を
入力すれば、カレントノードの下に含まれる概念集合の
中からのみ、同部分文字列にマッチングする概念が選ば
れることになる。例えば、図１１で現われた１１個の概
念の内、１１番目の「RELATIONAL-DATABASE-SYSTEM-IN
C」は会社名であり、これのみが選択されることにな
る。すなわち、これだけが「組織」という概念に包摂さ
れている。

【００８９】ここで、ある概念Ｃが包摂する概念は次の
ように得られる。まず、（Select'(C＃) 'S'(eq (v S＃) c)) （16）により該概念に直接包摂される（概念木で直下に位置す
る）概念が選び出される。従って、同機能を回帰的に繰
返して呼ぶことにより、概念ｃにより包摂されるすべて
の概念を選びだすことができる。

【００９０】次に第３番目の跋渉手段は、概念木をグラ
フィカルに表示しながら行う方法である。図１４は「空
間（space）」という概念に始まる、その下位２層まで
の概念木である。図１０におけるＣＲＴ２１０上に表示
される同概念木の任意のノードをマウス２３０で指示す
ることにより、指示された概念にカレントノードを移動
したり、指示された概念から始まる更に下位の概念木を
表示したりすることができる。ここでマウスで指定した
りすることができる。ここでマウスで指定したＣＲＴ上
の位置情報は図１０に示す対話制御部２００１が受取
る。該制御部はグラフィック表示を司どるので、ＣＲＴ
の各位置に何を表示しているかを記憶しており、位置情
報を入力することにより、同地点の最近点にどの概念を
表示しているかが分る。従って、制御部２００１はカー
ソル位置情報を入力して、概念名称をネットワーク跋渉
部２００５へ返す。

【００９１】グラフィカルな跋渉機能は、図１４に示す
概念の包摂関係のみでなく、部分全体関係（part-whole
relation）によっても行える。図１５は概念「地球（e
arth）」の部分を階層的に、別な意味での概念木として
表示したものである。上記例と全く同様に、部分全体関
係に沿って、歩き回ることができる。部分関係は次のよ
うに抽出することができる。まず、（select'(RS＃) 'R '(eq (v LR) 'HAS-PART-OF)) （17）は図７表Ｒより部分全体関係を表わす一般的関係番号Ｒ
Ｓ＃の集合を返す。図７の例では（２２２３）を返す。
これを変数ｘに一時記憶させる。

【００９２】いま、部分を見い出したい概念をｃとする
と、ｃが持つ「部分」となる概念は次式で得られる。

【００９３】（select'(CR) 'r '(and (eq (v CL) c) (member (v RS＃)x))) （18）ここでｒは小文字であるが図８の表の名称である。

【００９４】同様に、ＨＡＳ−ＰＡＲＴ−ＯＦが図７表
ＲのカラムＰＬにある場合についても、（１７）式と
（１８）式におけるＬＲとＲＬを交換して実行すること
により、概念ｃの部分概念が得られる。

【００９５】第４番目の跋渉手段は、概念のフレーム表
現を介在した連鎖的跋渉である。図１６の例で説明す
る。人名の部分文字列*sovaを入力し、唯一に「J. F. S
OWA」が見つかり、カレントノードが同概念に移動す
る。フレーム表示のためのｆｒコマンドにより同概念の
フレームが表示される（オペラント*はカレントノード
のフレームを表示することを意味する）。同フレームか
ら「J. F. SOWA」は「男（ＭＡＮ）」であり、PAPER ＃
0012と BOOK ＃ 0007の著者である、ということなどが
分る。ここで、例えば、PAPER ＃ 0012は何んであるか
知りたいというときには、コマンド「ｆｒ２」を投入す
ることにより、表示されているフレームの第２行目の概
念のフレームが表示される。この例では、PAPER ＃ 001
2は「論文（TECH-PAPER）」であり、著者が「J. F. SOW
A」、ページは３３６から３５７までで、「ＩＢＭ−Ｒ
ＥＳ＆ＤＥＶ−７６−２０」に載っているなどというこ
とが分かる。図１６の例では、同様な手続きでJ. F. SO
WA→PAPER ＃ 0012→ＩＢＭ−ＲＥＳ＆ＤＥＶ−７６−
２０→ＩＢＭ−ＣＯＲＰとカレントノードを移動させて
いる。

【００９６】フレームの表示は以上のように行う。い
ま、概念ｃのフレームを表示することにすると、（select'(RS ＃ CR) 'r '(eq (v CL) c)) （19）は、関係の基本形においてｃが左にある「関係」とその
ときの右側の概念のペア（組）の集合が得られる。同様
に、（select'(RS ＃ CL) 'r '(eq (c CR) c)) （20）は、ｃが右にある「関係」とそのときの左側の概念のペ
アの集合が得られる。これらの値（集合）をそれぞれ
ｘ，ｙとすると、（select'(LR) 'R '(eq (v RS＃) x_1i)) （21）（select' (RL) 'R '(eq (v RS＃) y_1i)) （22）はそれぞれ具体関係の名称を結果として返えす。

【００９７】但し、ｘ_i，ｙ_iは集合ｘ，ｙのｉ番目の要
素で、更にｘ_1iはｘ_iの第１要素、ｙ_1iはｙ_iの第１要素
である。この具体関係の名称はフレーム（図１６）の第
１カラムに対応する。すなわち、フレームの各行をスロ
ットと言うときのスロット名である。フレームの第２カ
ラムはスロット値（slot value）であり、各ペアｘ_i，
ｙ_iの第２要素ｘ_2i，ｙ_2iである。従って、スロット名
とスロット値のペアを作り、表形式に表示すれば、図１
６の如くなる。ここで内部的には概念は概念固有番号で
扱っているので、表示する際には表Ｃ（図５）から概念
名称に変換してから表示する。

【００９８】上記例では行番号（スロット番号）を指定
して次のフレームへ飛んでいるが、マウスによって直
接、飛んで行きたい概念をＣＲＴ上で指示することが出
来るし、またフレームは次々重ねて表示することも出来
る。

【００９９】次に、図１０における概念ネットワークエ
ディタ２００４を説明する。

【０１００】概念ネットワークエディタは知識ベースの
保守を行うものであり、新しい概念・関係の定義、追
加、変更、削除を行うためのものである。

【０１０１】図１７は新しい概念の追加の対話例であ
る。まず、ｍａｎとタイプすることによりカレントノー
ドを概念ＭＡＮ「男」に移し、新しい人間「スーパーマ
ン」を登録する。命令ｃｒｃにより「MR. SUPERMAN」を
ＭＡＮの下位に、すなわち、（MR.SUPERMAN IS-A MAN) （23）として登録できる。次に、命令ｃｒｒにより、新規に登
録した概念MR. SUPERMANの属性を、具体的な関係という
形式で定義、登録する。

【０１０２】システムは、一般関係という形式で「人間
は物を新しく考え出すものである」とか、「学位という
ものを持つ」とか、「何か戦をもつ」とかいう「知識」
を持っており、それらの知識を手掛りに入力すべき項目
をプロンプトとして表示する。図１７に示すごとく、M
R.SUPERMAN HAS-TITLE-OF (ACADEMIC-TITLE)：という
形で、MR. SUPERMANの学位の入力を促す。｛｝で示す
概念ACADEMIC-TITLEは、入力されるべき属性（ここでは
一つの概念）のクラスを示している。先に説明した概念
ネットワーク跋渉機能はこの時点で有効であり、この時
点ではカレントノードは概念ACADEMIC-TITLEに移されて
いる。したがって、入力すべき属性を見い出すために任
意の跋渉機能を用いることができる。図１７の例では、
直接、概念名称「ｐｈｄ」を入力しているが、同概念を
探し出すために、命令ｌによりACADEMIC-TITLEの下位の
概念をメニューとして表示（図１３参照）することも出
来るし、概念木を表示（図１４参照）して欲しい概念を
探し出してもよい。しかし、探索および跋渉はこの場合
は概念ACADEMIC-TITLEの下位の概念の範囲に限定する。
跋渉機能により入力したい属性を表わす概念にカレント
ノードを移動した後に、「ｏｋ」と入力することによ
り、次の属性の入力に移る。

【０１０３】以上のようにシステムが表示するプロンプ
トに従って入力すべき属性だけを選択しながら新規に定
義・登録することができる。

【０１０４】本発明方式での特徴の一つは、先に説明し
たごとく、属性を具体関係という形で捉えることによっ
て、双方の概念を同等に扱っていることであり、図１７
の例でいうと、上記定義により（RED IS-GIVEN-TO MR.SUPERMAN) （AAAI HAS-MEMBER-OF MR.SUPERMAN) (JAPAN HAS-PEOPLE-OF MR.SUPERMAN) （JAPAN HAS-PEOPLE-OF MR.SUPERMAN) （HITACHI-LTD HAS-EMPLOYEE-OF MR.SUPERMAN) などの事実が同時に定義されることになる。

【０１０５】概念の新規登録は、内部的には以下のよう
に実現できる。いま、最大のＣ＃（図５参照）をＣ_max
とすると、まず、（insert'C '(C＃ CNAME P/S) (list (add1 C_max) 'MR.SUPERMAN 'P)) （24）により表Ｃに概念MR.SUPERMANを登録する。ここで、要
数ａｄｄ１は＋１する関数である。

【０１０６】（insert'S '(C＃ S＃） (list (add1 C_max) (get-C＃'MAN))) （25）により表Ｓに、（２３）の事実が登録できる。ここで関
数ｇｅｔ−Ｃ＃は概念名称から同概念の固有番号を得る
ための関数である。

【０１０７】具体関係の登録は、名関係（属性）に対し
て次のように行える。

【０１０８】（insert'r '(R＃ RS＃ CL CR G/I) (list (add1 r＃_max) rs (get-C＃'MR.SUPERMAN) (get-C＃'PHD) 'I)) 但し、ここでｒｓは一般関係「ACADEMIC-TITLE」の固有
番号、ｒ＃_maxは表ｒにおけるその時点での最大Ｒ＃で
あるとする。

【０１０９】概念ネットワークエディタの別の機能は、
既に登録してある事実や概念の変更・修正である。具体
的には、概念名称の修正、概念木における位置の修正
（分類の修正）、具体関係の修正、一般的関係の修正な
どが行える。

【０１１０】図１８は概念木の修正例を示す。概念PSYC
HOLOGYの位置をSOCIAL-SCIENCEからNATURAL-SCIENCEの
元へ移動する例である。

【０１１１】（update'S 'S＃ '(get-C＃'NATURAL-SCIENCE) '(eq (v C＃) (get-C＃'PSYCHOLOGY))) （27）を実行することで上記例の移動が行われる。

【０１１２】概念ネットワークエディタでは、ネットワ
ーク跋渉機能を随時用いることが可能なことを述べた
が、同様にネットワークエディタ機能自体を再帰的に用
いることができる。例えば、新規概念の定義登録中に、
別の概念を新規登録しておくことが必要となることが往
々にしてあるからである。図１７の例で、「学会」（AC
ADEMIC-ASSOCIATION）の中にもし入力すべき「AAAI」が
未登録であったとすると、同時点で命令ｃｒｃを入力し
て新規に概念AAAIを登録することができる。更に必要で
あれば命令ｃｒｒによりAAAIの属性をその時点で登録し
てもよい。

【０１１３】あるいは、新規に概念を登録中に誤った
「事実」などの登録が見つかることもあり、この場合
も、修正・変更を即時に実行できる機能をもっている。
これらの再帰性により、効率よく新規な知識を追加登録
することが可能となる。

【０１１４】次に、図１０における検索式生成部２００
３および探索・概念マッチング部２００２を説明する。
これらの部分は、断片的なあいまい情報から意味的な内
容検索を可能とする主要な部分である。まず、機能を説
明するために処理の流れを検索例により説明する。

【０１１５】「カリフォルニア州にある会社が開発したコンピュータで、UNIX*が走るものに関する記事」（28）を検索することを考える *(UNIXはBell研究所の登録商
標である。）。

【０１１６】図１９の示すごとく、まず、カレントノー
ドを概念ARTICLE（記事）に移し、命令ｑを入力するこ
とにより検索式生成を開始する。システムは、上位概念
から継承されるものをも含めて、概念ARTICLEに定義さ
れている一般関係を求め、フレーム形式で図１９のごと
く表示する。「記事は出版物の一部である」、「記事は
何頁にある」、「記事はある記事から参照されている」
などの一般的知識から作られるフレームが表示されてい
る。ユーザは、この場合は、番号によりスロットを指定
して、同スロットに対して現在表示されているよりも具
体的な情報を追加することができる。図１９の例では、
記事の主題がコンピュータであることが情報として手元
にあるので、第５番目のスロットを選択する。システム
は入力すべき項目の上位概念、この場合はUNIVERSALへ
カレントノードを移す。ユーザはこの時点で任意のネッ
トワーク跋渉機能を用いることができる（図１０参
照）。図１９の例では直接「Computer」と入力し、カレ
ントノードを概念COMPUTERに移している。しかし、もし
入力すべき概念名称が思い浮ばなければ、部分文字列を
入力したり、メニュー表示をしたりすることにより、選
び出すことが可能である。本例では、コンピュータに関
する情報が更に存在するので、「Computer」の後に更に
命令ｑを続けて入力している。

【０１１７】図２０は次の対話画面である。概念COMPUT
ERに関する一般関係のフレーム表現が表示されている。
先と同様に、追加すべき条件のスロット、この場合４
番、を選択する。入力すべき項目のクラスは「ORGANIZA
TION. WORKPLACE」であることが表示される。ここでも
メニュー選択（図１３参照）などを用いることが出来る
が、本例では単に「ある会社」という意味で、直接「Co
mpany」と入力している。「Company」に対しても更に追
加すべき情報があるので、続けて「ｑ」を入力して検索
式生成過程を続ける。

【０１１８】図２１は概念COMPANYに対する一般関係の
フレーム表示である。第７番目のスロットを選択し、同
会社がカリフォルニア州にある、という条件を入力して
いる。この場合は部分文字列「Ｃａｌ」を入力して「Ca
lifornia」を選び出している。概念SPACE. PLACE. LOCA
TIONの下位概念は図１４に示した。

【０１１９】条件入力の終了は「ｏｋ」と入力すること
によりシステムに伝えられる。図２２は、COMPANYに対
する条件入力を終了して、再度COMPUTERに対する条件入
力を行う場面である。今回は、第１３番目のスロットを
選択し、「同コンピュータはオペレーティングシステム
UNIXのもとで走る」という情報を入力する。

【０１２０】以上の過程をすべて終了すると、（２８）
式の検索条件は次式の形式的表現に置換えられることに
なる。

【０１２１】（ARTICLE (SUBJECT-IS (COMPUTER (RUNS-UNDER UNIX) (IS-DEVELOPED-AT (COMPANY (IS-LOCATED-IN CALIFORNIA)))))) （29）検索式の自動的な生成は、上記のように一般的な関係と
して記述された一般知識によって導かれて行われる。こ
の一般的知識の多くは、上位の概念から継承されたもの
である。例えば、図２１において、（COMPANY IS-A ORGANIZATION.WORKPLACE) であるが、同フレームのほとんどのスロット（一般関
係）は上位概念ORGANIZATION.WORKPLACEに対して定義さ
れたものである。COMPANYに固有なものは、同図の例で
は（PRODUCES MACHINERY. DEVICE）のみである。このよ
うに、一般的知識としての一般関係は文字通り、より一
般的に（より上位の概念で）表現されればされる程、強
力なものとなる。すなわち、沢山の下位の概念に適用可
能となる。

【０１２２】概念ｃの一般関係は次のように求めること
ができる。いま、概念ｃの上位概念の集合をｘとする。

【０１２３】（表ＳでＩＳ−ＡリンクをUNIVERSALに突
き当るまでたどればよい。）（Select'(RS＃CR) 'r '(and (member (v CL) x) (eq (v G/I) 'G))) （30）は、概念ｃに継承される一般関係の内、概念ｃが左側に
定義されているものを抽出する。（３０）式において、
ＣＲ→ＣＬ，ＣＬ→ＣＲと置換えれば、概念ｃが右側に
定義されている一般関係が得られる。（３０）式から分
るように、得られるものはＲＳ＃とＣＬ又はＣＲペア
（組）である。ＲＳ＃から表Ｒを参照することにより、
フレームのスロット名称を得ることができる。いま、
（３０）式の答えを、（（ｙ_1i，ｙ_2i）…（ｙ_2i，
ｙ_2i）…）という形式であるとすると、（select'(LR) 'R '(eq (v RS＃) y_1i)) （31）から、ｉ番目のｙに対応するスロット名称を得ることが
できる。（３０）式のＣＲとＣＬを代えたものに対して
は、（３１）式においてもＬＲをＲＬと置換えればよい
（図７参照）。

【０１２４】（３１）式の答えを（（ｚ₁）…（ｚ_i）
…）と書くと、ペア（ｚ_iｙ_2i）はスロット名称と概念
固有番号から成っている。

【０１２５】（select'(CNAME) 'C '(and (eq (v C＃) y_2i) (eq (v P/S) 'P))) （32）は概念名称Ｃ₁を返えすので、結局、ペア（Ｚ_iＣ_i）は
スロット名称とスロット値を構成することになる。リス
ト（（Ｚ₁Ｃ₁）（Ｚ₂Ｃ₂）…（Ｚ_iＣ_i）…）を表形式で
表示することにより、図２１の如く一般関係のフレーム
を得ることができる。

【０１２６】さて、自動生成された検索条件式（例えば
（２９）式）に対して、探索命令を入力すると、カレン
トノードの終端概念（部分的概念木の「葉」（leaf）に
当る概念）の集合を対象として、概念マッチングが行わ
れる。すなわち、終端概念（最も具体的な概念）のそれ
ぞれが、検索条件式で表現される「抽象的概念」と比較
され、概念的に包含される終端概念が検索結果となる。

【０１２７】図２３は（２９）式の検索条件３０００に
対して探索を行った場合を示しており、条件の合致した
記事の概念フレーム表示３００１と、本文のイメージ３
０５１の表示が可能である。同図で示すように得られた
記号ARTICLE＃0014の概念フレームは、表面的には検索
条件式（２９）式と全く一致していないことである。こ
れは、正に従来のデータベース等の情報検索方式で起る
事柄である。すなわち、データベースには最も具体的な
情報が記憶されているため、検索条件が抽象的である
と、全く一致しないことになる。しかしながら、本発明
方式では、分野に関する知識を用いて、概念フレームの
具体的内容と、検索条件の抽象的表現のギャップを推論
により埋めている。

【０１２８】次に、上記ギャップを埋めるための抽象的
概念と具体的な概念との推論を用いてマッチング方法を
説明する。ここでは、この過程を概念マッチング（conc
eptmatching）と呼ぶ。図２４に、（２９）式で表わさ
れる抽象的概念と概念ARTICLE＃0014との概念マッチン
グの過程を示す。

【０１２９】探索過程では終端概念ARTICLE＃0001〜ART
ICLE＃0040のそれぞれが（２９）式と比較されるが、こ
こではマッチングが成功するARTICLE＃0014についての
み説明する。

【０１３０】まず、（ARTICLE）と（ARTICLE＃0014）が
比較される。フレーム3001から（ARTICLE＃0014 IS-A NEWS. ARTICLE）更に（NEWS.ARTICLE IS-A ARTICLE）であることが分り、（ARTICLE＃0014 IS-A ARTICLE）なる結論が得られる。従って、条件式を一段深くして、（ARTICLE(SUBJECT-IS COMPUTER)) （33）が成立するか否かを次に調べる。フレーム３００１か
ら、まず、（ARTICLE＃0014 (SUBJECT-IS HP-9000)) であることが分る。したがって、（HP-9000 IS-A COMPUTER）であるか否かを調べればよい。リンク３００３を辿る
と、（HP-9000 IS-A SUPERMINICOMPUTER) 更にリンク３０３２を辿ると（SUPERMINICOMPUTER IS-A COMPUTER) であることが、それぞれフレーム３００２，３００４か
ら分り、（３３）式が成功する。したがって、次に、（ARTICLE (SUBJECT-IS (COMPUTER (RUNS-UNDER UNIX) (IS-DEVELOPED-AT COMPANY)))) （34）の成立を調べる。（COMPUTER RUNS-UNDER UNIX）につい
てはフレーム３００２から成立することが直接分る。
（COMPUTER IS-DEVELOPED-AT COMPANY）については、フ
レーム３００２には（HP-9000 IS-DEVELOPED-AT HP.HEWLETT-PACKARD-CO) と書いてあるので、更に調べに行くことが必要である。
リンク３０３３を辿ると、フレーム３００４に（HP.HEWLETT-PACKARD-CO IS-A COMPANY) と書いてあるので成立する。従って（３４）式も成立す
る。

【０１３１】更に検索条件式を１段深くして（２９）式
と比較する。フレーム３００４は（HP.HEWLETT-PACKARD-CO IS-LOCATED-IN PALO-ALTO) （35）と書かれているので、（COMPANY IS-LOCATED-IN CALIFORNIA) （36）であるか否かを調べる必要がある。リンク３０３４を辿
ると、フレーム３００５に（PALO-ALTO IS-PART-OF CALIFORNIA) （37）と記録されているので、（３５）式とあわせて、（HP.HEWLETT-PACKARD-CO IS-LOCATED-IN CALIFORNIA) であることが推論される。結局、抽象的概念（２９）は
具体的概念ARTICLE＃0014を包摂することが分った。

【０１３２】以上、具体例を用いて、概念マッチングを
説明したが、この過程は再帰的に表現すると、概念の包
摂関係の成否を調べる過程と、各スロットが一致するか
否かを調べる過程とが交互に再帰的に呼ばれる過程とな
っている。また、説明からも分るように、後戻り形推論
（backward-chaining inference）となっている。従っ
て、探索時間は検索対象となる具体的物件の数に、基本
的には比例することになる。

【０１３３】概念マッチングではマッチングが成功した
時に具体的な概念を値として返えす。この値を抽象的概
念の中に埋め込むことにより、何故ある具体的概念がマ
ッチングしたかが、後から分る。本発明方式では、命令
ｗｈｙを入力すると検索された概念のマッチング理由が
表示・出力される。（２９）式の例では、（ARTICLE＃0014 （SUBJECT-IS (HP-9000 (RUNS-UNDER UNIX) (IS-DEVELOPED-AT (HP.HEWLETT-PACKARD-CO (IS-LOCATED-IN PALO-ALTO)))))) （38）が得られる。従って、抽象的に検索時に述べたコンピュ
ータとはＨＰ−９０００で、ある会社とはHP.HEWLETT-P
ACKARD-COであることが分かることになる。

【０１３４】さて、本発明の検索方式では、概念ネット
ワークで表現された知識を、通常ユーザが見慣れた表形
式に変換して表示し、同表の上で検索する手段をも提供
している。図２５に具体例を示す。カレントノードを抽
象概念NEWS.ARTICLEに移した後、命令ｔａｂを入力する
と、システムは同概念の下位の終端概念の概念フレーム
を内部的に生成する。次に、同フレームに現われるスロ
ット名称を表にして提示する。図２５の場合は、６種類
のスロットがあったことになる。ユーザは、どのスロッ
トをカラムとした表にするかを選択することができる。
同例では６番目と５番目のスロット、すなわち、TITLE-
ISとSUBJECT-ISを選択し、合計３つのカラムからなる表
が表示される。ユーザは例えばタイトルの文章から欲し
いものを探し出すことが出来る。選択した結果をカレン
トノードとして、本文イメージを表示する命令を入力す
れば、イメージ用ＣＲＴ５００に本文イメージが表示さ
れる。

【０１３５】本発明による検索方式は、必ずしも文書フ
ァイリングのみではなく、広く一般のデータや事実の情
報にも適用できる。また概念マッチングは、２つの概念
の包摂関係を自動的に検定する方式を与えており単に、
情報検索のみならず、特許のクレームの包摂関係の審査
のような情報分析技術としても応用することが出来る。
あるいは、大量な具体的概念を集めて、同概念マッチン
グを応用することにより、概念的なクラスタ分析も可能
となる。

【０１３６】本発明の一拡張として、知識ベースに時間
の概念を導入することができる。一般に、事実などは
「真」である時間を指定する必要があることが多い。例
えば、（MR.SUPERMAN IS-MEMBER-OF AAAI）という事実
は入会した時刻から、退会したとすればその時刻まで
「真」である。このような時間の概念は、具体関係を保
持する表ｒを拡張することにより実現できる。

【０１３７】更に別な拡張は、各事実の出所を記録する
機能である。例えば、誰がそう言ったか、どこにそれが
書いてあったか、という情報の出典を、表ｒを拡張する
ことにより記録し、情報の管理をすることができる。更
に、信頼度を付記することも考えられる。

【０１３８】本発明はシステムの実現方法に依存しな
い。たとえば、処理を高速化するために特殊なハードウ
ェアを導入してもよい。また、知識ベースが大きくなっ
た場合に実現上の変形たとえば、概念や関係を記憶する
表をクラスタに分割して記憶する方法などが考え得る
が、これらは本発明方式に含まれる。更に、日本語で概
念等を表記した場合には、日本語特有の仮名漢字変換機
能などが要求されるが、これらの拡張がなされたものも
本発明に含まれる。

【０１３９】

【発明の効果】以上説明したごとく、本発明によれば、
ファイルまたはデータベースの具体的な構築方法を知ら
ずとも、断片的な情報から欲しい文書などの情報を容易
に引出すことが可能になる。更に、容易に引出すること
ができるように格納することも極めて容易になる。

【０１４０】具体的には、ファイリングする対象に関す
る分野知識を、概念ネットワークで表現して知識ベース
化することにより、新しい知識の追加・編集や検索条件
の対話的入力が容易に行えるようになる。知識は、一般
関係と具体関係という形で表現されるが、情報の入力に
当ってシステムは、一般関係を用いてユーザが次に何を
入力すべきか、更にそれはどのクラスの概念であるべき
かを推定して、端末上に表示する機能を持つ。本機能は
基本的な原理の上に組立てられているので、概念ネット
ワークで表現される知識ベースを追加ないしは変更する
のみで、新しい世界や、より木目の細かい世界への適応
が可能である。

【０１４１】また、知識ベースの追加・変更などのため
に、概念ネットワークエディタがあり、４種類以上のネ
ットワーク跋渉機能を持つ知識ベースの状態を、概念木
やメニュー表、あるいはフレーム、更には関係データベ
ース形の表形式で表示する機能を与え、これらの表現の
上で次々異なる概念へ跋渉することが可能である。これ
らの豊富なデータビューが可能なことは、新しく考案し
た概念関係モデルを採ったことにある。特に、概念フレ
ームを表示しながら異なる概念へ飛んでいく機能は、人
間の思考形態とマッチしており、本機能のみでもかなり
高度な概念探索を実行することができる。

【０１４２】更に、本発明によれば、分野知識を用いた
推論を行うことにより、あいまいな断片情報から意味的
な内容検索が可能である。従来の技術では役に立たない
ような抽象的な情報からでも、「意味的」に内容を捉え
ることにより、精度高く検索できる。また、検索条件は
任意の項目で、かつ任意の深さまで推定することがで
き、人間が思い出すことの出来たレベルに合せて、検索
式を作ることができる。

【図面の簡単な説明】

【図１】本発明方式の一実施例のシステム構成図。

【図２】概念ネットワークを説明する図。

【図３】形式的表現による概念ネットワーク。

【図４】ＥＲ図式によった概念関係モデルのデータ表現
図。

【図５】概念関係モデルによる知識表現の具体例を示す
図。

【図６】概念関係モデルによる知識表現の具体例を示す
図。

【図７】概念関係モデルによる知識表現の具体例を示す
図。

【図８】概念関係モデルによる知識表現の具体例を示す
図。

【図９】画像データ管理用の具体例を示す図。

【図１０】ソフト的な機能ブロック図。

【図１１】部分文字列マッチングの説明する図。

【図１２】メニューを表示する図。

【図１３】メニュー選択を用いたネットワーク跋渉の説
明図。

【図１４】概念木表示を示す図。

【図１５】概念の部分全体関係にもとづく階層木を表示
する図。

【図１６】概念フレームによるネットワーク跋渉の説明
図。

【図１７】新しい概念の定義・登録方法の説明図。

【図１８】概念ネットワークエディタの説明図。

【図１９】対話的な検索式生成方式の説明図。

【図２０】対話的な検索式生成方式の説明図。

【図２１】対話的な検索式生成方式の説明図。

【図２２】対話的な検索式生成方式の説明図。

【図２３】意味的な内容検索の説明図。

【図２４】概念マッチングの説明図。

【図２５】表形式で概念ネットワークの状態を表示する
機能の説明図。

【符号の説明】

１００…制御装置、２００…操作端末、３００…主メモ
リ、４００…磁気ディスク装置群、４５０…光ディスク
装置、５００…高精細画像表示装置、６００…高速画像
処理回路、７００…画像スキャナ、７５０…画像プリン
タ、２００１…対話制御部、２００２…探索・概念マッ
チング部、２００３…検索式生成部、２００４…概念ネ
ットワークエディタ、２００５…ネットワーク跋渉部、
２００６…表操作部、２０１０…画像表示部。

Claims

【特許請求の範囲】

【請求項１】概念を表わすための複数の語句および複数
の語句間の関係を表わすための複数の述語を記憶する知
識ベースと、入力手段と、表示手段と、上記入力手段から検索キーとなる１つの概念を示す語句
が入力されたとき、上記知識ベースに基づいて該入力語
句と関連してユーザが選択しうる概念を検索し、上記入
力語句と関係をもつ少なくとも１つの語句と上記入力語
句との関係を表わす少なくとも１つの述語とを上記表示
手段に表示するための処理手段と、を備えた検索システムであって、上記表示手段に表示された語句と述語の中から所望の語
句と述語の組を上記表示手段を用いて選択させ、選択さ
れた語句に包摂される新たな語句を入力させることによ
り、上記入力語句と新たな入力語句とが上記選択された
述語で関連付けられた検索条件を生成することを特徴と
する検索システム。
【請求項２】概念を示す複数の語句と該複数の語句間の
関係を知識ベースとしてあらかじめ記憶しておき、選択された語句群と該語句群の関係を示す述語群で規定
される検索条件と、該検索条件中のある語句と関係を持
ち上記知識ベースに記憶された複数の別の語句とその関
係とを画面上に表示し、表示される上記複数の別の語句とその関係から１つを選
択し、その選択された語句とその関係に応じて上記検索
条件を書き換えて表示することを特徴とする検索システ
ムの画面表示方法。
【請求項３】請求項２記載において、上記検索条件中の
ある語句を上記画面上で指定し、その指定に応じて該指
定された語句と関係を持ち上記知識ベースに記憶された
複数の別の語句とその関係とを上記画面上に表示するこ
とを特徴とする検索システムの画面表示方法。