JPH09190453A

JPH09190453A - データベース装置

Info

Publication number: JPH09190453A
Application number: JP8326482A
Authority: JP
Inventors: Hiromichi Fujisawa; 浩道藤澤; Kon Debitsuto; デビット・コン; Atsushi Hatakeyama; 敦畠山; Itsuko Kiuchi; 伊都子木内
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1996-12-06
Filing date: 1996-12-06
Publication date: 1997-07-22
Anticipated expiration: 2014-09-13
Also published as: JP2948159B2

Abstract

(57)【要約】【目的】文書構造を自動的に解析するデ−タベース装置
において、構造を解析するための知識情報ファイルのメ
ンテナンスが不要なデ−タベースを提供する。【構成】複合名詞句を含む単語列５０１を入力する入力
手段５０２、入力された単語列を処理する処理手段、処
理結果を出力する出力手段を備える装置であって、処理
手段は、概念をノードとして表し、概念間の関係をリン
クとして表し、ノードとリンクで概念木を構成する概念
ネットワークを知識として記憶する知識ベース５１３
と、入力された単語列中に存在する複合名詞句の複数の
単語間の意味関係を判定するための知識情報を、概念ネ
ットワークを検索することにより抽出する解析手段を有
する装置。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、一般のユーザが知織・
情報の検索や登録を判り易く、かつ容易に出来るように
するための自然言語インターフェースに係る。より具体
的には、そのような自然言語インターフェースを実現す
るための自然言語理解方式と、それを用いた知識ベース
方式に関する。特に、多種多様な事物や事実を記憶し
て、自然言語から推論を働かせて検索が出来るような知
識デ−タベースの構築法に関する。

【０００２】

【従来の技術】従来、自然言語を用いたヒューマンイン
ターフェースとしては、データベースのための自然言語
インターフェースが知られている。例えば、文献［ジー
・ジー・ヘンドリックス、他、"ディベロッピング・ア
・ナチュラル・ラングエッジ・インタフェース・トゥー
・コンプレックス・データ"、エーシーエム、トランザ
クション・データベース・システム、ボル３、１９７
８、ピーピー１０５−１４７（G. G. Hendrix et al.,
"Developing a Natural Language Interface to Compl
ex Data," ACM Trans. Database Systems, Vol. 3, 197
8, pp.105-147)］などがある。これらのシステムでは、
データベースのためのデータモデル（記憶するデータ項
目間の関係を表現する方式のこと）と、自然言語を解釈
するための文法や辞書とが独立に設定されている。すな
わち、自然言語インターフェースを既存のデータベース
に対して付加するときは、文法や辞書を改めて構築する
必要がある。或いは、対象とするデータベースが変われ
ば、自然言語インターフェースのための文法や辞書を変
更する必要があるという問題点がある。

【０００３】また、従来、自然言語インターフェースが
与えられているデータベースは関係データベース（Rela
tional Database）であり、そこで用いられる検索のた
めの形式言語、例えば準標準的なＳＱＬ言語(Structure
d Query Language：ストラクチャード・クエリ・ラング
エッジ）は高次の知識の記述能力に弱い。通常、自然言
語による質問文は、このような中間言語としての形式言
語に翻訳されるため、この形式言語の表現能力にシステ
ム全体の機能が制限されてしまうという問題点がある。
特に、関係データベースは一様なデータに対しては有効
であるが、多種多様な事物を扱うヘテロジェネオス・デ
ータベース（heterogeneous database）や、オブジェク
ト指向のデータベースに対しては、充分適しているとは
言えない。例えば、曖昧なユーザの記憶から事物を記述
して、その記述からそれに関する情報を検索することに
は適していない。

【０００４】更に、これらのシステムでは、データ（新
しい知識・情報）の入力は自然言語以外の方法を用いて
おり、専門家が行っている。従って、エンドユーザが直
接入力・登録することが難しいという問題点がある。

【０００５】

【発明が解決しようとする課題】本発明の解決しようと
する課題は、データベースや知識ベースにおいて、以上
のような問題点を解決し、エンドユーザが曖昧、または
断片的な記憶からでも自然言語による記述から欲しい情
報を検索可能とすることにある。更に、新しい情報や知
識の登録もユーザ自身により同様に自然言語を用いて行
えるようにすることにある。

【０００６】

【課題を解決するための手段】本発明は、かかる課題を
達成するために、知識ベースと自然言語インターフェー
スとに共通の知識表現基盤を与え、それにより自然言語
による知織・情報の検索と登録とを容易に実現可能とす
るものである。

【０００７】具体的には、本発明は、知識ベースの構成
法として、「概念」と「関係」とで事物の体系と事実を
表現する「概念関係モデル」と呼ぶ知識表現方式（デー
タベースにおけるデータモデルに対応する）を与え、更
に、同知識ベースの中に言語的知識をも記憶させる方式
を提供する。ここで、「概念」とは、事物や事象、或い
は抽象的な概念を表わす計算機内のデータ項目であり、
「関係」とは、同概念間に定義するデータ項目である。
概念はノード（節）で表わし、関係はリンク（辺）で表
わす。概念関係モデルで表された知識は、従って、概念
のネットワークを構成する。ここでは、これを概念ネッ
トワークと称する。

【０００８】すなわち、本発明による知識ベースでは、
本来記憶したい知識とそれを言語的に表現するための知
識とを一体として概念ネットワークに格納し、自然言語
インターフェースは同知識を共用するようにすることが
特徴である。従って、原則として、自然言語インターフ
ェースのために改めて辞書などを構築する必要が無い。

【０００９】また、本発明は、知識ベースに記憶されて
いる事実などから推論を働かせて、自然言語で表わされ
た質問文の意味解釈を行う自然言語理解方式を提供す
る。特に、通常、我々が良く用いる複数の名詞の列から
なる複合名詞句の意味解釈方式を与える。複合名詞句を
意味解釈するためには、名詞間の関係をシステムが推論
する必要があるが、本発明では、知識ベース内に記憶さ
れている概念と関係のみを推論する方式を与える。

【００１０】更に、本発明による知滴表現方式は、複数
の言語に適用することが容易になるように、言語に依存
する部分を限定している。更には、複数の言語による表
現の共存も可能にしている。従って、同一知識ベースに
おいて、例えば、英語と日本語で検索したり、登録した
りすることを可能とする手段を提供する。

【００１１】なお、単語間の意味関係を概念ネットワー
クを用いて表現し自然言語処理に利用する技術自体に関
しては、特開昭６１−２２００２７号公報がある。しか
し、本願発明は、検索対象のデ−タを概念ネットワーク
を用いて記憶するとともに、自然言語を解釈するための
知識情報も同じ概念ネットワークから抽出することを示
す。よって、デ−タの増大にともなって知識情報の量も
自動的に増大する。

【００１２】これにより、別個に解釈用の知識ファイル
を設けた場合における、デ−タベースとは別に行なわな
ければならない知識ファイルのメンテナンスの問題を解
消することができる。

【００１３】

【作用】以下、本発明方式の原理を説明する。

【００１４】まず、基本となる概念関係モデルによる知
識表現方式を説明する。図２に概念ネットワークの一部
を説明のために示す。同図において、楕円は概念（ノー
ド）を表わし、矢印は関係（リンク）を表わす。ノード
２０１、"ＵＮＩＶＥＲＳＡＬ" は知識ベース内の全て
を代表するルートノード（根）である。各ノードには一
つ以上の文字列を概念の名称として定義できる。例え
ば、同義語や外国語を付加することができる。

【００１５】一方、ノードとノードを結ぶリンクには、
属性が継承される概念間に定義される包摂関係（ＩＳ−
Ａリンク２０２）、概念間に一般的に定義される「一般
関係」（ノード２０３）、および同一般関係の具体的事
例としての「具体関係」（リンク２０４）がある。包摂
関係は物のクラス（分類）を表わす。従って、概念と包
摂関係からなる概念ネットワークは、分類階層(taxonom
ic hierarchy）を表わす概念木を構成する。

【００１６】例えば、図２の概念ネットワークの内、概
念木は次のような知識を表わしている。

【００１７】 (PAPER-MATERIAL (is-a THING)) (BOOK (is-a PAPER-MATERIAL)) (BOOK#0051 (is-a BOOK)) (LIVING-THING (is-a THING)) (PERSON (is-a LIVING-THING)) (NEWTON (is-a PERSON)) ここで、これらフレーム表現と呼ばれる。ここでは、Ｌ
ＩＳＰ言語で使うＳ式表現（Symbolic expression）で
表わしている。これらは普通の英語でも表わすことが可
能であり、 Paper material is a thing. Book is a paper material. などと書ける。日本語では、「書物は物である。」「本は書物である。」「人は生物である。」などとなる。

【００１８】一般関係の例は、図２において、概念２１
１（ＢＯＯＫ）と概念２１２（ＰＥＲＳＯＮ）との間に
定義される関係２０３である。これは「本」と「人」と
の間には「著者」または「著作」という関係が有り得る
ことを表わしている。この一般関係は、 (BOOK (is-written-by PERSON)) (PERSON (has-written BOOK)) または、「本を書いた人」「人が書いた本」のように、右方向、或いは左方向へ双方向に読むことが
出来る。

【００１９】具体関係は、図２において、破線のリンク
２０４で示されるような関係であり、ある一般関係の一
つの具体的（データベースでは実現値とも言う）を示
す。例えば、図２では、「著者」という一般関係２０３
の具体例として、概念２１３と概念２１４との間に具体
関係２０４が定義されている。フレーム表現で書くと、となる。自然言語では、 BOOK#0051 is a book which is written by NEWTON. NEWTON is a person who has written BOOK#0051. 「ＢＯＯＫ＃００５１はＮＥＷＴＯＮが書いた本であ
る。」「ＮＥＷＴＯＮはＢＯＯＫ＃００５１を書いた人であ
る。」のように表わすことが出来る。

【００２０】さて、以上のような知識は、本発明方式で
は以下のようなデータ構造で記憶する。まず、概念とそ
の名称は概念名称テーブル２２１（図３）で記憶する。
同テーブル２２１は、三つのカラム２２２、２２３、２
２４から成っている。カラム２２２は概念の固有番号Ｃ
＃であり、カラム２２３にその名称ＣＮＡＭＥを定義で
きる。同名称の言言ＬＡＮＧはカラム２２４で規定す
る。例えば、ＬＡＮＧの値が "Ｊ" のときは同名称は日
本語、 "Ｅ" のときは英語である。

【００２１】また、概念名称は、同一言語に対して複数
個、定義することが出来る。そのために、カラム２２３
はデータ構造としてデータの繰返しを許している。例え
ば、概念Ｃ＃０００４の名称は「本」および "ＢＯＯ
Ｋ" であるが、これに対して、概念名称「書籍」を追加
定義することも出来る。

【００２２】次に、概念の包摂関係は、図４に示す包摂
関係テーブル２３１で表わす。カラム２３２とカラム２
３３は、各々概念固有番号Ｃ＃およびＣＳ＃であり、概
念Ｃ＃の上位概念（Superconcept）は概念ＳＣ＃である
ことを表わす。例えば、テーブル２３１の第２レコード
は、概念Ｃ＃０００２（「書物）」の上位概念は概念Ｃ
＃０００１（「事物」」であることを表わす。各概念に
定義される属性などの「関係」は、包摂関係のリンクを
通じて上位から下位へ継承される。ここで、一つの概念
に対して複数の上位概念を定義することが可能である。
従って、属性の多重継承が実現される。

【００２３】包摂関係以外の概念間の多種多様な関係
は、図５で示す一般関係定義テーブル２４１に定義する
ことが出来る。個々の一般関係は各々、関係の種類を表
わす。基本的には、そのような関係の種類の数に制限は
無く、任意の数の一般関係を定義することが可能であ
る。

【００２４】一般関係定義テーブル２４１は、主に「関
係」を自然言語で表現したときの「読み」を定義する。
カラム２４４は同関係を左から右へ読んだときの「読
み」ＬＲであり、カラム２４５はその逆に右から左への
「読み」ＲＬを定義する。これらのカラムは、データ構
造として繰返しを許容し、複数の読みを定義することが
出来る。また、これらは概念名称テーブルと同様にカラ
ム２４６によって読みの言語を指定することが出来る。
従って、複数の言語によって表現することが可能であ
る。

【００２５】図５の例では、関係 "AUTHORSHIP" は、 PERSON who is author of BOOK PERSON who is the author of BOOK PERSON who wrote BOOK PERSON who has written BOOK 或いは、 BOOK whose author is PERSON BOOK by PERSON BOOK from PERSON BOOK of PERSON と自然言語（この場合は英語）で表現できる。日本語の
場合も同様である（省略）。

【００２６】概念間の関係の存在は、図６に示す関係テ
ーブル２５１によって記憶する。これまでに説明したよ
うに、関係リンクには一般関係と具体関係とがあり、そ
れらはテーブル２５１のカラム２５６によって区別す
る。カラムＣＬＡＳＳの値がＧＲのときは一般関係、Ｉ
ＮＳＴのときは具体関係を表わす。図６の例では、第１
レコードは図２の一般関係２０３を表わし、第２レコー
ドは図２の具体関係２０４を表わす。また、カラムＣ＃
Ｌは左側の概念を、カラムＣ＃Ｒは右側の概念を規定す
る。ここで、ある概念を右に置くか左に置くかは、定義
次第であり、テーブル２４１とテーブル２５１とで矛盾
が無い限り、どちらに定義しても良い。

【００２７】さて、次に、以上の知識表現方式を基礎と
する自然言語理解方式の原理を説明する。

【００２８】まず、オブジェクト指向の知識ベースで最
も重要な複合名詞句の意味理解方式を説明する。ここ
で、複合名詞句とは一部形容詞を含んだ複数の名詞の列
からなる名詞句である。例えば、以下は複合名詞句の例
である。

【００２９】 supercomputer article (1) ElectronicsWeek article (2) Japanese personal computer company (3) American personal computer software packages (4) ここで、意味を理解することは、各形容詞および名詞の
間の関係を陽に求めることである。

【００３０】例えば、複合名詞句（１）と（２）は同じ
構造をしているが、意味は異なり、次のように解釈され
るべきである。（１）は、"article whose subject is
supercomputer" のことであり、（２）は、"article wh
ich is part of ElectronicsWeek" を意味する。すなわ
ち、（１）では、articleとsupercomputerとが関係subj
ect-isで結ばれていること、（２）では、articleとEle
ctronicsWeekが関係is-part-ofで結ばれていることを推
論する必要がある。フレーム形式が記述すると、次のよ
うな構造を自動的に抽出することが意味を理解すること
である。

【００３１】 (ARTICLE (subject-is SUPERCOMPUTER)) (5) (ARTICLE (is part-of ElectronicsWeek)) (6) 本発明による自然言語理解方式では、図７に示すような
知識に基づいて、以下のように意味を解釈する。まず、
この推論を可能とする知識としては、一般関係として、
関係ＲＳ＃００１１： (ARTICLE (subject-is UNIVERSAL)) (7a) (UNIVERSAL (is subject-of ARTICLE)) (7b) と、関係ＲＳ＃００１２： (ARTICLE (is-part-of JOURNAL)) (8a) (JOURNAL (has-part-of ARTICLE)) (8b) が定義されている必要がある。すなわち、「記事の主題
には何でも成り得ること」、「記事は雑誌の一部である
こと（記事は雑誌の一部に掲載されるものであるこ
と）」が知識として記憶されている必要がある。

【００３２】また、包摂関係としては、 (SUPERCOMPUTER (is-a THING)) (9) (THING (is-a UNIVERSAL)) (10) (ElectronicsWeek (is-a JOURNAL)) (11) が記憶されている必要がある。

【００３３】これにより、"supercomputer article" を
解釈することが出来る。まず、SUPERCOMPUTERから包摂
関係を上位に辿って、 (SUPERCOMPUTER (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)) であることが分かる。その結果、属性継承により、 (SUPERCOMPUTER (is-subject-of ARTICLE)) 或いは、 (ARTICLE (subject-is SUPERCOMPUTER)) という関係が有り得ることが推論される。すなわち、
「スーパーコンピュータは記事の主題に成り得ること」
が選出される。この場合は、これ以外の解釈は無いの
で、解釈： "article whose subject is supercomputer" 「スーパーコンピュータと主題とする記事」が採用される。

【００３４】複合名詞句（２）の意味解釈は少し複雑で
ある。この場合、図７から分かるように、 (ElectonicsWeek (is-a JOURNAL)) (JOURNAL (has-part-of ARTICLE)) であると同時に、 (ElectronicsWeek (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)) であるので、（ＥｌｅｃｔｒｏｎｉｃｓＷｅｅｋ（ｈａｓ−ｐａｒ
ｔ−ｏｆＡＲＴＩＣＬＥ））と、（ＥｌｅｃｔｒｏｎｉｃｓＷｅｅｋ（ｉｓ−ｓｕｂｊ
ｅｃｔ−ｏｆＡＲＴＩＣＬＥ））の二つの関係が有り得ることが推論される。すなわち、 "article which is part of ElectronicsWeek" と "article whose subject is ElectronicsWeek" の二つの解釈が有る得ることが分かる。

【００３５】このように複数の解釈の候補が存在する場
合は、本発明方式では、どの解釈が数多くの具体的事例
を持つかで、解釈の尤もらしさを評価するという発見的
手法を用いる。

【００３６】具体的には、先の例では、概念 "ARTICLE"
と概念 "ElectronicsWeek" の自分も含めた下位の概念
を探索して、関係ＲＳ＃００１１と関係ＲＳ＃００１２
の具体関係が、それぞれ幾つ登録されているかを計数す
る。図７の例では、前者は０、後者は一つ具体関係が登
録されている。すなわち、 "ElectronicsWeek" を主題
とした記事はないが、 "ElectronicsWeek" に掲載され
ている記事は一件、ARTICLE#0101がある。従って、関係
ＲＳ＃００１２（is-part-of）がより適切な解釈として
選択される。すなわち、"article which is part of El
ectronicsWeek" と解釈される。□以上に説明したよう
に、複合名詞句の解釈では、２語の名詞間の関係の推論
処理が基本となる。すなわち、以下説明する三つ以上の
単語から成る複合名詞句の解釈の基本処理は、上記２語
間の関係抽出である。以下、複合名詞句（３）を例に取
って説明する。

【００３７】まず、複合名詞句を構成する単語の中に複
合語から成る概念名称があるかどうかを調べながら、各
単語に対応する概念を選び出す。すなわち、先頭から順
次単語を切り取って、概念名称テーブルを参照して、登
録されているかどうかを調べる。

【００３８】複合名詞句（３）の場合は、のように、複合名詞句から部分単語列を切り出して、そ
れぞれが概念名称であるかどうかを調べて行く。

【００３９】ここで、本方式では、形容詞は対応する名
詞形を名称とする概念の同義語として登録されており、
形容詞は同概念として扱われる点が一つの特徴である。
例えば、形容詞 "Japanese" は概念 "JAPAN"（日本
国）、或いは概念 "Japanese people"（日本人）の同義
語として登録されていて、同概念として扱われる。

【００４０】従って、この処理の結果、"personal comp
uter" が一つの概念名称、"PERSONAL-COMPUTER" として
定義されていたとすると、複合名詞句（３）はまず、 (JAPAN PERSONAL-COMPUTER COMPANY) (JAPANESE-PEOPLE PERSONAL-COMPUTER COMPANY) として認知される。但し、以下の説明では、判り易くす
るため、最終的には意味のない解釈であることが分かる
後者は省いて説明する。

【００４１】すなわち、この段階で、同複合名詞句は実
質的に三つの概念の組合せであることが分かったことに
なる。これは括弧（）を用いて次のようにも表現でき
る。

【００４２】 (Japanese (personal computer) company) (12) 従って、次の処理は、これら３つの概念がどのように相
互に関連付けられているかを調べることである。この場
合、次の二つの可能性があることが分かる。

【００４３】 (Japanese ((personal computer) company)) (13) ((Japanese (personal computer))company) (14) まず、(13)の場合、COMPANYとPERSONAL-COMPUTER、およ
びCOMPANYとJAPANの間に結ばれ得る二つの関係を推論す
る必要がある。この場合、先に説明した関係の推論方式
により、 (COMPANY (produces PERSONAL-COMPUTER) (is-located-in JAPAN)) (15a) (COMPANY (has-developed PERSONAL-COMUTER) (is-located-in JAPAN) (15b) なる関係が抽出される。ここでは、複数の解釈の優先度
（尤度：尤もらしさ）を評価するために、COMPANYとPER
SONAL-COMPUTER、およびCOMPANYとJAPANの二つの関係の
具体例（下位の概念に定義されている具体関係）の総数
を、それぞれの解釈(15a)、(15b)に対して計数し、これ
を関係の重みとする。全体の評価としては、具体関係の
総数（関係の重み）を一般関係の数で割って、正規化す
る。(15a)、(15b)の例では、一般関係の数は２である。

【００４４】次に、第二の可能性である(14)について関
数を抽出する。この場合、COMPANYとPERSONAL-CPMPUTE
R、およびPERSONAL-COMPUTERとJAPANの二つの関係を求
める必要がある。前者については、 (COMPANY (produces PERSONAL-COMPUTER)) (16a) (COMPANY (has-developed PERSONAL-COMPUTER)) (16b) のような、二つの関係が（想定する知識ベースにおい
て）見つかる。同様に、後者については、 (PERSONAL-COMPUTER (is-produced-by (COMPANY (is Located-in JAPAN))) (17a) (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN))) (17b) が見つかる。伺し、ここで、PERSONAL-COMPUTERとJAPAN
とを直接結ぶ関係は無いので、これらを間接的に関係付
ける概念COMPANYを自動的に見出している。

【００４５】本発明方式は、このように直接結び付ける
関係が見つからないときは、関係を見出すべきこれら二
つの概念の上位を各々遡って、それら上位概念に定義さ
れる全ての一般関係（の集合）を抽出する。二つの概念
について行うので、二つの一般関係の集合が得られるこ
とになる。これは三つのテーブル２３１、２４１、２５
１を検索することによって抽出できる。次に、抽出され
た一般関係の相手方に結ばれている概念をそれぞれリス
トアップする。これにより、二つの概念集合が得られる
が、これらの積集合を求めることにより、最終的に二つ
の概念を仲介する概念、先の例では概念COMPANYが得ら
れる。

【００４６】結局、意味の無い組合せを捨てて、以下の
二つの解釈を得る。

【００４７】 (COMPANY (produces (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN)))))) (18a) (COMPANY (has-developed (PERSONAL-COMPUTER (is-produced-by (COMPANY (is-located-in JAPAN)))))) (18b) 最終的には、以下の合計４つの解釈が自動的に得られる
ことになる。

【００４８】 "company which produces personal computer which is located in Japan" (19a) "company which has developed personal computer which is located in Japan" (19b) "company which produces personal computer which was developed by company which is located in Japan" (19c) "company which has developed personal computer which is produced by company" (19d) なお、上記の英語の表現において、関係代名詞の掛り受
け関係はインデンテーションによって示した。レベルが
深くなっている場合は、直上の行の名詞を修飾してい
る。

【００４９】複合名詞句（４）についても同様に処理さ
れる。各単語を概念名称とマッチングすることにより、 (USA PERSONAL-COMPUTER SOFTWARE-PACKAGE) のような三つの概念から成ることが、まず分かる。これ
ら概念間の関係を推論することにより、以下の解釈が得
られる。

【００５０】 "software package which runs on personal computer which was developed by company which is located in USA" (20) さて、本発明による自然言語理解方式は、複合名詞句の
意味解釈機能の上に、文解釈部（構文解析部）を置くこ
とにより、より強力な名詞句解釈機能を可能とすると同
時に、知識ベースとの自然言語による広範な対話を実現
している。同文解釈部は構文規則を用いるが、リスト１
は同構文規則の一例を示す。一つの構文規則は、非終端
記号（ノンターミナルシンボル；ここでは、鉤括弧＜＞
で囲んだ記号）で構成される左辺と、その展開形である
右辺、およびその展開が成功したときに評価されるべき
関数の三つの部分から成る（例えば、(21a）式）。伺
し、リスト１では解析が成功したときの評価関数は省略
して示している。各規則の右辺は、終端記号（ターミナ
ルシンボル）と非終端記号から成る列で構成される。こ
こで、記号 "｜" は並置を示す。また、非終端記号 <s>
は文章全体を表わす。

【００５１】 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− リスト１： <s> :;= <system-command> | (21a) <define-command> | (21b) <search-command> | (21c) <browse-command> (21d) <system-command> ;:= load from <?> | save to <?> | update | quit | stop | <show-word> chart | edit <?> <show-word> ;:= show | print <search-command> ;:= <find-word><noun-phrase> (22) <find-word> ;:= look up | look for | search for | lookup | find (23) <noun-phrase> ;:= <noun-group> | (24a) <noun-phrase><joiner><noun-phrase> (24b) <noun-group> ;:= <noun-compound> | (25a) <art><noun-compound> | (25b) <def-art><noun-compound> (25c) <noun-compound> ;:= <noun-string> (26) <noun-string> ;:= <concept> | (27a) <concept><noun-string> (27b) <joiner> ;:= <prep> | <rel-pronoun><link> (28) <define-command> ;:= define relation <new-phrase> . | (29a) define <?> as <noun-phrase> . | (29b) <noun-phrase> is <noun-phrase> . | (29c) <noun-phrase><link><noun-phrase> . | (29d) <noun-group> is also known as <?> . (29e) <new-phrase> ;:= <noun-compound><?><noun-compound> (30) <?> ;:= <null> | <null><?> (31) −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 文解釈部はボトムアップ処理による語彙解析部と、トッ
プダウン処理による構文解析部とから成る。本方式にお
ける構文解析部は、構文規則に合致する全ての文構造を
候補として出力する。そこから、意味のある解釈（単語
間の掛り受け関係）のみを先に説明した複合名詞句解析
により評価、選択する。

【００５２】ボトムアップ処理である語彙解析（lexica
l analysis）は、概念名称、関係記述子、前置詞、関係
代名詞、冠詞の区別が記述されている語彙辞書（lexico
n）を用いて行われる。

【００５３】同語彙辞書は、先に説明した知識表現方式
による概念ネットワークから編集処理により自動的に構
築することが可能である。具体的には、概念名称はテー
ブル２２１（図３）から抽出される。語彙解析の結果、
概念名称とマッチングした入力文中の単語は、<concept
> という非終端記号として認識される。

【００５４】関係記述子とは、同知識表現方式における
「関係」、または、その「読み」のことであり、例え
ば、"is author of"，"wrote"，"has written"，"autho
r is"などである。これらは、一般関係定義テーブル２
４１（図５）から抽出される。これらにマッチングした
入力文中の単語、または単語列は非終端記号 <link> と
して認織される。

【００５５】前置詞は"by"，"from"，"of"などであり、
その意味（それが表わす関係の種類）は一般関係定義テ
ーブル２４１（図５）から自動的に抽出される。これら
前置詞は非終端記号 <prep> として認識される。ここ
で、関係記述子および前置詞として認織された場合に
は、上記非終端記号とともに、それらが意味する「関
係」の種類とその方向を語彙解析結果として出力する。
これにより、後述するように、"book by Newton"のよう
な名詞句の意味解釈が可能となる（構文規則（24b），
（28）を参照）。

【００５６】同語彙辞書には、更に、関係代名詞 <rel
- pronoun> (which, who, that)、不定冠詞 <art> (a,
an)、定冠詞 <def-art> (the) が記憶されている。ま
た、語彙解析で認識できなかった単語は非終端記号 <nu
ll> として認識される。

【００５７】構文解析は、このボトムアップ前処理とし
ての語彙解析をもとに行われる。図８を用いて構文解析
方法を説明する。同図において、入力文として、三つの
単語４０１、４０２、４０３が解析される。上部から下
部へ流れる矢印（例えば、矢印４１１）はボトムアップ
処理を、下部から上部へ流れる矢印（例えば、矢印４１
２）はトップダウン処理を表わす。

【００５８】語彙解析の結果として、単語４０１（pers
onal）にはマッチングする概念がないこと、単語４０２
（computer）の解釈としては二つの概念「計算機」およ
び「雑誌コンピュータ」が有り得ること、単語列４０１
−４０２（personal computer）は概念「パーソナルコ
ンピュータ」にマッチングすること、単語４０３（comp
any）は概念「会社」にマッチングすることが出力され
る。

【００５９】構文解析部は、これらの結果を受けて、例
えばリスト１に示す構文規則を参照して、文全体を展開
していく。図８は、その途中からのみを示しているが、
同図において、<noun-phrase> ４２１は（25a）式によ
り <noun-compound> ４２２へ、更に、(26）式により <
noun-string> ４２３へ展開される。更に、<noun-strin
g> は（27b）式により <concept> ４２６と <noun-stri
g> ４２７とに展開される。後者の <noun-string> は(2
7a)式により <concept> ４２８に展開される。結局、図
８の例では、入力文（名詞句）の解釈は、（personal c
omputer）と（company）の二つの概念（<concept>）と
から構成される複合名詞句（noun compound）が有り得
ることが分かる。

【００６０】なお、ここで図８以降図１１まででは、図
面を簡単にするために、リスト１で示す記号は、次のよ
うに簡略化している。すなわち、<noun-phrase>, <noun
-group>, <noun-compound>, <noun-string>, <joiner>,
<rel-pronoun>, <find-word> は、それぞれ <n-phrase
>, <n-group>, <n-comp>, <n-string>, <join>, <rpron
>, <find> と表記している。

【００６１】本構文解析では、構文的に可能な文構造を
全て抽出する。そのような構文解析アルゴリズムとして
は、例えばチャートバーザ［文献：エイチ・トンプソ
ン、エトアル、"インプリメンティング" ナチュラル・
ラングエッジ・バーザーズ"、アーティフィシャル・イ
ンテリジェンス：トゥール、テクニーク、アンドアプ
リケーションズ、エディティッドバイテー・オシア
アンドエム・アイゼンシュタト、ハーパ・アンド・
ロー、ニューヨーク、１９８４、ピーピー、２４５−３
００：Thompson, H. et al., "Implementing Natural L
anguage Parsers, "in Artificial Intelligence: Tool
s, Techniques, and Applications, editedby T. O'She
a and M. Eisenstat, Harper and Row, New York, NY,
1984, pp.245-300］が知られている。

【００６２】抽出された全構文候補は、各々構文規則に
記されている評価式により評価される。本発明の特徴
は、この評価に知識ベースに記憶されている知識を用い
る点にある。図８の例の場合では、概念 "personal com
puter" と概念 "company" から意味のある複合名詞句が
構成され得るかを評価する。この評価方法は、先に説明
した概念ネットワークに登録されている知識を用いる方
式を用いる。この結果、意味のある構文解析結果が尤度
の順に得られることになる。

【００６３】図９以降は検索文全体に対する構文解析結
果を示す。検索文は、構文規則（21c），(22）を用い
て、命令語と名詞句とに展開される。図９は、図８の名
詞句を含む例である。図１０は、関係代名詞を含む名詞
句を含む検索文の分析の例である。ここでは、図５で示
した概念関係モデルの「関係」の「読み」が関係代名詞
句の述語として機能しているのが分かる。更に、図１１
は、前置詞を含む検索文の例である。ここで、前置詞ｏ
ｎは関係「主題」（"whose subject is"）を、前置詞ａ
ｔは関係「所属」（"who works at"）を意味しているこ
とが、既に説明したように、図５で示した一般関係定義
テーブルに記されている。

【００６４】以上、説明した原理により、知識ベースと
最小限の構文規則により、陽に関係が記述されていない
名詞の列（複合名詞句）を含む自然言語文を意味解析す
ることが可能である。

【００６５】

【実施例】

（実施例１）以下、本発明の一実施例を説明する。図１
４は、本発明の一実施例である知識ベースシステムのハ
ードウェア構成のブロック図である。

【００６６】同システムは、同図において、主に中央制
御装置（ＣＰＵ）１０１、主メモリユニット（ＭＭＵ）
１０２、ワークメモリユニット（ＷＭＵ）１０３、シス
テムファイルとユーザファイルとを持つ統合ディスクユ
ニット１２１、１２２、プリンタ１３１、ローカル・エ
リア・ネットワーク（ＬＡＮ）に接続するための通信制
御装置（ＣＣＵ）１４１およびユーザとの対話のための
表示装置（ＣＲＴ）１５１、キーボード１５２、マウス
１５３から成る。

【００６７】統合ディスクユニットは磁気ディスクと光
ディスクとから成り、例えば本実施例の場合は、第１の
ディスクユニット（ＤＫＵ１）１２１は磁気ディスクで
構成されていて、高速性が要求される情報を記憶する。
一方、第２のディスクユニット（ＤＫＵ２）１２２は光
ディスクで構成され、特に大容量の情報を記憶する。

【００６８】システムファイルには、オペレーティング
システム、通信管理プログラム、ファイル管理プログラ
ム、知識ベース管理プログラム、或いは統合オフィス業
務支援システムといったシステムが提供するプログラム
群、およびそれに必要なデータベースなどのファイル群
が格納されている。一方、ユーザファイルには、個人化
されたシステム提供のプログラムやユーザが作成したプ
ログラムなどのアプリケーションプログラム群と、それ
に必要なデータベースなどのファイル群、およびユーザ
などが作成した統合知識ベース（後述）が格納されてい
る。

【００６９】システムの動作は、主メモリユニットにロ
ードされたプログラムの制御に従って、必要なデータを
主メモリユニットおよびファイルにアクセスして行われ
る。同時に、ユーザは表示装置１５１に表示される情報
を見ながら、入力手段１５２、１５３を用いてシステム
と対話することが可能である。

【００７０】本発明の知識ベースシステムのソフトウェ
ア部分は、概念ネットワークエディタ、概念ネットワー
クブラウザ、自然言語文解釈プログラム、マルチメディ
アファイル管理プログラムとから成るプログラム群と、
それらが用いる情報を統合した統合知識ベースとから成
る。以下、それぞれについて順次説明する。

【００７１】まず、概念ネットワークエディタは、既に
説明した概念関係モデルに基づいて、オブジェクト指向
の知識ベースの編集、検索、管理を行う。知識・情報
は、図３から図６までに示した概念名称テーブル、包摂
関係テーブル、一般関係定義テーブル、および関係テー
ブルによって記憶、管理する。これらに記憶されている
データを、ここでは概念ネットワークという。

【００７２】概念ネットワークエディタは、所定の仕様
に基づくコマンド言語（形式言語）によって、以下のの
機能を提供する。

【００７３】（１）概念の登録：概念名称と分類階層位
置を指定して、新概念を登録。

【００７４】（２）一般関係の登録：二つの概念と関係
の言語的表現法を指定して、新しい関係の種類を登録。

【００７５】（３）具体関係の登録：二つの概念と関係
の種類を指定して、事実、関係、属性などを登録。

【００７６】（４）概念名称の編集：名称の修正；同義
語・別名の削除・追加。

【００７７】（５）一般関係の編集：関係付けられてい
る二つの概念の変更；言語的表現法の修正と追加。

【００７８】（６）概念の削除（７）具体関係の削除（８）階層分類体系の変更（９）上位概念の追加：二重（或いはそれ以上）に同一
概念を分類；属性等の多重継承の付与。

【００７９】（10）構造化概念の登録・削除：概念を概
念によって修飾した抽象的概念（後述）の登録および削
除。

【００８０】（11）語彙辞書の更新：概念ネットワーク
から語彙解析に必要な情報を語彙辞書に追加・編集。□ （12）概念の検索：部分文字列、キーワード、構造化概
念からの検索。

【００８１】（13）ネットワーク踐渉：分類階層木、お
よび連想による注目概念の移動。

【００８２】（14）マルチメディア情報の付加・削除：
任意の概念にマルチメディアファイル内の情報を連想的
に付加、或いは削除。

【００８３】（15）マルチメディア情報の読出し：概念
に付加されているマルチメディア情報のマルチメディア
ファイルからの読出し。

【００８４】ここで、上記機能における構造化概念につ
いて説明する。構造化概念とは、ある概念を別の概念と
関係とによって、修飾した（意味を限定した）抽象的な
概念であり、概念ネットワークとは別の記憶手段に格納
する。具体的には、これまでにも例で示してきた複合名
詞句がそれに当たる。例えば、構造化概念D#0011をとして、登録できる。より具体的には、下記の内部デー
タ構造、のように、固有番号で記憶する。ここで、第１要素は構
造化概念固有番号、第２要素は構造化概念名称、第３要
素は構造化概念定義式である。但し、上記記法の例でC#
0401は概念 "article"、C#0501は概念 "supercompute
r"、RS#0033は関係「主題」（subject）の固有番号であ
る。

【００８５】この構造化概念は、抽象的な、或いは記述
的な記憶から情報を検索する際に用いる。本システム
は、構造化概念から、推論処理を用いて具体的な概念を
概念ネットワークから検索する機能を有する。上記の例
では、概念 "article" に包摂される具体的概念（概念
"article" の下位概念）の集合の中から、主題が概念"
supercomputer" に包摂される概念であるもののみ抽出
することが可能である。この処理を概念マッチングとい
うが、これは逆向きの推論処理によって実現される。

【００８６】このように、構造化概念を記憶する手段
と、それからの検索手段を与えることによって、ユーザ
は随意に自分のものの見方をシステムに登録し、更に、
欲しい概念を容易に検索することが可能である。

【００８７】概念ネットワークエディタの機能におい
て、マルチメディア情報機能を更に説明する。マルチメ
ディアファイルには、例えばイメージスキャナによって
入力した写真を登録・蓄積することが出来る。概念ネッ
トワークエディタには、同写真をある概念に連想的に付
加する機能がある。具体的には、概念固有番号とマルチ
メディアファイルメンバ名称との対応表を作成し、管理
することにより実現する。ユーザは同概念を検索した後
で、その写真を表示させることが可能である。マルチメ
ディアファイルには、写真のほかにも、文書イメージ
や、音声情報等を記録することが可能である。

【００８８】本概念ネットワークエディタの構成法とし
ては、発明「情報記憶方式」（特願昭６０−６０６７
８）で開示している方法を用いることが出来るので、こ
こでは説明を省略する。

【００８９】さて、次に概念ネットワークプラウザを説
明する。概念ネットワークプラウザとは、概念ネットワ
ークエディタのためのビジュアルインターフェース（視
覚形インターフェース）であり、マルチウィンドウとマ
ウスを用いた直接操作方式と採用することによって操作
性向上を図っている。同プラウザは知識ベースの内容を
概念階層木、フレーム形式、或いはテーブル形式、更に
は自然言語形式で、任意のウィンドウ内に表示すること
が出来る。また、その表示上のオブジェクト（概念と関
係）を例えばマウスで直接指示して、更に、メニューの
中から命令を選択指示することにより、先の概念ネット
ワークエディタの任意の機能を呼び出して、実行するこ
とが出来る。概念ネットワークプラウザは、ユーザのこ
のような直接的指示を形式言語であるコマンド言語に翻
訳して概念ネットワークエディタを起動する。

【００９０】次に、自然言語文解釈プログラムを機能ブ
ロック図、図１を参照しながら説明する。本発明の主な
る特徴の一つは、本自然言語文解釈方式にあり、その原
理については、先に説明した。同自然言語文解釈プログ
ラムは、構成としては、ユーザからの単語列５０１を入
力するための入力部５０２、同単語列の各単語の属性を
解析する語彙解析部５０３、構文規則を記憶した文法フ
ァイル５１４を参照しながら構文を解析する構文解析部
５０４、および、複合名詞解析部５０６とから成ってい
る。動作としては、本自然言語文解釈プログラムは概念
ネットワークプラウザから自然言語文５０１を受け取
り、解釈結果５０５を同概念ネットワークプラウザに返
す。

【００９１】本実施例では、語彙解析部は、構造化概念
ファイル５１１、語彙辞書ファイル５１２、および概念
ネットワーク形知識ベース５１３の概念名称テーブル５
２２を参照して解析を実行する。ここで、構造化概念フ
ァイル５１１は、先述したように、構造化概念固有番
号、構造化概念名称、構造化概念定義式の３組の集合を
記憶する。また、語彙辞書５１２は図１２で示す前置詞
テーブル６０１、および図１３で示す関係記述子テーブ
ル６１１で構成される。別な実施例として、高速化処理
のため、語彙辞書に概念名称テーブルも含める構成も有
り得る。

【００９２】前置詞テーブル６０１は、各前置詞に対
し、同前置詞が表わす一般関係の固有番号を、同関係の
方向別に記憶する。図１２の例でいうと、前置詞ａｔ
は、一般関係ＲＳ＃０１２３を左から右に読んだ場合
や、ＲＳ＃０２０９を右から左に読んだ場合等の「関
係」を表わす。また、関係記述子テーブル６１１は、各
関係記述子に対し、その一般関係固有番号とその方向性
を記憶する。これらの二つのテーブルは、これまでの説
明から容易に理解できるように、全ての有り得る前置詞
を別途記憶しておくことにより、図５で示した一般概念
定義テーブルから自動的に構築したり、更新したりでき
る。この機能は、図１における語彙辞書編集部５０７に
より提供され、実際には、概念ネットワークエディタの
機能の一部である。

【００９３】ここで語彙解析部の機能の説明を一部補足
する。発明の原理の説明では、理解を助けるため構造化
概念については述べなかったが、語彙解析部では、構造
化概念名称にマッチングした単語および単語列は、非終
端記号 <concept> として認識すると同時に、構造化概
念の場合には、構造化概念定義式を評価値として出力す
る。

【００９４】この目的のため、語彙解析部は、入力単語
列から原理説明のように部分単語列を順次取り出して、
各部分単語列が通常の概念名称のみならず、構造化概念
名称についてもマッチング（一致）するかどうかを調べ
る。その結果、それら何れかにマッチングする場合は、
非終端記号として <concept> を認識結果とし、更に、
通常の概念名称にマッチングした場合は同概念の固有番
号を評価値とし、構造化概念名称にマッチングした場合
は同構造化概念の定義式を評価値とする。

【００９５】更に、語彙解析の結果、前置詞および関係
記述子として認識された場合には、それぞれ対応する非
終端記号を認識結果とすると同時に、対応する全ての
「関係」を評価値とする。これら評価値は、認識結果で
ある非終端記号に付随して、語彙解析結果として出力さ
れる。

【００９６】構造解析部５０４は、原理説明で述べたよ
うに、語彙解析結果を入力として、文法ファイル５１４
の構文規則を参照しながら可能な全ての文構造をまず生
成する。構文規則に照らして可能な文構造を生成するこ
と（狭義の）のパージングという。このパージング段階
では、意味的な適合性は勘案していない。次に、構文解
析部５０４は意味的な適合性の分析と、複合名詞句の意
味解析を複合名詞解析部５０６に行わせる。これによ
り、候補として生成された文構造の集合から、意味的に
適合するものが尤度の順に選択されることになる。

【００９７】構文解析の結果として、意味的に特に重要
な要素は名詞句 <noun-phrase> であるので、主に名詞
句の構文解析について、図９から図１１の例を用いてよ
り具体的に説明する。

【００９８】まず、図９の場合において、名詞句： "personal computer companies" は、パージングの結果、下記に示す構造として解析され
る。

【００９９】 (<noun-phrase> D#1009 "personal computer companies" ((<concept> (C#1001 "personal computer")) (<concept> (C#1022 "company")))) (32) ここで、（３２）式に於いて、第１要素は非終端記号、
第２要素は随時与えられる構造化概念番号、第３要素は
入力文の対応する単語列、更に、第４要素以降はパージ
ング結果を表わす。パージング結果は、複数の解釈が存
在する場合にそれらを並置する。（３２）式では、単一
候補のため第５要素以降は存在しない。また、第４要素
は、一般的に概念と関係とからなる列を構成する。（３
２）式の例では、二つの概念の列になっている。関係を
含んだ例は、後述（３５）式で説明する。

【０１００】これら概念および関係は、（３２）式に示
す如く、その識別子（非終端記号）と具体的にマッチン
グした概念または関係の列でそれぞれ表わされる。（３
２）式の例では、各概念は単一のマッチング結果しかな
い。複数のマッチング結果の例は、（３７）式に示す。

【０１０１】さて、構文解析部はパージング結果（３
２）式を受けて、同式の最後の２行を複合名詞解析部５
０６に送る。同複合名詞解析部は、原理説明で述べた方
法により、二つの概念Ｃ＃１０１１とＣ＃１０２２の意
味的な関係を概念ネットワークで表わす知識ベースから
推論する。その結果、（想定する知識ベースに於いて）
次の二つの解釈、（３３）式および（３４）式を得る。
この例では、陽に記述されていない関係が推論処理によ
って抽出されている。

【０１０２】これらは自然言語的に表現すると、それぞれ以下のよう
になる。

【０１０３】次に、図１０の例について示す。この場合、パージング
結果は（３５）式のようになる。すなわち、名詞句は二
つの概念が結合子（joiner）によって結び付けられたも
のとして認識される。

【０１０４】 (<noun-phrase> D#1010 "person who is author of a book" ((<concept> (C#1101 "person")) (<joiner> (RS#0001 RL "is-author-of")) (<concept> (C#1122 "book")))) (35) ここで、複合名詞解析部は（３５）式の最後の３行を受
けて、概念Ｃ＃１１０１とＣ＃１１２２とが関係（ＲＳ
＃０００１ＲＬ）によって意味的に関係付けられ得る
ことを推論し、（３６）式の解釈を最終的に得る。この
場合、（３５）式は単一の候補しか示していないが、も
し仮りに、上記の推論に失敗した場合は、そのような意
味解釈は、知識ベースに記憶されている知識に照らして
みて、有り得ないことが分かったことを意味する。

【０１０５】 (D#1010 "person who is author of a book" (C#1101 ((RS#0001 RL) C#1122))) (36) （３６）式を自然言語的に表示すると下記のようにな
る。

【０１０６】"person who is author of book" 最後に、図１１の例を説明する。（３７）式に示すパー
ジング結果において、二番目の結合子（joiner）は、前
置詞ａｔを図１２に示す前置詞テーブル６０１を参照し
て解釈したものであり、その結果として複数の解釈が列
挙されている。

【０１０７】 (<noun-phrase> D#1011 "articles on people at companies" ((<concept> (C#0401 "article")) (<joiner> (RS#0033 LR "subject-is")) (<concept> (C#0601 "person")) (<joiner> (RS#0123 LR "is-developed-at") (RS#1054 LR "is-located-in") ・・・ (RS#0209 RL "works-at") ・・・) (<concept> (C#1022 "company"))) (37) 複合名詞解析部５０６は（３７）式の第４要素を入力し
て、「概念−結合子−概念」という３組毎に、原理説明
で述べた考え方により意味的な関係の妥当性を評価す
る。すなわち、二番目の３組の例でいうと、概念Ｃ＃０
６０１（person）と概念Ｃ＃１０２２（company）との
間に、関係 "is-developed-at" や "is-located-in" は
有り得なく、関係 "works-at" のみが意味的に妥当であ
ることを、知識ベースに記憶されている具体的な事実か
ら推論する。この場合には、（３８）式の解釈が最終的
に得られる。

【０１０８】 (D#1011 "articles on people at companies" (C#0401 ((RS#0033 LR) (C#0601 ((RS#0209 RL) C#1022))))) (38) 解釈（３８）式は、自然言語で表示すると下記のように
なる。

【０１０９】次に、本発明方式による知識ベースシステムの次の要素
であるマルチメディアファイル管理プログラムについて
説明する。知識ベースは記号的にオブジェクトまたは概
念を記憶するのに対して、マルチメディアファイルは、
情報自体をメディアのままで記憶する。すなわち、情報
圧縮のために各々最適な符号化を行うが、写真、文書、
図面、テキスト、音声といった複数の異なる種類のメデ
ィア情報（マルチメディア情報）を所定の記述方式に従
って記憶・管理する。マルチメディア情報の記述方式に
ついては、標準化されるべきマルチメディア・コンテン
ツ・アーキテクチャ（例えば、ＯＤＡ：オフィス・ドキ
ュメント・アーキテクチャ）が知られているので、ここ
では説明しない。

【０１１０】これらのマルチメディア情報は、所定の単
位で管理され、一つのオブジェクト（情報単位）を構成
する。例えば、「文書」、「記事」、「写真」、「図
表」、「一区切りの音声メッセージ」等々、我々が通常
一つの物として認知するものをオブジェクトとすること
ができる。このオブジェクトは、単一メディアであって
も良いし、マルチメディアであっても良い。これらオブ
ジェクトは、マルチメディアファイル管理プログラムに
よって、各情報単位に付けたファィルメンバ名称、物理
的ファイルにおける記憶位置および記憶レコード長、記
述形式（例えば符号化方式）等から成る管理情報によっ
て管理する。複数のオブジェクトが構造化されて、別の
オブジェクトを構成することも可能である。逆に、ある
オブジェクトを複数の部分オブジェクトの構造体として
管理することも可能である。

【０１１１】一方、マルチメディアファイルに格納され
ている各情報単位は、先述したように、概念ネットワー
クの任意の概念ノードに関連付けることが出来る。これ
によって、マルチメディアファイルに格納されている情
報本体を、概念ネットワーク形の知識ベースから知的に
推論を用いて検索することが可能である。

【０１１２】次に、統合知識ベースについて述べる。本
発明方式による知識ベースシステムは、これまでに説明
した如く、概念関係モデルに基づく概念ネットワーク形
知識ベース、構文規則を記憶した文法ファイル、上記知
識ベースから編集処理によって自動的に作成できる言語
的辞書（語彙辞書５１２）、ユーザが個人毎に定義でき
る概念辞書（構造化概念ファイル５１１）、およびマル
チメディアファイルとから構成されていることを特徴と
している。更に、本システムは、知識ベース内の概念と
マルチメディアファイル内のオブジェクトを関連付ける
記憶手段とを有している。このように、記号的・論理的
表現による知識・情報、言語的知識、およびメディア情
報とを有機的に記憶することが出来る知識ベースを、こ
こでは統合知識ベースと呼ぶ。これらの情報は、それぞ
れの特性に合わせて、統合ディスクユニットに記憶させ
る。

【０１１３】以上、本発明を特に英語の場合について説
明したが、原理的には、日本語等、他の言語にも同様に
拡張可能である。特に、知識表現方式の説明で述べたよ
うに、本発明によれば、容易に多国語システムに拡張す
ることが出来る。具体的には、知識表現手段のうち、概
念名称テーブル２２１（図３）と一般概念定義テーブル
２４１（図５）のみが言語に依存し、同時に、それらの
テーブルは言語を規定するフィールド（カラム）ＬＡＮ
Ｇ，２２４および２４６を有している。

【０１１４】また、本発明は実施例で示した構文規則の
内容（リスト１）に限定されることなく、同構文規則を
変更・拡張することにより、より広範な、或いは別なシ
ステムに適した自然言語を受け付けられることは自明で
ある。その意味でも、本発明方式は、広い応用分野を持
つ。例えば、詳細に説明しなかったが、リスト１におい
ても、（２９ａ）から（２９ｅ）は、自然言語を用いて
新しい概念の登録（２９ｂ）、一般関係の登録（２９
ａ）、或いは新しい事実の登録（２９ｄ）等を行うこと
が可能であることを示している。

【０１１５】更にまた、実施例の説明では、マルチメデ
ィアファィルと結合したシステムを述べたが、同マルチ
メディアファイルと独立して、知識ベースシステムのみ
で用いても効果的であることは言うまでもない。

【０１１６】

【発明の効果】以上説明した如く、本発明によれば、ユ
ーザは学習することが難しい形式言語を覚えることな
く、自然言語を用いて、曖昧な記憶から思い起こされる
記述的な検索要求から知識ベース内の欲しい情報を取り
出すことが可能となる。通常、我々の記憶は時間ととも
に薄らいでいくが、その時に残る記憶は、断片的であ
り、かつ抽象化していく。或いは、ずばりその名称を記
憶していることは稀であり、「こんなもの」、「あんな
もの」といった記述的なものに成っていくことも知られ
ている。本発明方式は、断片的、或いは抽象的な記述か
ら検索する方式を与えており、その意味では、単に自然
言語で検索できること以上の効果を有している。

【０１１７】また、本発明によれば、自然言語理解に必
要な知識は、システム本来の知識とともに知識ベース内
に一体となって記憶されているため、上記のようなシス
テムを構築することが、従来の自然言語インターフェー
スを与える方式に比べて、容易である。具体的には、ユ
ーザは特に自然言語インターフェースと知識ベースの整
合性などについて意識する必要はなく、知識ベースに本
来記憶管理させたい情報の登録に注目しさえすれば良
い。

【０１１８】更に、本発明によれば、新しい知識の登録
も自然言語を用いて行うことが可能である。一般的に、
複雑な機能を有するシステムでは、視覚的（直接操作
的）インターフェースと言語的インターフェースとの共
存が重要である。本方式では、視覚的（ビジュアル）イ
ンターフェースに言語的インターフェース機能が統合化
されており、ほとんど全ての機能を自然言語と直接操作
により提供している。その意味で、ユーザはその場その
場で、好きな方を選択することが出来、操作性および使
い勝手の面で優れている。

【０１１９】更にまた、本発明では、概念に対して同義
語、異表記語といった別名を登録したり、関係の名称
（「読み」）に対しても別名を記憶・登録させる手段を
与えており、多様な検索要求の表現に対しても適切に検
索処理を実行することが出来る。

【０１２０】また、本発明は、マルチメディア情報を知
識ベースに統合する方式についても示しており、これに
従えば、従来の記号的表現による知識ベース以上の応用
分野を切り開くことが可能である。

【０１２１】或いはまた、拡張例として述べた方式に従
って他国語システムを構築すれば、例えば、英語で検索
して日本語で出力すると言ったことも実現できる。

【図面の簡単な説明】

【図１】本発明方式の自然言語文解釈プログラムの機能
ブロック図。

【図２】概念関係モデルによる知識表現方式を説明する
概念ネットワークの図。

【図３】同モデルによる知識記憶を示す図であり、概念
名称を示す図。

【図４】同モデルによる知識記憶を示す図であり、包摂
関係を示す図。

【図５】同モデルによる知識記憶を示す図であり、一般
関係定義を示す図。

【図６】同モデルによる知識記憶を示す図であり、関係
を示す図。

【図７】同モデルによる知識記憶を示す図であり、複合
名詞句の意味解釈法の原理を説明するための図。

【図８】同モデルによる知識記憶を示す図であり、構文
解析法を説明する図。

【図９】同モデルによる知識記憶を示す図であり、構文
解析例を示す図。

【図１０】同モデルによる知識記憶を示す図であり、構
文解析例を示す図。

【図１１】同モデルによる知識記憶を示す図であり、構
文解析例を示す図。

【図１２】同モデルによる知識記憶を示す図であり、前
置詞を示す図。

【図１３】同モデルによる知識記憶を示す図であり、関
係記述子を示す図。

【図１４】同モデルによる知識記憶を示す図であり、本
発明の一実施例システムのハードウェア構成図。

【符号の説明】

５０３…語彙解析部、５０４…構文解析部、５０６…複
合名詞解析部、５１１…構造化概念ファイル、５１２…
語彙辞書、５１４…構文規則文法ファイル、２２１…概
念名称テーブル、２３１…包摂関係テーブル、２４１…
一般関係定義テーブル、２５１…関係テーブル、６０１
…前置詞テーブル、６１１…関係記述子テーブル。

───────────────────────────────────────────────────── フロントページの続き (72)発明者木内伊都子東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内

Claims

【特許請求の範囲】

【請求項１】複合名詞句を含む単語列を入力する入力手
段、入力された単語列を処理する処理手段、処理結果を
出力する出力手段を備える装置であって、上記処理手段
は、概念をノードとして表し、該概念間の関係をリンクとし
て表し、該ノードとリンクで概念木を構成する概念ネッ
トワークを知識として記憶する知識ベースと、上記入力された単語列中に存在する複合名詞句の複数の
単語間の意味関係を判定するための知識情報を、上記概
念ネットワークを検索することにより抽出する解析手段
を有することを特徴とするデ−タベース装置。
【請求項２】単語列を入力する入力手段、入力された単
語列を処理する処理手段、処理結果を出力する出力手段
を備える装置であって、上記処理手段は、概念をノードとして表し、該概念間の関係をリンクとし
て表し、該ノードとリンクで概念木を構成する概念ネッ
トワークを知識として記憶する知識ベースと、上記入力された単語列中に存在する複数の単語間の意味
関係を、上記概念ネットワークを検索することにより判
定する解析手段を有することを特徴とするデ−タベース
装置。
【請求項３】上記知識ベースは、上記概念の名称を記憶
する概念名称テーブルと、上記概念間の包摂関係を記憶
する包摂関係テーブルと、上記概念間に存在する包摂関
係以外の関係の定義を記憶する一般関係定義テーブル
と、上記概念間の関係の存在を記憶する関係テーブルを
有する特許請求の範囲第２項記載のデ−タベース装置。
【請求項４】さらに構文規則を記憶した文法ファイルを
有し、上記解析手段は、上記単語列の各単語の属性を解
析する語彙解析手段と、上記文法ファイル、上記知識ベ
ース、および上記語彙解析手段の解析結果を参照して、
上記単語列の構文を解析する構文解析手段を有する特許
請求の範囲第３項記載のデ−タベース装置。
【請求項５】さらに、ある概念を他の概念によって意味
を限定した構造化概念を記憶する構造化概念ファイル、
単語の種別を記憶する語彙辞書ファイルを有し、上記語
彙解析手段は、上記構造化概念ファイル、語彙辞書ファ
イル、および上記概念名称テーブルを参照して、前記単
語列の各単語の属性を解析することを特徴とする特許請
求の範囲第４項記載のデ−タベース装置。