JPH01180046A - 知識ベースシステムおよび自然言語理解方式 - Google Patents

知識ベースシステムおよび自然言語理解方式

Info

Publication number
JPH01180046A
JPH01180046A JP63002609A JP260988A JPH01180046A JP H01180046 A JPH01180046 A JP H01180046A JP 63002609 A JP63002609 A JP 63002609A JP 260988 A JP260988 A JP 260988A JP H01180046 A JPH01180046 A JP H01180046A
Authority
JP
Japan
Prior art keywords
concept
natural language
concepts
relationships
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63002609A
Other languages
English (en)
Other versions
JP2997469B2 (ja
Inventor
Hiromichi Fujisawa
浩道 藤澤
Kon Debitsudo
デビッド・コン
Atsushi Hatakeyama
敦 畠山
Itsuko Kiuchi
木内 伊都子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63002609A priority Critical patent/JP2997469B2/ja
Publication of JPH01180046A publication Critical patent/JPH01180046A/ja
Priority to US07/831,093 priority patent/US5404506A/en
Priority to US07/947,536 priority patent/US5696916A/en
Priority to US08/141,039 priority patent/US5555408A/en
Priority to US08/663,840 priority patent/US6182062B1/en
Application granted granted Critical
Publication of JP2997469B2 publication Critical patent/JP2997469B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は、一般のユーザが知識・情報の検索や登録を判
り易く、かつ容易に出来るようにするための自然言語イ
ンターフェースに係る。より具体的には、そのような自
然言語インターフェースを実現するための自然言語理解
方式と、それを用いた知識ベース方式に関する。特に、
多種多様な事物や事実を記憶して、自然言語から推論を
働かせて検索が出来るような知識ベースの構築法に関す
る。
[従来技術] 従来、自然言語を用いたヒユーマンインターフェースと
しては、データベースのための自然言語インターフェー
スが知られている。例えば、文献[シー・ジー・ヘンド
リックス、他、″ディベロッピング・ア・ナチュラル・
ラングエツジ・インタフェース・トウー・コンプレック
ス・データ″、ニーシーエム、トランザクション・デー
タベース・システム、ポル3.1978、ピーピー10
5−147 (G、 G、 )lendrix et 
al、、 ”Developing aNatural
 Language Interface to Co
mplex Data、”ACM Trans、 Da
tabase Systems、 Vol、 3.19
78゜pp、105−147) 1などがある。これら
のシステムでは、データベースのためのデータモデル(
記憶するデータ項目間の関係を表現する方式のこと)と
、自然言語を解釈するための文法や辞書とが独立に設定
されている。すなわち、自然言語インターフェースを既
存のデータベースに対して付加するときは、文法や辞書
を改めて構築する必要がある。
或いは、対象とするデータベースが変われば、自然言語
インターフェースのための文法や辞書を変更する必要が
あるという問題点がある。
また、従来、自然言語インターフェースが与えられてい
るデータベースは関係データベース(Relation
al Database)であり、そこで用いられる検
索のための形式言語、例えば準標準的なSQL言語(S
tructured Query Language 
ニストラクチヤード・クエリ・ラングエツジ)は高次の
知識の記述能力に弱い。通常、自然言語による質問文は
、このような中間言語としての形式言語に翻訳されるた
め、この形式言語の表現能力にシステム全体の機能が制
限されてしまうという問題点がある。
特に、関係データベースは−様なデータに対しては有効
であるが、多種多様な事物を扱うヘテロジエネオス0デ
ータベース(heterogeneousdataba
se)や、オブジェクト指向のデータベースに対しては
、充分適しているとは言えない。例えば、曖昧なユーザ
の記憶から事物を記述して、その記述からそれに関する
情報を検索することには適していない。
更に、これらのシステムでは、データ(新しい知識・情
報)の入力は自然言語以外の方法を用いており、専門家
が行っている。従って、エンドユーザが直接入力・登録
することが難しいという問題点がある。
[発明が解決しようとする課題] 本発明の解決しようとする課題は、データベースや知識
ベースにおいて、以上のような問題点を解決し、エンド
ユーザが曖昧、または断片的な記憶からでも自然言語に
よる記述から欲しい情報を検索可能とすることにある。
更に、新しい情報や知識の登録もユーザ自身により同様
に自然言語を用いて行えるようにすることにある。
[課題を解決するための手段] 本発明は、かかる課題を達成するために、知識ベースと
自然言語インターフェースとに共通の知識表現基盤を与
え、それにより自然言語による知識・情報の検索と登録
とを容易に実現可能とするものである。
具体的には、本発明は、知識ベースの構成法として、「
概念」と「関係」とで事物の体系と事実を表現する「概
念関係モデル」と呼ぶ知識表現方式(データベースにお
けるデータモデルに対応する)を与え、更に、同知識ベ
ースの中に言語的知識をも記憶させる方式を提供する。
ここで、「概念」とは、事物や事象、或いは抽象的な概
念を表わす計算機内のデータ項目であり、「関係」とは
、同概念間に定義するデータ項目である。概念はノード
(節)で表わし、関係はリンク(辺)で表わす。概念関
係モデルで表された知識は、従って、概念のネットワー
クを構成する。ここでは、これを概念ネットワークと称
する。
すなわち、本発明による知識ベースでは、本来記憶した
い知識とそれを言語的に表現するための知識とを一体と
して概念ネットワークに格納し、自然言語インターフェ
ースは同知識を共用するようにすることが特徴である。
従って、原則として、自然言語インターフェースのため
に改めて辞書などを構築する必要が無い。
また、本発明は、知識ベースに記憶されている事実など
から推論を働かせて、自然言語で表わされた質問文の意
味解釈を行う自然言語理解方式を提供する。特に、通常
、我々が良く用いる複数の名詞の列からなる複合名詞句
の意味解釈方式、を与える。複合名詞句を意味解釈する
ためには、名詞間の関係をシステムが推論する必要があ
るが、本発明では、知識ベース内に記憶されている概念
と関係とから、意味のある関係のみを推論する方式更に
、本発明による知識表現方式は、複数の言語に適用する
ことが容易になるように、言語に依存する部分を限定し
ている。更には、複数の言語による表現の共存も可能に
している。従って、同一知識ベースにおいて、例えば、
英語と日本語で検索したり、登録したりすることを可能
とする手段を提供する。
[作用] 以下、本発明方式の原理を説明する。
まず、基本となる概念関係モデルによる知識表現方式を
説明する。第2図に概念ネットワークの一部を説明のた
めに示す。同図において、楕円は概念(ノード)を表わ
し、矢印は関係(リンク)を表わす。ノード201、”
 UNIVER8AL”は知識ベース内の全てを代表す
るルートノード(根)である。各ノードには一つ以上の
文字列を概念の名称として定義できる。例えば、同義語
や外国語を付加することができる。
一方、ノードとノードを結ぶリンクには、属性が継承さ
れる概念間に定義される包摂関係(Is−Aリンク20
2)、概念間に一般的に定義される「一般関係」 (ノ
ード203)、および同一般関係の具体的事例としての
「具体関係」 (リンク204)がある。包摂関係は物
のクラス(分類)を表わす。従って、概念と包摂関係か
らなる概念ネットワークは、分類階層(taxonom
ic hierarchy)を表わす概念水を構成する
例えば、第2図の概念ネットワークの内、概念水は次の
ような知識を表わしている。
(PAPER−MATERIAL (is−a THI
NG))(BOOK (is−a PAPER−MAT
ERIAL))(BOOK#0051 (is−a B
ooに))(LIVING−THING (is−a 
THING))(PERSON (is−a LIVI
NG−THING))(NEWTON (is−a P
ER30N))ここで、これらはフレーム表現と呼ばれ
る。ここでは、LISP言語で使うS式表現(Symb
olicexpression )で表わしている。こ
れらは普通の英語でも表わすことが可能であり、 Paper material is a thing
Book is a paper material。
などと書ける。日本語では、 「書物は物である。」 1本は書物である。」 「人は生物である。」 などとなる。
一般関係の例は、第2図において、概念211(BOO
K)と概念212 (PERSON)との間に定義され
る関係203である。これは1本」と「人」との間には
「著者」または「著作」という関係が有り得ることを表
わしている。この一般関係は、 (BOOK (is−written−by PER3
0N))(PERSON (has−written 
BOOK))または、 「本を書いた人」 「人が書いた本」 のように、右方向、或いは左方向へ双方向に読むことが
出来る。
具体関係は、第2図において、破線のリンク204で示
されるような関係であり、ある一般関係の一つの具体例
(デ・−タベースでは実現値とも言う)を示す。例えば
、第2図では、「著者」という一般関係203の具体例
として、概念213と概念214との間に具体関係20
4が定義されている。フレーム表現で書くと、 (BOOK#0051 (is−a BOOK)(is
−written−by NEWTON))(NEWT
ON (is−a PER30N)(has−writ
ten BOOK#0051))となる。自然言語では
、 BOOK#0051 is a bookwhich 
is written by NEWTON。
NEWTON is a personwho has
 written BOOK#’0051゜rBOOK
#o051は NEWTONが書いた本である。」 rNEWTONは BOO’に#0051を’iVいた人である。」のよう
に表わすことが出来る。
さて、以上のような知識は、本発明方式では以下のよう
なデータ構造で記憶する。まず、概念とその名称は概念
名称テーブル221(第3図)で記憶する。同テーブル
221は、三つのカラム222.223.224から成
っている。カラム222は概念の固有番号C#であり、
カラム223にその名称CNAMEを定義できる。同名
称の言語LANGはカラム224で規定する。例えば、
LANGの値がII J 11のときは同名称は日本語
、E 11のときは英語である。
また、概念名称は、同一言語に対して複数個、定義する
ことが出来る。そのために、カラム223はデータ構造
としてデータの繰返しを許している。例えば、概念C#
0O04の名称は「本」および”BOOK”であるが、
これに対して、概念名称「書籍」を追加定義することも
出来る。
次に、概念の包摂関係は、第4図に示す包摂関係テーブ
ル231で表わす。カラム232とカラム233は、各
々概念固有番号C#およびcs#であり、概念C#の上
位概念(Superconcept )は概念SC#で
あることを表わす。例えば、テーブル231の第2レコ
ードは、概念C#0O02(「書物」)の上位概念は概
念c#ooo1 (「事物」)であることを表わす。各
概念に定義される属性などの「関係」は、包摂関係のリ
ンクを通じて上位から下位へ継承される。ここで、一つ
の概念に対して複数の上位概念を定義することが可能で
ある。従って、属性の多重継承が実現される。
包摂関係以外の概念間の多種多様な関係は、第5図で示
す一般関係定義テーブル241に定義することが出来る
。個々の一般関係は各々、関係の種類を表わす。基本的
には、そのような関係の種類の数に制限は無く、任意の
数の一般関係を定義することが可能である。
一般関係定義テーブル241は、主に「関係」を自然言
語で表現したときの「読み」を定義する。
カラム244は同関係を左から右へ読んだときの「読み
JLRであり、カラム245はその逆に右から左への「
読みJRLを定義する。これらのカラムは、データ構造
として繰返しを許容し、複数の読みを定義することが出
来る。また、これらは概念名称テーブルと同様にカラム
246によって読みの言語を指定することが出来る。従
って、複数の言語によって表現することが可能である。
第5図の例では、関係”AUTHOR3)IIP″′は
、PER30N who is author of 
BOOKPER8ON who is the aut
hor of [100KPER5ON who wr
ote BOOKPER3ON who has wr
itten BOOに或いは、 BOOK whose author is PER3
0NBOOK by PER30N BOOK from PER30N BOOK of PER30N と自然言語(この場合は英語)で表現できる。日本語の
場合も同様である(省略)。
概念間の関係の存在は、第6図に示す関係テ−プル25
1によって記憶する。これまでに説明したように、関係
リンクには一般関係と具体関係とがあり、それらはテー
ブル251のカラム256によって区別する。カラムC
LASSの値がGRのときは一般関係、lN5Tのとき
は具体関係を表わす、第6図の例では、第2レコードは
第2図の一般関係203を表わし、第2レコードは第2
図の具体関係204を表わす。また、カラムC#Lは左
側の概念を、カラムC#Rは右側の概念を規定する。こ
こで、ある概念を右に置くか左に置くかは、定義次第で
あり、テーブル241とテーブル251とで矛盾が無い
限り、どちらに定義しても良い。
さて、次に、以上の知識表現方式を基礎とする自然言語
理解方式の原理を説明する。
まず、オブジェクト指向の知識ベースで最も重要な複合
名詞句の意味理解方式を説明する。ここで、複合名詞句
とは一部形容詞を含んだ複数の名詞の列からなる名詞句
である。例えば、以下は複合名詞句の例である。
supercomputer article    
       (1)Electronicsすeek
 article          (2)Japa
nese  personal  cow+puter
  company   (3)American  
personal  computersoftwar
e packages  (4)ここで、意味を理解す
ることは、各形容詞および名詞の間の関係を陽に求める
ことである。
例えば、複合名詞句(1)と(2)は同じ構造をしてい
るが、意味は異なり1次のように解釈されるべきである
。(1)は、 ”article whose 5ubject is
 supercomputer”のことであり、(2)
は、 ”article which is part of
 Electronicsすeek”を意味する。すな
わち、(1)では、articleとsupercom
puterとが関係5ubject−isで結ばれてい
ること、(2)では、articleとElectro
nicsWeekが関係1s−part−ofで結ばれ
ていることを推論する必要がある。フレーム形式で記述
すると、次のような構造を自動的に抽出することが意味
を理解することである。
(ARTICLE  (subject−is SUP
ERCOMPUTER))(ARTICLE (is−
part−of Electronicsυeek))
本発明による自然言語理解方式では、第7図に示すよう
な知識に基づいて、以下のように意味を解釈する。まず
、この推論を可能とする知識としては、一般関係として
、関係R3#0O11:(ARTICLE (subj
ect−is UNIVER3AL))   (7a)
(UNIVER3AL (is−subject−of
 ARTICLE))  (7b)と、関係R3#0O
12: (ARTICLE (is−part−of JOUR
NAL))    (8a)(JOURNAL (ha
s−part−of ARTICLE))    (8
b)が定義されている必要がある。すなわち、「記事の
主題には何でも成り得ること」、「記事は雑誌の一部で
あること(記事は雑誌の一部に掲載されるものであるこ
と)」が知識として記憶されている必要がある。
また、包摂関係としては、 (SUPERCOMPUTER(is−a THING
))     (9)(TIIING (is−aいI
VER5AL))       (10)(Elect
ronicsWeek  (is−a JOURNAL
))    (11)が記憶されている必要がある。
これにより、”supercomputer arti
cle”を解釈することが出来る。まず、SUPERC
OMPUTERから包摂関係を上位に辿って、 (SUPERCO阿PUTEI((is−a  UNI
VER3AL))(いIVER3AL (is−sub
ject−of ARTICLE))であることが分か
る。その結果、属性継承により、(SUPERCOMP
uTER(is−subject−of ARITCL
E))或いは、 (ARTICLE (subject−is SUPE
RCOMPUTER))という関係が有り得ることが推
論される。すなわち、「スーパコンピュータは記事の主
題に成り得ること」が導出される。この場合は、これ以
外の解釈は無いので、解釈: ”article whose 5ubject is
 supercomputer”「スーパコンピュータ
と主題とする記事」が採用される。
複合名詞句(2)の意味解釈は少し複雑である。
この場合、第7図から分かるように、 (ElectronicsWeek (is−a JO
URNAL))(JOLIRNAL (has−par
t−of ARTICLE))であると同時に、 (ElectronicsWeek (is−a UN
IVERSAL))(UNIVERSAL (is−s
ubject−of ARTICLE))であるので、 (ElectronicsWeek (has−par
t−of ARTICLE))と (ElectronicsWeek  (is−sub
ject−of  ARTICLE))の二つの関係が
有り得ることが推論される。すなわち、 ”article which is part of
 ElectronicsWeek”と ”article  whose  5ubject 
 is  ElectronicsVeek”の二つの
解釈が有り得ることが分かる。
このように複数の解釈の候補が存在する場合は、本発明
方式では、どの解釈が数多くの具体的事例を持つかで、
解釈の尤もらしさを評価するという発見的手法を用いる
具体的には、先の例では、概念”ARTICLE”と概
念”ElectronicsWeek”の自分も含めた
下位の概念を探索して、関係R3#0O11と関係R3
#0012の具体関係が、それぞれ幾つ登録されている
かを計数する。第7図の例では、前者は0、後者は一つ
具体関係が登録されている。すなわち、”Electr
onicsVeek ”を主題とした記事はないが、E
lectronicsWeek ”に掲載されている記
事は一件、ARTICLIJOIOIがある。従って、
関係R3#0O12(is−part−of)がより適
切な解釈として選択される。すなわち、 ”article which is part of
 ElectronicsWeek”と解釈される。
以上に説明したように、複合名詞句の解釈では、2語の
名詞間の関係の推論処理が基本となる。すなわち、以下
説明する三つ以上の単語から成る複合名詞句の解釈の基
本処理は、上記2語間の関係抽出である。以下、複合名
詞句(3)を例に取って説明する。
まず、複合名詞句を構成する単語の中に複合語から成る
概念名称があるかどうかを調べながら、各単語に対応す
る概念を選び出す。すなわち、先頭から順次単語を切り
取って、概念名称テーブルを参照して、登録されている
かどうかを調べる。
複合名詞句(3)の場合は、 ”Japanese” ”Japanese personal””Japan
ese personal computer””Ja
panese personal computer 
company””personal” ”personal computer”’perso
nal computer company””com
puter company””con+pany” のように、複合名詞句から部分単語列を切り出して、そ
れぞれが概念名称であるかどうかを調べて行く。
ここで、本方式では、形容詞は対応する名詞形を名称と
する概念の同義語として登録されており、形容詞は同概
念として扱われる点が一つの特徴である。例えば、形容
詞”Japanese”は概念” J A P A N
 ”(日本国)、或いは概念”Japanese pe
ople”(日本人)の同義語として登録されていて、
同概念として扱われる。
従って、この処理の結果、personal comp
uter”が一つの概念名称、”PERSONAL−C
OMPUTER”として定義されていたとすると、複合
名詞句(3)はまず、 (JAPAN PERSONAL−COMPUTERC
OMPANY)(JAPANESE−PEOPLE P
ERSONAL−COMPUTERCOMPANY)と
して認知される。但し、以下の説明では、判り易くする
ため、最終的には意味のない解釈であることが分かる後
者は省いて説明する。
すなわち、この段階で、同複合名詞句は実質的に三つの
概念の組合せであることが分かったことになる。これは
括弧()を用いて次のようにも表現できる。
(Japanese (personal compu
ter) company)従って、次の処理は、これ
ら3つの概念がどのように相互に関連付けられているか
を調べることである。この場合、次の二つの可能性があ
ることが分かる。
(Japanese ((personal coII
lputer) company))((Japane
se (personal computer)) c
ompany)まず、(13)の場合、COMPANY
とPER50NAL −COMPUTERlおよびCO
MPANYとJAPANの間に結ばれ得る二つの関係を
推論する必要がある。この場合、先に説明した関係の推
論方式により、 (COMPANY (produces PERSONAL−COMPUT
ER)(is−1ocated−in JAPAN))
       (15a)(COMPANY (has−developed PER30NAL−C
OMPUTER)(is−1ocated−in JA
PAN))       (15b)なる関係が抽出さ
れる。ここでは、複数の解釈の優先度(尤度:尤もらし
さ)を評価するために、COMPANYとPER30N
AL −COMPUTERlおよびCOMPANYとJ
APANの二つの関係の具体例(下位の概念に定義され
ている具体関係)の総数を、それぞれの解釈(15a)
、(15b)に対して計数し、これを関係の重みとする
。全体の評価としては、具体関係の総数(関係の重み)
を一般関係の数で割って、正規化する。(15a)、(
15b)の例では、一般関係の数は2である。
次に、第二の可能性である(14)について関係を抽出
する。コノ場合、COMPANY トPER5ONAL
−COMPUTER1およびPERSONAL−COM
PUTERとJAPANの二つの関係を求める必要があ
る。前者については、(COMPANY (produ
ces PERSONAL−COMPUTER))(1
6a) (COMPANY (has−developed P
ERSONAL−COMPUTER))(16b) のような、二つの関係が(想定する知識ベースにおいて
)見つかる。同様に、後者については、(PERSON
AL−COMPUTER(is−produced−b
y (COMPANY (is−1ocated−in J
APAN)))(17a) (PERSONAL−COMPUTER(was−de
veloped−by (COMPANY (is−1ocated−in J
APAN)))(17b) が見つかる。但し、ここで、PERSONAL−COM
PUTERとJAPANとを直接結ぶ関係は無いので、
これらを間接的に関係付ける概念COMPANYを自動
的に見出している。
本発明方式は、このように直接結び付ける関係が見つか
らないときは、関係を見出すべきこれら二つの概念の上
位を各々遡って、それら上位概念に定義される全ての一
般関係(の集合)を抽出する。二つの概念について行う
ので、二つの一般関係の集合が得られることになる。こ
れは三つのテーブル231,241.251を検索する
ことによって抽出できる。次に、抽出された一般関係の
相手方に結ばれている概念をそれぞれリストアツブする
。これにより、二つの概念集合が得られるが、これらの
積集合を求めることにより、最終的に二つの概念を仲介
する概念、先の例では概念COMPANYが得られる。
結局、意味の無い組合せを捨てて、以下の二つの解釈を
得る。
(COMPANY (produces (PERSONAL−COMPUTER(was−de
veloped−by (COMPANY (is−1ocated−in JAPAN)))))
)(18a) (COMPANY (has−developed (PERSONAL−COMPUTER(is−pro
duced−by (COMPANY (is−1ocated−in JAPAN)))))
)(18b) 最終的には、以下の合計4つの解釈が自動的に得られる
ことになる。
”company which  produces personal 
computerwhich is 1ocated 
in Japan”      (19a)”comp
any LIlhich has developed per
sonal computerwhich is 1o
cated in Japan”      (19b
)” COm p a n y Which  produces  personal
  computerwhich  was  dev
eloped  by  companywhich 
is 1ocated in Japan” (19c
)”Company tmhich  has  developed  p
ersonal computerwhich  is
  produced  by  companywh
ich is 1ocated in Japan” 
(19d)なお、上記の英語の表現において、関係代名
詞の掛り受は関係はインデンテーションによって示した
。レベルが深くなっている場合は、直上の行の名詞を修
飾している。
複合名詞句(4)についても同様に処理される。
各単語を概念名称とマツチングすることにより、(US
A PER5ONAL−COMPUTER5OFTWA
RE−PACKAGE)のような三つの概念から成るこ
とが、まず分かる。
これら概念間の関係を推論することにより、以下の解釈
が得られる。
software package which runs on personal co
+mputerwhich was develope
d by coa+panywhich is 1oc
ated in USA”   (20)さて、本発明
による自然言語理解方式は、複合名詞句の意味解釈機能
の上に、文解釈部(構文解析部)を置くことにより、よ
り強力な名詞句解釈機能を可能とすると同時に、知識ベ
ースとの自然言語による広範な対話を実現している。同
文解釈部は構文規則を用いるが、リスト1は同構文規則
の一例を示す。一つの構文規則は、非終端記号(ノンタ
ーミナルシンボル;ここでは、鉤括弧く〉で囲んだ記号
)で構成される左辺と、その展開形である右辺、および
その展開が成功したときに評価されるべき関数の三つの
部分から成る(例えば、(21a)式)。但し、リスト
1では解析が成功したときの評価関数は省略して示して
いる。各規則の右辺は、終端記号(ターミナルシンボル
)と非終端記号から成る列で構成される。ここで、記号
′暑”は並置を示す。また、非終端記号<s〉は文章全
体を表わす。
リスト1: <s>  ::=  <system−command
>  l                (21a)
<define−command)  l      
           (21b)<search−c
ommand)l               (2
1c)<browse−command>      
            (21d)<system−
command>  ::=  1oad  from
  <’i’)  1save  to  <7>  
l  update  l  quit  I 5to
p  l<show−word>  chart  l
  edit  <?)<show−word>  :
:=  show  l  print<5earch
−command)  ::=<find−word>
<noun−phrase>  、       (2
2)<find−word>  ::=  1ook 
 up  l  1ook  for  1searc
h for l 1ookup l find    
 (23)<noun−phrase)  :::  
<noun−group)l          (2
4a)<noun−phrase>くjoiner><
noun−phrase>(24b) <noun−group>  :::  <noun−
compound>  l        (25a)
<art>(noun−compound>  l  
          (25b)<def−art><
noun−coIIlpound>         
(25c)<noun−con+pound>  ::
=  (noun−string>        (
26)<noun−string>  ::=  <c
oncept>  l             (2
7a)(concept><noun−string>
       (27b)<joiner)  ::=
  <prep>  l<rel−pronoun><
1ink>              (28)<d
efine−command>  ::=define
  relation  <new−phrase> 
 、  1(29a) define  <?>  as  <noun−ph
rase>  、  1(29b) (noun−phrase>  is  <noun−
phrase>  、  1(29c) <noun−phrase><1ink>(noun−
phrase>  、  1(29d) <noun−group>  is  also  k
nown  as  <?>  。
(29e) <new−phrase>  ::= <noun−compound><7><noun−c
ompound><’?>  :::  <null)
  l  <null><?>           
      (31)文解釈部はボトムアップ処理によ
る諸量解析部と、トップダウン処理による構文解析部と
から成る。本方式における構文解析部は、構文規則に合
致する全ての文構造を候補として出力する。そこから、
意味のある解釈(単語間の掛り受は関係)のみを先に説
明した複合名詞句解析により評価、選択する。
ボトムアップ処理である語文解析(lexicalan
alysis)は、概念名称、関係記述子、前置詞、関
係代名詞、冠詞の区別が記述されている諸量辞書(le
xicon)を用いて行われる。
同語文辞書は、先に説明した知識表現方式による概念ネ
ットワークから編集処理により自動的に構築することが
可能である。具体的には、概念名称はテーブル221(
第3図)から抽出される。
語粟解析の結果、概念名称とマツチングした入力文中の
単語は、<concept〉という非終端記号として認
識される。
関係記述子とは、同知識表現方式における「関係」、ま
たは、その「読み」のことであり、例えば、”is a
uthor of”、 ”wrote”、 ”has 
written”。
”author is”などである。これらは、一般関
係定義テーブル241(第5図)から抽出される。
これらにマツチングした入力文中の単語、または単語列
は非終端記号< 1ink >とじて認識される。
前置詞は”byII 、 IIfroIIIII 、 
IIofllなどであり、その意味(それが表わす関係
の種類)は一般関係定義テーブル241(第5図)から
自動的に抽出される。これら前置詞は非終端記号<pr
6p>として認識される。ここで、関係記述子および前
置詞として認識された場合には、上記非終端記号ととも
に、それらが意味する「関係」の種類とその方向を諸量
解析結果として出力する。これにより、後述するように
、”book by Newton”のような名詞句の
意味解釈が可能となる(構文規則(24b) 。
(28)を参照)。
同語文辞書には、更に、関係代名詞<rel −pro
noun> (which、 who、 that)、
不定冠詞<art>(a、 an)、定冠詞<def−
art> (the)が記憶されている。また、諸量解
析で認識できなかった単語は非終端記号<null>と
して認識される。
構文解析は、このボトムアップ前処理としての諸量解析
をもとに行われる。第8図を用いて構文解析方法を説明
する。同図において、入力文として、三つの単語401
,402.403が解析される。上部から下部へ流れる
矢印(例えば、矢印411)はボトムアップ処理を、下
部から上部へ流れる矢印(例えば、矢印412)はトッ
プダウン処理を表わす。
諸量解析の結果として、単語401 (persona
l)にはマツチングする概念がないこと、単語402(
computer )の解釈としては二つの概念「計算
機」および「雑誌コンピュータ」が有り得ること、単語
列401−402 (personal comput
er)は概念「パーソナルコンピュータ」にマツチング
すること、単語403 (company)は概念「会
社」にマツチングすることが出力される。
構文解析部は、これらの結果を受けて、例えばリスト1
に示す構文規則を参照して1交会体を展開していく。第
8図は、その途中からのみを示しているが、同図におい
て、<noun−phrase> 421は(25a)
式により<noun−compound> 422 ヘ
、更に、(26)式により<noun−string>
 423へ展開される。更に、<noun−strin
g>は(27b)式により <concept> 42
6と<noun−string> 427とに展開され
る。後者の<noun−string>は(27a)式
により<concept> 428に展開される。結局
、第8図の例では、入力文(名詞句)の解釈は、(pe
rsonal computer)と(company
)の二つの概念(<concept>)とから構成され
る複合名詞句(noun compound)が有り得
ることが分かる。
なお、ここで第8図以降第11図まででは、図面を簡単
にするために、リスト1で示す記号は、次のように簡略
化している。すなわち、<noun−phrase>、
  <noun−group>、  <noun−co
mpound>。
<noun−string>、  <joiner>、
  <rel−pronoun>。
< find−word >は、それぞれ<n−phr
ase>+<n−group>、  <n−camp>
、  <nn−5trin>、  <join>。
<rpron>、 <find> と表記している。
本構文解析では、構文的に可能な文構造を全て抽出する
。そのような構文解析アルゴリズムとしては、例えばチ
ャートパーザ[文献:エイチ・トンプソン、エトアル、
″インプリメンティングナチュラル・ラングエツジ・パ
ーザーズ、アーティフィシャル・インテリジェンスニド
ウール、テクニーク、アンド アプリケーションズ、エ
デイティラド バイ チー・オシア アンド エム・ア
イゼンシュタト、ハーバ・アンド・ロー、ニューヨーク
、1984、ピーピー、245−300 :Thomp
son、 H,et al、、 ”In+plemen
ting NaturalLanguage Pars
ers、” in ArtificialIntell
igence : Tools、 Technique
s、 andApplications、 edite
d by T、 O’5hea and M。
Eisenstat、 Harper and Row
、 New York、 NY。
1984、 pp、245−300]が知られている。
抽出された全構文候補は、各々構文規則に記されている
評価式により評価される。本発明の特徴は、この評価に
知識ベースに記憶されている知識を用いる点にある。第
8図の例の場合では、概念”personal com
puter”と概念”company”から意味のある
複合名詞句が構成され得るかを評価する。
この評価方法は、先に説明した概念ネットワークに登録
されている知識を用いる方式を用いる。この結果、意味
のある構文解析結果が尤度の順に得られることになる。
第9図以降は検索文全体に対する構文解析結果を示す。
検索文は、構文規則(21c)、 (22)を用いて、
命令語と名詞句とに展開される。第9図は、第8図の名
詞句を含む例である。第10図は、関係代名詞を含む名
詞句を含む検索文の分析の例である。ここでは、第5図
で示した概念関係モデルの「関係」の「読み」が関係式
名詞句の述語として機能しているのが分かる。更に、第
11図は、前置詞を含む検索文の例である。ここで、前
置詞onは関係「主題J  (”whose 5ubj
ect is”)を、前置詞atは関係「所属J  (
”who works at”)を意味していることが
、既に説明したように、第5図で示した一般関係定義テ
ーブルに記されている。
以上、説明した原理により、知識ベースと最小限の構文
規則により、陽に関係が記述されていない名詞の列(複
合名詞句)を含む自然言語文を意味解釈することが可能
である。
[実施例] 以下、本発明の一実施例を説明する。第14図は、本発
明の一実施例である知識ベースシステムのハードウェア
構成のブロック図である。
同システムは、同図において、主に中央制御装置(CP
tJ)101、主メモリユニット(MMU)102、ワ
ークメモリユニット(WMU)103、システムファイ
ルとユーザファイルとを持つ統合ディスクユニット12
1,122、プリンタ131、ローカル・エリア・ネッ
トワーク(LAN)に接続するための通信制御装置(C
CU)141およびユーザとの対話のための表示装置(
CRT)151、キーボード152、マウス153から
成る。
統合ディスクユニットは磁気ディスクと光ディスクとか
ら成り、例えば本実施例の場合は、第1のディスクユニ
ット(DKUI)121は磁気ディスクで構成されてい
て、高速性が要求される情報を記憶する。一方、第2の
ディスクユニット(DKU2)122は光ディスクで構
成され、特に大容量の情報を記憶する。
システムファイルには、オペレーティングシステム、通
信管理プログラム、ファイル管理プログラム、知識ベー
ス管理プログラム、或いは統合オフィス業務支援システ
ムといったシステムが提供するプログラム群、およびそ
れに必要なデータベースなどのファイル群が格納されて
いる。一方、ユーザファイルには、個人化されたシステ
ム提供のプログラムやユーザが作成したプログラムなど
のアプリケーションプログラム群と、それに必要なデー
タベースなどのファイル群、およびユーザなどが作成し
た統合知識ベース(後述)が格納されている。
システムの動作は、主メモリユニットにロードされたプ
ログラムの制御に従って、必要なデータを主メモリユニ
ットおよびファイルにアクセスして行われる。同時に、
ユーザは表示装置151に表示される情報を見ながら、
入力手段152.153を用いてシステムと対話するこ
とが可能である。
本発明の知識ベースシステムのソフトウェア部分は、概
念ネットワークエディタ、概念ネットワークブラウザ、
自然言語文解釈プログラム、マルチメディアファイル管
理プログラムとから成るプログラム群と、それらが用い
る情報を統合した統合知識ベースとから成る。以下、そ
れぞれについて順次説明する。
まず、概念ネットワークエディタは、既に説明した概念
関係モデルに基づいて、オブジェクト指向の知識ベース
の編集、検索、管理を行う。知識・情報は、第3図から
第6図までに示した概念名称テーブル、包摂関係テーブ
ル、一般関係定義テーブル、および関係テーブルによっ
て記憶、管理する。これらに記憶されているデータを、
ここでは概念ネットワークという。
概念ネットワークエディタは、所定の仕様に基づくコマ
ンド言語(形式言語)によって、以下の機能を提供する
(1)概念の登録:概念名称と分類階層位置を指定して
、新概念を登録。
(2)一般関係の登録ユニつの概念と関係の言語的表現
法を指定して、新しい 関係の種類を登録。
(3)具体関係の登録:二つの概念と関係の種類を指定
して、事実、関係、属 性などを登録。
(4)概念名称の編集:名称の修正;同義語・別名の削
除・追加。
(5)一般関係の編集:関係付けられている二つの概念
の変更;言語的表現法 の修正と追加。
(6)概念の削除 (7)具体関係の削除 (8)階層分類体系の変更 (9)上位概念の追加二二重(或いはそれ以上)に同一
概念を分類;属性等の多 重継承の付与。
(10)構造化概念の登録・削除:概念を概念によって
修飾した抽象的概念(後 述)の登録および削除。
(11)諸量辞書の更新:概念ネットワークから諸量解
析に必要な情報を語柔辞 書に追加・編集。
(12)概念の検索二部公文字列、キーワード、構造化
概念からの検索。
(13)ネットワーク跋渉二分類階暦木、および連想に
よる注目概念の移動。
(14)マルチメディア情報の付加・削除:任意の概念
にマルチメディアファイ ル内の情報を連想的に付加、或 いは削除。
(15)マルチメディア情報の読出し:概念に付加され
ているマルチメディア情 報のマルチメディアファイルか らの読出し。
ここで、上記機能における構造化概念について説明する
。構造化概念とは、ある概念を別の概念と関係とによっ
て、修飾した(意味を限定した)抽象的な概念であり、
概念ネットワークとは別の記憶手段に格納する。具体的
には、これまでにも例で示してきた複合名詞句がそれに
当たる。例えば、構造化概念D#0011を (D#0011 ”supercomputer ar
ticle”(article  (subject−
is  supercomputer)))として、登
録できる。より具体的には、下記の内部データ構造、 (D#0011 ”supercomputer ar
ticle”(C#0401 ((R5#0033 L
R) C#0501)))のように、固有番号で記憶す
る。ここで2第1要素は構造化概念固有番号、第2要素
は構造化概念名称、第3要素は構造化概念定義式である
。但し、上記記法の例でC#0401は概念” a r
 t i c l e ”、C#0501は概念”su
percomputer”、R35OO33は関係「主
題」(subject)の固有番号である。
この構造化概念は、抽象的な、或いは記述的な記憶から
情報を検索する際に用いる。本システムは、構造化概念
から、推論処理を用いて具体的な概念を概念ネットワー
クから検索する機能を有する。上記の例では、概念”a
rticle”に包摂される具体的概念(概念” a 
r t i c 1 e ”の下位概念)の集合の中か
ら、主題が概念”5uperco+mputer”に包
摂される概念であるもののみを抽出することが可能であ
る。この処理を概念マツチングというが、これは逆向き
の推論処理によって実現される。
このように、構造化概念を記憶する手段と、それからの
検索手段を与えることによって、ユーザは随意に自分の
ものの見方をシステムに登録し、更に、欲しい概念を容
易に検索することが可能である。
概念ネットワークエディタの機能において、マルチメデ
ィア情報機能を更に説明する。マルチメディアファイル
には、例えばイメージスキャナによって入力した写真を
登録・蓄積することが出来る。概念ネットワークエディ
タには、同写真をある概念に連想的に付加する機能があ
る。具体的には、概念固有番号とマルチメディアファイ
ルメンバ名称との対応表を作成し、管理することにより
実現する。ユーザは同概念を検索した後で、その写真を
表示させることが可能である。マルチメディアファイル
には、写真のほかにも、文書イメージや、音声情報等を
記録することが可能である。
本概念ネットワークエディタの構成法としては、発明「
情報記憶方式」 (特願昭6O−60678)で開示し
ている方法を用いることが出来るので、ここでは説明を
省略する。
さて、次に概念ネットワークブラウザを説明する。概念
ネットワークブラウザとは、概念ネットワークエディタ
のためのビジュアルインターフェース(視覚形インター
フェース)であり、マルチウィンドウとマウスを用いた
直接操作方式を採用することによって操作性向上を図っ
ている。同ブラウザは知識ベースの内容を概念階層水、
フレーム形式、或いはテーブル形式、更には自然言語形
式で、任意のウィンドウ内に表示することが出来る。ま
た、その表示上のオブジェクト(概念と関係)を例えば
マウスで直接指示して、更に、メニューの中から命令を
選択指示することにより、先の概念ネットワークエディ
タの任意の機能を呼び出して、実行することが出来る。
概念ネットワークブラウザは、ユーザのこのような直接
的指示を形式言語であるコマンド言語に翻訳して概念ネ
ットワークエディタを起動する。
次に、自然言語文解釈プログラムを機能ブロック図、第
1図を参照しながら説明する。本発明の主なる特徴の一
つは、本自然言語文解釈方式にあり、その原理について
は、先に説明した。同自然言語文解釈プログラムは、構
成としては、ユーザからの単語列501を入力するため
の入力部502、同単語列の各単語の属性を解析する諸
量解析部503、構文規則を記憶した文法ファイル51
4を参照しながら構文を解析する構文解析部5゜4、お
よび、複合名詞解析部506とから成っている。動作と
しては、本自然言語文解釈プログラムは概念ネットワー
クブラウザから自然言語文501を受は取り、解釈結果
505を同概念ネットワークブラウザに返す。
本実施例では、諸量解析部は、構造化概念ファイル51
1、諸量辞書ファイル512、および概念ネットワーク
形知識ベース513の概念名称テーブル522を参照し
て解析を実行する。ここで、構造化概念ファイル511
は、先述したように、構造化概念固有番号、構造化概念
名称、構造化概念定義式の3組の集合を記憶する。また
、諸量辞書512は第12図で示す前置詞テーブル60
1、および第13図で示す関係記述子テーブル611で
構成される。別な実施例として、高速化処理のため、諸
量辞書に概念名称テーブルも含める構成も有り得る。
前置詞テーブル601は、各前置詞に対し、同前置詞が
表わす一般関係の固有番号を、同関係の方向別に記憶す
る。第12図の例でいうと、前置詞atは、一般関係R
3#0123を左から右に読んだ場合や、R3#020
9を右から左に読んだ場合等の「関係」を表わす。また
、関係記述子テーブル611は、各関係記述子に対し、
その−般関係固有番号とその方向性を記憶する。これら
の二つのテーブルは、これまでの説明から容易に理解で
きるように、全ての有り得る前置詞を別途記憶しておく
ことにより、第5図で示した一般概念定義テーブルから
自動的に構築したり、更新したりできる。この機能は、
第1図における諸量辞書編集部507により提供され、
実際には、概念ネットワークエディタの機能の一部であ
る。
ここで語鴬解析部の機能の説明を一部補足する。
発明の詳細な説明では、理解を助けるため構造化概念に
ついては述べなかったが、語ゑ解析部では、構造化概念
名称にマツチングした単語および単語列は、非終端記号
<concept > として認識すると同時に、構造
化概念の場合には、構造化概念定義式を評価値として出
力する。
この目的のため、語り解析部は、入力単語列から原理説
明のように部分単語列を順次切り出して、各部分単語列
が通常の概念名称のみならず、構造化概念名称について
もマツチング(一致)するかどうかを調べる。その結果
、それら何れかにマツチングする場合は、非終端記号と
して(COnCepj>を認識結果とし、更に、通常の
概念名称にマツチングした場合は同概念の固有番号を評
価値とし、構造化概念名称にマツチングした場合は同構
造化概念の定義式を評価値とする。
更に、諸量解析の結果、前置詞および関係記述子として
認識された場合には、それぞれ対応する非終端記号を認
識結果とすると同時に、対応する全ての「関係」を評価
値とする。これら評価値は、認識結果である非終端記号
に付随して、諸量解析結果として出力される。
構文解析部504は、原理説明で述べたように、語3解
析結果を入力として、文法ファイル514の構文規則を
参照しながら可能な全ての文構造をまず生成する。構文
規則に照らして可能な文構造を生成することを(狭義の
)パージングという。
このパージング段階では、意味的な適合性は勘案してい
ない。次に、構文解析部504は意味的な適合性の分析
と、複合名詞句の意味解析を複合名詞解析部506に行
わせる。これにより、候補として生成された文構造の集
合から、意味的に適合するものが尤度の順に選択される
ことになる。
構文解析の結果として、意味的に特に重要な要素は名詞
句<noun−phrase>であるので、主に名詞句
の構文解析について、第9図から第11図の例を用いて
より具体的に説明する。
まず、第9図の場合において、名詞句:”person
al computer companies”は、パ
ージングの結果、下記に示す構造として解析される。
(<noun−phrase> D#1009 ”personal computer compan
ies”((<concept>  (C#1001 
 ”personal  computer”))(<
concept) (C#1022 ”company
”))))ここで、(32)式に於いて、第1要素は非
終端記号、第2要素は随時与えられる構造化概念番号、
第3要素は入力文の対応する単語列、更に、第4要素以
降はパージング結果を表わす。パージング結果は、複数
の解釈が存在する場合にそれらを並置する。(32)式
では、単一候補のため第5要素以降は存在しない。また
、第4要素は、一般的に概念と関係とからなる列を構成
する。(32)式の例では、二つの概念の列になってい
る。関係を含んだ例は、後述(35)式で説明する。
これら概念および関係は、(32)式に示す如く、その
識別子(非終端記号)と具体的にマツチングした概念ま
たは関係の列でそれぞれ表わされる。(32)式の例で
は、各概念は単一のマツチング結果しかない。複数のマ
ツチング結果の例は、(37)式に示す。
さて、構文解析部はパージング結果(32)式を受けて
、開式の最後の2行を複合名詞解析部506に送る。同
複合名詞解析部は、原理説明で述べた方法により、二つ
の概念C#1O11とC#1022の意味的な関係を概
念ネットワークで表わす知識ベースから推論する。その
結果、(想定する知識ベースに於いて)次の二つの解釈
、(33)式および(34)式を得る。この例では、陽
に記述されていない関係が推論処理によって抽出されて
いる。
(D#1009 ”personal co+nputer compa
nies”(C#1022 ((RS#0055 RL
) C#1001)))(D#1009 ”personal computer compan
ies”(C#1022 ((R3#0056 RL)
 C#1001)))これらは自然言語的に表現すると
、それぞれ以下のようになる。
”coI!1pany which produces
’ personal co+oputer””com
pany which has developedp
ersonal computer”次に、第10図の
例について示す。この場合、パージング結果は(35)
式のようになる。すなわち、名詞句は二つの概念が結合
子(joiner)によって結び付けられたものとして
認識される。
(<noun−phrase> D#1010 ”person tyho is author of
 a book”((<concept>  、(C#
1101  ”person”))(<joiner>
 (R3#0001 RL ”1s−author−o
f”))(<concept>  (C#1122  
”book”))))ここで、複合名詞解析部は(35
)式の最後の3行を受けて、概念C#1101とC#1
122とが関係(R8#0OOI  RL)によって意
味的に関係付けられ得ることを推論し、(36)式の解
釈を最終的に得る。この場合、(35)式は単一の候補
しか示していないが、もし仮りに、上記の推論に失敗し
た場合は、そのような意味解釈は、知識ベースに記憶さ
れている知識に照らしてみて、有り得ないことが分かっ
たことを意味する。
(D$1010 ”person tgho is author of
 a book”(C#1101 ((R3#0O01
RL) C#1122)))(36)式を自然言語的に
表示すると下記のようになる。
”person who is author of 
book”最後に、第11図の例を説明する。(37)
式に示すパージング結果において、二番目の結合子(j
oiner )は、前置詞atを第12図に示す前置詞
テーブル601を参照して解釈したものであり、その結
果として複数の解釈が列挙されている。
(<noun−phrase> D#1011 ”articles on people at co
mpanies”((<concept>  (C#0
401  article”))(<joiner> 
(R3#0033 LR”5ubject−is”))
(<concept)  (C#0601  ”per
son”))(<joiner>  (R3#0123
  LR”1s−developed−at”)(R3
#1054 LR”1s−1ocated−in”)(
R3#0209 RL ”works−at”) 、、
、 )(<concept> (C#1022”com
pany”)))複合名詞解析部506は(37)式の
第4要素を入力して、「概念−結合子−概念」という3
組毎に、原理説明で述べた考え方により意味的な関係の
妥当性を評価する。すなわち、二番目の3組の例でいう
と、概念C# 0601 (person)と概念C#
 1022 (company)との間に、関係”1s
−developed−at”や”1s−1ocate
d−in”は有り得なく、関係” w o r k s
−a t ”のみが意味的に妥当であることを、知識ベ
ースに記憶されている具体的な事実から推論する。この
場合には、(38)式の解釈が最終的に得られる。
(D#1011 articles on people at com
panies”(C#0401 ((R5#0033 LR) (C#0601  ((R3#0209 RL)  (
41022)))))解釈(38)式は、自然言語で表
示すると下記のようになる。
”article whose 5ubject is personwh
o tuorks at company”欣に、本発
明方式による知識ベースシステムの次の要素であるマル
チメディアファイル管理プログラムについて説明する。
知識ベースは記号的にオブジェクトまたは概念を記憶す
るのに対して、マルチメディアファイルは、情報自体を
メディアのままで記憶する。すなわち、情報圧縮のため
に各々最適な符号化は行うが、写真、文書、図面、テキ
スト、音声といった複数の異なる種類のメディア情報(
マルチメディア情報)を所定の記述方式に従って記憶・
管理する。マルチメディア情報の記述方式については、
標準化されるべきマルチメディア・コンテンツ・アーキ
テクチャ(例えば、ODA:オフィス・ドキュメント・
アーキテクチャ)が知られているので、ここでは説明し
ない。
これらのマルチメディア情報は、所定の単位で管理され
、一つのオブジェクト(情報単位)を構成する。例えば
、「文書」、「記事」、「写真」、「図表」、「一区切
りの音声メツセージ」等々、我々が通常−つの物として
認知するものをオブジェクトとすることができる。この
オブジェクトは、単一メディアであっても良いし、マル
チメディアであっても良い。これらオブジェクトは、マ
ルチメディアファイル管理プログラムによって、各情報
単位に付けたファイルメンバ名称、物理的ファイルにお
ける記憶位置および記憶レコード長、記述形式(例えば
符号化方式)等から成る管理情報によって管理する。複
数のオブジェクトが構造化されて、別のオブジェクトを
構成することも可能である。逆に、あるオブジェクトを
複数の部分オブジェクトの構造体として管理することも
可能である。
一方、マルチメディアファイルに格納されている各情報
単位は、先述したように、概念ネットワークの任意の概
念ノードに関連付けることが出来る。これによって、マ
ルチメディアファイルに格納されている情報本体を、概
念ネットワーク形の知識ベースから知的に推論を用いて
検索することが可能である。
次に、統合知識ベースについて述べる。本発明方式によ
る知識ベースシステムは、これまでに説明した如く、概
念関係モデルに基づく概念ネットワーク形知識ベース、
構文規則を記憶した文法ファイル、上記知識ベースから
編集処理によって自動的に作成できる言語的辞書(語文
辞書512)、ユーザが個人毎に定義できる概念辞書(
構造化概念ファイル511)、およびマルチメディアフ
ァイルとから構成されていることを特徴としている。
更に、本システムは、知識ベース内の概念とマルチメデ
ィアファイル内のオブジェクトを関連付ける記憶手段と
を有している。このように、記号的・論理的表現による
知識・情報、言語的知識、およびメディア情報とを有機
的に記憶することが出来る知識ベースを、ここでは統合
知識ベースと呼ぶ。
これらの情報は、それぞれの特性に合わせて、統合ディ
スクユニットに記憶させる。
以上、本発明を特に英語の場合について説明したが、原
理的には、日本語等、他の言語にも同様に拡張可能であ
る。特に、知識表現方式の説明で述べたように、本発明
によれば、容易に多国語システムに拡張することが出来
る。具体的には、知識表現手段のうち、概念名称テーブ
ル221(第3図)と一般概念定義テーブル241(第
5図)のみが言語に依存し、同時に、それらのテーブル
は言語を規定するフィールド(カラム)LANG。
224および246を有している。
また、本発明は実施例で示した構文規則の内容(リスト
1)に限定されることなく、同構文規則を変更・拡張す
ることにより、より広範な、或いは別なシステムに適し
た自然言語を受は付けられることは自明である。その意
味でも、本発明方式は、広い応用分野を持つ。例えば、
詳細に説明しなかったが、リスト1においても、(29
a)から(29e)は、自然言語を用いて新しい概念の
登録(29b)、一般関係の登! (29a) 、或い
は新しい事実の登録(29d)等を行うことが可能であ
ることを示している。
更にまた、実施例の説明では、マルチメディアファイル
と結合したシステムを述べたが、同マルチメディアファ
イルと独立して、知識ベースシステムのみで用いても効
果的であることは言うまでもない。
[発明の効果] 以上説明した如く、本発明によれば、ユーザは学習する
ことが難しい形式言語を覚えることなく、自然言語を用
いて、曖昧な記憶から思い起こされる記述的な検索要求
から知識ベース内の欲しい情報を取り出すことが可能と
なる9通常、我々の記憶は時間とともに薄らいでいくが
、その時に残る記憶は、断片的であり、かつ抽象化して
いく。或いは、ずばりその名称を記憶していることは稀
であり、「こんなもの」、「あんなもの」といった記述
的なものに成っていくことも知られている。
本発明方式は、断片的、或いは抽象的な記述から検索す
る方式を与えており、その意味では、単に自然言語で検
索できること以上の効果を有している。
また、本発明によれば、自然言語理解に必要な知識は、
システム本来の知識とともに知識ベース内に一体となっ
て記憶されているため、上記のようなシステムを構築す
ることが、従来の自然言語インターフェースを与える方
式に比べて、容易である。具体的には、ユーザは特に自
然言語インターフェースと知識ベースの整合性などにつ
いて意識する必要はなく、知識ベースに本来記憶管理さ
せたい情報の登録に注目しさえすれば良い。
更に、本発明によれば、新しい知識の登録も自然言語を
用いて行うことが可能である。一般的に。
複雑な機能を有するシステムでは、視覚的(直接操作的
)インターフェースと言語的インターフェースとの共存
が重要である。本方式では、視覚的(ビジュアル)イン
ターフェースに言語的インターフェース機能が統合化さ
れており、はとんど全ての機能を自然言語と直接操作に
より提供している。その意味で、ユーザはその場その場
で、好きな方を選択することが出来、操作性および使い
勝手の面で優れている。
更にまた、本発明では、概念に対して同義語、異表記語
といった別名を登録したり、関係の名称(「読み」)に
対しても別名を記憶・登録させる手段を与えており、多
様な検索要求の表現に対しても適切に検索処理を実行す
ることが出来る。
また、本発明は、マルチメディア情報を知識ベースに統
合する方式についても示しており、これに従えば、従来
の記号的表現による知識ベース以上の応用分野を切り開
くことが可能である。
或いはまた、拡張例として述べた方式に従って他国語シ
ステムを構築すれば、例えば、英語で検索して日本語で
出力すると言ったことも実現できる。
【図面の簡単な説明】
第1図は本発明方式の自然言語文解釈プログラムの機能
ブロック図、第2図は概念関係モデルによる知識表現方
式を説明する概念ネットワークの図である。第3図以降
は同モデルによる知識記憶を示す図であり、第3図は概
念名称を示す図、第4図は包摂関係を示す図、第5図は
一般関係定義を示す図、第6図は関係を示す図である。 第7図は複合名詞句の意味解釈法の原理を説明するため
の図、第8図は構文解析法を説明する図、更に、第9図
、第10図、第11図は構文解析例を示す図である。第
12図は前置詞を示す図、第13図は関係記述子を示す
図である。第14図は本発明の一実施例システムのハー
ドウェア構成図である。 503・・・語穴解析部、504・・・構文解析部、5
06・・・複合名詞解析部、511・・・構造化概念フ
ァイル、512・・諸量辞書、514・・・構文規則文
法ファイル、221・・・概念名称テーブル、231・
・・包摂関係テーブル、241・・・一般関係定義テー
ブル、251・・・関係テーブル、601・・・前コ詞
テーブル、611・・・関係記述子テーブル。

Claims (1)

  1. 【特許請求の範囲】 1、知識を概念を表わすノードと関係を表わすリンクに
    よって表現する概念関係モデルに基づく知識ベースシス
    テムにおいて、概念名称を記憶する第1の記憶手段と、
    概念間の包摂関係を記憶する第2の記憶手段と、関係の
    種類の定義を記憶する第3の記憶手段と、概念同志の関
    係を記憶する第4の記憶手段と、複数の概念名称の列を
    入力して該概念名称が指す概念間の関係を上記第1から
    第4の記憶手段で記憶される知識を用いて推論する関係
    推論手段を有することを特徴とする知識ベースシステム
    。 2、第1項記載の知識ベースシステムにおいて、同知識
    ベースシステムは、更に、自然言語文を理解するための
    構文規則を記憶する第5の記憶手段と、第1の記憶手段
    と第3の記憶手段とから編集可能な語彙辞書を記憶する
    第6の記憶手段と、自然言語文を入力して第6の記憶手
    段の情報を参照して語彙解析をする語彙解析手段と、該
    語彙解析結果と第5の記憶手段に記憶されている情報と
    から可能な文章構造を生成する構文解析手段と、該構文
    解析結果から上記関係推論手段を用いて意味的に妥当な
    文章構造のみを抽出選択する手段とを有することを特徴
    とする知識ベースシステム。 3、名詞の列から成る自然言語文を入力して、該名詞列
    を構成する各名詞間の関係を、概念と関係とで記述され
    る知識ベースに記憶されている事実の集合から推論する
    ことを特徴とする自然言語理解方式。 4、自然言語文を入力して、該入力文の構文解析をして
    意味構造を出力する自然言語理解方式において、該構文
    解析は、構文規則に照らして可能な全ての文章構造を構
    文解析結果として出力し、概念と関係とで記述される知
    識ベースに記憶されている事実の集合から意味の妥当性
    を推論して、該構文解析結果の中から意味的に妥当なも
    ののみを選択出力することを特徴とする自然言語理解方
    式。
JP63002609A 1985-03-27 1988-01-11 自然言語理解方法および情報検索装置 Expired - Lifetime JP2997469B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP63002609A JP2997469B2 (ja) 1988-01-11 1988-01-11 自然言語理解方法および情報検索装置
US07/831,093 US5404506A (en) 1985-03-27 1992-02-10 Knowledge based information retrieval system
US07/947,536 US5696916A (en) 1985-03-27 1992-09-21 Information storage and retrieval system and display method therefor
US08/141,039 US5555408A (en) 1985-03-27 1993-10-25 Knowledge based information retrieval system
US08/663,840 US6182062B1 (en) 1986-03-26 1996-08-21 Knowledge based information retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63002609A JP2997469B2 (ja) 1988-01-11 1988-01-11 自然言語理解方法および情報検索装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8326482A Division JP2948159B2 (ja) 1996-12-06 1996-12-06 データベース装置

Publications (2)

Publication Number Publication Date
JPH01180046A true JPH01180046A (ja) 1989-07-18
JP2997469B2 JP2997469B2 (ja) 2000-01-11

Family

ID=11534137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63002609A Expired - Lifetime JP2997469B2 (ja) 1985-03-27 1988-01-11 自然言語理解方法および情報検索装置

Country Status (1)

Country Link
JP (1) JP2997469B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195383A (ja) * 1992-09-25 1994-07-15 Nec Corp 知識ベース構築方式
JPH06325104A (ja) * 1993-02-02 1994-11-25 Internatl Business Mach Corp <Ibm> 情報の保存及び検索のための方法及びシステム
JP2000305953A (ja) * 1999-03-31 2000-11-02 Internatl Business Mach Corp <Ibm> ファイルまたはデータベースの管理方法とシステム
US6792418B1 (en) 2000-03-29 2004-09-14 International Business Machines Corporation File or database manager systems based on a fractal hierarchical index structure
JP2007087401A (ja) * 2005-09-23 2007-04-05 Fuji Xerox Co Ltd インデクシングシステム、インデクシング方法、質問テンプレート生成システム、質問テンプレート生成方法、及びプログラム
US9390117B2 (en) 2012-05-31 2016-07-12 International Business Machines Corporation Method of transforming sets of input strings into at least one pattern expression that is string expressing sets of input strings, method of extracting transformation pattern as approximate pattern expression, and computer and computer program for the methods
JP2019526139A (ja) * 2016-06-24 2019-09-12 エレメンタル コグニション リミテッド ライアビリティ カンパニー コンピュータ学習および理解のためのアーキテクチャおよびプロセス

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5856071A (ja) * 1981-09-29 1983-04-02 Fujitsu Ltd 日本語による検索システム
JPS61220027A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd 文書ファイリングシステム及び情報記憶検索システム
JPS62205438A (ja) * 1986-03-06 1987-09-10 Sharp Corp エキスパ−トシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5856071A (ja) * 1981-09-29 1983-04-02 Fujitsu Ltd 日本語による検索システム
JPS61220027A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd 文書ファイリングシステム及び情報記憶検索システム
JPS62205438A (ja) * 1986-03-06 1987-09-10 Sharp Corp エキスパ−トシステム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195383A (ja) * 1992-09-25 1994-07-15 Nec Corp 知識ベース構築方式
JPH06325104A (ja) * 1993-02-02 1994-11-25 Internatl Business Mach Corp <Ibm> 情報の保存及び検索のための方法及びシステム
JP2000305953A (ja) * 1999-03-31 2000-11-02 Internatl Business Mach Corp <Ibm> ファイルまたはデータベースの管理方法とシステム
US6792418B1 (en) 2000-03-29 2004-09-14 International Business Machines Corporation File or database manager systems based on a fractal hierarchical index structure
JP2007087401A (ja) * 2005-09-23 2007-04-05 Fuji Xerox Co Ltd インデクシングシステム、インデクシング方法、質問テンプレート生成システム、質問テンプレート生成方法、及びプログラム
US9390117B2 (en) 2012-05-31 2016-07-12 International Business Machines Corporation Method of transforming sets of input strings into at least one pattern expression that is string expressing sets of input strings, method of extracting transformation pattern as approximate pattern expression, and computer and computer program for the methods
JP2019526139A (ja) * 2016-06-24 2019-09-12 エレメンタル コグニション リミテッド ライアビリティ カンパニー コンピュータ学習および理解のためのアーキテクチャおよびプロセス

Also Published As

Publication number Publication date
JP2997469B2 (ja) 2000-01-11

Similar Documents

Publication Publication Date Title
US6182062B1 (en) Knowledge based information retrieval system
US5404506A (en) Knowledge based information retrieval system
US5083268A (en) System and method for parsing natural language by unifying lexical features of words
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
Bontcheva et al. Evolving GATE to meet new challenges in language engineering
US5721938A (en) Method and device for parsing and analyzing natural language sentences and text
US6446081B1 (en) Data input and retrieval apparatus
US4829423A (en) Menu-based natural language understanding system
RU2509350C2 (ru) Способ семантической обработки естественного языка с использованием графического языка-посредника
US6792418B1 (en) File or database manager systems based on a fractal hierarchical index structure
JPH03278174A (ja) 異言語交信用翻訳方法およびシステム
JP2002229981A (ja) 文字列の正規化表示を生成するシステム
US20080228468A1 (en) English-Language Translation Of Exact Interpretations of Keyword Queries
Chang et al. A methodology and interactive environment for iconic language design
JP2609173B2 (ja) 用例主導型機械翻訳方法
EP0118187A1 (en) Menu-based natural language understanding system
JP2948159B2 (ja) データベース装置
JP2997469B2 (ja) 自然言語理解方法および情報検索装置
EP2184685A1 (en) Method for semantic processing of natural language using graphical interlingua
EP1041499A1 (en) File or database manager and systems based thereon
Di Buono Information extraction for ontology population tasks. An application to the Italian archaeological domain
JP4014130B2 (ja) 用語集生成装置及び用語集生成プログラム並びに用語集検索装置
JP4043176B2 (ja) 自然言語処理装置
JPH0561902A (ja) 機械翻訳システム
Legesse Accessing Databases Using Amharic Natural Language

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071029

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 9