JPH09190453A - データベース装置 - Google Patents

データベース装置

Info

Publication number
JPH09190453A
JPH09190453A JP8326482A JP32648296A JPH09190453A JP H09190453 A JPH09190453 A JP H09190453A JP 8326482 A JP8326482 A JP 8326482A JP 32648296 A JP32648296 A JP 32648296A JP H09190453 A JPH09190453 A JP H09190453A
Authority
JP
Japan
Prior art keywords
concept
knowledge
concepts
relation
word string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8326482A
Other languages
English (en)
Other versions
JP2948159B2 (ja
Inventor
Hiromichi Fujisawa
浩道 藤澤
Kon Debitsuto
デビット・コン
Atsushi Hatakeyama
敦 畠山
Itsuko Kiuchi
伊都子 木内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8326482A priority Critical patent/JP2948159B2/ja
Publication of JPH09190453A publication Critical patent/JPH09190453A/ja
Application granted granted Critical
Publication of JP2948159B2 publication Critical patent/JP2948159B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】文書構造を自動的に解析するデ−タベース装置
において、構造を解析するための知識情報ファイルのメ
ンテナンスが不要なデ−タベースを提供する。 【構成】複合名詞句を含む単語列501を入力する入力
手段502、入力された単語列を処理する処理手段、処
理結果を出力する出力手段を備える装置であって、処理
手段は、概念をノードとして表し、概念間の関係をリン
クとして表し、ノードとリンクで概念木を構成する概念
ネットワークを知識として記憶する知識ベース513
と、入力された単語列中に存在する複合名詞句の複数の
単語間の意味関係を判定するための知識情報を、概念ネ
ットワークを検索することにより抽出する解析手段を有
する装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、一般のユーザが知織・
情報の検索や登録を判り易く、かつ容易に出来るように
するための自然言語インターフェースに係る。より具体
的には、そのような自然言語インターフェースを実現す
るための自然言語理解方式と、それを用いた知識ベース
方式に関する。特に、多種多様な事物や事実を記憶し
て、自然言語から推論を働かせて検索が出来るような知
識デ−タベースの構築法に関する。
【0002】
【従来の技術】従来、自然言語を用いたヒューマンイン
ターフェースとしては、データベースのための自然言語
インターフェースが知られている。例えば、文献[ジー
・ジー・ヘンドリックス、他、"ディベロッピング・ア
・ナチュラル・ラングエッジ・インタフェース・トゥー
・コンプレックス・データ"、エーシーエム、トランザ
クション・データベース・システム、ボル3、197
8、ピーピー105−147(G. G. Hendrix et al.,
"Developing a Natural Language Interface to Compl
ex Data," ACM Trans. Database Systems, Vol. 3, 197
8, pp.105-147)]などがある。これらのシステムでは、
データベースのためのデータモデル(記憶するデータ項
目間の関係を表現する方式のこと)と、自然言語を解釈
するための文法や辞書とが独立に設定されている。すな
わち、自然言語インターフェースを既存のデータベース
に対して付加するときは、文法や辞書を改めて構築する
必要がある。或いは、対象とするデータベースが変われ
ば、自然言語インターフェースのための文法や辞書を変
更する必要があるという問題点がある。
【0003】また、従来、自然言語インターフェースが
与えられているデータベースは関係データベース(Rela
tional Database)であり、そこで用いられる検索のた
めの形式言語、例えば準標準的なSQL言語(Structure
d Query Language:ストラクチャード・クエリ・ラング
エッジ)は高次の知識の記述能力に弱い。通常、自然言
語による質問文は、このような中間言語としての形式言
語に翻訳されるため、この形式言語の表現能力にシステ
ム全体の機能が制限されてしまうという問題点がある。
特に、関係データベースは一様なデータに対しては有効
であるが、多種多様な事物を扱うヘテロジェネオス・デ
ータベース(heterogeneous database)や、オブジェク
ト指向のデータベースに対しては、充分適しているとは
言えない。例えば、曖昧なユーザの記憶から事物を記述
して、その記述からそれに関する情報を検索することに
は適していない。
【0004】更に、これらのシステムでは、データ(新
しい知識・情報)の入力は自然言語以外の方法を用いて
おり、専門家が行っている。従って、エンドユーザが直
接入力・登録することが難しいという問題点がある。
【0005】
【発明が解決しようとする課題】本発明の解決しようと
する課題は、データベースや知識ベースにおいて、以上
のような問題点を解決し、エンドユーザが曖昧、または
断片的な記憶からでも自然言語による記述から欲しい情
報を検索可能とすることにある。更に、新しい情報や知
識の登録もユーザ自身により同様に自然言語を用いて行
えるようにすることにある。
【0006】
【課題を解決するための手段】本発明は、かかる課題を
達成するために、知識ベースと自然言語インターフェー
スとに共通の知識表現基盤を与え、それにより自然言語
による知織・情報の検索と登録とを容易に実現可能とす
るものである。
【0007】具体的には、本発明は、知識ベースの構成
法として、「概念」と「関係」とで事物の体系と事実を
表現する「概念関係モデル」と呼ぶ知識表現方式(デー
タベースにおけるデータモデルに対応する)を与え、更
に、同知識ベースの中に言語的知識をも記憶させる方式
を提供する。ここで、「概念」とは、事物や事象、或い
は抽象的な概念を表わす計算機内のデータ項目であり、
「関係」とは、同概念間に定義するデータ項目である。
概念はノード(節)で表わし、関係はリンク(辺)で表
わす。概念関係モデルで表された知識は、従って、概念
のネットワークを構成する。ここでは、これを概念ネッ
トワークと称する。
【0008】すなわち、本発明による知識ベースでは、
本来記憶したい知識とそれを言語的に表現するための知
識とを一体として概念ネットワークに格納し、自然言語
インターフェースは同知識を共用するようにすることが
特徴である。従って、原則として、自然言語インターフ
ェースのために改めて辞書などを構築する必要が無い。
【0009】また、本発明は、知識ベースに記憶されて
いる事実などから推論を働かせて、自然言語で表わされ
た質問文の意味解釈を行う自然言語理解方式を提供す
る。特に、通常、我々が良く用いる複数の名詞の列から
なる複合名詞句の意味解釈方式を与える。複合名詞句を
意味解釈するためには、名詞間の関係をシステムが推論
する必要があるが、本発明では、知識ベース内に記憶さ
れている概念と関係のみを推論する方式を与える。
【0010】更に、本発明による知滴表現方式は、複数
の言語に適用することが容易になるように、言語に依存
する部分を限定している。更には、複数の言語による表
現の共存も可能にしている。従って、同一知識ベースに
おいて、例えば、英語と日本語で検索したり、登録した
りすることを可能とする手段を提供する。
【0011】なお、単語間の意味関係を概念ネットワー
クを用いて表現し自然言語処理に利用する技術自体に関
しては、特開昭61−220027号公報がある。しか
し、本願発明は、検索対象のデ−タを概念ネットワーク
を用いて記憶するとともに、自然言語を解釈するための
知識情報も同じ概念ネットワークから抽出することを示
す。よって、デ−タの増大にともなって知識情報の量も
自動的に増大する。
【0012】これにより、別個に解釈用の知識ファイル
を設けた場合における、デ−タベースとは別に行なわな
ければならない知識ファイルのメンテナンスの問題を解
消することができる。
【0013】
【作用】以下、本発明方式の原理を説明する。
【0014】まず、基本となる概念関係モデルによる知
識表現方式を説明する。図2に概念ネットワークの一部
を説明のために示す。同図において、楕円は概念(ノー
ド)を表わし、矢印は関係(リンク)を表わす。ノード
201、"UNIVERSAL" は知識ベース内の全て
を代表するルートノード(根)である。各ノードには一
つ以上の文字列を概念の名称として定義できる。例え
ば、同義語や外国語を付加することができる。
【0015】一方、ノードとノードを結ぶリンクには、
属性が継承される概念間に定義される包摂関係(IS−
Aリンク202)、概念間に一般的に定義される「一般
関係」(ノード203)、および同一般関係の具体的事
例としての「具体関係」(リンク204)がある。包摂
関係は物のクラス(分類)を表わす。従って、概念と包
摂関係からなる概念ネットワークは、分類階層(taxonom
ic hierarchy)を表わす概念木を構成する。
【0016】例えば、図2の概念ネットワークの内、概
念木は次のような知識を表わしている。
【0017】 (PAPER-MATERIAL (is-a THING)) (BOOK (is-a PAPER-MATERIAL)) (BOOK#0051 (is-a BOOK)) (LIVING-THING (is-a THING)) (PERSON (is-a LIVING-THING)) (NEWTON (is-a PERSON)) ここで、これらフレーム表現と呼ばれる。ここでは、L
ISP言語で使うS式表現(Symbolic expression)で
表わしている。これらは普通の英語でも表わすことが可
能であり、 Paper material is a thing. Book is a paper material. などと書ける。日本語では、 「書物は物である。」 「本は書物である。」 「人は生物である。」 などとなる。
【0018】一般関係の例は、図2において、概念21
1(BOOK)と概念212(PERSON)との間に
定義される関係203である。これは「本」と「人」と
の間には「著者」または「著作」という関係が有り得る
ことを表わしている。この一般関係は、 (BOOK (is-written-by PERSON)) (PERSON (has-written BOOK)) または、 「本を書いた人」 「人が書いた本」 のように、右方向、或いは左方向へ双方向に読むことが
出来る。
【0019】具体関係は、図2において、破線のリンク
204で示されるような関係であり、ある一般関係の一
つの具体的(データベースでは実現値とも言う)を示
す。例えば、図2では、「著者」という一般関係203
の具体例として、概念213と概念214との間に具体
関係204が定義されている。フレーム表現で書くと、 となる。自然言語では、 BOOK#0051 is a book which is written by NEWTON. NEWTON is a person who has written BOOK#0051. 「BOOK#0051はNEWTONが書いた本であ
る。」 「NEWTONはBOOK#0051を書いた人であ
る。」 のように表わすことが出来る。
【0020】さて、以上のような知識は、本発明方式で
は以下のようなデータ構造で記憶する。まず、概念とそ
の名称は概念名称テーブル221(図3)で記憶する。
同テーブル221は、三つのカラム222、223、2
24から成っている。カラム222は概念の固有番号C
#であり、カラム223にその名称CNAMEを定義で
きる。同名称の言言LANGはカラム224で規定す
る。例えば、LANGの値が "J" のときは同名称は日
本語、 "E" のときは英語である。
【0021】また、概念名称は、同一言語に対して複数
個、定義することが出来る。そのために、カラム223
はデータ構造としてデータの繰返しを許している。例え
ば、概念C#0004の名称は「本」および "BOO
K" であるが、これに対して、概念名称「書籍」を追加
定義することも出来る。
【0022】次に、概念の包摂関係は、図4に示す包摂
関係テーブル231で表わす。カラム232とカラム2
33は、各々概念固有番号C#およびCS#であり、概
念C#の上位概念(Superconcept)は概念SC#である
ことを表わす。例えば、テーブル231の第2レコード
は、概念C#0002(「書物)」の上位概念は概念C
#0001(「事物」」であることを表わす。各概念に
定義される属性などの「関係」は、包摂関係のリンクを
通じて上位から下位へ継承される。ここで、一つの概念
に対して複数の上位概念を定義することが可能である。
従って、属性の多重継承が実現される。
【0023】包摂関係以外の概念間の多種多様な関係
は、図5で示す一般関係定義テーブル241に定義する
ことが出来る。個々の一般関係は各々、関係の種類を表
わす。基本的には、そのような関係の種類の数に制限は
無く、任意の数の一般関係を定義することが可能であ
る。
【0024】一般関係定義テーブル241は、主に「関
係」を自然言語で表現したときの「読み」を定義する。
カラム244は同関係を左から右へ読んだときの「読
み」LRであり、カラム245はその逆に右から左への
「読み」RLを定義する。これらのカラムは、データ構
造として繰返しを許容し、複数の読みを定義することが
出来る。また、これらは概念名称テーブルと同様にカラ
ム246によって読みの言語を指定することが出来る。
従って、複数の言語によって表現することが可能であ
る。
【0025】図5の例では、関係 "AUTHORSHIP" は、 PERSON who is author of BOOK PERSON who is the author of BOOK PERSON who wrote BOOK PERSON who has written BOOK 或いは、 BOOK whose author is PERSON BOOK by PERSON BOOK from PERSON BOOK of PERSON と自然言語(この場合は英語)で表現できる。日本語の
場合も同様である(省略)。
【0026】概念間の関係の存在は、図6に示す関係テ
ーブル251によって記憶する。これまでに説明したよ
うに、関係リンクには一般関係と具体関係とがあり、そ
れらはテーブル251のカラム256によって区別す
る。カラムCLASSの値がGRのときは一般関係、I
NSTのときは具体関係を表わす。図6の例では、第1
レコードは図2の一般関係203を表わし、第2レコー
ドは図2の具体関係204を表わす。また、カラムC#
Lは左側の概念を、カラムC#Rは右側の概念を規定す
る。ここで、ある概念を右に置くか左に置くかは、定義
次第であり、テーブル241とテーブル251とで矛盾
が無い限り、どちらに定義しても良い。
【0027】さて、次に、以上の知識表現方式を基礎と
する自然言語理解方式の原理を説明する。
【0028】まず、オブジェクト指向の知識ベースで最
も重要な複合名詞句の意味理解方式を説明する。ここ
で、複合名詞句とは一部形容詞を含んだ複数の名詞の列
からなる名詞句である。例えば、以下は複合名詞句の例
である。
【0029】 supercomputer article (1) ElectronicsWeek article (2) Japanese personal computer company (3) American personal computer software packages (4) ここで、意味を理解することは、各形容詞および名詞の
間の関係を陽に求めることである。
【0030】例えば、複合名詞句(1)と(2)は同じ
構造をしているが、意味は異なり、次のように解釈され
るべきである。(1)は、"article whose subject is
supercomputer" のことであり、(2)は、"article wh
ich is part of ElectronicsWeek" を意味する。すなわ
ち、(1)では、articleとsupercomputerとが関係subj
ect-isで結ばれていること、(2)では、articleとEle
ctronicsWeekが関係is-part-ofで結ばれていることを推
論する必要がある。フレーム形式が記述すると、次のよ
うな構造を自動的に抽出することが意味を理解すること
である。
【0031】 (ARTICLE (subject-is SUPERCOMPUTER)) (5) (ARTICLE (is part-of ElectronicsWeek)) (6) 本発明による自然言語理解方式では、図7に示すような
知識に基づいて、以下のように意味を解釈する。まず、
この推論を可能とする知識としては、一般関係として、
関係RS#0011: (ARTICLE (subject-is UNIVERSAL)) (7a) (UNIVERSAL (is subject-of ARTICLE)) (7b) と、関係RS#0012: (ARTICLE (is-part-of JOURNAL)) (8a) (JOURNAL (has-part-of ARTICLE)) (8b) が定義されている必要がある。すなわち、「記事の主題
には何でも成り得ること」、「記事は雑誌の一部である
こと(記事は雑誌の一部に掲載されるものであるこ
と)」が知識として記憶されている必要がある。
【0032】また、包摂関係としては、 (SUPERCOMPUTER (is-a THING)) (9) (THING (is-a UNIVERSAL)) (10) (ElectronicsWeek (is-a JOURNAL)) (11) が記憶されている必要がある。
【0033】これにより、"supercomputer article" を
解釈することが出来る。まず、SUPERCOMPUTERから包摂
関係を上位に辿って、 (SUPERCOMPUTER (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)) であることが分かる。その結果、属性継承により、 (SUPERCOMPUTER (is-subject-of ARTICLE)) 或いは、 (ARTICLE (subject-is SUPERCOMPUTER)) という関係が有り得ることが推論される。すなわち、
「スーパーコンピュータは記事の主題に成り得ること」
が選出される。この場合は、これ以外の解釈は無いの
で、解釈: "article whose subject is supercomputer" 「スーパーコンピュータと主題とする記事」 が採用される。
【0034】複合名詞句(2)の意味解釈は少し複雑で
ある。この場合、図7から分かるように、 (ElectonicsWeek (is-a JOURNAL)) (JOURNAL (has-part-of ARTICLE)) であると同時に、 (ElectronicsWeek (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)) であるので、 (ElectronicsWeek (has−par
t−of ARTICLE)) と、 (ElectronicsWeek (is−subj
ect−of ARTICLE)) の二つの関係が有り得ることが推論される。すなわち、 "article which is part of ElectronicsWeek" と "article whose subject is ElectronicsWeek" の二つの解釈が有る得ることが分かる。
【0035】このように複数の解釈の候補が存在する場
合は、本発明方式では、どの解釈が数多くの具体的事例
を持つかで、解釈の尤もらしさを評価するという発見的
手法を用いる。
【0036】具体的には、先の例では、概念 "ARTICLE"
と概念 "ElectronicsWeek" の自分も含めた下位の概念
を探索して、関係RS#0011と関係RS#0012
の具体関係が、それぞれ幾つ登録されているかを計数す
る。図7の例では、前者は0、後者は一つ具体関係が登
録されている。すなわち、 "ElectronicsWeek" を主題
とした記事はないが、 "ElectronicsWeek" に掲載され
ている記事は一件、ARTICLE#0101がある。従って、関係
RS#0012(is-part-of)がより適切な解釈として
選択される。すなわち、"article which is part of El
ectronicsWeek" と解釈される。□以上に説明したよう
に、複合名詞句の解釈では、2語の名詞間の関係の推論
処理が基本となる。すなわち、以下説明する三つ以上の
単語から成る複合名詞句の解釈の基本処理は、上記2語
間の関係抽出である。以下、複合名詞句(3)を例に取
って説明する。
【0037】まず、複合名詞句を構成する単語の中に複
合語から成る概念名称があるかどうかを調べながら、各
単語に対応する概念を選び出す。すなわち、先頭から順
次単語を切り取って、概念名称テーブルを参照して、登
録されているかどうかを調べる。
【0038】複合名詞句(3)の場合は、 のように、複合名詞句から部分単語列を切り出して、そ
れぞれが概念名称であるかどうかを調べて行く。
【0039】ここで、本方式では、形容詞は対応する名
詞形を名称とする概念の同義語として登録されており、
形容詞は同概念として扱われる点が一つの特徴である。
例えば、形容詞 "Japanese" は概念 "JAPAN"(日本
国)、或いは概念 "Japanese people"(日本人)の同義
語として登録されていて、同概念として扱われる。
【0040】従って、この処理の結果、"personal comp
uter" が一つの概念名称、"PERSONAL-COMPUTER" として
定義されていたとすると、複合名詞句(3)はまず、 (JAPAN PERSONAL-COMPUTER COMPANY) (JAPANESE-PEOPLE PERSONAL-COMPUTER COMPANY) として認知される。但し、以下の説明では、判り易くす
るため、最終的には意味のない解釈であることが分かる
後者は省いて説明する。
【0041】すなわち、この段階で、同複合名詞句は実
質的に三つの概念の組合せであることが分かったことに
なる。これは括弧( )を用いて次のようにも表現でき
る。
【0042】 (Japanese (personal computer) company) (12) 従って、次の処理は、これら3つの概念がどのように相
互に関連付けられているかを調べることである。この場
合、次の二つの可能性があることが分かる。
【0043】 (Japanese ((personal computer) company)) (13) ((Japanese (personal computer))company) (14) まず、(13)の場合、COMPANYとPERSONAL-COMPUTER、およ
びCOMPANYとJAPANの間に結ばれ得る二つの関係を推論す
る必要がある。この場合、先に説明した関係の推論方式
により、 (COMPANY (produces PERSONAL-COMPUTER) (is-located-in JAPAN)) (15a) (COMPANY (has-developed PERSONAL-COMUTER) (is-located-in JAPAN) (15b) なる関係が抽出される。ここでは、複数の解釈の優先度
(尤度:尤もらしさ)を評価するために、COMPANYとPER
SONAL-COMPUTER、およびCOMPANYとJAPANの二つの関係の
具体例(下位の概念に定義されている具体関係)の総数
を、それぞれの解釈(15a)、(15b)に対して計数し、これ
を関係の重みとする。全体の評価としては、具体関係の
総数(関係の重み)を一般関係の数で割って、正規化す
る。(15a)、(15b)の例では、一般関係の数は2である。
【0044】次に、第二の可能性である(14)について関
数を抽出する。この場合、COMPANYとPERSONAL-CPMPUTE
R、およびPERSONAL-COMPUTERとJAPANの二つの関係を求
める必要がある。前者については、 (COMPANY (produces PERSONAL-COMPUTER)) (16a) (COMPANY (has-developed PERSONAL-COMPUTER)) (16b) のような、二つの関係が(想定する知識ベースにおい
て)見つかる。同様に、後者については、 (PERSONAL-COMPUTER (is-produced-by (COMPANY (is Located-in JAPAN))) (17a) (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN))) (17b) が見つかる。伺し、ここで、PERSONAL-COMPUTERとJAPAN
とを直接結ぶ関係は無いので、これらを間接的に関係付
ける概念COMPANYを自動的に見出している。
【0045】本発明方式は、このように直接結び付ける
関係が見つからないときは、関係を見出すべきこれら二
つの概念の上位を各々遡って、それら上位概念に定義さ
れる全ての一般関係(の集合)を抽出する。二つの概念
について行うので、二つの一般関係の集合が得られるこ
とになる。これは三つのテーブル231、241、25
1を検索することによって抽出できる。次に、抽出され
た一般関係の相手方に結ばれている概念をそれぞれリス
トアップする。これにより、二つの概念集合が得られる
が、これらの積集合を求めることにより、最終的に二つ
の概念を仲介する概念、先の例では概念COMPANYが得ら
れる。
【0046】結局、意味の無い組合せを捨てて、以下の
二つの解釈を得る。
【0047】 (COMPANY (produces (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN)))))) (18a) (COMPANY (has-developed (PERSONAL-COMPUTER (is-produced-by (COMPANY (is-located-in JAPAN)))))) (18b) 最終的には、以下の合計4つの解釈が自動的に得られる
ことになる。
【0048】 "company which produces personal computer which is located in Japan" (19a) "company which has developed personal computer which is located in Japan" (19b) "company which produces personal computer which was developed by company which is located in Japan" (19c) "company which has developed personal computer which is produced by company" (19d) なお、上記の英語の表現において、関係代名詞の掛り受
け関係はインデンテーションによって示した。レベルが
深くなっている場合は、直上の行の名詞を修飾してい
る。
【0049】複合名詞句(4)についても同様に処理さ
れる。各単語を概念名称とマッチングすることにより、 (USA PERSONAL-COMPUTER SOFTWARE-PACKAGE) のような三つの概念から成ることが、まず分かる。これ
ら概念間の関係を推論することにより、以下の解釈が得
られる。
【0050】 "software package which runs on personal computer which was developed by company which is located in USA" (20) さて、本発明による自然言語理解方式は、複合名詞句の
意味解釈機能の上に、文解釈部(構文解析部)を置くこ
とにより、より強力な名詞句解釈機能を可能とすると同
時に、知識ベースとの自然言語による広範な対話を実現
している。同文解釈部は構文規則を用いるが、リスト1
は同構文規則の一例を示す。一つの構文規則は、非終端
記号(ノンターミナルシンボル;ここでは、鉤括弧<>
で囲んだ記号)で構成される左辺と、その展開形である
右辺、およびその展開が成功したときに評価されるべき
関数の三つの部分から成る(例えば、(21a)式)。伺
し、リスト1では解析が成功したときの評価関数は省略
して示している。各規則の右辺は、終端記号(ターミナ
ルシンボル)と非終端記号から成る列で構成される。こ
こで、記号 "|" は並置を示す。また、非終端記号 <s>
は文章全体を表わす。
【0051】 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− リスト1: <s> :;= <system-command> | (21a) <define-command> | (21b) <search-command> | (21c) <browse-command> (21d) <system-command> ;:= load from <?> | save to <?> | update | quit | stop | <show-word> chart | edit <?> <show-word> ;:= show | print <search-command> ;:= <find-word><noun-phrase> (22) <find-word> ;:= look up | look for | search for | lookup | find (23) <noun-phrase> ;:= <noun-group> | (24a) <noun-phrase><joiner><noun-phrase> (24b) <noun-group> ;:= <noun-compound> | (25a) <art><noun-compound> | (25b) <def-art><noun-compound> (25c) <noun-compound> ;:= <noun-string> (26) <noun-string> ;:= <concept> | (27a) <concept><noun-string> (27b) <joiner> ;:= <prep> | <rel-pronoun><link> (28) <define-command> ;:= define relation <new-phrase> . | (29a) define <?> as <noun-phrase> . | (29b) <noun-phrase> is <noun-phrase> . | (29c) <noun-phrase><link><noun-phrase> . | (29d) <noun-group> is also known as <?> . (29e) <new-phrase> ;:= <noun-compound><?><noun-compound> (30) <?> ;:= <null> | <null><?> (31) −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 文解釈部はボトムアップ処理による語彙解析部と、トッ
プダウン処理による構文解析部とから成る。本方式にお
ける構文解析部は、構文規則に合致する全ての文構造を
候補として出力する。そこから、意味のある解釈(単語
間の掛り受け関係)のみを先に説明した複合名詞句解析
により評価、選択する。
【0052】ボトムアップ処理である語彙解析(lexica
l analysis)は、概念名称、関係記述子、前置詞、関係
代名詞、冠詞の区別が記述されている語彙辞書(lexico
n)を用いて行われる。
【0053】同語彙辞書は、先に説明した知識表現方式
による概念ネットワークから編集処理により自動的に構
築することが可能である。具体的には、概念名称はテー
ブル221(図3)から抽出される。語彙解析の結果、
概念名称とマッチングした入力文中の単語は、<concept
> という非終端記号として認識される。
【0054】関係記述子とは、同知識表現方式における
「関係」、または、その「読み」のことであり、例え
ば、"is author of","wrote","has written","autho
r is"などである。これらは、一般関係定義テーブル2
41(図5)から抽出される。これらにマッチングした
入力文中の単語、または単語列は非終端記号 <link> と
して認織される。
【0055】前置詞は"by","from","of"などであり、
その意味(それが表わす関係の種類)は一般関係定義テ
ーブル241(図5)から自動的に抽出される。これら
前置詞は非終端記号 <prep> として認識される。ここ
で、関係記述子および前置詞として認織された場合に
は、上記非終端記号とともに、それらが意味する「関
係」の種類とその方向を語彙解析結果として出力する。
これにより、後述するように、"book by Newton"のよう
な名詞句の意味解釈が可能となる(構文規則(24b),
(28)を参照)。
【0056】同語彙辞書には、更に、関係代名詞 <rel
- pronoun> (which, who, that)、不定冠詞 <art> (a,
an)、定冠詞 <def-art> (the) が記憶されている。ま
た、語彙解析で認識できなかった単語は非終端記号 <nu
ll> として認識される。
【0057】構文解析は、このボトムアップ前処理とし
ての語彙解析をもとに行われる。図8を用いて構文解析
方法を説明する。同図において、入力文として、三つの
単語401、402、403が解析される。上部から下
部へ流れる矢印(例えば、矢印411)はボトムアップ
処理を、下部から上部へ流れる矢印(例えば、矢印41
2)はトップダウン処理を表わす。
【0058】語彙解析の結果として、単語401(pers
onal)にはマッチングする概念がないこと、単語402
(computer)の解釈としては二つの概念「計算機」およ
び「雑誌コンピュータ」が有り得ること、単語列401
−402(personal computer)は概念「パーソナルコ
ンピュータ」にマッチングすること、単語403(comp
any)は概念「会社」にマッチングすることが出力され
る。
【0059】構文解析部は、これらの結果を受けて、例
えばリスト1に示す構文規則を参照して、文全体を展開
していく。図8は、その途中からのみを示しているが、
同図において、<noun-phrase> 421は(25a)式によ
り <noun-compound> 422へ、更に、(26)式により <
noun-string> 423へ展開される。更に、<noun-strin
g> は(27b)式により <concept> 426と <noun-stri
g> 427とに展開される。後者の <noun-string> は(2
7a)式により <concept> 428に展開される。結局、図
8の例では、入力文(名詞句)の解釈は、(personal c
omputer)と(company)の二つの概念(<concept>)と
から構成される複合名詞句(noun compound)が有り得
ることが分かる。
【0060】なお、ここで図8以降図11まででは、図
面を簡単にするために、リスト1で示す記号は、次のよ
うに簡略化している。すなわち、<noun-phrase>, <noun
-group>, <noun-compound>, <noun-string>, <joiner>,
<rel-pronoun>, <find-word> は、それぞれ <n-phrase
>, <n-group>, <n-comp>, <n-string>, <join>, <rpron
>, <find> と表記している。
【0061】本構文解析では、構文的に可能な文構造を
全て抽出する。そのような構文解析アルゴリズムとして
は、例えばチャートバーザ[文献:エイチ・トンプソ
ン、エトアル、"インプリメンティング" ナチュラル・
ラングエッジ・バーザーズ"、アーティフィシャル・イ
ンテリジェンス:トゥール、テクニーク、アンド アプ
リケーションズ、エディティッド バイ テー・オシア
アンド エム・アイゼンシュタト、ハーパ・アンド・
ロー、ニューヨーク、1984、ピーピー、245−3
00:Thompson, H. et al., "Implementing Natural L
anguage Parsers, "in Artificial Intelligence: Tool
s, Techniques, and Applications, editedby T. O'She
a and M. Eisenstat, Harper and Row, New York, NY,
1984, pp.245-300]が知られている。
【0062】抽出された全構文候補は、各々構文規則に
記されている評価式により評価される。本発明の特徴
は、この評価に知識ベースに記憶されている知識を用い
る点にある。図8の例の場合では、概念 "personal com
puter" と概念 "company" から意味のある複合名詞句が
構成され得るかを評価する。この評価方法は、先に説明
した概念ネットワークに登録されている知識を用いる方
式を用いる。この結果、意味のある構文解析結果が尤度
の順に得られることになる。
【0063】図9以降は検索文全体に対する構文解析結
果を示す。検索文は、構文規則(21c),(22)を用い
て、命令語と名詞句とに展開される。図9は、図8の名
詞句を含む例である。図10は、関係代名詞を含む名詞
句を含む検索文の分析の例である。ここでは、図5で示
した概念関係モデルの「関係」の「読み」が関係代名詞
句の述語として機能しているのが分かる。更に、図11
は、前置詞を含む検索文の例である。ここで、前置詞o
nは関係「主題」("whose subject is")を、前置詞a
tは関係「所属」("who works at")を意味しているこ
とが、既に説明したように、図5で示した一般関係定義
テーブルに記されている。
【0064】以上、説明した原理により、知識ベースと
最小限の構文規則により、陽に関係が記述されていない
名詞の列(複合名詞句)を含む自然言語文を意味解析す
ることが可能である。
【0065】
【実施例】
(実施例1)以下、本発明の一実施例を説明する。図1
4は、本発明の一実施例である知識ベースシステムのハ
ードウェア構成のブロック図である。
【0066】同システムは、同図において、主に中央制
御装置(CPU)101、主メモリユニット(MMU)
102、ワークメモリユニット(WMU)103、シス
テムファイルとユーザファイルとを持つ統合ディスクユ
ニット121、122、プリンタ131、ローカル・エ
リア・ネットワーク(LAN)に接続するための通信制
御装置(CCU)141およびユーザとの対話のための
表示装置(CRT)151、キーボード152、マウス
153から成る。
【0067】統合ディスクユニットは磁気ディスクと光
ディスクとから成り、例えば本実施例の場合は、第1の
ディスクユニット(DKU1)121は磁気ディスクで
構成されていて、高速性が要求される情報を記憶する。
一方、第2のディスクユニット(DKU2)122は光
ディスクで構成され、特に大容量の情報を記憶する。
【0068】システムファイルには、オペレーティング
システム、通信管理プログラム、ファイル管理プログラ
ム、知識ベース管理プログラム、或いは統合オフィス業
務支援システムといったシステムが提供するプログラム
群、およびそれに必要なデータベースなどのファイル群
が格納されている。一方、ユーザファイルには、個人化
されたシステム提供のプログラムやユーザが作成したプ
ログラムなどのアプリケーションプログラム群と、それ
に必要なデータベースなどのファイル群、およびユーザ
などが作成した統合知識ベース(後述)が格納されてい
る。
【0069】システムの動作は、主メモリユニットにロ
ードされたプログラムの制御に従って、必要なデータを
主メモリユニットおよびファイルにアクセスして行われ
る。同時に、ユーザは表示装置151に表示される情報
を見ながら、入力手段152、153を用いてシステム
と対話することが可能である。
【0070】本発明の知識ベースシステムのソフトウェ
ア部分は、概念ネットワークエディタ、概念ネットワー
クブラウザ、自然言語文解釈プログラム、マルチメディ
アファイル管理プログラムとから成るプログラム群と、
それらが用いる情報を統合した統合知識ベースとから成
る。以下、それぞれについて順次説明する。
【0071】まず、概念ネットワークエディタは、既に
説明した概念関係モデルに基づいて、オブジェクト指向
の知識ベースの編集、検索、管理を行う。知識・情報
は、図3から図6までに示した概念名称テーブル、包摂
関係テーブル、一般関係定義テーブル、および関係テー
ブルによって記憶、管理する。これらに記憶されている
データを、ここでは概念ネットワークという。
【0072】概念ネットワークエディタは、所定の仕様
に基づくコマンド言語(形式言語)によって、以下のの
機能を提供する。
【0073】(1)概念の登録:概念名称と分類階層位
置を指定して、新概念を登録。
【0074】(2)一般関係の登録:二つの概念と関係
の言語的表現法を指定して、新しい関係の種類を登録。
【0075】(3)具体関係の登録:二つの概念と関係
の種類を指定して、事実、関係、属性などを登録。
【0076】(4)概念名称の編集:名称の修正;同義
語・別名の削除・追加。
【0077】(5)一般関係の編集:関係付けられてい
る二つの概念の変更;言語的表現法の修正と追加。
【0078】(6)概念の削除 (7)具体関係の削除 (8)階層分類体系の変更 (9)上位概念の追加:二重(或いはそれ以上)に同一
概念を分類;属性等の多重継承の付与。
【0079】(10)構造化概念の登録・削除:概念を概
念によって修飾した抽象的概念(後述)の登録および削
除。
【0080】(11)語彙辞書の更新:概念ネットワーク
から語彙解析に必要な情報を語彙辞書に追加・編集。□ (12)概念の検索:部分文字列、キーワード、構造化概
念からの検索。
【0081】(13)ネットワーク踐渉:分類階層木、お
よび連想による注目概念の移動。
【0082】(14)マルチメディア情報の付加・削除:
任意の概念にマルチメディアファイル内の情報を連想的
に付加、或いは削除。
【0083】(15)マルチメディア情報の読出し:概念
に付加されているマルチメディア情報のマルチメディア
ファイルからの読出し。
【0084】ここで、上記機能における構造化概念につ
いて説明する。構造化概念とは、ある概念を別の概念と
関係とによって、修飾した(意味を限定した)抽象的な
概念であり、概念ネットワークとは別の記憶手段に格納
する。具体的には、これまでにも例で示してきた複合名
詞句がそれに当たる。例えば、構造化概念D#0011を として、登録できる。より具体的には、下記の内部デー
タ構造、 のように、固有番号で記憶する。ここで、第1要素は構
造化概念固有番号、第2要素は構造化概念名称、第3要
素は構造化概念定義式である。但し、上記記法の例でC#
0401は概念 "article"、C#0501は概念 "supercompute
r"、RS#0033は関係「主題」(subject)の固有番号であ
る。
【0085】この構造化概念は、抽象的な、或いは記述
的な記憶から情報を検索する際に用いる。本システム
は、構造化概念から、推論処理を用いて具体的な概念を
概念ネットワークから検索する機能を有する。上記の例
では、概念 "article" に包摂される具体的概念(概念
"article" の下位概念)の集合の中から、主題が概念"
supercomputer" に包摂される概念であるもののみ抽出
することが可能である。この処理を概念マッチングとい
うが、これは逆向きの推論処理によって実現される。
【0086】このように、構造化概念を記憶する手段
と、それからの検索手段を与えることによって、ユーザ
は随意に自分のものの見方をシステムに登録し、更に、
欲しい概念を容易に検索することが可能である。
【0087】概念ネットワークエディタの機能におい
て、マルチメディア情報機能を更に説明する。マルチメ
ディアファイルには、例えばイメージスキャナによって
入力した写真を登録・蓄積することが出来る。概念ネッ
トワークエディタには、同写真をある概念に連想的に付
加する機能がある。具体的には、概念固有番号とマルチ
メディアファイルメンバ名称との対応表を作成し、管理
することにより実現する。ユーザは同概念を検索した後
で、その写真を表示させることが可能である。マルチメ
ディアファイルには、写真のほかにも、文書イメージ
や、音声情報等を記録することが可能である。
【0088】本概念ネットワークエディタの構成法とし
ては、発明「情報記憶方式」(特願昭60−6067
8)で開示している方法を用いることが出来るので、こ
こでは説明を省略する。
【0089】さて、次に概念ネットワークプラウザを説
明する。概念ネットワークプラウザとは、概念ネットワ
ークエディタのためのビジュアルインターフェース(視
覚形インターフェース)であり、マルチウィンドウとマ
ウスを用いた直接操作方式と採用することによって操作
性向上を図っている。同プラウザは知識ベースの内容を
概念階層木、フレーム形式、或いはテーブル形式、更に
は自然言語形式で、任意のウィンドウ内に表示すること
が出来る。また、その表示上のオブジェクト(概念と関
係)を例えばマウスで直接指示して、更に、メニューの
中から命令を選択指示することにより、先の概念ネット
ワークエディタの任意の機能を呼び出して、実行するこ
とが出来る。概念ネットワークプラウザは、ユーザのこ
のような直接的指示を形式言語であるコマンド言語に翻
訳して概念ネットワークエディタを起動する。
【0090】次に、自然言語文解釈プログラムを機能ブ
ロック図、図1を参照しながら説明する。本発明の主な
る特徴の一つは、本自然言語文解釈方式にあり、その原
理については、先に説明した。同自然言語文解釈プログ
ラムは、構成としては、ユーザからの単語列501を入
力するための入力部502、同単語列の各単語の属性を
解析する語彙解析部503、構文規則を記憶した文法フ
ァイル514を参照しながら構文を解析する構文解析部
504、および、複合名詞解析部506とから成ってい
る。動作としては、本自然言語文解釈プログラムは概念
ネットワークプラウザから自然言語文501を受け取
り、解釈結果505を同概念ネットワークプラウザに返
す。
【0091】本実施例では、語彙解析部は、構造化概念
ファイル511、語彙辞書ファイル512、および概念
ネットワーク形知識ベース513の概念名称テーブル5
22を参照して解析を実行する。ここで、構造化概念フ
ァイル511は、先述したように、構造化概念固有番
号、構造化概念名称、構造化概念定義式の3組の集合を
記憶する。また、語彙辞書512は図12で示す前置詞
テーブル601、および図13で示す関係記述子テーブ
ル611で構成される。別な実施例として、高速化処理
のため、語彙辞書に概念名称テーブルも含める構成も有
り得る。
【0092】前置詞テーブル601は、各前置詞に対
し、同前置詞が表わす一般関係の固有番号を、同関係の
方向別に記憶する。図12の例でいうと、前置詞at
は、一般関係RS#0123を左から右に読んだ場合
や、RS#0209を右から左に読んだ場合等の「関
係」を表わす。また、関係記述子テーブル611は、各
関係記述子に対し、その一般関係固有番号とその方向性
を記憶する。これらの二つのテーブルは、これまでの説
明から容易に理解できるように、全ての有り得る前置詞
を別途記憶しておくことにより、図5で示した一般概念
定義テーブルから自動的に構築したり、更新したりでき
る。この機能は、図1における語彙辞書編集部507に
より提供され、実際には、概念ネットワークエディタの
機能の一部である。
【0093】ここで語彙解析部の機能の説明を一部補足
する。発明の原理の説明では、理解を助けるため構造化
概念については述べなかったが、語彙解析部では、構造
化概念名称にマッチングした単語および単語列は、非終
端記号 <concept> として認識すると同時に、構造化概
念の場合には、構造化概念定義式を評価値として出力す
る。
【0094】この目的のため、語彙解析部は、入力単語
列から原理説明のように部分単語列を順次取り出して、
各部分単語列が通常の概念名称のみならず、構造化概念
名称についてもマッチング(一致)するかどうかを調べ
る。その結果、それら何れかにマッチングする場合は、
非終端記号として <concept> を認識結果とし、更に、
通常の概念名称にマッチングした場合は同概念の固有番
号を評価値とし、構造化概念名称にマッチングした場合
は同構造化概念の定義式を評価値とする。
【0095】更に、語彙解析の結果、前置詞および関係
記述子として認識された場合には、それぞれ対応する非
終端記号を認識結果とすると同時に、対応する全ての
「関係」を評価値とする。これら評価値は、認識結果で
ある非終端記号に付随して、語彙解析結果として出力さ
れる。
【0096】構造解析部504は、原理説明で述べたよ
うに、語彙解析結果を入力として、文法ファイル514
の構文規則を参照しながら可能な全ての文構造をまず生
成する。構文規則に照らして可能な文構造を生成するこ
と(狭義の)のパージングという。このパージング段階
では、意味的な適合性は勘案していない。次に、構文解
析部504は意味的な適合性の分析と、複合名詞句の意
味解析を複合名詞解析部506に行わせる。これによ
り、候補として生成された文構造の集合から、意味的に
適合するものが尤度の順に選択されることになる。
【0097】構文解析の結果として、意味的に特に重要
な要素は名詞句 <noun-phrase> であるので、 主に名詞
句の構文解析について、図9から図11の例を用いてよ
り具体的に説明する。
【0098】まず、図9の場合において、名詞句: "personal computer companies" は、パージングの結果、下記に示す構造として解析され
る。
【0099】 (<noun-phrase> D#1009 "personal computer companies" ((<concept> (C#1001 "personal computer")) (<concept> (C#1022 "company")))) (32) ここで、(32)式に於いて、第1要素は非終端記号、
第2要素は随時与えられる構造化概念番号、第3要素は
入力文の対応する単語列、更に、第4要素以降はパージ
ング結果を表わす。パージング結果は、複数の解釈が存
在する場合にそれらを並置する。(32)式では、単一
候補のため第5要素以降は存在しない。また、第4要素
は、一般的に概念と関係とからなる列を構成する。(3
2)式の例では、二つの概念の列になっている。関係を
含んだ例は、後述(35)式で説明する。
【0100】これら概念および関係は、(32)式に示
す如く、その識別子(非終端記号)と具体的にマッチン
グした概念または関係の列でそれぞれ表わされる。(3
2)式の例では、各概念は単一のマッチング結果しかな
い。複数のマッチング結果の例は、(37)式に示す。
【0101】さて、構文解析部はパージング結果(3
2)式を受けて、同式の最後の2行を複合名詞解析部5
06に送る。同複合名詞解析部は、原理説明で述べた方
法により、二つの概念C#1011とC#1022の意
味的な関係を概念ネットワークで表わす知識ベースから
推論する。その結果、(想定する知識ベースに於いて)
次の二つの解釈、(33)式および(34)式を得る。
この例では、陽に記述されていない関係が推論処理によ
って抽出されている。
【0102】 これらは自然言語的に表現すると、それぞれ以下のよう
になる。
【0103】 次に、図10の例について示す。この場合、パージング
結果は(35)式のようになる。すなわち、名詞句は二
つの概念が結合子(joiner)によって結び付けられたも
のとして認識される。
【0104】 (<noun-phrase> D#1010 "person who is author of a book" ((<concept> (C#1101 "person")) (<joiner> (RS#0001 RL "is-author-of")) (<concept> (C#1122 "book")))) (35) ここで、複合名詞解析部は(35)式の最後の3行を受
けて、概念C#1101とC#1122とが関係(RS
#0001 RL)によって意味的に関係付けられ得る
ことを推論し、(36)式の解釈を最終的に得る。この
場合、(35)式は単一の候補しか示していないが、も
し仮りに、上記の推論に失敗した場合は、そのような意
味解釈は、知識ベースに記憶されている知識に照らして
みて、有り得ないことが分かったことを意味する。
【0105】 (D#1010 "person who is author of a book" (C#1101 ((RS#0001 RL) C#1122))) (36) (36)式を自然言語的に表示すると下記のようにな
る。
【0106】"person who is author of book" 最後に、図11の例を説明する。(37)式に示すパー
ジング結果において、二番目の結合子(joiner)は、前
置詞atを図12に示す前置詞テーブル601を参照し
て解釈したものであり、その結果として複数の解釈が列
挙されている。
【0107】 (<noun-phrase> D#1011 "articles on people at companies" ((<concept> (C#0401 "article")) (<joiner> (RS#0033 LR "subject-is")) (<concept> (C#0601 "person")) (<joiner> (RS#0123 LR "is-developed-at") (RS#1054 LR "is-located-in") ・・・ (RS#0209 RL "works-at") ・・・) (<concept> (C#1022 "company"))) (37) 複合名詞解析部506は(37)式の第4要素を入力し
て、「概念−結合子−概念」という3組毎に、原理説明
で述べた考え方により意味的な関係の妥当性を評価す
る。すなわち、二番目の3組の例でいうと、概念C#0
601(person)と概念C#1022(company)との
間に、関係 "is-developed-at" や "is-located-in" は
有り得なく、関係 "works-at" のみが意味的に妥当であ
ることを、知識ベースに記憶されている具体的な事実か
ら推論する。この場合には、(38)式の解釈が最終的
に得られる。
【0108】 (D#1011 "articles on people at companies" (C#0401 ((RS#0033 LR) (C#0601 ((RS#0209 RL) C#1022))))) (38) 解釈(38)式は、自然言語で表示すると下記のように
なる。
【0109】 次に、本発明方式による知識ベースシステムの次の要素
であるマルチメディアファイル管理プログラムについて
説明する。知識ベースは記号的にオブジェクトまたは概
念を記憶するのに対して、マルチメディアファイルは、
情報自体をメディアのままで記憶する。すなわち、情報
圧縮のために各々最適な符号化を行うが、写真、文書、
図面、テキスト、音声といった複数の異なる種類のメデ
ィア情報(マルチメディア情報)を所定の記述方式に従
って記憶・管理する。マルチメディア情報の記述方式に
ついては、標準化されるべきマルチメディア・コンテン
ツ・アーキテクチャ(例えば、ODA:オフィス・ドキ
ュメント・アーキテクチャ)が知られているので、ここ
では説明しない。
【0110】これらのマルチメディア情報は、所定の単
位で管理され、一つのオブジェクト(情報単位)を構成
する。例えば、「文書」、「記事」、「写真」、「図
表」、「一区切りの音声メッセージ」等々、我々が通常
一つの物として認知するものをオブジェクトとすること
ができる。このオブジェクトは、単一メディアであって
も良いし、マルチメディアであっても良い。これらオブ
ジェクトは、マルチメディアファイル管理プログラムに
よって、各情報単位に付けたファィルメンバ名称、物理
的ファイルにおける記憶位置および記憶レコード長、記
述形式(例えば符号化方式)等から成る管理情報によっ
て管理する。複数のオブジェクトが構造化されて、別の
オブジェクトを構成することも可能である。逆に、ある
オブジェクトを複数の部分オブジェクトの構造体として
管理することも可能である。
【0111】一方、マルチメディアファイルに格納され
ている各情報単位は、先述したように、概念ネットワー
クの任意の概念ノードに関連付けることが出来る。これ
によって、マルチメディアファイルに格納されている情
報本体を、概念ネットワーク形の知識ベースから知的に
推論を用いて検索することが可能である。
【0112】次に、統合知識ベースについて述べる。本
発明方式による知識ベースシステムは、これまでに説明
した如く、概念関係モデルに基づく概念ネットワーク形
知識ベース、構文規則を記憶した文法ファイル、上記知
識ベースから編集処理によって自動的に作成できる言語
的辞書(語彙辞書512)、ユーザが個人毎に定義でき
る概念辞書(構造化概念ファイル511)、およびマル
チメディアファイルとから構成されていることを特徴と
している。更に、本システムは、知識ベース内の概念と
マルチメディアファイル内のオブジェクトを関連付ける
記憶手段とを有している。このように、記号的・論理的
表現による知識・情報、言語的知識、およびメディア情
報とを有機的に記憶することが出来る知識ベースを、こ
こでは統合知識ベースと呼ぶ。これらの情報は、それぞ
れの特性に合わせて、統合ディスクユニットに記憶させ
る。
【0113】以上、本発明を特に英語の場合について説
明したが、原理的には、日本語等、他の言語にも同様に
拡張可能である。特に、知識表現方式の説明で述べたよ
うに、本発明によれば、容易に多国語システムに拡張す
ることが出来る。具体的には、知識表現手段のうち、概
念名称テーブル221(図3)と一般概念定義テーブル
241(図5)のみが言語に依存し、同時に、それらの
テーブルは言語を規定するフィールド(カラム)LAN
G,224および246を有している。
【0114】また、本発明は実施例で示した構文規則の
内容(リスト1)に限定されることなく、同構文規則を
変更・拡張することにより、より広範な、或いは別なシ
ステムに適した自然言語を受け付けられることは自明で
ある。その意味でも、本発明方式は、広い応用分野を持
つ。例えば、詳細に説明しなかったが、リスト1におい
ても、(29a)から(29e)は、自然言語を用いて
新しい概念の登録(29b)、一般関係の登録(29
a)、或いは新しい事実の登録(29d)等を行うこと
が可能であることを示している。
【0115】更にまた、実施例の説明では、マルチメデ
ィアファィルと結合したシステムを述べたが、同マルチ
メディアファイルと独立して、知識ベースシステムのみ
で用いても効果的であることは言うまでもない。
【0116】
【発明の効果】以上説明した如く、本発明によれば、ユ
ーザは学習することが難しい形式言語を覚えることな
く、自然言語を用いて、曖昧な記憶から思い起こされる
記述的な検索要求から知識ベース内の欲しい情報を取り
出すことが可能となる。通常、我々の記憶は時間ととも
に薄らいでいくが、その時に残る記憶は、断片的であ
り、かつ抽象化していく。或いは、ずばりその名称を記
憶していることは稀であり、「こんなもの」、「あんな
もの」といった記述的なものに成っていくことも知られ
ている。本発明方式は、断片的、或いは抽象的な記述か
ら検索する方式を与えており、その意味では、単に自然
言語で検索できること以上の効果を有している。
【0117】また、本発明によれば、自然言語理解に必
要な知識は、システム本来の知識とともに知識ベース内
に一体となって記憶されているため、上記のようなシス
テムを構築することが、従来の自然言語インターフェー
スを与える方式に比べて、容易である。具体的には、ユ
ーザは特に自然言語インターフェースと知識ベースの整
合性などについて意識する必要はなく、知識ベースに本
来記憶管理させたい情報の登録に注目しさえすれば良
い。
【0118】更に、本発明によれば、新しい知識の登録
も自然言語を用いて行うことが可能である。一般的に、
複雑な機能を有するシステムでは、視覚的(直接操作
的)インターフェースと言語的インターフェースとの共
存が重要である。本方式では、視覚的(ビジュアル)イ
ンターフェースに言語的インターフェース機能が統合化
されており、ほとんど全ての機能を自然言語と直接操作
により提供している。その意味で、ユーザはその場その
場で、好きな方を選択することが出来、操作性および使
い勝手の面で優れている。
【0119】更にまた、本発明では、概念に対して同義
語、異表記語といった別名を登録したり、関係の名称
(「読み」)に対しても別名を記憶・登録させる手段を
与えており、多様な検索要求の表現に対しても適切に検
索処理を実行することが出来る。
【0120】また、本発明は、マルチメディア情報を知
識ベースに統合する方式についても示しており、これに
従えば、従来の記号的表現による知識ベース以上の応用
分野を切り開くことが可能である。
【0121】或いはまた、拡張例として述べた方式に従
って他国語システムを構築すれば、例えば、英語で検索
して日本語で出力すると言ったことも実現できる。
【図面の簡単な説明】
【図1】本発明方式の自然言語文解釈プログラムの機能
ブロック図。
【図2】概念関係モデルによる知識表現方式を説明する
概念ネットワークの図。
【図3】同モデルによる知識記憶を示す図であり、概念
名称を示す図。
【図4】同モデルによる知識記憶を示す図であり、包摂
関係を示す図。
【図5】同モデルによる知識記憶を示す図であり、一般
関係定義を示す図。
【図6】同モデルによる知識記憶を示す図であり、関係
を示す図。
【図7】同モデルによる知識記憶を示す図であり、複合
名詞句の意味解釈法の原理を説明するための図。
【図8】同モデルによる知識記憶を示す図であり、構文
解析法を説明する図。
【図9】同モデルによる知識記憶を示す図であり、構文
解析例を示す図。
【図10】同モデルによる知識記憶を示す図であり、構
文解析例を示す図。
【図11】同モデルによる知識記憶を示す図であり、構
文解析例を示す図。
【図12】同モデルによる知識記憶を示す図であり、前
置詞を示す図。
【図13】同モデルによる知識記憶を示す図であり、関
係記述子を示す図。
【図14】同モデルによる知識記憶を示す図であり、本
発明の一実施例システムのハードウェア構成図。
【符号の説明】
503…語彙解析部、504…構文解析部、506…複
合名詞解析部、511…構造化概念ファイル、512…
語彙辞書、514…構文規則文法ファイル、221…概
念名称テーブル、231…包摂関係テーブル、241…
一般関係定義テーブル、251…関係テーブル、601
…前置詞テーブル、611…関係記述子テーブル。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 木内 伊都子 東京都国分寺市東恋ケ窪1丁目280番地株 式会社日立製作所中央研究所内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】複合名詞句を含む単語列を入力する入力手
    段、入力された単語列を処理する処理手段、処理結果を
    出力する出力手段を備える装置であって、上記処理手段
    は、 概念をノードとして表し、該概念間の関係をリンクとし
    て表し、該ノードとリンクで概念木を構成する概念ネッ
    トワークを知識として記憶する知識ベースと、 上記入力された単語列中に存在する複合名詞句の複数の
    単語間の意味関係を判定するための知識情報を、上記概
    念ネットワークを検索することにより抽出する解析手段
    を有することを特徴とするデ−タベース装置。
  2. 【請求項2】単語列を入力する入力手段、入力された単
    語列を処理する処理手段、処理結果を出力する出力手段
    を備える装置であって、上記処理手段は、 概念をノードとして表し、該概念間の関係をリンクとし
    て表し、該ノードとリンクで概念木を構成する概念ネッ
    トワークを知識として記憶する知識ベースと、 上記入力された単語列中に存在する複数の単語間の意味
    関係を、上記概念ネットワークを検索することにより判
    定する解析手段を有することを特徴とするデ−タベース
    装置。
  3. 【請求項3】上記知識ベースは、上記概念の名称を記憶
    する概念名称テーブルと、上記概念間の包摂関係を記憶
    する包摂関係テーブルと、上記概念間に存在する包摂関
    係以外の関係の定義を記憶する一般関係定義テーブル
    と、上記概念間の関係の存在を記憶する関係テーブルを
    有する特許請求の範囲第2項記載のデ−タベース装置。
  4. 【請求項4】さらに構文規則を記憶した文法ファイルを
    有し、上記解析手段は、上記単語列の各単語の属性を解
    析する語彙解析手段と、上記文法ファイル、上記知識ベ
    ース、および上記語彙解析手段の解析結果を参照して、
    上記単語列の構文を解析する構文解析手段を有する特許
    請求の範囲第3項記載のデ−タベース装置。
  5. 【請求項5】さらに、ある概念を他の概念によって意味
    を限定した構造化概念を記憶する構造化概念ファイル、
    単語の種別を記憶する語彙辞書ファイルを有し、上記語
    彙解析手段は、上記構造化概念ファイル、語彙辞書ファ
    イル、および上記概念名称テーブルを参照して、前記単
    語列の各単語の属性を解析することを特徴とする特許請
    求の範囲第4項記載のデ−タベース装置。
JP8326482A 1996-12-06 1996-12-06 データベース装置 Expired - Lifetime JP2948159B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8326482A JP2948159B2 (ja) 1996-12-06 1996-12-06 データベース装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8326482A JP2948159B2 (ja) 1996-12-06 1996-12-06 データベース装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP63002609A Division JP2997469B2 (ja) 1985-03-27 1988-01-11 自然言語理解方法および情報検索装置

Publications (2)

Publication Number Publication Date
JPH09190453A true JPH09190453A (ja) 1997-07-22
JP2948159B2 JP2948159B2 (ja) 1999-09-13

Family

ID=18188316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8326482A Expired - Lifetime JP2948159B2 (ja) 1996-12-06 1996-12-06 データベース装置

Country Status (1)

Country Link
JP (1) JP2948159B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6792418B1 (en) 2000-03-29 2004-09-14 International Business Machines Corporation File or database manager systems based on a fractal hierarchical index structure
JPWO2004066164A1 (ja) * 2003-01-23 2006-05-18 富士通株式会社 話題ネットの生成方法及び装置
JP2010079915A (ja) * 1997-07-22 2010-04-08 Microsoft Corp 自然言語処理技法を用いたテキスト入力処理システム
US7756897B2 (en) 2003-01-23 2010-07-13 Fujtisu Limited Topic net generation method and apparatus
JP5099367B2 (ja) * 2006-03-10 2012-12-19 日本電気株式会社 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム
JP2018005690A (ja) * 2016-07-05 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2020086874A (ja) * 2018-11-22 2020-06-04 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021082308A (ja) * 2020-01-15 2021-05-27 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079915A (ja) * 1997-07-22 2010-04-08 Microsoft Corp 自然言語処理技法を用いたテキスト入力処理システム
US6792418B1 (en) 2000-03-29 2004-09-14 International Business Machines Corporation File or database manager systems based on a fractal hierarchical index structure
JPWO2004066164A1 (ja) * 2003-01-23 2006-05-18 富士通株式会社 話題ネットの生成方法及び装置
US7756897B2 (en) 2003-01-23 2010-07-13 Fujtisu Limited Topic net generation method and apparatus
JP5099367B2 (ja) * 2006-03-10 2012-12-19 日本電気株式会社 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム
JP2018005690A (ja) * 2016-07-05 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2020086874A (ja) * 2018-11-22 2020-06-04 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021082308A (ja) * 2020-01-15 2021-05-27 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体

Also Published As

Publication number Publication date
JP2948159B2 (ja) 1999-09-13

Similar Documents

Publication Publication Date Title
US6182062B1 (en) Knowledge based information retrieval system
US11113304B2 (en) Techniques for creating computer generated notes
US5404506A (en) Knowledge based information retrieval system
Bontcheva et al. Evolving GATE to meet new challenges in language engineering
JP4851789B2 (ja) ユーザ関心反映型検索結果指示子使用及び作成システム及び方法
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US5083268A (en) System and method for parsing natural language by unifying lexical features of words
JP4658420B2 (ja) 文字列の正規化表示を生成するシステム
JP2609173B2 (ja) 用例主導型機械翻訳方法
US20060116861A1 (en) Systems and methods for user-interest sensitive note-taking
JP2948159B2 (ja) データベース装置
JP2997469B2 (ja) 自然言語理解方法および情報検索装置
US7801723B2 (en) Systems and methods for user-interest sensitive condensation
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
Vickers Ontology-based free-form query processing for the semantic web
Du On the use of natural language processing for automated conceptual data modeling
Marcoux et al. Formal and informal meaning from documents through skeleton sentences
JP4938298B2 (ja) テキストの要約に含める文の候補を出力する方法およびプログラム
Karanastasi et al. User Interactions with Multimedia Repositories using Natural Language Interfaces-OntoNL: an Architectural Framework and its Implementation.
Hahn et al. SYNDIKATE-generating text knowledge bases from natural language texts
Tools Online Help and User Manuals A Syntactical Analysis using
WO2000049522A1 (en) Translation
JPH0973454A (ja) 文書作成装置及び文書作成方法
Marcoux Balisage: The Markup Conference 2009
Windhouwer Feature grammar systems. Incremental maintenance of indexes to digital media warehouses

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 9