JPH02240769A

JPH02240769A - 自然言語文生成装置

Info

Publication number: JPH02240769A
Application number: JP1063253A
Authority: JP
Inventors: Yoshihiro Tokuume; 徳梅　喜啓; Shogo Shibata; 柴田　昇吾; Koichi Tanagi; 棚木　孝一
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1989-03-14
Filing date: 1989-03-14
Publication date: 1990-09-25
Also published as: EP0388156A2; DE69031354T2; DE69031354D1; EP0388156A3; US5101349A; EP0388156B1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は、自然言語処理システムに関し、特に、構・文
生成装置に関するものである。

［従来の技術］自然言語入力を受けて、自然言語出力を行なう自然言語
処理システムでは、例えば日本語から英語への機械翻訳
システムの場合、先ず、日本語文の解析を行なって、日
本語の概念構造（意味構造）を決定する。この概念構造
は、一般に、概念を表わすノードと概念間の関係を表わ
すアークからなる意味ネットワークで表現される。日本
語解析によって得られた上記の日本語の概念は、日本概
念構造から英語文を訳出するのが生成である。

第２図は一般的な機械翻訳システムの構成図である。第
２図においてＳ２１は入力文である。２１は入力文を形
態素に分割する形態素解析装置で、入方丈が日本語のよ
うな膠着語の場合に必要となるが、英語のような屈折語
の場合は不要である。

する構文解析装置である。

Ｓ２３は、単語列Ｓ２２が構文解析された結果得られる
構文木であり、２３は構文木Ｓ２３に基づいて、意味の
レヴエルでの解析を行う意味解析装置である。

Ｓ２４は意味解析の結果得られる意味構造であり、２４
は入力言語の意味構造Ｓ２４を訳出言語の意味構造Ｓ２
５に変換するトランスファ装置である。

２５は訳出言語の意味構造Ｓ２５から構文木８２６を生
成する構文生成装置であり、２６は構文木Ｓ２６から訳
出文Ｓ２７を生成する形態素生成装置である。

なお、従来はこの他に生成系を構文生成装置と形態素生
成装置に分けず、意味構造から構文木を生成せずに、直
接訳出文を出力する方式も多く用いられていた。

第３図はデイスプレィ画面（ＣＲＴ）上の６つのウィン
ドウに表示された第２図の入力文Ｓ２１．構文木Ｓ２３
、およびＳ２６、意味構造Ｓ２４、およびＳ２５、出力
文Ｓ２７の一例を示す。

本発明は第２図の構文生成装置２５の如き構文生成装置
に関するものである。

従来の生成装置では、日経エレクトロニクス１９８４年
１２月１７日号の「言語に依存しない概念構造を中間表
現とし、常識を使う多言語向き機械翻訳システム」ある
いは、特開昭６３−１３６２６０号で説明されているよ
うに、意味ネットワークの如き概念構造をなぞりなから
ノード名（以下、単語という）をキーワードとして辞書
を引き、そこから文生成規則格納部に格納されている上
記単語に関係する文生成規則を起動し、訳文を生成して
いく方式をとっていた。

つまり、辞書にはその単語に関する生成規則群を示す生
成記号が格納されており、生成記号は、生成規則のなか
で、その単語についての生成規則群を示すポインタの役
目をしている。生成規則は意味ネットワークのノードや
アークを一つ一つ調べて単語列を得るためのプロダクシ
ョンルールとみなすことができる。生成規則は名詞、自
動詞、他動詞、代名詞主格、代名詞目的格といった細か
い品詞分類ごとに作成されている。一つの生成規則群は
いくつかの生成規則から成っている。その適用する順序
が決まっており、この順序が単語の語順を決定する。

さて、このような従来の生成方式によつて、第４図に示
す意味ネットワークから英語文″Ｈｅ　　ｗｅｎｔｔｏ
　　Ｋｏｂｅ　　ｂｙ　　ｂｕｓ、”を生成する過程を
説明する。第４図の意味ネットワークにおいて、二重丸
のノードは用言を表している。アーク名がＡＧＥＮＴ。

ＧＯＡＬ、ｌＮ５Ｔのアークはそれぞれ動作主、目標、
道具といった深層格関係を表している。また、ＰＡＳＴ
なるアークは過去時制であることを示し、ＳＴなるアー
クは文中の最も中心となる述語を指す。生成規則の例を
第５図に示す。

さて、第４図の意味ネットワークにおいて、文生成はま
ずＳＴというアークが入っているノード“ｇ。

から始める。生成規則を解釈するルール・インクブリ店
夕は“ｇｏ”″に関する生成規則を一つずつ調べて行く
。ｇｏ”の生成記号はＶｌである。これは、ＶＩ（自動
詞）の生成規則を１から順に使用することを示す。まず
、第５図の自動詞に関する規則（１）を適用する。そし
て、アウト・アーク（ノードから出ているアーク）のＡ
ＧＥＮＴを主語として生成しようとする。この結果アウ
ト・アークＡＧＥＮＴから始まるサブネットワークに処
理が移る。このときの５ＵＢＪ　（主語）というメツセ
ージをノード’ｈｅ”に送る。

ＡＧＥＮＴで始まるサブネットワークを処理するために
、まずノード“ｈｅ”に移動する。このとき、ノード“
ｇｏ”について処理中であることを示すフラグを立てる
。“ｈｅ”の生成記号はＰＳ（代名詞主格）なので第５
図の代名詞主格の生成規則を適用する。ノードａ　ｈ　
ｅ＃には５ＵＢＪ　（主語）というメツセージがすでに
送られているが、これは代名詞主格の規則（１）　〜（
４）の＜　ｃｏｎｄｉｔｉｏｎ　＞とは合わず、（５）
と適合する。そして、＜　ａｃｔｉｏｎ　＞に示すとお
り自分自身を出力する。この後適用する生成規則がもう
ないので、ＡＧＥＮＴで始まるサブネットワークの生成
を終わる。そして、ノード“ｇ。

に戻る。

ノード“ｇｏ”は自動詞ＶＩの生成規則の規則（２）以
降を順に適用する。生成規則（２）〜（４）は、ノード
“ｇｏ”の構造から、適用する必要はない。

ノード“ｇｏ”から時制情報ＰＡＳＴのアークが出てい
るので、その次の規則（５）を適用する。そして、ｇｏ
”の過去形“ｗｅｎｔ”を出力する。次に規則（８）に
移り、アウト・アークのＧＯＡＬから始まるサブネット
ワークに対応する句の生成に移る。これも前のアウト・
アークＡＧＥＮＴと同様の過程を経る。

アークＧＯＡＬから前置詞“ｔｏ”を選ぶときに、ｇ。

と“Ｋｏｂｅ”が“ｔｏ”を介して共起するチエツクす
る。こうして、このサブネットワークから“ｔ。

Ｋｏｂｅ”が生成される。

さらに規則（９）によつてｌＮ５Ｔから始まるサブネッ
トワークに対する句の生成を行う。この結果“ｂｙ　　
ｂｕｓ”を生成する。最後にイン−アークＳＴからピリ
オドを生成し、ノード′ｇｏ”の周りのアークの処理を
すべて終わる。これで文生成が完了し、結果としてＨｅ
　　ｗｅｎｔ　　ｔｏ　　Ｋｏｂｅ　　ｂｙ　　ｂｕｓ
。

という英語文が得られる。

また、情報処理学会第２８回（昭和５９年前期）全国大
会の５Ｌ−３の「概念依存図式からの英文生成」で述べ
られているように、下記のような句構造規則を改良した
文法ルールを用いて、意味ネットワークから句構造を生
成する過程（構文生成過程）を設ける方式が考えられて
いる。

１、　５（ＮＰ（Ａ）　ＶＰ（’／（＊）　ＮＰ（０）
）２、　　　Ｓ　（ＮＰ　（Ａ）ＶＰ　（Ｖ　（木）　
　ｌＮＦ２　（０）））３、　３（ＮＰ（Ａ）　ＶＰ（
Ｖ（＊）　ＮＰ（Ｒ）ＮＰ（０）））ここで、α（βｌ
・・・βｎ）は、αをβｌ、・・・βｎの並びに書き換
える句構造規則である。木は熟語を、Ａは動作主格を、
Ｏは対象格を、Ｒは受は手格を表す。

〔発明が解決しようとしている課題〕

しかしながら、上述の従来例の内、構文生成過程を設け
ない自然言語処理システムでは、意味ネットワークから
文生成を行うとき、意味ネットワークをなぞりなからノ
ード名をキーワードとして単語辞書を引き、そこから文
生成規則格納部に格納されている上記単語に関係する文
生成規則を起動し、訳文を生成してい（方式をとってい
たため、生成規則の規模が増大するにつれて、文生成規
則の作成者以外にはその構造的な理解が困難となったて
、保守性が著しく低下し、また拡張性にも乏しいという
問題があった。

また、この生成方式では、生成規則の適用順序が語順を
決定するようになっていたが、このように、文法（句構
造規則）が陽に現れていない方式では、生成した文の白
文法性が保証されないという問題があった。

一方、構文生成過程を設けた上記従来例においては、構
文的規則である句構造規則の中に、意味的情報である格
情報を混在させるため、下記のように、同じ句構造規則
を複数書かねばならないという問題が起こる。

１．５（ＮＰ（Ａ）ＶＰ（Ｖ（＊）ＮＰ（０）））Ｉ　
　ｇｉｖｅ　　ｈｉｍ　　ａ　　ｂｏｏｋ。

２、　５（ＮＰ（Ａ）　　ＶＰ（Ｖ（ネ）　　ＮＰ（Ｃ
）））Ｉ　　ｃａｌｌ　　ｈｉｍ　　ａ　　５ｃｈｏｌ
ａｒ。

ここで、Ｃは内容規定格である。

［課題を解決するための手段］本発明は、句構造規則を記述した句構造領域と、該句構
造領域に記述された句構造規則における上位カテゴリか
ら下位カテゴリへの属性情報の伝播方法を記述した意味
領域と、文法ルールの適用条件を記述した条件領域と、
前記下位カテゴリを上位カテゴリとする句構造規則に制
約を与えるメツセージが記述されるメツセージ領域とを
有する文法ルールを記憶する文法ルール記憶手段と、該
文法ルール記憶手段に記憶された文法ルールを検索する
ための検索手段と、前記文法ルール記憶手段に記憶され
た文法ルールを解釈するための解釈手段と、前記文法ル
ール記憶手段に記憶された文法ルールを、前記検索手段
によって検索し、前記解釈手段によって解釈しながら適
用して、文法機能の情報の集合から句構造を生成する生
成手段とを有して構成される。

素性値からなり、文法機能を表わすものである。

素性名の簡単な例としては、主語、目的語、姓、数、格
などがある。

また、本発明の構文生成装置は、素性を要素として表わ
される素性構造（ｆｅａｔｕｒｅ　５ｔｒｕｃｔｕｒｅ
　）をその入力として受取り、句構造を出力するもので
あるが、このように素性構造を導入することによって、
従来別々であった解析と生成を、ユニフィケーション文
法という枠組で、同じように記述できるようにもなった
。

なお、ユニフィケーション文法とは、１．５ｃｈｉｅｂｅｒ：Ａｎ　１ｎｔｒｏｄｕｃｔｉｏ
ｎ　ｔｏ　Ｕｎｉｆｉｃａｔｉｏｎ−Ｂａｓｅｄ　ａｐ
ｐｒｏａｃｈｅｓ　ｔｏ　Ｇｒａｍｍａｒ。

Ｃ３ＬＩ　Ｌｅｃｔｕｒｅ　Ｎｏｔｅｓ　Ｎｏ、４．１
９８６２、野村：自然言語処理の基礎技術、電子情報通
信学会線、コロナ社（１９８ｇ）に述べられているように、素性を使って文法を記述し、
文の構成素間の関係をこの素性のユニフイーケーション
（単一化）として表すものである。また、ユニフィケー
ションとは一種の和集合演算である。

さて、以下にユニフィケーション文法を使ってユニフィ
ケーション操作により文構造を解析する文法（ユニフィ
ケーション解析）について説明する。

ユニフィケーション文法は、何種類かのものがあるが、
ここではＬＦＧ　（Ｌｅｘｉｃａｌ　　Ｆｕｎｃｔｉｏ
ｎａｌＧｒａｍｍａｒ）を取り上げて説明する。

Ｌ應Ｇでは、文法規則として句構造規則に文法機文能を加えたものを使う。文の構造表現には、構造木を表
すＣ−構造と文法機能の階層構造を表すＦ−構造の２つ
の階層を使う。ここでＦ−’構造は素性構造である。

Ｃ−構造（Ｃｏｎｓｔｉｔｕｅｎｔ　　５ｔｒｕｃｔｕ
ｒｅ）は、構文木そのものである。これは、Ｌ　Ｐ　Ｇ
文法規則の中の句構造規則の部分を使って通常の構文解
析を行った結果として得られる解析木を表す。Ｆ−構造
（Ｆｕｎｃｔｉｏｎａｌ　　５ｔｒｕｃｔｕｒｅ）は、
Ｃ−構造が表す構文構造に対応させて、文法規則の中に
記述されている文法機能の関係を階層的に表した素性構
造である。Ｃ−構造は、Ｆ−構造を求める過程で使われ
るものであり、従って、ＬＰＧの解析結果はＦ−構造で
表される。例えば、文法規則の句構造規則の部分として
第６図（ａ）句構造規則ＥＲを使うと、文″Ｈｅ　　５
ｅｅｓ　　ｔａｂｌｅｓ”に対するＣ−構造は第６図（
ｂ）のようになる。

このＣ−構造に対して、Ｆ−構造は、例えば第６図（Ｃ
）のように表わされる。

このＦ−構造（素性構造）の概略は次の通りである。主
語“５ＵＢＪ”は数が単数“ＮＵＭＳＧ”で人称が三人
称“ＰＥＲ３３”で、性は男性“ＧＥＮ　ＭＡＳＣ”で
、格が主格“ＣＡＳＥ　　ＮＯＭ”で、その内容がＨＥ
“ＰＲＥＤ　　ＨＥ”であるという文法機能を表してい
る。また、この文の時制は現在時制“ＴＥＮＳＥ　ＰＲ
ＥＳ”である。目的語“ＯＢＪ”は、複数″ＮＵＭＰＬ
″で、その内容１；！ＴＡＢＬＥ　”ＰＲＥＤ　　ＴＡ
ＢＬＥ’　であ６゜この文の述語は、“５ＥＥＳ”であ
り、それは述語と目的語を取り、“ＰＲＥＤ　　’５Ｅ
ＥＳ＜　（ＳＵＢＪ）（ＯＢＪ）＞’”という形で特徴
づけられる。

ここで、“５ＵＢＪ−や“ＯＢＪ”やＮＵＭ”などが文
法機能である。これらの文法機能を素性標識として使う
。素性値には、原始値を取るものと、Ｆ−構造を取るも
のとの二種類がある。原始値を取るものとは、例えば、
素性“ＮＵＭ”に対する素性値“ＳＧ”や“ＰＬ”であ
る。Ｆ−構造を取るものとは、例えば、素性“５ＵＢＪ
”やＯＢＪ”に対する素性値である。この場合、Ｆ−構
造は階層構造となる。

さて、次にＬＰＧの文法規則を説明する。

ＬＰＧの文法規則は、句構造規則にその句構造規則の中
に現れる非終端標識の間の文法機能をつけ加えて表す。

文法機能は、メタ変数を使って機能スキーマと呼ぶ形で
表す。例えば、次のように表す。

ＬＲＩ）ＬＲ２）ＬＲ３）ＬＲ４）ＬＲ５）ＬＲ６）Ｓ　→　　ＮＰ　　　　　　　　ＶＰ（↑５ＵＢＪ）−↓　　↑−↓ ＶＰ、Ｖ　　　（ＮＰ）　　　　　　　（ＰＰ）（↑０
ＢＪ）　＝↓　　（↑（↓ＰＣＡＳＥ））−↓ＶＰ、Ｖ
　　　（ＮＰ）　　　　（ＮＰ）　　　　　　（ＰＰ＊
）（↑０ＢＪ）　　↓　（↑０ＢＪ２）　　↓　（↑Ａ
ＤＪＵＮσ０　↓ＮＰ−ＮＰ　　　　（ＰＰ本） ↑ツ↓　（↑ＡＤＪＵＮＣＴ）−↓ ＮＰ→（Ｄ）　　（Ａ）　　　ＮＰＰ→Ｐ　　　　　　ＮＰ（↑０ＢＪ）　＝↓ ここで、それぞれの文法規則は、句構造規則と、句構造
規則の右辺の非終端標識につけられた式か数と呼ぶ。

メタ変数↑は、その句構造規則の左辺の非終端標識に対
応づけられているＦ−構造を指す。すなわち、その句構
造規則に対応する構文木の中の親ノードのＦ−構造を指
す。例えば（↑５ＵＢＪ）は、親ノードのＦ−構造にあ
る５ＵＢＪを指している。メタ変数↓は、その機能スキ
ーマがつけられている非終端標識に対応づけられている
Ｆ−構造を指す。

すなわち、その句構造規則に対応する構文木のその子ノ
ードのＦ−構造を指す。なお、句構造規則の中の括弧（
）で囲まれた非終端標識は省略できることを示す。また
、木のついた要素は０個以上出現することを示し、それ
らの出現順序は問わない。

木のついた要素が複数個出現するときは、それぞれを独
立に扱う。すなわち、それぞれ独立なＦ−構造を持つ。

ＬＲＩは、句構造規則ＥＲＩに対応する。ＬＲＩは、文
Ｓは名詞句ＮＰと動詞句ｖＰがこの順序で並んだもので
あり、かつそれぞれはそれぞれにつけられている機能ス
キーマが示す条件を満たさなければならないことを示す
。

ＬＲＩの右辺の第１項ＮＰ（↑５ＵＢＪ）　＝’↓ は、ｒＮＰのＦ−構造は親ノードのＦ−構造の５ＵＢＪ
の部分へ移る」と読む。すなわち、この名詞句ＮＰのＦ
−構造は、文Ｓの主語５ＵＢＪのＦ−構造であることを
示す。従って、文の主語の文法機能は、ＬＲＩの句構造
規則におけるＮＰが持つ文法機能であることが示されて
いる。

ＬＰＩの右辺の第２項ＮＰ ↑＝↓ は、ｒＶＰのＦ−構造は親ノードのＦ−構造へ移る」と
読む。機能スキーマ↑＝↓は、句構造規則の右辺の子ノ
ードの中で、それがつけられているノードがヘッド（生
酔）であることを表す。

さて、次に辞書項目の表現について述べる。

辞書の鉛量項目も機能スキーマを使って表す。機能スキ
ーマの中のメタ変数↑は、文法規則のときと同じく親ノ
ードのＦ−構造を参照する。鉛量項目の親ノードは常に
前終端標識である。次に鉛量項目の例を示す。

ＬＤＩ）　　５ｅｅｓ　：　Ｖ　（↑ＴＥＮＳＥ）＝Ｐ
ＲＥＳ（↑５ＵＢＪ　ＮＵＭ）＝ＳＧ（↑５ＵＢＪ　ＰＥＲ３）　＝３（↑ＰＲＥＤ）＝　’５ＥＥＳ＜（↑５ＵＢＪ）（↑０
ＢＪ）　＞’ＬＤ２）　　　ｈｅ：　　Ｎ（↑ＮＵＭ）
＝ＳＧ（↑ＰＥＲ８）＝３（↑ＧＥＮ）＝ＭＡＳＣ（↑ＣＡＳＥ）＝ＮＯＭ（↑ＰＲＥＤ）＝ＨＥＬＤ３）　　ｔａｂｌｅｓ　：　Ｎ　（↑ＮＵＭ）＝Ｐ
Ｌ（↑ＰＲＥＤ）＝　’ＴＡＢＬＥＳ’ ここで、素性のＴＥＮＳＥは時制を、ＮＵＭは数を、Ｐ
ＥＲ３は人称を示す。また、素性値のＳＧは単数を、Ｐ
Ｌは複数を、３は三人称を示す。ＬＤＩは、５ｅｅｓが
動詞であることをＶによって示している。また、（↑Ｔ
ＥＮＳＥ）＝ＰＲＥＳによって動詞５ｅｅｓが現在形で
あることを示している。更に、（↑５ＵＢＪ　　ＮＵＭ
）＝ＳＧ、（↑５ＵＢＪ　　ＰＥＲ３）＝３によって主
語は三人称単数でなければならないことを示している。

素性ＰＲＥＤの値は記号゛で囲まれているが、°′で囲
まれた内容を意味形と呼ぶ。意味形は、その項目の意味
解釈の情報を与える。

さて、以上でＬＰＧの文法と辞書の説明ができたのでＬ
ＰＧによる文解析方法について説明する。

解析はＣ−構造の作成とＦ−構造の作成の２段階で行う
。Ｃ−構造の作成は、文法規則の中の句構造規則の部分
と辞書の中の品詞の部分を用いて通常の構文解析により
行う。このとき機能スキーマの部分は用いない。

Ｃ−構造ができると機能スキーマを用いてＣ−構造から
Ｆ−構造を求める。このときユニフィケーションという
操作を用いる。

今、Ｃ−構造として第６図（ｂ）が得られたとする。こ
のとき、上記ＬＤＩ）によって、ＶのＦ　−構造はであり、上記ＬＤ３）によってｔａｂｌｅ”に対応する
ＮＰのＦ−構造はである。

そして、上記ＬＲ２）の機能スキーマから、ｖｐのＦ−
構造はとなる。このように、ＶのＦ−構造ＦＳＩ）とＮＰのＦ
−構造Ｆｓ２）をり、Ｒ２）の機能スキーマに従って１
つのより大きなＦ−構造ＦＳ３）にまとめ上げる操作が
ユニフィケーションである。

ユニフィケーションは一種の和集合演算であるが、無矛
盾性のチエツクも行う。

さて、次に“ｈｅ”に対応するＮＰのＦ−構造はＬＤ２
）よりである。よって、ＬＲｌ）の機能スキーマから、ＳのＦ
−構造はとなる。ここで上記“ｈｅ”は対応するＮＰのＦ−構造
ＦＳ４）における［：ＮＵＭ　　ＳＧＩと（ＰＥＲ３３
〕ハ上記ＶＰ（７）Ｆ−構造ＦＳ３）（７）ＳＵＢＪ（
７）中の（ＮＵＭ　　ＳＧ）と（ＰＥＲ３３）と矛盾し
ないのでユニフィケーションが無事行われる。

以上のようにして求められたＳのＦ−構造ＦＳ５）が最
終的に求まる文の意味構造である。

〔実施例〕

以下、図面を参照して本発明の実施例を詳細に説明する
。

第１図は、本実施例の構文生成装置の構成図である。こ
の構文生成装置は素性構造から句構造を生成するもので
ある。

第１図において、１１は構文生成用の文法ルール格納部
である。文法ルール格納部に収納された格文法ルールは
、句構造部、意味部、条件部、メツセージ部から構成さ
れている。ここで、句構造部には、”５ＤＥＣ−ＮＰ　
　ＶＰ″’Ｐ“ＶＰ−＋ＶＮＰ“などの句構造規則が記
述されている。（ＳＤＥＣは平叙文を、ＮＰは名詞句を
、ｖｐは動詞句を、■は動詞を表し、これらを文法カテ
ゴリという。）意味部には、親カテゴリ（句構造規則の
左辺の文法カテゴリ）から子カテゴリ（句構造規則の右
辺の文法カテゴリ）への素性情報の伝播方法が記述され
ている。条件部はその文法の適用条件を記述するための
もので、メツセージ部はその文法の子カテゴリを親カテ
ゴリとする文法ルールを適用するときの制約を与えるた
めのものである。１２は文法ルール検索部である。１３
は文法ルール解釈部である。ここは、文法ルール検索部
１２が文法ルール格納部１１から検索してきた文法ルー
ルを解釈するところである。１４は生成部である。ここ
は、各種情報の入出力の制御や、文法ルールを適用して
句構造を生成してい（ところである。１５はワーキング
メモリ（作業領域）である。ここには最初、文の意味を
表す素性構造がセットされる。そして、これをもとに、
このワーキングメモリ上で句構造を築き上げてい（。

第７図は、第１図の構文生成装置による構文生成処理の
流れ図の一例である。以下に第７図の説明を行う。

まず、ステップＳ２０１で、第８図のような素性構造が
、構文木の最上位に位置する文法カテゴリｂｕｎにセッ
トされる。次に、ステップ５２０２でｂｕｎを親カテゴ
リ（句構造規則の左辺の文法カテゴリ）とする文法ルー
ルを検索する。そして、ステップ５２０３で、検索した
文法ルールの条件部に記述された文法適用条件を検査す
る。ステップ５２０４では、この文法適用条件を満足し
ていなければ、他にｂｕｎを親カテゴリとする文法ルー
ルがあるか検査する。

他になければ、ステップ５２０５へ進み、構文生成は失
敗する。他にあれば、ステップ５２０６でその文法ルー
ルを適用し、ステップ５２０３に戻り、その条件部に記
述された文法適用条件を満足するか検査する。満足した
場合は、その文法ルールの適用が可能となる。

そして、次にステップ５２０７へ進み、文法ルールの句
構造部や意味部を実行する。句構造部には、句構造規則
が記述されている。意味部には、親カテゴリの素性情報
の子カテゴリへの伝播方法が記述されている。意味部の
記述に従つて、親カテゴリから子カテゴリへ素性情報を
伝播させてい（ことによって、文の情報が適切に分配さ
れてい（。

さて、次に、ステップ８２０８でメツセージ部を実行す
る。メツセージ部はその文法ルールの子カテゴリを親カ
テゴリとする文法ルールを適用するときの制約を与える
ために設けられている。つまり、上記条件部とメツセー
ジ部によって文法ルールを適用していくときの制御を行
っている。

以上のようにして文法ルールが実行されると、次に、更
に下位の句構造（構文木）を生成していくために、ステ
ップ５２０９でこの文法ルールの子カテゴリを親カテゴ
リとする文法ルールがあるか検索する。文法ルールがあ
れば、ステップ５２０３のへ戻り、その文法ルールを適
用できるか否か見るため条件部を検査する。そして、上
述の処理を繰り返す。

子カテゴリを親カテゴリとする文法ルールがなければ、
ステップ５２１０でその子カテゴリが終端記号か否か検
査する。なお、終端記号とは図６のＮやＶのようにそれ
以上下位の文法カテゴリを持たない文法カテゴリをいう
。

終端記号でない場合は、ステップ５２１１へ進み、構文
解析は失敗する。終端記号の場合は、ステップ５２１２
で、その終端記号に伝播されてきた素性情報の中から単
語を取りだす終端記号の下に接続する。ステップ５２１
３では、このようにして、すべての終端記号に対して単
語が決定されたかを見て、決定されていれば、構文生成
は終了する。もし、まだ単語の決定されていない終端記
号があれば、ステップ５２１２へ戻り、その終端記号に
対して単語を決定する。

第１０図は文法ルールの例である。ここで、＠ｓｅｍは
意味部を、＠　ｃ　ｏ　ｎは条件部、＠　ｍ　ｅ　ｓは
メツセージ部を示す。↑は親カテゴリの素性構造を示す
。＝は素性構造が等しいことを、−は素性構造の削除を
示す。＝＝および≠は値の一致、不一致を表す。

＋十はメツセジの付加を表す。また、文法カテゴリにつ
いては、ｂｕｎは文、５ＤＥＣは平叙文、ＥＮＤは句点
、ＮＰは名詞句、ＢＥＰはｂｅ動詞句、ＰＲＥＤは叙述
句（Ｐｒｅｄｉｃａｔｅ　　Ｐｈｒａｓｅｓ、）、ｖＰ
は動詞句、ＤＤＥＴは定冠詞などの定の限定詞句、ＮＯ
ＭＨＤは名詞句生酔、５ＲＥＬ／ＮＰは関係節、ＨＥＬ
ＰＲＯは関係代名詞、■は動詞を示す。

文法ルールの詳細は後程、本構文生成装置の処理過程を
説明する中で述べる。

ｉｓ　　Ｊｏｈｎ、”に対応するものである。

第８図は素性構造の例である。図の如く素性構造とは素
性名と素性値の対の集合である。素性値は単なる値の場
合だけでなく素性構造となっている場合もある。第７図
において（１）は素性構造のリンクを表す。第８図の素
性構造は第１１図の意味ネットワークを変換して得られ
たものである。なお、この変換に際しては英語辞書が参
照される。

さて、それでは以下に本構文生成装置が図５の素性構造
から句構造を生成する過程を説明する。

この処理に関係する文法ルールは第１０図の如くである
。

まず、第８図の素性構造がｂｕｎにセットされ、構文生
成が始まる。最初に第１０図の文法ｌが適用され、ｂｕ
ｎの素性構造はそのまま５ＤＥＣに伝播される。次に５
ＤＥＣの主動詞の文法コードがＷ　ｖ　１　。

であるので文法２．の条件部とマツチし、文法２．が適
用される。ここで、文法２．の条件部に記述されている
（↑ｈｅａｄ　　５ｙｎ）　＝＝Ｗｖｌは５ＤＥＣの素
性構造の中・の素性名ｈｅａｄの素性構造の中の素性名
ｓｙｎの素性値がＷｖｌであるこを示している。なお、
素性名ｓｙｎは５ｙｎｔａｘ　　ｃｏｄｅの略で、Ｗｖ
ｌはＬ　ｏ　ｎ　ｇ　ｍ　ａ　ｎ　Ｄ　ｉ　ｃ　ｔ　ｉ
　ｏ　ｎ　ａ　ｒ　ｙ　Ｏｆ　Ｃｏ　ｎ　ｔ　ｅ　ｍ　
ｐ　ｏ　ｒ　ａ　ｒ　ｙＥｎｇｌｉｓｈの文法コードで
ありｂｅ動詞を意味する。

文法２．では、意味部の（↑５ｕｂｃａｔ　　５ＵＢ）
　＝ＮＰの記述が特に重要である。この記述に従って、
親である５ＤＥＣの素性構造の中の素性名５ｕｂｃａｔ
の素性構造の中の素性名ＳＵＢの素性構造がＮＰに伝播
される。なお、５ｕｂｃａｔはｓｕｂｃａｔｅｇｏｒｉ
ｚａｔｉｏｎの略で、主動詞（今の場合はｂｅ動詞）と
文法的に強い結び付きを持つ要素を束ねるものである。

文法２．ではメツセージ部の記述がある。これは文法２
、で生成されるＮＰが関係節（ｔｅｌ）を伴っていれば
５ＲＥＬというメツセージをＮＰに付加することを示し
ている。今の場合、関係節なので５ＲＥＬが付加される
。これは文法４．の条件部とマツチし、文法４．が適用
される。

文法４．の句構造部にある文法カテゴリ５ＲＥＬ／ＮＰ
は関係節を示している。ここで／はスラッシュと呼び、
欠けの情報を表す。つまり／ＮＰは関係節５ＲＥＬにお
いてＮＰが欠けていることを明示するためのものである
。５ＲＥＬ／ＮＰに対しては文法５゜が適用される。

文法５．では、意味部の（↑ｒｅｌｐｒｏ）　＝ＲＥＬ
ＰＲＯの記述によって、親である５ＲＥＬ／ＮＰの素性
構造の中の素性名ｒｅｌｐｒｏの素性構造が関係代名詞
ＨＥＬＰＲＯに伝播されるとともに、↑−（↑ｒｅｌｐ
ｒｏ）＝ＳＤＥＣの記述によって５ＲＥＬ／ＮＰの素性
構造からｒｅｌｐｒｏの素性構造を削除したものが５Ｄ
ＥＣに伝播される。この５ＤＥＣは文法３．を経て文法
６゜につながる。

なお、／ＮＰという欠けの情報は素性構造の中に５ｌａ
ｓｈ素性として持たせてあり、素性の伝播に従って自動
的に送られる。そして、ＮＰにこの情報が送られて（る
とφを出力するようになっている。

最終的に得られる句構造を第９図に示す。

〔他の実施例〕

前記実施例では関係節という言語現象をとりあげて説明
したが、本発明はこれに限らず幅広い言語現象に対応で
きるものである。他の実施例として、構文生成の重要な
役割である適切な語順の決定に関するものとして任意格
の処理について述べる。素性構造としては、第１２図の
“Ｉ　　５ｔｏｐ　　ａｔＫｏｂｅ　　ｔｏ　　ｒｅｓ
ｔ、”に対応する意味ネットワークから得られる第１３
図のものを用いる。第１３図の素性構造の処理に関する
文法ルールを第１４図に示す。

さて、任意格の処理の説明を行う。本例では５ｔｏｐの
任意格要素として目的格（ＰＵＲ）と場所格（ＳＰＡ）
がある。任意格の中では目的格、原因格、条件部などの
処理が優先されるので、目的格の処理が最初に行われる
。これは第１４図の文法１．のメツセージ部で、目的格
要素が動詞のときはｖＰにメツセージとして不定詞句を
表すＩＮＦを付加することによってなされる。つまり、
第１４図の文法３．の条件部は前置詞句を表すメツセー
ジＰＰを要求しているため適用されず、ＩＮＦを要求し
ている文法２．が適用される。なお、文法１．のメツセ
ージ部にあるｏｂｌはｏｂｌｉｑｕｅの略で、任意要素
を束ねる素性名である。

文法２．のメツセージ部では任意格があれば、子のｖＰ
にメツセージとしてＰＰを付加することが記述されてい
る。よって、ｖＰに対しては文法３．が適用される。文
法３゜の意味部では、任意格があれば、そのうちの１つ
の素性構造をＰＰの素性構造とすることが記述されてい
る。この記述は（↑ｏｂｌ＊ｘ）＝ＰＰであるが、ここ
で＊Ｘという変数によって任意のｌづの格要素を表して
いる。このようにして、今度は場所路が前置詞句として
生成される。

最終的に得られる句構造を第１５図に示す。

以上述べてきた実施例においては、概念構造として意味
ネットワークを用い、素性構造は意味ネットワークを変
換して得るものとしていた。しかし、素性を使って文法
機能を記述し、文の構成素間の関係をこの素性のユニフ
ィケーション（単一化）として表す文法であるユニフィ
ケーション文法に乗取った解析を行った場合、概念構造
として素性構造を用いることができるので、必ずしも意
味ネットワークから変換する方式を取る必要はない。

他の実施例として生成部の他の実施例を示す。

第１６図は生成部の流れ図である。

まず簡単に処理の概要を述べる。

このジェネレータ部の中心になるのは“ｇｅｎ”という
構文木を生成するプログラムである。

このプログラムは再帰的処理を行うプログラムであり　
ｇｅｎ”の中で“ｇｅｎ”を呼ぶことにより、構文木の
下位の構造を生成されていくものである。

ｇｅｎ”を呼ぶとき、引き数として、文法カテゴリとそ
れに対応する素性構造を渡す。　ｇｅｎ”は、引き数と
して与えられた文法カテゴリを親カテゴリとする部分木
を生成させようとする。このとき、この子カテゴリが終
端記号でないときは、さらに、この子カテゴリ以下の部
分木を生成させるために、この子カテゴリとそれに対応
する素性構造を引き数として“ｇｅｎ”を呼ぶ。子カテ
ゴリが終端記号のときは、これ以上下位の部分木が生成
されないので、この終端記号以下の部分木が確定し、こ
の部分木を、この終端記号を引き数とする“ｇｅｎ”の
返り値とする。

すべての子カテゴリについて、これを引き数とした“ｇ
ｅｎ“の返り値（部分木）が返されると、それらの返り
値（部分木）と親カテゴリとをまとめた部分木を作り、
これを親カテゴリを引き数とする“ｇｅｎ”の返り値と
する。

以上のようにして、最終的にはｂｕｎというトップカテ
ゴリを引き数とする　ｇｅｎ”の返り値つまり求める構
文木が得られる。

さて、それでは以下に第１５図につき詳細に説明する。

まず、ステップ５３０１で構文木のトップカテゴリ（最
上位の文法カテゴリ）であるｂｕｎと文の素性構造を引
き数として、生成プログラム“ｇｅｎ”を呼ぶ。この“
ｇｅｎ”の返り値が得られたら、ステップ５３０２でこ
れをＴＲＥＥという名の値としてセットする。これが求
める構文木である。

ｇｅｎ”は構文木を生成するための再帰的処理プログラ
ムである。　ｇｅｎ”では、まず、ステップ５３０４で
引き数として渡された文法カテゴリをｃａｔという名の
値としてセットし、素性構造をＦＳという名の値として
セットする。

そして、ステップ５３０５でｃａｔを親カテゴリとする
文法ルールを検索する。このとき、第１図の文法ルール
検索部１２が使われる。

ステップ５３０６でｃａｔを親カテゴリとする文法ルー
ルがあるかを調べ、ありだときステップ５３０７で文法
ルールを適用する。このとき、第１図の文法ルール解釈
部１３が使われる。文法ルールを適用する際、まず、ス
テップ５３０８で条件部を満足するか否かチエツクする
。満足しなかったときは、スチップ５３０９で他の文法
ルールがあるか否かチエツクする。他に文法ルールがな
ければ、ステップ５３１０へ進み構文生成は失敗する。

他に文法ルールがあれば、ステップ５３１１でその文法
ルールを適用する。

条件部を満足した場合、ステップ５３１２で句構造部と
意味部を実行し、素性の伝播を行う。そして、次にステ
ップ５３１３でメツセージ部を実行する。

以上のようにして文法ルールの適用が終了すると、ステ
ップ５３１４で文法ルールの子カテゴリとそれに対応す
る素性構造を引き数として“ｇｅｎ”を呼ぶ。

このようにして“ｇｅｎ“の中で″ｇｅｎ“を呼ぶ再帰
的処理が本ジェネレータ部の特徴である。このとき、一
般には、子カテゴリは複数あるので、ｇｅｎも複数実行
される。

そして、ステップ５３１５でこれらの“ｇｅｎ”の返り
値が得られたか否かチエツクし、すべての子カテゴリに
関する　ｇｅｎ”の返り値が得られた場合は、ステップ
８３１６で、これらの返り値と親カテゴリを１つのリス
トにまとめ、それを親カテゴリを引き数とした“ｇｅｎ
”の返り値として返す。この返り値が親カテゴリ以下の
部分木である。

ところで、今まではステップ５３０６の判定で、文法カ
テゴリｃａｔを親カテゴリとする文法ルールがあった場
合についてのべてきたが、次に文法ルールがなかった場
合について述べる。

このとき、ステップ５３１７でＣａｔが■（動詞）やＮ
（名詞）などの終端記号か否かチエツクし、ｃａｔが終
端記号でなければステップ８３１８へ進み、構文解析失
敗となる。

ｃａｔが終端記号のとき、ステップ５３１９でｃａｔに
伝播されてきた素性構造の中から単語を抽出する。

そして、ステップ５３２０でｃａｔと単語からなる部分
木を、ｃａｔを引き数とした“ｇｅｎ”の返り値として
返す。

〔発明の効果〕

本発明により、宣言的な記述がなされた文法ルールによ
る見通しの良い処理が可能となり、保守性・拡張性の高
い生成系が実現できる。また、生成した文の白文法性が
保証される効果がある。さらに、本発明の構文生成装置
は、素性を要素として表される素性構造をその入力とし
て受は取り、句構造を出するものであるが、このように
素性記述を導入することによって、従来別々であった解
析と生成をユニフィケーション文法という枠組みで同じ
様に記述できるようにもなった。

そして、構文木の上位ノードから下位ノードへの「素性
の伝播」という単一原理によって構文木（句構造）を生
成していくという非常にシンプルで体系的な生成方式と
なった。

【図面の簡単な説明】

第１図は本発明構文生成装置の一実施例の構成図、第２
図は機械翻訳システムの構成図、第３図、第４図、第１１図、第１２図は意味ネットワー
クを示す図、第５図は生成規則を表わす図、第８図、第１３図は素性構造を表わす図、第９図、第１
５図は句構造を表わす図、第１０図、第１４図は文法ル
ールを表わす図、第１６図は生成部の処理を示すフロー
チャートである。１１・・・文法ルール格納部１２・・・文法ルール検索部、１３・・・文法ルール解釈部、１４・・・生成部、１５・・・ワーキングメモリ、Ｓ２ワ一５３！ビ８１）ＰビＲ２）Ｖ２→ ＰＥＦＺヲンＮＰ→ ζａ）（１）ン（こン１、　ｂ＋７ｌ−５ＤｅＣＦＪＪＯ＠ｔｅＭ＋　ｍ５ＤｅｃＷｅ図窄ｑ口＝５４１ツ（イｓＨ≧］

Claims

【特許請求の範囲】句構造規則を記述した句構造領域と、該句構造領域に記
述された句構造規則における上位カテゴリから下位カテ
ゴリへの属性情報の伝播方法を記述した意味領域と、文
法ルールの適用条件を記述した条件領域と、前記下位カ
テゴリを上位カテゴリとする句構造規則に制約を与える
メッセージが記述されるメッセージ領域とを有する文法
ルールを記憶する文法ルール記憶手段と、該文法ルール記憶手段に記憶された文法ルールを検索す
るための検索手段と、前記文法ルール記憶手段に記憶された文法ルールを解釈
するための解釈手段と、前記文法ルール記憶手段に記憶された文法ルールを、前
記検索手段によって検索し、前記解釈手段によって解釈
しながら適用して、文法機能の情報の集合から句構造を
生成する生成手段とを有することを特徴とする自然言語
文生成装置。