JPH02240769A - 自然言語文生成装置 - Google Patents

自然言語文生成装置

Info

Publication number
JPH02240769A
JPH02240769A JP1063253A JP6325389A JPH02240769A JP H02240769 A JPH02240769 A JP H02240769A JP 1063253 A JP1063253 A JP 1063253A JP 6325389 A JP6325389 A JP 6325389A JP H02240769 A JPH02240769 A JP H02240769A
Authority
JP
Japan
Prior art keywords
grammar
grammatical
rule
rules
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1063253A
Other languages
English (en)
Inventor
Yoshihiro Tokuume
徳梅 喜啓
Shogo Shibata
柴田 昇吾
Koichi Tanagi
棚木 孝一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1063253A priority Critical patent/JPH02240769A/ja
Priority to US07/491,811 priority patent/US5101349A/en
Priority to EP90302676A priority patent/EP0388156B1/en
Priority to DE69031354T priority patent/DE69031354T2/de
Publication of JPH02240769A publication Critical patent/JPH02240769A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、自然言語処理システムに関し、特に、構・文
生成装置に関するものである。
[従来の技術] 自然言語入力を受けて、自然言語出力を行なう自然言語
処理システムでは、例えば日本語から英語への機械翻訳
システムの場合、先ず、日本語文の解析を行なって、日
本語の概念構造(意味構造)を決定する。この概念構造
は、一般に、概念を表わすノードと概念間の関係を表わ
すアークからなる意味ネットワークで表現される。日本
語解析によって得られた上記の日本語の概念は、日本概
念構造から英語文を訳出するのが生成である。
第2図は一般的な機械翻訳システムの構成図である。第
2図においてS21は入力文である。21は入力文を形
態素に分割する形態素解析装置で、入方丈が日本語のよ
うな膠着語の場合に必要となるが、英語のような屈折語
の場合は不要である。
する構文解析装置である。
S23は、単語列S22が構文解析された結果得られる
構文木であり、23は構文木S23に基づいて、意味の
レヴエルでの解析を行う意味解析装置である。
S24は意味解析の結果得られる意味構造であり、24
は入力言語の意味構造S24を訳出言語の意味構造S2
5に変換するトランスファ装置である。
25は訳出言語の意味構造S25から構文木826を生
成する構文生成装置であり、26は構文木S26から訳
出文S27を生成する形態素生成装置である。
なお、従来はこの他に生成系を構文生成装置と形態素生
成装置に分けず、意味構造から構文木を生成せずに、直
接訳出文を出力する方式も多く用いられていた。
第3図はデイスプレィ画面(CRT)上の6つのウィン
ドウに表示された第2図の入力文S21.構文木S23
、およびS26、意味構造S24、およびS25、出力
文S27の一例を示す。
本発明は第2図の構文生成装置25の如き構文生成装置
に関するものである。
従来の生成装置では、日経エレクトロニクス1984年
12月17日号の「言語に依存しない概念構造を中間表
現とし、常識を使う多言語向き機械翻訳システム」ある
いは、特開昭63−136260号で説明されているよ
うに、意味ネットワークの如き概念構造をなぞりなから
ノード名(以下、単語という)をキーワードとして辞書
を引き、そこから文生成規則格納部に格納されている上
記単語に関係する文生成規則を起動し、訳文を生成して
いく方式をとっていた。
つまり、辞書にはその単語に関する生成規則群を示す生
成記号が格納されており、生成記号は、生成規則のなか
で、その単語についての生成規則群を示すポインタの役
目をしている。生成規則は意味ネットワークのノードや
アークを一つ一つ調べて単語列を得るためのプロダクシ
ョンルールとみなすことができる。生成規則は名詞、自
動詞、他動詞、代名詞主格、代名詞目的格といった細か
い品詞分類ごとに作成されている。一つの生成規則群は
いくつかの生成規則から成っている。その適用する順序
が決まっており、この順序が単語の語順を決定する。
さて、このような従来の生成方式によつて、第4図に示
す意味ネットワークから英語文″He  wentto
  Kobe  by  bus、”を生成する過程を
説明する。第4図の意味ネットワークにおいて、二重丸
のノードは用言を表している。アーク名がAGENT。
GOAL、lN5Tのアークはそれぞれ動作主、目標、
道具といった深層格関係を表している。また、PAST
なるアークは過去時制であることを示し、STなるアー
クは文中の最も中心となる述語を指す。生成規則の例を
第5図に示す。
さて、第4図の意味ネットワークにおいて、文生成はま
ずSTというアークが入っているノード“g。
から始める。生成規則を解釈するルール・インクブリ店
夕は“go”″に関する生成規則を一つずつ調べて行く
。go”の生成記号はVlである。これは、VI(自動
詞)の生成規則を1から順に使用することを示す。まず
、第5図の自動詞に関する規則(1)を適用する。そし
て、アウト・アーク(ノードから出ているアーク)のA
GENTを主語として生成しようとする。この結果アウ
ト・アークAGENTから始まるサブネットワークに処
理が移る。このときの5UBJ (主語)というメツセ
ージをノード’he”に送る。
AGENTで始まるサブネットワークを処理するために
、まずノード“he”に移動する。このとき、ノード“
go”について処理中であることを示すフラグを立てる
。“he”の生成記号はPS(代名詞主格)なので第5
図の代名詞主格の生成規則を適用する。ノードa h 
e#には5UBJ (主語)というメツセージがすでに
送られているが、これは代名詞主格の規則(1) 〜(
4)の< condition >とは合わず、(5)
と適合する。そして、< action >に示すとお
り自分自身を出力する。この後適用する生成規則がもう
ないので、AGENTで始まるサブネットワークの生成
を終わる。そして、ノード“g。
に戻る。
ノード“go”は自動詞VIの生成規則の規則(2)以
降を順に適用する。生成規則(2)〜(4)は、ノード
“go”の構造から、適用する必要はない。
ノード“go”から時制情報PASTのアークが出てい
るので、その次の規則(5)を適用する。そして、go
”の過去形“went”を出力する。次に規則(8)に
移り、アウト・アークのGOALから始まるサブネット
ワークに対応する句の生成に移る。これも前のアウト・
アークAGENTと同様の過程を経る。
アークGOALから前置詞“to”を選ぶときに、g。
と“Kobe”が“to”を介して共起するチエツクす
る。こうして、このサブネットワークから“t。
Kobe”が生成される。
さらに規則(9)によつてlN5Tから始まるサブネッ
トワークに対する句の生成を行う。この結果“by  
bus”を生成する。最後にイン−アークSTからピリ
オドを生成し、ノード′go”の周りのアークの処理を
すべて終わる。これで文生成が完了し、結果としてHe
  went  to  Kobe  by  bus
という英語文が得られる。
また、情報処理学会第28回(昭和59年前期)全国大
会の5L−3の「概念依存図式からの英文生成」で述べ
られているように、下記のような句構造規則を改良した
文法ルールを用いて、意味ネットワークから句構造を生
成する過程(構文生成過程)を設ける方式が考えられて
いる。
1、 5(NP(A) VP(’/(*) NP(0)
)2、   S (NP (A)VP (V (木) 
 lNF2 (0)))3、 3(NP(A) VP(
V(*) NP(R)NP(0)))ここで、α(βl
・・・βn)は、αをβl、・・・βnの並びに書き換
える句構造規則である。木は熟語を、Aは動作主格を、
Oは対象格を、Rは受は手格を表す。
〔発明が解決しようとしている課題〕
しかしながら、上述の従来例の内、構文生成過程を設け
ない自然言語処理システムでは、意味ネットワークから
文生成を行うとき、意味ネットワークをなぞりなからノ
ード名をキーワードとして単語辞書を引き、そこから文
生成規則格納部に格納されている上記単語に関係する文
生成規則を起動し、訳文を生成してい(方式をとってい
たため、生成規則の規模が増大するにつれて、文生成規
則の作成者以外にはその構造的な理解が困難となったて
、保守性が著しく低下し、また拡張性にも乏しいという
問題があった。
また、この生成方式では、生成規則の適用順序が語順を
決定するようになっていたが、このように、文法(句構
造規則)が陽に現れていない方式では、生成した文の白
文法性が保証されないという問題があった。
一方、構文生成過程を設けた上記従来例においては、構
文的規則である句構造規則の中に、意味的情報である格
情報を混在させるため、下記のように、同じ句構造規則
を複数書かねばならないという問題が起こる。
1.5(NP(A)VP(V(*)NP(0)))I 
 give  him  a  book。
2、 5(NP(A)  VP(V(ネ)  NP(C
)))I  call  him  a  5chol
ar。
ここで、Cは内容規定格である。
[課題を解決するための手段] 本発明は、句構造規則を記述した句構造領域と、該句構
造領域に記述された句構造規則における上位カテゴリか
ら下位カテゴリへの属性情報の伝播方法を記述した意味
領域と、文法ルールの適用条件を記述した条件領域と、
前記下位カテゴリを上位カテゴリとする句構造規則に制
約を与えるメツセージが記述されるメツセージ領域とを
有する文法ルールを記憶する文法ルール記憶手段と、該
文法ルール記憶手段に記憶された文法ルールを検索する
ための検索手段と、前記文法ルール記憶手段に記憶され
た文法ルールを解釈するための解釈手段と、前記文法ル
ール記憶手段に記憶された文法ルールを、前記検索手段
によって検索し、前記解釈手段によって解釈しながら適
用して、文法機能の情報の集合から句構造を生成する生
成手段とを有して構成される。
素性値からなり、文法機能を表わすものである。
素性名の簡単な例としては、主語、目的語、姓、数、格
などがある。
また、本発明の構文生成装置は、素性を要素として表わ
される素性構造(feature 5tructure
 )をその入力として受取り、句構造を出力するもので
あるが、このように素性構造を導入することによって、
従来別々であった解析と生成を、ユニフィケーション文
法という枠組で、同じように記述できるようにもなった
なお、ユニフィケーション文法とは、 1.5chieber:An 1ntroductio
n to Unification−Based ap
proaches to Grammar。
C3LI Lecture Notes No、4.1
9862、野村:自然言語処理の基礎技術、電子情報通
信学会線、コロナ社(198g) に述べられているように、素性を使って文法を記述し、
文の構成素間の関係をこの素性のユニフイーケーション
(単一化)として表すものである。また、ユニフィケー
ションとは一種の和集合演算である。
さて、以下にユニフィケーション文法を使ってユニフィ
ケーション操作により文構造を解析する文法(ユニフィ
ケーション解析)について説明する。
ユニフィケーション文法は、何種類かのものがあるが、
ここではLFG (Lexical  Functio
nalGrammar)を取り上げて説明する。
L應Gでは、文法規則として句構造規則に文法機文 能を加えたものを使う。文の構造表現には、構造木を表
すC−構造と文法機能の階層構造を表すF−構造の2つ
の階層を使う。ここでF−’構造は素性構造である。
C−構造(Constituent  5tructu
re)は、構文木そのものである。これは、L P G
文法規則の中の句構造規則の部分を使って通常の構文解
析を行った結果として得られる解析木を表す。F−構造
(Functional  5tructure)は、
C−構造が表す構文構造に対応させて、文法規則の中に
記述されている文法機能の関係を階層的に表した素性構
造である。C−構造は、F−構造を求める過程で使われ
るものであり、従って、LPGの解析結果はF−構造で
表される。例えば、文法規則の句構造規則の部分として
第6図(a)句構造規則ERを使うと、文″He  5
ees  tables”に対するC−構造は第6図(
b)のようになる。
このC−構造に対して、F−構造は、例えば第6図(C
)のように表わされる。
このF−構造(素性構造)の概略は次の通りである。主
語“5UBJ”は数が単数“NUMSG”で人称が三人
称“PER33”で、性は男性“GEN MASC”で
、格が主格“CASE  NOM”で、その内容がHE
“PRED  HE”であるという文法機能を表してい
る。また、この文の時制は現在時制“TENSE PR
ES”である。目的語“OBJ”は、複数″NUMPL
″で、その内容1;!TABLE ”PRED  TA
BLE’ であ6゜この文の述語は、“5EES”であ
り、それは述語と目的語を取り、“PRED  ’5E
ES< (SUBJ)(OBJ)>’”という形で特徴
づけられる。
ここで、“5UBJ−や“OBJ”やNUM”などが文
法機能である。これらの文法機能を素性標識として使う
。素性値には、原始値を取るものと、F−構造を取るも
のとの二種類がある。原始値を取るものとは、例えば、
素性“NUM”に対する素性値“SG”や“PL”であ
る。F−構造を取るものとは、例えば、素性“5UBJ
”やOBJ”に対する素性値である。この場合、F−構
造は階層構造となる。
さて、次にLPGの文法規則を説明する。
LPGの文法規則は、句構造規則にその句構造規則の中
に現れる非終端標識の間の文法機能をつけ加えて表す。
文法機能は、メタ変数を使って機能スキーマと呼ぶ形で
表す。例えば、次のように表す。
LRI) LR2) LR3) LR4) LR5) LR6) S →  NP        VP (↑5UBJ)−↓  ↑−↓ VP、V   (NP)       (PP)(↑0
BJ) =↓  (↑(↓PCASE))−↓VP、V
   (NP)    (NP)      (PP*
)(↑0BJ)  ↓ (↑0BJ2)  ↓ (↑A
DJUNσ0 ↓NP−NP    (PP本) ↑ツ↓ (↑ADJUNCT)−↓ NP→(D)  (A)   N PP→P      NP (↑0BJ) =↓ ここで、それぞれの文法規則は、句構造規則と、句構造
規則の右辺の非終端標識につけられた式か数と呼ぶ。
メタ変数↑は、その句構造規則の左辺の非終端標識に対
応づけられているF−構造を指す。すなわち、その句構
造規則に対応する構文木の中の親ノードのF−構造を指
す。例えば(↑5UBJ)は、親ノードのF−構造にあ
る5UBJを指している。メタ変数↓は、その機能スキ
ーマがつけられている非終端標識に対応づけられている
F−構造を指す。
すなわち、その句構造規則に対応する構文木のその子ノ
ードのF−構造を指す。なお、句構造規則の中の括弧(
)で囲まれた非終端標識は省略できることを示す。また
、木のついた要素は0個以上出現することを示し、それ
らの出現順序は問わない。
木のついた要素が複数個出現するときは、それぞれを独
立に扱う。すなわち、それぞれ独立なF−構造を持つ。
LRIは、句構造規則ERIに対応する。LRIは、文
Sは名詞句NPと動詞句vPがこの順序で並んだもので
あり、かつそれぞれはそれぞれにつけられている機能ス
キーマが示す条件を満たさなければならないことを示す
LRIの右辺の第1項 NP (↑5UBJ) =’↓ は、rNPのF−構造は親ノードのF−構造の5UBJ
の部分へ移る」と読む。すなわち、この名詞句NPのF
−構造は、文Sの主語5UBJのF−構造であることを
示す。従って、文の主語の文法機能は、LRIの句構造
規則におけるNPが持つ文法機能であることが示されて
いる。
LPIの右辺の第2項 NP ↑=↓ は、rVPのF−構造は親ノードのF−構造へ移る」と
読む。機能スキーマ↑=↓は、句構造規則の右辺の子ノ
ードの中で、それがつけられているノードがヘッド(生
酔)であることを表す。
さて、次に辞書項目の表現について述べる。
辞書の鉛量項目も機能スキーマを使って表す。機能スキ
ーマの中のメタ変数↑は、文法規則のときと同じく親ノ
ードのF−構造を参照する。鉛量項目の親ノードは常に
前終端標識である。次に鉛量項目の例を示す。
LDI)  5ees : V (↑TENSE)=P
RES(↑5UBJ NUM)=SG (↑5UBJ PER3) =3 (↑PRED)= ’5EES<(↑5UBJ)(↑0
BJ) >’LD2)   he:  N(↑NUM)
=SG(↑PER8)=3 (↑GEN)=MASC (↑CASE)=NOM (↑PRED)=HE LD3)  tables : N (↑NUM)=P
L(↑PRED)= ’TABLES’ ここで、素性のTENSEは時制を、NUMは数を、P
ER3は人称を示す。また、素性値のSGは単数を、P
Lは複数を、3は三人称を示す。LDIは、5eesが
動詞であることをVによって示している。また、(↑T
ENSE)=PRESによって動詞5eesが現在形で
あることを示している。更に、(↑5UBJ  NUM
)=SG、(↑5UBJ  PER3)=3によって主
語は三人称単数でなければならないことを示している。
素性PREDの値は記号゛で囲まれているが、°′で囲
まれた内容を意味形と呼ぶ。意味形は、その項目の意味
解釈の情報を与える。
さて、以上でLPGの文法と辞書の説明ができたのでL
PGによる文解析方法について説明する。
解析はC−構造の作成とF−構造の作成の2段階で行う
。C−構造の作成は、文法規則の中の句構造規則の部分
と辞書の中の品詞の部分を用いて通常の構文解析により
行う。このとき機能スキーマの部分は用いない。
C−構造ができると機能スキーマを用いてC−構造から
F−構造を求める。このときユニフィケーションという
操作を用いる。
今、C−構造として第6図(b)が得られたとする。こ
のとき、上記LDI)によって、VのF −構造は であり、上記LD3)によってtable”に対応する
NPのF−構造は である。
そして、上記LR2)の機能スキーマから、vpのF−
構造は となる。このように、VのF−構造FSI)とNPのF
−構造Fs2)をり、R2)の機能スキーマに従って1
つのより大きなF−構造FS3)にまとめ上げる操作が
ユニフィケーションである。
ユニフィケーションは一種の和集合演算であるが、無矛
盾性のチエツクも行う。
さて、次に“he”に対応するNPのF−構造はLD2
)より である。よって、LRl)の機能スキーマから、SのF
−構造は となる。ここで上記“he”は対応するNPのF−構造
FS4)における[:NUM  SGIと(PER33
〕ハ上記VP(7)F−構造FS3)(7)SUBJ(
7)中の(NUM  SG)と(PER33)と矛盾し
ないのでユニフィケーションが無事行われる。
以上のようにして求められたSのF−構造FS5)が最
終的に求まる文の意味構造である。
〔実施例〕
以下、図面を参照して本発明の実施例を詳細に説明する
第1図は、本実施例の構文生成装置の構成図である。こ
の構文生成装置は素性構造から句構造を生成するもので
ある。
第1図において、11は構文生成用の文法ルール格納部
である。文法ルール格納部に収納された格文法ルールは
、句構造部、意味部、条件部、メツセージ部から構成さ
れている。ここで、句構造部には、”5DEC−NP 
 VP″’P“VP−+VNP“などの句構造規則が記
述されている。(SDECは平叙文を、NPは名詞句を
、vpは動詞句を、■は動詞を表し、これらを文法カテ
ゴリという。)意味部には、親カテゴリ(句構造規則の
左辺の文法カテゴリ)から子カテゴリ(句構造規則の右
辺の文法カテゴリ)への素性情報の伝播方法が記述され
ている。条件部はその文法の適用条件を記述するための
もので、メツセージ部はその文法の子カテゴリを親カテ
ゴリとする文法ルールを適用するときの制約を与えるた
めのものである。12は文法ルール検索部である。13
は文法ルール解釈部である。ここは、文法ルール検索部
12が文法ルール格納部11から検索してきた文法ルー
ルを解釈するところである。14は生成部である。ここ
は、各種情報の入出力の制御や、文法ルールを適用して
句構造を生成してい(ところである。15はワーキング
メモリ(作業領域)である。ここには最初、文の意味を
表す素性構造がセットされる。そして、これをもとに、
このワーキングメモリ上で句構造を築き上げてい(。
第7図は、第1図の構文生成装置による構文生成処理の
流れ図の一例である。以下に第7図の説明を行う。
まず、ステップS201で、第8図のような素性構造が
、構文木の最上位に位置する文法カテゴリbunにセッ
トされる。次に、ステップ5202でbunを親カテゴ
リ(句構造規則の左辺の文法カテゴリ)とする文法ルー
ルを検索する。そして、ステップ5203で、検索した
文法ルールの条件部に記述された文法適用条件を検査す
る。ステップ5204では、この文法適用条件を満足し
ていなければ、他にbunを親カテゴリとする文法ルー
ルがあるか検査する。
他になければ、ステップ5205へ進み、構文生成は失
敗する。他にあれば、ステップ5206でその文法ルー
ルを適用し、ステップ5203に戻り、その条件部に記
述された文法適用条件を満足するか検査する。満足した
場合は、その文法ルールの適用が可能となる。
そして、次にステップ5207へ進み、文法ルールの句
構造部や意味部を実行する。句構造部には、句構造規則
が記述されている。意味部には、親カテゴリの素性情報
の子カテゴリへの伝播方法が記述されている。意味部の
記述に従つて、親カテゴリから子カテゴリへ素性情報を
伝播させてい(ことによって、文の情報が適切に分配さ
れてい(。
さて、次に、ステップ8208でメツセージ部を実行す
る。メツセージ部はその文法ルールの子カテゴリを親カ
テゴリとする文法ルールを適用するときの制約を与える
ために設けられている。つまり、上記条件部とメツセー
ジ部によって文法ルールを適用していくときの制御を行
っている。
以上のようにして文法ルールが実行されると、次に、更
に下位の句構造(構文木)を生成していくために、ステ
ップ5209でこの文法ルールの子カテゴリを親カテゴ
リとする文法ルールがあるか検索する。文法ルールがあ
れば、ステップ5203のへ戻り、その文法ルールを適
用できるか否か見るため条件部を検査する。そして、上
述の処理を繰り返す。
子カテゴリを親カテゴリとする文法ルールがなければ、
ステップ5210でその子カテゴリが終端記号か否か検
査する。なお、終端記号とは図6のNやVのようにそれ
以上下位の文法カテゴリを持たない文法カテゴリをいう
終端記号でない場合は、ステップ5211へ進み、構文
解析は失敗する。終端記号の場合は、ステップ5212
で、その終端記号に伝播されてきた素性情報の中から単
語を取りだす終端記号の下に接続する。ステップ521
3では、このようにして、すべての終端記号に対して単
語が決定されたかを見て、決定されていれば、構文生成
は終了する。もし、まだ単語の決定されていない終端記
号があれば、ステップ5212へ戻り、その終端記号に
対して単語を決定する。
第10図は文法ルールの例である。ここで、@semは
意味部を、@ c o nは条件部、@ m e sは
メツセージ部を示す。↑は親カテゴリの素性構造を示す
。=は素性構造が等しいことを、−は素性構造の削除を
示す。==および≠は値の一致、不一致を表す。
+十はメツセジの付加を表す。また、文法カテゴリにつ
いては、bunは文、5DECは平叙文、ENDは句点
、NPは名詞句、BEPはbe動詞句、PREDは叙述
句(Predicate  Phrases、)、vP
は動詞句、DDETは定冠詞などの定の限定詞句、NO
MHDは名詞句生酔、5REL/NPは関係節、HEL
PROは関係代名詞、■は動詞を示す。
文法ルールの詳細は後程、本構文生成装置の処理過程を
説明する中で述べる。
is  John、”に対応するものである。
第8図は素性構造の例である。図の如く素性構造とは素
性名と素性値の対の集合である。素性値は単なる値の場
合だけでなく素性構造となっている場合もある。第7図
において(1)は素性構造のリンクを表す。第8図の素
性構造は第11図の意味ネットワークを変換して得られ
たものである。なお、この変換に際しては英語辞書が参
照される。
さて、それでは以下に本構文生成装置が図5の素性構造
から句構造を生成する過程を説明する。
この処理に関係する文法ルールは第10図の如くである
まず、第8図の素性構造がbunにセットされ、構文生
成が始まる。最初に第10図の文法lが適用され、bu
nの素性構造はそのまま5DECに伝播される。次に5
DECの主動詞の文法コードがW v 1 。
であるので文法2.の条件部とマツチし、文法2.が適
用される。ここで、文法2.の条件部に記述されている
(↑head  5yn) ==Wvlは5DECの素
性構造の中・の素性名headの素性構造の中の素性名
synの素性値がWvlであるこを示している。なお、
素性名synは5yntax  codeの略で、Wv
lはL o n g m a n D i c t i
 o n a r y Of Co n t e m 
p o r a r yEnglishの文法コードで
ありbe動詞を意味する。
文法2.では、意味部の(↑5ubcat  5UB)
 =NPの記述が特に重要である。この記述に従って、
親である5DECの素性構造の中の素性名5ubcat
の素性構造の中の素性名SUBの素性構造がNPに伝播
される。なお、5ubcatはsubcategori
zationの略で、主動詞(今の場合はbe動詞)と
文法的に強い結び付きを持つ要素を束ねるものである。
文法2.ではメツセージ部の記述がある。これは文法2
、で生成されるNPが関係節(tel)を伴っていれば
5RELというメツセージをNPに付加することを示し
ている。今の場合、関係節なので5RELが付加される
。これは文法4.の条件部とマツチし、文法4.が適用
される。
文法4.の句構造部にある文法カテゴリ5REL/NP
は関係節を示している。ここで/はスラッシュと呼び、
欠けの情報を表す。つまり/NPは関係節5RELにお
いてNPが欠けていることを明示するためのものである
。5REL/NPに対しては文法5゜が適用される。
文法5.では、意味部の(↑relpro) =REL
PROの記述によって、親である5REL/NPの素性
構造の中の素性名relproの素性構造が関係代名詞
HELPROに伝播されるとともに、↑−(↑relp
ro)=SDECの記述によって5REL/NPの素性
構造からrelproの素性構造を削除したものが5D
ECに伝播される。この5DECは文法3.を経て文法
6゜につながる。
なお、/NPという欠けの情報は素性構造の中に5la
sh素性として持たせてあり、素性の伝播に従って自動
的に送られる。そして、NPにこの情報が送られて(る
とφを出力するようになっている。
最終的に得られる句構造を第9図に示す。
〔他の実施例〕
前記実施例では関係節という言語現象をとりあげて説明
したが、本発明はこれに限らず幅広い言語現象に対応で
きるものである。他の実施例として、構文生成の重要な
役割である適切な語順の決定に関するものとして任意格
の処理について述べる。素性構造としては、第12図の
“I  5top  atKobe  to  res
t、”に対応する意味ネットワークから得られる第13
図のものを用いる。第13図の素性構造の処理に関する
文法ルールを第14図に示す。
さて、任意格の処理の説明を行う。本例では5topの
任意格要素として目的格(PUR)と場所格(SPA)
がある。任意格の中では目的格、原因格、条件部などの
処理が優先されるので、目的格の処理が最初に行われる
。これは第14図の文法1.のメツセージ部で、目的格
要素が動詞のときはvPにメツセージとして不定詞句を
表すINFを付加することによってなされる。つまり、
第14図の文法3.の条件部は前置詞句を表すメツセー
ジPPを要求しているため適用されず、INFを要求し
ている文法2.が適用される。なお、文法1.のメツセ
ージ部にあるoblはobliqueの略で、任意要素
を束ねる素性名である。
文法2.のメツセージ部では任意格があれば、子のvP
にメツセージとしてPPを付加することが記述されてい
る。よって、vPに対しては文法3.が適用される。文
法3゜の意味部では、任意格があれば、そのうちの1つ
の素性構造をPPの素性構造とすることが記述されてい
る。この記述は(↑obl*x)=PPであるが、ここ
で*Xという変数によって任意のlづの格要素を表して
いる。このようにして、今度は場所路が前置詞句として
生成される。
最終的に得られる句構造を第15図に示す。
以上述べてきた実施例においては、概念構造として意味
ネットワークを用い、素性構造は意味ネットワークを変
換して得るものとしていた。しかし、素性を使って文法
機能を記述し、文の構成素間の関係をこの素性のユニフ
ィケーション(単一化)として表す文法であるユニフィ
ケーション文法に乗取った解析を行った場合、概念構造
として素性構造を用いることができるので、必ずしも意
味ネットワークから変換する方式を取る必要はない。
他の実施例として生成部の他の実施例を示す。
第16図は生成部の流れ図である。
まず簡単に処理の概要を述べる。
このジェネレータ部の中心になるのは“gen”という
構文木を生成するプログラムである。
このプログラムは再帰的処理を行うプログラムであり 
gen”の中で“gen”を呼ぶことにより、構文木の
下位の構造を生成されていくものである。
gen”を呼ぶとき、引き数として、文法カテゴリとそ
れに対応する素性構造を渡す。 gen”は、引き数と
して与えられた文法カテゴリを親カテゴリとする部分木
を生成させようとする。このとき、この子カテゴリが終
端記号でないときは、さらに、この子カテゴリ以下の部
分木を生成させるために、この子カテゴリとそれに対応
する素性構造を引き数として“gen”を呼ぶ。子カテ
ゴリが終端記号のときは、これ以上下位の部分木が生成
されないので、この終端記号以下の部分木が確定し、こ
の部分木を、この終端記号を引き数とする“gen”の
返り値とする。
すべての子カテゴリについて、これを引き数とした“g
en“の返り値(部分木)が返されると、それらの返り
値(部分木)と親カテゴリとをまとめた部分木を作り、
これを親カテゴリを引き数とする“gen”の返り値と
する。
以上のようにして、最終的にはbunというトップカテ
ゴリを引き数とする gen”の返り値つまり求める構
文木が得られる。
さて、それでは以下に第15図につき詳細に説明する。
まず、ステップ5301で構文木のトップカテゴリ(最
上位の文法カテゴリ)であるbunと文の素性構造を引
き数として、生成プログラム“gen”を呼ぶ。この“
gen”の返り値が得られたら、ステップ5302でこ
れをTREEという名の値としてセットする。これが求
める構文木である。
gen”は構文木を生成するための再帰的処理プログラ
ムである。 gen”では、まず、ステップ5304で
引き数として渡された文法カテゴリをcatという名の
値としてセットし、素性構造をFSという名の値として
セットする。
そして、ステップ5305でcatを親カテゴリとする
文法ルールを検索する。このとき、第1図の文法ルール
検索部12が使われる。
ステップ5306でcatを親カテゴリとする文法ルー
ルがあるかを調べ、ありだときステップ5307で文法
ルールを適用する。このとき、第1図の文法ルール解釈
部13が使われる。文法ルールを適用する際、まず、ス
テップ5308で条件部を満足するか否かチエツクする
。満足しなかったときは、スチップ5309で他の文法
ルールがあるか否かチエツクする。他に文法ルールがな
ければ、ステップ5310へ進み構文生成は失敗する。
他に文法ルールがあれば、ステップ5311でその文法
ルールを適用する。
条件部を満足した場合、ステップ5312で句構造部と
意味部を実行し、素性の伝播を行う。そして、次にステ
ップ5313でメツセージ部を実行する。
以上のようにして文法ルールの適用が終了すると、ステ
ップ5314で文法ルールの子カテゴリとそれに対応す
る素性構造を引き数として“gen”を呼ぶ。
このようにして“gen“の中で″gen“を呼ぶ再帰
的処理が本ジェネレータ部の特徴である。このとき、一
般には、子カテゴリは複数あるので、genも複数実行
される。
そして、ステップ5315でこれらの“gen”の返り
値が得られたか否かチエツクし、すべての子カテゴリに
関する gen”の返り値が得られた場合は、ステップ
8316で、これらの返り値と親カテゴリを1つのリス
トにまとめ、それを親カテゴリを引き数とした“gen
”の返り値として返す。この返り値が親カテゴリ以下の
部分木である。
ところで、今まではステップ5306の判定で、文法カ
テゴリcatを親カテゴリとする文法ルールがあった場
合についてのべてきたが、次に文法ルールがなかった場
合について述べる。
このとき、ステップ5317でCatが■(動詞)やN
(名詞)などの終端記号か否かチエツクし、catが終
端記号でなければステップ8318へ進み、構文解析失
敗となる。
catが終端記号のとき、ステップ5319でcatに
伝播されてきた素性構造の中から単語を抽出する。
そして、ステップ5320でcatと単語からなる部分
木を、catを引き数とした“gen”の返り値として
返す。
〔発明の効果〕
本発明により、宣言的な記述がなされた文法ルールによ
る見通しの良い処理が可能となり、保守性・拡張性の高
い生成系が実現できる。また、生成した文の白文法性が
保証される効果がある。さらに、本発明の構文生成装置
は、素性を要素として表される素性構造をその入力とし
て受は取り、句構造を出するものであるが、このように
素性記述を導入することによって、従来別々であった解
析と生成をユニフィケーション文法という枠組みで同じ
様に記述できるようにもなった。
そして、構文木の上位ノードから下位ノードへの「素性
の伝播」という単一原理によって構文木(句構造)を生
成していくという非常にシンプルで体系的な生成方式と
なった。
【図面の簡単な説明】
第1図は本発明構文生成装置の一実施例の構成図、第2
図は機械翻訳システムの構成図、 第3図、第4図、第11図、第12図は意味ネットワー
クを示す図、 第5図は生成規則を表わす図、 第8図、第13図は素性構造を表わす図、第9図、第1
5図は句構造を表わす図、第10図、第14図は文法ル
ールを表わす図、第16図は生成部の処理を示すフロー
チャートである。 11・・・文法ルール格納部 12・・・文法ルール検索部、 13・・・文法ルール解釈部、 14・・・生成部、 15・・・ワーキングメモリ、 S2ワ 一53! ビ81) P ビR2) V2→ P EFZヲン NP→ ζa) (1)ン (こン 1、 b+7l−5DeCFJJO @teM+ m5Dec We図 窄q口 =541 ツ(イsH≧]

Claims (1)

  1. 【特許請求の範囲】 句構造規則を記述した句構造領域と、該句構造領域に記
    述された句構造規則における上位カテゴリから下位カテ
    ゴリへの属性情報の伝播方法を記述した意味領域と、文
    法ルールの適用条件を記述した条件領域と、前記下位カ
    テゴリを上位カテゴリとする句構造規則に制約を与える
    メッセージが記述されるメッセージ領域とを有する文法
    ルールを記憶する文法ルール記憶手段と、 該文法ルール記憶手段に記憶された文法ルールを検索す
    るための検索手段と、 前記文法ルール記憶手段に記憶された文法ルールを解釈
    するための解釈手段と、 前記文法ルール記憶手段に記憶された文法ルールを、前
    記検索手段によって検索し、前記解釈手段によって解釈
    しながら適用して、文法機能の情報の集合から句構造を
    生成する生成手段とを有することを特徴とする自然言語
    文生成装置。
JP1063253A 1989-03-14 1989-03-14 自然言語文生成装置 Pending JPH02240769A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1063253A JPH02240769A (ja) 1989-03-14 1989-03-14 自然言語文生成装置
US07/491,811 US5101349A (en) 1989-03-14 1990-03-12 Natural language processing system
EP90302676A EP0388156B1 (en) 1989-03-14 1990-03-13 Natural language processing system
DE69031354T DE69031354T2 (de) 1989-03-14 1990-03-13 Natursprachenverarbeitungssystem

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1063253A JPH02240769A (ja) 1989-03-14 1989-03-14 自然言語文生成装置

Publications (1)

Publication Number Publication Date
JPH02240769A true JPH02240769A (ja) 1990-09-25

Family

ID=13223906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1063253A Pending JPH02240769A (ja) 1989-03-14 1989-03-14 自然言語文生成装置

Country Status (4)

Country Link
US (1) US5101349A (ja)
EP (1) EP0388156B1 (ja)
JP (1) JPH02240769A (ja)
DE (1) DE69031354T2 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129469A (ja) * 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
US5418716A (en) * 1990-07-26 1995-05-23 Nec Corporation System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases
US5369574A (en) * 1990-08-01 1994-11-29 Canon Kabushiki Kaisha Sentence generating system
EP0494788B1 (en) * 1991-01-11 1996-10-02 Canon Kabushiki Kaisha Fault diagnosis using simulation
US5297040A (en) * 1991-10-23 1994-03-22 Franklin T. Hu Molecular natural language processing system
JPH05151260A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JP2801459B2 (ja) * 1992-02-21 1998-09-21 富士通株式会社 オブジェクトネットワークによる言語処理システム
JPH05324702A (ja) * 1992-05-20 1993-12-07 Fuji Xerox Co Ltd 情報処理装置
US5369573A (en) * 1992-07-02 1994-11-29 Docustructure Corporation Structured document syntax management
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5384702A (en) * 1993-09-19 1995-01-24 Tou Julius T Method for self-correction of grammar in machine translation
US5717913A (en) * 1995-01-03 1998-02-10 University Of Central Florida Method for detecting and extracting text data using database schemas
GB2300495A (en) * 1995-04-13 1996-11-06 Canon Kk Language processing
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US6292767B1 (en) * 1995-07-18 2001-09-18 Nuance Communications Method and system for building and running natural language understanding systems
JPH0981569A (ja) * 1995-09-12 1997-03-28 Hitachi Ltd 多カ国対応サービス提供システム
AU7723498A (en) * 1997-06-02 1998-12-30 Harris Corporation Distributed enhanced telecommunications services platform and method
US5960384A (en) * 1997-09-03 1999-09-28 Brash; Douglas E. Method and device for parsing natural language sentences and other sequential symbolic expressions
ITUD980032A1 (it) 1998-03-03 1998-06-03 Agostini Organizzazione Srl D Sistema di traduzione a macchina e rispettivo tradsistema di traduzione a macchina e rispettivo traduttore che comprende tale sistema uttore che comprende tale sistema
US6330530B1 (en) * 1999-10-18 2001-12-11 Sony Corporation Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures
US7099855B1 (en) * 2000-01-13 2006-08-29 International Business Machines Corporation System and method for electronic communication management
US8478732B1 (en) 2000-05-02 2013-07-02 International Business Machines Corporation Database aliasing in information access system
US6704728B1 (en) * 2000-05-02 2004-03-09 Iphase.Com, Inc. Accessing information from a collection of data
WO2001098942A2 (en) * 2000-06-19 2001-12-27 Lernout & Hauspie Speech Products N.V. Package driven parsing using structure function grammar
US8290768B1 (en) 2000-06-21 2012-10-16 International Business Machines Corporation System and method for determining a set of attributes based on content of communications
US9699129B1 (en) 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
US6408277B1 (en) 2000-06-21 2002-06-18 Banter Limited System and method for automatic task prioritization
US7010479B2 (en) * 2000-07-26 2006-03-07 Oki Electric Industry Co., Ltd. Apparatus and method for natural language processing
US6675159B1 (en) 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7043420B2 (en) * 2000-12-11 2006-05-09 International Business Machines Corporation Trainable dynamic phrase reordering for natural language generation in conversational systems
US7644057B2 (en) 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
US6950793B2 (en) * 2001-01-12 2005-09-27 International Business Machines Corporation System and method for deriving natural language representation of formal belief structures
US7249018B2 (en) * 2001-01-12 2007-07-24 International Business Machines Corporation System and method for relating syntax and semantics for a conversational speech application
US7085723B2 (en) * 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
US7257537B2 (en) * 2001-01-12 2007-08-14 International Business Machines Corporation Method and apparatus for performing dialog management in a computer conversational interface
US7127402B2 (en) * 2001-01-12 2006-10-24 International Business Machines Corporation Method and apparatus for converting utterance representations into actions in a conversational system
US6766316B2 (en) 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7526424B2 (en) 2002-03-20 2009-04-28 Microsoft Corporation Sentence realization model for a natural language generation system
JP2004139427A (ja) * 2002-10-18 2004-05-13 Fuji Xerox Co Ltd コミュニケーション支援システム及びコミュニケーション支援システム、並びにコンピュータ・プログラム
US20040193557A1 (en) * 2003-03-25 2004-09-30 Olsen Jesse Dale Systems and methods for reducing ambiguity of communications
US7346493B2 (en) * 2003-03-25 2008-03-18 Microsoft Corporation Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system
US7389230B1 (en) 2003-04-22 2008-06-17 International Business Machines Corporation System and method for classification of voice signals
US8495002B2 (en) * 2003-05-06 2013-07-23 International Business Machines Corporation Software tool for training and testing a knowledge base
US20050187913A1 (en) 2003-05-06 2005-08-25 Yoram Nelken Web-based customer service interface
US8060357B2 (en) * 2006-01-27 2011-11-15 Xerox Corporation Linguistic user interface
KR100691400B1 (ko) * 2006-03-31 2007-03-12 엔에이치엔(주) 부가 정보를 이용하여 형태소를 분석하는 방법 및 상기방법을 수행하는 형태소 분석기
US8346555B2 (en) * 2006-08-22 2013-01-01 Nuance Communications, Inc. Automatic grammar tuning using statistical language model generation
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US9286589B2 (en) 2011-10-14 2016-03-15 Caelo Media, Llc Method and system for customizing a project
US9064009B2 (en) * 2012-03-28 2015-06-23 Hewlett-Packard Development Company, L.P. Attribute cloud
US9594745B2 (en) * 2013-03-01 2017-03-14 The Software Shop, Inc. Systems and methods for improving the efficiency of syntactic and semantic analysis in automated processes for natural language understanding using general composition
US9606980B2 (en) 2014-12-16 2017-03-28 International Business Machines Corporation Generating natural language text sentences as test cases for NLP annotators with combinatorial test design
US10943075B2 (en) * 2018-02-22 2021-03-09 Entigenlogic Llc Translating a first language phrase into a second language phrase

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JPH0833895B2 (ja) * 1986-11-28 1996-03-29 富士通株式会社 機械翻訳システムにおける文生成処理方式
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system

Also Published As

Publication number Publication date
EP0388156A2 (en) 1990-09-19
DE69031354T2 (de) 1998-01-08
DE69031354D1 (de) 1997-10-09
EP0388156A3 (en) 1992-09-02
US5101349A (en) 1992-03-31
EP0388156B1 (en) 1997-09-03

Similar Documents

Publication Publication Date Title
JPH02240769A (ja) 自然言語文生成装置
US5848385A (en) Machine translation system using well formed substructures
US8078450B2 (en) Method and system for analyzing various languages and constructing language-independent semantic structures
US9471562B2 (en) Method and system for analyzing and translating various languages with use of semantic hierarchy
US6470306B1 (en) Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
JP3009215B2 (ja) 自然語処理方法および自然語処理システム
US20050086592A1 (en) Systems and methods for hybrid text summarization
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
US8762131B1 (en) Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US20020013793A1 (en) Fractal semantic network generator
WO2001029699A1 (en) Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
JPH0383167A (ja) 自然言語処理方法
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
EP0737928B1 (en) Language processing method and apparatus
JPH0261763A (ja) 機械翻訳装置
Erbach Syntactic processing of unknown words
Pretkalniņa et al. Universal dependency treebank for Latvian: a pilot
Bŏhmová et al. Automatic procedures in tectogrammatical tagging
Sengupta et al. A morpho-syntactic analysis based lexical subsystem
JP3919732B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Wintner et al. Syntactic analysis of Hebrew sentences
Alansary et al. IAN: An Automatic tool for Natural Language Analysis
Adorni et al. Toward a language-independent generator of sentences
JPH0157829B2 (ja)
Lauma PRETKALNINA et al. Universal Dependency Treebank for