JPH0383167A

JPH0383167A - 自然言語処理方法

Info

Publication number: JPH0383167A
Application number: JP2205324A
Authority: JP
Inventors: Karen Jensen; カレン・ジヤンセン
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1989-08-16
Filing date: 1990-08-03
Publication date: 1991-04-09
Also published as: EP0413132A2; EP0413132A3; US5146406A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】Ａ、産業上の利用分野本明細書に記載された本発明は、自然言語処理（ＮＬＰ
）のためのデータ処理方法に関し、具体的には文の基本
意味構造を決定するための改良されたデータ処理方法に
関する。

Ｂ、従来の技術自然言語テキストは、述部とそれらの引き数から成る命
題（ｐｒｏｐｏｓｉｔｉｏｎ　）群から構成されると言
える。述部の例は動詞であり、その引き数の例は関連す
る名詞または名詞句である。たとえば、Ｊｏｈｎ　１０
ｖｅｓ　Ｍａｒｙ。

という文には、動詞″１０ｖｅｓ　”を述部とする。１
つの命題がある。”　１０ｖｅｓ″はこの命題中で、”
　Ｊｏｈｎ　”と”　）ｌａｒｙ″の２つの引き数をも
つ。コンピュータ・システムが自然言語を理解するには
、述部と引き数群を正確に識別できなければならない。

上記のような単純な文では、これは難しくない６　（上
記の”Ｊｏｈｎ　１０ｖｅｓ　Ｉ（ａｒｙ、　”のよう
に）英語の動詞にその引き数が直接接している場合、コ
ンピュータ文法で動詞に適切な引き数を割り当てるのは
比較的容易である。しかし、実生活上のテキストでよく
現れるようなより複雑な文では、この作業はずっと難し
くなる。引き数がその動詞に密接してないとき、難しい
問題が発生する。

実際には、引き数が文の上で全く見えなくなることもあ
るが、人間がするように、プログラムがそれを推論しな
ければならない。たとえば、Ｍａｒｙ　ｗａｓ　ｋｉｓ
ｓｅｄ。

この文では、動詞”　ｋｉｓｓｅｄ　”の唯一の目に見
える引き数は”Ｍａｒｙ”である。しかし、人間はキス
をした人に対応する別の引き数を推論することができる
。もう１つの関連する状況は次のような文に現れる。

Ｗｈｏ　ｄｉｄ　Ｍａｒｙ　ｔｈｉｎｋ　ｔｈａｔ　Ｐ
ｅｔｅｒ　５ａｉｄ　ｔｈａｔＪｏｈｎ　ｋｉｓｓｅｄ
？上記の例でも、動詞の”　ｋ　１ｓｓｅｄ　”に２つの
引き数がある。”　Ｊｏｈｎ″は動詞のすぐ傍にあるが
、第２の引き数である”ｗｈｏ″は動詞から離れている
。

したがって、問題は、見えないものや離れた位置にある
ものを含めて、すべての引き数をそれらの述部と正しく
連係することである。

述部−引き数構造を識別する問題、特に、”Ｗｈ。

ｄｉｄ　Ｍａｒｙ　ｔｈｉｎｋ　ｔｈａｔ　Ｐｅｔｅｒ
　５ａｉｄ　ｔｈａｔ　Ｊｏｈｎｋｉｓｓｅｄ？”にお
けるような「遠く離れた依存関係」を正しく指定するＨ
Ｈは、言語学及びコンピュータ言語の文献で周知である
。これを実施するための２つの主要な方法が記載されて
いる。

＊「空範嗜Ｊ　　（ＥＣ）法＊「機能的不確定性Ｊ　　（ＦＵ）法ＥＣ法は、支配結合（ＧＢ）学派及び一般化句構造文法
（ＧＰＳＧ）学派の言語学者によって主張されている。

（Ｐ、セル（Ｓｅｌｌ）著「現代統辞法理輪講義（Ｌｅ
ｃｔｕｒｅｓ　ｏｎ　Ｃｏｎｔｅ＋＋ｐｏｒａｒｙＳｙ
ｎｔａｃｔｉｃ　Ｔｈｅｏｒｆｅｓ）　Ｊ　、ＣＳ　Ｌ
　Ｉ　Ｎ　スタンフォード大学、米国カリフォルニア州
スタンフォード、１９８５年刊）。この方法は、その文
が最も中立的な形にある場合に転置された構成要素があ
るはずの場所に、空のスロットを含む解析構造を使用す
る。たとえば、”Ａｌ１ｃｅ、　Ｐｅｔｅｒ　５ａｉｄ
　ｔｈａｔＪｏｈｎ　　ｋｉｓｓｅｄ、　にＰｅｔｅｒ
　５ａｉｄ　ｔｈａｔ　Ｊｏｈｎ　ｋｉｓｓｅｄＡｌｉ
ｃｅ、）　”という文は、動詞″ｋｉｓｓｅｄ”のすぐ
後に「空範曙」または「トレースＪ　　（’“ｃＩＩで
表ス）をもつと想像される。というのは、それが、名詞
句”Ａｌ１ｃｅ”が属する場所であるからである。こう
した方向に沿って＋ｍ築されたコンピュータ文法は、実
際にその解析構造または氷中に空スロットを指定する（
第１Ａ図参照）。

ＦＵ法は、語負機能文法（ＬＦＧ）理論を信奉する言語
学者によって主張されている。この方法は、解析木中の
空スロットではなく、すべての動詞の特徴（「特徴」と
は主として動詞が持たなければならない必要な引き数の
数と種類を指す）を、文の左から右へと順次評価して、
転置された構成要素が最もうまくはまる場所を見つける
ものである。うまくあてはまる引き数構造を計算するた
めに、形式的表記装置がＬＰＧ文法記述言語に追加され
た。Ｒ，Ｍ、カブラン（Ｋａｐｌａｎ）　、Ａ、ツェー
ネン（Ｚａｅｎｅｎ　）の論文「遠隔依存関係、句構造
、および機能的不確定性（Ｌｏｎｇ−ｄｉｓｔａｎｃｅ
Ｄｅｐｅｎｄｅｎｃｉｅｓ、　Ｃｏｎ５ｔｉｔｕｅｎｔ
　５ｔｒｕｃｔｕｒｅ、　ａｎｄＦｕｎｃｔｉｏｎａｌ
　Ｕｎｃｅｒｔａｉｎｔｙ）　Ｊ　１Ｍ、パルティン（
Ｂａｌｔｉｎ）　、Ａ、クロッホ（Ｋｒｏｃｈ　）共編
「句構造の代替概念（Ａｌｔｅｒｎａｔｉｖｅ　Ｃｏｎ
ｃｅｐｔｉｏｎｓ　ｏｆＰｈｒａｓｅ　５ｔｒｕｃｔｕ
ｒｅ）　Ｊ　、シカゴ大学出版社、１９８７年刊）。こ
うした方向に沿って構築されたコンピュータ言語は、こ
の装置を使用して、その文法規則で、見えない引き数を
割り当てるべき場所を指定する。

本発明の方法は、上記のどちらの方法とも異なっている
。本方法は、ＥＣ法とは次の点で異なる。

ａ、どんな種類の空［４またはトレースも使用しない。

ｂ、構成要素、木、構造に余り依存せず、構文解析によ
って供給されるあらゆる種類の情報を使用する。

本方法は、ＦＵ法とは次の点で異なる。

ａ、使用するプログラミング言語によってすでに供給さ
れたちの以外のどんな特別の表記装置も使用しない。

５１文中の動詞の特徴（いわゆる「機能情報」）に完全
には依存せず、構文解析によって供給されるあらゆる種
類の情報を使用する。

本方法は、構文解析が完了した後に引き数充填を実行す
るという点で上記のどちらの方法とも異なっている。本
方法は、解析構成要素自体ではなく、ポストプロセッサ
を使用して、構文属性値情報の全領域を操作して、最も
妥当な引き数構造を誘導するものである。

本方法と、言語理論から生まれたＮＬＰシステムの方法
のもう一つの違いは、後者のシステムの大部分が、論理
プログラミング言語によって供給されたような、ある形
式の統一化を使用していることである。統一化により、
属性値構造の自動突合せが可能になるが、それは、否定
および分離の条件をうまく処理できないなど、いくつか
の欠点をもつ。本方法は、手順式ポストプロセッサを使
用するので、こうした欠点を持たない。

本方法はきわめて効率的である。ポストプロセッサによ
ってシステムの動作時間は大して増加しない。さらに、
初期解析構成要素は完全に定義域に依存しているので、
システム全体できわめて広い範囲の英語をカバーするこ
とができる。

ＥＣ法とＦＵ法は現在有力な言語理論であるが、どちら
も、今日のＮＬＰ技術を使用する応用分野で広く採用さ
れてはいない。英文テキストの意味解析を含む従来技術
の応用例は、一般に何らかの形の辞書主導の引き数識別
を使用しているが、ＥＣまたはＦＵの技術または形式を
必ずしも採用していない。

従来技術による英文のテキストの意味処理の方法は、コ
ンピュータ言語学会第２５回年会報文集（ｔｈｅ　Ｐｒ
ｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２５ｔｈ　Ａｎｎ
ｕａｌ　Ｍｅ゛ｅｔｉｎｇｏｆ　ｔｈｅ　Ａｓ５ｏｃｉ
ａｔｉｏｎ　ｆｏｒ　ＣｏｍｐｕｔａｔｉｏｎａｌＬｉ
ｎｇｕｉｓｔｉｃｓ）　、スタンフォード大学、１９８
７年７月−９月、ｐｐ、１３１−１３４に記載されてい
る。そこに記載された方法について、以下に簡単に説明
する。この従来技術のシステムは、単一の意味定義域、
すなわち、米海軍の船舶で使用される特定の種類の機械
類の故障報告を処理するように設計されている。この定
義域に属する英文が入力されると、システムは、文の意
味解析を行ない、その意味解析を、いくつの引き数をそ
の文の動詞に関連づけることができるか、及びそれがど
んな種類の引き数かを指定する、基礎フォーマットまた
はテンプレートにマツプする。（１）必須、（２）基本
、（３）非基本の３つの異なる引き数クラスが定義され
ている。必須引き数は構文解析で必ず存在しなければな
らず、存在しないとその解析は失敗する。基本引き数は
、構文中に必ずしも存在する必要はないが、それがない
場合、システムはその役割を果たすいくつかの「最良の
推測」の候補を仮説として取り上げる。したがって、基
本引き数及び必須引き数は、最終的には文の意味構造中
に存在する。非基本引き数は存在してもしなくてもよい
。

たとえば、”Ｐｕｍｐ　ｆａｉｌｅｄ、　　（ポンプ故
障）という入力文が与えられると、構文解析の結果は、
主動詞として”ｆａｉｌｅｄ″が与えられ、その構文上
の主語としてｐｕｍｐ　”が与えられるはずである。

動詞”ｆａｉｌ″１の基礎テンプレートは、それがＦＡ
ＴＩ　ＥＮＴと呼ばれる１つの引き数を持つことを示す
はずである。次に、マツピング規則は、ｎｐｕｖＡｐｎ
がＰＡＴＩ　ＥＮＴ引き数の良い候補である（引き数は
「役割」とも呼ばれる）とする。次に、制限があるかど
うか検査する。動詞″ｆａｉｌ”では、ＰＡＴＩＥＮＴ
の役割を果たすものは機械装置でなければならないとい
う制限がある。（−般に、こうした情報は、辞書の名詞
″ｐｕｍｐ″の項目に記載のマーク、すなわち＋ＭＥＣ
Ｈで示される。）　　ｐｕｍｐ”は機械装置として合格
しているので、この引き数構造は完成する。すなわち、
”ｆａｉｌｅｄ”は１つの引き数としてそのＰＡＴ、Ｉ
ＥＮＴをもち、これはｐｕｍｐ　”で充填される。

しかし、この従来技術の引き数充填法には、次のような
いくつかの問題点がある。

第一に、単語がとり得る可能な意味が、当該の定義域に
属するものだけに厳しく限定される。たとえば、動詞”
ｆａｉｌ　”は、次のような文に関連する意味をもつこ
とができる。

Ｔｈｅ　ｅｑｕｉｐｍｅｎｔ　ｆａｉｌｅｄ。

土窯では、この動詞は１つの必須引き数（”　ｅｑｕｉ
ｐｍｅｎｔ″）をとる。しかし、このシステムは次のよ
うな文中の動詞″ｆａＬＩｅｄ“を解釈できない。

Ｈｉｓ　ｃｏｕｒａｇｅ　ｆａｉｌｅｄ　ｈｉｍ。

Ｔｏｄａｙ　　Ｉ　　ｔｏｏｋ　ｔｈｅ　ｃｈｅｍｉｓ
ｔｒｙ　ｅｘａｍ　ａｎｄ　ｆａｉｌｅｄｍｅ　ａ　ｖ
ｈｏｐｐｅｒ！このシステムは、狭く定義された部分定義域内ではこの
ような文は通常現れないことに依拠している。しかし、
人間による言葉の使い方は予測できないものであり、動
詞”ｆａｉｌ″が海軍船舶の報告で上記のような意味で
は絶対に使用されないとの保証はない。このシステムで
このような文ヲ扱う唯一の方法は、”ｆａｉｌ”に対す
る追加のテンプレートを用いるものであろう。しかし、
追加のテンプレートを用いると、構文解析構成要素に多
くの困難が生じることがある。

第二に、各動詞ごとに、必須、基本、非基本の３つの引
き数クラスを分離する必要があるために処理が複数にな
る。必須引き数の数は、ある動詞の意味が異なるごとに
変わるので、特定の狭い意味論上の部分定義域の範囲内
でさえ、所与の動詞がいくつの意味をとり得るかを正確
に指定することは非常に難しい。

第三に、充填子が「最良の推測」仮説にすぎない場合で
さえすべての基本引き数を充填する必要があるために、
システムの流れが妨げられる。構文構造中に必須引き数
及び基本引き数、のりストで必要とされるより少しの引
き数しか存在しない場合、その文の文法解析を成功させ
るために、しばしば、システムを停止し、バックアップ
し、再度試行する必要がある。

第四に、この従来技術のシステムでは、上記の「遠隔依
存関係」など最も巧妙な種類の引き数充填にほとんどま
たは全く関心が払われていない。

このシステムは、そのような複雑な構造が狭い部分定義
域で現れるとは予想されないということに依拠している
。しかし、自然言語がフレキシブルな性格であるとすれ
ば、この予想は完全に安全なものではない。

上記の理論的引き数充填手法（ＥＣとＦＵ）は、自然言
語の複雑さを処理するものであるが、それ自体が複雑で
あるため、実際の応用例で使用するのは難しい。これら
の従来技術の応用例は、実世界で意味論上の部分定義域
の範囲内で利用できるが、自然言語の複雑さをすべて処
理する技術を提供するものではなく、シたがってその適
用範囲が限られている。

米国特許第４７３１７３６号明細書に、本明細書で開示
する発明が実施できるデータ処理システムが開示されて
いる。上記の開示を、本明細書に開示する発明の背景技
術として、引用により本明細書に合体する。

Ｃ０発明が解決しようとする課題本発明の目的は、英文の引き数構造または基本意味構造
を決定するための改良された方法を提供することである
。

本発明の他の目的は、制限された意味定義域に関連する
文だけでなく、英語の任意の入力文に対する引き数構造
を決定する際に成功の確率が高くなるように、広い範囲
の英語をカバーすることである。

本発明の他の目的は、属性値データ構造に照会し、それ
に追加し、かつそれから差し引くことによって完全に動
作し、ある動詞（または任意の語）を理解できるように
するにはそれがいくつの引き数をもたなければならない
かを指定する任意の述部引き数テンプレートによって制
限されない、手順と結合した、完全にモジュール式の方
法を使って、効率的な意味処理技術を提供することにあ
る。

０１課題を解決するための手段上記その他の目的、特徴及び利点は、本明細書に記載す
る発明によって達成される。英語の入力散文の述部−引
き数構造を決定するためのコンピュータによる方法が開
示される。ブランクで分離された単語文字列の形の入力
文を、まず単語に関する形態論情報及び構文情報にのみ
アクセスできる規則構成要素によって文法解析する。こ
の規則構成要素の出力は、属性値対からなるデータ構造
の形のもので、それが次に、言語知識をさらに統合する
部分的に順序通り配列された一組の手順から構成される
、引き数構造構成要素によって処理される。こうした手
順の出力は、同じ属性値構造であるが、今度は意味（す
なわち、意味のある非構文的な）ｒｆ４性の存在によっ
て性能が向上している。これらの意味属性が一つにまと
まって入力文の引き数構造を形成する。

その結果、本発明は、構文から自然（人為）言語の意味
処理の第１の段階に進むための、完全にモジュール式の
包括的かつ効率的な方法である。

本発明は、その設計の対象となっている言語の一部分で
はなく、すべての散文に適用される。本発明は、定義域
特有の意味情報を使用して、構文構成要素の精度または
効率を改善するものではない。

したがって、本発明は、今日の大部分のＮＬＰ応用例で
使用されている制限的方法ではなく、自然言語処理（Ｎ
ＬＰ）に対する無制限の広範囲をカバーする方法である
。

異なる自然言語に対する具体的な規則及び手順はそれぞ
れ異なるが、本発明で具体化された全般的な概念はすべ
ての自然言語に適用可能である。

英語の入力文字列の基本意味構造を決定するためのＮＬ
Ｐ方法が開示される。本方法によれば、こうした目的を
達成するために、英語の入力文字列を以下のように処理
する。本発明によれば、この方法には２つの段階がある
。第１段階は意味構成要素なしで構文解析を実行するも
のであり、第２段階は意味解析を実行するものである。

まず、入力文字列を、構文解析構造要素で解析する。−
例を挙げると、好ましい実施例では、ＰＬＮＬＰ英語文
法（ＰＥＧ）と呼ばれる構文解析プログラムを使用する
。（”ＰＬＮＰＬ”はプログラミング言語の名前であり
、自然言語処理用プログラミング言語の頭字語である。

）ＰＥＧは、各入力文字列ごとに構文解析を行なう。こ
の解析は、属性と値の収集からなる。こうした集合体を
、「レコード」または「レコード構造」と呼ぶ。

構文解析の段階で、ＰＥＧは、各動詞への引き数の割当
ての完了を試みない。しかし、ＰＥＧが行なう解析は、
すべての引き数を計算し充填するのに必要なすべての情
報を含んでいる。

引き数構造は、意味値をもつ追加の属性を用いて、構文
解析レコードの性能を改善することによって作成される
。構文を、しばしば入力文字列の「表面」構造と呼び、
意味を入力文字列の「深層」構造と呼んでいる。以下の
「深層」属性が定義されている。必要に応じて他のもの
が追加されることもある。

ａ、ＤＳＵＢＪＥＣＴ−命題の深層（すなわち意味上の
）主語、一般に、動作の行為者。

ｂ、ＤＯＢＪＥＣＴ−命題の深層目的語、すなわち行為
者の動作によって最も直接的に影響を受けるエンティテ
ィ。

ｃ、ＤＩＮＤＯＢＪ−深層間接目的語、すなわち行為者
の動作を介して何かを経験し、または受は取るエンティ
ティ。

ｄ、ＤＰＲＥＤＮＯＭ−命題中でＤＳＵＢＪＥＣＴと同
じになるエンティティ。

ｅ、ＤＯＢＪＣＯＭＰ−命題中でＤＯＢＪＥＣＴと同じ
になるエンティティ。

構文解析段階を終えた後、本発明によると、レコードは
意味解析段階の第１ステツプに進む。ここでは、構文基
準により、識別の容易な意味引き数を、すなわちその動
詞に近接しかつ密接に関連する意味引き数を識別する。

これは、単に「深層Ｊ引き数層性を加算して、それらが
その「深層」構文解析が与えるのと同じ値を指すように
させる。

意味解析段階にはさらに２つのステップがある。

第２のステップでは、以下のように引き数を指定し完成
する。

＊不定詞節と分詞節の見えない引き数を指定する。

＊転置された引き数または「遠隔」引き数を指定する。

＊受動構文の見えないまたは転置された引き数を指定す
る。

＊英語の間接目的構文の２つの異なる形式に対する引き
数を等しくする。

これで、引き数指定ステップは完了する。任意選択で、
他の構文状況が発見された場合にその状況に対する引き
数指定を処理する手順を考案して、このステップを増補
することもできる。

これらの中核的手順のうちで、順序配置がある程度重要
である。たとえば、見えない引き数を不定詞節及び分詞
節に割り当てる部分手順は、リストの最初に配置しなけ
ればならない。転置された（遠隔）引き数は、受動構文
手順の前に配置しなければならない。

すべての引き数が適切に指定された後、ポストプロセッ
サがその第３のステップを開始して、主動詞の引き数で
はない解析済みセグメントを再検討する。これらの非引
き数セグメントは「付加部Ｊと呼ばれる。この＠討の結
果、ＶＰ（動詞句）、ＡＪＰ（形容詞句）、ＡＶＰ（副
詞句）、ＮＰ（名詞句）、及びＰＰ（前置詞句）という
各主要クラスの非引き数修飾部を指す意味属性の追加に
よって、レコード構造の性能がさらに改善される。

以下の意味属性が定義されており、必要に応じて他のも
のも追加されることがある。

ａ、ＭＯＤＳ−修飾部；指定されない。

ｂ、ＮＡＤＪ−名詞を前から修飾する形容詞。

ｃ、ＰＡＤＪ−述部形容詞、または修飾名詞を後から修
飾する形容詞。

ｄ、０ＰＳ−操作子；限定辞と限量辞を含む。

ｅ、ＰＡＲＴＩＣＬ−動詞と組み合わされて動詞句の引
き数構造の大きな変化を知らせる前置詞または副詞。

ｆ、ＰＲＥＤ−各単語の基本形式。

ｇ、ＰＲＯＰ−前置修飾部；不定詞句と分詞句を含む。

ｈ、ＲＥＦ−代名詞が指す名詞。

このレコード構造に最終的調整を加えて、不必要な属性
を消去し、一般にレコード構造を１．システムの次の構
成要素に移る前にクリーンアップする。ある自然言語を
別の言語により正確に翻訳するために、出力されたレコ
ード構造を機械翻訳装置で使用することができる。この
出力は、高度のテキスト校訂、改良された情報検索、電
子メールの経路設定及びファイル編成、自動テキスト生
成、及び基本意味解析を必要とするその他のＮＬＰ応用
例にも適用できる。

Ｅ、実施例第２図は、このシステムの全体的構成を示す。

このシステムは、入力段階、構文構造を作成する解析段
階、意味引き数が構文引き数と等しい場合に引き数を指
定する予備機解析ステップ（１）と、他のすべての場合
に引き数を決定し、それ自体が意味引き数を指定するス
テップ（２，１）と、付加部を指定するステップ（２，
２）とを含む主ポストプロセッサ（２）、最後に、入力
文字列に対応する基本意味構造である完成した引き数構
造（３）を含んでいる。

入力段階中に、単語の文字列がシステムに入力される。

これは通常、キーボードでテキストをタイプ入力するこ
とによって行なう。ただし、単語文字列は他のどんな手
段で入力してもよい。たとえば、音声認識構成要素が利
用できる場合、テキストを人間の声で入力することもで
きる。

構文解析段階は、構文解析構成要素ＰＥＧによって実行
される。ＰＥＧは、各入力文字列ごとに、属性値「レコ
ード」構造の形の解析記述を生成する。より読みやすい
構文解析「木」も、レコード構造に含まれる情報から表
示される。ＰＥＧは非常に大きな英語語寅リスト（シば
しば辞典（レフシコン）と呼ばれる）及び、英語の標準
の形態論的規則にアクセスする。しかし、辞典は、こう
した規則とあいまって、以下の種類の限られた形態論的
情報及び解析情報のみをＰＥＧに提供する。

＊大部分の英語の単語の正書法に基づく形（綴り）＊各
単語が英語でとり得る品詞＊各単語に与えられた各品詞ごとの時制、数などの形態
情報＊各単語が属する様々な構文上の下位範嗜クラスに関す
る情報（たとえば、特定の動詞が他動詞か否か）ＰＥＧは、ＰＬＮＬＰ　（自然言語処理用プログラミン
グ言語）で書かれた大きなプログラムである。ＰＥＧは
、ボトム・アップ式の完全に並列処理のアルゴリズムに
よって駆動される、約２００の増補句構造規則からなる
。これらの規則は、入力文字列の構文解析を生成する。

特定の規則が特定の文字列またはその文字列の一部分に
適用できるかどうかは、その文字列をカバーするレコー
ド構造中のある属性の有無及びそれらの値によって決ま
る。ある属性は辞典によって提供され、他の属性は規則
自体によって追加される。ＰＥＧが行なうのは、個々の
単語に対するレコードから始めて、最後にある構造に到
達するまで、次々により大きなレコード構造を構築する
ことにより、文字列の構文記述を生成することである。

最終構造に到達すると、入力文字列全体が解析される。

ＰＥＧは形態論的情報及び構文情報だけを使用し、意味
情報は全く使用しないで解析を行なうことに留意された
い。

多くの情報が属性値解析構造に含まれている。

この情報の一部は単純である。たとえば、動詞句（７）
Ｌ／コード中のＰＡＳＴＩＩｔ性は、オンまたはオフの
値を持つ。それが「オン」の場合、その動詞句は、過去
時制であることを示す。ある情報はより複雑である。た
とえば、動詞句は属性５ＵＢＪＥＣＴをもつが、この属
性は、その値として、その名詞句に属するすべての情報
と共に、その主語として働く名詞句をカバーする他のレ
コード構造全体をｔ旨すポインタをもつ。

ＰＥＧによって指定されるすべての属性は、構文属性で
ある。そのうちには、入力文字列の構文引き数を参照す
るものがある（ＳＵＢＪＥＣＴなど）。本明細書に開示
する方法によれば、意味論的後処理の第１段階では、意
味引き数が構文引き数と正確に対応するとき、その意味
引き数を識別する。これを行なうため、ポストプロセッ
サは、単にレコードにある意味属性を追加して、それが
その構文解析と同じ値を指すようにさせる（たとえば、
ＤＳＵＢ　Ｊ　ＥＣＴは、５ＵＢＪＥＣＴが指すのと同
じレコードを指す）。

後処理の次の段階では、引き数識別の残りのすべてのケ
ースを処理する。

第１に、ポストプロセッサは、不定詞または分詞形の動
詞補語を探したり、主語の名詞句に隣接するのではなく
、文の終りに現れる分詞形の主語補語を探して、レコー
ド構造を走査する。動詞補語である現在分詞を見つけた
（ステップ４）と仮定する。たとえば、Ｊｏｈｎ＋　ｉｎ　ｍｙ　ｏｐｉｎｉｏｒ＋、　１ｉｋ
ｅｓ　ｅｎｔｅｒｔａｉｎｉｎｇＶＯｌｅｎ。

の文でｅｎｔｅｒｔａｉｎｉｎｇ　ｗｏｍｅｎ″は）主
動詞″１ｉｋｅｓ″の補語である現在分詞節を形成する
。

この節の意味上の目的語（ＤＯＢＪＥＣＴ）は名詞“ｗ
ｏｍｅｎ″であるｏ　”　Ｗｏｍｅｎ″′は構文上の目
的語として現れており、後処理の第１段階で意味上の目
的語であると識別されている。しかし、ｅｎｔｅｒｔａ
ｉｎｉｎｇ　ｖｏ■ｅｎ″の構文上の主語はない〇さら
に、この段階では、”　ｅｎ　ｔｅｒ　ｔａ　ｉｎ　ｉ
ｎｇ　”を行なっているのが誰なのかわからないのでｅ
ｎｔｅｒｔａｉｎｉｎｇｗｏｍｅｎ″の正しい意味上の
主語を決定することは不可能である。女を楽しませてい
るのはＪｏｈｎかもしれないし、他の誰かかもしれない
。食違がＪｏｈｎを楽しませている可能性すらある。そ
６場合は、これは分詞節ではなく　、”ｅｎｔｅｒｔａ
ｉｎｉｎｇが形容詞として働く名詞句となる。したがっ
て、仮の意味上の主語（ｘｘ”）がこの場合の属性［５
ＵＢＪＥＣＴの値として指定される。これで、上記の文
の動詞”ｅｎｔｅｒｔａｉｎ　”の引き数指定はチアす
る。システムの後の構成要素で、“’　ｅｎｔｅｒｔａ
　ｉｎの最も可能性の高いＤＳＵＢＪＥＣＴを計算する
。

第２Ａ図の他のすべてのケースでは、ＤＳＵＥＪＥＣＴ
がすでに節に存在する場合、手順は停社する。そうでな
い場合は、主動の構文上の主語力・当該の節のＤＳＵＢ
ＪＥＣＴとして指定される（ステップ５）。分詞形の主
語補語の例として、次の文を考えてみる。

Ｍａｒｙ、　ａｓ　ｙｏｕ　ｐｒｅｄｉｃｔｅｄ、　ａ
ｒｒｉｖｅｄ　ｅｘｃｉｔｅｄｌｙｗａｖｉｎｇ　ｈｅ
ｒ　ｈａｎｄ。

”ｗａｖｉｎｇ　ｈｅｒ　ｈａｎｄｓ″は）主動詞”　
ａｒｒｉｖｅｄ　”の補語ではなく、主動の主語″Ｍａ
ｒｙ　”にかかるまたは補足する分詞節である。Ｗａｖ
ｉ０ｇ“は、構文上の目的語（ｈｅｒ　ｈａｎｄｓ）を
もち、これは直ちにその意味上の目的語ＤＯＢＪＥＣＴ
として識別される。しかし、″ｗａｖｉｎｇ　ｈｅｒ　
ｈａｎｄｓ“の構文上の主語はない。ステップ５で、”
Ｍａｒｙ″をその意味上の主語（ＤＳＵＢ　Ｊ　ＥＣＴ
）として識別する。

第２Ｂ図は、遠隔引き数を処理する手順の流れ図である
。現在４つの異なる遠隔状況が処理される。

ａ１話題提示二″Ａｌ１ｃｅ、　Ｐｅｔｅｒ　５ａｉｄ
　ｔｈａｔ　Ｊｏｈｎｋｉｓｓｇｄ。

ｂ、疑問詞を使った疑問”Ｗｈｏ　ｃｌｉｄ　Ｐｅｔｅ
ｒ　５ａｙｔｈａｔ　Ｊｏｈｎ　ｋｉｓｓｅｄ？　”Ｃ
１関係節：”Ｔｈ１ｓ　ｉｓ　ｔｈｅ　ｇｉｒｌ　ｗｈ
ｏ　Ｐｅｔｅｒ　５ａｉｄｔｈａｔ　Ｊｏｈｎ　ｋｉｓ
ｓｅｄ、　”ｄ、自由関係：　”Ｉ　ｋｎｏｗ　ｗｈｏ
　Ｐｅｔｅｒ　５ａｉｄ　ｔｈａｔＪｏｈｎ　ｋｉｓｓ
ｅｄ。

この遠隔引き数処理手順では、遠隔前置要素（たとえば
、上記の文でイタリック体の単語）を識別して、この要
素をＦＲＮＴＮＰと呼ぶ。次に、遠隔関係の候補となる
節を識別し、これをＣＡＮＤと呼ぶ。ＣＡＮＤは通常主
動詞を後から修飾する節のリストの最後の節である。こ
のリストは補語節と不定詞節を含むが、たとえば、従属
接続詞によって導入された従属節は含まない。

ＣＡＮＤ自体が次の文のように等位接続の動詞句を含む
場合は（ステップ６）、Ｗｈｏ　ｄｉｄ　Ｐｅｔｅｒ　ｓａｙ　ｔｈａｔ　Ｊｏ
ｈｎ　ｋｉｓｓｅｄ　ａｎｄｈｕｇｇｅｄ？等位接続動詞句を分離する手順に送られる（第２Ｊ図参
照）。最終的に、分離された要素が遠隔手順に戻される
。次に考慮することは、ＣＡＮＤが次の文のように懸垂
前置詞を含むかどうかである（ステップ７）。

Ｗｈｏ　ｄｉｄ　Ｐｅｔｅｒ　ｓａｙ　ｔｈａｔ　Ｊｏ
ｈｎ　ｒａｎ　１ｎｔｏ　？上記の文では、ＣＡＮＤは
、”Ｊｏｈｎ　ｒａｎ　１ｎｔｏ″であり、懸垂前置詞
は“１ｎｔｏ　”である。このような場合、ＦＲＮＴＮ
Ｐが懸垂前置詞の目的語として指定され（Ｊｏｈｎ　ｒ
ａｎ　１ｎｔｏ　ｗｈｏ？）　、手順は終了する。この
節は、必要に応じて次の引き数識別に利用できる。

ＣＡＮＤ中に等位接続関係がなく、懸垂前置詞もない場
合、この手順の主な仕事が始まる。

遠隔依存関係の引き数を正しく識別するには、複雑な１
組の情報が必要である（ステップ８）。

第１に、ＣＡＮＤ中の主動詞の下位範噌クラスが重要で
ある。作為動詞か、授与動詞か、それともそのどちらで
もないか。作為動詞は目的語と目的補語を取る。”Ｔｈ
ｅｙ　ｅｌｅｃｔｅｄ　ｈｉｍ　（目的語）ｐｒｅｓｉ
ｄｅｎｔ　（目的補語）、″授与動詞は間接目的語と目
的語を取る。”Ｔｈｅｙ　ｇａｖｅ　ｈｅｒ　（間接目
的語）ａｎ　ａｗａｒｄ　（目的語）、″第２に、ＣＡ
ＮＤは時制節か、それとも不定詞節か。第３に、どれだ
けの引き数がすでに節中にあるか。第４に、すでに存在
している引き数ならびに遠隔要素にどんな特徴があるの
か。

ここで特に重要な特徴ＨＵＭは、いくつかの代名詞（′
ｖｈｏ科　Ｉ″＋　　”ｙｏｕ″、ｈｅ″　”　ｓｈｅ
　”など）といくつかの名詞（“ｍａｎ″、°“ｗｏｍ
ａｎ″ｃｈｉｌｄ”など）に付加される。この特徴は、
明らかに意味のある解釈をもっているが、ここでは、意
味論上のものとみなすべきではなく、他の特徴と同じく
、単語リストのメンバに付加できる特徴である。これは
、それが付加される単語が、ある状況で構文上ある挙動
を示す確率が高いことを示す。したがって、辞典にこの
特徴が記載されていることは、意味情報なしで構文解析
構成要素が働くという先の主張と矛盾するものではない
。

上記の情報に基づいて、この手順は、遠隔依存関係を解
決する（ステップ９）。次の文で、Ｗｈｏ　ｄｉｄ　Ｊ
ｏｈｎ　ｗａｎｔ　ｔｏ　ｋｉｓｓ？ＦＲＮＴＮＰ　（
ｗｈｏ　”　）が、動詞″ｋｉｓｓ　”のＤＯＢＪＥＣ
Ｔとして指定される。これは動詞の動作の影響を直接受
ける。次の文では、Ｗｈｏ　ｄｉｄ　Ｊｏｈｎ　ｗａｎｔ　ｔｏ　ｗｒｉｔ
ｅ？ＦＲＮＴＮＰ　（”ｗｈｏ″）が、動詞″ｗｒｉｔ
ｅ″のＤＩＮＤＯＢＪとして指定される。これは、動詞
の動作を介しであるものを受は取る。次の文では、Ｗｈ
ａｔ　ｄｉｄ　Ｊｏｈｎ　ｗａｎｔ　ｔｏ　ｗｒｉｔｅ
？ＦＲＮＴＮＰ　（ｗｈａｔ　”　）が、動詞″ｗｒｉ
ｔｅ”のＤＯＢ　Ｊ　ＥＣＴとしてｔ舌足される。

受動構文に出会うと（第２Ｃ図）、ポストプロセッサは
、受動国中に懸垂前置詞があるかどうか再度１１べる（
ステップ１０）。たとえば、Ｔｈｅ　ｈｏｕｓｅ　ｗａ
ｓ　ｂｒｏｋｅｎ　１ｎｔｏ。

上記の文の１ｎｔｏ″のような懸垂前置詞が存在する場
合、構文上の主語（この場合は”ｔｈｅ　ｈｏｕｓｅ　
”　）が懸垂前置詞の目的語として指定される（”ｂｒ
ｏｋｅｎｉｎｔｏ　ｔｈｅ　ｈｏｕｓｅ″）。次に、手
順は先に飛んで、可能性のある”ｂｙ″前置詞句を見つ
け（ステップ１３）、意味上の主語を識別する。

受動構文の意味上の引き数を正しく適切に識別するため
に、懸垂前置詞がない場合、複雑な１絹の情報を照会す
る。第１に、主動詞の下位範曙クラスが重要である。作
為動詞か、授与動詞か、それともそのどちらでもないか
（上記参照）。第２に、どれだけの引き数がすでに筒中
にあるか。第３に、節の構文上の主語にどんな特徴があ
るか。

ここで特に重要な特徴ＡＮＩＭは、人間ではない、生物
を指す名詞に付加される点以外は、すべての点でＨＵＭ
と同様である。この特徴も明らかに意味のある解釈をも
っているが、ここでは意味論上のものとみなさない。

次に、手順は、上記の情報に基づいてＤＳＵＢＪＥＣＴ
以外の意味引き数を指定する（ステップ１２）。次の受
身文では、Ｔｈｅ　ｍａｎ　ｗａｓ　ｅｌｅｃｔｅｄ　Ｐｒｅｓｉ
ｄｅｎｔ。

”ｔｈｅ　ｍａｎ　”がＤ　ＯＢ　Ｊ　Ｅ　ＣＴ、、　
”Ｐｒｅｓｉｄｅｎｔ″がＤＯＢ　Ｊ　ＣＯＭＰである
。次の文では、ｌｉｅ　ｗａｓ　ｇｉｖｅｎ　ａ　ｍａ
ｎｄａｔｅ。

”ｈｅ“がＤＩＮＤＯＢＪ　（あるものを受は取る人）
で、”ａ　ｍａｎｄａｔｅ　’がＤＯＢＪＥＣＴ（受は
取られるもの）である。次の文では、Ｙｏｕ　ｗｅｒｅ　１ｎｖｉｔｅｄ。

ｙｏｕ″がＤＯＢＪＥＣＴである。ＤＯＢＪＣＯＭＰま
たはＤ　ＩＮＤＯＢＪはない。

手順は、次に受動構文のＤＳＵＢＪＥＣＴを指定する。

′ｂｙ″前置詞句が存在するかどうか検索して調べる（
ステップ１３）。ない場合は、ＤＳＵＢＪＥＣＴが”ｘ
ｘ″の値に指定される。”ｘｘ”は、後で必要な情報が
処理されたとき、解決できる。″ｂｙ＝ｌ前置詞句が存
在する場合、ＤＳＵＢＪＥＣＴは、その前置詞句の目的
語を指すように指定すれる（ステップ１４）。たとえば
、次の文で、Ｙｏｕ　ｗｅｒｅ　１ｎｖｉｔｅｃｌ　ｂ
ｙ　ｔｈｅ　Ｐｒｅｓｉｄｅｎｔ。

”　ｔｈｅ　Ｐｒｅｓｉｄｅｎｔ″がＤＳＵＢＪＥＣＴ
である。

この文は能動文”Ｔｈｅ　Ｐｒｅｓｉｄｅｎｔ　１ｎｖ
ｉｔｅｄ　ｙｏｕ。

と等価な受動文である。どちらの文でも、ＤＳＵＢＪＥ
ＣＴが”ｔｈｅ　Ｐｒｅｓｉｄｅｎｔ″　ＤＯＢＪＥＣ
Ｔがｙｏｕ″である。このように、能動文と受動文の表
面上の構文形式は全く異なっているが、基礎となる引き
数構造は、それらが意味上類似していることを指摘して
いる。

次の部分手順（第２Ｄ図）は、間接目的構文を処理する
ものである。この手順の目的は、′ｖｅｇａｖｅ　ｈｉ
＋ｎ　ａ　ｍａｎｄａｔｅ、　”と”１ｉｆｅ　ｇａｖ
ｅ　ａ　ｍａｎｄａｔｅｔｏ　ｈｉｍ、　”のような文
の意味上の類似性を指摘することである。この点で、間
接目的手順は、受動手順と同じ目的をもつが、ずっと単
純である。第１段階で、”ｔｏ″前置詞句の目的語を見
つける。

次の段階で、この目的語をＤＩＮＤＯＢＪ属性の値に指
定する。この段階が完了すると、どちらの文もＤＳＵＢ
ＪＥＣＴ″ｗｅ″、ＤＩＮＤＯＢＪ”ｈｉｍ’ｓ及びＤ
ＯＢＪＥＣＴ″ａ　ｍａｎｄａｔｅ″をもつ。

コレで、ポストプロ・セッサの中心部分の第１ステツプ
（２，１）が終了して、意味上の属性にその値が指定さ
れ、入力文字列に対する引き数構造が構築される。第２
ステツプ（２，２）では、意味上の付加部、すなわち引
き数ではないが、最終的な意味構造にとって重要な修飾
部を指定する。

この第２ステツプの第１相では、述部形容詞をその主語
名詞句と連係させる（第２Ｅ図）。述部形容詞構文の例
は次の文である。

Ｍａｒｙ　ａｎｄ　Ｊｏｈｎ　ａｒｅ、　ａｎｄ　ａｌ
ｗａｙｓ　ｗｉｌｌ　ｂｅ。

ｈａｐｐｙ　。

形容詞″ｈａｐｐｙ”は主語名詞句″Ｍａｒｙ　ａｎｄ
　Ｊｏｈｎ　”のＩＩ　Ｍａ、ｙｎと’　Ｊｏｈｎ　”
にかかるが、ＮＰからずっと離れている。句が”ｈａｐ
ｐｙ　Ｊｏｈｎ　ａｎｄ　ｈａｐｐｙ　Ｍａｒｙ　”で
ある場合は、問題はない。しかし、上記の文は形容詞が
主語から離れているので、構文解析によって、直接圧し
い接続はできない。この点で、述部形容詞をそのＮＰと
連係させる問題は、遠隔依存関係の問題と同じである。

その問題を解決する第１ステツプは、主語名詞句のリス
トを構成することである（ステップ１５）。主ＭＮＰが
１つしかない場合、リストは、１つのメンバを含むリス
トである。リストの各メンバ上で、ＰＡＤＪＩ性を作成
する（ステップ１６）。その値は述部形容詞を指すポイ
ンタである。

次に、主語ＮＰのリストの次のメンバを処理する。

リストが空になると、手順は終了する。

すべての引き数が識別されると、ポストプロセッサは主
な句範１１ＶＰ、ＮＰ　（ＰＰを含む）、ＡＪＰ、ＡＶ
Ｐを考慮して、すべての非引き数修飾部にその固有の意
味属性が指定されていることを確認する（これらの非引
き数修飾部も「付加部」と呼ばれる）。

考慮すべき第１の範嗜は、動詞句である（第２Ｆ図）。

動詞句自体が等位接続のＶＰを含む場合、それは等位接
続ｖＰを分類する手順に送られる（ステップ１７）。分
類された要素は主手順に戻される。ＶＰが等位接続セグ
メントではない場合、前Ｗ修飾部と後置修飾部を含むす
べての修飾部のリストが構成される（ステップ１８）。

そのリストの各メンバについて、ａ、それがＮＰである場合は、ＮＰ修飾部を処理する手
順に送られる（ステップ１９）。

ｂ、それがＰＰである場合は、（１）ＰＰ中の前置詞と同じ名前をもつ属性がＶＰ上に
作成される（ステップ２０）。

（２）ＰＰの目的語がこの属性の値として指定される（
ステップ２０）。

（３）セグメントがＮＰ修飾部を処理する手順に送られ
る（第２Ｇ図参照）。

Ｃ３それが形容詞句または副詞句である場合、ＭＯＤＳ
属性がＶＰ上に作成され、その値はＡＪＰまたはＡＶＰ
を指すポインタである（ステップ２１）。

ｄ、それが埋め込まれた節（たとえば、従属節）である
場合、ＰＲＯＰｒＲ性がＶＰ上に作成され、その値は埋
込みクラスを指すポインタである（ステップ２２）。

次に、修飾部のリストの次のメンバを処理する（ステッ
プ２３）。リストが空になると、手順は終了する。

考慮すべき次の範曙は、名詞句（第２Ｇ図）である。名
詞句自体が等位接続ＮＰを含む場合は、等位接続ＮＰを
分離する手順に送られる（ステップ２４）。分離された
要素は主手順に戻される。

ＮＰが等位接続セグメントでない場合、前置修飾部と後
置修飾部を含むすべての修飾部のリストが構成される（
ステップ２５）。そのリストの各メンバについて、ａ、それが限定辞または限量辞（ｔｈｅ、　ａｌ　ｔｈ
ｉｓ＋ｓｏｍｅ＋　ａｌｌなどの単語）である場合、Ｏ
ＰＳ　（操作子）属性がＮＰ上に作成され、その値は限
定辞または限量辞を指すポインタである（ステップ２６
）。

ｂ、それが限定辞または限量辞以外の形容詞句である場
合、ＮＡＤＪｇ性がＮＰ上に作成され、その値は形容詞
句を指すポインタである（ステップ２７）。

ｃ、ＮＰが動名詞（”−ｉｎｇ″で終わる名詞）の場合
、（１）問題の句が所有形容詞である場合は、ＤＳＵＢＪ
ＥＣＴ属性がＮＰ上に作成され、その値は所有形容詞を
指すポインタである（ステップ２８）。

（２）動名詞ＮＰ中に所有形容詞がない場合は、ＤＳＵ
ＢＪＥＣＴ属性がＮＰ上に作成され、その値はＸＸ″で
ある（ステップ２９）。この値は、より多くの情報が利
用できるとき変更できる。

ｄ１問題の句が埋込み節（たとえば、関係節）である場
合、ＰＲＯＰ属性がＶＰ上に作成され、その値は埋込み
節を指すポインタである（ステップ３０）。

ｅ、それがＰＰである場合、（１）ＰＰ中の前置詞と同じ名前をもつ属性がＮＰ上に
作成される（ステップ３１）。

（２）ＰＰの目的語がこの属性の値として指定される（
ステップ３１）。

（３）そのセグメントがＮＰ修飾部を処理する（すなわ
ち、現在説明している第２Ｇ図の手順）手順に戻される
。

ｆ２問題の句が上記以外のものである場合、Ｍ○ＤＳ属
性がＮＰ上に作成され、その値はこの他の句を指すポイ
ンタである（ステップ３２）。

次に、修飾部のリストの次のメンバが処理される（ステ
ップ３３）。リストが空になると、手順が終了する。

形容詞向及び副詞句の意味上の修飾部を識別する（第２
Ｈ図と第２Ｉ図）手順の各ステップは同一である。まず
、すべての修飾部のリストを構成する（ステップ３４）
。そのリストの各メンバについて、ａ、それがＰＰである場合、（１）ＰＰの前置詞と同じ名前をもつ属性がＡＪＰまた
はＡＶＰ上に作成される（ステップ３５）。

（２）ＰＰの目的語がこの属性の値として指定される（
ステップ３５）。

（３）そのセグメントがＮＰ修飾部を処理する手順に送
られる（第２Ｇ図参照）。

ｂ、そうでない場合は、ＭＯＤＳ属性がＡＪＰまたはＡ
ＶＰ上に作成され、その値は考慮中のリスト・メンバを
ｔ旨すポインタである（ステップ３６）。

次に、修飾部のリストの次のメンバが処理される（ステ
ップ３７）。リストが空になると、手順が終了する。

第２Ｊ図は、等位接続動詞句を分離する処理を示す。こ
の手順は、ＶＰ修飾部を処理する処理手順から呼び出さ
れる（第２Ｆ図参照）。まず、より大きな等位接続ＶＰ
内にあるすべてのＶＰＰからリストが構成される（ステ
ップ３８）。次に、ＶＰのリストの各メンバについて、ａ１等位接続ＶＰが共通の構文上の主語をもつ場合、そ
の主語がリストの各メンバＶＰに分配される（ステップ
３９）。その１例は以下の通りである。

Ｊｏｈｎ　ｃａｍｅ　ｉｎ　ａｎｄ　ｓａｔ　ｄｏｗｎ
。

上記の文で、”　ＪＯｈｎ　”は、等位接続ＶＰ″ｃａ
ｍｅｉｎ″と５Ｂｔ　ｄｏｗｎ″の両方の構文上の主語
である。

６０節が受動態の場合（たとえば、・Ｊｏｈｎ　ｗａｓ
ｈｕｇｇｅｄ　ａｎｄ　ｋｉｓｓｅｄ、　”　）　、各
メンバＶＰ中ノＰＡＳＳＩＶＥ属性がオンにセットされ
る（ステップ４０）。

Ｃ１最終的ｖＰ中に構文上の直接目的語がある場合、そ
の目的語がリストの各他動詞メンバＶＰに分配される（
ステップ４１）。その１例は次の通りである。

Ｊｏｈｎ　ｗｒｏｔｅ　ａｎｄ　ｓｉｇｎｅｄ　ｔｈｅ
　ｄｏｃｕｍｅｎｔ。

上記の文で１″ｔｈｅ　ｄｏｃｕｍｅｎｔ″は、等位接
続ＶＰ”　ｗｒｏｔｅ　”と”ｓｉｇｎｅｄ”の両方の
構文上の目的である。

ｄ、その節に遠隔依存関係が存在する場合、前置要素が
リストの各メンバＶＰに分配される。（ステップ４２）
。その１例は次の通りである。

Ｗｈａｔ　ｄｉｄ　Ｐｅｔｅｒ　ｓａｙ　ｔｈａｔ　Ｊ
ｏｈｎ　ｗｒｏｔｅ　ａｎｄＳ　ｉｇｎｅｄ？上記の文で、前置疑問詞”　ｗｈａｔ　”がＶ　Ｐ　”
　ｗｒｏｔｅ　”と、ＶＰ″ｓｉｇｎｅｄ″に分配され
る。依存関係は、後で第２Ｂ図に示す手順によって解決
される。

ｅ、上記のすべての分配が行なわれた後、ＶＰリストの
個々の各メンバが引き数を識別するため主手順に送られ
る（ステップ４３）。次いで、ＶＰのリストの次のメン
バが処理される（ステップ４４）。リストが空になると
、手順は終了する。

第２に図は、等位接続名詞句を分類する処理を示す。こ
の手順は、ＮＰ修飾部を処理する処理手順から呼び出さ
れる（第２Ｇ図参照）。まず、より大きな等位接続ＮＰ
内にあるすべてのＮＦＬからリストが構成される（ステ
ップ４５）。次に、ＮＰのリストの各メンバについて、ａ、ＭＯＤｓｆｆ性が親ＮＰ上に作成され、その値はリ
ストのＮＰメンバを指すポインタである（ステップ４６
）。この結果、すべての等位接続ＮＰがそれらの１ｆＡ
ＮＰのもとてＭＯＤＳとしてリストされることになる。

ｂ、ＮＰリストの個々の各メンバがそのように措置され
た後、引き数を識別するため主手順に送られる（ステッ
プ４７）。次に、ＮＰのリストの次のメンバが処理され
る（ステップ４８）。リストが空になると、手順が終了
する。

第３図は、遠隔依存関係をもつ文°“Ａ１１ｃｅ。

Ｐｅｔｅｒ　５ａｉｄ　ｔｈａｔ　Ｊｏｈｎ　ｋｉｓｓ
ｅｄ、　”の処理の際に行なわれる２つの構造段階を示
す。第１は、解析木４９として省略形で示した構文構造
である。この解析木は、ＰＥＧがこの入力文字列を処理
した後にレコード構造中に実際存在する少数の属性と値
のみを使って作成される。この解析木では、”　ＡＩ　
ｉｃｅ″が動詞″ｋｉｓｓｅｄ″から離されており、こ
の２つの単語の間に何らかの意味のある関係の指示はな
い。

第２は、基本意味構造、引き数構造５０であり、一種の
図として省略形で示されている。この図は、本発明で開
示された意味属性と引き数のみを使用し、それらの引き
数がその動詞によって正しくグループ分けされるように
インデントすることによって作成される。この引き数構
造では、”　ＡＩ　ｉｃｅ“は動詞″ｋｉｓｓｅｄ”の
ＤＯＢＪＥＣＴとして正しく連係されている。

出力されるレコード構造は、ある自然言語を別の言語に
より正確に翻訳するために機械翻訳装置で使用される。

この出力は、高度のテキスト校訂、改良された情報検索
、電子メールの経路設定及びファイル編成、及び基本意
味解析を必要とするその他のＮＬＰ応用例にも適用でき
る。

本発明は、前記の米国特許４７３１７３５号明細書に開
示されているようなデータ処理システムで走行するコン
ピュータ・プログラムとして具体化される。本発明を具
体化したプログラムは、システムのメモリに記憶され、
実行装置によって実行される。自然言語の単語の文字列
は、キーボード、大容量記憶装置、接続端末、または通
信リンクから実行装置に入力できる。本発明の構文解析
段階と意味解析段階は、データ処理システム中の本発明
のプログラム実施例によって実行される。

本発明のプログラム実施例によって出力された意味属性
レコード構造は、入力文字列の意味上の特徴づけとして
、表示装置、プリンタ、大容量記憶装置、通信リンク、
またはメモリの別の区画に出力することができる。表示
画面上でユーザに直接表示でき、同じデータ処理システ
ムまたは他のデータ処理システム上で走行する利用処理
またはプログラムに入力できる。

本発明の特定の実施例を開示したが、当業者なら容易に
理解できるように、本発明の精神と範囲から逸脱するこ
となくこの具体的実施例に変更を加えることができる。

【図面の簡単な説明】

第１Ａ図及び第１Ｂ図は、現在の言語学理論による見え
ない引き数の決定するための従来の方法を示す図である
。第２図は、引き数構造を決定するための方法の流れ図を
示す第２Ａ図ないし第２に図の関係を示す図である。第２Ａ図は、流れ図の不定詞補語及び分詞補語を処理す
る部分を示す図である。第２Ｂ図は、流れ図の遠隔引き数を処理する部分を示す
図である。第２Ｃ図は、流れ図の受動構文を処理する部分を示す図
である。第２Ｄ図は、流れ図の前置詞″ｔｏ”をもつ前置詞句中
に間接目的語がある間接目的構文を処理する部分を示す
図である。第２Ｅ図は、流れ図の述部形容詞を主部名詞句と連係す
る部分を示す図である。第２Ｆ図は、流れ図の動詞句修飾部を処理する部分を示
す図である。第２Ｇ図は、流れ図の名詞句修飾部を処理する部分を示
す図である。第２Ｈ図は、流れ図の形容詞句修飾部を処理する部分を
示す図である。第２１図は、流れ図の動詞句の修飾部を処理する部分を
示す図である。第２Ｊ図は、流れ図の等位接続動詞句を処理する部分を
示す図である。第２に図は、流れ図の等位接続名詞句を処理する部分を
示す図である。第３図は、遠隔依存関係の適切な解決法を示す例として
、文”Ａｌ１ｃｅ、　Ｐｅｔｅｒ　５ａｉｄ　ｔｈａｔ
　Ｊｏｈｎｋｉｓｓｅｄ、　”の完成した基本意味構造
（引き数構造）の解析木と表示を示す図である。

Claims

【特許請求の範囲】

（１）自然言語による言語表現を形成する複数の単語か
ら成る文字列を入力するステップと、入力文字列の構文構造を誘導する１組の構文規則によっ
て入力文字列を解析し、前記単語の構文引き数を識別す
るステップと、意味引き数が前記構文引き数と正確に対応するとき、前
記文字列中の第１の単語グループを意味引き数として識
別するステップとを有し、さらに、前記第１グループに
はない、前記文字列中の第２の単語グループの意味引き
数を識別するために、不定詞節及び分詞節の滅失してい
る引き数を指定するサブステップと、遠隔引き数を指定するサブステップと、受動構文の滅失しているまたは離れた引き数を指定する
サブステップと、間接目的構文の引き数を指定するサブステップと、前記入力単語文字列の正規化意味構造を実現する前記指
定引き数を出力するステップとを有することを特徴とす
る自然言語の単語文字列の基本意味構造を決定する自然
言語処理方法。
（２）間接目的構文の引き数を指定するステップの後で
、述部形容詞をその主語名詞句と連係するステップ、動詞句修飾部をその動詞と連係するステップ、名詞句修
飾部をその名詞と連係するステップ、形容詞句修飾部を
その形容詞と連係するステップ、及び副詞句修飾部をその副詞と連係するステップを含み、修飾部が意味論的に前記入力単語文字列に連係される、請求項１に記載の自然言語処理方法。
（３）前記指定ステップで、前記解析ステップで累積さ
れた構文情報のすべてを含む前記構文構造を走査する手
順によって基本意味構造が作成される、請求項１に記載
の自然言語処理方法。
（４）前記正規化意味構造が、意味論的に重要な新しい
属性と値とを前記構文構造に追加することによって実現
される、請求項３に記載の自然言語処理方法。
（５）自然言語による言語表現を形成する複数の単語か
らなる文字列を入力するステップと、入力文字列の構文構造を誘導する１組の構文規則によっ
て入力文字列を解析し、前記単語の構文引き数を識別す
るステップとを有し、さらに、前記入力文字列の意味引
き数を識別するために、不定詞節と分詞節の滅失してい
る引き数を指定するサブステップと、遠隔引き数を指定するサブステップと、受動構文の滅失しているまたは離れた引き数を指定する
サブステップと、間接目的構文の引き数を指定するサブステップと、前記入力単語文字列の正規化意味構造を実現する前記指
定引き数を出力するステップとを有することを特徴とす
る自然言語の単語文字列の基本意味構造を決定するため
の自然言語処理方法。
（６）間接目的構文の引き数を指定する前記ステップの
後で、述部形容詞をその主語名詞句と連係するステップ、動詞句修飾部をその動詞と連係するステップ、名詞句修
飾部をその名詞と連係するステップ、形容詞句修飾部を
その形容詞と連係するステップ、及び副詞句修飾部をその副詞と連係するステップを含み、修飾部が意味論的に前記入力単語文字列に連係される、請求項５に記載の自然言語処理方法。
（７）前記指定ステップで、前記解析ステップで累積さ
れた構文情報のすべてを含む前記構文構造を走査する手
順によって基本意味構造が作成される、請求項５に記載
の自然言語処理方法。
（８）前記正規化意味構造が、意味論的に重要な新しい
属性と値を前記構文構造に追加することによって達成で
きるという、請求項７に記載の自然言語処理方法。
（９）自然言語の言語表現を形成する複数の単語から構
成される文字列を入力するステップと、入力文字列の構
文構造を誘導する、意味情報から自由な１組の構文規則
によって入力文字列を解析し、前記単語の構文引き数を
識別するステップとを有し、さらに、前記文字列の意味引き数を識別するために、不定詞節と
分詞節の滅失している引き数を指定するサブステップと
、遠隔引き数を指定するサブステップと、受動構文の滅失しているまたは離れた引き数を指定する
サブステップと、間接目的構文の引き数を指定するサブステップと、前記入力単語文字列の正規化意味構造を提供するレコー
ド中に前記指定引き数を出力するステップとを有するこ
とを特徴とする自然言語の単語文字列の基本意味構造を
決定する自然言語処理方法。
（１０）間接目的構文の引き数を指定する前記ステップ
の後で、述部形容詞をその主語名詞句と連係するステップ、動詞句修飾部をその動詞と連係するステップ、名詞句修
飾部をその名詞と連係するステップ、形容詞句修飾部を
その形容詞と連係するステップ、及び副詞句修飾部をその副詞と連係するステップを含み、修飾部が意味論的に前記入力単語文字列に連係される、請求項９に記載の自然言語処理方法。
（１１）前記指定ステップで、前記解析ステップで累積
された構文情報のすべてを含む前記構文構造を走査する
手順によって基本意味構造が作成される、請求項９に記
載の自然言語処理方法。
（１２）前記正規化意味構造が、意味論的に重要な新し
い属性と値を前記構文構造に追加することによって達成
される、請求項１１に記載の自然言語処理方法。