JPH0383167A - 自然言語処理方法 - Google Patents

自然言語処理方法

Info

Publication number
JPH0383167A
JPH0383167A JP2205324A JP20532490A JPH0383167A JP H0383167 A JPH0383167 A JP H0383167A JP 2205324 A JP2205324 A JP 2205324A JP 20532490 A JP20532490 A JP 20532490A JP H0383167 A JPH0383167 A JP H0383167A
Authority
JP
Japan
Prior art keywords
argument
natural language
associating
specifying
syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2205324A
Other languages
English (en)
Inventor
Karen Jensen
カレン・ジヤンセン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0383167A publication Critical patent/JPH0383167A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本明細書に記載された本発明は、自然言語処理(NLP
)のためのデータ処理方法に関し、具体的には文の基本
意味構造を決定するための改良されたデータ処理方法に
関する。
B、従来の技術 自然言語テキストは、述部とそれらの引き数から成る命
題(proposition )群から構成されると言
える。述部の例は動詞であり、その引き数の例は関連す
る名詞または名詞句である。たとえば、John 10
ves Mary。
という文には、動詞″10ves ”を述部とする。1
つの命題がある。” 10ves″はこの命題中で、”
 John ”と” )lary″の2つの引き数をも
つ。コンピュータ・システムが自然言語を理解するには
、述部と引き数群を正確に識別できなければならない。
上記のような単純な文では、これは難しくない6 (上
記の”John 10ves I(ary、 ”のよう
に)英語の動詞にその引き数が直接接している場合、コ
ンピュータ文法で動詞に適切な引き数を割り当てるのは
比較的容易である。しかし、実生活上のテキストでよく
現れるようなより複雑な文では、この作業はずっと難し
くなる。引き数がその動詞に密接してないとき、難しい
問題が発生する。
実際には、引き数が文の上で全く見えなくなることもあ
るが、人間がするように、プログラムがそれを推論しな
ければならない。たとえば、Mary was kis
sed。
この文では、動詞” kissed ”の唯一の目に見
える引き数は”Mary”である。しかし、人間はキス
をした人に対応する別の引き数を推論することができる
。もう1つの関連する状況は次のような文に現れる。
Who did Mary think that P
eter 5aid thatJohn kissed
? 上記の例でも、動詞の” k 1ssed ”に2つの
引き数がある。” John″は動詞のすぐ傍にあるが
、第2の引き数である”who″は動詞から離れている
したがって、問題は、見えないものや離れた位置にある
ものを含めて、すべての引き数をそれらの述部と正しく
連係することである。
述部−引き数構造を識別する問題、特に、”Wh。
did Mary think that Peter
 5aid that Johnkissed?”にお
けるような「遠く離れた依存関係」を正しく指定するH
Hは、言語学及びコンピュータ言語の文献で周知である
。これを実施するための2つの主要な方法が記載されて
いる。
*「空範嗜J  (EC)法 *「機能的不確定性J  (FU)法 EC法は、支配結合(GB)学派及び一般化句構造文法
(GPSG)学派の言語学者によって主張されている。
(P、セル(Sell)著「現代統辞法理輪講義(Le
ctures on Conte++porarySy
ntactic Theorfes) J 、CS L
 I N スタンフォード大学、米国カリフォルニア州
スタンフォード、1985年刊)。この方法は、その文
が最も中立的な形にある場合に転置された構成要素があ
るはずの場所に、空のスロットを含む解析構造を使用す
る。たとえば、”Al1ce、 Peter 5aid
 thatJohn  kissed、 にPeter
 5aid that John kissedAli
ce、) ”という文は、動詞″kissed”のすぐ
後に「空範曙」または「トレースJ  (’“cIIで
表ス)をもつと想像される。というのは、それが、名詞
句”Al1ce”が属する場所であるからである。こう
した方向に沿って+m築されたコンピュータ文法は、実
際にその解析構造または氷中に空スロットを指定する(
第1A図参照)。
FU法は、語負機能文法(LFG)理論を信奉する言語
学者によって主張されている。この方法は、解析木中の
空スロットではなく、すべての動詞の特徴(「特徴」と
は主として動詞が持たなければならない必要な引き数の
数と種類を指す)を、文の左から右へと順次評価して、
転置された構成要素が最もうまくはまる場所を見つける
ものである。うまくあてはまる引き数構造を計算するた
めに、形式的表記装置がLPG文法記述言語に追加され
た。R,M、カブラン(Kaplan) 、A、ツェー
ネン(Zaenen )の論文「遠隔依存関係、句構造
、および機能的不確定性(Long−distance
Dependencies、 Con5tituent
 5tructure、 andFunctional
 Uncertainty) J 1M、パルティン(
Baltin) 、A、クロッホ(Kroch )共編
「句構造の代替概念(Alternative Con
ceptions ofPhrase 5tructu
re) J 、シカゴ大学出版社、1987年刊)。こ
うした方向に沿って構築されたコンピュータ言語は、こ
の装置を使用して、その文法規則で、見えない引き数を
割り当てるべき場所を指定する。
本発明の方法は、上記のどちらの方法とも異なっている
。本方法は、EC法とは次の点で異なる。
a、どんな種類の空[4またはトレースも使用しない。
b、構成要素、木、構造に余り依存せず、構文解析によ
って供給されるあらゆる種類の情報を使用する。
本方法は、FU法とは次の点で異なる。
a、使用するプログラミング言語によってすでに供給さ
れたちの以外のどんな特別の表記装置も使用しない。
51文中の動詞の特徴(いわゆる「機能情報」)に完全
には依存せず、構文解析によって供給されるあらゆる種
類の情報を使用する。
本方法は、構文解析が完了した後に引き数充填を実行す
るという点で上記のどちらの方法とも異なっている。本
方法は、解析構成要素自体ではなく、ポストプロセッサ
を使用して、構文属性値情報の全領域を操作して、最も
妥当な引き数構造を誘導するものである。
本方法と、言語理論から生まれたNLPシステムの方法
のもう一つの違いは、後者のシステムの大部分が、論理
プログラミング言語によって供給されたような、ある形
式の統一化を使用していることである。統一化により、
属性値構造の自動突合せが可能になるが、それは、否定
および分離の条件をうまく処理できないなど、いくつか
の欠点をもつ。本方法は、手順式ポストプロセッサを使
用するので、こうした欠点を持たない。
本方法はきわめて効率的である。ポストプロセッサによ
ってシステムの動作時間は大して増加しない。さらに、
初期解析構成要素は完全に定義域に依存しているので、
システム全体できわめて広い範囲の英語をカバーするこ
とができる。
EC法とFU法は現在有力な言語理論であるが、どちら
も、今日のNLP技術を使用する応用分野で広く採用さ
れてはいない。英文テキストの意味解析を含む従来技術
の応用例は、一般に何らかの形の辞書主導の引き数識別
を使用しているが、ECまたはFUの技術または形式を
必ずしも採用していない。
従来技術による英文のテキストの意味処理の方法は、コ
ンピュータ言語学会第25回年会報文集(the Pr
oceedings of the 25th Ann
ual Me゛etingof the As5oci
ation for ComputationalLi
nguistics) 、スタンフォード大学、198
7年7月−9月、pp、131−134に記載されてい
る。そこに記載された方法について、以下に簡単に説明
する。この従来技術のシステムは、単一の意味定義域、
すなわち、米海軍の船舶で使用される特定の種類の機械
類の故障報告を処理するように設計されている。この定
義域に属する英文が入力されると、システムは、文の意
味解析を行ない、その意味解析を、いくつの引き数をそ
の文の動詞に関連づけることができるか、及びそれがど
んな種類の引き数かを指定する、基礎フォーマットまた
はテンプレートにマツプする。(1)必須、(2)基本
、(3)非基本の3つの異なる引き数クラスが定義され
ている。必須引き数は構文解析で必ず存在しなければな
らず、存在しないとその解析は失敗する。基本引き数は
、構文中に必ずしも存在する必要はないが、それがない
場合、システムはその役割を果たすいくつかの「最良の
推測」の候補を仮説として取り上げる。したがって、基
本引き数及び必須引き数は、最終的には文の意味構造中
に存在する。非基本引き数は存在してもしなくてもよい
たとえば、”Pump failed、  (ポンプ故
障)という入力文が与えられると、構文解析の結果は、
主動詞として”failed″が与えられ、その構文上
の主語としてpump ”が与えられるはずである。
動詞”fail″1の基礎テンプレートは、それがFA
TI ENTと呼ばれる1つの引き数を持つことを示す
はずである。次に、マツピング規則は、npuvApn
がPATI ENT引き数の良い候補である(引き数は
「役割」とも呼ばれる)とする。次に、制限があるかど
うか検査する。動詞″fail”では、PATIENT
の役割を果たすものは機械装置でなければならないとい
う制限がある。(−般に、こうした情報は、辞書の名詞
″pump″の項目に記載のマーク、すなわち+MEC
Hで示される。)  pump”は機械装置として合格
しているので、この引き数構造は完成する。すなわち、
”failed”は1つの引き数としてそのPAT、I
ENTをもち、これはpump ”で充填される。
しかし、この従来技術の引き数充填法には、次のような
いくつかの問題点がある。
第一に、単語がとり得る可能な意味が、当該の定義域に
属するものだけに厳しく限定される。たとえば、動詞”
fail ”は、次のような文に関連する意味をもつこ
とができる。
The equipment failed。
土窯では、この動詞は1つの必須引き数(” equi
pment″)をとる。しかし、このシステムは次のよ
うな文中の動詞″faLIed“を解釈できない。
His courage failed him。
Today  I  took the chemis
try exam and failedme a v
hopper! このシステムは、狭く定義された部分定義域内ではこの
ような文は通常現れないことに依拠している。しかし、
人間による言葉の使い方は予測できないものであり、動
詞”fail″が海軍船舶の報告で上記のような意味で
は絶対に使用されないとの保証はない。このシステムで
このような文ヲ扱う唯一の方法は、”fail”に対す
る追加のテンプレートを用いるものであろう。しかし、
追加のテンプレートを用いると、構文解析構成要素に多
くの困難が生じることがある。
第二に、各動詞ごとに、必須、基本、非基本の3つの引
き数クラスを分離する必要があるために処理が複数にな
る。必須引き数の数は、ある動詞の意味が異なるごとに
変わるので、特定の狭い意味論上の部分定義域の範囲内
でさえ、所与の動詞がいくつの意味をとり得るかを正確
に指定することは非常に難しい。
第三に、充填子が「最良の推測」仮説にすぎない場合で
さえすべての基本引き数を充填する必要があるために、
システムの流れが妨げられる。構文構造中に必須引き数
及び基本引き数、のりストで必要とされるより少しの引
き数しか存在しない場合、その文の文法解析を成功させ
るために、しばしば、システムを停止し、バックアップ
し、再度試行する必要がある。
第四に、この従来技術のシステムでは、上記の「遠隔依
存関係」など最も巧妙な種類の引き数充填にほとんどま
たは全く関心が払われていない。
このシステムは、そのような複雑な構造が狭い部分定義
域で現れるとは予想されないということに依拠している
。しかし、自然言語がフレキシブルな性格であるとすれ
ば、この予想は完全に安全なものではない。
上記の理論的引き数充填手法(ECとFU)は、自然言
語の複雑さを処理するものであるが、それ自体が複雑で
あるため、実際の応用例で使用するのは難しい。これら
の従来技術の応用例は、実世界で意味論上の部分定義域
の範囲内で利用できるが、自然言語の複雑さをすべて処
理する技術を提供するものではなく、シたがってその適
用範囲が限られている。
米国特許第4731736号明細書に、本明細書で開示
する発明が実施できるデータ処理システムが開示されて
いる。上記の開示を、本明細書に開示する発明の背景技
術として、引用により本明細書に合体する。
C0発明が解決しようとする課題 本発明の目的は、英文の引き数構造または基本意味構造
を決定するための改良された方法を提供することである
本発明の他の目的は、制限された意味定義域に関連する
文だけでなく、英語の任意の入力文に対する引き数構造
を決定する際に成功の確率が高くなるように、広い範囲
の英語をカバーすることである。
本発明の他の目的は、属性値データ構造に照会し、それ
に追加し、かつそれから差し引くことによって完全に動
作し、ある動詞(または任意の語)を理解できるように
するにはそれがいくつの引き数をもたなければならない
かを指定する任意の述部引き数テンプレートによって制
限されない、手順と結合した、完全にモジュール式の方
法を使って、効率的な意味処理技術を提供することにあ
る。
01課題を解決するための手段 上記その他の目的、特徴及び利点は、本明細書に記載す
る発明によって達成される。英語の入力散文の述部−引
き数構造を決定するためのコンピュータによる方法が開
示される。ブランクで分離された単語文字列の形の入力
文を、まず単語に関する形態論情報及び構文情報にのみ
アクセスできる規則構成要素によって文法解析する。こ
の規則構成要素の出力は、属性値対からなるデータ構造
の形のもので、それが次に、言語知識をさらに統合する
部分的に順序通り配列された一組の手順から構成される
、引き数構造構成要素によって処理される。こうした手
順の出力は、同じ属性値構造であるが、今度は意味(す
なわち、意味のある非構文的な)rf4性の存在によっ
て性能が向上している。これらの意味属性が一つにまと
まって入力文の引き数構造を形成する。
その結果、本発明は、構文から自然(人為)言語の意味
処理の第1の段階に進むための、完全にモジュール式の
包括的かつ効率的な方法である。
本発明は、その設計の対象となっている言語の一部分で
はなく、すべての散文に適用される。本発明は、定義域
特有の意味情報を使用して、構文構成要素の精度または
効率を改善するものではない。
したがって、本発明は、今日の大部分のNLP応用例で
使用されている制限的方法ではなく、自然言語処理(N
LP)に対する無制限の広範囲をカバーする方法である
異なる自然言語に対する具体的な規則及び手順はそれぞ
れ異なるが、本発明で具体化された全般的な概念はすべ
ての自然言語に適用可能である。
英語の入力文字列の基本意味構造を決定するためのNL
P方法が開示される。本方法によれば、こうした目的を
達成するために、英語の入力文字列を以下のように処理
する。本発明によれば、この方法には2つの段階がある
。第1段階は意味構成要素なしで構文解析を実行するも
のであり、第2段階は意味解析を実行するものである。
まず、入力文字列を、構文解析構造要素で解析する。−
例を挙げると、好ましい実施例では、PLNLP英語文
法(PEG)と呼ばれる構文解析プログラムを使用する
。(”PLNPL”はプログラミング言語の名前であり
、自然言語処理用プログラミング言語の頭字語である。
)PEGは、各入力文字列ごとに構文解析を行なう。こ
の解析は、属性と値の収集からなる。こうした集合体を
、「レコード」または「レコード構造」と呼ぶ。
構文解析の段階で、PEGは、各動詞への引き数の割当
ての完了を試みない。しかし、PEGが行なう解析は、
すべての引き数を計算し充填するのに必要なすべての情
報を含んでいる。
引き数構造は、意味値をもつ追加の属性を用いて、構文
解析レコードの性能を改善することによって作成される
。構文を、しばしば入力文字列の「表面」構造と呼び、
意味を入力文字列の「深層」構造と呼んでいる。以下の
「深層」属性が定義されている。必要に応じて他のもの
が追加されることもある。
a、DSUBJECT−命題の深層(すなわち意味上の
)主語、一般に、動作の行為者。
b、DOBJECT−命題の深層目的語、すなわち行為
者の動作によって最も直接的に影響を受けるエンティテ
ィ。
c、DINDOBJ−深層間接目的語、すなわち行為者
の動作を介して何かを経験し、または受は取るエンティ
ティ。
d、DPREDNOM−命題中でDSUBJECTと同
じになるエンティティ。
e、DOBJCOMP−命題中でDOBJECTと同じ
になるエンティティ。
構文解析段階を終えた後、本発明によると、レコードは
意味解析段階の第1ステツプに進む。ここでは、構文基
準により、識別の容易な意味引き数を、すなわちその動
詞に近接しかつ密接に関連する意味引き数を識別する。
これは、単に「深層J引き数層性を加算して、それらが
その「深層」構文解析が与えるのと同じ値を指すように
させる。
意味解析段階にはさらに2つのステップがある。
第2のステップでは、以下のように引き数を指定し完成
する。
*不定詞節と分詞節の見えない引き数を指定する。
*転置された引き数または「遠隔」引き数を指定する。
*受動構文の見えないまたは転置された引き数を指定す
る。
*英語の間接目的構文の2つの異なる形式に対する引き
数を等しくする。
これで、引き数指定ステップは完了する。任意選択で、
他の構文状況が発見された場合にその状況に対する引き
数指定を処理する手順を考案して、このステップを増補
することもできる。
これらの中核的手順のうちで、順序配置がある程度重要
である。たとえば、見えない引き数を不定詞節及び分詞
節に割り当てる部分手順は、リストの最初に配置しなけ
ればならない。転置された(遠隔)引き数は、受動構文
手順の前に配置しなければならない。
すべての引き数が適切に指定された後、ポストプロセッ
サがその第3のステップを開始して、主動詞の引き数で
はない解析済みセグメントを再検討する。これらの非引
き数セグメントは「付加部Jと呼ばれる。この@討の結
果、VP(動詞句)、AJP(形容詞句)、AVP(副
詞句)、NP(名詞句)、及びPP(前置詞句)という
各主要クラスの非引き数修飾部を指す意味属性の追加に
よって、レコード構造の性能がさらに改善される。
以下の意味属性が定義されており、必要に応じて他のも
のも追加されることがある。
a、MODS−修飾部;指定されない。
b、NADJ−名詞を前から修飾する形容詞。
c、PADJ−述部形容詞、または修飾名詞を後から修
飾する形容詞。
d、0PS−操作子;限定辞と限量辞を含む。
e、PARTICL−動詞と組み合わされて動詞句の引
き数構造の大きな変化を知らせる前置詞または副詞。
f、PRED−各単語の基本形式。
g、PROP−前置修飾部;不定詞句と分詞句を含む。
h、REF−代名詞が指す名詞。
このレコード構造に最終的調整を加えて、不必要な属性
を消去し、一般にレコード構造を1.システムの次の構
成要素に移る前にクリーンアップする。ある自然言語を
別の言語により正確に翻訳するために、出力されたレコ
ード構造を機械翻訳装置で使用することができる。この
出力は、高度のテキスト校訂、改良された情報検索、電
子メールの経路設定及びファイル編成、自動テキスト生
成、及び基本意味解析を必要とするその他のNLP応用
例にも適用できる。
E、実施例 第2図は、このシステムの全体的構成を示す。
このシステムは、入力段階、構文構造を作成する解析段
階、意味引き数が構文引き数と等しい場合に引き数を指
定する予備機解析ステップ(1)と、他のすべての場合
に引き数を決定し、それ自体が意味引き数を指定するス
テップ(2,1)と、付加部を指定するステップ(2,
2)とを含む主ポストプロセッサ(2)、最後に、入力
文字列に対応する基本意味構造である完成した引き数構
造(3)を含んでいる。
入力段階中に、単語の文字列がシステムに入力される。
これは通常、キーボードでテキストをタイプ入力するこ
とによって行なう。ただし、単語文字列は他のどんな手
段で入力してもよい。たとえば、音声認識構成要素が利
用できる場合、テキストを人間の声で入力することもで
きる。
構文解析段階は、構文解析構成要素PEGによって実行
される。PEGは、各入力文字列ごとに、属性値「レコ
ード」構造の形の解析記述を生成する。より読みやすい
構文解析「木」も、レコード構造に含まれる情報から表
示される。PEGは非常に大きな英語語寅リスト(シば
しば辞典(レフシコン)と呼ばれる)及び、英語の標準
の形態論的規則にアクセスする。しかし、辞典は、こう
した規則とあいまって、以下の種類の限られた形態論的
情報及び解析情報のみをPEGに提供する。
*大部分の英語の単語の正書法に基づく形(綴り)*各
単語が英語でとり得る品詞 *各単語に与えられた各品詞ごとの時制、数などの形態
情報 *各単語が属する様々な構文上の下位範嗜クラスに関す
る情報(たとえば、特定の動詞が他動詞か否か) PEGは、PLNLP (自然言語処理用プログラミン
グ言語)で書かれた大きなプログラムである。PEGは
、ボトム・アップ式の完全に並列処理のアルゴリズムに
よって駆動される、約200の増補句構造規則からなる
。これらの規則は、入力文字列の構文解析を生成する。
特定の規則が特定の文字列またはその文字列の一部分に
適用できるかどうかは、その文字列をカバーするレコー
ド構造中のある属性の有無及びそれらの値によって決ま
る。ある属性は辞典によって提供され、他の属性は規則
自体によって追加される。PEGが行なうのは、個々の
単語に対するレコードから始めて、最後にある構造に到
達するまで、次々により大きなレコード構造を構築する
ことにより、文字列の構文記述を生成することである。
最終構造に到達すると、入力文字列全体が解析される。
PEGは形態論的情報及び構文情報だけを使用し、意味
情報は全く使用しないで解析を行なうことに留意された
い。
多くの情報が属性値解析構造に含まれている。
この情報の一部は単純である。たとえば、動詞句(7)
L/コード中のPASTIIt性は、オンまたはオフの
値を持つ。それが「オン」の場合、その動詞句は、過去
時制であることを示す。ある情報はより複雑である。た
とえば、動詞句は属性5UBJECTをもつが、この属
性は、その値として、その名詞句に属するすべての情報
と共に、その主語として働く名詞句をカバーする他のレ
コード構造全体をt旨すポインタをもつ。
PEGによって指定されるすべての属性は、構文属性で
ある。そのうちには、入力文字列の構文引き数を参照す
るものがある(SUBJECTなど)。本明細書に開示
する方法によれば、意味論的後処理の第1段階では、意
味引き数が構文引き数と正確に対応するとき、その意味
引き数を識別する。これを行なうため、ポストプロセッ
サは、単にレコードにある意味属性を追加して、それが
その構文解析と同じ値を指すようにさせる(たとえば、
DSUB J ECTは、5UBJECTが指すのと同
じレコードを指す)。
後処理の次の段階では、引き数識別の残りのすべてのケ
ースを処理する。
第1に、ポストプロセッサは、不定詞または分詞形の動
詞補語を探したり、主語の名詞句に隣接するのではなく
、文の終りに現れる分詞形の主語補語を探して、レコー
ド構造を走査する。動詞補語である現在分詞を見つけた
(ステップ4)と仮定する。たとえば、 John+ in my opinior+、 1ik
es entertainingVOlen。
の文でentertaining women″は)主
動詞″1ikes″の補語である現在分詞節を形成する
この節の意味上の目的語(DOBJECT)は名詞“w
omen″であるo ” Women″′は構文上の目
的語として現れており、後処理の第1段階で意味上の目
的語であると識別されている。しかし、enterta
ining vo■en″の構文上の主語はない〇さら
に、この段階では、” en ter ta in i
ng ”を行なっているのが誰なのかわからないのでe
ntertainingwomen″の正しい意味上の
主語を決定することは不可能である。女を楽しませてい
るのはJohnかもしれないし、他の誰かかもしれない
。食違がJohnを楽しませている可能性すらある。そ
6場合は、これは分詞節ではなく 、”enterta
iningが形容詞として働く名詞句となる。したがっ
て、仮の意味上の主語(xx”)がこの場合の属性[5
UBJECTの値として指定される。これで、上記の文
の動詞”entertain ”の引き数指定はチアす
る。システムの後の構成要素で、“’ enterta
 inの最も可能性の高いDSUBJECTを計算する
第2A図の他のすべてのケースでは、DSUEJECT
がすでに節に存在する場合、手順は停社する。そうでな
い場合は、主動の構文上の主語力・当該の節のDSUB
JECTとして指定される(ステップ5)。分詞形の主
語補語の例として、次の文を考えてみる。
Mary、 as you predicted、 a
rrived excitedlywaving he
r hand。
”waving her hands″は)主動詞” 
arrived ”の補語ではなく、主動の主語″Ma
ry ”にかかるまたは補足する分詞節である。Wav
i0g“は、構文上の目的語(her hands)を
もち、これは直ちにその意味上の目的語DOBJECT
として識別される。しかし、″waving her 
hands“の構文上の主語はない。ステップ5で、”
Mary″をその意味上の主語(DSUB J ECT
)として識別する。
第2B図は、遠隔引き数を処理する手順の流れ図である
。現在4つの異なる遠隔状況が処理される。
a1話題提示二″Al1ce、 Peter 5aid
 that Johnkissgd。
b、疑問詞を使った疑問”Who clid Pete
r 5aythat John kissed? ”C
1関係節:”Th1s is the girl wh
o Peter 5aidthat John kis
sed、 ”d、自由関係: ”I know who
 Peter 5aid thatJohn kiss
ed。
この遠隔引き数処理手順では、遠隔前置要素(たとえば
、上記の文でイタリック体の単語)を識別して、この要
素をFRNTNPと呼ぶ。次に、遠隔関係の候補となる
節を識別し、これをCANDと呼ぶ。CANDは通常主
動詞を後から修飾する節のリストの最後の節である。こ
のリストは補語節と不定詞節を含むが、たとえば、従属
接続詞によって導入された従属節は含まない。
CAND自体が次の文のように等位接続の動詞句を含む
場合は(ステップ6)、 Who did Peter say that Jo
hn kissed andhugged? 等位接続動詞句を分離する手順に送られる(第2J図参
照)。最終的に、分離された要素が遠隔手順に戻される
。次に考慮することは、CANDが次の文のように懸垂
前置詞を含むかどうかである(ステップ7)。
Who did Peter say that Jo
hn ran 1nto ?上記の文では、CANDは
、”John ran 1nto″であり、懸垂前置詞
は“1nto ”である。このような場合、FRNTN
Pが懸垂前置詞の目的語として指定され(John r
an 1nto who?) 、手順は終了する。この
節は、必要に応じて次の引き数識別に利用できる。
CAND中に等位接続関係がなく、懸垂前置詞もない場
合、この手順の主な仕事が始まる。
遠隔依存関係の引き数を正しく識別するには、複雑な1
組の情報が必要である(ステップ8)。
第1に、CAND中の主動詞の下位範噌クラスが重要で
ある。作為動詞か、授与動詞か、それともそのどちらで
もないか。作為動詞は目的語と目的補語を取る。”Th
ey elected him (目的語)presi
dent (目的補語)、″授与動詞は間接目的語と目
的語を取る。”They gave her (間接目
的語)an award (目的語)、″第2に、CA
NDは時制節か、それとも不定詞節か。第3に、どれだ
けの引き数がすでに節中にあるか。第4に、すでに存在
している引き数ならびに遠隔要素にどんな特徴があるの
か。
ここで特に重要な特徴HUMは、いくつかの代名詞(′
vho科 I″+  ”you″、he″ ” she
 ”など)といくつかの名詞(“man″、°“wom
an″child”など)に付加される。この特徴は、
明らかに意味のある解釈をもっているが、ここでは、意
味論上のものとみなすべきではなく、他の特徴と同じく
、単語リストのメンバに付加できる特徴である。これは
、それが付加される単語が、ある状況で構文上ある挙動
を示す確率が高いことを示す。したがって、辞典にこの
特徴が記載されていることは、意味情報なしで構文解析
構成要素が働くという先の主張と矛盾するものではない
上記の情報に基づいて、この手順は、遠隔依存関係を解
決する(ステップ9)。次の文で、Who did J
ohn want to kiss?FRNTNP (
who ” )が、動詞″kiss ”のDOBJEC
Tとして指定される。これは動詞の動作の影響を直接受
ける。次の文では、 Who did John want to writ
e?FRNTNP (”who″)が、動詞″writ
e″のDINDOBJとして指定される。これは、動詞
の動作を介しであるものを受は取る。次の文では、Wh
at did John want to write
?FRNTNP (what ” )が、動詞″wri
te”のDOB J ECTとしてt舌足される。
受動構文に出会うと(第2C図)、ポストプロセッサは
、受動国中に懸垂前置詞があるかどうか再度11べる(
ステップ10)。たとえば、The house wa
s broken 1nto。
上記の文の1nto″のような懸垂前置詞が存在する場
合、構文上の主語(この場合は”the house 
” )が懸垂前置詞の目的語として指定される(”br
okeninto the house″)。次に、手
順は先に飛んで、可能性のある”by″前置詞句を見つ
け(ステップ13)、意味上の主語を識別する。
受動構文の意味上の引き数を正しく適切に識別するため
に、懸垂前置詞がない場合、複雑な1絹の情報を照会す
る。第1に、主動詞の下位範曙クラスが重要である。作
為動詞か、授与動詞か、それともそのどちらでもないか
(上記参照)。第2に、どれだけの引き数がすでに筒中
にあるか。第3に、節の構文上の主語にどんな特徴があ
るか。
ここで特に重要な特徴ANIMは、人間ではない、生物
を指す名詞に付加される点以外は、すべての点でHUM
と同様である。この特徴も明らかに意味のある解釈をも
っているが、ここでは意味論上のものとみなさない。
次に、手順は、上記の情報に基づいてDSUBJECT
以外の意味引き数を指定する(ステップ12)。次の受
身文では、 The man was elected Presi
dent。
”the man ”がD OB J E CT、、 
”President″がDOB J COMPである
。次の文では、lie was given a ma
ndate。
”he“がDINDOBJ (あるものを受は取る人)
で、”a mandate ’がDOBJECT(受は
取られるもの)である。次の文では、 You were 1nvited。
you″がDOBJECTである。DOBJCOMPま
たはD INDOBJはない。
手順は、次に受動構文のDSUBJECTを指定する。
′by″前置詞句が存在するかどうか検索して調べる(
ステップ13)。ない場合は、DSUBJECTが”x
x″の値に指定される。”xx”は、後で必要な情報が
処理されたとき、解決できる。″by=l前置詞句が存
在する場合、DSUBJECTは、その前置詞句の目的
語を指すように指定すれる(ステップ14)。たとえば
、次の文で、You were 1nvitecl b
y the President。
” the President″がDSUBJECT
である。
この文は能動文”The President 1nv
ited you。
と等価な受動文である。どちらの文でも、DSUBJE
CTが”the President″ DOBJEC
Tがyou″である。このように、能動文と受動文の表
面上の構文形式は全く異なっているが、基礎となる引き
数構造は、それらが意味上類似していることを指摘して
いる。
次の部分手順(第2D図)は、間接目的構文を処理する
ものである。この手順の目的は、′vegave hi
+n a mandate、 ”と”1ife gav
e a mandateto him、 ”のような文
の意味上の類似性を指摘することである。この点で、間
接目的手順は、受動手順と同じ目的をもつが、ずっと単
純である。第1段階で、”to″前置詞句の目的語を見
つける。
次の段階で、この目的語をDINDOBJ属性の値に指
定する。この段階が完了すると、どちらの文もDSUB
JECT″we″、DINDOBJ”him’s及びD
OBJECT″a mandate″をもつ。
コレで、ポストプロ・セッサの中心部分の第1ステツプ
(2,1)が終了して、意味上の属性にその値が指定さ
れ、入力文字列に対する引き数構造が構築される。第2
ステツプ(2,2)では、意味上の付加部、すなわち引
き数ではないが、最終的な意味構造にとって重要な修飾
部を指定する。
この第2ステツプの第1相では、述部形容詞をその主語
名詞句と連係させる(第2E図)。述部形容詞構文の例
は次の文である。
Mary and John are、 and al
ways will be。
happy 。
形容詞″happy”は主語名詞句″Mary and
 John ”のII Ma、ynと’ John ”
にかかるが、NPからずっと離れている。句が”hap
py John and happy Mary ”で
ある場合は、問題はない。しかし、上記の文は形容詞が
主語から離れているので、構文解析によって、直接圧し
い接続はできない。この点で、述部形容詞をそのNPと
連係させる問題は、遠隔依存関係の問題と同じである。
その問題を解決する第1ステツプは、主語名詞句のリス
トを構成することである(ステップ15)。主MNPが
1つしかない場合、リストは、1つのメンバを含むリス
トである。リストの各メンバ上で、PADJI性を作成
する(ステップ16)。その値は述部形容詞を指すポイ
ンタである。
次に、主語NPのリストの次のメンバを処理する。
リストが空になると、手順は終了する。
すべての引き数が識別されると、ポストプロセッサは主
な句範11VP、NP (PPを含む)、AJP、AV
Pを考慮して、すべての非引き数修飾部にその固有の意
味属性が指定されていることを確認する(これらの非引
き数修飾部も「付加部」と呼ばれる)。
考慮すべき第1の範嗜は、動詞句である(第2F図)。
動詞句自体が等位接続のVPを含む場合、それは等位接
続vPを分類する手順に送られる(ステップ17)。分
類された要素は主手順に戻される。VPが等位接続セグ
メントではない場合、前W修飾部と後置修飾部を含むす
べての修飾部のリストが構成される(ステップ18)。
そのリストの各メンバについて、 a、それがNPである場合は、NP修飾部を処理する手
順に送られる(ステップ19)。
b、それがPPである場合は、 (1)PP中の前置詞と同じ名前をもつ属性がVP上に
作成される(ステップ20)。
(2)PPの目的語がこの属性の値として指定される(
ステップ20)。
(3)セグメントがNP修飾部を処理する手順に送られ
る(第2G図参照)。
C3それが形容詞句または副詞句である場合、MODS
属性がVP上に作成され、その値はAJPまたはAVP
を指すポインタである(ステップ21)。
d、それが埋め込まれた節(たとえば、従属節)である
場合、PROPrR性がVP上に作成され、その値は埋
込みクラスを指すポインタである(ステップ22)。
次に、修飾部のリストの次のメンバを処理する(ステッ
プ23)。リストが空になると、手順は終了する。
考慮すべき次の範曙は、名詞句(第2G図)である。名
詞句自体が等位接続NPを含む場合は、等位接続NPを
分離する手順に送られる(ステップ24)。分離された
要素は主手順に戻される。
NPが等位接続セグメントでない場合、前置修飾部と後
置修飾部を含むすべての修飾部のリストが構成される(
ステップ25)。そのリストの各メンバについて、 a、それが限定辞または限量辞(the、 al th
is+some+ allなどの単語)である場合、O
PS (操作子)属性がNP上に作成され、その値は限
定辞または限量辞を指すポインタである(ステップ26
)。
b、それが限定辞または限量辞以外の形容詞句である場
合、NADJg性がNP上に作成され、その値は形容詞
句を指すポインタである(ステップ27)。
c、NPが動名詞(”−ing″で終わる名詞)の場合
、 (1)問題の句が所有形容詞である場合は、DSUBJ
ECT属性がNP上に作成され、その値は所有形容詞を
指すポインタである(ステップ28)。
(2)動名詞NP中に所有形容詞がない場合は、DSU
BJECT属性がNP上に作成され、その値はXX″で
ある(ステップ29)。この値は、より多くの情報が利
用できるとき変更できる。
d1問題の句が埋込み節(たとえば、関係節)である場
合、PROP属性がVP上に作成され、その値は埋込み
節を指すポインタである(ステップ30)。
e、それがPPである場合、 (1)PP中の前置詞と同じ名前をもつ属性がNP上に
作成される(ステップ31)。
(2)PPの目的語がこの属性の値として指定される(
ステップ31)。
(3)そのセグメントがNP修飾部を処理する(すなわ
ち、現在説明している第2G図の手順)手順に戻される
f2問題の句が上記以外のものである場合、M○DS属
性がNP上に作成され、その値はこの他の句を指すポイ
ンタである(ステップ32)。
次に、修飾部のリストの次のメンバが処理される(ステ
ップ33)。リストが空になると、手順が終了する。
形容詞向及び副詞句の意味上の修飾部を識別する(第2
H図と第2I図)手順の各ステップは同一である。まず
、すべての修飾部のリストを構成する(ステップ34)
。そのリストの各メンバについて、 a、それがPPである場合、 (1)PPの前置詞と同じ名前をもつ属性がAJPまた
はAVP上に作成される(ステップ35)。
(2)PPの目的語がこの属性の値として指定される(
ステップ35)。
(3)そのセグメントがNP修飾部を処理する手順に送
られる(第2G図参照)。
b、そうでない場合は、MODS属性がAJPまたはA
VP上に作成され、その値は考慮中のリスト・メンバを
t旨すポインタである(ステップ36)。
次に、修飾部のリストの次のメンバが処理される(ステ
ップ37)。リストが空になると、手順が終了する。
第2J図は、等位接続動詞句を分離する処理を示す。こ
の手順は、VP修飾部を処理する処理手順から呼び出さ
れる(第2F図参照)。まず、より大きな等位接続VP
内にあるすべてのVPPからリストが構成される(ステ
ップ38)。次に、VPのリストの各メンバについて、 a1等位接続VPが共通の構文上の主語をもつ場合、そ
の主語がリストの各メンバVPに分配される(ステップ
39)。その1例は以下の通りである。
John came in and sat down
上記の文で、” JOhn ”は、等位接続VP″ca
mein″と5Bt down″の両方の構文上の主語
である。
60節が受動態の場合(たとえば、・John was
hugged and kissed、 ” ) 、各
メンバVP中ノPASSIVE属性がオンにセットされ
る(ステップ40)。
C1最終的vP中に構文上の直接目的語がある場合、そ
の目的語がリストの各他動詞メンバVPに分配される(
ステップ41)。その1例は次の通りである。
John wrote and signed the
 document。
上記の文で1″the document″は、等位接
続VP” wrote ”と”signed”の両方の
構文上の目的である。
d、その節に遠隔依存関係が存在する場合、前置要素が
リストの各メンバVPに分配される。(ステップ42)
。その1例は次の通りである。
What did Peter say that J
ohn wrote andS igned? 上記の文で、前置疑問詞” what ”がV P ”
 wrote ”と、VP″signed″に分配され
る。依存関係は、後で第2B図に示す手順によって解決
される。
e、上記のすべての分配が行なわれた後、VPリストの
個々の各メンバが引き数を識別するため主手順に送られ
る(ステップ43)。次いで、VPのリストの次のメン
バが処理される(ステップ44)。リストが空になると
、手順は終了する。
第2に図は、等位接続名詞句を分類する処理を示す。こ
の手順は、NP修飾部を処理する処理手順から呼び出さ
れる(第2G図参照)。まず、より大きな等位接続NP
内にあるすべてのNFLからリストが構成される(ステ
ップ45)。次に、NPのリストの各メンバについて、 a、MODsff性が親NP上に作成され、その値はリ
ストのNPメンバを指すポインタである(ステップ46
)。この結果、すべての等位接続NPがそれらの1fA
NPのもとてMODSとしてリストされることになる。
b、NPリストの個々の各メンバがそのように措置され
た後、引き数を識別するため主手順に送られる(ステッ
プ47)。次に、NPのリストの次のメンバが処理され
る(ステップ48)。リストが空になると、手順が終了
する。
第3図は、遠隔依存関係をもつ文°“A11ce。
Peter 5aid that John kiss
ed、 ”の処理の際に行なわれる2つの構造段階を示
す。第1は、解析木49として省略形で示した構文構造
である。この解析木は、PEGがこの入力文字列を処理
した後にレコード構造中に実際存在する少数の属性と値
のみを使って作成される。この解析木では、” AI 
ice″が動詞″kissed″から離されており、こ
の2つの単語の間に何らかの意味のある関係の指示はな
い。
第2は、基本意味構造、引き数構造50であり、一種の
図として省略形で示されている。この図は、本発明で開
示された意味属性と引き数のみを使用し、それらの引き
数がその動詞によって正しくグループ分けされるように
インデントすることによって作成される。この引き数構
造では、” AI ice“は動詞″kissed”の
DOBJECTとして正しく連係されている。
出力されるレコード構造は、ある自然言語を別の言語に
より正確に翻訳するために機械翻訳装置で使用される。
この出力は、高度のテキスト校訂、改良された情報検索
、電子メールの経路設定及びファイル編成、及び基本意
味解析を必要とするその他のNLP応用例にも適用でき
る。
本発明は、前記の米国特許4731735号明細書に開
示されているようなデータ処理システムで走行するコン
ピュータ・プログラムとして具体化される。本発明を具
体化したプログラムは、システムのメモリに記憶され、
実行装置によって実行される。自然言語の単語の文字列
は、キーボード、大容量記憶装置、接続端末、または通
信リンクから実行装置に入力できる。本発明の構文解析
段階と意味解析段階は、データ処理システム中の本発明
のプログラム実施例によって実行される。
本発明のプログラム実施例によって出力された意味属性
レコード構造は、入力文字列の意味上の特徴づけとして
、表示装置、プリンタ、大容量記憶装置、通信リンク、
またはメモリの別の区画に出力することができる。表示
画面上でユーザに直接表示でき、同じデータ処理システ
ムまたは他のデータ処理システム上で走行する利用処理
またはプログラムに入力できる。
本発明の特定の実施例を開示したが、当業者なら容易に
理解できるように、本発明の精神と範囲から逸脱するこ
となくこの具体的実施例に変更を加えることができる。
【図面の簡単な説明】
第1A図及び第1B図は、現在の言語学理論による見え
ない引き数の決定するための従来の方法を示す図である
。 第2図は、引き数構造を決定するための方法の流れ図を
示す第2A図ないし第2に図の関係を示す図である。 第2A図は、流れ図の不定詞補語及び分詞補語を処理す
る部分を示す図である。 第2B図は、流れ図の遠隔引き数を処理する部分を示す
図である。 第2C図は、流れ図の受動構文を処理する部分を示す図
である。 第2D図は、流れ図の前置詞″to”をもつ前置詞句中
に間接目的語がある間接目的構文を処理する部分を示す
図である。 第2E図は、流れ図の述部形容詞を主部名詞句と連係す
る部分を示す図である。 第2F図は、流れ図の動詞句修飾部を処理する部分を示
す図である。 第2G図は、流れ図の名詞句修飾部を処理する部分を示
す図である。 第2H図は、流れ図の形容詞句修飾部を処理する部分を
示す図である。 第21図は、流れ図の動詞句の修飾部を処理する部分を
示す図である。 第2J図は、流れ図の等位接続動詞句を処理する部分を
示す図である。 第2に図は、流れ図の等位接続名詞句を処理する部分を
示す図である。 第3図は、遠隔依存関係の適切な解決法を示す例として
、文”Al1ce、 Peter 5aid that
 Johnkissed、 ”の完成した基本意味構造
(引き数構造) の解析木と表示を示す図である。

Claims (12)

    【特許請求の範囲】
  1. (1)自然言語による言語表現を形成する複数の単語か
    ら成る文字列を入力するステップと、 入力文字列の構文構造を誘導する1組の構文規則によっ
    て入力文字列を解析し、前記単語の構文引き数を識別す
    るステップと、 意味引き数が前記構文引き数と正確に対応するとき、前
    記文字列中の第1の単語グループを意味引き数として識
    別するステップとを有し、さらに、前記第1グループに
    はない、前記文字列中の第2の単語グループの意味引き
    数を識別するために、不定詞節及び分詞節の滅失してい
    る引き数を指定するサブステップと、 遠隔引き数を指定するサブステップと、 受動構文の滅失しているまたは離れた引き数を指定する
    サブステップと、 間接目的構文の引き数を指定するサブステップと、 前記入力単語文字列の正規化意味構造を実現する前記指
    定引き数を出力するステップとを有することを特徴とす
    る自然言語の単語文字列の基本意味構造を決定する自然
    言語処理方法。
  2. (2)間接目的構文の引き数を指定するステップの後で
    、 述部形容詞をその主語名詞句と連係するステップ、 動詞句修飾部をその動詞と連係するステップ、名詞句修
    飾部をその名詞と連係するステップ、形容詞句修飾部を
    その形容詞と連係するステップ、及び 副詞句修飾部をその副詞と連係するステップを含み、 修飾部が意味論的に前記入力単語文字列に連係される、 請求項1に記載の自然言語処理方法。
  3. (3)前記指定ステップで、前記解析ステップで累積さ
    れた構文情報のすべてを含む前記構文構造を走査する手
    順によって基本意味構造が作成される、請求項1に記載
    の自然言語処理方法。
  4. (4)前記正規化意味構造が、意味論的に重要な新しい
    属性と値とを前記構文構造に追加することによって実現
    される、 請求項3に記載の自然言語処理方法。
  5. (5)自然言語による言語表現を形成する複数の単語か
    らなる文字列を入力するステップと、 入力文字列の構文構造を誘導する1組の構文規則によっ
    て入力文字列を解析し、前記単語の構文引き数を識別す
    るステップとを有し、さらに、前記入力文字列の意味引
    き数を識別するために、不定詞節と分詞節の滅失してい
    る引き数を指定するサブステップと、 遠隔引き数を指定するサブステップと、 受動構文の滅失しているまたは離れた引き数を指定する
    サブステップと、 間接目的構文の引き数を指定するサブステップと、 前記入力単語文字列の正規化意味構造を実現する前記指
    定引き数を出力するステップとを有することを特徴とす
    る自然言語の単語文字列の基本意味構造を決定するため
    の自然言語処理方法。
  6. (6)間接目的構文の引き数を指定する前記ステップの
    後で、 述部形容詞をその主語名詞句と連係するステップ、 動詞句修飾部をその動詞と連係するステップ、名詞句修
    飾部をその名詞と連係するステップ、形容詞句修飾部を
    その形容詞と連係するステップ、及び 副詞句修飾部をその副詞と連係するステッ プを含み、 修飾部が意味論的に前記入力単語文字列に連係される、 請求項5に記載の自然言語処理方法。
  7. (7)前記指定ステップで、前記解析ステップで累積さ
    れた構文情報のすべてを含む前記構文構造を走査する手
    順によって基本意味構造が作成される、請求項5に記載
    の自然言語処理方法。
  8. (8)前記正規化意味構造が、意味論的に重要な新しい
    属性と値を前記構文構造に追加することによって達成で
    きるという、 請求項7に記載の自然言語処理方法。
  9. (9)自然言語の言語表現を形成する複数の単語から構
    成される文字列を入力するステップと、入力文字列の構
    文構造を誘導する、意味情報から自由な1組の構文規則
    によって入力文字列を解析し、前記単語の構文引き数を
    識別するステップとを有し、さらに、 前記文字列の意味引き数を識別するために、不定詞節と
    分詞節の滅失している引き数を指定するサブステップと
    、 遠隔引き数を指定するサブステップと、 受動構文の滅失しているまたは離れた引き数を指定する
    サブステップと、 間接目的構文の引き数を指定するサブステップと、 前記入力単語文字列の正規化意味構造を提供するレコー
    ド中に前記指定引き数を出力するステップとを有するこ
    とを特徴とする自然言語の単語文字列の基本意味構造を
    決定する自然言語処理方法。
  10. (10)間接目的構文の引き数を指定する前記ステップ
    の後で、 述部形容詞をその主語名詞句と連係するステップ、 動詞句修飾部をその動詞と連係するステップ、名詞句修
    飾部をその名詞と連係するステップ、形容詞句修飾部を
    その形容詞と連係するステップ、及び 副詞句修飾部をその副詞と連係するステップを含み、 修飾部が意味論的に前記入力単語文字列に連係される、 請求項9に記載の自然言語処理方法。
  11. (11)前記指定ステップで、前記解析ステップで累積
    された構文情報のすべてを含む前記構文構造を走査する
    手順によって基本意味構造が作成される、請求項9に記
    載の自然言語処理方法。
  12. (12)前記正規化意味構造が、意味論的に重要な新し
    い属性と値を前記構文構造に追加することによって達成
    される、 請求項11に記載の自然言語処理方法。
JP2205324A 1989-08-16 1990-08-03 自然言語処理方法 Pending JPH0383167A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/395,118 US5146406A (en) 1989-08-16 1989-08-16 Computer method for identifying predicate-argument structures in natural language text
US395118 1989-08-16

Publications (1)

Publication Number Publication Date
JPH0383167A true JPH0383167A (ja) 1991-04-09

Family

ID=23561769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2205324A Pending JPH0383167A (ja) 1989-08-16 1990-08-03 自然言語処理方法

Country Status (3)

Country Link
US (1) US5146406A (ja)
EP (1) EP0413132A3 (ja)
JP (1) JPH0383167A (ja)

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5255386A (en) * 1990-02-08 1993-10-19 International Business Machines Corporation Method and apparatus for intelligent help that matches the semantic similarity of the inferred intent of query or command to a best-fit predefined command intent
US5418716A (en) * 1990-07-26 1995-05-23 Nec Corporation System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases
JP2764343B2 (ja) * 1990-09-07 1998-06-11 富士通株式会社 節/句境界抽出方式
US5371807A (en) * 1992-03-20 1994-12-06 Digital Equipment Corporation Method and apparatus for text classification
US6278967B1 (en) * 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
JPH0728815A (ja) * 1993-02-18 1995-01-31 Matsushita Electric Ind Co Ltd 構文解析装置
US6397263B1 (en) 1993-11-03 2002-05-28 International Business Machines Corporation String command parser for message based systems
IL109268A (en) * 1994-04-10 1999-01-26 Advanced Recognition Tech Method and system for image recognition
KR100209816B1 (ko) * 1994-05-23 1999-07-15 세모스 로버트 어니스트 빅커스 텍스트로부터 음성을 합성하는 장치
US5752052A (en) * 1994-06-24 1998-05-12 Microsoft Corporation Method and system for bootstrapping statistical processing into a rule-based natural language parser
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US6684188B1 (en) * 1996-02-02 2004-01-27 Geoffrey C Mitchell Method for production of medical records and other technical documents
US5995922A (en) 1996-05-02 1999-11-30 Microsoft Corporation Identifying information related to an input word in an electronic dictionary
US5778157A (en) * 1996-06-17 1998-07-07 Yy Software Corporation System and method for expert system analysis using quiescent and parallel reasoning and set structured knowledge representation
US5999896A (en) * 1996-06-25 1999-12-07 Microsoft Corporation Method and system for identifying and resolving commonly confused words in a natural language parser
US5966686A (en) * 1996-06-28 1999-10-12 Microsoft Corporation Method and system for computing semantic logical forms from syntax trees
AU723274B2 (en) * 1996-08-29 2000-08-24 Bcl Computers, Inc. Natural-language speech control
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
EP1078323A4 (en) * 1997-04-22 2007-04-25 Greg Hetherington METHOD AND APPARATUS FOR PROCESSING UNSTRUCTURED DATA
US6470362B1 (en) * 1997-05-16 2002-10-22 Compaq Computer Corporation Extracting ordered list of words from documents comprising text and code fragments, without interpreting the code fragments
US5926784A (en) * 1997-07-17 1999-07-20 Microsoft Corporation Method and system for natural language parsing using podding
US5960384A (en) * 1997-09-03 1999-09-28 Brash; Douglas E. Method and device for parsing natural language sentences and other sequential symbolic expressions
US6009436A (en) * 1997-12-23 1999-12-28 Ricoh Company, Ltd. Method and apparatus for mapping structured information to different structured information
AU5581599A (en) * 1998-08-24 2000-03-14 Virtual Research Associates, Inc. Natural language sentence parser
US6519562B1 (en) * 1999-02-25 2003-02-11 Speechworks International, Inc. Dynamic semantic control of a speech recognition system
US6289513B1 (en) * 1999-06-01 2001-09-11 Isaac Bentwich Interactive application generation and text processing
US7509572B1 (en) * 1999-07-16 2009-03-24 Oracle International Corporation Automatic generation of document summaries through use of structured text
JP2001075957A (ja) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> 自然言語構造の表示方法及び装置
US6892191B1 (en) * 2000-02-07 2005-05-10 Koninklijke Philips Electronics N.V. Multi-feature combination generation and classification effectiveness evaluation using genetic algorithms
KR20000036344A (ko) * 2000-02-12 2000-07-05 장득걸 인터넷주소(도메인명)에 한글(모국어)을 사용하는 방법
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US7962326B2 (en) * 2000-04-20 2011-06-14 Invention Machine Corporation Semantic answering system and method
US6745181B1 (en) * 2000-05-02 2004-06-01 Iphrase.Com, Inc. Information access method
US6711561B1 (en) * 2000-05-02 2004-03-23 Iphrase.Com, Inc. Prose feedback in information access system
US7127450B1 (en) 2000-05-02 2006-10-24 International Business Machines Corporation Intelligent discard in information access system
US8478732B1 (en) 2000-05-02 2013-07-02 International Business Machines Corporation Database aliasing in information access system
US6704728B1 (en) 2000-05-02 2004-03-09 Iphase.Com, Inc. Accessing information from a collection of data
US6675159B1 (en) 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US20020194223A1 (en) * 2000-10-16 2002-12-19 Text Analysis International, Inc. Computer programming language, system and method for building text analyzers
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US6766316B2 (en) 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7711547B2 (en) * 2001-03-16 2010-05-04 Meaningful Machines, L.L.C. Word association method and apparatus
US20030093261A1 (en) * 2001-03-16 2003-05-15 Eli Abir Multilingual database creation system and method
US7860706B2 (en) 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7483828B2 (en) 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
US7136846B2 (en) 2001-04-06 2006-11-14 2005 Keel Company, Inc. Wireless information retrieval
US7113905B2 (en) * 2001-12-20 2006-09-26 Microsoft Corporation Method and apparatus for determining unbounded dependencies during syntactic parsing
US7343372B2 (en) * 2002-02-22 2008-03-11 International Business Machines Corporation Direct navigation for information retrieval
US7361881B2 (en) * 2002-03-13 2008-04-22 Oy Ajat Ltd Ganged detector pixel, photon/pulse counting radiation imaging device
US7526424B2 (en) 2002-03-20 2009-04-28 Microsoft Corporation Sentence realization model for a natural language generation system
EP1493118A1 (en) 2002-04-10 2005-01-05 Accenture Global Services GmbH Determination of attributes based on product descriptions
US7634398B2 (en) * 2002-05-16 2009-12-15 Microsoft Corporation Method and apparatus for reattaching nodes in a parse structure
JP4038717B2 (ja) * 2002-09-13 2008-01-30 富士ゼロックス株式会社 テキスト文比較装置
WO2004049192A2 (en) * 2002-11-28 2004-06-10 Koninklijke Philips Electronics N.V. Method to assign word class information
AU2003297732A1 (en) * 2002-12-06 2004-06-30 Attensity Corporation Systems and methods for providing a mixed data integration service
US7346493B2 (en) * 2003-03-25 2008-03-18 Microsoft Corporation Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system
US7505896B2 (en) * 2003-04-29 2009-03-17 Microsoft Corporation Method and apparatus for reattaching nodes in a parse structure
US8495002B2 (en) 2003-05-06 2013-07-23 International Business Machines Corporation Software tool for training and testing a knowledge base
US7742911B2 (en) 2004-10-12 2010-06-22 At&T Intellectual Property Ii, L.P. Apparatus and method for spoken language understanding by using semantic role labeling
US7689411B2 (en) * 2005-07-01 2010-03-30 Xerox Corporation Concept matching
US7809551B2 (en) * 2005-07-01 2010-10-05 Xerox Corporation Concept matching system
US7996440B2 (en) * 2006-06-05 2011-08-09 Accenture Global Services Limited Extraction of attributes and values from natural language documents
US7970767B2 (en) * 2006-06-05 2011-06-28 Accenture Global Services Limited Extraction of attributes and values from natural language documents
US8027941B2 (en) 2007-09-14 2011-09-27 Accenture Global Services Limited Automated classification algorithm comprising at least one input-invariant part
US20110119577A1 (en) * 2008-03-07 2011-05-19 Lionel Audant Method and apparatus for associating a plurality of processing functions with a text
US8738360B2 (en) 2008-06-06 2014-05-27 Apple Inc. Data detection of a character sequence having multiple possible data types
US8311806B2 (en) 2008-06-06 2012-11-13 Apple Inc. Data detection in a sequence of tokens using decision tree reductions
US8489388B2 (en) 2008-11-10 2013-07-16 Apple Inc. Data detection
US20100228538A1 (en) * 2009-03-03 2010-09-09 Yamada John A Computational linguistic systems and methods
US20110239146A1 (en) * 2010-03-23 2011-09-29 Lala Dutta Automatic event generation
US8620836B2 (en) 2011-01-10 2013-12-31 Accenture Global Services Limited Preprocessing of text
US8504492B2 (en) 2011-01-10 2013-08-06 Accenture Global Services Limited Identification of attributes and values using multiple classifiers
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9858343B2 (en) 2011-03-31 2018-01-02 Microsoft Technology Licensing Llc Personalization of queries, conversations, and searches
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9454962B2 (en) * 2011-05-12 2016-09-27 Microsoft Technology Licensing, Llc Sentence simplification for spoken language understanding
DE102013003055A1 (de) 2013-02-18 2014-08-21 Nadine Sina Kurz Verfahren und Vorrichtung zum Durchführen von Suchen in natürlicher Sprache
US20140249801A1 (en) 2013-03-01 2014-09-04 The Software Shop, Inc. Systems and methods for improving the efficiency of syntactic and semantic analysis in automated processes for natural language understanding
US10629188B2 (en) 2013-03-15 2020-04-21 International Business Machines Corporation Automatic note taking within a virtual meeting
US10019437B2 (en) * 2015-02-23 2018-07-10 International Business Machines Corporation Facilitating information extraction via semantic abstraction
US10671808B2 (en) * 2017-11-06 2020-06-02 International Business Machines Corporation Pronoun mapping for sub-context rendering
US11017172B2 (en) 2018-08-01 2021-05-25 Signals Analytics Ltd. Proposition identification in natural language and usage thereof for search and retrieval
CN110807096A (zh) * 2018-08-02 2020-02-18 鼎复数据科技(北京)有限公司 一种小样本集上的信息对匹配方法及系统
CN109460547B (zh) * 2018-09-19 2023-03-28 中国电子科技集团公司第二十八研究所 一种基于自然语言处理的结构化管制指令提取方法
CN111368540B (zh) * 2020-03-05 2023-07-14 国网安徽省电力有限公司 一种基于语义角色分析的关键词信息抽取方法
US20220269858A1 (en) * 2021-02-19 2022-08-25 International Business Machines Corporation Learning Rules and Dictionaries with Neuro-Symbolic Artificial Intelligence

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5937887Y2 (ja) * 1978-10-31 1984-10-20 シャープ株式会社 単語記憶装置
JPS5598797A (en) * 1979-01-20 1980-07-28 Sharp Kk Electronic translator
US4420817A (en) * 1979-05-25 1983-12-13 Sharp Kabushiki Kaisha Word endings inflection means for use with electronic translation device
JPS5853787B2 (ja) * 1979-08-30 1983-12-01 シャープ株式会社 電子辞典
JPS59868B2 (ja) * 1979-10-24 1984-01-09 シャープ株式会社 単語の基本形認識装置およびこれを用いた翻訳装置
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
US4635199A (en) * 1983-04-28 1987-01-06 Nec Corporation Pivot-type machine translating system comprising a pragmatic table for checking semantic structures, a pivot representation, and a result of translation
JPS6140672A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd 多品詞解消処理方式
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JPS62163173A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳方法
JP2732563B2 (ja) * 1986-05-20 1998-03-30 株式会社東芝 機械翻訳方法及び装置
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4862408A (en) * 1987-03-20 1989-08-29 International Business Machines Corporation Paradigm-based morphological text analysis for natural languages
JPS6466777A (en) * 1987-09-08 1989-03-13 Sharp Kk Mechanical translation device

Also Published As

Publication number Publication date
EP0413132A2 (en) 1991-02-20
EP0413132A3 (en) 1993-03-31
US5146406A (en) 1992-09-08

Similar Documents

Publication Publication Date Title
JPH0383167A (ja) 自然言語処理方法
Ades et al. On the order of words
US9390087B1 (en) System and method for response generation using linguistic information
US5960384A (en) Method and device for parsing natural language sentences and other sequential symbolic expressions
JP2855409B2 (ja) 自然言語処理方法及びシステム
US20060200338A1 (en) Method and system for creating a lexicon
Civit et al. Building cast3lb: A spanish treebank
Hammouda et al. Parsing Arabic nominal sentences with transducers to annotate corpora
Pretkalniņa et al. Universal Dependency treebank for Latvian: A pilot
Ehsan et al. Statistical Parser for Urdu
Kuboň Problems of robust parsing of Czech
KR950013128B1 (ko) 기계번역장치 및 방법
Rajendran Parsing in tamil: Present state of art
KR950013129B1 (ko) 기계번역장치 및 방법
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Darling et al. Towards coreference resolution for Early Irish
Wintner et al. Syntactic analysis of Hebrew sentences
Muischnek et al. Parsing and beyond: Tools and resources for Estonian
Chaminade et al. Preliminary Experiments concerning Verbal Predicative Structure Extraction from a Large Finnish Corpus
KR100413966B1 (ko) 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법
Barker Noun modifier relationship analysis in the TANKA system
Mirdjanovna et al. Algorithm of Word Order and Syntactic Analysis in Uzbek Language Sentences
Alansary et al. IAN: An Automatic tool for Natural Language Analysis
Fernández Lemmatising Old English on a relational database
Sunnehall Robust parsing using dependency with constraints and preference