JPS62267873A - 言語解析装置 - Google Patents

言語解析装置

Info

Publication number
JPS62267873A
JPS62267873A JP61110872A JP11087286A JPS62267873A JP S62267873 A JPS62267873 A JP S62267873A JP 61110872 A JP61110872 A JP 61110872A JP 11087286 A JP11087286 A JP 11087286A JP S62267873 A JPS62267873 A JP S62267873A
Authority
JP
Japan
Prior art keywords
analysis
sentence
english
language
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61110872A
Other languages
English (en)
Inventor
Toshihiko Yokogawa
横川 壽彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61110872A priority Critical patent/JPS62267873A/ja
Publication of JPS62267873A publication Critical patent/JPS62267873A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は言語解析装置、とくに自動翻訳装置に有用な+
!’ +i+’!解析装置に関する。
従来技術 たとえば英語などの外国語の文からそれに対応する日本
語の文を作成する場合、入力された英文の形態素を解析
し、その構文を解析し、その文構造を変換し、そののち
[1本語の訳文を生成する。
cfg文法(context−free gramma
r:文脈自由文法)において、bottom−up解析
手法においてもtop−down解析手法においても文
において部分的に文法に適合する解析解も出力される。
そこで、最終的に使用できない無駄な解も多数出力され
るのが欠点である。このような無駄な解は、人間がこれ
を読んだときに明らかに誤りであるとわかるものも多い
このような表面的に誤りとわかる解を多く含む解析結果
が構文解析で多数得られると、その後の1程である構造
変換や訳文生成の効率が低下することになる6つまり、
無駄な解についても構造変換を行ない、あるいは訳文生
成を実行し、それらの結果のi! !、IJ性をそれぞ
れの処理過程で判断することになり、処理時間を浪費す
る結果を招く。
たとえば英文における前置詞句や副114句は、その係
り先すなわち修飾光が文脈)二から自由に選択できるの
かよい、そこで、それらの被修M Ii/を句が確定し
ないものは、IIf能な係り先をすべて解の可能性とし
てもつ方式が考えられる。また、辞書記述を優先的に考
慮する方式もある。後者の場合は、辞−iを索引して特
定の中詰に特定の前置詞をとる旨の記述があると、必ず
その共起関係を採用するものである。これは、その文の
本来の意図が無視される危険性がある。たとえば、英文
”I sawa man in the park w
ith a telescope、”の例では、辞=1
7の中詰”saw”に前l詞″with”をとる旨の記
述があると、iii置詞句″with a teles
cope’は必ず動調“saw”を係り先としてとるこ
とになり、他の可ス七性が無視されてしまう。
しかし、構文解析においてそのような可濠な係り先の候
補をすべて解としてしまうと、候補の数が多くなり、そ
の後の構造変換や訳文生成の処理で生ずる解は莫大な数
となってしまう。このように解の候補の数が多いことは
、それ以降の処理の速度を著しく低下させる結果を招く
そこで、自動翻訳プロセス全体の効率を向上させるには
、このような無駄な解の数を減らして解析の効率を高く
するとともに、解析結果をより確からしいものにするこ
とが要求される。
[1的 本発明はこのような要求に鑑み、構文解析を効率的に行
なうことのできる言語解析装置を提供することをl]的
とする。
構成 本発明はtZ記の1」的を達成させるため、入力された
所定の言語の文について形態素解析を行なう第1の解析
手段と、第1の解析手段からの形yE素解析結果をもと
にその言語の文について構文解析を行なう第2の解析手
段と、第1および第2の解析・L段の解析に使用するそ
の言語の辞書データを格納した辞J) i一段と、辞書
1段を索引して第1および第2の解析L段に解析を行な
わせる制御手段とを有し、第1の解析手段は、辞書手段
を索引し、入力文の形181−の特徴を識別して構文上
のまとまりを判別し、第2の解析手段は、文法ルールを
適用してその文の表層構造を解析し、その文にまとまり
が含まれていれば、まとまりの内部においてその文に含
まれる構成要票の係り先を選択するγを語解析装置を特
徴としたものである。以下、未発11の一実施例に基づ
いて具体的に説明する。
第1図を参照すると、本発明による言語解析装置を英1
1自動翻訳装置に適用した実施例の全体構成が示されて
いる。なお本発明は、英語を日本語に翻訳する英ロロ動
翻訳装置のみならず、ある1つのr’+ +iAを他の
言語に翻訳する自動翻訳装置にも効果的に適用されるこ
とは、言うまでもない。
同実施例は入力部10を有し、rJ 、に語に翻訳すべ
き英文テキスト12がこれにより入力される。入力部l
Oはたとえば、英数字キーなどの文字キーや機f七キー
などを有するキーボード、紙に記録された英文テキスト
を読み取る光学的文字読取装青(OCR) 、および(
または)磁気ディスクなどの記憶媒体に記録された英文
テキストを読み込むファイル記憶装置などを含んでよい
入力部10により入力された英文テキストは、in1編
集部14に読み込まれ、翻訳の油処理が行なわれる。こ
こでは、主として文の認゛定と未知語の処理を行なう、
これは形態素解析の一部として機71する。
前編集された英文データは、前編集で得られた情報とと
もに形態素解析部18に転送される。形態素解析部1B
では、単語辞書18を索引して文に分割し、英文の形態
素を解析し、未知語の処理、固有名詞、時の表現、数の
表現などの各種のまとめあげを行ない、付加疑問、同格
の認定などの文全体の処理を行なう、その形態素解析ル
ールは解析ルールファイル36に格納きれている。
こうして形態素解析された英文データは、形態素解析で
得られた辞書情報とともに構文解析1部20に転送され
る。構文解析1部20は、本実施例ではcrg文法ルー
ルを英文データに適用して文についテbottom−u
p、 right−to−leftに表層構造の解析を
行ない、すべての構文的1’f fE性を見つけ出す機
能部である。
構文解析I部20で構文解析(バーズ)された英文デー
タは、その解析情報とともに構文解析11部22に送ら
れる。ここでは、構文解析Iによる表層的なバーズ結果
から、構造記述を適用して解を選択する。これによって
英語文の確からしい解析木を作成し、その構造を作る。
これらの構文解析ルールはやはり、解析ルールファイル
36に格納されている。
構文解析された英文データは、解析木のデータとして構
造変換i’1B24に転送される。構造変換部24では
、英語文の中間的構造である構文木から対応する[1本
語文の構文木を作成し、日本語文を訳出しやすい日本語
基底構造に変換する。
こうして構造変換された日本語の基底構造を示す構文木
データは訳文生成部28に送出され、後者にて訳文の生
成が行なわれる。これは、日本語の構文木の木構造から
日本語の文を生成する機俺である。まず、語順を日本語
のそれに一致させるため、順序の入換えを行なって木構
造を変更する構文生成を行ない1次に形態素生成を行な
って構文木においテtop−down、 left−t
o−rightに訳文を生成する。
訳文生成された日本語文データ、すなわち訳文データは
、後編集部30に送られる。後編集部30では、翻訳処
理に利用した情報を使用し、辞書18を索引して訳文デ
ータを修正し、より自然な日本語文を完成する。この日
本語文データは出力部32に転送され、翻訳された日本
語文34として出力部32から出力される。出力部32
は、たとえばプリンタ、ディスプレイ、および(または
)磁気ディスクなどのファイル記憶装置を含む。
これらの一連の翻訳処理の流れは1本装置全体の制御を
統括する制御部38によって制御される。
中詰辞、1″i18には、本実施例では英語および日本
語の単語についての辞書データが格納され、諸量だけで
なく、係り関係すなわち共起関係や、意味、単複、品詞
などの様々な情報が記述されている。
また解析ルールファイル36には、形態素解析および構
文解析のルールデータが格納されている。
制御部38には、操作表示部40が接続されている。操
作表示部40は、操作者から本装置に様々な指示をグー
える、たとえば翻訳指示キー、カーソルキーなどの操作
キーや、入力英語文テキスト、翻訳結果の11本語文、
辞書情報などの中間データ、操作者に対する様々な指示
などを可視表示するディスプレイやインジケータを有す
る。なお、それらの操作表示機能の多くは、入力部10
にキーボードを備えている場合はそのキーボードに、ま
た出力部32にディスプレイを備えている場合はそのデ
ィスプレイに含まれるように構成してよい。
、ところで構文解析IF!20では、形態素解析された
・英文データについて、英文にcfg文法ルールをbo
ttom−up、 right−to−leftに適用
してその文について’11駈性のあるすべての構文解を
導出する。この解は一般に構造木の形で理解される。こ
れは、1つの文ごとにそれに含まれる単語または句が修
飾関係および格関係などの従属ないしは共起関係によっ
て相互に関連づけられ、たとえば親、子。
孫といった相互の従属関係を示すものである。各I′I
i語または句は、構造木の箇点すなわちノードの位置を
占める。
本実施例では、構文解析に先立って、文の形j5」−お
よび諸費ヒの特徴を識別して構文上のまとまりを判別す
る。この構文上のまとまりをここでは「1ニツト」およ
び「ブロック、と称する。
「ユニット」は、翻訳プロセスの最小単位となる語の集
まりであり、バーズの際には、これを−語と同等に扱い
、それに含まれる各構成要素の辞書情報を使用しない。
また「ブロック」は、その内部での解析を外部における
解析より優先させて行ない、ブロー、り外に対してはそ
のブロックをユニットと同等に扱う構文的なまとまりで
ある。たとえば、yH1句などの他、 cfg文法で用
いる中間的なシンボルに相当するものでもよい、また、
入れ子になり得る。すなわちブロック内にさらにブロッ
クが含まれていてもよい、さらに、ブロックの概念に、
文、段落、文べt全体をも含め、これらをそれぞれ1つ
のブロックとみなしてもよい、この、部分的解析を優先
させる処理をここでは1部分バーズ」と称する。これに
よって、前述の無駄な構文解が減少し、解析の効率が向
−トしてより確からしい解析結果が得られる。
第1図に示す実施例において、入力英文の構文上のまと
まりをブロックとして認識する機f駐は、形態素解析F
iII16にて行なわれる。萌編集部14で市編集され
た英文データは形態素解析部16に入力され、同解析部
18では、小諸辞書18および解析ルールファイル3B
を使用して入力英文の構文」−のまとまりを識別する。
’11語辞書18には、英語の単語や熟語についての辞
書情報が格納されている0本実施例では6語の変化形ご
とにエントリが形成され、そのすべての情報が展開され
ている。たとえば品詞情報については、複数の品詞の情
報を持つことができる。
解析ルールファイル36には、ブロックの先頭を示す先
頭条件、および末尾を示す終了条件のデータがテーブル
として格納されている。その例を第2図に示す、たとえ
ば、「、接続詞」によって1つのブロックが開始し、こ
れは文末にて終了する。また「、関係詞」にて他のブロ
ックが開始し、これは、「、」または文末にて終了する
。後者のように、1つの先頭条件について複数の終了条
件の可r駐性を許容する。これらは、′m常の現代英語
文にて現われる句、簡ないしは文を形成する条件によっ
ている。なお同図において、記号「u」はスペースを示
す。
ところで形態素解析部16では、萌編集部14から入力
される英文をまず、翻訳単位である文に分割する。その
際、スペルの誤りや未登録語の検出を行なう0文中位に
辞書1Bを索引し、各構成要素の辞書情報をフェッチす
る。それらの辞書情報に従って各種のまとめあげ処理を
行なう。
形態素解析部1Bにて行なわれるブロックについてのま
とめあげ処理では、まず、1つの英語文の先頭から1w
1に’lj +if’lの取出し処理を実行する。中詰
取出し処理では、取出し位置を小義させながら1つずつ
rn語を取り出してその11語について辞書18を検索
し、その中詰情報を、呻き出す。
中詰取出し処理で11語情報が取り出されると。
ブロックの先頭、終了条件テーブル36を参照し、先頭
条件にマツチするものがあるか否かを判定する。先頭条
件にマツチするものが検出されるまで、これを繰り返す
、先頭条件にマツチすると、次のrn、 、i/iに続
いて必要な数だけ単語を崖1次取り出し、ブロックの先
頭条件との−・致を照合する。その際、必要ならば、そ
れぞれの語について辞−)を検索する。
こうしてブロックの先頭条件にマツチすると、その先頭
条件についてのブロック終了条件に合致する8:/Iを
探す。終了条件に合致するものが見つかるまでこれを縁
り返す、終了条件に一致すると、その語までをブロック
と認定し、ブロックの′LI旨11しを行なう、すなわ
ち、ブロックの先頭位置以降で最初に出現する終了条件
を満たす語の位置がそのブロックの終了位置とされる。
このようなブロック認識の結果、第3図に例示するよう
に、英文中にたとえば「40.、接続詞61.」があれ
ば、文頭からr、」の前までを1つのブロック、r 、
 vc続調」から文末までを他の1つのブロックとして
認識する。同図において[]内が1つのブロックを示し
ている。なお「、」を含まない位置からブロックとして
もよい、また、句読点の類は、ブロックのもつ情報とし
て構文解析の対象からはずしてもよい。
同様に、たとえばr、、、、関係間、、、、Jがあれば
、「、関係間、、、、Jを1つのブロックとして認識す
る。ブロックは、勿論入れ子にすることもあり得る。た
とえば第4図に示すように、英文が「(文頭)、、、、
接続詞4.2.関係間、、、、、、、  (文末)」の
ような構成であると、「、接続詞」から文末までが1つ
のブロックBLI〜BLIを形成し、その中に「、関係
間、、、、Jが他のブロックBL2〜BL2として包含
されている。
このように形7F、素解析部1Bでは、文の形jS J
:および語Ql−の特徴を識別して構文1−のまとまり
をブロックとして判別する。なお形7ff素解析部16
では、このようなブロックの認識の他に、たとえば固有
基j4、派生語、未知語、省略語、数、時の表現、ハイ
フン語、アポストロフィr′」などの処理や、同格の推
定、付加疑問の処理などの様/Iな処理を行なって、形
IE素解析データを作成する。
たとえば英文 15aid、 ”White Hous
e isn’twhite、″が形態素解析部°IBで
解析されると、ブロック1が最初の「”」の位置で開始
して最終の「“」の位置で経了し、同様にブロック2が
語Whiteの位置で開始して語Houseの位置で終
了することがわかる。つまり、”White Hous
e iSn’twhite、”のブロックの中に他のブ
ロックWb i teHouseが入れ子になっている
。英文データは、このようなブロックの情報とともに、
「rL語辞書18を索引した中詰情報が付加されて形態
素解析部IBから構文解析工部20へ送出される。なお
、WhiteHouseはユニットとして扱ってもよい
、これまでの処理が第5図のフローに示す処理100に
相当する。
構文解析工部20では、cfg文法ルールを英文データ
に適用して文についてbottos−up、 righ
t−to−1eftに表層構造の解析を行ない、すべて
の構文的r+7能性を見つけ出す、すなわち、解析ルー
ルファイル3Bに格納されている文脈自由文法ルールを
適用して英文の表層構造を解析し、可能性のあるすべて
の構文木を見つけだす、その際、ブロックが含まれてい
れば前述の部分バーズを行ない。
局所的解析を優先させる。これによって、解析の効率と
正確さが向−1ニする。
より詳細には、ブロックの位置情報からブロックの包含
関係を作成する。そこで、最も内側のブロックをバーズ
する。パージングを終了したブロックはユニー、トとみ
なしてその内側はそれ以上処理しない。こうして順次、
外側のブロック認識する。なおバーズは、cfg文法ル
ールにノ1(づき、英文においてbottom−up、
 right−to−1eftに行なう0文法ルールの
許すII丁能性をすべて保持した形でバーズする。
まず、構文解析工部20に供給された英文データに)1
(づき、1つの文について構文」−のまとまりをすべて
ブロックとして認識する。このまとめ方は、第3図に例
示した通りである。そこで、こうしたまとまりの中にブ
ロックが存在しなければ、その文を解析し、1つの文の
シンボルとしてまとまったものだけを選択してその文の
解析を終了する。
ブロックが存在すると、まず、最も内側のブロックから
解析する。7jS4図の例では、まずブロックBL2〜
BL2の内部を解析する。この解析によって一般に様々
な解が得られるが、それらの解のうち、1つのcfgシ
ンボルとしてまとまったもののみを選択する。そこで、
このように選択したものを屯−・のまとまりとして扱う
ように処理する。この処理を11「1次繰り返す。
こうして、第4図の例では、まずブロックBL2〜BL
2の内部が解析され、次にブロックBLI〜BLIの内
部が解析される。その際、ブロックBL2〜BL2は屯
−の単語と同等に扱われ、それに含まれる構成要素のそ
れぞれについての解析は行なわない。
こうして構文りのまとまりと従属関係を規定するデータ
が得られると、これは構文解析I LR22に送られる
。このデータは、第7図に示すcog解析結果(係り先
暫定状態)のリス) 200の形をとり、前述した構文
木の形で容易に理解される。構文解析11部22では、
構文解析1部20による表層的なバーズ結果から、ウェ
イトないしは優先度を考慮して構造記述を適用し、解を
選択する。これによって英語文の確からしい解析木の候
補を作成し、その構造を作る( 101 、第5図)、
さらに、辞書記述などを利用して、前置詞句や副詞句の
係り先を決定し、最優先テーブルを作成する (102
)。
これによって、より確からしい解析木を得る。
第6図を参照し、英文He 5aid、 ”I saw
 a manin the park with a 
telescope、”を例にとって構文解析11部2
2における処理を説明する。この英文の構文的要素は、
NPI−Vtl−vP2−(Vt2* タはVt3)−
vP3−PPI−PP2テアル。7’、 タL 、 N
Plf 名詞句、v t ハ他!PII 、ri、pp
は前置詞句であり、添字はその諸量または形態が異なる
ものを示している。形1ム素解析部16ではこのうち vP2−(Vt2’! 7’S−はVt3)−vP3−
PPI−PP2の部分SE2をブロックであると認定す
る。ただしSEは文を示す。
構文解析1部20ではそこで、SE2がブロックである
ことから、この英文の表層構造を SEI 、−NPI VPI VPI −Vtl [5E21 と解析する。ただしvPは動詞句を示し、ブロックはど
のシンボルに対しても付加することができる。この解析
結果データは、構文解析11部22でcfg解析結果リ
スト200に格納される。
構文解析II部22ではまず、構文解析I部20から得
られたcfg解析結果のリスト200に従って辞書18
を索引し、“11/定木構造化処理を実行する。これに
よって、構文的なまとまりをブロックとして認識しく 
100) 、cfgルールに基づき解析を行ない(Il
l)、 cfgルールに対応する規則に基づきすべての
解析木の候補を得る (112)。
辞−17引きでは、解析結果リス) 200に含まれる
単語について辞書18を索引してその内容を取り込み、
辞、1)引きバッファ202に蓄積する。・所定木構造
化処理では、解析結果リスト200内の優先度ないしは
ウェイトと、解析ルール3Bに含まれる構造編集ルール
206とから木構造を作成する0作成された優先度の値
は、木構造スタック(係り先”コリ定状yE)216に
格納される。また、木構造は木構造データ(係り先°1
1定状態)218に蓄積される。
たとえばヒ記英文例では、暫定構造 (Vtl (NPI (Vt2 (vP2 vP3 P
P1a PP2all))が得られる。この優先度をた
とえば「20」とする、ただし、()は形78素の従属
ないしは共起1場(tを 示十・ン ン ポルで訊 番
1   込t ^ L+−4不 (1キル暫定的に一応
決定したノードであることを示す。
この暫定的係り関係構造を第8A図に示す。同図で二重
線は、そのド位のノードがブロックであることを示して
いる。また、他の優先度、たとえば「15」として別の
°I9定構造 1Vtl (NPI [Vt3 (vP2 vP3 P
P1a PP2allllも得られる。この暫定的係り
関係構造を第8B図に示す。
そこで、ルールの優先度などに基づき、解の候補を限定
する (113)、具体的には、木構造スタック(係り
先゛19定状態)の優先度の高い順に木構造スタック(
係り先°117定状態)とそれに木構造データ(係り先
・所定状態)を並べかえることで実現している。次に、
このように絞り込んだ解析木について、すべての係り先
の可能性のそれぞれに解析木を抽出する (114)、
なお処理113は削除してもよい。
この係り先決定処理208では、所定の論理条件210
に従って優先度の修正を行なう。たとえば。
辞、+718の共起情報に記述されている係り先につぃ
ては、その優先度を増す、辞書の記述と反対のものは、
優先度を減少させる。辞:!Iにないものは。
はぼそのままでよい。
優先度の増減の度合は、シミュレーションなどで決定す
るのがよい、−例をあげると、共起情報に記述がある係
り先ノードは+15.自己のノードの親の7−ドに係る
場合は+5、「1己のメートの兄第(姉妹)で最も近い
年上の兄かその子孫の場合は+8.それ以外の兄第の場
合は+2、親の兄第とその子孫の場合は変更なし、など
である。
まず、木構造データ(係り先暫定状態) 218の先頭
から順に1文を取り出す0次に、その文中における共起
情報を辞書引きバー2フア202中の単語記述と照合す
る。その内容により木構造と優先度を決定する。その際
、複数発生することがあるので、優先度表を使用する。
決定した優先度は木構造スタック(係り先決定状71)
2に2へ、また木構造は木構造データ(係り先決定状態
)214へ格納する。
係り先の変更の範囲は、本実施例では第9図に点123
0で示す範囲である。すなわち、同図において各丸印は
構文木のメートを示し、実線で各7−ドのJ(起関係が
示されている。自己のノードがiであるとすれば、係り
先を変更できる範囲は。
1)自己のノードiの親ノードeと、その祖先のノード
b、 aなど、 2)自己のノードiの親ノードの兄第であって親ノード
より年tのものc、 dなどと、その子孫の7−ドn、
 oなど、 3)「1己のノードiの兄第であって「1己ノードより
年上のものg、 hと、そのf−孫のノードl、 ra
などである。
こうして、可染性のある係り先を規定した解析木をすべ
て抽出したのち(114)、自己のノードの属していな
いノードに直接係っている係り先を含む解析木を排除す
る (115)、つまり、係り先の変更範囲は、ト述の
3つの条件に加えて。
4)ブロックの境界[」をまたいで移動しないことを条
件とする。
こうして処理115で残留したすべての解析木から係り
方などを考慮して、より確からしい解析木を得る (1
1B)。具体的には、木構造スター2り(係り先決定状
態)の優先度の高い順に木構造スタック(係り先決定状
態)とそれに木構造データ(係り先決定状態)を並べか
えることで実現している。
に述の英文例では、たとえば優先度「43」で解析木 (Vtl (NPI [Vt2 (NF2 NF2 (
PPI)) PP2]11が得られる。これを第10A
図に示す、これは、前述の英文例で、前置詞句”in 
the park”が名詞句”a man”に係り、萌
置詞句”with a telescope、”がrを
見た」という意味の動詞“saw″に係ることを意味す
る。
また、たとえば優先度「40」で解析木(Vtl (N
PI (Vt2 (NF2 NF2 PPI) PP2
]))。
またたとえば優先度「38」で解析木 (Vtl (NPI [Vt3 (NF2 NF2 (
PPIJ) PP2]))それぞれ示す、第10B図の
場合は、前置詞句”1nthe park”およびwi
th a telescope、”が名詞句”a +m
an”に係り、また第100図の場合は、前置詞句“i
n the park”が名詞句”a may+”に係
り、rm置詞句”with a telescope、
”が「をのこぎりでひく」という意味の動詞”saw“
に係ることを意味する。勿論、これら以外の結果も得ら
れる。
こうして構文解析された英文データは、構造変換部24
へ転送されて日本語文の構造に変換され、訳文生成部2
Bでは、それに含まれる各7−ドごとに、訳文を生成し
てゆく、構造木におけるノードの処理は、top−do
wn、 left−to−rightで行なう、生成さ
れた訳文は、後編集部30で後処理が行なわれ、操作表
示部40にof視大表示れるとともに、出力i’!11
32にて「1本文34としてたとえば印字出力される。
このように本実施例によれば、英文の形態上および諸量
1−の特徴に応じた構文りのまとまりを規定するブロッ
クの内部でのみ、そのブロックに含オースL店tJ: 
+ID l’ M jf、 41 ’J= L :張t
1.I −J−z  イ門J−hsx外側に対して係り
先を選択することはJ、トされる。これによって、無駄
な解の数を減らし、解析の効(ぺが向トするとともに、
解析結果がより確からしいものとなる。
たとえば前述の英文例では、前置詞句PPIやPP2が
ブロック[SE2]内だけで移動するので、それらが名
詞句NPIや他動詞Vtlに直接係るような、1!+1
もかに無駄な解が生ずることが最小化される。つまり、
前を詞句”in the park”や”with a
telescope″が”He″または”5aid”に
係るような、人間が読んで明らかに誤りとわかるような
構文木が生成されるのを回避することができる。
効  果 本発明によれば、所定の言語の文の形態上および諸量上
の特徴に応じた構文上のまとまりの内部でのみ、そのま
とまりに含まれる構成要素の係り先が選択される。まと
まり部の外側に対して係り先を選択することは禁止され
る。これによって。
無駄な解の生成を最小化し、解析の効率と正確さを向1
−させている。
【図面の簡単な説明】
第1図は、本発明による言語解析装置を英[1目+、I
J翻訳装置に適用した実施例の全体構成を示す機能ブロ
ック図、 第2図は、第1図に示す実施例における解析ルールファ
イルに格納されているブロック先頭条件および終Y条件
のテーブルデータの例を示す説明図。 第3図は、同実施例における構文上のまとめあげの例を
示す説明図、 第4図は、ブロックのまとめあげの例を示す説明図、 第5図は、同実施例の形態素解析部および構文解析部で
実行される解析処理の例を示すフロー図。 第6図は、同実施例における係り先を限定する構文解析
処理の例を示すフロー図、 第7図は、同実施例において、係り先を限定する構文解
析処理のet、Ieをまとめた機能ブロック図、 第8八図ないし第10C図は、特定の入力英文例につい
て解析木のまとめあげ処理の例を示す説明図である。 主要部分の符()の説明 10、、、入力部 1G、、、形態素解析部 18、、、lii語辞書 20.22. 、構文解析部 24、、、構造変換部 28、、、訳文生成部 32、、、出力部 3629.解析ルール 3B、、、制御部 40、、、操作表示部 第2図 第3図 (文頭)・・、接続詞 −・−・・、関係上・・・・・
・・・ 、 ・・(文末)BLI        BL
2        BL2      BLI第6図 第8A図 ■t1 第8B図 NF2  NF2  PP1a  PP2a第2a

Claims (1)

  1. 【特許請求の範囲】 1、入力された所定の言語の文について形態素解析を行
    なう第1の解析手段と、 第1の解析手段からの形態素解析結果をもとに前記言語
    の文について構文解析を行なう第2の解析手段と、 第1および第2の解析手段の解析に使用する該言語の辞
    書データを格納した辞書手段と、 該辞書手段を索引して第1および第2の解析手段に解析
    を行なわせる制御手段とを有し、 第1の解析手段は、前記辞書手段を索引し、前記入力さ
    れた言語の文の形態上の特徴を識別して構文上のまとま
    りを判別し、 第2の解析手段は、文法ルールを適用して該言語の文の
    表層構造を解析し、該文に前記まとまりが含まれていれ
    ば、該まとまりの内部において該文に含まれる構成要素
    の係り先を選択することを特徴とする言語解析装置。 2、特許請求の範囲第1項記載の装置において、第2の
    解析手段は、 前記言語の文の構成要素の係り先を選択する条件を規定
    したテーブルを有し、 前記文に含まれる構成要素の係り先を暫定的に設定した
    構文木の候補を優先度を割り当てて作成し、 該候補のうちから優先度の高いものを選択 し、 前記テーブル、および前記辞書手段からの辞書データを
    参照して前記選択された候補の優先度を修正することを
    特徴とするす言語解析装置。
JP61110872A 1986-05-16 1986-05-16 言語解析装置 Pending JPS62267873A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61110872A JPS62267873A (ja) 1986-05-16 1986-05-16 言語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61110872A JPS62267873A (ja) 1986-05-16 1986-05-16 言語解析装置

Publications (1)

Publication Number Publication Date
JPS62267873A true JPS62267873A (ja) 1987-11-20

Family

ID=14546840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61110872A Pending JPS62267873A (ja) 1986-05-16 1986-05-16 言語解析装置

Country Status (1)

Country Link
JP (1) JPS62267873A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6371774A (ja) * 1986-09-12 1988-04-01 Nec Corp 文脈解析方式

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS62177665A (ja) * 1986-01-31 1987-08-04 Toshiba Corp 翻訳システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS62177665A (ja) * 1986-01-31 1987-08-04 Toshiba Corp 翻訳システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6371774A (ja) * 1986-09-12 1988-04-01 Nec Corp 文脈解析方式
JPH0517591B2 (ja) * 1986-09-12 1993-03-09 Nippon Electric Co

Similar Documents

Publication Publication Date Title
US5406480A (en) Building and updating of co-occurrence dictionary and analyzing of co-occurrence and meaning
US5418717A (en) Multiple score language processing system
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US6721697B1 (en) Method and system for reducing lexical ambiguity
JP3476237B2 (ja) 構文解析装置
JPH0351020B2 (ja)
KR20160138077A (ko) 기계 번역 시스템 및 방법
US5608623A (en) Special cooccurrence processing method and apparatus
CN100361124C (zh) 用于词分析的系统和方法
Nugues Language Processing with Perl and Prolog
WO2009113289A1 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP2632806B2 (ja) 言語解析装置
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JPS62267873A (ja) 言語解析装置
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
US20220004708A1 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons
JP4033089B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3508312B2 (ja) キーワード抽出装置
Gerbremedhin Design and Development of Part of Speech Tagger for Ge’ ez Language Using Hybrid Approach
Deoskar et al. Induction of Treebank-Aligned Lexical Resources.
JPH0345423B2 (ja)
Daybelge Improving the precision of example-based machine translation by learning from user feedback
JPS63113669A (ja) 言語解析装置