JPS59121574A

JPS59121574A - 翻訳処理方式

Info

Publication number: JPS59121574A
Application number: JP57229498A
Authority: JP
Inventors: Toshihiro Kakimoto; 柿元　俊博
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-12-28
Filing date: 1982-12-28
Publication date: 1984-07-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、自然言語の翻訳処理方式に関し、特（＝、構
文解析のための文法規則を、汎用規則と語依存規則とに
分離して適用することにより、処理現方式に関する。

〔技術の背景〕

一般に、自然言語の翻訳処理システムは、第１図に示す
ような構成をもっている。概要を説明すると、同図にお
いて、１は入力部であり、たとえば英日翻訳の場合、英
文の文章が入力される。２は辞書処理部であり、拳語辞
書ファイル３および熟語辞書ファイル４（＝もとづいて
単語の辞書引きを行なう。このとき語尾処理も行なわれ
る。′５は構文解析部であり１文法規則ファイル６から
適用すべき規則を見出しくマツチング）９時刻、格等の
細部構造を決定し５語順を入れ替え、訳文を生成する。

７は出力部であり、訳文を表示あるいはプリント出力す
る。

第２図は９文法規則の構成を示している。

第１図に示す従来システムは、単語辞書および熟語辞書
と文法規則とがそれぞれ独立しており。

辞書処理と構文解析とは継続的なステップとして処理さ
れている。このため文法規則は、汎用性をもたせた構造
となっており、特殊例外処理等の規則を網羅しているた
め、たとえばあるシステムでは、その数が１５００にも
達している。構文解析部５は、このような膨大な規則を
用いてその適用処理を行なうため、トライ回数が多くな
り、処理効率が悪く、処理時間が長くなっていた。また
。

語依存性の規則、すなわち語特有の用法の適用が本質的
に困難であるため、誤訳を生じゃすい欠点があった。

〔発明の目的および構成〕

本発明の目的は、翻訳実行時の文法規則の適用回数を減
らし、処理効率を上げることにある。

そのため本発明の原理は１文法規則には語に依存した規
則が多いことと、一般に本としてつくられている辞書は
語とその用例の記述でできており。

用例は一種の文法規則と考えられることと、熟語。

慣用句なども文法規則として一般化できることに着目し
１文法規則を汎用規則と語依存性の規則とに分離し９語
依存性の規則を辞書内の対応する語の情報の一部として
含ませた辞書構造をつくり。

かつ、汎用規則を名詞句の処理、動詞句の処理などの部
分に分けて、それぞれ１つの制御単位とし。

更（＝汎用規則に対する語依存性規則の適用レベルを制
御するため１両者をラベルで結合することにより、処理
の効率化を図るものである。

それにより１本発明の構成は、自然言語の翻訳処理シス
テムにおいて９語毎に語依存性の文法規則を包含する辞
書ファイルと、核辞書ファイルを用いて入力文中の谷語
について辞書引き処理を行ない、訳語等ととも（１語依
存性文法規則を組゛み合わせて出力する辞書処理部と、
汎用文法規則ファイルと９文法規則を用いて上記辞書引
き処理された入力文の構文解析を行なう構文解析部とを
そなえ、該構文解析部は１文法規則の適用に際して、　
　　・汎用文法規則に語依存性規則を組み合わせて実行
することを特徴としている。

〔発明の実施例〕

以下に９本発明を実施例にしたがって説明する。

はじめに本発明実施例の基礎となっ÷いる従来の構文解
析および訳文生成処理方式について説明する。

第３図（α）、　Ｃｈ）Ｉ　（ｃ）は、それぞれ、従来
方式の単語辞書、熟語辞書９文法規則の１例を示したも
のである。

第３図（α）における、単語辞書は、単語をインデック
スとして９文法規則上の名詞Ｎ１動詞Ｖ　］などの処理
単位となるカテゴリおよびサブカテゴリと、訳とをテー
ブル化した構成となっている。

第３図（Ａ）における熟語辞書は、熟語をインデックス
として、カテゴリおよび訳をテーブル化した構成となっ
ている。

第３図（ｃ）における文法規則は、複数の部分集合すな
わち部分文法Ｃ部分けられ、そのラベルと、カテゴリで
表示し、た変換規則と、訳順とＣ二よって構成されてい
る。たとえは１部分集合ラベルのおよび■は名詞句の処
理、■は文の処理、■は動詞句の処理を表わしている。

第４図および第５図は、第３図（ｃＬ）、　（ｈ）、　
（ｔ））の辞書および文法規則を用いて実行した構文解
析および訳文生成処理の例である。

第４図の例では、入力文（Ｉ　　ｔａｋｅ　ａ　ｃｏｌ
ｄ）の単語および熟語を、単語辞書および熟語辞書を用
いて、対応するカテゴリＰＮ、ＮＰおよび訳に変換する
。ここでは、熟語辞書が単語辞書（二優先して適用され
る。次に得られたカテゴリＰＮ、ＮＰ（二ついて９文法
規則とマツチングをとる。ＰＮのみが、■にマツチング
し、　Ｐ　Ｎ　−＋　ＮＰの変換が行なわれ、ＮＰ、Ｖ
Ｐとなる。次に再び文法規則とマツチングをとる。今度
は、■にマツチングし。

ＮＰ、ＶＰ、Ｓの変換が行なわれ、訳文〔私′は風邪を
引く〕が得られる。

第５図の例は、入力文（■ｔａｋ６ｍｙ　ｄ、１ｃｔｉ
ｏｎ、ａｒｙ）がｔ　ａ、ｋ　ｅの多義語性〔捕える。

取る〕により、■の寸ｄ；關印１の論田ｌ−松１．ハで
竿Ｉ　ＩＩ百イ１“Ｉｏの胛再ｒ十山キス）を採用した
ため、誤訳〔私は私の辞相：を捕える〕となったもので
ある。

この場合、■Ｖｌ　（ＢＣ）、ＮＰ（ＡＡ）−→ＶＰと
いう文法規則を新たにつくり、これを■に優先させて適
用させるならば、訳語〔取る〕と〔辞書〕を連結するこ
とができ、第６図に示すように、正しい訳文〔私は私の
辞書を取る〕を得ることができる。

本発明では、この■のような語依存性の文法規則を辞書
側（二格納するものであって、第７図はその実施例を示
す。ラベル欄は、汎用規則中の連係適用すべき部分集合
（部分文法）のラベルを表わし、＃■は、第３図（Ｃ）
中の文法規則■の前に適用すべきことを表わしている。

優先度は、その適用上の優先度を表わす。

第８図は１本発明実施例システムの構成図である。同図
１−おいて、８は入力部、９は辞書処理部。

１０は単語辞書、１０ａは語依存性規則、１１は熟語辞
書ファイル、１２は構文解析部、１３は汎用１７Ａ　只
り　／　　ノ　　１　　ノＶ、１５　　　α　、　　　
工　　３Ｂ、＝゛　は　Ｋ　用　ム九　只りの部分集合
、１４は出力部を表わす。

辞書処理部９は、入力部８から入力された原文について
第１図の場合と同様に、単語辞書ファイル１０．熟語辞
書ファイル１１を用いて、辞書引き処理を行なう。この
場合１語が語依存性規則１０ｚを含むものについては、
そのラベル、優先度、規則も併せて構文解析部１２へ供
給する。

構文解析部１２の基本的機能は、第４図で説明した従来
例と同様である。しかし、単語辞書１６から読み出した
語依存性規則１０．ｚｋ、汎用規則に連係させる処理が
必要であるため、同ブロック内にフローで表示されてい
る機能をもっている。

汎用規則の部分集合１３α、１３Ａ、・・・のいずれか
に制御が渡っているとき、まずその部分集合のラベルと
、辞書処理部９から供給された語依存性規則の１つのラ
ベルとのマツチングをとる。た゛とえば第７図の例では
、汎用規則の部分集合■を実行する段階で１語依存性規
則＃■のラベルとマッチンクスる。ラベル間のマツチン
グが成功したとき。

その優先度表示にしたがって１語依存性規則を汎用規則
の部分集合内（二挿入する。他方、マツチングが不成功
であったときで、しかも、祉依存性規則に残りがある場
合Ｃ二は、そのラベルとのマツチングをとる。そしてマ
ツチング成功の」場合およびマツチングすべき語依存性
規則力；なし′Ｘ場合（−レよ。

その部分集合にしたがって文法規則を実行する。

このようにして、得られた訳文は、出力部１４から出力
される。

〔発明の効果〕

以上述べたように１本発明によれレイ、文法規＠１］の
構成が単純化され、かつその数カー減少されるため、シ
ステムのコストを低減すること力；でき、更（＝翻訳精
度を向上させることが容易とな０．力１つ処理時間を短
縮することができる０

【図面の簡単な説明】

第１図は従来の翻訳処理システムの構成１菌、第２図は
文法規則の構成例を示す図、第３図＜ａ）＋　（ｂ）。（Ｃ）はそれぞれ単語辞書、熟語辞書１文ｆ１モ規貝１
］の内容例を示す図、第４図および第５！図）ま５惜文
角予析＜−理例を示す図、第６図は本発明の原理（−も
と−づく構文解析例を示す図、第７図をま本発明（＝も
とづく単語辞書の内容例を示す図、第８図［ま本発明実
施例システムの構成図である。図中、８は入力部、９は辞書処理部［Ｓ、１（Ｈま単語
辞書ファイル、１０αは語依存性規貝１１．１．１）ま
熟語辞書、１２は構文解析部、１３しよ汎用規貝１１フ
ァイル、１３α、１３ｈは汎用規ＩＩ＋の部分集合。１４は出力部を表わす。特許出願人　富士通株式会社代理人弁理士　　長谷用　文　廣　（外１名）７２図才＋ｍｆ５層ｔｃｎすδｍ

Claims

【特許請求の範囲】自然言語の翻訳処理システムにおいて９語毎に語依存性
の文法規則を包含する辞書ファイルと。該辞書ファイルを用いて入力文中の各語について辞書引
き処理を行ない、訳語等とともに語依存性文法規則を組
み合わせて出力する辞書処理部と。汎用文法規則ファイルと１文法規則を用いて上記辞書引
き処理された入力文の構文解析を行なう構文解析部・と
をそなえ、該構文解析部は１文法規則の適用に際して、
汎用文法規則に語依存性規則を組み合わせて実行するこ
とを特徴とする翻訳処理方式。