JPS59121574A - 翻訳処理方式 - Google Patents

翻訳処理方式

Info

Publication number
JPS59121574A
JPS59121574A JP57229498A JP22949882A JPS59121574A JP S59121574 A JPS59121574 A JP S59121574A JP 57229498 A JP57229498 A JP 57229498A JP 22949882 A JP22949882 A JP 22949882A JP S59121574 A JPS59121574 A JP S59121574A
Authority
JP
Japan
Prior art keywords
rules
dictionary
word
rule
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57229498A
Other languages
English (en)
Inventor
Toshihiro Kakimoto
柿元 俊博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57229498A priority Critical patent/JPS59121574A/ja
Publication of JPS59121574A publication Critical patent/JPS59121574A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、自然言語の翻訳処理方式に関し、特(=、構
文解析のための文法規則を、汎用規則と語依存規則とに
分離して適用することにより、処理現方式に関する。
〔技術の背景〕
一般に、自然言語の翻訳処理システムは、第1図に示す
ような構成をもっている。概要を説明すると、同図にお
いて、1は入力部であり、たとえば英日翻訳の場合、英
文の文章が入力される。2は辞書処理部であり、拳語辞
書ファイル3および熟語辞書ファイル4(=もとづいて
単語の辞書引きを行なう。このとき語尾処理も行なわれ
る。′5は構文解析部であり1文法規則ファイル6から
適用すべき規則を見出しくマツチング)9時刻、格等の
細部構造を決定し5語順を入れ替え、訳文を生成する。
7は出力部であり、訳文を表示あるいはプリント出力す
る。
第2図は9文法規則の構成を示している。
第1図に示す従来システムは、単語辞書および熟語辞書
と文法規則とがそれぞれ独立しており。
辞書処理と構文解析とは継続的なステップとして処理さ
れている。このため文法規則は、汎用性をもたせた構造
となっており、特殊例外処理等の規則を網羅しているた
め、たとえばあるシステムでは、その数が1500にも
達している。構文解析部5は、このような膨大な規則を
用いてその適用処理を行なうため、トライ回数が多くな
り、処理効率が悪く、処理時間が長くなっていた。また
語依存性の規則、すなわち語特有の用法の適用が本質的
に困難であるため、誤訳を生じゃすい欠点があった。
〔発明の目的および構成〕
本発明の目的は、翻訳実行時の文法規則の適用回数を減
らし、処理効率を上げることにある。
そのため本発明の原理は1文法規則には語に依存した規
則が多いことと、一般に本としてつくられている辞書は
語とその用例の記述でできており。
用例は一種の文法規則と考えられることと、熟語。
慣用句なども文法規則として一般化できることに着目し
1文法規則を汎用規則と語依存性の規則とに分離し9語
依存性の規則を辞書内の対応する語の情報の一部として
含ませた辞書構造をつくり。
かつ、汎用規則を名詞句の処理、動詞句の処理などの部
分に分けて、それぞれ1つの制御単位とし。
更(=汎用規則に対する語依存性規則の適用レベルを制
御するため1両者をラベルで結合することにより、処理
の効率化を図るものである。
それにより1本発明の構成は、自然言語の翻訳処理シス
テムにおいて9語毎に語依存性の文法規則を包含する辞
書ファイルと、核辞書ファイルを用いて入力文中の谷語
について辞書引き処理を行ない、訳語等ととも(1語依
存性文法規則を組゛み合わせて出力する辞書処理部と、
汎用文法規則ファイルと9文法規則を用いて上記辞書引
き処理された入力文の構文解析を行なう構文解析部とを
そなえ、該構文解析部は1文法規則の適用に際して、 
  ・汎用文法規則に語依存性規則を組み合わせて実行
することを特徴としている。
〔発明の実施例〕
以下に9本発明を実施例にしたがって説明する。
はじめに本発明実施例の基礎となっ÷いる従来の構文解
析および訳文生成処理方式について説明する。
第3図(α)、 Ch)I (c)は、それぞれ、従来
方式の単語辞書、熟語辞書9文法規則の1例を示したも
のである。
第3図(α)における、単語辞書は、単語をインデック
スとして9文法規則上の名詞N1動詞V ]などの処理
単位となるカテゴリおよびサブカテゴリと、訳とをテー
ブル化した構成となっている。
第3図(A)における熟語辞書は、熟語をインデックス
として、カテゴリおよび訳をテーブル化した構成となっ
ている。
第3図(c)における文法規則は、複数の部分集合すな
わち部分文法C部分けられ、そのラベルと、カテゴリで
表示し、た変換規則と、訳順とC二よって構成されてい
る。たとえは1部分集合ラベルのおよび■は名詞句の処
理、■は文の処理、■は動詞句の処理を表わしている。
第4図および第5図は、第3図(cL)、 (h)、 
(t))の辞書および文法規則を用いて実行した構文解
析および訳文生成処理の例である。
第4図の例では、入力文(I  take a col
d)の単語および熟語を、単語辞書および熟語辞書を用
いて、対応するカテゴリPN、NPおよび訳に変換する
。ここでは、熟語辞書が単語辞書(二優先して適用され
る。次に得られたカテゴリPN、NP(二ついて9文法
規則とマツチングをとる。PNのみが、■にマツチング
し、 P N −+ NPの変換が行なわれ、NP、V
Pとなる。次に再び文法規則とマツチングをとる。今度
は、■にマツチングし。
NP、VP、Sの変換が行なわれ、訳文〔私′は風邪を
引く〕が得られる。
第5図の例は、入力文(■tak6my d、1cti
on、ary)がt a、k eの多義語性〔捕える。
取る〕により、■の寸d;關印1の論田l−松1.ハで
竿I II百イ1“Ioの胛再r十山キス)を採用した
ため、誤訳〔私は私の辞相:を捕える〕となったもので
ある。
この場合、■Vl (BC)、NP(AA)−→VPと
いう文法規則を新たにつくり、これを■に優先させて適
用させるならば、訳語〔取る〕と〔辞書〕を連結するこ
とができ、第6図に示すように、正しい訳文〔私は私の
辞書を取る〕を得ることができる。
本発明では、この■のような語依存性の文法規則を辞書
側(二格納するものであって、第7図はその実施例を示
す。ラベル欄は、汎用規則中の連係適用すべき部分集合
(部分文法)のラベルを表わし、#■は、第3図(C)
中の文法規則■の前に適用すべきことを表わしている。
優先度は、その適用上の優先度を表わす。
第8図は1本発明実施例システムの構成図である。同図
1−おいて、8は入力部、9は辞書処理部。
10は単語辞書、10aは語依存性規則、11は熟語辞
書ファイル、12は構文解析部、13は汎用17A 只
り /  ノ  1  ノV、15   α 、   
工  3B、=゛ は K 用 ム九 只りの部分集合
、14は出力部を表わす。
辞書処理部9は、入力部8から入力された原文について
第1図の場合と同様に、単語辞書ファイル10.熟語辞
書ファイル11を用いて、辞書引き処理を行なう。この
場合1語が語依存性規則10zを含むものについては、
そのラベル、優先度、規則も併せて構文解析部12へ供
給する。
構文解析部12の基本的機能は、第4図で説明した従来
例と同様である。しかし、単語辞書16から読み出した
語依存性規則10.zk、汎用規則に連係させる処理が
必要であるため、同ブロック内にフローで表示されてい
る機能をもっている。
汎用規則の部分集合13α、13A、・・・のいずれか
に制御が渡っているとき、まずその部分集合のラベルと
、辞書処理部9から供給された語依存性規則の1つのラ
ベルとのマツチングをとる。た゛とえば第7図の例では
、汎用規則の部分集合■を実行する段階で1語依存性規
則#■のラベルとマッチンクスる。ラベル間のマツチン
グが成功したとき。
その優先度表示にしたがって1語依存性規則を汎用規則
の部分集合内(二挿入する。他方、マツチングが不成功
であったときで、しかも、祉依存性規則に残りがある場
合C二は、そのラベルとのマツチングをとる。そしてマ
ツチング成功の」場合およびマツチングすべき語依存性
規則力;なし′X場合(−レよ。
その部分集合にしたがって文法規則を実行する。
このようにして、得られた訳文は、出力部14から出力
される。
〔発明の効果〕
以上述べたように1本発明によれレイ、文法規@1]の
構成が単純化され、かつその数カー減少されるため、シ
ステムのコストを低減すること力;でき、更(=翻訳精
度を向上させることが容易とな0.力1つ処理時間を短
縮することができる0
【図面の簡単な説明】
第1図は従来の翻訳処理システムの構成1菌、第2図は
文法規則の構成例を示す図、第3図<a)+ (b)。 (C)はそれぞれ単語辞書、熟語辞書1文f1モ規貝1
]の内容例を示す図、第4図および第5!図)ま5惜文
角予析<−理例を示す図、第6図は本発明の原理(−も
と−づく構文解析例を示す図、第7図をま本発明(=も
とづく単語辞書の内容例を示す図、第8図[ま本発明実
施例システムの構成図である。 図中、8は入力部、9は辞書処理部[S、1(Hま単語
辞書ファイル、10αは語依存性規貝11.1.1)ま
熟語辞書、12は構文解析部、13しよ汎用規貝11フ
ァイル、13α、13hは汎用規II+の部分集合。 14は出力部を表わす。 特許出願人 富士通株式会社 代理人弁理士  長谷用 文 廣 (外1名)72図 才+m f5層 tcn すδm

Claims (1)

  1. 【特許請求の範囲】 自然言語の翻訳処理システムにおいて9語毎に語依存性
    の文法規則を包含する辞書ファイルと。 該辞書ファイルを用いて入力文中の各語について辞書引
    き処理を行ない、訳語等とともに語依存性文法規則を組
    み合わせて出力する辞書処理部と。 汎用文法規則ファイルと1文法規則を用いて上記辞書引
    き処理された入力文の構文解析を行なう構文解析部・と
    をそなえ、該構文解析部は1文法規則の適用に際して、
    汎用文法規則に語依存性規則を組み合わせて実行するこ
    とを特徴とする翻訳処理方式。
JP57229498A 1982-12-28 1982-12-28 翻訳処理方式 Pending JPS59121574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57229498A JPS59121574A (ja) 1982-12-28 1982-12-28 翻訳処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57229498A JPS59121574A (ja) 1982-12-28 1982-12-28 翻訳処理方式

Publications (1)

Publication Number Publication Date
JPS59121574A true JPS59121574A (ja) 1984-07-13

Family

ID=16893108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57229498A Pending JPS59121574A (ja) 1982-12-28 1982-12-28 翻訳処理方式

Country Status (1)

Country Link
JP (1) JPS59121574A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS63143669A (ja) * 1986-12-05 1988-06-15 Matsushita Electric Ind Co Ltd 構文解析装置
US5396419A (en) * 1991-09-07 1995-03-07 Hitachi, Ltd. Pre-edit support method and apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPH0415504B2 (ja) * 1983-04-28 1992-03-18 Nippon Electric Co
JPS63143669A (ja) * 1986-12-05 1988-06-15 Matsushita Electric Ind Co Ltd 構文解析装置
US5396419A (en) * 1991-09-07 1995-03-07 Hitachi, Ltd. Pre-edit support method and apparatus

Similar Documents

Publication Publication Date Title
Hays Dependency theory: A formalism and some observations
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
EP0266001A3 (en) A parser for natural language text
JPH02165378A (ja) 機械翻訳システム
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
Gehlot et al. Hindi to English transfer based machine translation system
JPS59121574A (ja) 翻訳処理方式
Tomita Feasibility study of personal interactive machine translation systems
JP2007133905A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Carter Lattice-based word identification in CLARE
JPH0715691B2 (ja) 自動翻訳装置
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH041852A (ja) 機械翻訳装置
JPH05151255A (ja) 日本語入力方法
Tsujii The current stage of the Mu-Project
Garje et al. English to Marathi Rule Based Machine Translation of Simple Assertive Sentences
Saha Bangla sentence parsing using traditional parser
JPS61115171A (ja) 機械翻訳システム
JPH04112366A (ja) 自然言語文解析装置
JPS6055468A (ja) 多言語解析装置
JPH1166069A (ja) 機械翻訳装置
Thao et al. Mhong Language Council Conference (University of Minnesota, Minneapolis, August 12-14, 1982). Interim Report.
JPH10269221A (ja) 未登録語処理方式
JPS63180172A (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法