JPS59121574A - 翻訳処理方式 - Google Patents
翻訳処理方式Info
- Publication number
- JPS59121574A JPS59121574A JP57229498A JP22949882A JPS59121574A JP S59121574 A JPS59121574 A JP S59121574A JP 57229498 A JP57229498 A JP 57229498A JP 22949882 A JP22949882 A JP 22949882A JP S59121574 A JPS59121574 A JP S59121574A
- Authority
- JP
- Japan
- Prior art keywords
- rules
- dictionary
- word
- rule
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、自然言語の翻訳処理方式に関し、特(=、構
文解析のための文法規則を、汎用規則と語依存規則とに
分離して適用することにより、処理現方式に関する。
文解析のための文法規則を、汎用規則と語依存規則とに
分離して適用することにより、処理現方式に関する。
一般に、自然言語の翻訳処理システムは、第1図に示す
ような構成をもっている。概要を説明すると、同図にお
いて、1は入力部であり、たとえば英日翻訳の場合、英
文の文章が入力される。2は辞書処理部であり、拳語辞
書ファイル3および熟語辞書ファイル4(=もとづいて
単語の辞書引きを行なう。このとき語尾処理も行なわれ
る。′5は構文解析部であり1文法規則ファイル6から
適用すべき規則を見出しくマツチング)9時刻、格等の
細部構造を決定し5語順を入れ替え、訳文を生成する。
ような構成をもっている。概要を説明すると、同図にお
いて、1は入力部であり、たとえば英日翻訳の場合、英
文の文章が入力される。2は辞書処理部であり、拳語辞
書ファイル3および熟語辞書ファイル4(=もとづいて
単語の辞書引きを行なう。このとき語尾処理も行なわれ
る。′5は構文解析部であり1文法規則ファイル6から
適用すべき規則を見出しくマツチング)9時刻、格等の
細部構造を決定し5語順を入れ替え、訳文を生成する。
7は出力部であり、訳文を表示あるいはプリント出力す
る。
る。
第2図は9文法規則の構成を示している。
第1図に示す従来システムは、単語辞書および熟語辞書
と文法規則とがそれぞれ独立しており。
と文法規則とがそれぞれ独立しており。
辞書処理と構文解析とは継続的なステップとして処理さ
れている。このため文法規則は、汎用性をもたせた構造
となっており、特殊例外処理等の規則を網羅しているた
め、たとえばあるシステムでは、その数が1500にも
達している。構文解析部5は、このような膨大な規則を
用いてその適用処理を行なうため、トライ回数が多くな
り、処理効率が悪く、処理時間が長くなっていた。また
。
れている。このため文法規則は、汎用性をもたせた構造
となっており、特殊例外処理等の規則を網羅しているた
め、たとえばあるシステムでは、その数が1500にも
達している。構文解析部5は、このような膨大な規則を
用いてその適用処理を行なうため、トライ回数が多くな
り、処理効率が悪く、処理時間が長くなっていた。また
。
語依存性の規則、すなわち語特有の用法の適用が本質的
に困難であるため、誤訳を生じゃすい欠点があった。
に困難であるため、誤訳を生じゃすい欠点があった。
本発明の目的は、翻訳実行時の文法規則の適用回数を減
らし、処理効率を上げることにある。
らし、処理効率を上げることにある。
そのため本発明の原理は1文法規則には語に依存した規
則が多いことと、一般に本としてつくられている辞書は
語とその用例の記述でできており。
則が多いことと、一般に本としてつくられている辞書は
語とその用例の記述でできており。
用例は一種の文法規則と考えられることと、熟語。
慣用句なども文法規則として一般化できることに着目し
1文法規則を汎用規則と語依存性の規則とに分離し9語
依存性の規則を辞書内の対応する語の情報の一部として
含ませた辞書構造をつくり。
1文法規則を汎用規則と語依存性の規則とに分離し9語
依存性の規則を辞書内の対応する語の情報の一部として
含ませた辞書構造をつくり。
かつ、汎用規則を名詞句の処理、動詞句の処理などの部
分に分けて、それぞれ1つの制御単位とし。
分に分けて、それぞれ1つの制御単位とし。
更(=汎用規則に対する語依存性規則の適用レベルを制
御するため1両者をラベルで結合することにより、処理
の効率化を図るものである。
御するため1両者をラベルで結合することにより、処理
の効率化を図るものである。
それにより1本発明の構成は、自然言語の翻訳処理シス
テムにおいて9語毎に語依存性の文法規則を包含する辞
書ファイルと、核辞書ファイルを用いて入力文中の谷語
について辞書引き処理を行ない、訳語等ととも(1語依
存性文法規則を組゛み合わせて出力する辞書処理部と、
汎用文法規則ファイルと9文法規則を用いて上記辞書引
き処理された入力文の構文解析を行なう構文解析部とを
そなえ、該構文解析部は1文法規則の適用に際して、
・汎用文法規則に語依存性規則を組み合わせて実行
することを特徴としている。
テムにおいて9語毎に語依存性の文法規則を包含する辞
書ファイルと、核辞書ファイルを用いて入力文中の谷語
について辞書引き処理を行ない、訳語等ととも(1語依
存性文法規則を組゛み合わせて出力する辞書処理部と、
汎用文法規則ファイルと9文法規則を用いて上記辞書引
き処理された入力文の構文解析を行なう構文解析部とを
そなえ、該構文解析部は1文法規則の適用に際して、
・汎用文法規則に語依存性規則を組み合わせて実行
することを特徴としている。
以下に9本発明を実施例にしたがって説明する。
はじめに本発明実施例の基礎となっ÷いる従来の構文解
析および訳文生成処理方式について説明する。
析および訳文生成処理方式について説明する。
第3図(α)、 Ch)I (c)は、それぞれ、従来
方式の単語辞書、熟語辞書9文法規則の1例を示したも
のである。
方式の単語辞書、熟語辞書9文法規則の1例を示したも
のである。
第3図(α)における、単語辞書は、単語をインデック
スとして9文法規則上の名詞N1動詞V ]などの処理
単位となるカテゴリおよびサブカテゴリと、訳とをテー
ブル化した構成となっている。
スとして9文法規則上の名詞N1動詞V ]などの処理
単位となるカテゴリおよびサブカテゴリと、訳とをテー
ブル化した構成となっている。
第3図(A)における熟語辞書は、熟語をインデックス
として、カテゴリおよび訳をテーブル化した構成となっ
ている。
として、カテゴリおよび訳をテーブル化した構成となっ
ている。
第3図(c)における文法規則は、複数の部分集合すな
わち部分文法C部分けられ、そのラベルと、カテゴリで
表示し、た変換規則と、訳順とC二よって構成されてい
る。たとえは1部分集合ラベルのおよび■は名詞句の処
理、■は文の処理、■は動詞句の処理を表わしている。
わち部分文法C部分けられ、そのラベルと、カテゴリで
表示し、た変換規則と、訳順とC二よって構成されてい
る。たとえは1部分集合ラベルのおよび■は名詞句の処
理、■は文の処理、■は動詞句の処理を表わしている。
第4図および第5図は、第3図(cL)、 (h)、
(t))の辞書および文法規則を用いて実行した構文解
析および訳文生成処理の例である。
(t))の辞書および文法規則を用いて実行した構文解
析および訳文生成処理の例である。
第4図の例では、入力文(I take a col
d)の単語および熟語を、単語辞書および熟語辞書を用
いて、対応するカテゴリPN、NPおよび訳に変換する
。ここでは、熟語辞書が単語辞書(二優先して適用され
る。次に得られたカテゴリPN、NP(二ついて9文法
規則とマツチングをとる。PNのみが、■にマツチング
し、 P N −+ NPの変換が行なわれ、NP、V
Pとなる。次に再び文法規則とマツチングをとる。今度
は、■にマツチングし。
d)の単語および熟語を、単語辞書および熟語辞書を用
いて、対応するカテゴリPN、NPおよび訳に変換する
。ここでは、熟語辞書が単語辞書(二優先して適用され
る。次に得られたカテゴリPN、NP(二ついて9文法
規則とマツチングをとる。PNのみが、■にマツチング
し、 P N −+ NPの変換が行なわれ、NP、V
Pとなる。次に再び文法規則とマツチングをとる。今度
は、■にマツチングし。
NP、VP、Sの変換が行なわれ、訳文〔私′は風邪を
引く〕が得られる。
引く〕が得られる。
第5図の例は、入力文(■tak6my d、1cti
on、ary)がt a、k eの多義語性〔捕える。
on、ary)がt a、k eの多義語性〔捕える。
取る〕により、■の寸d;關印1の論田l−松1.ハで
竿I II百イ1“Ioの胛再r十山キス)を採用した
ため、誤訳〔私は私の辞相:を捕える〕となったもので
ある。
竿I II百イ1“Ioの胛再r十山キス)を採用した
ため、誤訳〔私は私の辞相:を捕える〕となったもので
ある。
この場合、■Vl (BC)、NP(AA)−→VPと
いう文法規則を新たにつくり、これを■に優先させて適
用させるならば、訳語〔取る〕と〔辞書〕を連結するこ
とができ、第6図に示すように、正しい訳文〔私は私の
辞書を取る〕を得ることができる。
いう文法規則を新たにつくり、これを■に優先させて適
用させるならば、訳語〔取る〕と〔辞書〕を連結するこ
とができ、第6図に示すように、正しい訳文〔私は私の
辞書を取る〕を得ることができる。
本発明では、この■のような語依存性の文法規則を辞書
側(二格納するものであって、第7図はその実施例を示
す。ラベル欄は、汎用規則中の連係適用すべき部分集合
(部分文法)のラベルを表わし、#■は、第3図(C)
中の文法規則■の前に適用すべきことを表わしている。
側(二格納するものであって、第7図はその実施例を示
す。ラベル欄は、汎用規則中の連係適用すべき部分集合
(部分文法)のラベルを表わし、#■は、第3図(C)
中の文法規則■の前に適用すべきことを表わしている。
優先度は、その適用上の優先度を表わす。
第8図は1本発明実施例システムの構成図である。同図
1−おいて、8は入力部、9は辞書処理部。
1−おいて、8は入力部、9は辞書処理部。
10は単語辞書、10aは語依存性規則、11は熟語辞
書ファイル、12は構文解析部、13は汎用17A 只
り / ノ 1 ノV、15 α 、
工 3B、=゛ は K 用 ム九 只りの部分集合
、14は出力部を表わす。
書ファイル、12は構文解析部、13は汎用17A 只
り / ノ 1 ノV、15 α 、
工 3B、=゛ は K 用 ム九 只りの部分集合
、14は出力部を表わす。
辞書処理部9は、入力部8から入力された原文について
第1図の場合と同様に、単語辞書ファイル10.熟語辞
書ファイル11を用いて、辞書引き処理を行なう。この
場合1語が語依存性規則10zを含むものについては、
そのラベル、優先度、規則も併せて構文解析部12へ供
給する。
第1図の場合と同様に、単語辞書ファイル10.熟語辞
書ファイル11を用いて、辞書引き処理を行なう。この
場合1語が語依存性規則10zを含むものについては、
そのラベル、優先度、規則も併せて構文解析部12へ供
給する。
構文解析部12の基本的機能は、第4図で説明した従来
例と同様である。しかし、単語辞書16から読み出した
語依存性規則10.zk、汎用規則に連係させる処理が
必要であるため、同ブロック内にフローで表示されてい
る機能をもっている。
例と同様である。しかし、単語辞書16から読み出した
語依存性規則10.zk、汎用規則に連係させる処理が
必要であるため、同ブロック内にフローで表示されてい
る機能をもっている。
汎用規則の部分集合13α、13A、・・・のいずれか
に制御が渡っているとき、まずその部分集合のラベルと
、辞書処理部9から供給された語依存性規則の1つのラ
ベルとのマツチングをとる。た゛とえば第7図の例では
、汎用規則の部分集合■を実行する段階で1語依存性規
則#■のラベルとマッチンクスる。ラベル間のマツチン
グが成功したとき。
に制御が渡っているとき、まずその部分集合のラベルと
、辞書処理部9から供給された語依存性規則の1つのラ
ベルとのマツチングをとる。た゛とえば第7図の例では
、汎用規則の部分集合■を実行する段階で1語依存性規
則#■のラベルとマッチンクスる。ラベル間のマツチン
グが成功したとき。
その優先度表示にしたがって1語依存性規則を汎用規則
の部分集合内(二挿入する。他方、マツチングが不成功
であったときで、しかも、祉依存性規則に残りがある場
合C二は、そのラベルとのマツチングをとる。そしてマ
ツチング成功の」場合およびマツチングすべき語依存性
規則力;なし′X場合(−レよ。
の部分集合内(二挿入する。他方、マツチングが不成功
であったときで、しかも、祉依存性規則に残りがある場
合C二は、そのラベルとのマツチングをとる。そしてマ
ツチング成功の」場合およびマツチングすべき語依存性
規則力;なし′X場合(−レよ。
その部分集合にしたがって文法規則を実行する。
このようにして、得られた訳文は、出力部14から出力
される。
される。
以上述べたように1本発明によれレイ、文法規@1]の
構成が単純化され、かつその数カー減少されるため、シ
ステムのコストを低減すること力;でき、更(=翻訳精
度を向上させることが容易とな0.力1つ処理時間を短
縮することができる0
構成が単純化され、かつその数カー減少されるため、シ
ステムのコストを低減すること力;でき、更(=翻訳精
度を向上させることが容易とな0.力1つ処理時間を短
縮することができる0
第1図は従来の翻訳処理システムの構成1菌、第2図は
文法規則の構成例を示す図、第3図<a)+ (b)。 (C)はそれぞれ単語辞書、熟語辞書1文f1モ規貝1
]の内容例を示す図、第4図および第5!図)ま5惜文
角予析<−理例を示す図、第6図は本発明の原理(−も
と−づく構文解析例を示す図、第7図をま本発明(=も
とづく単語辞書の内容例を示す図、第8図[ま本発明実
施例システムの構成図である。 図中、8は入力部、9は辞書処理部[S、1(Hま単語
辞書ファイル、10αは語依存性規貝11.1.1)ま
熟語辞書、12は構文解析部、13しよ汎用規貝11フ
ァイル、13α、13hは汎用規II+の部分集合。 14は出力部を表わす。 特許出願人 富士通株式会社 代理人弁理士 長谷用 文 廣 (外1名)72図 才+m f5層 tcn すδm
文法規則の構成例を示す図、第3図<a)+ (b)。 (C)はそれぞれ単語辞書、熟語辞書1文f1モ規貝1
]の内容例を示す図、第4図および第5!図)ま5惜文
角予析<−理例を示す図、第6図は本発明の原理(−も
と−づく構文解析例を示す図、第7図をま本発明(=も
とづく単語辞書の内容例を示す図、第8図[ま本発明実
施例システムの構成図である。 図中、8は入力部、9は辞書処理部[S、1(Hま単語
辞書ファイル、10αは語依存性規貝11.1.1)ま
熟語辞書、12は構文解析部、13しよ汎用規貝11フ
ァイル、13α、13hは汎用規II+の部分集合。 14は出力部を表わす。 特許出願人 富士通株式会社 代理人弁理士 長谷用 文 廣 (外1名)72図 才+m f5層 tcn すδm
Claims (1)
- 【特許請求の範囲】 自然言語の翻訳処理システムにおいて9語毎に語依存性
の文法規則を包含する辞書ファイルと。 該辞書ファイルを用いて入力文中の各語について辞書引
き処理を行ない、訳語等とともに語依存性文法規則を組
み合わせて出力する辞書処理部と。 汎用文法規則ファイルと1文法規則を用いて上記辞書引
き処理された入力文の構文解析を行なう構文解析部・と
をそなえ、該構文解析部は1文法規則の適用に際して、
汎用文法規則に語依存性規則を組み合わせて実行するこ
とを特徴とする翻訳処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57229498A JPS59121574A (ja) | 1982-12-28 | 1982-12-28 | 翻訳処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57229498A JPS59121574A (ja) | 1982-12-28 | 1982-12-28 | 翻訳処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59121574A true JPS59121574A (ja) | 1984-07-13 |
Family
ID=16893108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57229498A Pending JPS59121574A (ja) | 1982-12-28 | 1982-12-28 | 翻訳処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59121574A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
JPS63143669A (ja) * | 1986-12-05 | 1988-06-15 | Matsushita Electric Ind Co Ltd | 構文解析装置 |
US5396419A (en) * | 1991-09-07 | 1995-03-07 | Hitachi, Ltd. | Pre-edit support method and apparatus |
-
1982
- 1982-12-28 JP JP57229498A patent/JPS59121574A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
JPH0415504B2 (ja) * | 1983-04-28 | 1992-03-18 | Nippon Electric Co | |
JPS63143669A (ja) * | 1986-12-05 | 1988-06-15 | Matsushita Electric Ind Co Ltd | 構文解析装置 |
US5396419A (en) * | 1991-09-07 | 1995-03-07 | Hitachi, Ltd. | Pre-edit support method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hays | Dependency theory: A formalism and some observations | |
JPH0335354A (ja) | 機械翻訳装置における略称付き固有名詞処理方法 | |
EP0266001A3 (en) | A parser for natural language text | |
JPH02165378A (ja) | 機械翻訳システム | |
JPH02281372A (ja) | 機械翻訳装置における挿入副詞句処理方法 | |
Gehlot et al. | Hindi to English transfer based machine translation system | |
JPS59121574A (ja) | 翻訳処理方式 | |
Tomita | Feasibility study of personal interactive machine translation systems | |
JP2007133905A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Carter | Lattice-based word identification in CLARE | |
JPH0715691B2 (ja) | 自動翻訳装置 | |
JP4033088B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JPH041852A (ja) | 機械翻訳装置 | |
JPH05151255A (ja) | 日本語入力方法 | |
Tsujii | The current stage of the Mu-Project | |
Garje et al. | English to Marathi Rule Based Machine Translation of Simple Assertive Sentences | |
Saha | Bangla sentence parsing using traditional parser | |
JPS61115171A (ja) | 機械翻訳システム | |
JPH04112366A (ja) | 自然言語文解析装置 | |
JPS6055468A (ja) | 多言語解析装置 | |
JPH1166069A (ja) | 機械翻訳装置 | |
Thao et al. | Mhong Language Council Conference (University of Minnesota, Minneapolis, August 12-14, 1982). Interim Report. | |
JPH10269221A (ja) | 未登録語処理方式 | |
JPS63180172A (ja) | 機械翻訳装置 | |
JPH02281374A (ja) | 機械翻訳装置におけるハイフン合成語処理方法 |