JPH0512329A - 機械翻訳方式 - Google Patents

機械翻訳方式

Info

Publication number
JPH0512329A
JPH0512329A JP3165732A JP16573291A JPH0512329A JP H0512329 A JPH0512329 A JP H0512329A JP 3165732 A JP3165732 A JP 3165732A JP 16573291 A JP16573291 A JP 16573291A JP H0512329 A JPH0512329 A JP H0512329A
Authority
JP
Japan
Prior art keywords
sentence
result
generation
language
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3165732A
Other languages
English (en)
Inventor
Shogo Shibata
昇吾 柴田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3165732A priority Critical patent/JPH0512329A/ja
Priority to US07/738,118 priority patent/US5369574A/en
Priority to DE69130246T priority patent/DE69130246T2/de
Priority to EP91307012A priority patent/EP0469884B1/en
Publication of JPH0512329A publication Critical patent/JPH0512329A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 翻訳文を読みやすいものとする。 【構成】 本発明では、原文を入力する入力部81と、
入力された原文を解析して意味表現を出力する構文解析
装置82及び意味解析装置83と、生成される翻訳文が
満たすべき制約を記憶する制約保持部8と、制約保持部
8に記憶されている制約に基づいて、意味表現から文を
生成する文生成部2と、文生成部2の生成結果を記憶す
る結果保持部3と、結果保持部3に記憶された翻訳文を
出力する出力部85と、結果保持部3に記憶された結果
を評価する結果評価部4と、結果評価部4による評価に
基づいて制約保持部8に記憶されている制約を変更する
制御部7とを具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された第1言語の
文を第2言語の文に翻訳する機械翻訳方式に関するもの
である。
【0002】
【従来の技術】従来、機械翻訳方式では、入力された第
1言語の文を解析して意味表現に変換し、この意味表現
から第2言語の文を生成する方法がとられている。この
場合、従来の文を生成する方法では、一般にその生成プ
ロセスは、与えられた意味表現に対して、文法ルールな
どに従って文の語順を決定し、表層の語句を選択して出
力するという手順で行われていた。
【0003】
【発明が解決しようとしている課題】しかしながら、上
記従来の生成プロセスでは、文全体から部分へと生成し
ているため、部分の生成をしている時には広く全体を見
渡すことができない。
【0004】従って、生成される文では、部分としては
正しく生成できたとしても、文全体としてのバランスが
考慮されていなかった。
【0005】このため、従来の生成方法では、文を組み
立てていくにつれて矛盾や不自然さが生じ、文法的に誤
りはないものの、人間にとって読みにくい文が生成され
る場合があった。
【0006】特に、機械翻訳システムにおいて、従来の
方法で生成され、出力される第2言語の文が、システム
のユーザーの母国語でない場合には、かかる読みにくさ
に気づきにくいという問題があった。
【0007】また、ユーザーが出力文の読みにくさに気
づいたにしても、更に、どの部分をどのように修正すれ
ば良いかを判断するには、高度の言語知識・能力を必要
とするうえ、実際に出力文をユーザーが頻繁に修正する
となれば、ユーザーの負荷が高くなる。
【0008】本発明の目的は、上述の欠点を除去し、読
みやすい訳文を生成可能な機械翻訳方式提供することに
ある。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、本発明機械翻訳方式では、第1言語の文を入力する
入力手段と、該入力手段より入力された第1言語の文を
解析して意味表現を出力する解析手段と、生成される第
2言語の文が満たすべき制約を記憶する制約記憶手段
と、該制約記憶手段に記憶されている制約に基づいて、
前記意味表現から第2言語の文を生成する文生成手段
と、該文生成手段の生成結果を記憶する結果記憶手段
と、該結果記憶手段に記憶された第2言語の文を出力す
る出力手段と、前記結果記憶手段に記憶された結果を評
価する評価手段と、該評価手段による評価に基づいて前
記制約記憶手段に記憶されている制約を変更する変更手
段とを具える。
【0010】上記構成により、第1言語の文を解析して
意味表現とし、意味表現より第2言語の文を生成し、生
成結果を評価して、評価が基準を満たさない場合は、生
成上の制約を変更して第2言語の文の生成を再実行する
ことにより、人間にとって読みやすい訳文を生成するこ
とを可能とする。
【0011】
【実施例】以下、図面を参照して本発明を詳細に説明す
る。
【0012】図8は、一般の機械翻訳システムの構成を
示すブロック図である。
【0013】同図において、81は第1言語の文を入力
する入力部、82は入力された第2言語の文を構成する
各単語の品詞などを知り、文の構造を解析する構文解析
装置である。日本語のように、文を構成する単語の区切
りが明確でない言語(膠着語)では、文を単語に分解す
るために、形態素解析も行なうものとする。83は、構
文解析装置82の解析結果から、意味概念の結びつきを
表す図4に示すような意味表現を生成する意味解析装置
である。意味表現として言語特性に依存しない表現を用
いる場合には、第1言語を解析して得られた意味表現か
ら第2言語の文を直接得ることができるが、意味表現が
言語に依存する場合、本意味解析装置は、第1言語を解
析して得られた第1言語の意味表現を、第2言語の意味
表現に変換して出力するものとする。84は、意味解析
装置83の出力する意味表現から第2言語の文を生成す
る文生成装置、85は生成された第2言語の文を出力す
る出力部である。
【0014】図1は、本発明機械翻訳方式の中核をな
す、文生成装置84の一実施例を示すブロック構成図で
ある。
【0015】同図において、1は生成するべき文を意味
表現の状態で保持する意味表現保持部、2(1) 〜(n) は
文の意味表現を受け取って文を生成する一過程である文
生成部、3(1) 〜(n) は文生成部2(1) 〜(n) で生成さ
れた生成結果を保持しておく結果保持部である。
【0016】本実施例では、文生成部2および結果保持
部3はそれぞれn個設けられ、最初の文生成部2(1) が
与えられた意味表現から生成を行ない、その結果を結果
保持部3(1) に保持し、以下、順次各生成部2(m)は前
段の結果保持部3(m-1) より生成を行ない、その結果を
後段の結果保持部3(m) に保持する(m=2,3,…,
n)。特に、結果保持部3(n) は、最終的な出力文が保
持される出力文保持部になる。
【0017】また、4は各文生成部2の生成過程で生成
された中間結果を評価する結果評価部であり、5は結果
評価部4が中間結果の読みやすさを評価するための基準
値を蓄える評価基準値テーブルである。更に、6は生成
過程によってどのような評価をすべきかを指示する評価
タイミングテーブルである。
【0018】また、7は一連の文生成の過程を制御する
制御部であり、8は生成過程で必要なさまざまな制約を
保持している文生成用制約保持部、9は結果評価部4に
よる評価に基づいて文の改良方法を指示する文改良知識
を保持している文改良知識群である。
【0019】図2は、本発明を適用した機械翻訳装置の
ハ−ドウェア構成を説明するものである。
【0020】同図において、10は、図3のフロ−チャ
−トにつき後述する処理手順のためのプログラムを含む
各種プログラムを格納する制御メモリ、11は、かかる
プログラムに従って、各種演算・判断を実行する中央処
理装置であるCPU、12は、与えられた入力文や構文
解析結果、意味表現や生成過程における生成結果などを
保持するなどワ−クメモリとして用いられ、作業に必要
な制約を記憶するRAM、13は文の生成に必要な文法
や辞書などのデータを記憶するディスク、14はキーボ
ードやマウスなどの入力装置、15はCRTなどの表示
装置、16はバスである。
【0021】次に、図1に示す文生成装置の動作につい
て、図3に示すフロ−チャ−トを参照して説明する。
【0022】本実施例の装置は、入力された意味表現か
ら文を生成するものである。説明を具体化するため、例
として図4に示す意味表現を考える。この意味表現は、
文の主要な構成要素の意味的な連絡を示すものである。
【0023】図4に示す意味表現は、『I felt chill t
his morning but I went to my office to take part i
n an urgent conference soI got a high fever.』とい
う内容を表している。
【0024】図3において、まず、ステップs1で意味表
現が入力されたかを判断する。ステップs1は、意味表現
が入力されるまで繰り返す。
【0025】意味表現保持部1に意味表現が入力される
と、ステップs2の生成処理に移る。
【0026】文の生成過程は、n個に分けられており、
対応する文生成部2(1) 〜2(n) による生成処理が順に
実行される。
【0027】ステップs2を行う文生成部2(m) は、文生
成用制約保持部7にあらかじめ与えられた制約を用い
て、この意味表現を処理し、その結果を結果保持部3
(m) に保持する。
【0028】この文生成用の制約とは、文を生成して行
く際に行う選択の方向を規定するもので、テ−ブル形式
で与えられる。その一例を図5に示す。
【0029】制約には、文体など、1文章の生成の途中
で変更されない固定制約と、1文の単語数など、生成の
途中で変更されうる自由制約との2種類がある。制約保
持部7のテーブルには、あらかじめ与えられた自由制約
の初期値と現在値が記入され、更に、その値の履歴情報
も蓄えておく。
【0030】ステップs2が終了すると、ステップs3で生
成結果を評価する。評価は、現在得ている結果に対する
評価値と、あらかじめ与えておいた評価基準値とを比べ
ることによって行なう。この基準値は、読み手のレベル
に応じて設定することができる。
【0031】ここで、評価結果が評価基準値を満たす場
合には、この中間の生成結果を次の生成過程である文生
成部2(m+1) に渡し、文の生成を続ける。
【0032】次に、ステップs4では、全ての生成過程が
終了したか否かを判断するものである。生成過程が終了
した場合には、現在の結果の文を出力してEND となる。
【0033】一方、評価した結果が評価基準を満たして
いなければ、生成をやり直す。再実行により、よい結果
を得るために、制約を変更する。そのために、ステップ
s5へ移る。
【0034】ステップs5では、出力された結果のどこが
不適当でどう改良すべきかを知るために、評価結果に応
じた文改良知識を文改良知識群9より取り出す。
【0035】この例における評価と再生成の推移を図7
に示す。
【0036】まず、最初の生成結果a『I felt chill t
his morning but I went to my office to take part i
n an urgent conference soI got a high fever.』は、
24語となり、評価基準に定められた上限値20語を越
えるので、『文の長さが長い』という評価結果bを得
る。この評価に対する文改良知識を図6に示す。
【0037】文改良知識には、どのように文を改良すべ
きかを表すルールが記入してある。
【0038】例えば、『文の長さが長い』場合には、
「助動詞/ムード決定 処理に関しては語数の少ないも
のを選択する」とか、「関係節処理に関しては、入れ子
の数を減らす」といった改良を施せば良いというルール
が与えられている。
【0039】文改良知識中に書かれたこれらの改良ルー
ルには優先順位がある。
【0040】ステップs6では、ステップs5で取り出した
文改良知識に基づいて、フィードバックをかける先とな
る生成処理における文生成用の制約を変更する。
【0041】この例では、文の長さを短くするために、
「述部決定」処理にフィードバックして、優先順位17
の制約『文章意味表現をまとめる』をオンにする文改良
ルールが最初に使われる。
【0042】ステップs7でフィードバックすべき生成処
理を指定して、ステップs2の生成処理(この場合、述部
決定)に戻る。
【0043】再び、図4の意味表現を見直すと、図7c
の如く、『take part in』という部分が『attend』に言
い換えられることがわかる。この言い換えを行なって再
び文を生成する。新しく生成された文d『I felt chill
this morning but I wentto my office to attend an
urgentconference so I got a high fever. 』は、評価
部で再評価される。
【0044】今度は、22語となり、改善は見られるも
のの、まだ上限値20語を越えているので『文が長すぎ
る』と評価される。
【0045】その評価結果eから、再び図6の文改良ル
ールに従い、今回は、優先順位20の『文中の連接数を
1減らす』というルールに従い、意味表現を分割する制
約をオンにする。
【0046】制約が変更されると、再び、ステップs2に
移る。図4に示す意味表現は、連接を表す『原因』( "
get"と "go" を結ぶもの)で分割される(図7f)。
【0047】ステップs2では、意味表現を分割すること
によって、『I felt chill this morning but I went t
o my office to take part in an urgent conference.S
o I got a high fever.』という文gを生成する。
【0048】そして、生成された文は、再び結果保持部
3に移り、評価を受ける。
【0049】2 つに分割された文は、それぞれ18語及
び6語となり、長さも適当であるので評価基準を満たし
END となる(図7h)。
【0050】[他の実施例]上記実施例では、出力され
る翻訳文が英文である場合を例に取って説明したが、日
本語など、他の言語の文を出力する場合も、それぞれの
言語に対応する評価基準と、制約及び改良知識を用意す
ることにより、上記実施例と同様に、本発明の適用が可
能となる。
【0051】上記実施例では、一文の意味表現を取り出
して処理していたが、複数の文からなる文章全体の意味
表現から一括して文生成を行ない、この生成結果を対象
として、評価を行うとすることも可能である。
【0052】ところで、前記実施例では、生成と評価を
交互に繰り返すため、評価基準が厳しい場合などには、
出力文を得るまでに時間を要する。
【0053】このため、生成と評価を1つのループと考
え、このループの実行回数の上限をあらかじめセットし
ておき、この数をオーバーした場合には強制的に終了す
るようにしてもよい。
【0054】更にまた、前記実施例で用いた評価基準値
は、評価基準値テーブルを書き換えることによって変更
することも可能であり、読み手の英語力などのレヴェル
によって基準値を変更し、様々な読み手に適した英文を
生成できるようになる。
【0055】また、上記のごとくループの制限を回数で
指定するだけではなく、同じ状態の文が生成された場合
にも、無限ループの恐れがあるので、強制的に終了する
ようにしてもよい。
【0056】また、前記実施例では、結果評価部で用い
るルールとして、if- then ルールを用いたが、神経回
路網を利用し、意味表現とそれに対する適切な出力文と
の組を与えて学習を行ない、その学習の結果に基づい
て、評価するようにしてもよい。
【0057】
【発明の効果】以上説明したように、本発明によれば、
生成された第2言語の文が即座に評価され、この結果を
フィードバックすることによって、より『読みやすい』
翻訳文を生成することができる。
【図面の簡単な説明】
【図1】本発明に係る文生成装置の1実施例を示す機能
ブロック図である。
【図2】本発明に係る機械翻訳装置のハードウェア構成
の例を示すブロック図、
【図3】英文生成処理の手順を示すフローチャートであ
る。
【図4】意味表現の例を示す図である。
【図5】文生成で用いる制約の例を示す図である。
【図6】結果評価部で用いるルールの例を示す図であ
る。
【図7】具体的な処理の流れを表す図である。
【図8】本発明を適用した機械翻訳システムの1実施例
を示す機能ブロック図である。
【符号の説明】
1 意味表現保持部 2(1) 〜2(n) 文生成部 3(1) 〜3(n) 結果保持部 4 結果評価部 5 評価基準値テーブル 6 評価タイミングテーブル 7 制御部 8 文生成用制約保持部 9 文改良知識群 10 制御メモリ 11 CPU 12 RAM 13 ディスク 14 入力装置 15 CRT 16 バス 81 入力部 82 構文解析装置 83 意味解析装置 84 文生成装置 85 出力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された第1言語の文を第2言語の文
    に翻訳して出力する機械翻訳方式であって、 第1言語の文を入力する入力手段と、 該入力手段より入力された第1言語の文を解析して意味
    表現を出力する解析手段と、 生成される第2言語の文が満たすべき制約を記憶する制
    約記憶手段と、 該制約記憶手段に記憶されている制約に基づいて、前記
    意味表現から第2言語の文を生成する文生成手段と、 該文生成手段の生成結果を記憶する結果記憶手段と、 該結果記憶手段に記憶された第2言語の文を出力する出
    力手段と、 前記結果記憶手段に記憶された結果を評価する評価手段
    と、 該評価手段による評価に基づいて前記制約記憶手段に記
    憶されている制約を変更する変更手段とを具え、変更さ
    れた制約に基づいて、前記第2言語の文の生成を再実行
    するように制御することを特徴とする機械翻訳方式。
  2. 【請求項2】 前記文生成手段は、各々が文生成処理の
    一部を実行する複数の部分生成手段を有し、前記評価手
    段は、当該複数の部分生成手段の各々による生成結果を
    評価することを特徴とする請求項第1項記載の機械翻訳
    方式。
JP3165732A 1990-08-01 1991-07-05 機械翻訳方式 Pending JPH0512329A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP3165732A JPH0512329A (ja) 1991-07-05 1991-07-05 機械翻訳方式
US07/738,118 US5369574A (en) 1990-08-01 1991-07-30 Sentence generating system
DE69130246T DE69130246T2 (de) 1990-08-01 1991-07-31 System zur Bildung von Sätzen
EP91307012A EP0469884B1 (en) 1990-08-01 1991-07-31 Sentence generating system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3165732A JPH0512329A (ja) 1991-07-05 1991-07-05 機械翻訳方式

Publications (1)

Publication Number Publication Date
JPH0512329A true JPH0512329A (ja) 1993-01-22

Family

ID=15818026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3165732A Pending JPH0512329A (ja) 1990-08-01 1991-07-05 機械翻訳方式

Country Status (1)

Country Link
JP (1) JPH0512329A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010113691A1 (ja) * 2009-03-30 2010-10-07 日本電気株式会社 言語解析装置、方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010113691A1 (ja) * 2009-03-30 2010-10-07 日本電気株式会社 言語解析装置、方法、及びプログラム
CN102369524A (zh) * 2009-03-30 2012-03-07 日本电气株式会社 语言分析装置、语言分析方法和语言分析程序
JP5464209B2 (ja) * 2009-03-30 2014-04-09 日本電気株式会社 言語解析装置、方法、及びプログラム
US8977539B2 (en) 2009-03-30 2015-03-10 Nec Corporation Language analysis apparatus, language analysis method, and language analysis program

Similar Documents

Publication Publication Date Title
US8515733B2 (en) Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language
US4833611A (en) Machine translation system
Stenzhorn Xtragen-a natural language generation system using xml-and java-technologies
JPH0682377B2 (ja) 感情情報抽出装置
Arwidarasti et al. Converting an Indonesian constituency treebank to the Penn treebank format
JPH0512329A (ja) 機械翻訳方式
JPS6180362A (ja) 翻訳装置
JP2632806B2 (ja) 言語解析装置
JPS61260366A (ja) 学習機能付機械翻訳システム
Pretorius et al. Finite-state computational morphology-treatment of the zulu noun
JP3192415B2 (ja) 文生成方式
JPS63136265A (ja) 機械翻訳装置
KR20220050496A (ko) 서술 텍스트로부터 대화 텍스트를 자동으로 만드는 장치 및 그 방법
JP3003459B2 (ja) プログラム作成支援装置
JPS6180359A (ja) 翻訳装置
JPH0410665B2 (ja)
Bateman et al. The use of syntactic annotaion tools: partial and full parsing
JPH03222069A (ja) 機械翻訳装置
Huiskens et al. Developing a tool for the description of language acquisition
JP3233800B2 (ja) 機械翻訳装置
JPS62209659A (ja) 日本語文章校正装置
JPS6190268A (ja) 翻訳方式
Klein et al. Construction and annotation of test-items in DiET
JPS61265673A (ja) 翻訳方式
JPH09185623A (ja) 言語処理装置及び方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020618