JPH0443462A - 翻訳後校正支援システム - Google Patents

翻訳後校正支援システム

Info

Publication number
JPH0443462A
JPH0443462A JP2150623A JP15062390A JPH0443462A JP H0443462 A JPH0443462 A JP H0443462A JP 2150623 A JP2150623 A JP 2150623A JP 15062390 A JP15062390 A JP 15062390A JP H0443462 A JPH0443462 A JP H0443462A
Authority
JP
Japan
Prior art keywords
language
translation
grammatical
translated
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2150623A
Other languages
English (en)
Inventor
Yoshitoku Arai
荒井 良徳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2150623A priority Critical patent/JPH0443462A/ja
Publication of JPH0443462A publication Critical patent/JPH0443462A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 1先立夏 本発明は、翻訳後校正支援システムに関する。
丈米に先 翻訳後の校正には、誤訳、訳し洩れ、訳語の統一のチェ
ックなどの第1言語による原文と第2言語による訳文が
密接に関連している作業と、訳文のみに対してスペルミ
スや読みにくさなどのチェックをする作業に分けられる
。従来の校正支援システムは、後者のみを支援し、前者
に対しては、人間に頼らざるを得なかった。
一方、機械翻訳は第1言語から第2言語に変換するが、
全てを正しく変換することは現状の技術では不可能であ
り、指定訳語が必ず使われるなどの特徴はあるものの、
基本的には翻訳作業を支援しているに過ぎず、校正が必
要となってしまう。
また、機械翻訳の辞書構築などのために、対応する2つ
の文書から原文単語と訳語を抽出するということも考え
られていたが、これは機械翻訳のための支援であった。
■−−煎 本発明は、上述のごとき実情に鑑みてなされたもので、
翻訳後の校正において、原文と訳文を互いに参照しなが
ら進行しなければならないようないわば翻訳後特有の校
正において、第1言語による原文文書と第2言語による
訳文文書を、言語特性まで対応比較することによって校
正が可能となり、この言語特性の対応を機械翻訳の技術
を利用することによって、容易に翻訳後の校正を支援す
るようにした翻訳後校正支援システムを提供することを
目的としてなされたものである。
1−一皮 本発明は、上記目的を達成するために、第1言語から第
2言語に翻訳された文章に対して翻訳後特有の訳語の統
一、訳し洩れ、誤訳などのチェックを行なう校正をする
翻訳後校正支援システムにおいて、第1言語の文法的特
性を、第2言語の文法的特性を利用して解析するか、又
は第2言語の文法的特性を、第1言語の文法的特性を利
用して解析し、更に第2言語の文法的特性もしくは第1
言語の文法的特性を解析して両言語の文法的特性を照合
比較することにより、翻訳後の校正を支援することを特
徴としたものである。以下、本発明の実施例に基づいて
説明する。
ここでは、英語から日本語への翻訳結果を前提として説
明するが、本発明は特にこれに限定されるものではない
第1図は、本発明による翻訳後校正支援システムの一実
施例を説明するためのフローチャートである。
本発明における翻訳後校正においては、原文文書と訳文
文書が必ずあり、これらはほぼ対応しているものである
。しかし翻訳という性格上、直訳とは限らないし、2文
が1文になったり、1文が2文になったり、新たに追加
されたりもする。まず、原文文書と翻訳後の訳文文書と
を各々文の分割を行い(Stepl 、 2) 、各々
分割された文の対応をチェックする(Step 3 )
。次に文法の対応をチェックする(Step4 )。更
に次の文に対して同様に対応をチェックしていく。すな
わち、原文文書の言語の文法的特性を、訳文文書の言語
の文法的特性を利用して解析するが、または逆に、訳文
文書の言語の文法的特性を、原文文書の言語の文法的特
性を利用して解析する。更に、訳文文書の言語の文法的
特性もしくは原文文書の言語の文法的特性を解析して両
言語の文法的特性を照合比較する。
第2図は、文の対応チェックを行うためのフローチャー
トで、以下、各ステップに従って順に説明する。
扛弘上;まず、原文中のn番目の文書と、訳文中のm±
i番目のいずれかの文章との単語数をカウントする。
畦吐又;カウントされた単語数を比較する。
畦吐主;単語数の比較で対応していると認められればキ
ーワードの抽出を行う。
社吐土;次に、キーワードの辞書引きを行う。
旦堕旦5キーワードの比較を行う。対応していれば、今
度は文法の対応をチェックする。
麩肚旦;前記5tep 2において単語数が対応してい
ない場合、あるいは5tep 5において、キーワード
が対応していない場合には、iが2以上か以下かを判断
する。
1す2j−;i<=2であれば、i=i+1番目の訳文
中の文章を対象とする。
コ」■」−; i > 2であれば、チェックレポート
を作成する。
社笠旦; n = n + 1番目の原文中の文章を対
象とし、次の文の対応チェックを行う。
このような前記ステップの処理に基づいて、第4図(a
)、(b)に示した原文と訳文の例について以下に説明
する。図(a)は原文、図(b)は訳文の例である。
まず、原文文書の第1文”Till1e flies 
1ike anarrow、”と、訳文文書の第1文′
′この文は日本語である。″につぃて文と文が対応して
いるが比較を行なう。
原文での’ Time″′は、′″時、時間°′などの
訳番こなる事は辞書を検索すれば分かるが、これらの訳
は訳文の方には現われないし、” f i l j e
 s ”111ekeII 、  arrow”に対す
る訳語も呪われてこないので、この場合は原文と訳文の
画文は対応していないと思われる。
文と文の比較の方法はこれにとどまらず、単語数の比較
を行う。例えば、原文が5単語であるのに対し、訳文が
20単語であれば、原文が融合して訳文になっているな
どから対応していないと予想される。前記のようなキー
ワード訳語対比(原文の単語に対する第2言語の訳、及
び訳文の単語に対する第1言語の訳の両方が考えられる
)なども考えられる。
次に、原文の第1文に対し、訳文の第2文を比較する。
この場合も前後2文まで見たりすることなども十分考え
られる。この例では、原文第1文と訳文第2文″時は矢
のように飛ぶものである′″が単語数も許容範囲内であ
るし、単語状に関しても十分に対応しているように思わ
れる0例えば、原文の単語数は5単語であるが、冠詞を
除けば4つになる。原文1文中に現われる単語数の0.
7〜1.5倍をしきい値としておけば、この例での訳文
1文中の単語数は、6単語(文節)であるので十分その
範囲内となる。また、“Time”に対して“時”、“
flies”に対して“飛ぶ71 、  jllike
llに対してパように″が対応しており、5単語中この
時点で半数以上の3単語の表層的な対応が可能であると
思われる。このように両者のしきい値をクリアしている
場合のみを対応すると思うが、各ステップで評価関数を
設け、最終的に評価値で判断するかなどいくつかの方法
が考えられる。
第3図は、文法の対応チェックを行うためのフローチャ
ートで、以下、各ステップに従って順に説明する。
まず、原文について形態素解析を行い(stepl)、
次に構文解析を行い(step 2 ) 、変換処理(
step3) L/て構文木を得る。一方訳文について
も同様に形態素解析、構文解析を行い(step4 。
5)、原文と訳文の構文木を比較しく5tep 6 )
、対応していなければチェックレポートを作成しく5t
ep 7 ) 、対応していれば用語対応レポートを作
成する(step 8 )。
このように各ステップの処理により、表層的には対応し
ていると思われたこれら同文に対して、文法的特性まで
の対応を検討する。原文に対して形態素解析、構文解析
などにより、その文法特性を解析する。更に変換、生成
などの技術により第2言詔の特性までも調べておく。但
し、機械翻訳とは違い、訳文を出すことを目的とせず、
第2言語から見た原文の文法特性を抽出することが目的
である事を考慮すれば、変換まででも十分である。
また、解析時に曖昧となる係り受は先や品詞同定などは
訳文を参考にすれば十分に絞り込めることができる。
例えば、ここでは原文に対して、″時節は矢が好きだ′
、時は矢のように飛ぶ″、矢のよう番こ蝿を計れ″、矢
のような蝿を計れ″、矢のような時節″′と言う第2言
語の生成が形態素解析、構文解析、変換、生成によって
可能である。
この時、訳文を形態素解析すれば、時・・・名詞、形容
詞、飛ぶ・・・動詞などとなる。また、原文を形態素解
析した時点では、time・・・名詞、動詞、flie
s・・名詞、動詞・・・・・・などとなる。第2言語を
本とする場合、  ”time”に対して辞書検索によ
り訳語は訳文の″時″という名詞の単語が対応しそうな
ことが表記上予想される。そうすれば、原文の形態素解
析での多義解消の一要因となり、”time”が名詞と
なるパ時は矢のように飛ぶシか解析されなくなる。LL
timeHに対して″時″′という名詞の単語が対応し
そうなことは表記上の予想であり、この情報により解析
がうまく出来ない場合もあるが、更に他の表記上から予
想される制約を次々と利用していけばよい。
この実施例では、原文の形態素解析に於いて訳語からの
情報を用いることにより得られた原文の第2言語の構造
と、訳文の形態素解析結果の構造を対応させれば良いこ
とになる。
これには、形態素レベルと辞書検索による対訳語により
判断することも可能であるが、訳文を形態素解析にとど
めず構文解析までをして、原文から変換された第2言語
の構造水と、訳文から解析された第2の構造水を比較す
ることにより対応付けすることも可能となる。
ここでは、第2言語を基本として例を上げたが、第1言
語を基本として訳文を形態素解析、構文解析、変換し、
第1言語の構文木と、原文を形態素解析、構文解析して
得られる第1言語の構文木を比較対応付けしても良い。
原文と訳文との対応は1文法特性がきっちりと対応され
る場合はそれらの文がかなり直訳調か、もしくは解析プ
ログラムの性能がかなり良い場合に限られてしまう。
しかし、文法特性が逐一対応していない場合は、前述の
ように変換木と形態素情報により対応を付けてもよいし
、それでも対応しない場合には、第1言語の形態素情報
と第2言語の形態素情報のみを用いて対応付けしてもよ
い。どのレベルで対応させるかは、ステップを踏んだり
、評価関数を用いたりすることが考えられる。
この実施例においても、訳文の中の″ものである″は原
文と対応付けされない。このような場合は、ユーザへの
警告レベルを低くしてチェックしてもよい。チェックさ
れた項目はバッファなどにためておき、チェックレベル
毎もしくはテキスト順で表示もしくは印刷などをするか
、チェック時点でその都度ユーザに表示し、修正を促す
などをする。 このように原文と訳文の文法構造がある
程度対応付けされた場合、原文の単語に対して訳文の訳
語に何が使われたか分かるので、これらの統計を取れば
訳語が統一されているかをチェックすることが可能とな
る。
また、前述のように文と文とがまるっきり対応しなく、
浮いてしまうような原文や訳文があれば、訳し洩れもし
くは新規文追加の可能性がある。
また、前後の文は対応しているが、注目の文はまるっき
り対応しない場合は、誤訳の可能性がある。
このように、第1言語から第2言語へ翻訳する機械翻訳
技術はまだ未成熟であり正しくない結果を生むが、第1
言語と第2言語から文法特性を抽出することは多義など
のあいまいさを解消することになり実用可能な技術とな
る。これを翻訳後の校正に利用し、訳語の統一、訳し洩
れ、誤訳のチェックなど、従来人間でしか出来なかった
ような作成が十分機械により実現可能となる。
豊−一來 以上の説明から明らかなように、本発明によると、第1
言語による原文文書と第2言語による訳文文書を、言語
特性まで対応比較することによって、翻訳後特有の校正
を支援することができる。
【図面の簡単な説明】
第1図は、本発明による翻訳後校正支援システムの一実
施例を説明するためのフローチャート、第2図は、文の
対応をチェックするためのフローチャート、第3図は1
文法の対応をチェックするためのフローチャート、第4
図は1M文と訳文の例を示す図である。 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 1、第1言語から第2言語に翻訳された文章に対して翻
    訳後特有の訳語の統一、訳し洩れ、誤訳などのチェック
    を行なう校正をする翻訳後校正支援システムにおいて、
    第1言語の文法的特性を、第2言語の文法的特性を利用
    して解析するか、又は第2言語の文法的特性を、第1言
    語の文法的特性を利用して解析し、更に第2言語の文法
    的特性もしくは第1言語の文法的特性を解析して両言語
    の文法的特性を照合比較することにより、翻訳後の校正
    を支援することを特徴とする翻訳後校正支援システム。
JP2150623A 1990-06-08 1990-06-08 翻訳後校正支援システム Pending JPH0443462A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2150623A JPH0443462A (ja) 1990-06-08 1990-06-08 翻訳後校正支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2150623A JPH0443462A (ja) 1990-06-08 1990-06-08 翻訳後校正支援システム

Publications (1)

Publication Number Publication Date
JPH0443462A true JPH0443462A (ja) 1992-02-13

Family

ID=15500912

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2150623A Pending JPH0443462A (ja) 1990-06-08 1990-06-08 翻訳後校正支援システム

Country Status (1)

Country Link
JP (1) JPH0443462A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093170A (ja) * 2008-10-10 2010-04-22 Toyota Motor Corp 半導体装置の製造方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093170A (ja) * 2008-10-10 2010-04-22 Toyota Motor Corp 半導体装置の製造方法

Similar Documents

Publication Publication Date Title
JP3906356B2 (ja) 構文解析方法及び装置
US6470306B1 (en) Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
KR101084786B1 (ko) 트리 서열화 컴포넌트를 저장하는 컴퓨터 판독가능 기록매체
US20050171757A1 (en) Machine translation
EP1349079A1 (en) Machine translation
US7752033B2 (en) Text generation method and text generation device
Lenci et al. Multilingual Summarization by Integrating Linguistic Resources in the MLIS-MUSI Project.
WO1997048058A1 (en) Automated translation of annotated text
WO1997048058A9 (en) Automated translation of annotated text
JPH0443462A (ja) 翻訳後校正支援システム
JP2632806B2 (ja) 言語解析装置
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
May et al. Surprise! What's in a Cebuano or Hindi Name?
Eineborg et al. ILP in part-of-speech tagging—an overview
JP4708682B2 (ja) 対訳単語対の学習方法、装置、及び、対訳単語対の学習プログラムを記録した記録媒体
JP2521435B2 (ja) 日本語生成装置
JP2719453B2 (ja) 機械翻訳装置
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
KR100333681B1 (ko) 용언 중심 문틀을 이용한 자동 번역 장치 및 그 방법
JP2901977B2 (ja) 翻訳装置
JPH04296969A (ja) 機械翻訳装置
Minghui et al. A knowledge-based system for Chinese NLP
Stamatatos et al. 5HOHYDQW: RUN
Suganthi et al. Rule based Approach for Prepositional Phrase Attachment in English-Tamil Translation