JP3273782B2 - 機械翻訳方法 - Google Patents

機械翻訳方法

Info

Publication number
JP3273782B2
JP3273782B2 JP27629590A JP27629590A JP3273782B2 JP 3273782 B2 JP3273782 B2 JP 3273782B2 JP 27629590 A JP27629590 A JP 27629590A JP 27629590 A JP27629590 A JP 27629590A JP 3273782 B2 JP3273782 B2 JP 3273782B2
Authority
JP
Japan
Prior art keywords
sentence
role
translation
document
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27629590A
Other languages
English (en)
Other versions
JPH04152466A (ja
Inventor
敦子 小泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP27629590A priority Critical patent/JP3273782B2/ja
Publication of JPH04152466A publication Critical patent/JPH04152466A/ja
Application granted granted Critical
Publication of JP3273782B2 publication Critical patent/JP3273782B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、同じ文書の中でも文脈によって訳し方をか
える必要がある文書の翻訳に好適な機械翻訳システムに
関する。
〔従来の技術〕
自然言語文では、1つの表現形式に対して複数の解釈
が成り立つ場合がある。例えば、日本語の「〜するこ
と」に対しては、命令文という解釈と名詞句という解釈
が成り立つ。また、同じような意味を表現する複数の表
現形式があり、基本的な意味は同じだがニュアンスがか
わるということがある。自然言語間の翻訳においては、
文書の性格や個々の文の文脈を考慮して、原文の意図に
あつた解釈、訳出形式を選択する必要がある。
従来の機械翻訳システムでは、この問題に対処するた
めに、次のような方法を用いている。
(1) 特願昭59−201113号記載のように、ユーザが文
ごとに文体を指定するという方法。
(2) 特開昭62−143178号記載のように、文書中のど
こからどこまでが見出し、小見出し、本文かということ
をユーザが指定するとそれに適した訳し方をするという
方法。
(3) 特願昭62−15138号に記載のように、1つの表
現に対応する複数の訳し方や訳出例をシステムが表示
し、ユーザが望ましいと思うものを選択すると、文書全
体を通して指定通りに訳されるように文法群を切り替え
るという方法。
文書を通して訳し方が1つに決められるような場合
は、(3)の方法が有効である。しかし、1つの文書の
中でも文脈を考慮して訳し分ける必要がある場合は、
(1)の方法で1文ずつ訳し方を指定するか、(2)の
方法で文書を区分けしておく必要がある。
システムが自動的に訳し分けを行う方法としては、広
瀬他:「英日機械翻訳システムATLAS/Iにおける原文形
式解析」情報処理学会第28会全国大会予稿集pp.903−90
4(1984)で、原文形式によって文種を判定し、訳し分
けを行うことが提案されている。例えば、章や節の見出
しの形式(例えば「1.1〜」)を認識し、章や節の見出
しであれば名詞句として解析する。しかし、翻訳対象文
の文書中での役割が翻訳対象文自身の形式的な特徴のみ
から判定できるのは、タイトルなど、ごく限られた範囲
のものである。また、文種の判定基準や訳し方をユーザ
が指定する手段を持たないため、タイトルと文の区別の
ように、ごく一般的なものに限られる。
〔発明が解決しようとする課題〕
本発明の目的は、機械翻訳システムにおいて、文脈条
件によって文体や言い回しの訳し分けを行う機能を高度
化することと、文脈条件の設定とその判定方法、それに
よる訳し分け方法の指定をユーザが容易にできるように
し、上記機能の効果を高めることにある。
〔課題を解決するための手段〕
上記目的を達成するために、本発明は、機械翻訳シス
テムにおいて、後続する文あるいは段落の文脈条件を示
す情報を獲得する手段と、該情報を記憶保持する手段
と、文書構造を認識して該情報が示す文脈条件の及ぶ範
囲を決定する手段と、文脈条件を訳し分けの手がかりと
して利用する手段と、何を手がかりにどのような文脈情
報を取得するか、またその文脈によって訳し方をどのよ
うに変えるかをユーザが指定する手段を設けたものであ
る。
〔作用〕
本発明の機械翻訳システムは、訳出オプション指定機
能を選択すると、文脈情報定義画面を表示する。ユーザ
は、ここで、何を手がかりにどのような文脈情報を取得
したら良いかを指定する。次にシステムは、訳出オプシ
ョン指定画面を表示する。訳出オプションの選択肢に
は、優先順位と文脈条件を記入する欄が設けてあるの
で、ユーザは必要に応じて文脈条件付きで訳出オプショ
ンを指定する。訳出オプションの項目は翻訳用文法の1
つのルールに対応し、訳出オプションの選択肢はそのル
ールに含まれるサブルールに対応する。システムは、ユ
ーザが指定した優先順位と文脈条件をもとにサブルール
の適用順序と適用条件を決定し、ルールの中のサブルー
ル適用制御部の情報を書き換える。訳出オプションのす
べての項目についてこの処理を行うことにより、ルール
のカスタマイズが完了する。
次に文書を指定し、翻訳処理機能を選択すると、文頭
より1文ずつ読み込み、文脈情報の取得と翻訳を行う。
後続する文や段落の文脈条件を示す文脈情報を得た場合
は、それを記憶しておき、後で利用する。これにより、
先行する文から文脈条件の手がかりを得ることが可能と
なる。
〔発明の実施例〕
以下、本発明の実施例を図面により詳細に説明する。
第1の実施例として、日本語の文章を英語に翻訳する日
英翻訳システムについて述べる。
(1) システムの構成 第2図に示すように、本実施例の日英翻訳システム
は、プロセッサ1,メモリ2,入力装置3,表示装置4,日本語
テキストフアイル5,英語テキストファイル6,文法ファイ
ル7,辞書ファイル8から成る。5〜8のファイルは、磁
気ディスク、フロッピーディスク、または光ディスク等
の媒体に格納されている。第3図に示すように、メモリ
2には、文脈条件認識プログラム201、翻訳処理プログ
ラム202,文脈条件登録処理プログラム203,訳出オプショ
ン指定登録処理プログラム204,文法調整処理プログラム
205が記憶されており、これらのプログラムはプロセッ
サ1によって実行される。また、メモリ2には、翻訳処
理に必要な日本文テキストエリア206,日本文エリア207,
英文テキストエリア208,英文エリア209のほか、ユーザ
が定義した文脈条件を訳し分けに利用するという、本発
明のシステム特有の機能を実現するために必要な文脈条
件格納エリア210,文書構造・文脈条件定義データ格納エ
リア211,訳出オプション指定データ格納エリア212が設
けられている。
(2) ユーザ定義の文脈条件に基づいて訳し分けを行
なう機能を実現するためのデータ 文書構造・文脈条件定義データ どのようなキーからどのような文書構造・文脈条件を
認識したら良いかを示す定義。第6図に示すような形式
でユーザが定義し、文書構造・文脈条件定義データ格納
エリア211に記憶される。
第6図において、「キー」は、文章の区切りや文脈条
件を認識するためのキーである。キーは、字種や字面で
記述する。たとえば、「NB"・"NB""STR」は、「数字
列,ピリオド,数字列,スペース,文字列」のパターン
とマッチする。例えば、第7図では、S1の「2.6 CANCE
L JOBコマンド」がこのキーと一致する。第6図の定義
により、レベル2の文章の区切りであること、レベル2
の文書構造上の単位(この場合は「節」)のTOPICは「C
ANCEL JOBコマンド」であることを認識する。
訳出オプション指定データ 第1図に示すような形式でユーザが定義し、訳出オプ
ション指定データ格納エリア212に記憶される。第1図
において、「項番」は、翻訳文法中の1つの規則に対応
する。この規則は、主語なしの「〜する。」という表現
形式の解釈と訳し分けを決める規則である。「訳出オプ
ション」の選択肢R1〜R5は、その規則に含まれるサブル
ールに対応する。各サブルールは、1つの表現形式にた
いし、異なる解釈をする。ユーザは、これにたいし、訳
出オプション、すなわちサブルールの優先順位を文脈条
件つきで指定することができる。
文脈条件 文脈条件格納エリア210には、翻訳対象文の文脈条件
を示すものとして次の4種類の情報が記憶される。
(a) カレントレベル(CL) 翻訳対象文が文書構造のどのレベルにあるかを示す。
ここでいう文書構造およびレベルは、文書構造・文脈条
件定義データ格納エリア211に記憶されているユーザ定
義に基づくものである。文書構造上の単位には、章、
節、段落などがある。ユーザ定義により、「章はレベル
1,節はレベル2…」というように対応づけられる。カレ
ントレベルを追うことにより、段落や節の主題・役割を
認識した際に、その情報を適用すべき範囲を知ることが
できる。
(b) 翻訳対象文の文脈条件(TEMP) 文の主題(TOPIC):日本語では、文の主題が文
脈から明らかな場合に省略(ゼロ代名詞化)されること
がある。翻訳においてはそれを復元することが必要な場
合があるので、文脈から文の主題がわかつたらここに記
憶する。
役割(ROLE):定義文、指示文、説明文など、文
の役割によって解釈が変わるような表現形式がある。そ
こで、文脈から判断した文の役割をここに記憶し、訳し
分けに利用する。例えば、主語なしで「ジヨブを打ち切
る。」と言つたとき、それだけでは解釈が1つに決まら
ない。説明文かもしれないし、指示文かもしれない。前
者であれば平叙文、後者であれば命令文で訳すのが良
い。さらに、平叙文の場合、主語を復元して訳した方が
よい場合がある。たとえば、第7図のS3のように、章や
節のトピックセンテンスの主語がタイトルと一致するた
めに省略されているような場合である。
(c) 次の文の文脈条件(NEXT) 文の主題(TOPIC) 文の役割(ROLE) 翻訳対象文の次の文の文脈条件を示すキーが得られた
場合にここに記憶しておく。翻訳対象文の翻訳後、NEXT
の情報をTEMPにシフトする。
(d) 複数文にわたる文脈条件(DISC) 段落や節の主題(TOPIC) 段落や節の役割(ROLE) 文書構造上のレベル(章、節、段落など、ユーザ定義
によるレベル)ごとにの情報を待つ。章、節、段落
が変わると更新される。
第7図の各例文を翻訳する際に文脈条件格納エリア21
0に記憶されている文脈条件の内容を第8図に示す。第
8図において、矢印は情報が引き継がれていることを示
し、Φは情報が削除されることを示す。
(3) 文脈条件による訳し分けの処理の流れ 第4図は、本実施例の日英翻訳システムにおける文脈
条件による訳し分けのプロセスを示すフローチャートで
ある。以下、第4図のフローに従つて本実施例の動作を
説明する。
(文書の指定) まず、システムは対象文書名・文書タイプ入力画面を
表示し(ステップ401)、ユーザが対象文書の文書名と
文書タイプを指定すると、翻訳対象の日本語テキストを
日本語テキストファイル5よりメモリ2内に取り込む
(ステップ402)。
(訳出オプションの指定) 次に、各訳出オプションの値に文書タイプごとに決ま
っている優先順位および文脈条件のデフオルト値をセッ
トし(ステップ403)、第1図に示すような訳出オプシ
ョン指定入力画面に表示する(ステップ404)。これに
対してユーザは、優先順位や文脈条件を変更したり、任
意の文脈条件を付加したりすることができる。システム
はその結果をメモリ2の訳出オプション指定データ格納
エリア212に格納する。
(文法の調整) メモリ2の訳出オプション指定データ格納エリア212
の情報をもとに、文法調整処理プログラム203により、
文法を調整する(ステップ405)。
翻訳用文法の構成を第15図に示す。翻訳用文法1501
は、複数の規則1502からなる。各規則は、規則共通条件
1503、サブルール適用制御1504、サブルール群1505群を
含む。
本ステップ文法の調整とは、具体的には、ユーザの訳
出オプション指定に従ってサブルール適用制御1504の情
報の書き換えを行うことである。第15図のサブルール適
用制御1504の情報は、第1図の訳出オプション指定欄の
情報とユーザ指定欄の文脈条件の情報を組み合わせて 「C(i):if文脈条件then APPLYサブルール(訳出オ
プション)」 の形式で記述し、ユーザ指定の優先順位の順番に並べた
ものである。
次に、翻訳実行時において、サブルール適用制御1504
がどのように解釈、実行されるかを、第16図のフローに
従って説明する。
まず、サブルール適用制御のカウンタiとROLEテーブ
ルのカウンタjの値を0にする(ステップ1601)。ROLE
テーブルには、翻訳対象文や翻訳対象文を含む段落など
のROLEが格納されている。翻訳対象文TEMPのROLEがROLE
(1)に、翻訳対象文を含む文書構造上の単位DISC
(k)のROLEが小さい単位から順に、すなわち、段落、
章というような順番でROLE(2)以下に格納されてい
る。
サブルール適用制御のカウンタiをカウントアップし
ながら(ステップ1602)優先順位の高いサブルールが適
用できるかをみていく(ステップ1603)。C(i)にRO
LE条件があれば(ステップ1604)ROLEテーブルに格納さ
れたROLEの中に一致するものがあるかを調べる(ステッ
プ1605〜1608)。一致したら(ステップ1609)、指定さ
れた規則を適用する(ステップ1610)。規則の適用に成
功したら終了し、失敗したらサブルール適用制御に従
い、次のサブルール適用を試みる(ステップ1611)。ス
テップ1604において、サブルール適用制御ら文脈条件が
記述されていない場合は、ROLEのチエックをせずにサブ
ルール適用(ステップ1610)を行う。
(文書構造・文脈条件の定義) 訳出オプション指定入力画面に文脈条件を記述する際
に、ユーザは、新しい文脈条件を設定し、用いることが
できる。その場合は、文脈条件を定義する必要がある。
そこで、次のステップでは、文脈条件登録画面を表示す
る(ステップ406)。
ここでユーザは、何をキーとしてどのような文書構造
・文脈条件を認識したらよいかを第6図に示すような形
式で指示する。文書構造・文脈条件のキーは、字種およ
び字面で指定する。ユーザの入力が終わると、システム
は入力データをメモリ2の文書構造・文脈条件定義デー
タ格納エリア211に読み込む(ステップ407)。ステップ
406とステップ407は、ステップ403、あるいはステップ4
04の前に位置付けることも可能である。
(文書構造・文脈条件の認識と翻訳) 以上により、文脈条件により訳し分けの仕方をユーザ
が指定したことになる。次に、対象文書を1文ずつ読み
込み、翻訳していく処理に入る。まず、日本文テキスト
エリア206に記憶された対象文書内に未翻訳の文が残つ
ているかどうかを確かめ(ステップ408)、翻訳対象文
がある場合は、1文を日本文エリア207に読み込み(ス
テップ409)、文脈条件認識プログラムを実行する。文
脈条件認識プログラムでは、入力文を文書構造・文脈条
件定義データ格納エリア211に記憶された情報(第6図
参照)と照らしあわせ、文章の区切りを示す情報や文脈
条件を示す情報が含まれている場合は、メモリ2の文脈
条件格納エリア210に記憶する(ステップ410)。そし
て、翻訳処理プログラム202により翻訳を行う(ステッ
プ411)。翻訳処理において用いる方法は、訳出オプシ
ョン指定に基づいて調整されたものであり、訳し分けの
条件部に、ユーザが指定した文脈条件が設定されてい
る。文脈条件格納エリア210に記憶された翻訳対象文の
文脈条件が、文法規則に適用条件に書かれた文脈条件を
充たしているかどうかをチェックすることにより、文脈
条件による訳し分けが可能となる。このようにして翻訳
対象文の読み込み、文書構造・文脈条件の認識、翻訳を
繰返し、翻訳対象分がなくなったら終了する。
(4) 文脈条件認識処理の詳細 本発明の機械翻訳システムの特徴の1つに、1文を読
み込んだとき、その文の文脈条件を示す情報だけでな
く、後続する文や段落の文脈条件を示す情報も認識し、
翻訳に利用できるように保持しておくという機能があ
る。本実施例の日英翻訳システムにおいてこの機能を実
現する処理の流れを第5図に示す。これにより、第7図
の例文に対して第8図に示すような文脈条件に関する情
報を得る。以下、処理の詳細を説明する。
(文脈条件のシフト) 「次の文の文脈条件」としてNEXTに記憶してあった情
報を「翻訳対象文の文脈条件」TEMPにシフトする(ステ
ップ501)。
(ユーザ定義情報のキー認識) 文書構造・文脈条件定義データ格納エリア211(第6
図参照)に記憶されたユーザ定義情報のキーが翻訳対象
文に含まれていないか、キーを1つずつ取り上げてチエ
ックする(ステップ502〜505)。例えば、翻訳対象文が
第7図のS1であるとき、第6図の文書構造・文脈条件定
義の2番目の項目のキーを含む事を認識する。文中にキ
ーが1つもなければ、以下の処理を行わずに終了する。
(文書構造の認識) LEVELの値が“−”でない場合は、文章の区切りと判
定し(ステップ506)、LEVELの値をカウントレベルCLに
セットする(ステップ507)。例えば、翻訳対象文が第
7図のS1であるとき、カウントレベルの値を“2"とす
る。カレントレベルが前のカレントレベル以上である場
合は、段落や節などの文書構造上のまとまりが終了した
と判断し、有効性の無くなった文脈条件、即ち、文書構
造のレベルごとに設定される文脈情報DISCのうちカレン
トレベル以下の情報をクリアする(ステップ508〜50
9)。例えば、翻訳対象文が第7図のS4であるとき、カ
レントレベルCLを“3"とし、DISC(3)の情報をクリア
する。DISC(2)の情報はそのまま保持する。
(文脈条件の認識) 文書構造・文脈条件定義データに記述された文脈条件
TEMP、次の文の文脈条件NEXT、複数文の文脈条件DISCを
文脈条件格納エリア210に記憶する。例えば、第7図のS
2では、次の文NEXTの役割(ROLE)がトピックセンテン
ス(TPCSNT)であること、S2から始まる一連の文(レベ
ル3)が説明文(EXP)であることを認識し、NEXT,DISC
(3)に記憶しておく。これらの情報はS3の翻訳の際に
主語無し文の訳し分けの手掛かりとして利用される。こ
れにより、S3の「ジョブを打ち切る」を“CANCEL JOB
コマンド”を主語にした文で訳すことが可能となる。
なお、本実施例では文書構造や文脈条件を示すキーを
字種や字面で指定しているが、ISO規格のSGML(Standar
d Generalized Markup Language)によつて文書にタグ
付けがされている場合は、それを利用することも考えら
れる。
本実施例によれば、1つの文書の中でも文脈によつて
訳し方を変えることができ、さらに、その変え方のユー
ザ指定が容易にできる。このため、訳文の質が向上し、
後編集の工数を削減することができるという効果があ
る。
次に、本発明の第2の実施例として、英文レター作成
支援システムについて述べる。第9図に示すように、本
実施例の英文レター作成支援システムは、プロセッサ1,
メモリ2,人力装置3,表示装置4,英文レターファイル9,文
法ファイル7,辞書ファイル8によって構成される。本シ
ステムの第1の特徴は、第1の実施例として示した日英
翻訳システムと同様の方法で日本文を英文に翻訳する日
英翻訳機能を持つことである。この機能を実現するた
め、メモリ2には、第1の実施例と同じ内容、即ち第3
図に示した内容が記憶されている。また、システムの第
2の特徴は、手紙のレター管理情報として日付、宛先等
を入力すると、この情報から文脈条件を認識する機能
と、文脈条件に適した形式と表現によって手紙の枠組を
作成する機能、文脈条件をもとに翻訳文法を調整する機
能を持つことである。これらの機能を実現するため、メ
モリ2には、上記の内容に加えて、第10図に示すよう
に、枠組み作成プログラム213が記憶されており、レタ
ー管理情報エリア214、英文レターエリア215が設けられ
ている。
本実施例の英文レター作成支援システムの処理の流れ
を第13図のフローに従って説明する。
(レター管理情報の取得) 第11図に示すようなレター管理情報入力画面を表示し
(ステップ1301)、入力された日付、宛先、件名、差出
人をレター管理情報エリア214に記憶する(ステップ130
2)。
(文脈条件認識) レター管理情報をもとに、文脈条件を認識する。英国
式、米国式のいずれがよいか、相手は個人か組織か、を
判断し、書式や訳し方を決める際の手がかりとして記憶
しておく。まず、レター管理情報の宛先の国名欄の最後
が“U.K."であれば(ステップ1303)、書式や綴り、訳
語を英国式にしたらよいと判定し、英国属性ENGの値をB
RE(英語)とし(ステップ1304)、それ以外の場合はEN
G=AME(米語)とする(ステップ1305)。ステップ1303
の国名の判定では、“U.K."の他、旧英国領の国など、
英国式が慣例となつている国の国名の場合もENG=BRE
(英語)となるようにすることも考えられる。また、英
語の種類を3種類以上にすることも考えられる。
次に、宛先が個人か会社などの組織かを見る。宛先の
「個人宛/組織宛」の欄を参照し、組織宛であれば(ス
テップ1306)、相手属性ADRをORG(組織)とし(ステッ
プ1307)、個人宛であればADR=PSN(個人)とする。こ
の情報は、「拝啓」にあたる英語表現(Dear名前、Dera
Sirs,Gentlemen)を決める時などに有効となる。
(手紙の枠組みの作成) レター管理情報をもとに、第12図に示すような手紙の
枠組を英文レターエリア215に作成し、表示する(ステ
ップ1309)ここで、先のステップで認識した文脈条件に
適した枠組みを作成する。本実施例では、日付の形式と
「拝啓」にあたる表現の決定に際し、第14図に示す規則
を用いている。これにより、日付の1990年8月1日は英
国式に“1st August,1990"となり、「拝啓」にあたる表
現として“Dear Sirs:"が選択されている。宛先の名前
の欄に“Mr.Andrew Long"という名前が書かれている
が、相手属性ADR=ORG(組織宛)なので、“Attention"
の欄に名前が書かれている。「個人宛」と指定された場
合は、“Dear Mr.Long:"となる。本実施例では、英国式
/米国式、個人宛/組織宛によって日付の形式と「拝
啓」にあたる英語表現を決めるようにしているが、同様
にしてフオーマットや「敬具」にあたる英語表現を決め
ることも考えられる。また、本実施例のレター管理情報
では、件名の欄が空白になつているが、件名が書いてあ
る場合は、枠組み作成結果に“Subject:…”と出力す
る。このとき、次に述べる翻訳伊能を用いれば、日本語
で書かれた件名を英語に訳すことも可能である。
(本文の翻訳) 本文の作成に際し、ユーザが日本語入力を希望した場
合は(ステップ1310)、原文入力、訳文表示のための日
英対訳表示画面を表示する(1311)。ユーザが原文を入
力して翻訳を指示すると、第1の実施例の機械翻訳シス
テムの機能により翻訳する。(ステップ1312)。翻訳に
際しては、英語属性(英語/米語)、相手属性(個人/
組織)によって訳語、綴り、言い回しの訳し分けを行
う。
なお、ユーザが対訳画面においては原文や訳文を校正
することは、従来技術によって容易に実現しうる。
(本文の作成) ステップ1309で作成した枠組を表示し、本文の入力を
促す(1313)。先のステップ1311〜1312で本文を日本語
で入力し翻訳した場合は、本文が入る位置に翻訳結果を
表示する。通常の英文ワードプロセッシング機能によ
り、枠組みと本文を含む手紙全体の編集を支援し(ステ
ップ1314)、手紙が完成したらレター管理情報とともに
英文レターファイル9に登録し、終了する。
本実施例では、相手の住所から英語/米語のいずれを
用いるかを決定し、日本語で入力した本文を翻訳する際
に訳し分けるようにしたが、従来の英文チエック技術と
組み合わせることにより、英語で入力した文の綴り、用
語、言い回しが英語/米語の習慣に合っているかをチエ
ックするように拡張することも可能である。
本実施例では、宛先をレター管理情報から得る場合に
ついて述べたが、手紙におけるアドレスの位置は決まっ
ているので、手紙そのものに書かれたアドレスから個人
宛/組織宛の別、宛先の国名を知り、訳し分けの手がか
りとすることも考えられる。
本実施例によれば、相手に適した手紙の枠組みが自動
的に作成される。また、日本語で入力した本文を相手に
適した訳し方で訳すことができる。
これにより、英文レターの形式・表現に関する知識や
国による習慣の違いを知らないユーザでも、相手に適し
た形式、表現の英文レターを簡単に作成することができ
るという効果がある。
〔発明の効果〕
本発明によれば、機械翻訳システムによる翻訳結果や
英文レター作成支援システムによる手紙の枠組み作成結
果が文脈に適したものとなるので、後編集の工数が削減
できるという効果がある。
【図面の簡単な説明】
第1図〜第8図は本発明の第1の実施例の日英翻訳シス
テムに関するものである。第1図は、文脈条件つき訳出
オプション指定機能の入力画面を示す図、第2図は、シ
ステムのハードウエア構成図、第3図は、メモリ2に記
憶される内容を示す図、第4図および第5図は、文脈条
件による訳し分け処理のプロセスを示すフローチャー
ト、第6図は、メモリ2の文書構造・文脈条件定義デー
タ格納エリア209に記憶されるデータの例を示す図、第
7図は、入力文書の例を示す図、第8図は、システムが
第7図の入力文書に対し、第6図の文書構造・文脈条件
定義に従って各文の文脈条件を認識した結果を示す図で
ある。 第9図〜第14図は本発明の第2の実施例の英文レター作
成支援システムに関するものである。第9図は、システ
ムのハードウエア構成図、第10図は、メモリ2に記憶さ
れる内容を示す図、第11図は、レター管理情報入力画面
を示す図、第12図は、レター管理情報をもとにシステム
が手紙の枠組を作成した結果を示す図、第13図は、レタ
ー作成支援処理の流れを示すフローチャート、第14図
は、手紙の枠組み作成において、文脈条件をもとに形
式、表現を決定する規則の例を示す図、第15図は翻訳用
文法の構成図、第16図はそのフロー図である。 1……プロセッサ、2……メモリ、3……入力装置、4
……表示装置、5……日本語テキストファイル、6……
英語テキストファイル、7……文法ファイル、8……辞
書ファイル、9……英文レターファイル、201……文脈
条件認識プログラム、202……翻訳処理プログラム、203
……文脈条件登録処理プログラム、204……訳出オプシ
ョン指定登録処理プログラム、205……文法調整処理プ
ログラム、206……日本文テキストエリア、207……日本
文エリア、208……英文テキストエリア、209……英文エ
リア、210……文脈条件格納エリア、211……文書構造・
文脈条件定義データ格納エリア、212……訳出オプショ
ン指定データ格納エリア、213……枠組み作成プログラ
ム、214……レター管理情報エリア、215……英文レター
エリア。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】次のステップを有することを特徴とする機
    械翻訳方法。 (1)章、節を含む文の階層レベルによって階層化され
    た翻訳対象文書を記憶手段へ格納し、 (2)前記翻訳対象文書は複数種類の見出しを有し、前
    記翻訳対象文書に出現することのある任意の一の見出し
    を構成する文字列の字種または文字の並びの特徴である
    キーと、その見出しが属する前記階層レベルはどのレベ
    ルであるのか、その見出しの主題と役割Key(TEMP,TOPI
    C,ROLE)、その見出しの次の行の文の主題と役割Key(N
    EXT,TOPIC,ROLE)およびその見出しに属する文書構成要
    素の主題と役割Key(DISC,TOPIC,ROLE)とを対応づけた
    文書構造・文脈条件定義データを記憶手段へ格納し、 (3)前記(1)および(2)のステップの後に前記翻
    訳対象文書を前記記憶手段から一文ずつ呼び出し、前記
    呼び出した文と前記キーとを照合した結果、その文に前
    記文書構造・文脈条件定義データで定義されている見出
    しが含まれる場合にはその文の文書構造・文脈条件デー
    タであるその文の主題と役割S(TEMP,TOPIC,ROLE)、
    その文の次の行の文の主題と役割S(NEXT,TOPIC,ROL
    E)およびその見出しに属する文書構成要素の主題と役
    割S(DISC,TOPIC,ROLE)を前記文書構造・文脈条件定
    義データに基づいて更新し、前記照合した結果、その文
    が前記文書構造・文脈条件定義データで定義されている
    見出しではない場合には前記S(NEXT,TOPIC,ROLE)に
    記憶していたデータを削除すると共にそのデータを前記
    S(TEMP,TOPIC,ROLE)へ移動することにより当該文の
    主題および役割を認識し、 (4)当該文の前記主題および前記役割に基づいて前記
    当該文の文体あるいは文種を特定した後に前記当該文を
    機械翻訳する。
JP27629590A 1990-10-17 1990-10-17 機械翻訳方法 Expired - Fee Related JP3273782B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27629590A JP3273782B2 (ja) 1990-10-17 1990-10-17 機械翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27629590A JP3273782B2 (ja) 1990-10-17 1990-10-17 機械翻訳方法

Publications (2)

Publication Number Publication Date
JPH04152466A JPH04152466A (ja) 1992-05-26
JP3273782B2 true JP3273782B2 (ja) 2002-04-15

Family

ID=17567460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27629590A Expired - Fee Related JP3273782B2 (ja) 1990-10-17 1990-10-17 機械翻訳方法

Country Status (1)

Country Link
JP (1) JP3273782B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
JP5473533B2 (ja) * 2009-10-27 2014-04-16 エスディーエル・ピーエルシー 文脈内正確(ice)一致
GB2474839A (en) * 2009-10-27 2011-05-04 Sdl Plc In-context exact matching of lookup segment to translation memory source text
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Also Published As

Publication number Publication date
JPH04152466A (ja) 1992-05-26

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
US5311429A (en) Maintenance support method and apparatus for natural language processing system
JP2001195404A (ja) 句翻訳方法およびシステム
JP3273782B2 (ja) 機械翻訳方法
JPH0731677B2 (ja) 文書作成・校正支援装置
JPH10214268A (ja) 文書検索方法および装置
JPH08329108A (ja) テキストのハイパーテキスト化方法
JPH07325826A (ja) 日本語処理システム
JP3394856B2 (ja) 翻訳方法及び機械翻訳装置
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPH03233669A (ja) 文書作成装置
JPH1021242A (ja) 機械翻訳装置及び機械翻訳後編集方法
JPH05225232A (ja) テキスト自動前編集装置
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
JP2002073602A (ja) 自然言語処理装置
JP2011210193A (ja) 機械翻訳装置および機械翻訳プログラム
JPH01114978A (ja) 文書作成・校正支援装置
JPH0668134A (ja) 翻訳用例ベース利用翻訳方式
JPH02308371A (ja) 自然言語インターフェースにおける構文規則の追加,修正処理方式
JP2003256415A (ja) 辞書構築支援方法、装置及びプログラム
JPH10162006A (ja) 文書翻訳表示装置
JPH04323770A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees