JPH0749871A - 定型文翻訳方式 - Google Patents

定型文翻訳方式

Info

Publication number
JPH0749871A
JPH0749871A JP5195849A JP19584993A JPH0749871A JP H0749871 A JPH0749871 A JP H0749871A JP 5195849 A JP5195849 A JP 5195849A JP 19584993 A JP19584993 A JP 19584993A JP H0749871 A JPH0749871 A JP H0749871A
Authority
JP
Japan
Prior art keywords
translation
sentence
pattern
key word
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5195849A
Other languages
English (en)
Inventor
Mayumi Sugiura
真弓 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5195849A priority Critical patent/JPH0749871A/ja
Publication of JPH0749871A publication Critical patent/JPH0749871A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】複雑な構造を持つ文に対して、キーワードの位
置から構造上の纏まりを把握して切り出し、纏まりごと
に翻訳処理を行い、訳出パターンにあてはめて訳文を構
成し出力することにより、翻訳効率を向上させる。 【構成】翻訳処理装置、入力装置、出力装置、辞書デー
タファイル、文法データファイル、定型パターンファイ
ル、訳出パターンファイル、原文ファイル、訳文ファイ
ル、メモリ。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システムの翻
訳方式に係り、特に文構造が長くて複雑な定型文を多く
含む文書を効率的に翻訳するのに好適な定型文翻訳方式
に関する。
【0002】
【従来の技術】従来の翻訳方式では、契約書等の文は長
文であるために翻訳処理が困難であった。しかし、この
種の文書に現れる文にはパターンがあり、人間が翻訳す
るときは、このパターンにあてはめて翻訳している。
【0003】また、特開平4−160473号公報に記
載のように、文書中の類似文について、既に翻訳した結
果を利用して典型対訳パターンと異なる要素のみを翻訳
する方式がある。しかし、この方式は、類似文が長い場
合は、類似文を検索するために時間がかかったり、パタ
ーンが見つけ出せなかったりする。また、翻訳済みの訳
文を利用して典型対訳パターンを抽出するが、長文のよ
うに翻訳結果が失敗しやすい文については考慮されてい
なかった。
【0004】また、特開昭63−211464号公報に
記載のように、主語が長すぎるという特定の構造を持つ
文に対して、特殊な構文処理を施して原文を翻訳してい
た。しかし、この方式では、主語以外の文構成要素が長
い複雑な構造を持っている文については考慮されていな
かった。
【0005】
【発明が解決しようとする課題】本発明の目的は、翻訳
処理装置が解析困難である複雑な構造を持つ長文に対し
て、確実に文の構造を把握して翻訳の効率を上げ、翻訳
結果を利用者が内容を理解しやすいように出力すること
にある。
【0006】
【課題を解決するための手段】上記の目的は、文書によ
く現れる定型パターンを記憶しておくキーワード情報テ
ーブルを設けて、キーワードの位置から構造上の纏まり
を捉えてその纏まり毎に翻訳処理を行い、翻訳結果を定
型パターンに対応する訳出パターンにあてはめることに
より達成される。
【0007】
【作用】最初に、ユーザは、定形パターンのキーワード
情報を定形パターンファイルに登録しておく。また、各
々の定形パターンに対応する訳出パターンを訳出パター
ンファイルに登録しておく。システムは、第一言語のテ
キストを入力し文分割する。次に、ユーザが予め登録し
た定型パターンの情報テーブルを用いて、自動的に入力
文中からキーワードを検索し、定型文翻訳処理を行う文
を選択する。定型パターンにマッチングしなかった文
は、通常の翻訳処理を行う。一方、マッチングした文
は、対応する訳出パターンで訳が決まっていない部分を
切り出し、切り出された部分のみ翻訳処理を行う。最後
に翻訳結果を対応する訳出パターンにあてはめて、一文
に構成して出力する。これによって、長くて複雑な構造
をもつ文でも、キーワードの位置から構造上の纏まりを
認識して、必要な部分だけを翻訳することができ、翻訳
効率が向上する。
【0008】
【実施例】以下、本発明の一実施例を図面で説明する。
図1は本発明方式による機械翻訳システムの構成を示し
たものである。本システムは翻訳処理装置1、入力装置
2、出力装置3、辞書データファイル4、文法データフ
ァイル5、定型パターンファイル6、訳出パターンファ
イル7、原文ファイル8、訳文ファイル9、メモリ10
から構成される。翻訳処理装置1は、原文テキストの文
分割処理、原文の定型文認識処理、辞書データファイル
4と文法データファイル5を利用した翻訳処理、訳文の
整形処理、および訳文の出力処理を行う。入力装置2
は、原文テキストの入力、及びユーザが定型パターンや
訳出パターンの情報の入力を行う。出力装置3は翻訳結
果の出力を行う。辞書データファイル4は、第一言語の
単語見出し、品詞、訳語、文法情報等が格納されている
レコードの集合である。文法データファイル5は、第一
言語の解析、変換、第二言語の生成に必要な文法規則の
集合である。辞書データファイル4と文法データファイ
ル5は翻訳処理で利用する。定型パターンファイル6
は、第一言語の定型パターンのキーワードである単語や
句の情報テーブルが格納されている。訳出パターンファ
イル7は、定型パターンに対応する訳語の情報テーブル
が格納されている。原文ファイル8は、第一言語のテキ
ストが格納されている。訳文ファイル9は、翻訳結果が
格納されている。
【0009】図2はキーワード情報テーブルの一例を示
したものである。ユーザは、予め、文書によく現れる定
型文の情報をこのテーブルに登録しておく。テーブルに
は、定型パターン番号、ブロック番号、キーワード群番
号、キーワード番号、キーワードの6つの情報がある。
定型パターン番号は、定型パターン毎に与える番号であ
る。キーワードは、定型文中に必ず現れる単語であり、
定型文認識のキーとなるものである。キーワード番号
は、キーワード毎に与える番号である。キーワード群番
号は、連続したキーワードから構成されるキーワード群
に与える番号である。ブロック番号は、キーワード群部
分と変化部分をブロックとしたとき、そのブロック毎に
与える番号である。このテーブルは、定型パターンファ
イル6に格納されており、定型文認識処理を行うときに
利用する。
【0010】図3は訳出パターンテーブルの一例を示し
たものである。ユーザは、定型パターンに対応した訳出
パターンの情報をこのテーブルに登録しておく。このテ
ーブルには、定型パターン番号、訳文番号、訳文、翻訳
対象ブロック番号の4つの情報がある。訳文は、定型文
の部分訳である。ユーザは訳文の項目に任意の訳出パタ
ーンを登録する。訳文番号は、既定部分訳とそれ以外の
未定部分に文頭から順番に与える番号である。翻訳対象
ブロック番号は、訳の未定部分に対応し、翻訳処理の対
象となる原文ブロックを示すものである。このテーブル
は、訳出パターンファイル7に格納されている。このパ
ターンに翻訳結果をあてはめることにより、定型文につ
いて一定の表現形式の翻訳結果が得られる。
【0011】図4は本発明による機械翻訳システムの定
型文翻訳処理フローの例である。最初に、システムは原
文ファイル8から原文テキストを入力し(11)、ピリ
オドなどの記号を基に文分割を行う(12)。
【0012】一文に分割された原文は、図2のキーワー
ド情報テーブルを用いて、キーワード検索を行う(1
3)。例えば、定型パターン1を”A shall B provide
d,however,that C.″とし、キーワード情報テーブル
に、図2に示す情報がユーザによって既に登録されてい
るとする。また、入力文を、”The term of office ofd
irectors shall expire at the close of the ordinary
general meeting;provited,however,that the init
ial directors shall hold office untilthe end of th
e Accounting Period.”とする。このとき、最初に、
システムは、第1キーワード群の第1キーワードであ
る”shall”を入力文中から検索する。マッチングした
ら、次の第2キーワード群の第1キーワードである”p
rovided”を検索する。マッチングしたら、”p
rovided”の後に、連続して第2キーワード
の”,(コンマ)”があるか、検索を行う。このよう
に、同一キーワード群中のキーワードは、連続して現れ
ているかを検索を行っていく。キーワード検索時には、
同時にマッチングしたキーワードの文中の位置をメモリ
10に記憶する。こうして、最後のキーワードまで検索
して全てマッチングした場合は、この文に定型パターン
1のマーキングをする。
【0013】次に、システムは、入力文が定型パターン
のマーキングがされているか判断する(14)。定型パ
ターンのマーキングがされている文は、訳出パターンテ
ーブルを用いて、翻訳処理を行う部分を切り出す(1
5)。このことにより、複雑な構造でも、構造上の纏ま
りごとに分割して翻訳処理を行えるので、翻訳効率が向
上する。切り出したブロックは翻訳処理装置1で翻訳処
理を行い(16)、翻訳結果は訳出パターンテーブルの
訳文の項目に出力して、最後に一文として訳文全体を出
力する(17)。一方、非定型文の場合は、一文のま
ま、翻訳処理を行う(18)。
【0014】例えば、訳出パターンテーブルに、図3に
示す定型パターン1の情報がユーザによって登録されて
いるとする。翻訳対象ブロック番号が、1、3、5であ
るので、メモリに記憶しておいたキーワードの文中の位
置から、当該ブロック番号の対応部分を入力文から切り
出す。前出の入力文の例では、第1ブロックは”theter
m of office of directors”となる。このブロックの翻
訳結果”取締役の任期”は、訳出パターンテーブルか
ら、訳文番号1の位置に対応することがわかる。よっ
て、訳文番号1の訳文項目に、翻訳結果を出力する。同
様にして、第3ブロック、第5ブロックも入力文から切
り出し、翻訳結果を訳出パターンテーブルへ出力する。
最後に、訳文番号1から5までの訳文を一文として構成
する。この結果、最終的な訳文は、「取締役の任期は、
することになる。一般的な会議の終結で終了するだろ
う。ただし、条件として最初の取締役は、会計期間の末
までオフィスを所有しているだろう。」となる。
【0015】定型文及び非定型文の最終的な訳文は、訳
文ファイル9に出力する(19)。定型文の訳文を表示
するときには、ユーザが訳出パターンテーブルに登録し
た既定訳の部分は、ゴシック体や網かけにする。これに
より、訳文の文構造が理解しやすくなり、後編集の効率
向上に効果がある。
【0016】
【発明の効果】本発明によれば、機械翻訳システムが解
析困難である複雑な構文でも、予め文書によく現れる定
型パターンを登録し、キーワード検索することにより、
キーワードの位置から構造的な纏まりを確実に把握する
ことができるので、翻訳の効率向上に効果がある。ま
た、ユーザが訳出パターンを設定することにより、理解
しやすい文構造に整形された翻訳結果が一定して得られ
る。
【図面の簡単な説明】
【図1】本発明の翻訳システムの構成図である。
【図2】キーワード情報テーブルの一例である。
【図3】訳出パターンテーブルの一例である。
【図4】本発明の処理手順の一実施例を示すフローチャ
ートである。
【符号の説明】
1…翻訳処理装置、 2…入力装置、 3…出力装置、 4…辞書データファイル、 5…文法データファイル、 6…定型パターンファイル、 7…訳出パターンファイル、 8…原文ファイル、 9…訳文ファイル、 10…メモリ。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】第一言語による文章を対応する第二言語の
    文章に翻訳する機械翻訳システムにおいて、第一言語に
    よる文章の単語や構文の情報テーブルとそれに対応する
    訳出パターンを設けて、複雑な構造を持つ文をキーワー
    ドの位置から構造上の纏まりを自動的に捉え、纏まり毎
    に翻訳処理を行い、その翻訳結果を対応する訳出パター
    ンにあてはめて出力することを特徴とする定型文翻訳方
    式。
  2. 【請求項2】特許請求の範囲第1項記載の定型文翻訳方
    式において、当該定型パターン及び訳出パターンをユー
    ザが自由に登録できることを特徴とする定型文翻訳方
    式。
  3. 【請求項3】特許請求の範囲第1項記載の定型文翻訳方
    式において、定型文の翻訳結果を表示する際に、既定の
    部分訳をゴシック体または網かけ等、他の部分と異なる
    ように表示することを特徴とする定型文翻訳方式。
JP5195849A 1993-08-06 1993-08-06 定型文翻訳方式 Pending JPH0749871A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5195849A JPH0749871A (ja) 1993-08-06 1993-08-06 定型文翻訳方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5195849A JPH0749871A (ja) 1993-08-06 1993-08-06 定型文翻訳方式

Publications (1)

Publication Number Publication Date
JPH0749871A true JPH0749871A (ja) 1995-02-21

Family

ID=16348037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5195849A Pending JPH0749871A (ja) 1993-08-06 1993-08-06 定型文翻訳方式

Country Status (1)

Country Link
JP (1) JPH0749871A (ja)

Similar Documents

Publication Publication Date Title
US5774845A (en) Information extraction processor
WO2003056450A1 (fr) Procede et appareil d'analyse syntaxique
JPH0749871A (ja) 定型文翻訳方式
JPH0225215B2 (ja)
JP4039205B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0561902A (ja) 機械翻訳システム
JP2742059B2 (ja) 翻訳用辞書編集装置
Pudaruth et al. English to Creole and Creole to English Rule Based Machine Translation System
JP2715875B2 (ja) 多言語要約生成装置
JPH07152767A (ja) 機械翻訳装置
JPH02208775A (ja) 機械翻訳方式
JPS63109572A (ja) 派生語処理方式
JPH0421167A (ja) 機械翻訳装置
JPH05197752A (ja) 機械翻訳装置
JPH10134078A (ja) 文書検索方法及び装置
JPH09146959A (ja) 機械翻訳システム
JPH04372047A (ja) 仮名漢字変換装置
JPS6386071A (ja) 自然言語翻訳方式
JPH05181900A (ja) 固有名詞処理装置
JPH03240876A (ja) 機械翻訳装置
JPH0635964A (ja) 機械翻訳装置
JPH10105552A (ja) 機械翻訳システム
JPS63121977A (ja) 機械翻訳装置
JPH0855121A (ja) 文対応装置及び原文と訳文の対応付け方法
JPS6395570A (ja) 言語解析方式