JPH07182344A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07182344A
JPH07182344A JP5328799A JP32879993A JPH07182344A JP H07182344 A JPH07182344 A JP H07182344A JP 5328799 A JP5328799 A JP 5328799A JP 32879993 A JP32879993 A JP 32879993A JP H07182344 A JPH07182344 A JP H07182344A
Authority
JP
Japan
Prior art keywords
text data
data
document
text
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5328799A
Other languages
English (en)
Inventor
Hidezo Kugimiya
秀造 釘宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5328799A priority Critical patent/JPH07182344A/ja
Publication of JPH07182344A publication Critical patent/JPH07182344A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 言語データと非言語データとが混在する文書
を効率よく翻訳することができる機械翻訳装置の提供。 【構成】 原文書中の言語データと非言語データとを判
別するCPU2と、言語データを翻訳するための翻訳モ
ジュール4と、翻訳された言語データを結果文書に格納
すると共に、非言語データはそのまま結果文書に格納す
る制御部1とを備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文章を形成する言語デ
ータ(以下、テキストデータと称する)と非テキストデ
ータとが混在している文書の翻訳に適した機械翻訳装置
に関するものである。
【0002】
【従来の技術】最近は、DTP(Desk Top Publishing)
機能を持った文書編集システムにより、文章からなるテ
キスト以外に図や表を含む文書が多く作成されるように
なっている。
【0003】また、TeXのようにテキスト中に、書体
やフォントのサイズ等の組版の指定情報を表すマークア
ップ記号が埋め込まれた文書も増大している。
【0004】そして、これらの文書を他の言語に翻訳す
るという技術に対する需要も増えてきている。
【0005】しかしながら、従来の機械翻訳装置では、
入力されるデータのうちテキストデータしか処理するこ
とができない。そのため、例えば図や表を含んだDTP
文書を翻訳しようとする場合、一旦、図や表、レイアウ
ト情報などの非テキストデータを原文書から取り除き、
テキストデータのみを翻訳した後で、非テキストデータ
を結合するという操作が必要となり、非常に効率が悪
い。
【0006】そこで、原文書から言語データだけを取り
出して翻訳処理を行い、原文書の言語データと処理され
たデータとを置き換えることにより、非言語データが含
まれた文書の文書処理を行うことができるようにしたシ
ステムが、特開平4−259057号公報に開示されて
いる。
【0007】
【発明が解決しようとする課題】ところが、このシステ
ムでは、処理された言語データが元の文書内のどこにあ
ったかという情報がないために、元の文書内の言語デー
タと処理された言語データとを置き換えるための対応箇
所決定手段が必要となる。また、対応箇所決定手段によ
り正しい対応箇所が決定されるとは限らないために、非
効率であるとともに信頼性に欠けるという問題点を有し
ている。
【0008】本発明の目的は、テキストデータと非テキ
ストデータが混在する文書を効率よく翻訳することがで
きる機械翻訳装置を提供することにある。
【0009】
【課題を解決するための手段】本発明の機械翻訳装置
は、上記課題を解決するために、第1言語からなるテキ
ストデータと非テキストデータとが混在する文書を第2
言語からなる文書に翻訳する機械翻訳装置において、テ
キストデータか非テキストデータかを判別するための判
別手段、例えばCPUと、テキストデータを第2言語の
テキストデータに翻訳するための翻訳手段、例えば翻訳
モジュールと、第2言語のテキストデータを結果文書に
格納すると共に、非テキストデータはそのまま結果文書
に格納する格納手段、例えば制御部とを含むことを特徴
としている。
【0010】
【作用】上記の構成により、第1言語からなるテキスト
データと非テキストデータとが混在する文書を第2言語
からなる文書に翻訳する場合は、先ず判別手段によっ
て、テキストデータか非テキストデータかの判別が行わ
れ、テキストデータと判断された場合は、翻訳手段にお
いて翻訳が行われた後、格納手段により結果文書に格納
される。また非テキストデータと判別された場合は、格
納手段によりそのまま結果文書に格納される。従って、
原文書に構成されていた構成と同じ構成のまま、第2言
語に翻訳されたテキストデータ及び非テキストデータが
結果文書に格納されるので、原文書と同じ結果文書が得
られることになり、効率よく信頼性の高い翻訳処理結果
が得られる。
【0011】
【実施例】本発明の一実施例について図1ないし図3に
基づいて説明すれば、以下の通りである。
【0012】本発明の機械翻訳装置は、図1に示すよう
に、装置全体の制御を行うための、判別手段であるCP
U(中央処理装置)2及びCPU2の動作時にデータ等
を記憶するためのメインメモリ3からなる制御部1(格
納手段)を有している。この制御部1には、図示しない
翻訳CPU、翻訳プログラム、バッファ等からなる翻訳
モジュール4(翻訳手段)と、翻訳モジュール4が入力
された原文を翻訳する際に使用する翻訳用の辞書、文法
規則等を格納しているメモリ5とが接続されている。さ
らに、制御部1には、入力原文の文字入力や機械翻訳装
置に対する指示等の入力のためのキーボード7や、CR
T(Cathode Ray Tube) 等の表示装置6が接続されてい
る。また、上記キーボード7から入力された原文のファ
イル(原文ファイル)や翻訳文のファイルを格納する外
部記憶装置8も制御部1に接続されている。
【0013】上記翻訳モジュール4は、翻訳される原文
に使用されている第1言語であるソース言語が入力され
ると、それを翻訳して翻訳文に使用されている第2言語
であるターゲット言語を出力するものである。すなわ
ち、CPU2の制御により、外部記憶装置8に格納され
た複数の原文ファイルのうち、予め指定された1つの原
文ファイルが外部記憶装置8からメインメモリ3に転送
され、その原文ファイルの中の1文のソース言語が翻訳
モジュール4に送られる。そうすると、翻訳モジュール
4はメモリ5に記憶されている辞書、文法規則を用い
て、入力されたソース言語をターゲット言語に翻訳す
る。翻訳された文は、メインメモリ3に一旦記憶される
と共に、表示装置6の画面に表示されるようになってい
る。
【0014】次に、図2を参照して、テキストデータと
非テキストデータとが混在する文書を翻訳するための処
理の手順を説明する。
【0015】翻訳される文書の1ページのレイアウトを
図3に示す。この文書では、ブロック1〜4はテキスト
データである文章から構成されており、ブロック3に非
テキストデータである図が存在している。
【0016】先ず、翻訳対象となる、テキストデータと
非テキストデータとが混在している原文書を読み込み、
メインメモリ3に格納する(ステップS1)。
【0017】また、以下の表1に、図3の入力文書を文
書データとして記憶する場合の記憶例を示す。
【0018】
【表1】
【0019】次に、データポインタを原文書の先頭にセ
ットする。表1に示す例では、ブロック1を指す(ステ
ップS2)。
【0020】CPU2において、データポインタが指し
ているデータがテキストデータか非テキストデータかを
判別する(ステップS3)。表1に示す例では、テキス
ト/非テキストデータを示すフラグによりテキストデー
タか非テキストデータかを判別することができる。
【0021】ステップS3においてテキストデータと判
別された場合は、判別されたテキストデータを対象とし
て、翻訳モジュールにより翻訳処理が行われる(ステッ
プS4)。
【0022】翻訳処理の結果得られた訳文を、制御部1
によりメインメモリ3における結果文書に格納する(ス
テップS5)。表1の例では、ブロック1の「内容」の
部分が訳文に置き換えられる。
【0023】データポインタを+1進める(ステップS
6)。データポインタが指す場所にデータがあるかどう
か判断する(ステップS7)。データがある場合は、ス
テップS3へと戻る。
【0024】一方、ステップS3で非テキストデータと
判別された場合、例えば表1においてブロック3のデー
タが指定された場合、ブロック3のデータは非テキスト
データであるので、翻訳処理を行うことなく、制御部1
により非テキストデータをメインメモリ3における結果
文書に格納する。つまり、現在データポインタが指して
いるデータをそのまま結果文書に格納する(ステップS
8)。
【0025】これにより、原文書のテキストデータと非
テキストデータのとちらとも結果文書に格納されること
になる。
【0026】非テキストデータが結果文書に格納された
後は、上記ステップS6に進む。
【0027】このようにして文書データのブロック2、
ブロック3、…と上記の処理を繰り返し、データが無く
なれば処理を終了する。
【0028】上記のように、本発明の機械翻訳装置で
は、翻訳対象となる原文書は複数のブロックに分けら
れ、非テキストデータ及びテキストデータに関わらず順
次ブロックごとに制御部1において処理される。そして
制御部1における処理において、CPU2によりテキス
トデータか非テキストデータかの判別が行われ、テキス
トデータと判断された場合は、翻訳モジュール4におい
て翻訳が行われた後、メインメモリ3の結果文書に格納
される。また非テキストデータと判別された場合は、そ
のままメインメモリ3の結果文書に格納される。従っ
て、原文書に構成されていた構成と同じ構成のまま、翻
訳されたテキストデータ及び非テキストデータが結果文
書に格納されるので、原文書と同じ構成の結果文書が得
られることになり、効率よく信頼性の高い翻訳処理結果
が得られる。
【0029】尚、上記実施例においては、テキストデー
タか非テキストデータであるかの判別はフラグによって
行ったが、判別方法はこれに限らず、例えば、DTPシ
ステムのひとつであるフレームメーカー(Frame maker)
によって作成された文書の場合は、「String」で始まる
部分がテキストデータであることにより、判別すること
ができる。
【0030】また、翻訳対象となる原文書は、テキスト
データと非テキストデータとが混在する文書に限らず、
テキストデータのみ又は非テキストデータのみからなる
文書でももちろんよい。
【0031】
【発明の効果】本発明の機械翻訳装置は、以上のよう
に、テキストデータか非テキストデータかを判別するた
めの判別手段と、テキストデータを第2言語のテキスト
データに翻訳するための翻訳手段と、第2言語のテキス
トデータを結果文書に格納すると共に、非テキストデー
タはそのまま結果文書に格納する格納手段とを含む構成
である。
【0032】それゆえ、第1言語の文書に非テキストデ
ータが存在しても、非テキストデータを取り除くことな
く、テキストデータのみが第2言語に翻訳された文書を
得ることができる。従って、使用者が効率よく翻訳作業
を行うことができると共に、信頼性のある翻訳文書が得
られるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置の一実施例を示すブロッ
ク図である。
【図2】本発明の機械翻訳装置における処理を示すフロ
ーチャートである。
【図3】入力文書の1頁のレイアウトを示す説明図であ
る。
【符号の説明】
1 制御部(格納手段) 2 CPU(判別手段) 3 メインメモリ 4 翻訳モジュール(翻訳手段)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】第1言語からなるテキストデータと非テキ
    ストデータとが混在する文書を第2言語からなる文書に
    翻訳する機械翻訳装置において、 テキストデータか非テキストデータかを判別するための
    判別手段と、 テキストデータを第2言語のテキストデータに翻訳する
    ための翻訳手段と、 第2言語のテキストデータを結果文書に格納すると共
    に、非テキストデータはそのまま結果文書に格納する格
    納手段とを含むことを特徴とする機械翻訳装置。
JP5328799A 1993-12-24 1993-12-24 機械翻訳装置 Pending JPH07182344A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5328799A JPH07182344A (ja) 1993-12-24 1993-12-24 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5328799A JPH07182344A (ja) 1993-12-24 1993-12-24 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH07182344A true JPH07182344A (ja) 1995-07-21

Family

ID=18214240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5328799A Pending JPH07182344A (ja) 1993-12-24 1993-12-24 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH07182344A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5587902A (en) * 1992-05-26 1996-12-24 Sharp Kabushiki Kaisha Translating system for processing text with markup signs
KR20020020409A (ko) * 2000-09-08 2002-03-15 정규석 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5587902A (en) * 1992-05-26 1996-12-24 Sharp Kabushiki Kaisha Translating system for processing text with markup signs
KR20020020409A (ko) * 2000-09-08 2002-03-15 정규석 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
EP0213906B1 (en) Machine translation system
EP0201096A2 (en) Processing method and processor for machine translation
JPH0981566A (ja) 翻訳装置及び翻訳方法
US20010029442A1 (en) Translation system, translation processing method and computer readable recording medium
JPH05303590A (ja) 自動翻訳装置
GB2199680A (en) Translating apparatus
JPH05108716A (ja) 機械翻訳装置
JPH0883280A (ja) 文書処理装置
JPH07182344A (ja) 機械翻訳装置
JPH0630107B2 (ja) 文書処理装置
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPH0728829A (ja) 翻訳支援装置
JPH04311262A (ja) 辞書情報表示装置
JPH0375912B2 (ja)
JPH0612548B2 (ja) 文書処理装置
JPS62245366A (ja) 文書処理装置
JPH08190561A (ja) 文書修正装置
JP3206600B2 (ja) 文書生成装置
JPS62143178A (ja) 自然言語翻訳方式
JP2894064B2 (ja) 機械翻訳装置
JP3204517B2 (ja) 未知語認定方法
JP2864691B2 (ja) 学習支援装置
JP2575947B2 (ja) 文節切出し装置
JPH0589164A (ja) 文書変換装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 6

Free format text: PAYMENT UNTIL: 20090418

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20100418

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20110418

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 10

Free format text: PAYMENT UNTIL: 20130418

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250