JPH0954775A - 翻訳方法及び機械翻訳装置 - Google Patents

翻訳方法及び機械翻訳装置

Info

Publication number
JPH0954775A
JPH0954775A JP7207152A JP20715295A JPH0954775A JP H0954775 A JPH0954775 A JP H0954775A JP 7207152 A JP7207152 A JP 7207152A JP 20715295 A JP20715295 A JP 20715295A JP H0954775 A JPH0954775 A JP H0954775A
Authority
JP
Japan
Prior art keywords
document
sentence
language
translation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7207152A
Other languages
English (en)
Other versions
JP3394856B2 (ja
Inventor
Etsuo Ito
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP20715295A priority Critical patent/JP3394856B2/ja
Publication of JPH0954775A publication Critical patent/JPH0954775A/ja
Application granted granted Critical
Publication of JP3394856B2 publication Critical patent/JP3394856B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 文書中に含まれる文献や同一意味を有する語
句の併記等の、翻訳しても意味をなさない部分の翻訳を
極力抑制して、より自然な翻訳文書を得る。 【構成】 入力される第1の言語で記述された文書又は
文を第2の言語で記述された文書又は文に順次翻訳して
いく際に、入力される第1の言語の文書に含まれる又は
各文間に位置する各見出し部分を入力時に検出してい
き、検出される見出し部分が参考文献の記述開始を示す
見出し部分のとき、次の見出し部分までの翻訳を行わず
に、その間に入力された第1の言語で記述された文書又
は文をそのまま、第2の言語で記述された文書内の対応
する位置に記述する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文書を翻訳
する翻訳方法とこの翻訳方法を採用した機械翻訳装置に
係わり、特に、重複翻訳や無意味な翻訳を極力避けるこ
とができる翻訳方法及び機械翻訳装置に関する。
【0002】
【従来の技術】操作者の指示により、ある言語で記述さ
れた文書を他の言語の文書に自動的に翻訳する機械翻訳
装置においては、翻訳対象文書を構成する各文を先頭か
ら順番に取り込み、各文を当該他の言語の文に翻訳す
る。このように、従来は、文書全体を1文単位に分割し
て、各文毎にそれぞれ個別に翻訳していた。
【0003】
【発明が解決しようとする課題】しかしながら、翻訳対
象文書には種々の語句が含まれる。そして、それらのな
かには、固有名詞や文献名等の翻訳しても意味をなさな
い語句も含まれる。例えば、文書が論文の場合、文書の
末尾に挿入された、この論文中で参照したり引用した参
考文献リストや論文中に含まれる人名や書名,文献名を
翻訳しても無意味である。また、特に、文献の雑誌名は
翻訳された名称より翻訳しない原文の名称の方が実際の
文献を特定しやすい場合も多い。
【0004】さらに、名称が長い場合、論文中において
略称を使用することがある。このような場合、論文中で
最初に略称を使用すると、一般的に正式名称と併記し、
それ以降は略称のみを使用している。例えば、略式名称
と正式名称[MT(Machine Translat
ion)]の語句を[機械翻訳(機械翻訳)]と翻訳し
ても意味をなさないのである。
【0005】また、括弧の内側(正式名称)を翻訳しな
くて、[機械翻訳(MachineTranslati
on)]とする技術が考えられるが、それでも略号と正
式名称との関係が不明瞭になってしまう。
【0006】このような不自然な翻訳文書が生じないよ
うにするためには、例えば、翻訳すべき文書を表示装置
の表示画面に順番に表示していき、操作者が翻訳不要の
文や語句をマウスやカーソルで指定したり、翻訳しない
語句リストを与え、指定された文や語句の翻訳を行なわ
ない方式が考えられる。
【0007】しかし、このように操作者が翻訳不要箇所
を指定する方式においては、結果的に、操作者は翻訳す
べき文書全体に目を通す必要があるので、操作者の負担
が大幅に増加する問題がある。
【0008】また、操作者は、翻訳すべき元の文書をあ
る程度理解できる程度の語学能力を有している必要があ
る。本発明はこのような事情に鑑みてなされたものであ
り、入力された文書に記載された参考文献に含まれる著
者名,書名等の固有名詞を検出することによって、参考
文献に関する部分の翻訳をせず、翻訳不要部分の翻訳を
極力抑制でき、読み易い翻訳文が得られる翻訳方法及び
機械翻訳装置を提供することを目的とする。
【0009】また、同一意味を有する連続した語句を検
出することによつて、重複翻訳を防止でき、より自然で
読みやすい翻訳文が得られる翻訳方法及び機械翻訳装置
を提供することを目的とする。
【0010】
【課題を解決するための手段】上記課題を解消するため
に、請求項1の発明の翻訳方法においては、入力される
第1の言語で記述された文書又は文を第2の言語で記述
された文書又は文に順次翻訳していく際に、入力される
第1の言語の文書に含まれる又は各文間に位置する各見
出し部分を入力時に検出していき、検出される見出し部
分が参考文献の記述開始を示す見出し部分のとき、次の
見出し部分までの翻訳を行わずに、その間に入力された
第1の言語で記述された文書又は文をそのまま、第2の
言語で記述された文書内の対応する位置に記述してい
る。
【0011】また、請求項2の機械翻訳装置において
は、入力される第1の言語で記述された文書又は文を第
2の言語で記述された文書又は文に順次翻訳していく翻
訳部と、入力される第1の言語の文書に含まれる又は各
文間に位置する各見出し部分を入力時に検出していく見
出し部分検出手段と、見出し部分検出手段にて検出され
る見出し部分が参考文献の記述開始を示す見出し部分か
否かを判定する参考文献開始判定手段と、参考文献開始
判定手段にて参考文献開始と判定されたとき、見出し部
分検出手段が次の見出し部分を検出するまで翻訳部にお
ける翻訳を行わずに、その間に入力された第1の言語で
記述された文書又は文をそのまま、第2の言語で記述さ
れた文書内の対応する位置に記述する翻訳部停止制御手
段とを備えている。
【0012】請求項3の翻訳方法においては、入力され
る第1の言語で記述された文書に含まれる又は各文間に
位置する各見出し部分を順次検出していき、この検出さ
れる見出し部分が参考文献の記述開始を示す見出し部分
のとき、次の見出し部分までに入力される文書又は文に
含まれる著者名,書名,文献名等の固有名詞を検出して
記憶しておき、次に、入力された第1の言語で記述され
た文書又は文を第2の言語で記述された文書又は文に順
次翻訳していく際に、入力された文書又は文に前記記憶
された固有名詞が検出されると、この固有名詞に対する
翻訳を行わずに、この固有名詞をそのまま第2の言語で
記述された文書内の対応する位置に記述している。
【0013】請求項4の機械翻訳装置においては、入力
される第1の言語で記述された文書に含まれる又は各文
間に位置する各見出し部分を検出していく見出し部分検
出手段と、見出し部分検出手段にて検出される見出し部
分が参考文献の記述開始を示す見出し部分か否かを判定
する参考文献開始判定手段と、参考文献開始判定手段に
て参考文献開始と判定されたとき、見出し部分検出手段
が次の見出し部分を検出するまでに入力される文書又は
文に含まれる著者名.書名,文献名等の固有名詞を検出
する固有名詞検出手段と、固有名詞検出手段にて検出さ
れた固有名詞を記憶する固有名詞記憶部と、入力された
第1の言語で記述された文書又は文を第2の言語で記述
された各文に順次翻訳していく翻訳部と、入力される文
書又は文に固有名詞記憶部に記憶された固有名詞が含ま
れるときこの固有名詞に対する翻訳部における翻訳を行
わずに、この固有名詞をそのまま第2の言語で記述され
た文書内の対応する位置に記述する翻訳部停止制御手段
とを備えている。
【0014】請求項5の翻訳方法においては、入力され
る第1の言語で記述された文書又は文を第2の言語で記
述された文書又は文に順次翻訳していく際に、入力され
る第1の言語の文書又は文に含まれる同一意味を有する
連続した略語句と正式語句との複数の語句を検出してい
き、入力される文書又は文にこの同一意味を有する連続
した複数の語句が検出されると、この複数の語句に対す
る翻訳を行わずに、この複数の語句をそのまま、第2の
言語で記述された文書内の対応する位置に記述してい
る。
【0015】さらに、請求項6の機械翻訳装置において
は、入力される第1の言語で記述された文書又は文を第
2の言語で記述された文書又は文に順次翻訳していく翻
訳部と、入力される第1の言語の文書又は文に含まれる
同一意味を有する連続した略語句と正式語句との複数の
語句を検出する連続同一語句検出手段と、連続同一語句
検出手段にて同一意味を有する連続する複数の語句が検
出されたとき、この複数の語句に対する翻訳を行わず
に、この複数の語句をそのまま、第2の言語で記述され
た文書内の対応する位置に記述する翻訳部停止制御手段
とを備えている。
【0016】
【作用】請求項1及び請求項2の翻訳方法及び機械翻訳
装置においては、翻訳すべき文書又は文に含まれる各見
出し部分が順番に検出されていく、そして、検出された
見出し部分が参考文献の記載開始を示す見出し部分の場
合は、この見出し部分から次の見出し部分までに含まれ
れる文書又は文の翻訳を行わずに、翻訳された第2の言
語で記述された文書内の対応する位置にそのまま記述さ
れる。
【0017】すなわち、論文等のように文書の最終位置
に行を改めて[参考文献]等の見出し語に続いて、この
論文で引用されたり、参考された文献の一覧が記載され
た欄(文章)がある場合は、この文献の一覧は翻訳され
ない。
【0018】請求項3及び請求項4の翻訳方法及び機械
翻訳装置においては、請求項1及び請求項2において、
参考文献の一覧が記載された欄(文章)の各文に含まれ
る著者名,書名,文献名等の固有名詞が検出されて記憶
保持される。
【0019】そして、入力された文書の各文を順番に翻
訳していく過程で、記憶部に記憶された固有名詞が出現
すると、この固有名詞は参考文献に関係する固有名詞で
あると見なせるので、翻訳されずに原文のまま残され
る。
【0020】請求項5及び請求項6の翻訳方法及び機械
翻訳装置においては、文書中に同一意味を有する連続し
た略語句(略式名称)と正式語句(正式名称)との複数
の語句が存在した場合は、両方の語句とも翻訳されな
い。すなわち、例えば、[略称(正式名称)]の連続し
た語句の記載があった場合は、いずれも翻訳されない。
【0021】
【実施例】以下本発明の実施例を図面を用いて説明す
る。 (第1実施例)図1は第1実施例の翻訳方法が適用され
た機械翻訳装置の概略構成を示すブロック図である。
【0022】この実施例の機械翻訳装置は例えばコンピ
ュータ等の情報処理装置で構成されている。そして、ア
プリケーションプログラム上にソフト的に構成された制
御部1に対して、外部から入力部を介して書込まれた翻
訳対象とする文書を記憶する例えばHDD内に形成され
た記憶部2、CRT表示装置,ビットマップディスプレ
イ,ゴーグル,壁への投影等の翻訳前の文書や翻訳文等
を表示するための表示部3、翻訳対象の文書が入力され
ると共に、操作者が各種操作指令を入力するためのキー
ボード,マウス,ライトペン,デジタイザ等で構成され
た入力部4等が接続されている。
【0023】さらに、前記制御部1は、同じくアプリケ
ーションプログラム上にソフト的に構成された翻訳部
5、見出し部検出部6及び参考文献開始判定部7が接続
されている。また、翻訳部5にはデータベース上に形成
された知識辞書8が接続されてている。
【0024】翻訳部5は入力された第1の言語で記述さ
れた文を知識辞書8を参照しながら第2の言語の文へ翻
訳する。見出し部分検出部6は、入力された各文に含ま
れる各語句から見出し部分を検出する。具体的には、文
書中に含まれる見出し部分を特定するための下記に示す
各情報(例えば英語の場合) (a) 全部大文字又は基幹語の先頭が全て大文字 (b) 章番号,節番号等が先頭につく (C) ピリオド等が行末になく、改行されており、次の行
と接続なし を検出して、この情報が含まれる部分を見出し部分とし
て検出する。
【0025】次の参考文献開始判定部7は、見出し部分
検出部6で順次検出される見出し部分について、その記
載内容が参考文献の記述開始を示すものであるか否かを
判定する。
【0026】制御部1はこの機械翻訳装置全体の動作を
制御する機能を有している。そして、図3に示す流れ図
に従って記憶部2に記憶されている文書に対する翻訳処
理を実行する。
【0027】流れ図が開始され、P(プログラム・ステ
ップ)1にて記憶部2に記憶されている文書のうちの1
つの文を読出して文書Aとする。P2にて、文書Aの一
つの文の分番号iを1に初期設定し、文献文章フラグF
を0に初期設定する。
【0028】P3にて、文書Aのi番目の文を読出して
文Bとする。そして、この文Bを見出し部検出部6へ送
出する(P4)。見出し部検出部6は前述した手法でこ
の文が見出し部分であるか否かを判定する。見出し部分
の場合(P5)、文Bを参考文献開始判定部7へ送出す
る(P6)。
【0029】参考文献開始判定部7は図2に示す流れ図
に従って、該当見出し部分が参考文献開始か否かを判定
する。すなわち、文Bが[参考文献],[文献],[Re
ffarence]等の語句の場合はこの見出し部は参考文献の
開始を示すものてあり、その他の場合は、通常の見出し
部分であると判断する。
【0030】図3のP7において、該当見出し部が参考
文献の開始を示す場合は、文献文章フラグFを1に設定
する(P8)。そして、この文Bを翻訳部5へ送付して
(P9)、翻訳部5から翻訳結果を得て、例えば表示部
3へ出力する(P10)。一つの文に対する翻訳処理が
終了すると、文番号iが最終文番号iE に達していない
ことを確認すると(P11)、文番号iを更新して(P
12)、P3へ戻る。
【0031】また、P7で文献開始以外の通常の見出し
部の場合は、文献文章フラグFを0に戻す(P13)。
また、P5にて、文Bが見出し部ではなくて通常の文の
場合は、文献文章フラグFの値を調べて(P14)、1
に設定されていた場合は、文Bは文献文章中の文である
と判断して、翻訳していない文Bをそのまま翻訳結果と
してP10へ進む。P14にて0に設定されていた場合
は、該当文Bは通常の文章に含まれる文であるので、P
9へ進み、該当文Bを翻訳する。
【0032】P11にて、文番号iが最終文番号iE
達すると、この文書Aに対する翻訳処理を終了する。こ
のように構成された機械翻訳装置においては、語記憶部
2に記憶されている翻訳すべき文書Aに含まれる各見出
し部が見出し部分検出部6で順次検索されていく。そし
て、検出された見出し部が参考文献開始判定部7で参考
文献の記載開始を示す見出し部分であると判定された場
合は、この見出し部分から次の見出し部分までに含まれ
れる各文は翻訳されない。
【0033】すなわち、論文等のように文書の最終位置
に行を改めて[参考文献]等の見出し部分に続いて、こ
の論文で引用されたり参考にされた文献の一覧が記載さ
れた欄(文章)がある場合は、この文献の一覧は翻訳さ
れない。
【0034】(第2実施例)図4は本発明の第2実施例
の機械翻訳装置の概略構成を示すブロック図である。図
1の第1実施例装置と同一部分には同一符号が付してあ
る。したがって、重複する部分の詳細説明を省略する。
【0035】この実施例の機械翻訳装置装置において
は、翻訳部5,見出し部検出部6,及び参考文献開始判
定部7の他に、固有名詞抽出部9,翻訳不要句設定部1
0及び固有名詞記憶部11が設けられている。
【0036】固有名詞抽出部9は入力される各文に含ま
れる著者名,書名、雑誌名、出版会社名等の固有名詞を
抽出する。具体的には、「 」や” ”や「、」で区切
られた部分を1つの固有名詞の塊として抽出する。これ
によって、例えば、「E.ITHO,New Machine Translation
System,T-journal,1994」の一連の語句より「E.ITHO」
「New Machine Translation System」「T-journal 」と
いう固有名詞を抽出できる。
【0037】固有名詞記憶部11は固有名詞抽出部9に
よって、抽出された固有名詞を記憶する。また、翻訳不
要句設定部10は記憶部2から順次読出した文書Aの各
文Bに、前記固有名詞記憶部11に記憶されている固有
名詞が発見された場合に該当固有名詞に翻訳不要のフラ
グを付与する機能を有する。
【0038】そして、制御部1は、図5及び図6に示す
流れ図に従って、記憶部2に記憶されている文書に対す
る翻訳処理を実行する。図5の流れ図のQ1〜Q8まで
の処理動作は、図3におけるP1〜P8までの処理動作
と同じであるので、説明を省略する。
【0039】Q8において、検出した見出し部分が参考
文献開始を示す場合に文献文章フラグFを1に設定し、
Q9へ進み、文番号iが最終文番号iE に達していない
場合に文番号iを更新して(Q10)、Q3へ戻る。
【0040】また、Q7で文献開始以外の通常の見出し
部の場合は、文献文章フラグFを0に戻す(P12)。
また、Q5にて、文Bが見出し部分ではなくて通常の文
の場合は、文献文章フラグFの値を調べて(P13)、
1に設定されていた場合は、文Bは文献文章中の文であ
ると判断して、前述したように、該当文Bを「 」や”
”や「、」で区切られた部分を分離して(Q14)、
分離された語句を固有名詞と見なして、固有名詞記憶部
11に登録する(Q15)。そして、Q9へ進む。Q1
3にて0に設定されていた場合は、該当文Bは通常の文
章に含まれる文であるので、Q9へ進む。
【0041】Q9にて、文番号iが最終文番号iE に達
すると、この文書Aに対する文献文章中に出現する著者
名,書名、雑誌名、出版会社名等の固有名詞の固有名詞
記憶部11に対する登録処理を終了する。
【0042】次に、Q16で文番号iを1の初期値に戻
し、文書Aに対する実際の翻訳処理を開始する。Q17
にて、記憶部2に記憶されている文書Aのうちのi番目
の文を読出して文Cとする。Q18にて、この文Cを翻
訳不要句設定部10へ送出する。
【0043】翻訳不要句設定部10は、Q19にて、固
有名詞記憶部11に記憶されている固有名詞の語句が入
力した文Cに含まれるか否かを判断して、含まれる場合
は、該当語句を翻訳不要句と設定する。そして、この翻
訳不要句を分む文Cを翻訳部5へ送出する。なお、翻訳
不要句が含まれない場合はこの文Cをそのまま翻訳部5
へ送出する。
【0044】翻訳部5は、翻訳不要句設定部10から入
力された文Cを翻訳する(Q21)。この場合、文Cに
翻訳不要句と設定された語句が存在する場合は、この語
句は翻訳しない。
【0045】一つのの文Cに対する翻訳処理が終了する
と、文番号iが最終文番号iE に達していないことを確
認(Q22)し、文番号iを更新して(Q23)、Q1
7へ戻る。
【0046】Q22にて、文番号iが最終文番号iE
達すると、この文書Aに対する翻訳処理を終了する。こ
のように構成された機械翻訳装置においては、記憶部2
に記憶されている翻訳対象の文書Aの例えば末尾に参考
文献の一覧が記載された文章における各文Cに含まれる
著者名,書名,文献名等の固有名詞が検出されて固有名
詞記憶部11に記憶保持される。
【0047】そして、次に、入力された文書Aの各文C
を順番に翻訳していく過程で、固有名詞記憶部11に記
憶された固有名詞が出現すると、この固有名詞は参考文
献に関係する固有名詞であると見なせるので、翻訳され
ずに原文のまま残される。
【0048】すなわち、文書Aの参考文献欄ではなく
て、本文中に含まれる参考文献に関する固有名詞は翻訳
されないので、不必要な翻訳が実施される事なく、常識
的な非常に読みやすい文書にできる。
【0049】(第3実施例)図7は本発明の第3実施例
の機械翻訳装置の概略構成を示すブロック図である。図
4の第2実施例装置と同一部分には同一符号が付してあ
る。したがって、重複する部分の詳細説明を省略する。
【0050】この実施例の機械翻訳装置装置において
は、翻訳部5と翻訳不要句設定部10の他に、連続統一
語句検出部12が設けられている。この連続統一語句検
出部12は、入力された文に略称と正式名称とが併記さ
れているか否かを調べる。例えば、「公取委(公正取引
委員会)」の各語句が存在する場合は、括弧内を「公
正」「取引」「委員会」のように各単語に分解して、そ
の頭文字を集めた「公取委」が括弧直前の語句と比較し
て、等しい場合は略称と正式名称とが併記されていると
判断する。さらに、「MAX (MultiAmeni
ty eXpress」の連続語句の場合は、括弧内の
大文字部分が括弧直前の語句と比較して、等しい場合は
併記されていると判断する。
【0051】翻訳不要句設定部10は記憶部2から順次
読出した文書の各文に、上述したように同一意味を有す
る語句が連続した場合は、両方の語句に対して翻訳不要
のフラグを付与する機能を有する。
【0052】そして、制御部1は、図8及び図9に示す
流れ図に従って、記憶部2に記憶されている文書に対す
る翻訳処理を実行する。図8の流れ図が開始され、S
(ステップ)1にて記憶部2に記憶されている文書のう
ちの1つの文を読出して文書Aとする。S2にて、文書
Aの一つの文の分番号iを1に初期設定する。S3に
て、文書Aのi番目の文を読出して文Bとする。そし
て、この文Bを連続同一語句検出部12へ送出する(S
4)。
【0053】連続同一語句検出部12は、図9に示す流
れ図に従って、この文Bに同一意味を有する連続語句
(語句併記)が存在するか否かを判定する。図9の流れ
図のS11にて文Bを受領すると、文Bに括弧が存在す
れば(S12)、括弧内の文字列をEとし、括弧直前の
単語(語句)をDとする(S13)。文字列Eを形態素
解析して単語毎に分割する(S14)。そして、 (1) 文字列Eの各単語の先頭文字を継げると、括弧直
前の単語(語句)Dに一致した場合(S15) (2) 文字列Eの大文字部分を継げると、括弧直前の単
語(語句)Dに一致した場合(S16) (3) 文字列Eにおける各文字のうちフォントが他の文
字と異なる文字を継げると、括弧直前の単語(語句)D
に一致した場合(S17) のいずれかの条件を満たすと、S21へ進み、読出した
文Bには語句の併記が存在すると判定する。
【0054】(1)(2)(3) のいずれの条件も満たさない場
合は、S18にて文字列Eを翻訳部5で翻訳して翻訳結
果をFとする。また、S19にて括弧直前の単語(語
句)Dを同様に翻訳して翻訳結果をGとする。S20に
て、翻訳結果F,Gどおしを比較して、等しい場合は、
読出した文Bには語句の併記が存在すると判定する。
【0055】S20にて等しくない場合、及びS12に
て、読出した文Bに括弧が無い場合は、S22にて、こ
の文Bには同一意味を有する連続語句(語句併記)が存
在しないと判断する。
【0056】連続同一語句検出部10における判定処理
が終了すると、図8のS5へ戻り、併記箇所が存在する
場合はS6へ進む。S6においては、翻訳不要句設定部
10を起動して、文Bにおける同一意味を有する連続す
る2つの語句(併記語句)を翻訳不要句に設定して、こ
の翻訳不要句に設定された語句が存在する文Bを翻訳部
5へ送出する(S7)。
【0057】なお、S5にて、併記箇所が存在しないと
判定された場合は、入力された文Bをそのまま翻訳部5
へ送出する(S7)。翻訳部5は、入力された文Bを翻
訳して、翻訳結果を例えば表示部3へ出力する(S
8)。この場合、文Bに翻訳不要句と設定された語句が
存在する場合は、この語句は翻訳しない。
【0058】一つのの文Bに対する翻訳処理が終了する
と、文番号iが最終文番号iE に達していないことを確
認(S9)し、文番号iを更新して(S10)、S3へ
戻る。
【0059】S9にて、文番号iが最終文番号iE に達
すると、この文書Aに対する翻訳処理を終了する。この
ように構成された機械翻訳装置においては、記憶部2に
記憶されている翻訳対象の文書Aにおいて、例えば[略
称(正式名称)]等のように、同一意味を有する語句が
連続した場合は、両方の語句とも翻訳されない。
【0060】実施例装置において、「This is a MTS(Ma
chine Translation System).」の記載が存在した場合
は、この記載に対して「これはMTS(機械翻訳システ
ム)」と翻訳せずに、「これは MTS(Machine Translati
on System). 」と翻訳する。
【0061】このように、略称と正式名称とが併記され
た場合は、両方とも翻訳しないことにより、両方を翻訳
した場合における不自然な文になることが未然に防止さ
れる。
【0062】さらに、前述したように、括弧の内側(正
式名称)を翻訳しない、等の一方のみを翻訳しない場合
は、略号と正式名称との関係が不明瞭になってしまが、
本発明においては、このような不自然さが解消される。
【0063】
【発明の効果】以上説明したように本発明の翻訳方法及
び機械翻訳装置においては、文書又は分に含まれる見出
し部分を検出して、検出された見出し部分が参考文献の
記載開始を示す見出し部分の場合は、この見出し部分か
ら次の見出し部分までに含まれる各文の翻訳を停止して
いる。したがって、論文等において引用されたり参照さ
れた文献やその一覧等の翻訳不要な文章は翻訳されない
ので、翻訳処理効率を向上できると共に、より自然な翻
訳文が得られる。
【0064】また、文末の参考文献の一覧に記載された
著者名,書名,文献名等の固有名詞が検出されて記憶保
持され、入力された文書の各文を順番に翻訳していく過
程で、記憶部に記憶された固有名詞が出現すると、この
固有名詞は参考文献に関係する固有名詞であると見なせ
るので、翻訳されずに原文のまま残される。したがっ
て、本文中における翻訳不要の固有名詞は翻訳されない
ので、さらに自然な翻訳文書が得られる。
【0065】さらに、文書中に同一意味を有する略語句
と正式語句とが連続した場合は、両方の語句とも翻訳を
しない。したがって、略称と正式名称とが併記された場
合は、両方とも翻訳しないことにより、両方を翻訳する
と翻訳結果として同一語句が連続する不自然な翻訳文書
になることが未然に防止される。
【図面の簡単な説明】
【図1】 本発明の第1実施例の翻訳方法を適用した機
械翻訳装置の概略構成を示すブロック図
【図2】 同実施例装置の参考文献開始判定部の動作を
示す流れ図
【図3】 同実施例装置の制御部の動作を示す流れ図
【図4】 本発明の第2実施例の翻訳方法を適用した機
械翻訳装置の概略構成を示すブロック図
【図5】 同実施例装置の制御部の動作を示す流れ図
【図6】 同じく同制御部の動作を示す流れ図
【図7】 本発明の第3実施例の翻訳方法を適用した機
械翻訳装置の概略構成を示すブロック図
【図8】 同実施例装置の制御部の動作を示す流れ図
【図9】 同実施例装置の連続同一語句判定部の動作を
示す流れ図
【符号の説明】
1…制御部、2…記憶部、3…表示部、4…入力部、5
…翻訳部、6…見出し部分検出部、7…参考文献開始判
定部、8…知識辞書、9…固有名詞抽出部、10…翻訳
不要句設定、11…固有名詞記憶部、12…連続同一語
句検出部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力される第1の言語で記述された文書
    又は文を第2の言語で記述された文書又は文に順次翻訳
    していく際に、前記入力される第1の言語の文書に含ま
    れる又は各文間に位置する各見出し部分を入力時に検出
    していき、前記検出される見出し部分が参考文献の記述
    開始を示す見出し部分のとき、次の見出し部分までの翻
    訳を行わずに、その間に入力された前記第1の言語で記
    述された文書又は文をそのまま、前記第2の言語で記述
    された文書内の対応する位置に記述することを特徴とす
    る翻訳方法。
  2. 【請求項2】 入力される第1の言語で記述された文書
    又は文を第2の言語で記述された文書又は文に順次翻訳
    していく翻訳部と、 前記入力される第1の言語の文書に含まれる又は各文間
    に位置する各見出し部分を入力時に検出していく見出し
    部分検出手段と、 この見出し部分検出手段にて検出される見出し部分が参
    考文献の記述開始を示す見出し部分か否かを判定する参
    考文献開始判定手段と、 この参考文献開始判定手段にて参考文献開始と判定され
    たとき、前記見出し部分検出手段が次の見出し部分を検
    出するまで前記翻訳部における翻訳を行わずに、その間
    に入力された前記第1の言語で記述された文書又は文を
    そのまま、前記第2の言語で記述された文書内の対応す
    る位置に記述する翻訳部停止制御手段とを備えたことを
    特徴とする機械翻訳装置。
  3. 【請求項3】 入力される第1の言語で記述された文書
    に含まれる又は各文間に位置する各見出し部分を順次検
    出していき、この検出される見出し部分が参考文献の記
    述開始を示す見出し部分のとき、次の見出し部分までに
    入力される文書又は文に含まれる著者名,書名,文献名
    等の固有名詞を検出して記憶しておき、次に、前記入力
    された第1の言語で記述された文書又は文を第2の言語
    で記述された文書又は文に順次翻訳していく際に、前記
    入力された文書又は文に前記記憶された固有名詞が検出
    されると、この固有名詞に対する翻訳を行わずに、この
    固有名詞をそのまま前記第2の言語で記述された文書内
    の対応する位置に記述することを特徴とする翻訳方法。
  4. 【請求項4】 入力される第1の言語で記述された文書
    に含まれる又は各文間に位置する各見出し部分を検出し
    ていく見出し部分検出手段と、 この見出し部分検出手段にて検出される見出し部分が参
    考文献の記述開始を示す見出し部分か否かを判定する参
    考文献開始判定手段と、 この参考文献開始判定手段にて参考文献開始と判定され
    たとき、前記見出し部分検出手段が次の見出し部分を検
    出するまでに入力される文書又は文に含まれる著者名.
    書名,文献名等の固有名詞を検出する固有名詞検出手段
    と、 この固有名詞検出手段にて検出された固有名詞を記憶す
    る固有名詞記憶部と、 前記入力された第1の言語で記述された文書又は文を第
    2の言語で記述された各文に順次翻訳していく翻訳部
    と、 前記入力される文書又は文に前記固有名詞記憶部に記憶
    された固有名詞が含まれるときこの固有名詞に対する前
    記翻訳部における翻訳を行わずに、この固有名詞をその
    まま前記第2の言語で記述された文書内の対応する位置
    に記述する翻訳部停止制御手段とを備えたことを特徴と
    する機械翻訳装置。
  5. 【請求項5】 入力される第1の言語で記述された文書
    又は文を第2の言語で記述された文書又は文に順次翻訳
    していく際に、前記入力される第1の言語の文書又は文
    に含まれる同一意味を有する連続した略語句と正式語句
    との複数の語句を検出していき、前記入力される文書又
    は文にこの同一意味を有する連続した複数の語句が検出
    されると、この複数の語句に対する翻訳を行わずに、こ
    の複数の語句をそのまま、前記第2の言語で記述された
    文書内の対応する位置に記述することを特徴とする翻訳
    方法。
  6. 【請求項6】 入力される第1の言語で記述された文書
    又は文を第2の言語で記述された文書又は文に順次翻訳
    していく翻訳部と、 前記入力される第1の言語の文書又は文に含まれる同一
    意味を有する連続した略語句と正式語句との複数の語句
    を検出する連続同一語句検出手段と、 この連続同一語句検出手段にて同一意味を有する連続す
    る複数の語句が検出されたとき、この複数の語句に対す
    る翻訳を行わずに、この複数の語句をそのまま、前記第
    2の言語で記述された文書内の対応する位置に記述する
    翻訳部停止制御手段とを備えたことを特徴とする機械翻
    訳装置。
JP20715295A 1995-08-14 1995-08-14 翻訳方法及び機械翻訳装置 Expired - Fee Related JP3394856B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20715295A JP3394856B2 (ja) 1995-08-14 1995-08-14 翻訳方法及び機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20715295A JP3394856B2 (ja) 1995-08-14 1995-08-14 翻訳方法及び機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH0954775A true JPH0954775A (ja) 1997-02-25
JP3394856B2 JP3394856B2 (ja) 2003-04-07

Family

ID=16535088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20715295A Expired - Fee Related JP3394856B2 (ja) 1995-08-14 1995-08-14 翻訳方法及び機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3394856B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1277136A2 (en) * 2000-04-24 2003-01-22 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
JP2009157882A (ja) * 2007-12-28 2009-07-16 Ricoh Co Ltd 翻訳支援システム、翻訳支援方法及びプログラム
JP2010272079A (ja) * 2009-05-25 2010-12-02 Toshiba Corp 機械翻訳装置、方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612447A (ja) * 1992-03-31 1994-01-21 Toshiba Corp 要約文章作成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612447A (ja) * 1992-03-31 1994-01-21 Toshiba Corp 要約文章作成装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1277136A2 (en) * 2000-04-24 2003-01-22 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
JP2009157882A (ja) * 2007-12-28 2009-07-16 Ricoh Co Ltd 翻訳支援システム、翻訳支援方法及びプログラム
JP2010272079A (ja) * 2009-05-25 2010-12-02 Toshiba Corp 機械翻訳装置、方法及びプログラム

Also Published As

Publication number Publication date
JP3394856B2 (ja) 2003-04-07

Similar Documents

Publication Publication Date Title
US5010486A (en) System and method for language translation including replacement of a selected word for future translation
JPS62203273A (ja) 機械翻訳システム
JPH04229364A (ja) 強調特性変更方法及びシステム
JP2004220616A (ja) 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置
JP3273782B2 (ja) 機械翻訳方法
JP3394856B2 (ja) 翻訳方法及び機械翻訳装置
JP4350566B2 (ja) 機械翻訳システム
US5640581A (en) CD-ROM information editing apparatus
JPS6118074A (ja) プレ・エデイツト方式
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2570681B2 (ja) ワード・プロセッサ
JP3696765B2 (ja) 辞書作成装置、辞書作成方法、辞書作成プログラムを記録したコンピュータで読取可能な記録媒体および翻訳装置
JPH0765008A (ja) 用語登録制御方法及び同装置
JPH1021242A (ja) 機械翻訳装置及び機械翻訳後編集方法
JP3378267B2 (ja) 機械翻訳装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPH03233669A (ja) 文書作成装置
JP3278889B2 (ja) 機械翻訳装置
JP2682048B2 (ja) 文章処理装置
JP2000029882A (ja) 要約文作成装置
JP3014746B2 (ja) 機械翻訳装置
JP2010055561A (ja) 電子辞書、電子辞書における検索方法、およびプログラム
JPH05257969A (ja) 機械翻訳方法および装置
JPH0773185A (ja) 機械翻訳装置及び方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080131

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090131

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100131

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100131

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110131

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120131

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130131

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140131

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees