JPH05257966A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH05257966A
JPH05257966A JP4052117A JP5211792A JPH05257966A JP H05257966 A JPH05257966 A JP H05257966A JP 4052117 A JP4052117 A JP 4052117A JP 5211792 A JP5211792 A JP 5211792A JP H05257966 A JPH05257966 A JP H05257966A
Authority
JP
Japan
Prior art keywords
field
range
translation
original
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4052117A
Other languages
English (en)
Inventor
Mikito Hirata
幹人 平田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4052117A priority Critical patent/JPH05257966A/ja
Publication of JPH05257966A publication Critical patent/JPH05257966A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 各種の分野の文章が混在する原文を翻訳する
際に、原文を指定した範囲に分けて、その範囲の分野を
自動的に推定することにより、あらかじめ分野を指定せ
ずに適切な翻訳を行えるようにする。 【構成】 原文入力手段1は、原文を入力する。辞書2
は、訳語及び翻訳に必要な情報を分野別に格納する。範
囲指定手段3は、文章中で分野を切り換える範囲を指定
する。分野判定手段4は、原文を範囲指定手段3によっ
て指定された範囲に区切ってその範囲内に出現した分野
を特定する語から辞書2を参照してその範囲の分野を決
定する。翻訳手段5は、辞書2から分野判定手段4によ
って決定された分野の訳語を優先して用いることにより
翻訳を行う。訳文出力手段6は、翻訳手段5で翻訳した
訳文を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳装置に関し、
特に、文書の翻訳を行う機械翻訳装置に関する。
【0002】
【従来の技術】翻訳を行う場合には、同一の語であって
も使われる分野によって、訳語が異なることが多い。そ
こで、従来の機械翻訳装置は、各種の分野の文章が混在
する文書を翻訳する際には、個々の文章毎に利用者があ
らかじめ分野を指定して、指定された分野の訳語を優先
して翻訳に使用していた。
【0003】
【発明が解決しようとする課題】上述した従来の機械翻
訳装置は、異なる分野の文章が混在している文書(例え
ば、雑誌や新聞など)では、利用者があらかじめ文章を
分けてその内容に目を通して、各々の範囲に対して分野
を指定しなければならいので、工数がかかるという欠点
を有している。
【0004】また、従来の機械翻訳装置は、システムで
用意された分野の種類が多い場合には、利用者にはどの
語に何の分野が割り当てられているかが解りづらいの
で、分野の決定も困難であり、結果としてコストがかか
るという欠点を有している。
【0005】
【課題を解決するための手段】本発明の機械翻訳装置
は、原文を入力するための原文入力手段と、訳語及び翻
訳に必要な情報を分野別に格納する辞書と、文章中で分
野を切り換える範囲を指定するための範囲指定手段と、
原文を前記範囲指定手段によって指定された範囲に区切
ってその範囲内に出現した分野を特定する語から前記辞
書を参照してその範囲の分野を決定する分野判定手段
と、前記辞書から前記分野判定手段によって決定された
分野の訳語を優先して用いることにより翻訳を行う翻訳
手段と、前記翻訳手段で翻訳した訳文を出力する訳文出
力手段とを有して構成されている。
【0006】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。図1は、本発明の機械翻訳装置の一実施例
を示すブロック図である。本発明の機械翻訳装置は、日
英翻訳や英日翻訳など任意の言語間の翻訳に適用できる
が、ここでは英日翻訳を例として以下に説明する。
【0007】本実施例の機械翻訳装置は、図1に示すよ
うに、原文入力手段1は、原文を入力するための手段で
あり、一般的には、CRTおよびキーボードであるが、
他にには、OCR入力装置や文書を扱う他のシステムが
出力した文のファイルを読み込むための装置である場合
もある。
【0008】辞書2は、原文言語の各見出し語毎に、訳
語及び各訳語に対して翻訳に必要な情報である品詞等の
解析情報や生成情報並びにその訳語が使われる分野の情
報を保持している。そして、特に、使用分野を限定せず
に用いられる訳語については「一般」という分野が付与
されている。「一般」という分野の訳語を持たない語
は、その語を含む文章の分野をいずれかに特定すべき語
であることを意味している。
【0009】図2は、辞書2に格納された情報内容の一
例を示す図である。図2に示すように、“airframe”は
「航空」分野に、“amplifier ”は「電気」分野に、そ
れぞれ、特徴的な語であることを示している。また、
“bay ”の訳語は、一般的には“湾”であるが、「航
空」分野では“隔室”となる。さらに、“current ”の
訳語は、一般的には“流れ”であるが、「電気」分野で
は“電流”となる。
【0010】一方、範囲指定手段3は、分野を切り換え
る文章の範囲を利用者が指定するための手段であり、利
用者が文章の構成のされ方に基づいて、例えば、文章中
の章,節,段落あるいは特定の文字列で区切られる範囲
等のどの範囲で分野を切り換えるかを指定する。
【0011】図3は、範囲指定手段3の分野切り換え範
囲指定画面の一例を示す図である。図3に示すように、
画面にメニューが表示されており、分野を切り換える範
囲として、前の四角が反転している「節」を指定してい
る。そして、メニュー中の「文字列」の項目では、特定
の文字や記号を入力する。なお、章,節,段落のいずれ
かの指定と「文字列」の指定とは、同時に可能である。
【0012】そこで、分野判定手段4は、第1に、原文
入力手段1から入力された原文を読み込み、範囲指定手
段3で指定された範囲に原文を区切る。
【0013】図4は、原文入力手段1から入力された原
文の一例を示す図である。分野切り換え範囲として節が
指定されていると、図4に示すように、“Section(1)”
の最初から“Section(2)”の前までの文を分野決定範囲
41として切り出す。
【0014】また、分野判定手段4は、第2に、区切ら
れた範囲内の文に対して、辞書2の情報を使うことによ
り、形態素解析を行って、語に分割する。第3に、分割
された語の中から、「一般」分野の訳語を持たない語す
なわち分野を特定する語を、その出現頻度とともに抽出
する。なお、同一語が複数回現れた場合にも、その数だ
け出現回数に加算する。
【0015】また、「一般」分野以外に、複数の分野を
持つ語については、その各々の分野に対して、出現回数
が加算されている。分野決定範囲41では、図4に下線
で示されているように、「航空」分野として“airfram
e”が2回、「電気」分野として“amplifier ”が1回
出現している。
【0016】図5は、分野判定手段4による分野情報の
一例を示す図である。分野判定手段4は、第4に、分野
を特定する語が最も多く出現する分野から順に、図5に
示すように、分野の優先度を付けて、分野決定範囲41
に対して、分野情報51を決定している。そして、分野
情報51は、「航空」を第1優先の分野とし、「電気」
を第2優先の分野としている。
【0017】そこで、翻訳手段5は、分野判定手段4か
ら、区切られた範囲毎に、その範囲内の原文と分野情報
とを受け取り、辞書2の解析情報や生成情報を用いて翻
訳を行い、訳文を生成している。このときに、ある語が
その範囲に対する分野情報の中の分野に属する訳語を持
っているならば、その範囲の分野の中で最も優先度の高
い分野の訳語を選んでいる。
【0018】図4の例では、分野決定範囲41の文中の
“bay ”という語について、分野情報がなければ、「一
般」分野として図2の辞書2により“湾”と訳されるけ
れども、分野情報51の中の第1優先である「航空」分
野の訳語を優先することにより、“隔室”という適切な
訳語を得ることができる。さらに、分野決定範囲41の
文中の“current ”という語についても、分野情報がな
ければ、「一般」分野として辞書2により“流れ”と訳
されるが、分野情報51の中の第2優先である「電気」
分野の訳語を優先することにより、“電流”という適切
な訳語を得ることができる。
【0019】最後に、訳文出力手段6は、翻訳手段5で
得られた訳文の出力を行うための手段であり、一般的に
はプリンタであるが、CRTや他のシステムへの入力と
して使用するためにファイルの形で出力する場合もあ
る。
【0020】
【発明の効果】以上説明したように、本発明の機械翻訳
装置は、異なる分野の文章が混在する文書においても、
その文書の構成に基づいて、指定された範囲に原文を区
切り、分野を特定する語の出現頻度から、その範囲の分
野を自動的に決定し、決定した分野の訳語を優先するこ
とによって、適切な訳語を得ることができるという効果
を有している。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置の一実施例を示すブロッ
ク図である。
【図2】辞書2に格納された情報内容の一例を示す図で
ある。
【図3】範囲指定手段3の分野切り換え範囲指定画面の
一例を示す図である。
【図4】原文入力手段1から入力された原文の一例を示
す図である。
【図5】分野判定手段4による分野情報の一例を示す図
である。
【符号の説明】
1 原文入力手段 2 辞書 3 範囲指定手段 4 分野判定手段 5 翻訳手段 6 訳文出力手段 41 分野決定範囲 51 分野情報

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 原文を入力するための原文入力手段と、
    訳語及び翻訳に必要な情報を分野別に格納する辞書と、
    文章中で分野を切り換える範囲を指定するための範囲指
    定手段と、原文を前記範囲指定手段によって指定された
    範囲に区切ってその範囲内に出現した分野を特定する語
    から前記辞書を参照してその範囲の分野を決定する分野
    判定手段と、前記辞書から前記分野判定手段によって決
    定された分野の訳語を優先して用いることにより翻訳を
    行う翻訳手段と、前記翻訳手段で翻訳した訳文を出力す
    る訳文出力手段とを有することを特徴とする機械翻訳装
    置。
JP4052117A 1992-03-11 1992-03-11 機械翻訳装置 Pending JPH05257966A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4052117A JPH05257966A (ja) 1992-03-11 1992-03-11 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4052117A JPH05257966A (ja) 1992-03-11 1992-03-11 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH05257966A true JPH05257966A (ja) 1993-10-08

Family

ID=12905935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4052117A Pending JPH05257966A (ja) 1992-03-11 1992-03-11 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH05257966A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086143A (ja) * 2008-09-30 2010-04-15 Toshiba Corp 機械翻訳システム及び機械翻訳プログラム
JP2011095802A (ja) * 2009-10-27 2011-05-12 Toshiba Corp 機械翻訳装置及びプログラム
USRE45530E1 (en) 1999-05-14 2015-05-26 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE45530E1 (en) 1999-05-14 2015-05-26 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use
JP2010086143A (ja) * 2008-09-30 2010-04-15 Toshiba Corp 機械翻訳システム及び機械翻訳プログラム
JP2011095802A (ja) * 2009-10-27 2011-05-12 Toshiba Corp 機械翻訳装置及びプログラム

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
KR100330801B1 (ko) 언어식별장치및언어식별방법
JPH0433069B2 (ja)
JPH05303590A (ja) 自動翻訳装置
JPH0535783A (ja) タイポグラフイカル情報付き文書の翻訳装置
JPH05257966A (ja) 機械翻訳装置
JP2638187B2 (ja) 文章要約装置
JP2838984B2 (ja) 汎用参照装置
JPH0683812A (ja) 文書入力装置のかな漢字変換装置
JPS61248160A (ja) 文書情報登録方式
JPH0561902A (ja) 機械翻訳システム
JPH06223113A (ja) 電子ファイリング装置
JPH0668070A (ja) 複合語辞書登録装置
JPH02144763A (ja) 仮名漢字変換装置
JPH0612453A (ja) 未知語抽出登録装置
JPH07152778A (ja) 文書検索装置
JPS6366665A (ja) 文書解析整形装置
JPS6395565A (ja) 仮名漢字変換手法
JPH09134358A (ja) 機械翻訳装置
JPH05225226A (ja) 機械翻訳装置
JPH04270450A (ja) 文書作成装置
JPH11238060A (ja) 自然言語処理装置
JPH04153878A (ja) 機械翻訳装置における前編集支援処理装置
JPH11232268A (ja) 文書処理装置、ルビ割り付け方法、及び記録媒体
JPH0512332A (ja) 翻訳処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981215