JPH04348466A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH04348466A
JPH04348466A JP3010835A JP1083591A JPH04348466A JP H04348466 A JPH04348466 A JP H04348466A JP 3010835 A JP3010835 A JP 3010835A JP 1083591 A JP1083591 A JP 1083591A JP H04348466 A JPH04348466 A JP H04348466A
Authority
JP
Japan
Prior art keywords
word
editing
post
words
superordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3010835A
Other languages
English (en)
Inventor
Yukio Yamamoto
由紀雄 山本
Masaki Matsudaira
正樹 松平
Hitoshi Sakamoto
仁 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3010835A priority Critical patent/JPH04348466A/ja
Publication of JPH04348466A publication Critical patent/JPH04348466A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、任意の言語の文章を他
の言語に翻訳する機械翻訳システムに関し、特に、翻訳
後の編集支援機能に関するものである。
【0002】
【従来の技術】機械翻訳システムを用いて翻訳した文章
は、現在のところ、全てが完全とは言い難く、読みずら
い文章や誤訳の文章が生じることを避け得ない。そこで
、翻訳された文章が、翻訳言語による自然なより完全な
文章になるように、翻訳処理に先立ち、入力する原文(
入力文)を予め翻訳しやすいように修正したり、翻訳さ
れた訳文(出力文)を修正して理解しやすい文にするよ
うなことが行われている。なお、前者の修正のことは前
編集と呼ばれ、後者の修正のことは後編集と呼ばれてい
る。これら前編集及び後編集は、機械翻訳システムの翻
訳能力を越えた部分を補うものであるので、人間が中心
的に行なう。
【0003】このような機械翻訳システムでの翻訳処理
と、人間が行なう前編集・後編集とを組み合わせること
により、効率良く、高品質の訳文を得ることができる。
【0004】ところで、多くの機械翻訳システムにおい
ては、このシステム上で人間が前編集や後編集を容易に
実行できるような支援機能を有する(例えば、特開昭6
3−273165 号公報)。このような機械翻訳シス
テムが支援する後編集機能は、翻訳文一文内で、単語を
別表現にしたり、単語の順序の入換えを行なったりする
ものであった。
【0005】
【発明が解決しようとする課題】ところで、編集者が後
編集を行う際には、訳文1文のみでなく、対象としてい
る文の前後に現れる文も考慮して、わかりやすい訳文に
修正していかなければならない。
【0006】しかし、従来システムにおける後編集の支
援では、一文を表示しての支援であって一文内のみの情
報を利用させるようなものであるため、対象としている
文の前後に現れる文の情報を人間が利用し難いものであ
った。実際上、対象としている文の前後に現れる文の情
報を利用して後編集を行なうことが適当な場合がある。 例えば、2つの文に現れる別々の単語が同じものを意味
している場合があり、その場合には、訳語(表現)を同
じにしたり、後の文中の単語を代名詞に置き換えること
が適当である。
【0007】本発明は、以上の点を考慮してなされたも
のであり、訳文を後編集する際に、文章全体中の各単語
の上位、下位関係を認識し、その情報を利用するように
支援できて、最終的な訳文をより完全なものとすること
ができる使い勝手の良好な機械翻訳システムを提供しよ
うとするものである。
【0008】
【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、任意言語の入力文を目的言語に
翻訳した訳文に対して行なう後編集の支援機能を有する
機械翻訳システムにおいて、以下の各部を設けた。
【0009】すなわち、各単語の上位、下位関係を格納
した上下位関係格納部と、この上下位関係格納部を利用
して訳文内での上位語、下位語関係を認識する上下位関
係認識部と、認識した上下位語関係を、編集者が知得で
きる形態で提示する後編集支援部とを設けた。
【0010】
【作用】本発明においては、各単語の上位、下位関係を
格納した上下位関係格納部を予め作成して用意しておく
。そして、任意言語の原文を目的言語に翻訳した訳文が
得られると、上下位関係認識部は、上下位関係格納部を
利用して訳文内での上下位語関係を認識し、後編集支援
部は、認識した上下位語関係を編集者が知得できる形態
で提示する。
【0011】これにより、編集者は、訳文の後編集の際
に、訳語の統一や名詞の代名詞の変換などを容易に行な
うことができる。
【0012】
【実施例】以下、本発明の一実施例を図面を参照しなが
ら詳述する。なお、この実施例は、原文が日本語で訳文
が英語の場合である。
【0013】この実施例の機械翻訳システムも、ハード
ウェア的には、一般のコンピュータシステム(ワークス
テーション)と同様な構成を有する。すなわち、中央処
理装置(CPU)、主記憶装置、補助記憶装置、キーボ
ード入力装置、CRTディスプレイ装置、プリンタ装置
、光学式文字読取装置(OCR)等から構成されており
、これ以上のハードウェアについての説明は省略する。
【0014】図1は、実施例の機械翻訳システムの機能
ブロック図である。図1に示すように、この実施例の機
械翻訳システムは主に、翻訳部10、上下位関係認識部
20及び後編集支援部30から構成されている。
【0015】翻訳部10は、機能的には、形態素解析部
11、構文解析部12、意味解析部13、意味生成部1
4、構文生成部15及び形態素生成部16から構成され
ている。入力原文は、形態素解析部11に入力され、各
機能部11〜16によって順次処理されて、形態素生成
部16から訳文が出力される。
【0016】形態素解析部11は、入力文を単語に分割
し、各々の単語の品詞等の文法属性を認識する。この際
、原言語単語辞書17を利用する。構文解析部12は、
単語と単語の係り受け関係等を認識する。この際、単語
辞書17に格納されている原言語に関する文法規則知識
等を利用する。意味解析部13は、単語辞書17を利用
しながら、単語と単語の意味関係を認識して入力文の意
味表現を認識する。この段階で、単語に複数個の意味が
あるもの(多義語)の意味も限定する。なお、意味解析
の結果を意味表現と呼ぶ。この際、意味表現を抽出する
ための知識等を利用する。
【0017】各解析部11、12、13で参照される単
語辞書17は図2に示すように構成されている。すなわ
ち、見出し語17aと、その単語の品詞17bと、その
品詞についての詳細情報(品詞別情報;例えば普通名詞
や可算名詞等)17cと、その見出し語が有する複数の
意味に対する通し番号である意味No(従って意味No
は意味を特定している)17dと、意味情報17eとか
ら構成されている。
【0018】意味生成部14は、意味解析の結果に基づ
いて原言語の語を目的言語の語や句等に置き換える。さ
らに訳語の表層的情報(品詞や活用型など)のみでなく
、意味的情報(単語が複数個の意味を持つ場合、何番目
の意味であるか)も取得する。この際、原言語の単語と
目的言語の単語の対応をとる対訳辞書18が用いられる
。構文生成部15は、対訳辞書18を利用しながら、単
語と単語の係り受け関係を認識し、語順も決定する。 この際、目的言語に関する文法規則知識等を利用する。 形態素生成部16は、対訳辞書18を利用しながら、各
単語の語尾変化等の活用処理を行ない、目的とする訳文
を作成する。
【0019】各生成部14、15、16で参照される対
訳辞書18は、図3に示すように構成されている。すな
わち、原文言語の表現での見出し語18aと、その見出
し語の意味No18bと、その見出し語のその意味No
に対する訳語18cと、その訳語の意味No18dとか
ら構成されている。
【0020】翻訳部10は、後編集を実行しやすいよう
に、訳文だけでなく、原文も訳文に対応付けて、上下位
関係認識部20に出力する。原文は文章そのものである
が、訳文は、文内の単語の意味Noも付与されて出力さ
れる。これは、例えば「liquid」という単語には
形容詞、名詞等の2つの品詞があるが、意味Noによっ
て、どの品詞であるか、また多義語である場合にどの意
味であるかが判別できるようにするためである。この意
味Noは、上述した意味生成部14によって得られた情
報である。
【0021】上下位関係認識部20は、上下位関係テー
ブル21の格納内容に基づいて、訳文全体(複数の文か
らなることが多い)の上位語、下位語関係を認識し、上
下位語関係にある訳文上の単語には識別情報(上下位語
No)を付与して、翻訳部10から与えられた原文と共
に後編集支援部30に出力する。
【0022】図4は上下位関係格納部としての上下位関
係テーブル21の構成を示すものである。相互に上位語
と下位語の関係にある単語は1組にまとめられて上下位
語群を構成しており、上下位関係テーブル21は、上下
位語群を特定する上下位語No21aと、その上下位語
Noに属する単数または複数の見出し語及び意味Noを
有する上位部21bと、上下位語Noに属する見出し語
及び意味Noを有する下位部No21cとから構成され
ている。
【0023】後編集支援部30は、機能的には、後編集
実行部31と、上下位語検索部32と、単語指定上下位
語検索部33とから構成されている。後編集実行部31
は、原文及び訳文をディスプレイ上に表示すると共に、
編集者によって指示された内容に基づいて訳文を修正す
るものである。なお、意味Noや上下位語Noは表示さ
れない。上下位語検索部32は、編集者によって上下位
語検索処理モードが指示された場合に、上下位関係認識
部20において付与された上下位語Noを検索して訳文
内の上下位語関係をディスプレイ上に表示させるもので
ある。単語指定上下位語検索部33は、編集者によって
訳文上の単語が指定された上下位語検索処理モードが指
示された場合に、上下位関係認識部20において付与さ
れたその単語について上下位語Noを認識し、その上下
位語Noと等しい上下位語Noを有する訳文内の単語(
相互に上位語または下位語の関係にある単語)を検索し
てディスプレイ上に表示させるものである。
【0024】なお、後編集支援部30は、実際上ソフト
ウェアによって構成されており、その処理フローチャー
トは図5に示すようなものである。なお、図5(A)は
全体処理のフローチャート、図5(B)及び(C)はそ
の一部処理についての詳細フローチャートである。
【0025】編集者によって上下位語検索処理モードが
指示されたか否かを判断し(ステップ100)、指示さ
れた場合には図5(B)に示す上下位語検索処理を実行
し(ステップ101)、指示されない場合には直ちに後
述するステップ102に進む。
【0026】上下位語検索処理においては、まず、上下
位語Noが付与されている一組の単語群(上下位語群)
を検索してその組み合わせの各単語を他の単語と区別す
るように表示する(ステップ110)。例えば、それぞ
れの組に識別番号や下線を付与したり、反転表示したり
する。その後、編集者が指示した後編集(指示しない場
合もある)を実行する(ステップ111)。例えば、編
集者は上位語と下位語を同一の単語に置き換えるような
後編集を行なったり、後側の上位、下位語を代名詞に置
き換えるような後編集を必要に応じて実行する。その後
、他の上下位語単語群を表示するか否かを指示すること
を編集者に促し、編集者が指示した内容を取り込んで指
示内容を判別する(ステップ112)。他の上下位語単
語群を表示することが指示された場合には、全種類の上
下位語単語群に対する表示が終了していないことを確認
して(ステップ113)、上述したステップ110に戻
る。他の上下位語単語群についての表示を要しないこと
が指示された場合、及び、他の上下位語単語群を表示す
ることが指示されたが全種類の上下位語単語群に対する
表示が終了している場合には、上下位語検索処理を終了
する。
【0027】上下位語検索処理が指示されない場合、及
び、上下位語検索処理が指示されてその処理が終了した
場合には、図5(A)に示すように、単語を指定しての
上下位語検索処理モードが編集者によって指示されたか
否かを判断する(ステップ102)。指示された場合に
は図5(C)に示す単語指定上下位語検索処理を実行し
(ステップ103)、指示されない場合には直ちに後述
するステップ104に進む。
【0028】単語指定上下位語検索処理においては、ま
ず、編集者が指定した単語を取り込み(ステップ120
)、その単語に上下位語Noが付与されているか否かを
判断することで上位語と下位語の関係の単語があるか否
かを判断する(ステップ121)。上位、下位語がある
場合には、その単語群を検索してその組み合わせの各単
語を他の単語と区別するように表示する(ステップ12
2)。その後、編集者が指示した後編集(指示しない場
合もある)を実行する(ステップ123)。後編集が終
了した後、又は、指定された単語についての上下位語が
存在しない場合(ステップ121で否定結果)には、他
の単語を指定するか否かを指示することを編集者に促し
、編集者が指示した内容を取り込んでその内容を判別す
る(ステップ124)。他の単語を指定することが指示
された場合には上述したステップ120に戻り、他方、
他の単語を指定することが指示されない場合には単語指
定による上下位語検索処理を終了する。
【0029】単語指定による上下位語検索処理が指示さ
れない場合、及び、単語指定による上下位語検索処理が
指示されてその処理が終了した場合には、図5(A)に
示すように、後編集(上下位語の検索を利用しての後編
集以外の後編集もあるが図5では他のモードの後編集に
ついては省略している)の終了が指示されたか否かを判
別し(ステップ104)、指示されない場合には上述の
ステップ100に戻り、指示された場合には、一連の処
理を終了する。
【0030】このような処理を実行する後編集支援部3
0を利用した後編集によって、訳文がより完全なものと
なる。
【0031】以下、具体例を説明する。なお、翻訳部1
0に入力された原文及び翻訳部10によって得られた訳
文が以下にものとする。
【0032】[原文1]アセトンは無色である。
【0033】[原文2]その液体はヨードホルムの原料
である。
【0034】[訳文1]Acetone is col
orless.[訳文2]The liquid is
 raw material of jodform.
訳文は、上述したように文内の単語の意味Noも付与さ
れて出力される。例えば、訳文1及び訳文2は、以下の
ような構造で出力される。
【0035】[訳文1]Acetone[1]is[1
]colorless[1].[訳文2]The[1]
liquid[2]is[1]raw[2]mater
ial[1]of[1]jodform[1]. ここで、[  ]はその単語(熟語)の意味Noを意味
する。
【0036】このような意味Noが付与された訳文が入
力された上下位関係認識部20は、訳文単語の見出し語
とその意味Noとに基づき、しかも上下位関係テーブル
21を利用して各単語の上下位関係を認識する。上述の
例の場合、訳文中の「Acetone」(意味Noが1
)と「liquid」(意味Noが2)とは、上下位関
係テーブル21によって上位、下位関係があると認識さ
れる。上下位関係認識部20は、これらの単語に対して
同一の上下位語No(図4に置いては1)を付与して、
後編集支援部30に出力する。後編集支援部30に出力
された訳文の構造は、例えば以下のようになる。
【0037】[訳文1]Acetone[1](1)i
s[1]colorless[1]. [訳文2]The[1]liquid[2](1)is
[1]raw[2]material[1]of[1]
jodform[1]. ここで、()は上下位語Noであり、この()内の数字
が等しいものが上位語と下位語の関係にある単語である
【0038】後編集支援部30は、図6に示すように、
原文及び訳文を対応付けてディスプレイ上に表示するの
であるが、編集者によって上下位語検索処理が指定され
ると、与えられた訳文の上下位語Noに基づいて上位、
下位関係にある単語を検索し、それらをディスプレイ上
でわかりやすく表示する。なお、図6においては、下位
語である「Acetone」にアンダーラインを付し、
上位語である「liquid」を反転表示させて区別し
ている。
【0039】なお、同じ文章中に”water”(「水
面」という意味)という単語があっても”liquid
”の2番目の意味は「液体」であるから”liquid
”(意味No2)の下位関係の語ではない。このためア
ンダーラインが施されることはない。
【0040】編集者は、このように、後編集支援部30
を用いて、上位、下位関係を持つ単語の組合せを知るこ
とができるため、文章の理解が容易になり、後編集が行
い易くなる。これにより、訳語を統一したり、適宜単語
を代名詞に置き換えることが可能である。例えば、ある
文に下位語があり、次の文に(定冠詞)+上位語があっ
た場合、(定冠詞)+上位語を代名詞に置き換えること
などが行い易い。図6の例の場合では、訳文2における
「The liquid」を「It」に置き換えてもよ
いことがわかる。
【0041】従って、上述した実施例によれば、機械翻
訳システムによって翻訳された文章内で上位語と下位語
の関係にある単語を表示するようにしたので、編集者が
訳文の理解に要する時間が短縮され、さらに、訳文の後
編集の際に、訳語の統一や名詞の代名詞化が容易に行な
えるというように、使い勝手が向上する。また、後編集
された文章は非常にわかりやすい文章となる。
【0042】なお、本発明の対象言語は日本語及び英語
に限定されるものではない。また、双方向の機械翻訳シ
ステムに対して本発明を適用することができる。さらに
、認識した上位語と下位語の関係にある単語の編集者に
対する提示方法は、上述の実施例のものに限定されない
【0043】また、上下位語検索処理(ステップ101
)においては、上下位語群を1組だけ表示するようにし
たが、異なる複数組の上下位語群を同時に表示するよう
にしてもよい。このとき、異なる上下位語群は、網掛け
や色分け等でそれぞれ識別するようにする。
【0044】
【発明の効果】以上のように、本発明によれば、訳文に
おける上下位語を認識して後編集の際にその上下位語群
を表示するようにしたので、訳文を後編集する際に、編
集者がその文の前後の文の情報を利用するように支援で
きて、最終的な訳文をより完全なものとすることができ
る使い勝手の良好な機械翻訳システムを実現できる。
【図面の簡単な説明】
【図1】実施例の機能ブロック図である。
【図2】単語辞書17の構成を示す説明図である。
【図3】対訳辞書18の構成を示す説明図である。
【図4】上下位関係テーブル21の構成を示す説明図で
ある。
【図5】後編集支援部30の処理フローチャートである
【図6】後編集支援部30によるディスプレイ上の表示
例の説明図である。
【符号の説明】
10    翻訳部 20    上下位関係認識部 21    上下位関係テーブル(上下位関係格納部)
30    後編集支援部 31    後編集実行部 32    上下位語検索部 33    単語指定上下位語検索部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  任意言語の原文を目的言語に翻訳した
    訳文に対して行なう後編集の支援機能を有する機械翻訳
    システムにおいて、単語の上位、下位関係を格納した上
    下位関係格納部と、この上下位関係格納部を利用して訳
    文内での上位語、下位語関係を認識する上下位関係認識
    部と、認識した上下位語関係を、編集者が知得できる形
    態で提示する後編集支援部とを備えたことを特徴とする
    機械翻訳システム。
JP3010835A 1991-01-31 1991-01-31 機械翻訳システム Pending JPH04348466A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3010835A JPH04348466A (ja) 1991-01-31 1991-01-31 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3010835A JPH04348466A (ja) 1991-01-31 1991-01-31 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH04348466A true JPH04348466A (ja) 1992-12-03

Family

ID=11761412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3010835A Pending JPH04348466A (ja) 1991-01-31 1991-01-31 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH04348466A (ja)

Similar Documents

Publication Publication Date Title
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
KR900009120B1 (ko) 기계번역장치
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP2815714B2 (ja) 翻訳装置
JPH10312382A (ja) 類似用例翻訳システム
Sinhal et al. Machine translation approaches and design aspects
Kempen et al. Author environments: Fifth generation text processors
JPH04348466A (ja) 機械翻訳システム
Xaitqulov An overview of automated translation and its linguistic problems
JPH0561902A (ja) 機械翻訳システム
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JPH0410665B2 (ja)
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
Picchi et al. A translator’s workstation
JP2521435B2 (ja) 日本語生成装置
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JPH04321178A (ja) 機械翻訳システム
JP2687334B2 (ja) 機械翻訳装置
Tsujii The current stage of the Mu-Project
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH0635964A (ja) 機械翻訳装置
Pigott Systran Machine Translation Processing as an example of natural language understanding
JPH04130577A (ja) 自然言語処理装置
JPH07262194A (ja) 機械翻訳装置