JPH0855121A - 文対応装置及び原文と訳文の対応付け方法 - Google Patents

文対応装置及び原文と訳文の対応付け方法

Info

Publication number
JPH0855121A
JPH0855121A JP6207937A JP20793794A JPH0855121A JP H0855121 A JPH0855121 A JP H0855121A JP 6207937 A JP6207937 A JP 6207937A JP 20793794 A JP20793794 A JP 20793794A JP H0855121 A JPH0855121 A JP H0855121A
Authority
JP
Japan
Prior art keywords
sentence
translated
text
original
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6207937A
Other languages
English (en)
Inventor
Sanae Anraku
早苗 安樂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6207937A priority Critical patent/JPH0855121A/ja
Publication of JPH0855121A publication Critical patent/JPH0855121A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 共通性の低い言語間の文どうしであっても正
確な対応付けを行うことのできる文対応装置を提供する
ことを目的とする。 【構成】 原文と訳文との対応付けを行う制御部11
と、原文中のキーワードを格納するキーワード格納部1
2と、訳文を格納する訳文格納部13と、訳文中に含ま
れるキーワードの数をカウントして格納するカウント結
果格納部14と、原語テキスト中のすべてのキーワード
を格納する全キーワード格納部15と、訳語テキスト中
のすべての訳文を格納する訳語テキスト格納部16と、
キーワード及び訳語テキストを入力する入力部17と、
対応付けを行った結果を出力する出力部18とを備え
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳等の技術にお
いて用いられ、原文と訳文とからなる対訳のテキストを
対象に同一内容を示す原語によるテキスト中の文と訳語
によるテキスト中の文とを対応づける文対応装置及び該
文対応装置による原文と訳文の対応付け方法に関する
(以下、テキストと該テキストを構成する文とを区別す
るため、テキストについては原語テキストまたは訳語テ
キストと称し、テキスト中の各文については原文または
訳文と称す)。
【0002】
【従来の技術】機械翻訳等の技術においては、テキスト
における原文と訳文との対応関係(どの文とどの文とが
同一内容を示すかという関係)が明確になっていること
が必要な場合がある。たとえば、翻訳の正確さを向上さ
せ処理効率を高めるために、すでに訳出されている文を
記憶装置に格納しておき、同一の文を翻訳する場合に再
度翻訳処理を行わずに記憶装置に格納してある訳文を当
てる場合がある。このようにすでに訳出された文をその
後の文の翻訳に利用するためには、当該文において原文
と訳文との各文ごとの対応関係が明確になっていなけれ
ばならない。したがって、例えば日本語のマニュアルと
その英訳のような、原文と訳文とが必ずしも一対一で対
応していないテキストにおいて、各文の対応付けを行う
作業が必要となる場合がある。
【0003】従来、このような原文と訳文とを対応付け
る技術としては、第1に、各文ごとに原文と訳文の長
さ、すなわち1文中の文字の量を比較し、ダイナミック
プログラミング(動的計画法、以下、DPと略す)を利
用して最適解を求めるDPマッチングにより文の長さが
最も近い文どうしを対応付ける技術があった。かかる技
術には、たとえば、論文集「Proceedings
of the 29thAnnuaI Meeting
of the Association for C
omputationaI Linguistics」
に掲載されているWilliam A. GaleとK
enneth W. Church著の論文「A Pr
ogram for A1igning Senten
cesin BilinguaI Corpora」に
示される技術がある。
【0004】また第2に、各文ごとに原文と訳文の単語
数を比較し、DPマッチングにより単語数の最も近い文
どうしを対応付ける技術があった。かかる技術には、た
とえば、前述の論文集中のPeter F. Brow
nとJennifer C.LaiとRobert
L. Mercer著の論文「A1igning Se
ntences in Parallel Corpo
ra」に示される技術がある。
【0005】以上の技術は主として欧米語どうしの間に
おける原文と訳文との対応付けに用いられる技術であ
る。欧米語どうしの間では、語源が同じである等の理由
から、原文と訳文との間で1文中の語数や文字数が近似
する傾向があるため、上記の技術を用いることが可能で
ある。しかし、日本語と英語のように語源がまったく異
なる言語どうしの間では1文中の語数や単語の文字数が
近似する傾向はなく、文の構造も著しく異なるため訳文
の出現順序が原文と異なる場合もあるので、正確な対応
付けを行うことは困難であり、上記従来の技術による効
果はあまり期待できなかった。
【0006】
【発明が解決しようとする課題】上述したように、従来
の原文と訳文とを対応付ける技術は、欧米語どうしでは
有効であるものの、日本語と英語のような語源が異なる
言語どうしの場合には正確な対応付けを行うことは困難
であり、顕著な効果を望めないという欠点があった。
【0007】本発明は、上記従来の欠点を解消し、日本
語と欧米語のように共通性の低い言語間の文どうしであ
っても正確な対応付けを行うことのできる原文と訳文の
対応付け方法を提供し、該原文と訳文の対応付け方法を
適用した文対応装置を提供することを目的とする。
【0008】
【課題を解決するための手段】上記の目的を達成するた
め、本発明の文対応装置は、原語テキストに含まれる単
語のうちあらかじめ特定された品詞を翻訳したキーワー
ドと該原語テキストを翻訳した訳語テキストとを入力し
て格納する格納手段と、前記キーワードを前記原語テキ
ストの1文ごとに前記格納手段から抽出して取得するキ
ーワード取得手段と、前記取得されたキーワードと前記
訳語テキストとを比較し原語テキストを構成するすべて
の原文と訳語テキストを構成するすべての訳文との組み
合わせについて該訳文中に前記キーワードがいくつ含ま
れるかをカウントするキーワードカウント手段と、前記
キーワードカウント手段のカウント結果にしたがって前
記原文訳文との最適な組み合わせを選択して対応付けを
行う文対応手段とを備える構成としている。
【0009】また、他の態様では、原語テキストに含ま
れる単語のうちあらかじめ特定された品詞を翻訳したキ
ーワードと該原語テキストを翻訳した訳語テキストとを
入力する入力部と、前記入力した原語テキストを構成す
るすべての文中のキーワードを格納する全キーワード格
納部と、前記原語テキストを構成する1文ごとに前記全
キーワード格納部から該当する原文のキーワードを読み
出して格納するキーワード格納部と、前記入力した訳語
テキストをすべて格納する訳語テキスト格納部と、前記
訳語テキスト格納部から前記訳語テキストを構成する1
文を読み出して格納する訳文格納部と、前記原語テキス
トを構成するすべての文と前記訳語テキストを構成する
すべての文との組み合わせについて前記訳文中に前記キ
ーワードがいくつ含まれるかをカウントした結果を格納
するカウント結果格納部と、前記キーワード格納部に格
納されたキーワードと前記訳文格納部に格納された訳文
とを比較し該訳文中のキーワードの数をカウントして前
記カウント結果格納部に格納し、前記カウント結果格納
部に格納されたすべての原文と訳文の組み合わせについ
てのキーワードのカウント結果にしたがって各原文と訳
文との最適な組み合わせを選択して対応付けを行う制御
部とを備える構成としている。
【0010】また、他の態様では、前記制御部が、前記
原語テキストを構成する原文の数と前記訳語テキストを
構成する訳文の数とが異なるために対応付けられない文
についてあらためて前記カウント結果格納部のカウント
結果を参照し、該文と原文または訳文との最適な組み合
わせを選択して対応付けを行う構成としている。
【0011】上記目的を達成する他の文対応装置は、原
語テキストと該原語テキストを翻訳した訳語テキストと
を入力して格納する格納手段と、前記原語テキストに含
まれる単語のうちあらかじめ特定された品詞を翻訳した
キーワードを前記原語テキストの1文ごとに前記格納手
段から抽出して取得するキーワード取得手段と、前記取
得されたキーワードと前記訳語テキストとを比較し原語
テキストを構成するすべての原文と訳語テキストを構成
するすべての訳文との組み合わせについて該訳文中に前
記キーワードがいくつ含まれるかをカウントするキーワ
ードカウント手段と、前記キーワードカウント手段のカ
ウント結果にしたがって前記原文と訳文との最適な組み
合わせを選択して対応付けを行う文対応手段とを備える
構成としている。
【0012】上記目的を達成するため、本発明の原文と
訳文の対応付け方法は、原語テキストに含まれる単語の
うちあらかじめ特定された品詞を翻訳したキーワードと
該原語テキストを翻訳した訳語テキストとを入力して格
納するステップと、前記キーワードを前記原語テキスト
の1文ごとに抽出するステップと、前記抽出されたキー
ワードと前記訳語テキストとを比較し原語テキストを構
成するすべての原文と訳語テキストを構成するすべての
訳文との組み合わせについて該訳文中に前記キーワード
がいくつ含まれるかをカウントするステップと、前記キ
ーワードのカウント結果にしたがって前記原文とた区分
との最適な組み合わせを選択して対応付けを行うステッ
プとを備える構成としている。
【0013】
【作 用】本発明によれば、原文中の特定の単語の訳語
であるキーワードを抽出し、訳文に含まれる該キーワー
ドの数をカウントし、該カウント結果にしたがって原文
と訳文との組み合わせを選択することにより、原文と訳
文との間の最適な対応付けを行うことができる。また、
キーワードにする品詞の種類を適当に選択することがで
きる。
【0014】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。図1は、本発明の文対応装置の1実施例の
構成を示すブロック図である。図示のように、本実施例
の文対応装置は、原文と訳文との対応付けを行う制御部
11と、原文中のキーワードを格納するキーワード格納
部12と、訳文を格納する訳文格納部13と、訳文中に
含まれるキーワードの数をカウントして格納するカウン
ト結果格納部14と、原語テキスト中のすべてのキーワ
ードを格納する全キーワード格納部15と、訳語テキス
ト中のすべての訳文を格納する訳語テキスト格納部16
と、キーワード及び訳語テキストを入力する入力部17
と、対応付けを行った結果を出力する出力部18とを備
える。
【0015】入力部17は、原語テキストのすべての文
中の単語のうちあらかじめ特定された品詞の訳語である
キーワードと当該原語テキストを翻訳した訳語テキスト
とを入力する。キーワードとしては、その単語のみで特
定の概念を表す品詞を用いるのが適当である。たとえ
ば、日本語においては名詞、副詞、動詞、形容詞等の自
立語が該当する。単数複数の別のある品詞や活用する品
詞についてはこれらの複数形や活用形をすべてキーワー
ドとする。他の原語においても日本語の自立語に相当す
る品詞をキーワードとすることが一般的には好ましい
が、原語と訳語との関係において特に対応付けの基準と
なり得る品詞をキーワードに加えてもかまわない。また
日本語においても必要に応じて自立語でない助動詞や助
詞をキーワードに含めてもよい。なお、入力するキーワ
ードは、既存の機械翻訳システムの辞書から自動的に原
文中の自立語等の訳語を辞書引きし活用展開したり、人
手で紙の辞書を引いたりして得ることができる。
【0016】全キーワード格納部15は、入力部17で
入力した原語テキストのすべての文中のキーワードを各
文ごとに格納する。訳語テキスト格納部16は、入力部
17で入力した訳語テキストの全文を格納する。なお、
入力部17から入力されたキーワード及び訳語テキスト
は制御部11によって全キーワード格納部15及び訳語
テキスト格納部16へ送られる。
【0017】キーワード格納部12は、全キーワード格
納部15に格納されているキーワードのうち所定の1文
についてのキーワードを読み出して格納する。訳文格納
部13は、訳語テキスト格納部16に格納されている訳
文から所定の1文を読み出して格納する。なお、キーワ
ード及び訳文の読み出し及び格納は制御部11によって
行われる。
【0018】カウント結果格納部14は、後述するよう
に制御部11が訳文中にキーワードがいくつ含まれるか
をカウントした結果を格納する。キーワードのカウント
は原語テキストを構成するすべての文と訳語テキストを
構成するすべての文との組み合わせについて行われ、カ
ウント結果格納部14はこれらすべての組み合わせにつ
いてのカウント結果を格納する。
【0019】制御部11は、キーワード格納部12に格
納された原文1文についてのキーワードと訳文格納部1
3に格納された訳文1文とを比較し、当該訳文中の当該
キーワードの数をカウントして結果をカウント結果格納
部14に格納する。キーワードのカウントは原語テキス
トを構成するすべての文と訳語テキストを構成するすべ
ての文との組み合わせについて順次行い、カウント結果
をすべてカウント結果格納部14に格納する。
【0020】また制御部11は、カウント結果格納部1
4に格納した原語テキストを構成するすべての原文と訳
語テキストを構成するすべての訳文との組み合わせにつ
いてのカウント結果を参照し、DPマッチングを利用し
て原文と訳文との最適な組み合わせを選択する。すなわ
ち、各訳文が所定の原文のキーワードをいくつ含むか、
及び所定の訳文が各原文のキーワードをいくつ含むかを
調べ、所定の規則にしたがって各原文と訳文との組み合
わせを選択する。そして、選択した原文と訳文とを対応
付ける。原文と訳文との組み合わせの選択手段について
は、後でより詳細に説明する。
【0021】出力部18は、制御部11の処理によって
得られた原文と訳文との対応付けの結果を出力する。
【0022】次に、本実施例の動作について図2、図3
のフローチャート、及び図4ないし図14を参照して説
明する。なお本実施例では、日本語の原文と英語の訳文
との対応付けを行う場合について説明する。まず、「学
生は駅に行きます。本屋が駅にあるからです。駅は大き
いです。駅は学生でいっぱいです。」という原文と、
「There is a bookstore in
the station. That’s why s
tudents go to the statio
n. The stationis very lar
ge. The station is crowde
d with students.」という訳文とを例
文として対応付けを行った場合の例を示す。
【0023】まず、すべての原文のキーワードとすべて
の訳文とが入力部17から入力され、制御部11が全キ
ーワード格納部15と訳語テキスト格納部16とにそれ
ぞれ格納する(ステップ201)。原文及びキーワード
とその訳文とを図4示す。図において、原文及び訳文に
付されている番号は入力された順番を示すもので各文を
特定するが、その関係を示すものではない。キーワード
は、原文中の自立語の訳語とその複数形、活用形を含
む。たとえば、原文1文目(原文番号1の文)「学生は
駅に行きます。」の場合、「学生」「駅」「行く」が自
立語で、これらの訳語がキーワードになる。「学生」は
「student」、「駅」は「station」と
「terminal」、「行く」は「go」である。訳
語は必ずしも1つの自立語につき1つとは限らない。さ
らに、名詞の場合は複数形「students」、「s
tations」、「teminals」、動詞の場合
は三人称単数現在形、過去形、過去分詞形、現在分詞形
の「goes」、「went」、「gone」、「go
ing」の全部がキーワードとなる。
【0024】次に、キーワードのカウントを行うため、
制御部11が処理を行う原文及び訳文の番号を原文番号
m=1、訳文番号n=1の初期値を与える(ステップ2
02)。そして、全キーワード格納部15からm文目
(mは原文の文番号で初期値は1)の原文のキーワード
をキーワード格納部12に格納する(ステップ20
3)。この場合のキーワード格納部12に格納されたキ
ーワードを図5に示す。これは、m=1の時の場合で、
図4で示す原文1文目のキーワードが格納されている状
態である。
【0025】次に制御部11は、全キーワード格納部1
5に未処理のキーワードがあるかどうかチェックし、未
処理のキーワードがあれば、n文目(nは訳文の文番号
で初期値は1)の訳文を読み出し訳文格納部13に格納
する(ステップ204、205)。訳文格納部13に格
納されたデータの状態を図6に示す。同図は、n=1の
時で、図4で示された訳文1文目の各語を格納している
状態である。
【0026】次に制御部11は、訳語テキスト格納部1
6に未処理の訳文があるかどうかチェックし、未処理の
訳文があれば、キーワード格納部12に格納されたキー
ワードのうち未検索のキーワードを取り込む(ステップ
206、207)。キーワード格納部12に未検索のキ
ーワードがあれば、当該未検索のキーワードが訳文格納
部13に格納した訳文中に含まれていないか検索する
(ステップ208、209)。当該キーワードが当該訳
文中にあったときは、カウント結果格納部14の該当す
る原文番号及び訳文番号のキーワード数のカウントを1
加算する(ステップ210)。すなわち、図7に示すよ
うなテーブルの該当する文番号mとnが交差する位置の
カウントデータをプラス1する(カウントの初期値は
0)。図7(A)は、図4を例文とした場合で、原文1
文目(m=1)のキーワードの1つ「station」
が訳文1文目(n=1)にあったことを示すカウント結
果格納部14のデータの状態を表している。
【0027】キーワードのカウントを行った後、または
当該訳文中に当該キーワードが含まれていない場合、制
御部11は、検索し終わったキーワードを検索終了キー
ワードにする(ステップ210、211、212)。具
体的には検索終了を示すフラグを立てる等の既存の手段
を用いればよい。
【0028】以上のようにして、キーワード格納部12
に格納したキーワードの中に未検索のキーワードがなく
なるまで訳文への検索を行う。キーワード格納部12の
キーワード中に未検索のキーワードがなくなったとき
は、制御部11は、キーワード格納部12のキーワード
を全部未検索キーワードにし、訳文の文番号をn=n+
1に更新する(ステップ208、213)。そして、新
たに訳語テキスト格納部16から該当訳文を取り込み、
訳文格納部13に格納して同様にキーワードの検索を行
う(ステップ205)。これによって、すべての訳文に
ついてキーワード格納部12に格納された1つの原文の
キーワードがいくつ含まれるかというカウント結果が得
られる。
【0029】このようにしてすべての訳文についてキー
ワードの検索を行い、未処理の訳文がなくなった場合、
制御部11は、訳文番号をn=1に戻し、原文番号をm
=m+1に更新する(ステップ214)。そして、新た
に全キーワード格納部15から該当原文のキーワードを
取り込み、キーワード格納部12に格納して同様にキー
ワードの検索を行う(ステップ203)。これによっ
て、すべての訳文についてすべての原文のキーワードが
いくつ含まれるかというカウント結果が得られる。図7
(B)は、図4の例で、キーワード検索がすべて終了し
たときのカウント結果格納部14のデータの状態であ
る。
【0030】すべての訳文についてのすべてのキーワー
ドのカウントが終了すると、制御部11は、カウント結
果格納部14のデータを参照して、原文と訳文との最適
な対応付けを決めるための計算をする。(ステップ21
5、216)
【0031】ここで、制御部11が行う原文と訳文との
最適な対応付けを決める計算に、DPマッチングを利用
する。まず、原文と訳文が一対一で対応する場合とカウ
ント結果格納部14のデータに基づく対応関係とを比較
する。一対一対応とは図8で表されるように原文と訳文
とが同数でかつ同じ順番である場合の対応のことで、こ
れを標準的な対応としている。同図は、縦軸と横軸に原
文番号と訳文番号をそれぞれとり、座標(1、1)は原
文一文目と訳文一文目が対応していることを示す。カウ
ント結果格納部14のデータに基づく対応では、各原文
でカウント値の高い訳文を原則として対応する訳文とし
てグラフ化する。そして、図8に表される標準的な対応
と比較した場合のグラフ形状の違いの大小をコストの高
低として考慮し、グラフの変化の比率に応じてコスト計
算し、最もコストの低い対応パターンを最適な対応の組
み合わせとして選ぶ。
【0032】図9(A)(B)は、図7(B)から考え
られる対応付けの可能性をグラフ化したものである。図
7(B)を見ると、原文の1文目と4文目が訳文の2文
目または4文目に対応する2つの可能性を表しており、
それぞれの場合が図9(A)(B)のようにグラフ化さ
れる。図9(A)のように、原文の3文目と訳文の3文
目、さらに原文の4文目と訳文の4文目が対応するよう
な場合はコストを低く、図9(B)のように、原文の1
文目と訳文の4文目、さらに原文の2文目と訳文の1文
目が対応するような場合はコストを高くして計算する。
このようにして計算した結果、本例文の場合にはよりコ
ストの低い図9(A)に示される組み合わせを最適な対
応として選択する。
【0033】次に、制御部11は、原語テキストまたは
訳語テキストに対応付けが決定されていない文があるか
検索し、ある場合には改めて対応付けを計算する(ステ
ップ217、218)。対応付け未決定の文がない場合
は、得られた原文と訳文の最適な対応付けの結果を出力
部18より出力して処理を終了する。(ステップ21
9)。出力部18より出力される対応付けの結果は、た
とえば、図10に示すように、対応する原文と訳文の文
番号を並べたリストとすることができる。
【0034】次に、「この町には本屋が2つあります。
一方は駅に、もう一方は公園のそばにあります。生徒の
多くは、学校で教科書を注文します。」という原文と、
[There is a bookstores in
the town, one is in the
station, the other is nea
r the park. Many students
order their textbooks at
the school.」という訳文とを例文として
対応付けを行った場合の例を示す。なおこの例では、キ
ーワードをすべて検索しカウント結果に基づいて対応付
けを決める計算を行うステップ216までは前述の例と
同様なので説明を省略する。
【0035】この例における原文及びキーワードとその
訳文とを図11に示す。また、カウント結果格納部14
に格納されたカウント結果を図12に示す。このカウン
ト結果に基づいてDPマッチングにより得られた原文と
訳文との対応付けを決定する計算結果のグラフを図13
(A)に示す。図示のように、本例文では原語テキスト
の文の数が訳語テキストの文の数よりも多いため、原文
の1文目と訳文の1文目が、原文の3文目と訳文の2文
目がそれぞれ対応する可能性を表しており、原文の2文
目に対応する訳文がない状態になっている。
【0036】そこで制御部11は、対応する訳文のない
原文の2文目のみを対象として改めて対応付けの計算を
行う(ステップ217、218)。図11の例文の場
合、原文2文目のカウント結果から、当該原文が訳文1
文目に対応する可能性の方が訳文2文目に対応する可能
性よりも高いことがわかる。そこで制御部11は原文2
文目の最適な対応訳文を訳文1文目とする。このように
して得られた計算結果が図13(B)である。
【0037】以上のようにしてすべての原文と訳文との
対応付けを計算した後、制御部11は、図14に示すよ
うな、原文と訳文との最適な対応付けの結果を出力部2
18より出力する。なお本例文では原文の数が訳文の数
よりも多い場合を示したが、反対に訳文の数が原文の数
よりも多い場合にも、同様に対応付けの決定されていな
い訳文のみを対象として改めて対応付けの計算を行えば
よい。
【0038】以上好ましい実施例をあげて本発明を説明
したが、本発明は必ずしも上記実施例に限定されるもの
ではない。例えば、DPマッチングの計算をするにあた
って、本実施例では1つの原文に対し、全訳文との対応
の可能性を考えキーワードのカウントを行ったが、誤報
や文法上の制限、及び経験的に得られる種々の制限を適
用して訳文の対応候補の範囲を絞り、対応付けを決定す
るための計算量を少なくすることも可能である。
【0039】また、本実施例では、計算結果を対応する
原文と訳文の文番号を並べたリストとして出力したが、
図9や図13のグラフをそのまま出力してもよい。ま
た、図1に示した文対応装置の構成に、さらに原文を格
納する原文格納部を備えることで、出力部は、文番号だ
けでなく、原文と訳文を並べ対応関係を図示して出力さ
せることも可能である。
【0040】また、本実施例では、入力部にキーワード
と訳文を入力して対応付けを決定する計算を行ったが、
図1の構成に、原文の所定の単語を翻訳してキーワード
を作成するキーワード作成部をさらに備え、入力部から
原文と訳文とを入力することによって、キーワードの作
成、カウント、対応付けの計算のすべてを行うようする
こともできる。
【0041】なお、図1の構成に関しては、キーワード
格納部12、訳文格納部13、カウント結果格納部14
を制御部11と別個に設けず、制御部11の機能の一部
としてもよい。
【0042】また、本実施例では、日本語と英語の対訳
テキストを例に説明したが、日本語と英語に限らず他の
自然言語どうしについても本発明を適用できることはい
うまでもない。
【0043】
【発明の効果】以上説明したように、本発明の訳語とい
う言語情報を用いる文対文対応装置によって、日本語と
英語の様に、構文が著しく異なるため訳文の出現順序が
入れ替わったり、語源が異なるため語彙に共通点が見ら
れない言語間の場合でも、正確な対応付けを行うことが
できる。
【図面の簡単な説明】
【図1】 本発明の一実施例に係る文対応装置の構成を
示すブロック図である。
【図2】 本実施例の文対応装置の動作を示すフローチ
ャートである。
【図3】 本実施例の文対応装置の動作を示すフローチ
ャートである。
【図4】 本実施例で処理を行う例文を示す図である。
【図5】 図4の場合におけるキーワード格納部に格納
されたデータの例を示す図である。
【図6】 図4の場合における訳文格納部に格納された
データの例を示す図である。
【図7】 図4の場合におけるカウント結果格納部に格
納されたデータの例を示す図である。
【図8】 原文と訳文との対応関係の標準を示す図であ
る。
【図9】 図4の場合における原文と訳文との対応関係
の計算結果を示す図である。
【図10】 図4の場合における出力結果を示す図であ
る。
【図11】 本実施例で処理を行う例文を示す図であ
る。
【図12】 図11の場合におけるカウント結果格納部
に格納されたデータの例を示す図である。
【図13】 図11の場合における原文と訳文との対応
関係の計算結果を示す図である。
【図14】 図11の場合における出力結果を示す図で
ある。
【符号の説明】
11 制御部 12 キーワード格納部 13 訳文格納部 14 カウント結果格納部 15 全キーワード格納部 16 訳語テキスト格納部 17 入力部 18 出力部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 原語テキストに含まれる単語のうちあら
    かじめ特定された品詞を翻訳したキーワードと該原語テ
    キストを翻訳した訳語テキストとを入力して格納する格
    納手段と、 前記原語テキストを構成する1文についてのキーワード
    を前記格納手段から抽出して取得するキーワード取得手
    段と、 前記取得されたキーワードと前記訳語テキストとを比較
    し原語テキストを構成するすべての原文と訳語テキスト
    を構成するすべての訳文との組み合わせについて該訳文
    中に前記キーワードがいくつ含まれるかをカウントする
    キーワードカウント手段と、 前記キーワードカウント手段のカウント結果にしたがっ
    て前記原文と訳文との最適な組み合わせを選択して対応
    付けを行う文対応手段とを備えることを特徴とする文対
    応装置。
  2. 【請求項2】 原語テキストに含まれる単語のうちあら
    かじめ特定された品詞を翻訳したキーワードと該原語テ
    キストを翻訳した訳語テキストとを入力する入力部と、 前記入力した原語テキストを構成するすべての文中のキ
    ーワードを格納する全キーワード格納部と、 前記原語テキストを構成する1文についてのキーワード
    を前記全キーワード格納部から読み出して格納するキー
    ワード格納部と、 前記入力した訳語テキストをすべて格納する訳語テキス
    ト格納部と、 前記訳語テキストを構成する1文を前記訳語テキスト格
    納部から読み出して格納する訳文格納部と、 前記原語テキストを構成するすべての文と前記訳語テキ
    ストを構成するすべての文との組み合わせについて前記
    訳文中に前記キーワードがいくつ含まれるかをカウント
    した結果を格納するカウント結果格納部と、 前記キーワード格納部に格納されたキーワードと前記訳
    文格納部に格納された訳文とを比較し該訳文中のキーワ
    ードの数をカウントして前記カウント結果格納部に格納
    し、前記カウント結果格納部に格納されたすべての原文
    と訳文の組み合わせについてのキーワードのカウント結
    果にしたがって原文と訳文との最適な組み合わせを選択
    して対応付けを行う制御部とを備えることを特徴とする
    文対応装置。
  3. 【請求項3】 前記制御部が、前記原語テキストを構成
    する原文の数と前記訳語テキストを構成する訳文の数と
    が異なるために対応付けられない文についてあらためて
    前記カウント結果格納部のカウント結果を参照し、該文
    と原文または訳文との最適な組み合わせを選択して対応
    付けを行うことを特徴とする請求項2に記載の文対応装
    置。
  4. 【請求項4】 原語テキストと該原語テキストを翻訳し
    た訳語テキストとを入力して格納する格納手段と、 前記原語テキストに含まれる単語のうちあらかじめ特定
    された品詞を翻訳したキーワードを前記原語テキストの
    1文ごとに前記格納手段から抽出して取得するキーワー
    ド取得手段と、 前記取得されたキーワードと前記訳語テキストとを比較
    し原語テキストを構成するすべての原文と訳語テキスト
    を構成するすべての訳文との組み合わせについて該訳文
    中に前記キーワードがいくつ含まれるかをカウントする
    キーワードカウント手段と、 前記キーワードカウント手段のカウント結果にしたがっ
    て前記原文と訳文との最適な組み合わせを選択して対応
    付けを行う文対応手段とを備えることを特徴とする文対
    応装置。
  5. 【請求項5】 原語テキストに含まれる単語のうちあら
    かじめ特定された品詞を翻訳したキーワードと該原語テ
    キストを翻訳した訳語テキストとを入力して格納するス
    テップと、 前記キーワードを前記原語テキストの1文ごとに抽出す
    るステップと、 前記抽出されたキーワードと前記訳語テキストとを比較
    し原語テキストを構成するすべての原文と訳語テキスト
    を構成するすべての訳文との組み合わせについて該訳文
    中に前記キーワードがいくつ含まれるかをカウントする
    ステップと、 前記キーワードのカウント結果にしたがって前記原文と
    訳文との最適な組み合わせを選択して対応付けを行うス
    テップとを備えることを特徴とする原文と訳文の対応付
    け方法。
JP6207937A 1994-08-09 1994-08-09 文対応装置及び原文と訳文の対応付け方法 Pending JPH0855121A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6207937A JPH0855121A (ja) 1994-08-09 1994-08-09 文対応装置及び原文と訳文の対応付け方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6207937A JPH0855121A (ja) 1994-08-09 1994-08-09 文対応装置及び原文と訳文の対応付け方法

Publications (1)

Publication Number Publication Date
JPH0855121A true JPH0855121A (ja) 1996-02-27

Family

ID=16548014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6207937A Pending JPH0855121A (ja) 1994-08-09 1994-08-09 文対応装置及び原文と訳文の対応付け方法

Country Status (1)

Country Link
JP (1) JPH0855121A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543641A (zh) * 2019-08-14 2019-12-06 交控科技股份有限公司 一种中外文信息对比方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02294779A (ja) * 1989-05-10 1990-12-05 Hitachi Ltd 機械翻訳システム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02294779A (ja) * 1989-05-10 1990-12-05 Hitachi Ltd 機械翻訳システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543641A (zh) * 2019-08-14 2019-12-06 交控科技股份有限公司 一种中外文信息对比方法及装置
CN110543641B (zh) * 2019-08-14 2023-05-26 交控科技股份有限公司 一种中外文信息对比方法及装置

Similar Documents

Publication Publication Date Title
JPH03278174A (ja) 異言語交信用翻訳方法およびシステム
CN104573099A (zh) 题目的搜索方法及装置
KR20110027361A (ko) 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
EA005268B1 (ru) Способ и средства преобразования контента
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
CN111507113A (zh) 一种机器辅助人工翻译的方法和装置
CN112380877B (zh) 一种用于篇章级英译中机器翻译测试集的构建方法
JPH0855121A (ja) 文対応装置及び原文と訳文の対応付け方法
CN108153743B (zh) 基于相似度的智能离线翻译机
JP3085394B2 (ja) 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
JPH03260764A (ja) 翻訳用辞書登録方式
JP2902343B2 (ja) 言語解析システムおよび方法
JPH0561902A (ja) 機械翻訳システム
JPH0410665B2 (ja)
JPH1031676A (ja) 対訳例文検索装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
Gokhale et al. A Survey of Morphological Analysis for Marathi Language
JP2715875B2 (ja) 多言語要約生成装置
JPH03225468A (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
WO2019161421A2 (en) Method of changing languages of captions, subtitles and illustrations by dual identification technique
KR20020020406A (ko) 문서분할에 의한 병렬처리가 가능한 기계번역장치
JPH10198676A (ja) 日本語形態素解析装置及び日本語形態素解析方法
JPH0290364A (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法