JP2006011842A - 翻訳装置および翻訳プログラム - Google Patents
翻訳装置および翻訳プログラム Download PDFInfo
- Publication number
- JP2006011842A JP2006011842A JP2004188259A JP2004188259A JP2006011842A JP 2006011842 A JP2006011842 A JP 2006011842A JP 2004188259 A JP2004188259 A JP 2004188259A JP 2004188259 A JP2004188259 A JP 2004188259A JP 2006011842 A JP2006011842 A JP 2006011842A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- language
- example sentence
- translation
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】第1言語例文と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、第1言語例文中の前記相違箇所に対応する第2言語例文の語句を判定し当該語句を原文中の前記相違箇所の語句に置き換えた合成文を作成する合成部と、合成文に含まれる原文中の語句を当該語句に対応する訳語で置換した訳文を作成する訳文生成部と、原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える。
【選択図】図2
Description
また、例文の形態は、単文に限らず、語、句や複数の文から成るものを含んでいてもよい。
出力部からの出力は文字として表示されてもよいが、それに限らず例えば情報として記憶装置に記憶される態様や、音声などの態様であってもよい。
ここで、入力部からの入力はこの発明の翻訳装置が処理可能な情報に変換されるものであれば文字に限らず、例えば音声などであってもよい。
また、対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成されていてもよい。
さらにまた、出力された文をユーザが編集するための編集部をさらに備えていてもよい。このようにすれば、翻訳装置から出力された前記の文を参考にしながら、その内容をユーザが自由に編集することができ、ユーザの意図に沿う最終的な訳文の作成を支援することができる。
前記語句が、単語および連語であってもよい。
以下、図面に示す実施形態に基づいてこの発明を詳述する。
図1は、この発明の翻訳装置の構成の一例を示すブロック図である。
図1の入力部300は、翻訳すべき原文、処理翻訳に関する指示、訳文の編集に関する内容を入力する手段であり、例えばキーボードやマウスボタンで構成されるが、これに限らずタブレットやタッチパネルなどであってもよい。
出力部400は、訳文や訳文候補、編集の結果を出力する手段であり、LCDなどを用いた表示装置から構成されてもよいが、これに限らず、CRTなどの他の表示デバイスであってもよく、あるいはインクジェット方式などのプリンタ、外部の装置へデータを出力する出力I/F部が含まれていてもよい。
図2は、この発明の翻訳装置の構成の一例を翻訳の過程で処理されるデータの観点から示したブロック図である。図において、翻訳のための原文は、入力部300を介してユーザによって入力されるか、あるいは原文のデータが記憶された原文記憶部10から読み込まれる。これらの入力に関する指示は、ユーザ・インタフェース15によって管理される。ユーザ・インタフェース15によって、入力操作に関する画面が出力部400に表示され、ユーザは画面表示の内容から所望の入力方法を入力部300を用いて指示し、指示された内容をユーザ・インタフェース部15が判断してユーザの選択に応じた所定の処理が実行される。そして、ユーザが行った操作や翻訳の結果が出力部400に表示され、あるいは翻訳結果が翻訳結果記憶部11に格納される。
入力された原文は、対訳例文検索処理部31に入力される。対訳例文検索処理部31は、入力された原文と類似する例文を、対訳例文記憶部51に記憶された対訳例文データベースを参照して抽出する。対訳例文データベースは、翻訳装置の中に予め用意されている用例のほかに、ユーザが登録した対訳例文を含んでいてもよい。対訳例文検索処理部31は、一定の類似度以上の例文の第1言語とそれに対応する第2言語の例文およびそれらの文を構成する語の言語間での対応に関するデータと、原文と例文との相違点に関するデータとを訳文合成・生成処理部30へ送る。
このようにして生成した訳文と、前記の翻訳過程の文とをユーザ・インタフェースを介して出力部400へ出力する。
なお、規則主導型翻訳装置を併用する場合、その装置の翻訳辞書21を対訳辞書53と共用してもかまわない。また、機械翻訳処理部20の一部を対訳辞書引き処理部52と共用してもかまわない。
図3は、この発明の翻訳装置の概略の処理手順の一例を示すフローチャートである。図3に示すように、翻訳すべき原文をユーザに入力させ(Step s11)て図1の原文バッファ810に格納した後、さらに訳文を生成する指示を入力させる(Step s12)。規則主導型翻訳処理を併用する場合は、その処理を実行する(Step s13)。規則主導型翻訳装置は本願発明の必須構成要素ではなく、そのことを示すために、s13を点線で描いている。規則主導型翻訳を行わない場合、ルーチンはs12を実行した後s14へ移る。また、その処理手順は公知であるので、この明細書ではこれ以上の説明を行わない。次に、ルーチンは、対訳例文データベースを検索して訳文の合成・生成処理を行う(Step s14)。この処理の詳細は図5に記載されており、図5の説明として後述する。そして、ルーチンは、前記の処理を行った結果を出力して表示する(Step s15)。この処理の詳細については、さらに後述する。ユーザは、表示された訳文や翻訳の途中経過のデータを必要に応じて編集したり、ユーザが利用しやすい形態に変換したりする(Step s16)。この処理の詳細については、さらに後述する。
ここで、s12〜s14の処理は、必ずしも図のとおりの手順で行う必要はなく、例えばs13とs14を同時に行ってもよく、またs14をs13より先に行ってもよい。
以降の説明では、具体的な文を例に挙げながら各部の詳細な処理を説明する。ここで、「第1言語」が日本語、「第2言語」が英語であるとする。また、「△」は空白文字を表わす記号であるとする。
「私の眼鏡が見つかりません。」
という日本語の文であるとする。これが図1の原文バッファ810に格納されている。図12は、前述の原文が原文バッファ810に格納された様子を模式的に示した説明図である。図12に示すように、原文は、各文字の文字位置が識別可能に構成された原文バッファ810に、13文字からなる文として格納される。ここで、原文バッファの長さは固定されておらず、例文よりも長い文も短い文も格納できる。後述する他のバッファに関しても同様である。
まず、図11(a)は、対訳例文データベースが「第1言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の日本語文(第1言語文)が、17文字からなる「私のスーツケースが見つかりません。」であることを示している。
次に、図11(b)は、対訳例文データベースが「第1言語文の単語情報データ」を含むことと、そのデータの一例を示している。図11(b)に示すように、第1言語文の単語情報データは、対訳例文データベースに含まれる前述の対訳例文の日本語文の単語区切りが「私」「の」「スーツケース」「が」「見つかり」「ませ」「ん」「。」の間の7箇所であること、文が8単語からなること、そして各単語の文字数を示している。
さらに、図11(c)は、対訳例文データベースが「第2言語文データ」を含むことと、そのデータの一例を示している。即ち、対訳例文の英語文(第2言語文)が「I can't find my suitcase.」の全部で25文字からなる英文であることを示している。
そして、図11(d)は、対訳例文データベースが「第2言語文の単語情報データ」を含むことと、そのデータの一例を示している。図11(d)に示すように、第2言語文は、その単語区切りが「I」「can」「't」「find」「my」「suitcase」「.」の間の6箇所であること、全部で7単語からなること、そして各単語の文字数を示している。
最後に、図11(e)は、対訳例文データベースが「対応関係データ」を含むことと、そのデータの一例を示している。図11(e)に示すように、対応関係データは、第1言語文と第2言語文との単語の対応関係が4つの組からなり、それぞれの組の対応が以下のような対応関係であることを、それぞれの単語番号を用いて示している。
「私の――が見つかりません」−「I can't find my」
(ここで、日本語文中の「――」は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である)
「私の」−「 my」
「スーツケース」−「suitcase」
「が見つかりません」−「I can't find」
図5のStep s141で示す類似文検索処理は、次の手順で行う。
まず、「私の眼鏡が見つかりません。」をキーとして、日本語が類似する対訳例文を図1の対訳例文データベース51中から検索する(Step s141)。対訳例文データベース51は、例えば、第1言語「見つかりません」の語句を用いた例文として、以下の例文を記憶している。即ち、
対訳例文の例1
第1言語例文:「私のスーツケースが見つかりません。」と、
第2言語例文:「I can't find my suitcase.」の組、
対訳例文の例2
第1言語例文:「探している商品が見つかりません。」と、
第2言語例文:「I can't find the thing I want.」の組、
対訳例文の例3
第1言語例文:「ニューヨーク中電話しましたが、その本は見つかりませんでした。」と、
第2言語例文:「Although we have telephoned all over New York , we have been unable to find copies.」の組、
対訳例文の例4
第1言語例文「それが見つかるまでの間、どうにかしてもらえませんか。」と、
第2言語例文「What will you do for me until you find it?」の組
の5組である。
対訳例文の例5
第2言語例文「I like the homey atmosphere of that restaurant.」と、
第1言語例文「あのレストランの家庭的な雰囲気が好きだ」の組、
対訳例文の例6
第2言語例文「bad atmosphere engulfed the city」と、
第1言語例文「町はひどい大気に包まれた」の組、
の2組の例文を記憶している。
対応1: 「私の――が見つかりません」−「I can't find my」
ここで、前述のように日本語文中の「――」は、省略記号でなく、いわば穴あき箇所を示す。
対応2: 「私の」−「 my」
対応3: 「スーツケース」−「suitcase」
対応4: 「が見つかりません」−「I can't find」
対応1: 「探している商品」−「the thing I want」
対応2: 「探している」−「I want」
対応3: 「商品」−「thing」
対応4: 「が見つかりません」−「I can't find」
対応1: 「ニューヨーク」−「New York」
対応2: 「ニューヨーク中」−「all over New York」
対応3: 「電話し」−「telephoned」
対応4: 「電話しました」−「we have telephoned」
対応5: 「が」−「Although」
対応6: 「その本」−「copies」
対応7: 「は見つかりませんでした」−「we have been unable to find」
対応8: 「ませんでした」−「we have been unable to」
対応1: 「それ」−「it」
対応2: 「が見つかるまでの間」−「until you find」
対応3: 「てもらえませんか」−「will you」
対応4: 「どうにかしてもらえませんか」―「What will you do for me」
対応1: 「I like」−「が好きだ」
対応2: 「homey」−「家庭的な」
対応3: 「atmosphere」−「雰囲気」
対応4: 「of that restaurant」−「あのレストランの」
対応5: 「restaurant」−「レストラン」
対応1: 「Bad」−「ひどい」
対応2: 「atmosphere」−「大気」
対応3: 「the city」−「町」
次に、ルーチンは、第1言語における相違箇所を決定する(図5のStep s142)。図7は、この第1言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図7に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1421)。そして、処理対象とする類似対訳の第1言語文と、原文との相違箇所を判定する(Step s1422)。相違箇所の判定は、公知の技術を用いて実現することができる。
「相違箇所番号」は、原文と類似対訳との相違箇所が1箇所であることを示している。
「入力文文字位置」と「入力文文字数」とは、原文「私の眼鏡が見つかりません。」と類似対訳との相違箇所は、原文の3番目の文字から2文字である。そして、図12の原文バッファ810を参照することにより、相違箇所は「眼鏡」であることがわかる。
「第1言語文単語番号」と「第1言語文単語数」とは、対訳候補の日本語文「私のスーツケースが見つかりません。」における相違箇所が、3番目の単語から1単語であることを示している。そして、図14の「検索結果1」の「第1言語文の単語情報バッファ」ならびに「第1言語文バッファ」を参照することにより、相違箇所は「スーツケース」であることがわかる。
なお、図15の例では、入力文「私の眼鏡が見つかりません。」と検索結果1の対訳候補の日本語文「私のスーツケースが見つかりません。」との相違箇所の個数は、1カ所だけであるので、相違箇所データバッファ825のデータ列数は1列である。一般に、相違箇所が複数有る場合はこのデータ列数が複数になり、「相違箇所番号」は1から1ずつ昇順の整数の値をとる。
続いて、ルーチンは、原文に対する類似対訳の第2言語における相違箇所を決定する(図5のStep s143)。
図8は、この第2言語相違箇所を決定する処理の詳細な手順の一例を示すフローチャートである。図8に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1431)。そして、処理対象とする類似対訳の第1言語文の相違箇所に対応する第2言語文の相違箇所を判定する(Step s1432)。相違箇所の判定は、第1言語の相違箇所を示す相違箇所データバッファ825の内容、第1言語文と第2言語文との語の対応関係を示す対応関係バッファの内容、第2言語文の単語情報バッファの内容および第2言語文バッファの内容を用いて処理することができる。
「対訳例文単語番号」の欄は、対訳候補の英語文「I can't find my suitcase.」における相違箇所は、6番目の単語から1単語「suitcase」であることを示している。そして、「相違箇所番号」の欄は、この相違箇所が、原文と検索結果1の対訳候補の日本語文の第1番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第1言語のものか第2言語のものかを示す情報であるが、ある単語番号の単語が第1言語(原語)のものであることと、その単語番号の「相違箇所番号」の欄に有効な値が格納されていること、すなわち対訳の第2言語文に第1言語が合成されていることとは同じことなので、「言語フラグ」と「相違箇所番号」の両欄を兼用させてもよい。
次に、ルーチンは、原文に対する類似対訳の第2言語における相違箇所を原文(第1言語)で置換した合成文を作成する(図5のStep s144)。
図9は、この第2言語相違箇所を原文で置換した合成文を作成する処理の詳細な手順の一例を示すフローチャートである。図9に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1441)。そして、処理対象とする類似対訳の第2言語文の相違箇所に原文の語をあてはめた合成文を作成する(Step s1442)。相違箇所の置換は、原文に対する類似対訳の第2言語における相違箇所を示す合成単語情報バッファの内容、第2言語文の単語情報バッファの内容および第2言語文バッファの内容を用いて処理することができる。
「対訳例文文字番号」の欄は、対訳候補の英語(第2言語)文「I can't find my suitcase.」における相違箇所が、17番目と18番目であり、19番目の文字は、対訳例文の第2言語文の25番目の文字であることを示している。
「相違箇所番号」の欄は、17,18番目の文字の相違箇所が、入力文と検索結果1の対訳候補の日本語文の第1番目の相違箇所に関するものであることを示している。
「言語フラグ」の欄は、その単語番号の単語が第1言語のものか第2言語のものかを示す情報であり、17,18番目の文字が第1言語であり、その他の文字は第2言語であることを示している。
最後に、ルーチンは、合成文の第1言語を適切な第2言語に置換した訳文を生成する(図5のStep S145)。
図10は、合成文の第1言語を適切な第2言語に置換する第2言語文生成処理の詳細な手順の一例を示すフローチャートである。図10に示すように、ルーチンは対訳例文データベース51中から検索されたすべての類似対訳に対して順次処理を行うためのカウンタを初期化する(Step s1451)。そして、処理対象とする合成文の第1言語の合成箇所に適当な第2言語の語をあてはめた第2言語文を作成する(Step s1452)。ここで、合成文の第1言語の合成箇所に適当な第2言語の語をあてはめるために、相違箇所の第1言語、即ち「眼鏡」の語について対訳例文の検索をおこなう。検索した結果から、もっとも適切な語を判定し、それに対応する第2言語の語を合成文に当てはめる。この例では「眼鏡」の語であるが、複数の語からなる句であってもよい。この処理の詳細については、後述する。
「文字」欄は、第2言語生成文が「I can't find my glasses.」であることを示している。
「言語フラグ」欄は、第2言語合成文の第17〜25文字の「glasses」が、原文との相違箇所に由来することを示している。
「相違箇所番号」の欄は、第2言語合成文の第17〜25文字の「glasses」が、図14の相違箇所データバッファ825に示す第1番目の相違箇所に由来することを示している。
「対訳例文文字番号」の欄によれば、第2言語生成文のうち、第1〜16文字の「I can't find my 」と、第24文字の「.」が、図14の検索結果1の第2言語文バッファ中の第1〜第16文字と、第25文字に由来することを示している。
「言語フラグ」欄と「相違箇所番号」欄は、第2言語生成文を表示する際に、相違箇所を異なった態様で示すための情報として用いることができる。
以上が、図3のフローチャートのs14に示した対訳例文検索・合成・生成処理の詳細な処理手順の説明である。
次に、ルーチンは図3のフローチャートのs15に示す結果表示処理を実行する。
図18は、結果表示の態様の一例を示す説明図である。g110の対訳検索結果表示部は、この発明の翻訳装置の原文、翻訳の途中経過および結果を表示する領域である。対訳検索結果表示部g110中、g111の表示「私の眼鏡が見つかりません。」は、図12の原文バッファ810の内容が表示されたものである。また、g112の「私のスーツケースが見つかりません。」は、図14に示す検索結果1の第1言語文バッファの内容が表示されたものである。g113の「I can’t find my suitcase.」は、図14に示す検索結果1の第2言語文バッファの検索結果1が表示されたものである。また、g114の「I can’t find my 眼鏡.」は、図16に示す第1検索結果の合成文バッファ823の内容が表示されたものである。そして、g115の「I can’t find my glasses.」は、図17の生成文バッファ824の内容が表示されたものである。
また、これらの下に以下の内容が表示されている
私の眼鏡が見つかりません。
探している商品が見つかりません。
I can’t find the thing I want.
I can’t find 私の眼鏡.
I can’t find my glasses.
これらの表示は、図14に示す検索結果2の対訳例文に関する内容であり、各表示は、前述した検索結果1の対訳例文に関する表示g111〜g115に対応するものである。
処理結果表示フラグバッファ850の初期値は、本装置の動作開始時に、所定の値に定められてもよいし、ユーザがその値を変更できるように構成されてもよい。
まず、その時点における処理結果表示フラグバッファの各欄の値に基づいて、各検索結果におけるg111〜g115の各文の表示・非表示を決定する(s1502〜s1511)、そして、決定した内容に従って画面の描画を行う(s1514)。
描画処理を終えたら、ルーチンは、ユーザの操作待ちで待機する(s1515)。図18の表示選択指示欄のいずれか(g121, g122, g123, g124, g125)がユーザによってクリックされると、それに応じて処理結果表示フラグバッファ850の内容が変更され、処理結果表示フラグバッファ850が再チェックされて各文の表示・非表示が決め直され、出力画面が再描画される。ユーザの操作待ち状態から、この状態を脱するような操作がユーザによってなされる(s1516)(たとえば、ウィンドウが閉じられるなど)まで、この状態が続く。このような処理によって、原文、最終的な翻訳結果が作成される過程の参考情報および訳文を、ユーザの意向に添った態様で提示することができる。
以上が、図3のStep s15の結果表示処理の詳細な処理手順の説明である。
次に、ルーチンは図3のStep s16に示す表示内容の編集処理を実行する。図23は、この表示内容の編集処理の際の表示態様の一例を示す説明図である。この処理は、図18や図21のように対訳例文検索結果が表示され、あるいは併用する機械翻訳の結果が表示されている状態から、所望に応じてユーザが表示内容を編集することができる機能を提供する。
このモードの処理に入ると、まず、翻訳結果の一例として、前述の検索結果1の第2言語生成文「I can’t find my glasses.」が、g102(出力結果表示・編集部)に転写されて(s1601)ユーザの操作待ち状態(Step s1602)に入る。なお、この初期動作は、この発明の翻訳装置の一実施形態であって、これに限るものではない。
ユーザの操作待ち状態においては、操作に応じて以下のような動作がなされる。
図18に示すg110(対訳検索結果表示部)内をクリックした場合、ルーチンはStep s1603へ進み、クリックした位置にある文を強調表示する(Step s1604)。なお、その時点で、クリックした位置にある文以外の文が既に強調表示されている場合は、その文を通常表示に戻す。すなわち、g110領域内で強調表示される文は1文のみに制御される。そしてユーザの操作待ち状態に戻る。
あるいは、図18のg131(機械翻訳結果の転写指示ボタン)をクリックした場合、ルーチンはs1607へ進み、g103領域に表示されている機械翻訳結果の文字列(図13の機械翻訳文バッファ830に格納されている内容)を、g102の領域に追加的に転写する(Step s1608)。 そしてユーザの操作待ち状態に戻る。
あるいはまた、図18のg102(出力結果表示・編集部)の領域内をクリックした場合、ルーチンはStep s1609へ進み、g102の領域がテキストエディタとして動作するようになる(Step s1610)。そして、ユーザは、既に存在している文を参考にしながら、その内容を自由に編集することができる。テキストエディタの動作の詳細は公知の技術であるので詳細な説明は略す。ここで、g102の領域外のどこかをユーザがクリックすれば、テキストエディタモードを抜け、ユーザの待ち状態に戻る。
また、図18のg133(出力結果確定指示ボタン)をクリックした場合、ルーチンはs1611へ進み、その時点でg102(出力結果表示・編集部)領域に存在している文字列を確定させる。たとえば、クリップボードにコピーしたり、連動して動く他のアプリケーションプログラムに入力したりする(Step s1612)。そして編集動作を終了する。
この機能によって、ユーザは、機械が提示する情報を利用しながら編集を行うことにより最終的な訳文を作成することもできる。訳文が適切で、編集の必要がなければこの機能を利用する必要はない。
前述したような処理を行うことによって、対訳例文データベースを用いた翻訳を行うことができるが、入力した原文と類似する対訳例文を対訳例文データベースから検索した際に、所定の閾値以上の類似度を持つ例文が存在しなかった場合が考えられる。このような場合に、入力文を語・句に分割して、分割された各々の語・句について対訳例文データベースを検索し、その結果を出力させるようにしてもよい。これによって、最適な訳文が見つからなかった場合でも、参考情報を出力してユーザの翻訳を支援することができる。
そして、前記の検索結果を出力する(Step s223)。図25及び図26は、検索結果の出力態様の一例を示す説明図である。図25は、前述の図18と同様のウインドウであるが、入力文との類似度がある閾値以上の対訳例文が存在しないので、その旨が対訳検索結果表示部に表示されている状態を示している。また、出力結果表示・編集部には、《検索結果1》の《第2言語生成文》の代わりに、併用する機械翻訳処理による訳文「Recently, we introduced the new model of the electronic dictionary in the market.」が自動的に転写されている。ただし、これはあくまでも本装置の設計の一例であり、他にも様々な処理方針が考えられる。そして、同時に図26のような画面が、たとえば、マルチウィンドウシステムを用いて表示される。図26の画面には、原文から分割された語・句と、それを用いて検索された対訳例文が表示されている。図26の、語・句検索モードの出力画面例において、g201(入力文表示部)領域には、入力された原文「最近、われわれは、マーケットで電子辞書の新型製品を紹介した。」が自動的に転写されている。g204の検索結果表示部およびg207の検索語句リスト表示部には、入力文から分割された語・句(g205及びg207)が表示されている。これらのg205またはg207の語・句をクリックすると、g204の領域におけるそれらの語・句の下側に、g206に示すように、それらの語・句によって検索された対訳例文が表示される。
g204の領域では、対訳例文が表示されている際に、対訳例文が表示されている箇所をクリックすると、その箇所の対訳例文が強調表示される。強調表示される対訳例文は高々1組であり、ある対訳例文が強調表示されている時に、別の対訳例文の箇所がクリックされれば、新たにクリックされた箇所の対訳例文が強調表示され、それまで強調表示されていた対訳例文は通常表示に戻る。
なお、前述した処理は、あくまでもこの発明の翻訳装置における一つの実施形態であり、たとえば、g207の検索語句リスト表示部をg204と別に設けることをせず、検索結果と検索語句リストと一つの表示部に表示するなど、種々の異なる実施形態が考えられる。そして、それらの態様は、この発明の範疇に含まれる。
この発明の翻訳装置は、翻訳に用いる対訳例文をユーザが登録でき、あらかじめ登録された対訳例文に加えて、登録された対訳例文を用いた翻訳を行うことができる。これにより、ユーザは、よく使う分野の対訳例文を自分で作成して登録したり、パッケージ化された専門分野の対訳例文を入手して追加登録したりでき、これによって特定の分野の対訳例文を充実させて翻訳をより適切に行うことができる。
第1言語文(日本語):探している商品が見つかりません。
第2言語文(英語): I can’t find the thing I want.
であるとする。もっとも、入力される対訳例文は、このように対応する複数言語の文の文字列(いわゆるプレーンテキスト)に限られるものではなく、他の「翻訳メモリ」装置(例文検索型翻訳支援装置)で用いられている対訳例文のデータ形式をそのまま取り込む機能を含んでいてもよい。
第1言語文(日本語):「探し」「ている」「商品」「が」「見つかり」「ませ」「ん」「。」
第2言語文(英語): 「I」「can」「’t」「find」「the」「thing」「I」「want」「.」
そして、言語間の語・句の対応情報を、以下のように決する。
対応1: 「探している商品」−「the thing I want」
対応2: 「探している」−「I want」
対応3: 「商品」−「thing」
対応4: 「が見つかりません」−「I can’t find」
対応5: 「探している――が見つかりません」−「I can’t find ―― I want」
ここで、文中の「――」で示した箇所は、省略記号でなく、その部分に何かの語または句が挿入されることを示しており、いわば穴あき箇所である。
この発明の例文主導型翻訳装置は、図2の訳文合成・生成処理部30が、合成文の相違箇所である第1言語の語・句を第2言語に置換する。この処理は、図5のフローチャートにおいてはStep s145の処理で示されている。この第2言語への置換、即ち訳文生成処理は、置換すべき適切な訳語を選択する高度なものである。この処理に関して、さらに説明する。
That restaurant offers a good atmosphere.
の場合を例にあげて説明する。これは、説明のための一例であって、他の文であっても、第1言語が日本語で第2原語が英語の場合であっても、あるいはそのいずれか一方または両方が日本語および英語以外の言語であってもかまわない。
第1言語(英語): That restaurant offers a good service.
第2言語(日本語): そのレストランはサービスがいい。
この場合、第1言語相違箇所の決定処理(図5のStep s142)の結果、原文と対訳例文の第1言語における相違箇所は、原文では「atmosphere」であり、対訳例文の第1言語文では「service」であると判定される。
「そのレストランはatmosphereがいい。」
を得る。
(英語)が挿入された相違箇所「atmosphere」を第2言語(日本語)に変換する。前述の
ように、図2の訳文合成・生成処理部30は、相違箇所の「atmosphere」をキーワードに
対訳例文データベース51を検索する。いま、検索の結果、「atmosphere」を含む対訳例文
の組として、以下のような例を含む対訳例文の組が複数個見いだされたとする。
前記の対訳例文の例5
英語例文 「I like the homey atmosphere of that restaurant. 」と
日本語例文「あのレストランの家庭的な雰囲気が好きだ。」の組
前記の対訳例文の例6
英語例文 「bad atmosphere engulfed the city」と、
日本語例文「町はひどい大気に包まれた」の組、
そして、図31に示した、これらの対訳例文のデータに含まれている対応関係データによって、
対訳例文の例5では「atmosphere」−「雰囲気」が対応づけられていることがわかり、
対訳例文の例6では「atmosphere」−「大気」が対応づけられていることがわかる。
このようにして、「atmosphere」に対応する日本語として「雰囲気」と「大気」とが見出されたとする。訳文合成・生成処理部30は、これらの検索結果の日本語表現中、最も適切な語を選んでひとつの語に決定する必要がある。これを実現するために、訳文合成・生成処理部30は、次の処理を行う。
上記のように、検索した対訳例文の第1言語(英語)文について、入力文にある他の単語(例えば「restaurant」、「offers」および「good」)との共起の度合いを求める。ここで、共起の対象となる語は、原文に含まれるすべての語であってもよいが、所定の規則に従って対象とする語を絞り込むようにしてもよい。その詳細については、後述する。
「そのレストランは雰囲気がいい。」
が得られる。
11 翻訳結果記憶部
15 ユーザ・インタフェース
20 機械翻訳処理部
21 翻訳辞書
22 文法規則
30 訳文合成・生成処理部
31 対訳例文検索処理部
40 編集部
50 語・句対応付け処理部
51 対訳例文データベース(ユーザ登録対訳例文を含む)
52 対訳辞書引き処理部
53 対訳辞書
100 CPU
200 バスラインまたはネットワーク
300 入力部
400 出力部
500 制御プログラムモジュール
510 文字列編集部
521 機械翻訳文を文字列編集手段に入力する手段
522 第2原語生成文を文字列編集手段に入力する手段
530 表示制御部
531 原文表示選択部
532 対訳例文第1言語文表示選択部
533 対訳例文第2言語文表示選択部
534 第2言語合成文表示選択部
535 第2言語生成文表示選択部
600 機械翻訳プログラムモジュール
610 第1−第2言語辞書検索処理部
700 翻訳メモリプログラムモジュール
710 対訳例文検索処理プログラム
711 類似度判定処理プログラム
712 相違箇所判定処理プログラム
720 第2言語相違箇所判定処理プログラム
730 第2言語文合成処理プログラム
740 第2言語文生成処理プログラム
741 生成のための文法解析処理
750 対訳例文登録処理プログラム
751 対訳語句対応付け処理
800 動作用メインメモリ
810 原文バッファ
820 翻訳メモリ関連バッファ
821 ワークバッファ
822 対訳例文検索結果バッファ
823 合成文バッファ
824 生成文バッファ
825 相違箇所データバッファ
830 機械翻訳文バッファ
840 対訳例文登録関連バッファ
841 ワークバッファ
842 対訳例文バッファ
850 処理結果表示フラグバッファ
900 記憶部
910 語句対応付け済み対訳例文データ
920 第1−第2言語対訳辞書データ
930 第1→第2言語翻訳辞書データ、第1→第2言語翻訳文法規則データ、その他の第1→第2言語翻訳規則データ
940 第2言語生成用規則データ
g102 出力結果表示・編集部
g103 機械翻訳結果部
g110 対訳検索結果表示部
g111 原文バッファ表示部
g112 検索結果第1言語文バッファ表示部
g113 検索結果第2言語文バッファ表示部
g114 合成文バッファ表示部
g115 生成文バッファ表示部
g121〜125 表示選択指示ボックス
g131 機械翻訳結果の転写指示ボタン
g132 対訳検索結果の転写指示ボタン
g133 出力結果確定指示ボタン
Claims (9)
- 第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、
第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、
翻訳すべき第1言語の原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、
原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
第1言語例文中の前記相違箇所に対応する第2言語例文の語句を抽出し当該第2言語の語句を原文中の前記相違箇所の第1言語の語句に置き換えた合成文を作成する合成部と、
合成文に含まれる原文中の語句を当該第1言語の語句に対応する第2言語の訳語で置換した訳文を作成する訳文生成部と、
原文、原文に類似する第1言語例文、前記第1言語例文に対応する第2言語例文、合成文および訳文の少なくともいずれか一つを出力する出力部とを備える翻訳装置。 - 第1言語例文と、第1言語例文に対応する第2言語例文とを用いて第1言語から第2言語への翻訳を行う翻訳装置であって、
第1言語の原文を入力する入力部と、
第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の複数組を記憶する対訳例文記憶部と、
原文に類似する第1言語例文を複数組の対訳例文から検索する対訳例文検索部と、
原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定部と、
原文中の前記相違箇所の語句に関連する対訳例文から得られる情報に基づいて訳語を決定する訳語決定部と、
決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成部と、
生成された訳文を出力する出力部とを備える翻訳装置。 - 訳語決定部が、原文中の相違箇所の語句と原文中の他の語句との共起の度合いを考慮して訳語を決定する請求項2記載の翻訳装置。
- 前記対訳例文記憶部とは異なる記憶部を検索して翻訳を行う機械翻訳部をさらに備え、
機械翻訳による訳文を出力させるかあるいはさせないかを選択可能に構成される請求項1〜3のいずれか一つに記載の翻訳装置。 - 出力された文をユーザが編集するための編集部をさらに備える請求項1〜3のいずれか一つに記載の翻訳装置。
- 前記語句が、単語および連語である請求項1〜3のいずれか一つに記載の翻訳装置。
- 第1言語例文から当該例文の語句の構成に関する語句情報を作成し、各第1言語例文に対応する第2言語例文から当該例文の語句の構成に関する語句情報を作成し、作成された語句情報から第1言語の語句と第2言語の語句との対応に関する対応情報を作成して対訳例文記憶部に格納する語句対応付け部をさらに備えた請求項1または2記載の翻訳装置。
- 対訳例文検索部は、検索の結果該当する対訳例文がない場合に原文を構成する語句について複数組の対訳例文を検索し、
出力部は当該語句についての検索結果を出力するように構成される請求項1または2記載の翻訳装置。 - 第1言語の原文を入力させる入力処理と、
対訳例文記憶部に記憶された複数組の対訳例文であって、第1言語例文と、第1言語例文の語句の構成に関する情報と、第1言語例文に対応する第2言語例文と、第2言語例文の語句の構成に関する情報と、前記第1言語例文の語句と第2言語例文の語句との対応に関する情報とを含む対訳例文の中から原文に類似する第1言語例文を検索する対訳例文検索処理と、
原文と検索された対訳例文の第1言語例文との相違箇所を語句単位で判定する相違箇所判定処理と、
原文中の前記相違箇所の語句について複数組の対訳例文を検索した結果に基づいて訳語を決定する訳語決定処理と、
決定された訳語で第1言語例文中の前記相違箇所に対応する第2言語例文の語句を置換して訳文を作成する訳文生成処理と、
生成された訳文を出力する出力処理とをコンピュータに実行させる例文主導型翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004188259A JP4643183B2 (ja) | 2004-06-25 | 2004-06-25 | 翻訳装置および翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004188259A JP4643183B2 (ja) | 2004-06-25 | 2004-06-25 | 翻訳装置および翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006011842A true JP2006011842A (ja) | 2006-01-12 |
JP4643183B2 JP4643183B2 (ja) | 2011-03-02 |
Family
ID=35779041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004188259A Expired - Fee Related JP4643183B2 (ja) | 2004-06-25 | 2004-06-25 | 翻訳装置および翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4643183B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008158590A (ja) * | 2006-12-20 | 2008-07-10 | Oki Electric Ind Co Ltd | 文書選択装置及び文書選択プログラム |
JP2011095802A (ja) * | 2009-10-27 | 2011-05-12 | Toshiba Corp | 機械翻訳装置及びプログラム |
JP2011107852A (ja) * | 2009-11-14 | 2011-06-02 | Toshiba Corp | 機械翻訳装置及びプログラム |
WO2023189110A1 (ja) * | 2022-03-28 | 2023-10-05 | 株式会社バンダイ | 翻訳システム、翻訳装置及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2609173B2 (ja) * | 1990-03-26 | 1997-05-14 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 用例主導型機械翻訳方法 |
-
2004
- 2004-06-25 JP JP2004188259A patent/JP4643183B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2609173B2 (ja) * | 1990-03-26 | 1997-05-14 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 用例主導型機械翻訳方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008158590A (ja) * | 2006-12-20 | 2008-07-10 | Oki Electric Ind Co Ltd | 文書選択装置及び文書選択プログラム |
JP2011095802A (ja) * | 2009-10-27 | 2011-05-12 | Toshiba Corp | 機械翻訳装置及びプログラム |
JP2011107852A (ja) * | 2009-11-14 | 2011-06-02 | Toshiba Corp | 機械翻訳装置及びプログラム |
WO2023189110A1 (ja) * | 2022-03-28 | 2023-10-05 | 株式会社バンダイ | 翻訳システム、翻訳装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4643183B2 (ja) | 2011-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JP4643183B2 (ja) | 翻訳装置および翻訳プログラム | |
JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
JP2838984B2 (ja) | 汎用参照装置 | |
JP4845857B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP3069532B2 (ja) | かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4646078B2 (ja) | 相互に関係する固有表現の組抽出装置及びその方法 | |
US20130080144A1 (en) | Machine translation apparatus, a method and a non-transitory computer readable medium thereof | |
JP3692711B2 (ja) | 機械翻訳装置 | |
JP3313810B2 (ja) | アスペクト処理装置 | |
JP2023169063A (ja) | 日本語入力システムのkearm学習変換 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JP2006065542A (ja) | 機械翻訳方法 | |
JP2013174958A (ja) | テキスト読み上げ装置およびテキスト読み上げ方法 | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2004240605A (ja) | 文の拡大表現方法、文の拡大表現生成方法および文の拡大表現生成装置 | |
JP2024021555A (ja) | 日本語入力システムのkearm優先変換 | |
JPH11232003A (ja) | ドキュメント表示装置,表示方法および記憶媒体 | |
JPH0785026A (ja) | 辞書更生方法及び装置 | |
JPH0778166A (ja) | 翻訳方法及び機械翻訳装置 | |
JP2008226115A (ja) | 機械翻訳装置 | |
JPH0773185A (ja) | 機械翻訳装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4643183 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |