JP4405494B2 - 機械翻訳装置、機械翻訳プログラム - Google Patents

機械翻訳装置、機械翻訳プログラム Download PDF

Info

Publication number
JP4405494B2
JP4405494B2 JP2006271113A JP2006271113A JP4405494B2 JP 4405494 B2 JP4405494 B2 JP 4405494B2 JP 2006271113 A JP2006271113 A JP 2006271113A JP 2006271113 A JP2006271113 A JP 2006271113A JP 4405494 B2 JP4405494 B2 JP 4405494B2
Authority
JP
Japan
Prior art keywords
translation
language
word
sentence
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006271113A
Other languages
English (en)
Other versions
JP2007058871A (ja
Inventor
美和子 島津
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006271113A priority Critical patent/JP4405494B2/ja
Publication of JP2007058871A publication Critical patent/JP2007058871A/ja
Application granted granted Critical
Publication of JP4405494B2 publication Critical patent/JP4405494B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、自然言語を他の自然言語に翻訳する機械翻訳装置および機械翻訳プログラムに係り、特に、翻訳文の理解度向上に資するのに好適な機械翻訳装置および機械翻訳プログラムに関する。
ビジネスの国際化、ボーダーレス化が進むとともに、ネットワーク社会も進展し、インターネットや電子メールのように、デジタルでの情報交換が一般利用者の間でもごく日常的になって久しい。このようなネットワーク環境の普及に伴い、インターネット上でWWW(world wide web)を通じて情報獲得を頻繁に行うようになった。
こうしたインターネット上で得られる情報は大部分が英語であり、英語が母国語でなく不得手の場合、利用者は典型的には、機械翻訳を行って原文の意味を理解しようと努めてきた。一般的に当該外国語から日本語に変換する機械翻訳の質はまずまず耐えるレベルに達しつつある。
最近では、これに加え、日本からの情報発信の必要性が叫ばれており、このためには目的言語を読むという受動的な能力で要求される以上に目的言語の言語知識を必要とする。母国語を外国語に翻訳する機械翻訳システムの需要は高まっているが、訳文の品質はまだそれに見合っていない。その一つの原因として、日英翻訳を例にとると、機械翻訳で用いる対訳辞書の開発の際、参考とした市販の和英辞書における訳語の質が以前よりは改善してきたものの自然さという観点からは適切とはいいがたいことがある。よって機械翻訳でもそれを引きずっているという現状がある。
さらに、このように情報発信としたい原文は翻訳を意図して書かれたものでない限り、あくまでもその言語の母国語話者を対象としている。したがって、人間による翻訳の場合、必要に応じて注釈をつけるが、翻訳ソフトの翻訳方式は基本的に逐語訳であるため、原則として原文に存在した語の訳語を表示するのみで、読み手の理解を考慮したものとは通常なっていない。訳文として構文解析に成功していても読み手にその意図が伝わらなければ情報発信の目的は達成できていないことになる。
一例として、対訳辞書には音訳のみが訳語として挙げられているものがあるが、これは第1言語の単語、広くはその言語が母国語として使われている地域の文化に関する知識をもっていない限り、その語の外延は読み手には不明である。そのような語の説明は、第1言語の単言語辞書に備えられているが、読み手は訳文に出現する語の中で理解できなかった語に対して、逐一語義を調べていかなくてはならない。これ自体労力がかかるが、その語義を読むのも負担がかかる。しかし、そもそもその単言語辞書の内容は第1言語を知らない第2言語の母国語話者には、何らかの支援がない限り読むことができない。
第1言語の単言語辞書を機械翻訳に利用するという試み自体は存在する。例えば特開2002−334078号公報(特許文献1)には、対訳辞書(第1言語と第2言語間)に第1言語の単言語辞書に記述されている語義を付加し、さらに、他の言語対の対訳辞書(第2言語と第3言語間)と組み合わせることにより、異なった対訳辞書(第1言語と第3言語間)を構築することが記載されている。
また、注釈の作成機能については、例えば特開平9−44486号公報(特許文献2)に言及がある。これは、辞書の内容をそのまま注釈情報とするものであり翻訳とは関係しない。また、ユーザの指定があった語句にのみ注釈が作成されるようになっている。
現状を総括すると、翻訳に単言語辞書の情報を十分活用するという点が実現されておらず、また、単言語辞書にある内容をユーザ(第2言語の母国語話者)の得意とする言語で示すなど、情報を分かりやすい形で提示することも考慮されていない。このように現状では、可能な限り下調べの労力を省くことが可能でかつ必要十分な情報を目的言語の読み手に分かりやすく提示するという機械翻訳のニーズに十分応えられていない。
特開2002−334078号公報 特開平9−44486号公報
このように従来の機械翻訳では、第1言語の単言語辞書の語義を積極的に利用したりその情報を分かりやすく表示したりすることなく翻訳を行っているために、読み手は訳文の理解に制約を感じることになる。本発明はこのような事情を考慮してなされたもので、ある自然言語を他の自然言語に翻訳する機械翻訳装置および機械翻訳プログラムにおいて、翻訳文の理解度向上に資することができる機械翻訳装置および機械翻訳プログラムを提供することを目的とする。
上記の課題を解決するため、本発明に係る機械翻訳装置は、第1言語の文を第2言語の文に翻訳する翻訳装置において、第1言語の見出し語とこの見出し語に対応する語義とを記憶する単言語辞書と、第1言語の単語、熟語に対応する第2言語の訳語を記憶するとともに、前記訳語が説明調の訳語であるときには説明調の訳語であることを示す訳語種類情報を、前記訳語が音訳の訳語であるときには音訳の訳語であることを示す訳語種類情報を、それぞれ前記訳語に対応づけて記憶する単語・熟語辞書と、第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書を参照して第2の言語の翻訳文を作成する翻訳手段と、前記単語・熟語辞書を参照して、前記文書記憶手段に記憶された第1言語の文に含まれる語句の中から、その語句に対応づけられている訳語種類情報が説明調または音訳となっている語句を抽出する語句抽出手段と、この語句抽出手段で抽出された語句に基づいて前記単言語辞書を参照して前記抽出された語句に対応する語義を取得する語義取得手段と、この語義取得手段で取得された語義を前記単語・熟語辞書を参照して第2言語に翻訳し、この語義を翻訳した結果を前記翻訳手段が作成した前記翻訳文において前記抽出された語句に対応する翻訳語に代えてまたは関連づけて付加する付加手段とを具備することを特徴とする。
また、本発明に係る別の機械翻訳装置は、第1言語の文を第2言語の文に翻訳する翻訳装置において、第1言語の見出し語とこの見出し語に対応する語義とを記憶する単言語辞書と、第1言語の単語、熟語に対応する第2言語の訳語を記憶する記憶する単語・熟語辞書と、第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書を参照して第2の言語の翻訳文を作成する翻訳手段と、前記翻訳手段が前記翻訳文を作成する際に、前記文書記憶手段に記憶された第1言語の文の中に前記単語・熟語辞書を参照しても訳語が存在しない未知語があるとき、この未知語に基づいて前記単言語辞書を参照して前記未知語に対応する語義を取得する語義取得手段と、この語義取得手段で取得された語義を前記単語・熟語辞書を参照して第2言語に翻訳し、この語義を翻訳した結果を前記翻訳手段が作成した前記翻訳文において前記未知語に対応する翻訳語として付加する付加手段とを具備することを特徴とする。
また、本発明に係る機械翻訳プログラムは、第1言語の見出し語とこの見出し語に対応する語義とを記憶する単言語辞書と、第1言語の単語、熟語に対応する第2言語の訳語を記憶するとともに、前記訳語が説明調の訳語であるときには説明調の訳語であることを示す訳語種類情報を、前記訳語が音訳の訳語であるときには音訳の訳語であることを示す訳語種類情報を、それぞれ前記訳語に対応づけて記憶する単語・熟語辞書と、第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、を持ち、前記文書記憶手段に記憶された第1言語の文を第2言語の文に翻訳する翻訳装置において、コンピュータに、前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書を参照して第2の言語の翻訳文を作成し、この翻訳文を前記文書記憶手段に記憶する翻訳機能と、前記単語・熟語辞書を参照して、前記文書記憶手段に記憶された第1言語の文に含まれる語句の中から、その語句に対応づけられている訳語種類情報が説明調または音訳となっている語句を抽出する語句抽出機能と、この語句抽出機能で抽出された語句に基づいて前記単言語辞書を参照して前記抽出された語句に対応する語義を取得する語義取得機能と、この語義取得機能で取得された語義を前記単語・熟語辞書を参照して第2言語に翻訳し、この語義を翻訳した結果を、前記翻訳機能が作成し前記文書記憶手段に記憶した前記翻訳文において前記抽出された語句に対応する翻訳語に代えてまたは関連づけて付加する付加機能とを実現させることを特徴とする。
また、本発明に係る別の機械翻訳プログラムは、第1言語の見出し語とこの見出し語に対応する語義とを記憶する単言語辞書と、第1言語の単語、熟語に対応する第2言語の訳語を記憶するとともに、前記訳語が説明調の訳語であるときには説明調の訳語であることを示す訳語種類情報を、前記訳語が音訳の訳語であるときには音訳の訳語であることを示す訳語種類情報を、それぞれ前記訳語に対応づけて記憶する単語・熟語辞書と、第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、を持ち、前記文書記憶手段に記憶された第1言語の文を第2言語の文に翻訳する翻訳装置において、コンピュータに、前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書を参照して第2の言語の翻訳文を作成し、この翻訳文を前記文書記憶手段に記憶する翻訳機能と、前記翻訳機能が前記翻訳文を作成する際に、前記文書記憶手段に記憶された第1言語の文の中に前記単語・熟語辞書を参照しても訳語が存在しない未知語があるとき、この未知語に基づいて前記単言語辞書を参照して前記未知語に対応する語義を取得する語義取得機能と、この語義取得機能で取得された語義を前記単語・熟語辞書を参照して第2言語に翻訳し、この語義を翻訳した結果を、前記翻訳機能が作成し前記文書記憶手段に記憶した前記翻訳文において前記未知語に対応する翻訳語として付加する付加機能とを実現させることを特徴とする。
お、上記で、各手段は、例えばマイクロプロセッサやメモリ、ハードディスクなどのハードウエアと、これらのハードウエア上で動作するオペレーティングシステム等の基本ソフトウエアやアプリケーションプログラムなどとによって構成することが可能である。
本発明によれば、自然言語を他の自然言語に翻訳する機械翻訳装置および機械翻訳プログラムにおいて、翻訳文の理解度向上に資することができる。
下では本発明の実施形態を図面を参照しながら説明する。図1は、本発明の一実施形態に係る機械翻訳装置の構成を示すブロック図である。この機械翻訳装置は機械翻訳プログラムを備え、これにより、同図に示すように、入力部11、システム制御部12、編集部13、翻訳部14、翻訳辞書部15、単言語辞書部16、表示部17、文書記憶部18の各部が機能する。機械翻訳プログラムと機械翻訳装置の関係については以下の各実施形態でも同様である。以下では、他の実施形態も含めて、例として第1言語を日本語、第2言語を英語として説明を行う。
入力部11は、インターネットなどの通信手段やキーボード等を通じて、翻訳すべき第1言語の文や文章を入力するものである。また、機械翻訳装置としての動作を指示するためのコマンドなどを入力するものである。入力された文やコマンドなどはシステム制御部12に送られる。
システム制御部12は、この機械翻訳装置全体を統括的に制御するものである。例えば、入力部11から得た文や文章を、表示部17に表示すべく表示部17に送る、編集すべく編集部13に送る、翻訳すべく翻訳部14に送る、記憶すべく文書記憶部18に送るなどの動作を行う。また、入力部11からのコマンドに従い編集部13、翻訳部14、翻訳辞書部15、文書記憶部18、表示部17の動作を制御する。例えば、翻訳辞書部15のデータを取り出して各部に送ったり、コマンドに従い入力された文章から翻訳する文を選択したり翻訳辞書部15が有する辞書のうちから働かせるものを選択したりする。
編集部13は、システム制御部12で選択された第1言語の文に対する編集の他、表示部17に表示された対象の編集、すなわち入力部11から入力されたコマンドなどの指示に応じて表示上でのカーソルの移動、単言語辞書部16の使用の設定、翻訳部14における翻訳処理によって得られた訳文の、システム制御部12を介する表示部17での表示等の制御を行うものである。
翻訳部14は、システム制御部12で選択された第1言語による文に対して、システム制御部12で選択された翻訳辞書部15の辞書を参照しながら翻訳処理を行うものである。翻訳辞書部15は、翻訳部14が翻訳処理を行う際に使用する各種辞書を格納・保持するものである。翻訳辞書部15が有する各種辞書の内容については後述する。単言語辞書部16は第1言語の見出し語とその語義よりなるものであり、翻訳部14が翻訳を行うときに参照される。
表示部17は、システム制御部12の制御の下、入力部11から入力された第1言語の文章(原文)や、翻訳部14により訳出された第2言語の文章(訳文)等を表示するものである。文書記憶部18は、システム制御部12の制御の下、第1言語の文章と第2言語の文章とを独立して記憶・保持するとともに、第1言語とその翻訳結果としての第2言語のデータを対応付けて記憶・保持するものである。
翻訳辞書部15は、図示するように、活用変化辞書15a、解析文法辞書15b、単語・熟語辞書15c、変換文法辞書15d、生成文法辞書15e、形態素生成文法辞書15fを有する。活用変化辞書15aは、第1言語について、語尾等に変化のある単語・熟語をその原形に変換するための辞書である。解析文法辞書15bは、第1言語を解析するための文法が記憶された辞書である。単語・熟語辞書15cは、第1言語の単語・熟語に対応する第2言語の訳語がその品詞情報や訳語種類情報(例えば音訳、説明調訳、一対一対応訳といった分類)とともに記憶された辞書である。変換文法辞書15dは、第1言語と第2言語との構造変換規則が記憶された辞書である。生成文法辞書15eは、第2言語の文の構造を決定するための辞書である。形態素生成文法辞書15fは、第2言語の語尾等の語形を変化させて翻訳文を完成させるための辞書である。
次に、図2を参照して、図1に示した機械翻訳装置の動作を説明する。図2は、図1に示した機械翻訳装置の動作フローを示す流れ図である。まず、原文(翻訳すべき第1言語の文章)を入力部11を用いてこの機械翻訳装置に取り込む(ステップ21)。取り込まれた文章は、システム制御部12により表示部17に表示されかつ文章記憶部18に記憶・保持される。ここでは具体例として、この取り込まれた文章が図5に示すように表示部17に表示された日本語であるとして以下説明する。図5は、翻訳すべき第1言語(日本語)の文章を表示したウィンドウの一例を示す図である。
表示部17に第1言語の文章が表示されたら、次に、その文章のうち翻訳すべき文にカーソルを位置させる。通常は最初であれば第1文であるが(ステップ22)、ここでは第1文についての翻訳が終わりカーソルが第2文:「なぜならこの時期には日本の伝統行事である針供養そして雛祭りが行われるからです。」にあるとして、以下の各ステップを説明する。
次に、利用者は入力部11からイベントの実行を指示するコマンドを入力する(ステップ23)。入力されたコマンドが「終了」、「翻訳」でない場合には、そのコマンドに応じた処理を実行し(ステップ29)、再びコマンドの入力がされ得る状態、ステップ23に戻る。入力されたコマンドが「終了」の場合は(ステップ24のY)動作を終了する。入力されたコマンドが「翻訳」の場合は(ステップ25のY)、翻訳処理(ステップ26)に移行する。
翻訳対象を指示するカーソルの移動は、第1文から順にその文の翻訳が終わったら次の文に移動として自動的に移動する。これ以外に、カーソルの移動をコマンドによって指定することもできる。この場合には、ステップ29の処理を実行することでカーソルが移動する。内部的には、編集部13がコマンドに応じてシステム制御部12を介して表示部17上のカーソルを移動させる。この実施形態では、カーソルが位置する一文(例えばカーソルをその先頭に位置させる)が翻訳のコマンドが指示された際の翻訳対象である。このようなカーソルの移動は、原文を翻訳しようとする際に、現在のカーソル位置の文ではなく、その前後の文を翻訳したいときなどに対応するためである。
翻訳処理(ステップ26)はシステム制御部12が統括して行う。この処理の流れの詳細については、図3を参照して次段落から説明する。翻訳処理が終わると翻訳処理結果が表示部17に表示される(ステップ27)。また、翻訳対象を指定するカーソルを次の文に移動させる(ステップ28)。そして再びコマンドの入力がされ得る状態、ステップ23に戻る。以下同様の流れにより翻訳処理を進めることができる。
翻訳処理のステップ26について図3を参照して説明する。図3は、図2に示した流れ図の中に示されるステップ26の詳細を示す流れ図であり、ここでは日本語から英語の翻訳を行う場合について説明する。ここで翻訳対象は、上記のように例として、図5に示される文章の第2文:「なぜならこの時期には日本の伝統行事である針供養そして雛祭りが行われるからです。」である。
ステップ26として最初に、システム制御部12は、翻訳部14に対して第1言語の原文を第2言語の訳文に翻訳する翻訳処理を通常の手順で実行させる(ステップ31)。この手順自体については公知の機械翻訳の手順を利用してよい。例えば、翻訳部14はまず、翻訳処理の対象とする文章に対して、活用変化辞書15aや解析文法辞書15bを用いて、語尾等に変化のある単語・熟語をその原形に変換する処理や、文法の解析等を行う。次に、単語・熟語辞書15cの単語情報を参照しながら形態素解析を行う。次に、解析文法辞書15bを用いた解析結果を参照しながら、変換文法辞書15dを用いて、第1言語から第2言語への構造変換を行う。さらに、単語・熟語辞書15cを参照して単語ごとに個別に変換を行い、生成文法辞書15eと形態素生成文法辞書15fを用いて訳文を生成する、という手順である。
次に、想定される訳文読み手の、第1言語の使用される地域に対する知識(例えばその文化に対する知識)が乏しいと仮定しその対処のための処理を実行する。具体的には、翻訳部14は、まず日本語の文中の語句のうち単語・熟語辞書15cでの訳語種類情報が「説明調」または「音訳」となっている語句を抽出する(ステップ32)。訳語種類情報が「説明調」、「音訳」であるということは、単純な訳語として概念の一致するものがなく、第2言語が使用されている地域でそのもとの語句は異質であると考えられるからである。
なお、説明調訳とは、例えば「旨煮: fish and vegetables boiled in soy with sugar」のような訳であり、音訳とは、例えば「膵臓病研究財団:Suizobyo Kenkyu Zaidan」のような訳である。これ以外の訳語種類の例としては例えば一対一対応訳が挙げられ、これは「磁気共鳴画像:magnetic resonance imaging」のような訳である。この実施形態では、単語・熟語辞書15cがこのような訳語種類情報を第2言語の訳語ごとに有することを前提とする。
訳語種類情報が「説明調」または「音訳」となっている語句が抽出されたら次に、翻訳部14は抽出された語句についてその語義を単言語辞書部16から取得する。抽出された語句と、その語句について単言語辞書部16から取得した語義とはシステム制御部12を介して表示部17に表示される(ステップ33)。この表示結果は、例えば図6に示すようになる。図6は、抽出された補足事項が必要な語句と、その語句について単言語辞書から取得した語義とを表示したウィンドウの一例を示す図である。ここでは「針供養」が抽出されその語義:「2月8日(地方によっては12月8日)、平素裁縫などに使って折れた針を、豆腐やこんにゃくに刺したり淡島神社に納めたりして供養をすること。その日、一日は裁縫を休む。」が表示されている。表示される語句およびその語義の組が複数になる場合ももちろんある。なお、「針供養」は単語・熟語辞書15cにおける訳語としては”memorial service for broken needles”となっておりこれはステップ31における処理により内部的な翻訳文中に含まれている。
次に、表示部17に表示された語義を翻訳文に取り込むか否か、すなわち利用するか否かを利用者が入力部11より指示する(ステップ34)。そして、翻訳文への取り込み指示があった場合には、翻訳部14は、取得されている語義を翻訳辞書部15を用いて翻訳しその結果をシステム制御部12を介して表示部17に表示する(ステップ35)。これにより、例えば「Hold a memorial service on February 8 (it is December 8 depending on a district) by stabbing tofu and konnyaku with the needle which broke used usually in needlework, etc., or dedicating it to Awashima Jinja.」のような翻訳結果の表示を得ることができる。この翻訳結果は、上記の単語・熟語辞書15cにおける訳語”memorial service for broken needles”と対にして記憶・保持しておく。
また、この表示のとき、例えば図4に示すようなウィンドウを同時に表示部17に表示するようにする。図4は、日本語辞書(単言語辞書)の語義の利用方法を利用者が指定する表示ウィンドウの一例を示す図である。図4に示すようなウィンドウ中にチェックを入れることにより日本語辞書の語義の利用方法を利用者は指定することができる(ステップ36)。ここでは、「補足として付加する」と「訳語として使用する」とが選択できる。「補足として付加する」は、訳語の後ろに例えば括弧書きで、翻訳後の語義が付加されるという意味であり、「訳語として使用する」は、上記ステップ31で得られた対応訳語(単語・熟語辞書15cでの訳語)に置き換えるように翻訳後の語義が使用された状態になるという意味である。
語義の翻訳結果の利用方法が利用者により指定されたらその利用方法情報を保持する(ステップ37)。この情報は、このあとの翻訳処理結果を表示するステップ27(図2)において参照される。
以上図2、図3に示した動作フローによって図5に示した日本語の文章全部に対して翻訳処理がなされると、例えば図7(b)に示すような翻訳結果の表示を表示部17に得ることができる。この例はステップ36において利用者が「針供養」の語義について「補足として付加する」を選択した場合である。また、ステップ34において翻訳文への取り込み自体を利用者が指定しなかった場合は図7(a)に示すような表示となる。図7は、通常の手順に従い日本語から英語に翻訳された文章を表示したウィンドウの一例(図7(a))、および翻訳文中の補足事項の必要な対応語に補足を示す付加した文章を表示したウィンドウの一例(図7(b))を示す図である。
図7(b)における表示は、説明調の訳語の直後にその補足事項が括弧書きで付加されている。しかしながら、訳語は通常複数の語より構成されているため、「補足として付加する」の場合は、訳文を見ただけではどの範囲が補足の対象になっているか分かりづらい。そこで、この表示の例では、図示するように、さらに、補足対象範囲の明示のため説明調の訳語の部分に例えば下線が付与される、フォントが変更される、大きさが変更される等、識別ができるようにしている。なお、この例では翻訳された語義が長いため用いなかったが、単言語辞書部利用の指定画面(図4)で、「補足として付加する」ではなく「訳語として使用する」が選択された場合は、単語・熟語辞書15cにおける訳語は使用せず、単言語辞書部16の語義からの翻訳部分のみを表示する。
以上では、単語・熟語辞書15cにおける訳語種類情報が説明調訳である訳語の場合を説明したことになるが、訳語種類情報が音訳である場合について以下補足説明する。例えば、図5に示した第1言語の文章の第3文の翻訳文は、図7(a)中に示されるように「The junior high school student of this school went out for inspection of the ceremony of the memorial service for broken needles performed in Awashima Jinja in Asakusa on February 8.」であるが、ここで「淡島神社:Awashima Jinja」が音訳の訳語種類情報を有しているものとする。
このような音訳に対してはいくつかの選択肢を考えることが可能である。第1の選択肢は、「淡島神社」で単言語辞書部16を検索し、単言語辞書部16内に見出しとして挙がっていた場合に、その単語の語義を「針供養」の説明で行ったように提示することである。または、単語・熟語辞書15cでは見出しとして挙がっていても単言語辞書部16では見出し語となっていない場合は、図8に示すように、形態素解析においてさらに分割可能な場合は分割の上、単言語辞書部16を検索し、そこで見出し語になっていればその語義を翻訳して利用することも考えられる。図8は、図3に示した流れ図の中のステップ33における変形例を示す流れ図である。
例えば、「淡島神社」は形態素解析で「淡島」「神社」に分割可能である。単言語辞書部16を用いてこれらの単語が見出し語に挙がっていれば、「淡島」の語義と「神社」の語義を訳文に利用することができる。さらに、ここで、形態素解析の後、単言語辞書部16を用いず、その分割要素に対する単語・熟語辞書15cの訳語を提示することも考えられる。これによると例えばAwashima Shrineといった訳語を得ることができる。なお、このときの表示方法は単語の区切りごとに”Awashima (Awashima) Jinja (Shrine)”とすることも、一括して”Awashima Jinja (Awashima Shrine)”とすることも採り得る方法である。
次に、図3のステップ31において未知語が発生した場合について図9を参照して補足説明する。図9は、図3に示した詳細流れ図の変形例を示す流れ図である。図9において図3と同一相当の処理の場合には同一符号を付してある。その部分については説明を省略する。なお、ここで未知語とは、それ以上分割することができず形態素解析が不可能となった文字列をいう。これにより単語・熟語辞書15cに対応する訳語が存在しない。
翻訳すべき文の例として、「彼は北アフリカにおけるマイクロクレジットと、日本の頼母子講の比較を行った。」という第1言語の文を挙げる。この文を翻訳するステップ31で「頼母子講」が未知語になったとする。この場合、従来の機械翻訳の訳文は、「He compared micro credit in Africa with 頼母子講 in Japan.」のように、未知語部分が第1言語の文字種のまま出力される(なお、読み仮名のデータがある場合はそれをローマ字表示することもあり得る。)。
そこで、本実施形態では上述した翻訳の流れのうち、形態素解析において未知語と判定された文字の並び(単語・熟語辞書15cに訳語がなかった文字の並び)をひとまとまりの語の単位と仮定して抽出し(ステップ32a)、それを見出し語として単言語辞書部16を検索して語義を取得する(ステップ33)。これにより、その語義、この場合は例えば「金銭の融通を目的とする相互扶助組織。組合員が一定の期日に一定額の掛け金をし、くじや入札によって所定の金額の融通を受け、それが組合員全員にいき渡るまで行うもの。鎌倉時代に発生したもの。」のような情報を得ることができる。そこで、以下ステップ34以降を実行することにより、その語義の訳文を生成することができる。そして、この結果得られた翻訳結果を「頼母子講」の文字列またはそのローマ字表記に併記するか、またはその部分に代入するかして表示することができる。
なお、未知語の抽出に際して、第1言語が日本語のように膠着語の場合は未知語の範囲を特定できず、複数の可能性を出すことがあり得る。この場合について図10を参照して補足説明する。図10は、図9に示した流れ図の中のステップ32aにおける変形例を示す流れ図である。
このような場合にはすべての可能性を表示し、他の可能性についても上記と同様の処理を行うようにすることが考えられる。例を挙げると、”・・・ABCDE・・・”という文字列があり、1.ABCとDE、2.ABとCDE、3.Aは前の・・・の形態素の一部でありBCDEがひとまとまり、という3つの候補がある場合は、これらの可能性をすべて表示する(ステップ32aa)。ここで、さらには各候補に対して語義情報を提供するようにするようにしてもよい。利用者は候補の中から正しいと考えるものを選択する(ステップ32ab)。なお、機械翻訳装置として正しい候補を導出できないことも考えられる。その場合は、利用者が直接的に正しい未知語範囲を指定し、その指定された文字列を単言語検索の対象にすればよい。
次に、一参照例である機械翻訳システムについて図11ないし図13を参照して説明する。図11は、一参照例である機械翻訳システムの構成を示すブロック図であり、図1において説明した構成要素と同一のものには同一符号を付してある。その部分については特に付加する機能がない場合に説明を省略する。
この例は、単言語辞書部16を必要とせず、また翻訳辞書部15Aの構成が図1に示した翻訳辞書部15の構成と多少異なっている。翻訳辞書部15Aの単語・熟語辞書15caは、単語・熟語辞書13cと異なり訳語種類情報を有していないが、第1言語の読み仮名のデータを有する。また、第2言語についての活用変化辞書15gと解析文法辞書15hとを新たに有している。この例では、訳語種類情報を単語・熟語辞書15caの訳語から判定・検出するとともに、第2言語に翻訳された文章としての見やすさを考慮して翻訳文を生成する。
図12は、図11に示した機械翻訳システムの動作フローを示す流れ図である。図11において、図2に示した流れ図の各処理と同一のものには同一符号を付してある。その部分については説明を省略する。図12は、図2と比較して翻訳処理のステップ26および翻訳処理結果を表示するステップ27が翻訳処理のステップ26Aに置き換わったことを除き同じである。
図13は、図12に示した流れ図の中に示されるステップ26Aの詳細を示す流れ図である。ステップ26Aとして最初に、システム制御部12は、翻訳部14に対して第1言語の原文を第2言語の訳文に翻訳する翻訳処理を通常の手順で実行させる(ステップ41)。この手順自体については公知の機械翻訳の手順を利用してよい。例えば、翻訳部14はまず、翻訳処理の対象とする文章に対して、活用変化辞書15aや解析文法辞書15bを用いて、語尾等に変化のある単語・熟語をその原形に変換する処理や、文法の解析等を行う。次に、単語・熟語辞書15caの単語情報を参照しながら形態素解析を行う。次に、解析文法辞書15bを用いた解析結果を参照しながら、変換文法辞書15dを用いて、第1言語から第2言語への構造変換を行う。さらに、単語・熟語辞書15cを参照して単語ごとに個別に変換を行い、生成文法辞書15eと形態素生成文法辞書15fを用いて訳文を生成する、という手順である。
次に、得られた日本語から英語への対応訳のうち特に説明調訳である部分を判定・検出する処理を以下行う。ここでは、特に名詞についてを例に挙げて説明する。名詞の具体例として、「淡島神社」と”Awashima Jinja”(音訳)、「旨煮」と”fish and vegetables boiled in thick and soy with sugar”(説明調訳)、「男女共同参画型社会」と”gender-free society in which both men and women can participate fully”(説明調訳)、「磁気共鳴画像」と”magnetic resonance imaging”(一対一対応訳)の4種の訳語を想定する。
説明調訳である部分を判定・検出するため、まず、日本語の語句の読み仮名をアルファベットに置き換える(ステップ42)。次に、このアルファベット置換後の文字列をその訳語と照合し(ステップ43)、一致した場合は音訳であると判定する(ステップ44)。上記の各名詞の例では「淡島神社」と”Awashima Jinja”の対がこれに相当する。なお、日本語の見出し語がカタカナで外来語の場合は、その原語とカタカナ文字列の照合技術がすでに確立されているのでそれを利用することができる。
一致がみられなかった場合は(ステップ43のN)、活用変化辞書15a、第1言語を解析するための文法が記憶された解析文法辞書15bを用いて、当該の語句が分割できるかどうかを判定する(ステップ45)。分割できる場合には分割を行いその形態素それぞれに関して、単語・熟語辞書15caを検索し可能な訳語を取得する(ステップ46)。
次に、取得された訳語を目的言語(英語)の活用変化辞書15gと解析文法辞書15hとを用いて解析し、名詞、動詞といった内容語を抽出する。そして、その訳語に関係代名節、従属節が使用されているというような判定基準を満たす場合には(ステップ47)、これらを説明的な要素と見なして訳語のタイプとして説明調と判定する(ステップ48)。上記の各名詞の例では「男女共同参画型社会」と”gender-free society in which both men and women can participate fully”の対がこの分類になる。
次に、説明調と判定されなかったものについて、これらの内容語と先に取得された可能な訳語との組み合わせを作り、原語の各形態素の可能な訳語のいずれかと与えられた訳語が過不足なく一致すれば、一対一対応の訳語であると判定する。上記では「磁気共鳴画像」と”magnetic resonance imaging”の対がこの分類になる。また、部分的に一致する場合は、近似訳と判定し、訳語の内容語の数が原語の形態素の数を上回る場合は説明調と判定する(以上ステップ52、53)。ステップ47の判定基準は統語的特徴によるものであるのに対し、ステップ52の判定基準は内容語の一致度に基づいている。
ステップ45で原語がそれ以上分割できない場合は、目的言語(英語)の活用変化辞書15gと解析文法辞書hを用いて解析し、内容語が2以上であるというような判定基準を満たす場合は(ステップ49)、説明調であると判定する(ステップ50)。上記では「旨煮」と”fish and vegetables boiled in thick and soy with sugar”の対がこれに相当する。なお、以上のステップの解析処理で解析に成功しなかった場合は、訳語のタイプは判定不能とする(ステップ51、53)。
こうして訳語種類情報が判定・検出されると、その情報を訳語に付与する。続いて翻訳部14はこの情報をもとに適切な翻訳処理を行うことができる。例えば、説明調訳の場合は、それがもとは一つの概念であったということが訳文の状態では読み取れないので、音訳(例えば「旨煮」であればumani)を作成しそれを対応訳語に関連付けて表示する(ステップ54)。以降、同一文章内では訳語としてその音訳を使用する。このことによって、訳文が必要以上に複雑になるのを回避することができ、訳文として見やすくなる。
見やすくなることの補足として、例えば「政府は男女共同参画型社会と人権について世論調査を行った。」の翻訳を行うと、”The government conducted a public opinion survey on gender-free society in which both men and women can participate fully and human rights.”のような訳文が得られるが、この訳文では「社会」と「人権」に相当する訳語が離れてしまっている。訳文からでは、それらが並列関係にあるということ読み取るのは困難であり、意味の理解を妨げる。この点で、「男女共同参画型社会」の例えば音訳を対応訳語に添えることで並列関係が分かりやすくなる。また以降の「男女共同参画型社会」の対応訳語は音訳のみで示すことで翻訳文が見やすくなる。
なお、図13に示した翻訳処理では、訳語種類情報を判定・検出するために複数の尺度を用いて段階的に判定を行っているが、一つの尺度のみを用いるように簡単化することも可能である。すなわち、原語の内容語の翻訳候補と訳語の中の内容語との間の一致度を算出し、その一致度に基づいて、説明調訳、近似訳などの判定を行うことが考えられる。
以上、図11ないし図13に示した参照例においては、第2言語に翻訳された文章としての見やすさを考慮して翻訳文を生成する形態を説明した。その中で説明した訳語種類情報の判定・検出の方法は、当然ながら図1ないし図10を参照して説明した実施形態において利用することができる。これによれば、図1における単語・熟語辞書15cはあらかじめ訳語種類情報を有する必要がない。
次に、本発明の別の実施形態に係る機械翻訳装置について図14ないし図17を参照して説明する。図14は、本発明の別の実施形態に係る機械翻訳装置の構成を示すブロック図であり、図1において説明した構成要素と同一のものには同一符号を付してある。その部分については特に付加する機能がない場合に説明を省略する。
この機械翻訳装置は、図14に示すように、編集部13Aとして前編集部の機能が付加されている。この意図は、第1言語において利用者が文章を編集可能とすることである。例えば、長文を分割したり、受身文を能動文にしたりなどの書き換えや、訳文においても原語のまま表示したい語句を指定する、などの基本的編集のほか、特に訳語に注釈が必要な語句を利用者が指定可能とすることである。以下では、特に、前編集部を含む編集部13Aによる、訳語に注釈が必要な語句の利用者による指定について説明する。この場合の機械翻訳装置の動作フローは、図2に示した先の実施形態の場合とほぼ同じである。ただし、翻訳処理のステップ26については、図15に示すような翻訳処理26Bになる。図15は、図14に示した機械翻訳装置を前提とする、図2に示した流れ図の中に示されるステップ26の変形例としてのステップ26Bの詳細を示す流れ図である。
例として、翻訳すべき第1言語:「荻町集落は庄川の右岸の三日月形をした段丘にあり、3つの集落の中で最も大きな集落です。 集落の全域に山麓の林の一部を含む45.6haが重要伝統的建造物群保存地区として保存され、歴史的景観が維持されています。 合掌造り家屋59棟のほか、寺院本堂、庫裏、稲架小屋、板倉などの伝統的な建物や神社の社叢、水路などが保存すべきものとして特定されています。 毎年春先には、集落の人たちが協力して茅葺き屋根の葺替え作業を行います。」を取り挙げて説明する。
まず、内部的に、翻訳部14により通常の手順に従い日本語から英語に翻訳する(ステップ61)。これは図3や図9におけるステップ31と同じである。次に、日本語の文中の語句より注釈を付与すべき語句を利用者が入力部11から指定する(ステップ62)。ここでは「合掌造り」、「庫裏」、「稲架小屋」、「板倉」の4語を利用者が指定したとする。
次に、指定された語句と、その語句について単言語辞書部16から取得した語義とを表示部17に表示する(ステップ63)。例えば「合掌造り」では、「木材を山形に組み合わせて屋根を作る日本の家屋」のような語義の表示がなされる。そして、翻訳文への取り込みを利用者によって指示する(ステップ64)。さらに、翻訳文への取り込み指示があった場合には、取得された語義を翻訳辞書部15を用いて翻訳し、その結果を表示する(ステップ65)。これにより、例えば「合掌造り」とその訳”gassho-style house”とその語義の訳”a Japanese house built of timber combined to form a roof that resembles the shape of a mountain”とが表示される。
この語義の訳の表示とともに、例えば、図16に示すような注釈の作成形式の指定を利用者に求めるウィンドウを表示部17に表示する。図16は、注釈の作成方法を利用者が指定する表示ウィンドウの一例を示す図である。ここでは、作成形式として、1)近くに表示、2)離して表示、がある。2)は、さらに、2−1)脚注とする、2−2)用語集とする、がある。2−1)は、さらに2−1−1)各ページの末尾に作成、2−2−2)文書末尾に作成、がある。利用者は、これらのうちでチェックを入れることにより注釈の作成形式を指定できる(ステップ66)。補足すると、注釈とは、翻訳文の理解を助ける情報のことであり、用語集までも含んだ広い意味である。語義の翻訳結果の利用方法が利用者により指定されたらその利用方法情報を保持する(ステップ67)。この情報は、このあとの翻訳処理結果を表示するステップ27(図2)において参照される。
「近くに表示」は例えば図7(b)に示したような括弧書きによる表示である。これを指定した場合には、例えば、”gassho-style house (a Japanese house built of timber combined to form a roof that resembles the shape of a mountain)”と表示される。「脚注とする」が指定された場合には、例えば”gassho-style house 1”のように番号を付与して、指定された箇所(ページ末尾、文書末尾など)にその番号と注釈を表示する。
「用語集とする」が指定された場合には、例えば、”gassho-style house(→glossary)”のように文章中に用語集への関連付けを表示する。用語集では、本例では「合掌造り、庫裏、稲架小屋、板倉」の4語句が対象となっているので、これらに対する訳語とその語義の翻訳結果を例えば図17に示すように訳語のアルファベット順に並べて用語集とすることができる。図17は、用語集とした注釈の表示ウィンドウの一例を示す図である。ちなみに「glossary」とは目的言語(英語)で「用語集」の意味である。
なお、以上の説明では注釈の作成形式の指定をステップ66において行っているが、これより前のタイミングで行うようにしてもよい。例えばステップ62の直後や、ステップ63の直後などとすることもできる。また、以上の実施形態で説明した、脚注や用語集などの注釈の翻訳結果への付加表示方法は、当然ながら図1ないし10を参照して説明された実施形態においても採用することができる。
次に、本発明のさらに別の実施形態に係る機械翻訳装置について図18、図19を参照して説明する。図18は、本発明のさらに別の実施形態に係る機械翻訳装置の構成を示すブロック図であり、図1において説明した構成要素と同一のものには同一符号を付してある。その部分については特に付加する機能がない場合に説明を省略する。
この機械翻訳装置は、図18に示すように、編集部13Bとして後編集部の機能が付加されている。この意図は、第2言語において、利用者が文章を編集可能とすることである。すなわち、上記の実施形態(図14ないし図17を参照)は、第1言語を参照して利用者注釈希望か否かを判断しているが、本実施形態は訳文を参照しながら注釈希望か否かを利用者が指定するものである。換言すると、上記の実施形態は翻訳者が注釈の必要性を判断するものであるが、本実施形態は翻訳文書の読者が注釈の必要性を判断するケースという見方ができる。
この機械翻訳装置の動作フローは、図2に示した先の実施形態の場合とほぼ同じである。ただし、翻訳処理のステップ26については、図19に示すような翻訳処理26Cになる。図19は、図18に示した機械翻訳装置を前提とする、図2に示した流れ図の中に示されるステップ26の変形例としてのステップ26Cの詳細を示す流れ図である。
例として、翻訳すべき第1言語:「日本の建築史において、合掌造りは、その独自性ゆえに、日本の最も重要な農村家屋のタイプの一つである。」を取り挙げて説明する。
まず、翻訳部14により通常の手順に従い日本語から英語に翻訳する(ステップ71)。これは図3や図9におけるステップ31と同じである。これにより、”In the history of Japanese architecture, the gassho-style house is one of the most important farmhouse types in Japan, due to its uniqueness.”という機械翻訳結果が表示される。次に、翻訳文の文中の語句より注釈を付与すべき語句を利用者が入力部11から指定する(ステップ72)。
ここで、利用者が、”gassho”という語に対して注釈希望の指定をしたとする。単語・熟語辞書15cでは、「合掌造り」の訳語として”gassho-style house”が当てられている。そこで、次に過去の翻訳処理の履歴を蓄積してある文書記憶部18から、”gassho”の出力元をたどる。そして、”gassho”は”gassho-style house”という訳語の一部であり、さらにこの”gassho-style house”の原語は「合掌造り」であるという情報を取り出す。そして、指定された語句、対応する日本語語句、その日本語語句に対応する単言語辞書部16の語義を表示する(ステップ73)。
利用者は、これにより、先の実施形態と同様にして、翻訳文への取り込みを指示し(ステップ74)、さらに、図16に示したように表示されたウィンドウにおいてチェックを入れることにより注釈の作成形式を指定できる(ステップ75)。語義の翻訳結果の利用方法が利用者により指定されたらその利用方法情報を保持する(ステップ76)。この情報は、このあとの翻訳処理結果を表示するステップ27(図2)において参照される。
多少補足すると、この実施形態の上記の例では、利用者の希望の語句とは若干ずれ、”gassho-style house”という用語に対して注釈が付与されることになる。訳語が説明調であった場合、こうしたずれは必然的に生じる。しかし、これによって原語の知識のない読み手はこういった複数の単語からなるものが指し示す意味範囲は、原語では一つの概念に相当するということを知ることができる。もちろん、同じ例において利用者が”gassho-style house”に対して注釈希望を指示することも考えられる。この場合はずれの問題は生じない。以上の実施形態で説明した、第2言語における注釈の必要な語句の指定は、当然ながら図1ないし10を参照して説明された実施形態においても採用することができる。
以上説明した各実施形態は次のように種々変更が可能である。例えば、上記機械翻訳装置で使用されるプログラムは、注釈付与を本文の翻訳と並列して(すなわち各文ごとに)行うようにしているが、文章全体の機械翻訳を一通り行ってから、注釈付与の処理に入るようしてもよい。また、注釈付与の指定を翻訳の前、あるいは後に一括して行うようにしているが、対話翻訳において、語句ごとに注釈希望の旨を指示することも可能である。その場合、特に脚注や用語集の作成を希望しない場合、辞書参照の同じ要領でその場の参照にとどめて、翻訳結果は保存しなくてもよい。また、補足や注釈の形式は、補足説明を希望する語の並びの範囲を指定して(原語側でも目的言語側いずれも可能)、それに対する注釈をバルーン(吹き出し)表示とするようにしてもよい。
また、注釈を付与した目的言語の文書と注釈なしの目的言語の文書との間の切換を行うようにすることも可能である。つまり、同じ原文の文書の訳文を読むに際して、注釈つきで読みたい場合と注釈なしで読みたい場合と2通りある。この切換が利用者の指示一つでできるように構成することもできる。
さらに、注釈の中に出てきた訳語に対してもさらにまた注釈を付与するように対応可能にしてもよい。例えば最初の実施形態の例では”konnyaku”という日本特有のものを指す語が「針供養」の語義の訳出として使われている。これに対する意味内容を読み手が理解できなければ、この対象語句を何らかの形を用いて指定し、これに対応する原語を翻訳処理の履歴から復元する。この場合は先の例とは違い、原文ではなく、単言語辞書部16の語義の中から対応する文字列を探すことになる。この例では、対応する語が「こんにゃく」であるので、「こんにゃく」の語義を単言語辞書部16から取り出し、それに対して再び翻訳処理にかけ、結果を表示する。このとき、利用者は原語の文字種を知らなくとも、理解へと到達することが可能となる。原理的には芋づる式に何重にもこのプロセスを繰り返すことができる。
以上説明したように、上記の各実施形態によれば次のような効果がある。第1に、音訳のみの訳を極力避け、ユーザにとって意味のある語句を用いて読み手の訳文に対する意味理解を高める訳文を作成できる。第2に、単言語辞書部16の活用により従来未知語として処理されてしまっていたものを減らすことができる。第3に、脚注付与に際して、機械化可能な部分を自動処理しているので、翻訳者の下調べの手間を軽減することができる。
本発明の一実施形態に係る機械翻訳装置の構成を示すブロック図。 図1に示した機械翻訳装置の動作フローを示す流れ図。 図2に示した流れ図の中に示されるステップ26の詳細を示す流れ図。 日本語辞書(単言語辞書)の語義の利用方法を利用者が指定する表示ウィンドウの一例を示す図。 翻訳すべき第1言語(日本語)の文章を表示したウィンドウの一例を示す図。 抽出された補足事項が必要な語句と、その語句について単言語辞書から取得した語義とを表示したウィンドウの一例を示す図。 通常の手順に従い日本語から英語に翻訳された文章を表示したウィンドウの一例、および翻訳文中の補足事項の必要な対応語に補足を示す付加した文章を表示したウィンドウの一例を示す図。 図3に示した流れ図の中のステップ33における変形例を示す流れ図。 図3に示した詳細流れ図の変形例を示す流れ図。 図9に示した流れ図の中のステップ32aにおける変形例を示す流れ図。 一参照例に係る機械翻訳システムの構成を示すブロック図。 図11に示した機械翻訳システムの動作フローを示す流れ図。 図12に示した流れ図の中に示されるステップ26Aの詳細を示す流れ図。 本発明の別の実施形態に係る機械翻訳装置の構成を示すブロック図。 図14に示した機械翻訳装置を前提とする、図2に示した流れ図の中に示されるステップ26の変形例としてのステップ26Bの詳細を示す流れ図。 注釈の作成方法を利用者が指定する表示ウィンドウの一例を示す図。 用語集とした注釈の表示ウィンドウの一例を示す図。 本発明のさらに別の実施形態に係る機械翻訳装置の構成を示すブロック図。 図18に示した機械翻訳装置を前提とする、図2に示した流れ図の中に示されるステップ26の変形例としてのステップ26Cの詳細を示す流れ図。
符号の説明
11…入力部、12…システム制御部、13…編集部、13A…編集部(+前編集部)、13B…編集部(+後編集部)、14…翻訳部、15、15A…翻訳辞書部、15a…活用変化辞書(第1言語)、15b…解析文法辞書(第1言語)、15c、15ca…単語・熟語辞書、15d…変換文法辞書、15e…生成文法辞書(第2言語)、15f…形態素生成文法辞書(第2言語)、15g…活用変化辞書(第2言語)、15h…解析文法辞書(第2言語)、16…単言語辞書部、17…表示部、18…文書記憶部。

Claims (4)

  1. 第1言語の文を第2言語の文に翻訳する翻訳装置において、
    第1言語の見出し語とこの見出し語に対応する語義とを記憶する単言語辞書と、
    第1言語の単語、熟語に対応する第2言語の訳語を記憶するとともに、前記訳語が説明調の訳語であるときには説明調の訳語であることを示す訳語種類情報を、前記訳語が音訳の訳語であるときには音訳の訳語であることを示す訳語種類情報を、それぞれ前記訳語に対応づけて記憶する単語・熟語辞書と、
    第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、
    前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書を参照して第2の言語の翻訳文を作成する翻訳手段と、
    前記単語・熟語辞書を参照して、前記文書記憶手段に記憶された第1言語の文に含まれる語句の中から、その語句に対応づけられている訳語種類情報が説明調または音訳となっている語句を抽出する語句抽出手段と、
    この語句抽出手段で抽出された語句に基づいて前記単言語辞書を参照して前記抽出された語句に対応する語義を取得する語義取得手段と、
    この語義取得手段で取得された語義を前記単語・熟語辞書を参照して第2言語に翻訳し、この語義を翻訳した結果を前記翻訳手段が作成した前記翻訳文において前記抽出された語句に対応する翻訳語に代えてまたは関連づけて付加する付加手段と
    を具備することを特徴とする機械翻訳装置。
  2. 第1言語の文を第2言語の文に翻訳する翻訳装置において、
    第1言語の見出し語とこの見出し語に対応する語義とを記憶する単言語辞書と、
    第1言語の単語、熟語に対応する第2言語の訳語を記憶する記憶する単語・熟語辞書と、
    第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、
    前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書を参照して第2の言語の翻訳文を作成する翻訳手段と、
    前記翻訳手段が前記翻訳文を作成する際に、前記文書記憶手段に記憶された第1言語の文の中に前記単語・熟語辞書を参照しても訳語が存在しない未知語があるとき、この未知語に基づいて前記単言語辞書を参照して前記未知語に対応する語義を取得する語義取得手段と、
    この語義取得手段で取得された語義を前記単語・熟語辞書を参照して第2言語に翻訳し、この語義を翻訳した結果を前記翻訳手段が作成した前記翻訳文において前記未知語に対応する翻訳語として付加する付加手段と
    を具備することを特徴とする機械翻訳装置。
  3. 第1言語の見出し語とこの見出し語に対応する語義よりなる単言語辞書を記憶する単言語辞書記憶手段と、第1言語の単語、熟語に対応する第2言語の訳語に、前記訳語が説明調の訳語であるときには説明調の訳語であることを示す訳語種類情報を、前記訳語が音訳の訳語であるときには音訳の訳語であることを示す訳語種類情報を、それぞれ対応づけた単語・熟語辞書を記憶する単語・熟語辞書記憶手段と、第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、を持ち、前記文書記憶手段に記憶された第1言語の文を第2言語の文に翻訳する翻訳装置において、
    コンピュータに、
    前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書記憶手段を参照して第2の言語の翻訳文を作成し、この翻訳文を前記文書記憶手段に記憶する翻訳機能と、
    前記単語・熟語辞書記憶手段を参照して、前記文書記憶手段に記憶された第1言語の文に含まれる語句の中から、その語句に対応づけられている訳語種類情報が説明調または音訳となっている語句を抽出する語句抽出機能と、
    この語句抽出機能で抽出された語句に基づいて前記単言語辞書記憶手段を参照して前記抽出された語句に対応する語義を取得する語義取得機能と、
    この語義取得機能で取得された語義を前記単語・熟語辞書記憶手段を参照して第2言語に翻訳し、この語義を翻訳した結果を、前記翻訳機能が作成し前記文書記憶手段に記憶した前記翻訳文において前記抽出された語句に対応する翻訳語に代えてまたは関連づけて付加する付加機能と
    を実現させることを特徴とする機械翻訳プログラム。
  4. 第1言語の見出し語とこの見出し語に対応する語義よりなる単言語辞書を記憶する単言語辞書記憶手段と、第1言語の単語、熟語に対応する第2言語の訳語に、前記訳語が説明調の訳語であるときには説明調の訳語であることを示す訳語種類情報を、前記訳語が音訳の訳語であるときには音訳の訳語であることを示す訳語種類情報を、それぞれ対応づけた単語・熟語辞書を記憶する単語・熟語辞書記憶手段と、第1言語の文とその翻訳結果である第2言語の文とを記憶するための文書記憶手段と、を持ち、前記文書記憶手段に記憶された第1言語の文を第2言語の文に翻訳する翻訳装置において、
    コンピュータに、
    前記文書記憶手段に記憶された第1言語の文から前記単語・熟語辞書記憶手段を参照して第2の言語の翻訳文を作成し、この翻訳文を前記文書記憶手段に記憶する翻訳機能と、
    前記翻訳機能が前記翻訳文を作成する際に、前記文書記憶手段に記憶された第1言語の文の中に前記単語・熟語辞書記憶手段を参照しても訳語が存在しない未知語があるとき、この未知語に基づいて前記単言語辞書記憶手段を参照して前記未知語に対応する語義を取得する語義取得機能と、
    この語義取得機能で取得された語義を前記単語・熟語辞書記憶手段を参照して第2言語に翻訳し、この語義を翻訳した結果を、前記翻訳機能が作成し前記文書記憶手段に記憶した前記翻訳文において前記未知語に対応する翻訳語として付加する付加機能と
    を実現させることを特徴とする機械翻訳プログラム。
JP2006271113A 2006-10-02 2006-10-02 機械翻訳装置、機械翻訳プログラム Expired - Fee Related JP4405494B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006271113A JP4405494B2 (ja) 2006-10-02 2006-10-02 機械翻訳装置、機械翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006271113A JP4405494B2 (ja) 2006-10-02 2006-10-02 機械翻訳装置、機械翻訳プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004077243A Division JP4350566B2 (ja) 2004-03-17 2004-03-17 機械翻訳システム

Publications (2)

Publication Number Publication Date
JP2007058871A JP2007058871A (ja) 2007-03-08
JP4405494B2 true JP4405494B2 (ja) 2010-01-27

Family

ID=37922249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006271113A Expired - Fee Related JP4405494B2 (ja) 2006-10-02 2006-10-02 機械翻訳装置、機械翻訳プログラム

Country Status (1)

Country Link
JP (1) JP4405494B2 (ja)

Also Published As

Publication number Publication date
JP2007058871A (ja) 2007-03-08

Similar Documents

Publication Publication Date Title
US7908132B2 (en) Writing assistance using machine translation techniques
US20050197826A1 (en) Embedded translation document method and system
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JPH05120324A (ja) 言語処理方式
JP4350566B2 (ja) 機械翻訳システム
JP4405494B2 (ja) 機械翻訳装置、機械翻訳プログラム
JP2002091963A (ja) 機械翻訳システム
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
Zhang et al. Building an annotated japanese-chinese parallel corpus–a part of nict multilingual corpora
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP2682048B2 (ja) 文章処理装置
Vasuki et al. English to Tamil machine translation system using parallel corpus
JP4016037B2 (ja) 機械翻訳プログラム、機械翻訳装置
JP2002132764A (ja) 機械翻訳前処理装置
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP3313810B2 (ja) アスペクト処理装置
JP2737160B2 (ja) 文章処理装置
JPH04174069A (ja) 言語理解支援装置
JP2723886B2 (ja) 機械翻訳装置及びその翻訳規則作成方法
JP2928246B2 (ja) 翻訳支援装置
JP3353873B2 (ja) 機械翻訳装置
Batra et al. Automatic translation system from Punjabi to English for simple sentences in legal domain
JP2020118891A (ja) 学習システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070806

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070823

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20071109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091104

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4405494

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131113

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees