JP3680489B2 - 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3680489B2
JP3680489B2 JP12680597A JP12680597A JP3680489B2 JP 3680489 B2 JP3680489 B2 JP 3680489B2 JP 12680597 A JP12680597 A JP 12680597A JP 12680597 A JP12680597 A JP 12680597A JP 3680489 B2 JP3680489 B2 JP 3680489B2
Authority
JP
Japan
Prior art keywords
translation
information
dictionary
language
tree structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12680597A
Other languages
English (en)
Other versions
JPH10320395A (ja
Inventor
盛子 吉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP12680597A priority Critical patent/JP3680489B2/ja
Publication of JPH10320395A publication Critical patent/JPH10320395A/ja
Application granted granted Critical
Publication of JP3680489B2 publication Critical patent/JP3680489B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、機械翻訳装置及び、その機械翻訳装置を動作させるためのプログラムを格納した記録媒体に関するものである。
【0002】
【従来の技術】
従来の機械翻訳装置及び、その機械翻訳装置を動作させるためのプログラムを格納した記録媒体では、複数の単語より成る複合語を翻訳する場合には、その複合語が一語で翻訳辞書もしくはユーザー辞書に登録されていれば、その訳が出るが、そうでなければ、それぞれの単語の訳が並んで出ているだけであった。例えば、第一言語を日本語、第二言語を英語とすると、「大学卒業」はその見出し語で翻訳辞書もしくはユーザー辞書に登録されていなければ、「大学」から”university”が、「卒業」から”graduation”が出るので、その翻訳結果は”university graduation”であった。
【0003】
【発明が解決しようとする課題】
しかしながら、この翻訳結果は間違っており、正しくは”graduation from a university”である。このような訳を出すためには翻訳辞書もしくはユーザー辞書に「大学卒業」を1つの見出し語として登録すればいいのであるが、単に各々の単語の訳語を並べて出すだけでは正しい訳語を得ることができない複合語は「大学卒業」に限らず数え切れないほどあるため、そのすべてを翻訳辞書やユーザー辞書に登録するのは不可能である。
【0004】
本発明は、上述した問題点を解決するためになされたものであり、ある単語が複合語の中に出現した場合の訳し方を翻訳辞書もしくはユーザー辞書で指定できるようにすることによって、複合語の平らな構造から、その単語を親ノードとするような上下の関係を持つツリー構造に変換して、さらに英語の前置詞のような第二言語の情報や、「目的語」などの係り受けの情報をそのツリー構造に付与することによって、単に各々の単語の訳語を羅列するのではなく、ユーザーが翻訳結果を修正する必要のない自然な訳を出すことができる機械翻訳装置及び、その機械翻訳装置を動作させるためのプログラムを格納した記録媒体を提供することを目的としている。
【0005】
【課題を解決するための手段】
この目的を達成するために、本発明の請求項1に記載の機械翻訳装置は、第一言語を入力するための入力部と、翻訳に利用するための翻訳辞書と、ユーザーが任意に作成するユーザー辞書と、入力された第一言語を第二言語に翻訳する翻訳プログラムを実行するCPUと、翻訳結果を出力するための出力部とを備えた機械翻訳装置において、記憶媒体に記 憶された前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換する構造変換プログラムを備え、前記CPUが前記翻訳プログラムを実行することにより、前記見出し語を親ノードとするツリー構造に変換することを特徴とする。この構造の機械翻訳装置では、CPUが翻訳プログラムを実行することにより、入力部から入力された第一言語を翻訳辞書及びユーザー辞書を参照して第二言語に翻訳することができる。また、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することができる。従って、複合語の平らなツリー構造から、正しい翻訳結果を生成するために適したツリー構造に変換できる。
【0006】
また、請求項2に記載の機械翻訳装置は、請求項1に記載の機械翻訳装置の構成において、前記記憶媒体に記憶された前記翻訳辞書もしくは記憶装置に記憶されたユーザー辞書に、どのような条件の場合に前記のような構造変換を行うかを指定する条件指定情報を備えている。上記構成を有する請求項2記載の機械翻訳装置において、翻訳辞書およびユーザー辞書は、どのような条件の場合に前記のような構造変換を行うかを指定する条件指定情報を記憶する。
【0007】
また、請求項3に記載の機械翻訳装置は、請求項1に記載の機械翻訳装置の構成において、前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、第二言語の情報をツリー構造に付与するための情報を指定する第二言語情報指定情報を備えている。上記構成を有する請求項3記載の機械翻訳装置において、翻訳辞書もしくはユーザー辞書は、ツリー構造変換を行った後、第二言語の情報をツリー構造に付与するための情報を指定する第二言語情報指定情報を記憶する。
【0008】
さらに、請求項4に記載の機械翻訳装置は、請求項1に記載の機械翻訳装置の構成において、前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、係り受けの情報を前記ツリー構造に付与するための情報を指定する係り受け情報指定情報を備えている。上記構成を有する請求項4記載の機械翻訳装置において、前記翻訳辞書もしくはユーザー辞書は、ツリー構造に変換を行った後、係り受けの情報を前記ツリー構造に付与するための情報を指定する係り受け情報指定情報を記憶する。
【0009】
また、請求項5に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体は、第一言語を入力するための入力部と、翻訳に利用するための翻訳辞書と、ユーザーが任意に作成するユーザー辞書と、入力された第一言語を第二言語に翻訳するための翻訳プログラムを実行するCPUと、翻訳結果を出力するための出力部とを備えたコンピュータが読み取り可能な記録媒体において、前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換する構造変換プログラムを備えている。
【0010】
上記構成を有する本発明の請求項5記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体がコンピュータに読み取られることにより、コンピュータに、入力部から入力された第一言語を翻訳辞書及びユーザー辞書を参照して第二言語に翻訳させることができる。また、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することができる。従って、複合語の平らなツリー構造から、正しい翻訳結果を生成するために適したツリー構造に変換できる。
【0011】
また、請求項6に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体は、請求項5に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体の構成において、前記翻訳辞書もしくはユーザー辞書に、どのような条件の場合に前記ツリー構造変換を行うかを指定する条件指定情報を格納している。上記構成を有する請求項6記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体において、翻訳辞書もしくはユーザー辞書に、どのような条件の場合に前記ツリー構造変換を行うかを指定する条件指定情報を記憶する。
【0012】
また、請求項7に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体は、請求項5に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体の構成において、前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、第二言語の情報を前記ツリー構造に付与するための情報を指定する第二言語情報指定情報を格納している。上記構成を有する請求項7記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体において、翻訳辞書もしくはユーザー辞書は、ツリー構造に変換を行った後、第二言語の情報を前記ツリー構造に付与するための情報を指定する第二言語情報指定情報を記憶する。
【0013】
さらに、請求項8に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体は、請求項5に記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体の構成において、前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、係り受けの情報を前記ツリー構造に付与するための情報を指定する係り受け情報指定情報を格納している。上記構成を有する請求項8記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体において、翻訳辞書もしくはユーザー辞書は、ツリー構造に変換を行った後、係り受けの情報を前記ツリー構造に付与するための情報を指定する係り受け情報指定情報を記憶する。
さらに、請求項9に記載の機械翻訳方法は、入力部から入力された第一言語の入力文を、CPUが翻訳プログラムを実行することにより第二言語の文に翻訳する機械翻訳方法であって、入力部から入力された第一言語を入力バッファ領域に記憶し、当該入力バッファ領域に記憶された第一言語を記憶媒体に記憶された翻訳辞書と、記憶装置に記憶されたユーザー辞書とを参照して該当する単語があるかどうかを調べ、該当する単語のうちの最長のものを検索する形態素解析処理と、前記形態素解析処理によって得られた単語の並びを解析して、単語を句にまとめ上げたり、主語や目的語などの係り先を決め、且つ、各々の単語に見出し語と品詞と意味分類との情報を付与し、前記入力文の内部構造であるツリー構造を作る構文解析処理と、前記構文解析処理で解析された結果に基づいて、前記ユーザー辞書と前記翻訳辞書を参照しながら、各々の単語に第二言語の訳を当てると同時に、第二言語のツリー構造に変換し、また、第二言語の訳に反映させるために、前記構文解析処理で付与された第一言語の情報を第二言語の情報に付け替える構文変換処理と、前記翻訳辞書を参照しながら、前記構文変換処理により作られたツリー構造をもとにして、正しい英文を出すためのツリー構造にすると共に、英語の情報も各々のノードに付与する構文生成処理と、語尾変化などの調整を行う形態素生成処理とを行い、前記構文変換処理では、記憶媒体に記憶された前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することを特徴とする。
【0014】
【発明の実施の形態】
以下、本発明を具体化した実施の形態を、第一言語を日本語、第二言語を英語とした場合の実施例に基づいて説明する。
【0015】
本実施の形態の機械翻訳装置の構成を図1に示す。この図に示すように、キーボード等からなる日本語を入力するための入力部10と、CRTに表示したり、プリンタから印刷するための出力部20は、装置全体を制御するための中央処理装置であるCPU50に接続されている。
【0016】
記憶手段であるRAM60はCPU50に接続され、入力された日本語文を記憶するための入力バッファ領域61と、翻訳結果の英語文を記憶するための出力バッファ領域62とワークエリア63に分かれている。
【0017】
プログラムや辞書などを格納する記録媒体としてのROM70は、CPU50と接続され、その中には図2のフローチャートで示すプログラムが記憶され、日本語文を英語文に翻訳する翻訳プログラム30と翻訳プログラムが参照する翻訳辞書40が格納されている。翻訳プログラム30は日本語文を形態素解析するための形態素解析部31と、日本語文の係り受けなどの解析をする構文解析部32と、解析された日本語文を英語の構造に変換する構文変換部33と、変換された英語の構造から英語を生成する構文生成部34と、語尾変化などの調整を行う形態素生成部35に分かれている。
【0018】
CPU50には外部記憶装置80が接続されており、ユーザーが任意に作成するユーザー辞書81が格納されている。
【0019】
図2はROM70に記憶されたプログラムの動作を示すフローチャートである。
【0020】
先ず、ステップ1(以下、S1と略称する。他のステップも同様)において、キーボード等から日本語文を入力する。入力された日本語は翻訳にかけるために入力バッファ領域61に記憶される(S2)。ここに記憶された入力文は形態素解析部31において翻訳辞書40とユーザー辞書81を参照して該当する単語があるかどうかを調べるという形態素解析の処理が行われる(S3)。通常、形態素解析ではユーザー辞書があれば翻訳辞書に優先して検索される。一般的に、与えられた文の構造を把握するためには、まず文を単語の並びとして認識し、各単語を品詞などの属性に対応づける処理が必要である。英語などでは文が単語に分かち書きされるので単語と単語の境界を認定する必要はないが、日本語や中国語では通常分かち書きはされないので、単語の境界を認定する必要がある。そして、文の中に出現した単語が活用変化や語尾変化をしている場合には、その活用形を認識して、原形に戻す操作も必要である。単語の並びには一定の規則があり、入力された文字列をこの規則にしたがって翻訳辞書40やユーザー辞書81などの辞書を使用しながら分割していく処理が「形態素解析」である。
【0021】
本発明の機械翻訳装置は形態素解析における単語認定の方式として、一致する候補のうち最長のものを優先させる「最長一致法」を採用している。この方法によると、辞書の日本語見出しとして登録可能な最大文字数分の文字列を文頭から切り出し、それを検索キーワードとしてユーザー辞書81および翻訳辞書40を検索しに行く。そこで検索されない場合は最大文字数より1文字少ない文字数分の文字列を文頭から切り出し、それを検索キーワードにして検索する。もし該当する単語が検索されれば、その単語を確定して、次の文字列から再度最大文字数分を切り出して検索を続ける。
【0022】
候補の中で一致するものがあれば最長のものが検索される。例えば「大学卒業」は「大学」という名詞と「卒業」という名詞に形態素解析されるが、もし「大学卒業」という名詞があればその文字数の方が多いのでそちらが引けることになる。形態素解析で入力文を単語に分割し、検索した単語の辞書情報を各々の単語に付与した後、S4において構文解析部32において、形態素解析によって得られた単語の並びを解析プログラムによって解析して、単語を句にまとめ上げたり、主語や目的語などの係り先を決めるなどして、入力文の内部構造であるツリー構造を作る。次にS5において、構文の変換を行う。ここでは、解析された結果に基づいて、ユーザー辞書81と翻訳辞書40を参照しながら、各々の単語に英語の訳を当てると同時に、翻訳対象言語である英語のツリー構造に変換する。
【0023】
また、英文に反映させるために、解析で付与された日本語入力文の情報を英語の情報に付け替える。次にS6において構文生成を行う。ここでは、翻訳辞書57を参照しながら、構文変換部で作られたツリー構造をもとにして、正しい英文を出すためのツリー構造にする。また、英語の情報も各々のノードに付与する。次にS7において、形態素生成を行って語尾変化などの調整をして、S8で翻訳結果の英文をCRTに表示したり、プリンタから出力する。
【0024】
尚、本実施の形態の機械翻訳装置は、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換する構造変換プログラムと、どのような条件の場合に前記のような構造変換を行うかを指定する条件指定プログラムと、前記のような構造変換を行った後、第二言語の情報をツリー構造に付与するための情報を指定する第二言語情報指定プログラムと、係り受けの情報をツリー構造に付与するための情報を指定する係り受け指定プログラムがROMに予め格納されたものであるが、本発明は必ずしもこれに限定されるものではない。例えば、これらのプログラムをフロッピーディスクやCD‐ROM等に格納したものを読み取り装置により読み取ってインストールさせて動作させることができる。
【0025】
また、有線もしくは無線回線を使用して外部情報処理装置からプログラムを読み込んで動作させることができる。この場合、前記フロッピーディスクやCD‐ROMや、外部情報処理装置の当該プログラムを格納したメモリが本発明の記録媒体を構成することになる。
【0026】
図3は形態素解析部31において、入力文の「彼は大学卒業後に看護科の学校建設に携わった。」が形態素解析部31で形態素解析されてツリー構造に展開された結果を表している。この図においてrootというのは入力文のツリー構造の最上部にいつも付く仮のノードである。このノードは内部的なツリー構造を下げるのに形態素解析から形態素生成までの翻訳プロセスを通して必要なものであるが、最終的に英文を得るときには落とされる。rootのノードの下には検索された辞書の情報が付与されるが、ここでは便宜上、見出し語と品詞だけを挙げている。
【0027】
図4は入力文が構文解析部32で構文解析されツリー構造に展開された結果を表している。rootの下には入力文の主動詞である「携わる」が下がっている。形態素解析で「た」という過去の助動詞が検索されていたので、「携わる」のノードに時制の情報として「過去」が付与される。主動詞の下には「彼」と「卒業」と「建設」の3つのノードが下がっている。
【0028】
「彼」は「携わる」に対して「主語」の意味を持つので係り受けに「主語」が、そして助詞には「は」が付与されている。それぞれの単語には形態素解析から引き継いでいる「見出し語」と「品詞」の情報の他に名詞の場合にはどんな意味分類を持つかという情報が入っている。「大学卒業」は「大学」と「卒業」の2語で複合語を構成している。compというのは複合語を表し、その下に「大学」と「卒業」が下がっている。compの上には「卒業」というノードがあるが、複合語の最後の単語である「卒業」の情報が上がっている。「卒業」には文節接続マーカとして「後」が、助詞として「に」が付与されているが、これは「大学卒業後に」の部分を構文解析して得られた情報である。
【0029】
「看護科の学校建設に」の部分は以下のように構文解析されている。つまり、「看護」という名詞と「科」という名詞が2語で複合語を構成しているので、それをまとめるcompというノードがあり、その上には複合語の最後の単語である「科」が付いている。「科」には助詞として「の」が付与されており、それは「学校」と「建設」から成るcomp(複合語)をまとめる「建設」に下がっている。「携わる」という主動詞に対して「学校建設」は対象の意味を持つため、「建設」には係り受け情報として「対象」が、助詞として「に」が付与されている。
【0030】
図5は構文変換部33で参照する「卒業」の対訳辞書の情報を示す図である。この図が示すように、見出し語は「卒業」であり、その品詞は「名詞」である。また、訳語は”graduation”であり、その品詞は「名詞」である。「卒業」は複合語で使われたときの訳し分け情報を持っている。つまり、「大学卒業」のように見出し語の直前に「学校」の意味分類を持つ名詞が来たときには複合語の平らな構造を変換して、直前の単語である「大学」のノードに英語の前置詞の”from”を付与するということである。
【0031】
図6は構文変換部33で参照する「建設」の対訳辞書の情報を示す図である。この図が示すように、見出し語は「建設」であり、その品詞は「名詞」である。また、訳語は”build”であり、その品詞は「動詞」である。「建設」も複合語で使われたときの訳し分け情報を持っている。つまり、「学校建設」のように見出し語の直前に「建物」の意味分類を持つ名詞が来たときには複合語の平らな構造を変換して、直前の単語である「学校」を「建設」の訳語である”build”の目的語に取るようにするということである。
【0032】
図7は構文変換部33で参照する「科」の対訳辞書の情報を示す図である。この図が示すように、見出し語は「科」であり、その品詞は「名詞」である。また、訳語は”department”であり、その品詞は「名詞」である。「科」も同様に複合語で使われたときの訳し分け情報を持っている。つまり、「看護科」のように複合語で使われた場合は直前の名詞がどんな意味分類を持つ名詞であってもすべて訳語を”department”から”course”に変更するというものである。
【0033】
図8は構文変換部33における動作を、特に本実施の形態に関する複合語の処理について詳述したフローチャートである。
【0034】
以下に、構文変換部33で参照する対訳辞書である図5と図6と図7を使って、図4で示した解析結果のツリー構造を変換する動作について図8を用いて説明する。
【0035】
先ず、構文変換部33では名詞や副詞のように活用しない語(一般的に「体言」と呼ばれる)に対訳辞書を参照して訳語が付与される(S1)。この結果、訳語として「彼」には”he”、「大学」には”university”、「卒業」には”graduation”、「看護」には”nurse”、「科」には”department”、「学校」には”school”、「建設」には”build”がそれぞれ付与される。また同時に、「卒業」と「科」と「建設」には複合語の中で使われたときの訳し方を指示する複合語訳し分け情報があるが、この場合には、それを表すように「複合語訳し分け情報有り」という情報も付与する。
【0036】
そして、S2において「複合語訳し分け情報有り」という情報が付与されているかどうかを調べる。「複合語訳し分け情報有り」が付いていなければ(S2:NO)、複合語の処理は必要ないので、次の処理(S10)へ飛ぶ。「複合語訳し分け情報有り」であれば(S2:YES)、対訳辞書の中の複合語訳し分け情報を検索しに行く(S3)。対訳辞書には図5と図6で示すように、複合語の中で特に直前の名詞の意味分類が特定のものである場合にだけツリー構造を変えるように指定されたものがある。それを判別するためにS4において、複合語訳し分け情報で意味分類が指定されているかどうかを調べる。
【0037】
もし図5や図6のように意味分類が指定されている場合に(S4:YES)、次にS5において直前の名詞の意味分類と複合語訳し分け情報の意味分類がマッチするかどうかを調べる。マッチしなければ(S5:NO)それ以上の複合語の処理は行わず、次の処理(S10)へ飛ぶ。図7のように複合語訳し分け情報で意味分類が指定されていないか(S4:NO)、意味分類がマッチした場合(S5:YES)には次に複合語訳し分け情報に記述された情報に従って処理を進める。つまり、複合語訳し分け情報の中で「訳変更」と「英語前置詞」の両方の指定がある場合には、複合語の平らな構造から、見出し語の単語を親ノードとしてその下に直前のノードを下げるような構造に変換した上で、見出し語の単語は「訳変更」で指定された訳語に変更し、その下のノードには「英語前置詞」で指定された前置詞を付与する(S6)。
【0038】
複合語訳し分け情報の中で「英語前置詞」だけが指定されている場合には、複合語の平らな構造から、見出し語の単語を親ノードとしてその下に直前のノードを下げるような構造に変換した上で、その下のノードには「英語前置詞」で指定された前置詞を付与する(S7)。複合語訳し分け情報の中で「訳変更」のみが指定されている場合には、構造はそのままで見出し語の訳だけを「訳変更」で指定された訳語に変更する(S8)。複合語訳し分け情報の中で「係り受け」が指定されている場合には、複合語の平らな構造から、見出し語の単語を親ノードとしてその下に直前のノードを下げるような構造に変換した上で、その下のノードには「係り受け」で指定された情報を付与する(S9)もちろん、ここで「訳変更」も指定されていれば見出し語の訳語の変更も同様に行う。それが済むと、S10において用言の訳を付け、S11においてその他の処理を行う。ここでは日本語の助詞と文節接続マーカに対して適切な英語の前置詞が当てられる。入力文の中の文節接続マーカの「後」には英語の”after”という前置詞が当てられる。
【0039】
また、日本語の時制の「過去」は英語に訳したときにも過去形で出るように「英語の時制」にも「過去」が付与される。
【0040】
図9は上記のような構文変換の処理をかけた結果のツリー構造を示している。このツリー構造が示すように、rootのノードの下には主動詞の「携わる」が下がっているが、用言の訳が付いて”participate”という訳語が付与されている。”participate”の品詞は動詞であるので訳語の品詞は「動詞」である。また、日本語の時制が過去であったので、英語の時制にも「過去」が付与されている。「携わる」の下には「彼」と「卒業」と「建設」の3つのノードが下がっている。「彼」は入力文では「携わる」の主語であったが、英語でも”participate”の主語となるので英語の係り受けも「主語」である。「彼」の訳語は”he”でありその品詞は「代名詞」である。次に「卒業」と「建設」のノードについては図4の構文解析された結果できたツリー構造と比較してみると違いが明らかになる。
【0041】
つまり、構文解析されたツリー構造では複合語の構造となっており、「卒業」と「建設」のノードの下にはそれぞれ複合語であることを示すcompというノードが下がっており、その下に、複合語を構成するそれぞれの単語が平らに並んでいた。しかし、構文変換部で参照した対訳辞書の中の複合語訳し分け情報によってこれらの複合語の構造は見出し語を親ノードとして、その下に直前の単語を下げる構造になっている。「大学卒業」は「卒業」の対訳辞書の複合語訳し分け情報で直前に「学校」の意味分類を持つ単語が来たら、構造変換して直前の単語に英語の前置詞の”from”が付与されるため、「卒業」の下に直前の単語である「大学」が下がり、「大学」には英語の前置詞の”from”が付与されている。それぞれの名詞には訳語と訳語の品詞が付与されるのはすべて同様である。(以降は従って訳語と訳語の品詞の説明は省く。)「卒業」には訳語と訳語の品詞の他に、構文解析で付与された文節接続マーカの「後」に対する英語の前置詞の”after”が付与されている。
【0042】
また、「学校建設」は「建設」の対訳辞書の複合語訳し分け情報で直前に「建物」の意味分類を持つ単語が来たら、構造変換して直前の単語に係り受けの情報である「目的語」が付与されるため、「建設」の下に直前の単語である「学校」が下がり、「学校」には複合語訳し分け情報の係り受けとして「目的語」という情報が付与される。「建設」は訳語と訳語の品詞の他に、”participate”に対してどんな関係にあるのかを示すために英語の係り受けとして「対象」が付与されている。また、日本語の助詞の「に」に対して英語の前置詞の”in”が当たるのでそれも付与される。「建設」の下には「学校」だけでなく「看護科」という複合語も下がっている。「科」の対訳辞書の複合語訳し分け情報では訳を変更することだけしか指定されていないので「卒業」や「建設」のような構造変換は行われない。つまり、構文解析されてできた複合語の構造のままである。ただし、「科」は訳が”department”から”course”に変更されている。さらにcompのノードの上の「科」には日本語の助詞の「の」に対する英語の前置詞”of”が付与されている。
【0043】
このように構文変換されてできたツリー構造は構文生成部34で英文生成規則を適用して、英語として正しいツリー構造が作られ、形態素生成部35で、英語の動詞の受動態を生成したり、冠詞を出したり、語尾変形などをして最終的な訳文を得る。名詞の訳語に英語の動詞が当たっている場合に動名詞(ing形)を出すのも形態素生成である。
【0044】
「看護」の訳語の”nurse”は従って”nursing”となり、「建設」の訳語の”build”も”building”となる。構文変換部33で構造変換された際に下のノードに複合語訳し分け情報の係り受けの「目的語」が付与されたが、その場合は親ノードを動詞と見て、下のノードが目的語として処理される。つまり、「学校建設」の場合は「建設」の訳語が”build”という動詞になっており、「学校」のノードには複合語訳し分け情報の係り受けとして「目的語」が付与されているので、構文生成と形態素生成を経て得られる英文は”building a school”となる。入力文の「彼は大学卒業後に看護科の学校建設に携わった。」は上記のような処理を経て、”He participated in building a school of the nursing course.”という英文になって出力部20から出力される。
【0045】
【発明の効果】
以上説明したことから明らかなように、請求項1記載の機械翻訳装置によれば、CPUが翻訳プログラムを実行することにより、入力部から入力された第一言語を翻訳辞書及びユーザー辞書を参照して第二言語に翻訳することができる。また、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することができる。従って、複合語の平らなツリー構造から、正しい翻訳結果を生成するために適したツリー構造に変換できる。従って、単に各々の単語の訳を羅列しただけの訳語ではなく、自然な訳語を得ることができる。
【0046】
また、請求項2記載の機械翻訳装置によれば、前記翻訳辞書もしくはユーザー辞書に、どのような条件の場合に前記のような構造変換を行うかを指定する条件指定情報を備えることによって、ある条件の場合にだけその条件指定情報に指定された訳語に変更することができる。
【0047】
また、請求項3記載の機械翻訳装置によれば、前記翻訳辞書もしくはユーザー辞書に、前記のような前記ツリー構造変換を行った後、第二言語の情報をツリー構造に付与するための情報を指定する第二言語情報指定情報を備えることによって、複合語の中で使われた時に英語の前置詞などが確定できる場合にはそれを指定することによって、誤った第二言語の訳語が付かないようにすることができる
【0048】
さらに、請求項4記載の機械翻訳装置によれば、前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、係り受けの情報をツリー構造に付与するための情報を指定する係り受け情報指定情報を備えることによって、正しい係り受けの構造を作って、自然な訳語を生成することができる。つまり、上記のような手段により、単語の訳が羅列されただけの翻訳結果をユーザーがいちいち修正したり、翻訳辞書やユーザー辞書に複合語を一語で登録したりしなくても、自然で適切な複合語の訳を出すことができる。これは日本語のように複合語を作りやすい言語を翻訳するときには特に効果的である。
【0049】
また、請求項5記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体によれば、記録媒体がコンピュータに読み取られることにより、コンピュータに、入力部から入力された第一言語を翻訳辞書及びユーザー辞書を参照して第二言語に翻訳させることができる。また、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することができる。従って、複合語の平らなツリー構造から、正しい翻訳結果を生成するために適したツリー構造に変換できる。従って、単に各々の単語の訳を羅列しただけの訳語ではなく、自然な訳語を得ることができる。
【0050】
また、請求項6記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体によれば、前記翻訳辞書もしくはユーザー辞書に、どのような条件の場合に前記のようなツリー構造変換を行うかを指定する条件指定情報を格納することによって、ある条件の場合にだけその条件指定情報に指定された訳語に変更することができる。
【0051】
また、請求項7記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体によれば、前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、第二言語の情報をツリー構造に付与するための情報を指定する第二言語情報指定情報を格納することによって、複合語の中で使われた時に英語の前置詞などが確定できる場合にはそれを指定することによって、誤った第二言語の訳語が付かないようにすることができる
【0052】
さらに、請求項8記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体によれば、前記翻訳辞書もしくはユーザー辞書に、前記のようなツリー構造変換を行った後、係り受けの情報をツリー構造に付与するための情報を指定する係り受け情報指定情報を格納することによって、正しい係り受けの構造を作って、自然な訳語を生成することができる。つまり、上記のような係り受け情報指定情報により、単語の訳が羅列されただけの翻訳結果をユーザーがいちいち修正したり、翻訳辞書やユーザー辞書に複合語を一語で登録したりしなくても、自然で適切な複合語の訳を出すことができる。これは日本語のように複合語を作りやすい言語を翻訳するときには特に効果的である。
【0053】
さらに、請求項9に記載の機械翻訳方法では、入力部から入力された第一言語の入力文を、CPUが翻訳プログラムを実行することにより第二言語の文に翻訳する機械翻訳方法であって、入力部から入力された第一言語を入力バッファ領域に記憶し、当該入力バッファ領域に記憶された第一言語を記憶媒体に記憶された翻訳辞書と、記憶装置に記憶されたユーザー辞書とを参照して該当する単語があるかどうかを調べ、該当する単語のうちの最長のものを検索する形態素解析処理と、前記形態素解析処理によって得られた単語の並びを解析して、単語を句にまとめ上げたり、主語や目的語などの係り先を決め、且つ、各々の単語に見出し語と品詞と意味分類との情報を付与し、前記入力文の内部構造であるツリー構造を作る構文解析処理と、前記構文解析処理で解析された結果に基づいて、前記ユーザー辞書と前記翻訳辞書を参照しながら、各々の単語に第二言語の訳を当てると同時に、第二言語のツリー構造に変換し、また、第二言語の訳に反映させるために、前記構文解析処理で付与された第一言語の情報を第二言語の情報に付け替える構文変換処理と、前記翻訳辞書を参照しながら、前記構文変換処理により作られたツリー構造をもとにして、正しい英文を出すためのツリー構造にすると共に、英語の情報も各々のノードに付与する構文生成処理と、語尾変化などの調整を行う形態素生成処理とを行い、前記構文変換処理では 、記憶媒体に記憶された前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することができる。従って、単に各々の単語の訳を羅列しただけの訳語ではなく、自然な訳語を得ることができる。
【図面の簡単な説明】
【図1】 本実施の形態の機械翻訳装置の構成を示すブロック図である。
【図2】 記録媒体に記憶されたプログラムの処理の流れを説明するフローチャートである。
【図3】 形態素解析した結果の説明に供する図である。
【図4】 日本文が構文解析された結果のツリー構造を示す図である。
【図5】 構文変換部で参照する「卒業」の辞書情報を示す図である。
【図6】 構文変換部で参照する「建設」の辞書情報を示す図である。
【図7】 構文変換部で参照する「科」の辞書情報を示す図である。
【図8】 構文変換部における構造変換の動作を、特に本実施の形態に関する
複合語の処理について詳述したフローチャートである。
【図9】 日本文が構文変換された結果のツリー構造を示す図である。
【符号の説明】
10 入力部
20 出力部
30 翻訳プログラム
31 形態素解析部
32 構文解析部
33 構文変換部
34 構文生成部
35 形態素生成部
40 翻訳辞書
70 ROM
81 ユーザー辞書

Claims (9)

  1. 第一言語を入力するための入力部と、翻訳に利用するための翻訳辞書と、ユーザーが任意に作成するユーザー辞書と、入力された第一言語を第二言語に翻訳する翻訳プログラムを実行するCPUと、翻訳結果を出力するための出力部とを備え機械翻訳装置において、
    記憶媒体に記憶された前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換する構造変換プログラムを備え
    前記CPUが前記翻訳プログラムを実行することにより、前記見出し語を親ノードとするツリー構造に変換することを特徴とする機械翻訳装置。
  2. 前記記憶媒体に記憶された前記翻訳辞書もしくは記憶装置に記憶されたユーザー辞書に、どのような条件の場合に前記のような構造変換を行うかを指定する条件指定情報を備えることを特徴とする請求項1記載の機械翻訳装置。
  3. 前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、第二言語の情報をツリー構造に付与するための情報を指定する第二言語情報指定情報を備えることを特徴とする請求項1記載の機械翻訳装置。
  4. 前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、係り受けの情報を前記ツリー構造に付与するための情報を指定する係り受け情報指定情報を備えることを特徴とする請求項1記載の機械翻訳装置。
  5. 第一言語を入力するための入力部と、翻訳に利用するための翻訳辞書と、ユーザーが任意に作成するユーザー辞書と、入力された第一言語を第二言語に翻訳するための翻訳プログラムを実行するCPUと、翻訳結果を出力するための出力部とを備えたコンピュータが読み取り可能な記録媒体において、
    前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換する構造変換プログラムを備えていることを特徴とする機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
  6. 前記翻訳辞書もしくはユーザー辞書に、どのような条件の場合に前記ツリー構造変換を行うかを指定する条件指定情報を格納することを特徴とする請求項5記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
  7. 前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、第二言語の情報を前記ツリー構造に付与するための情報を指定する第二言語情報指定情報を格納することを特徴とする請求項5記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
  8. 前記翻訳辞書もしくはユーザー辞書に、前記ツリー構造変換を行った後、係り受けの情報を前記ツリー構造に付与するための情報を指定する係り受け情報指定情報を格納することを特徴とする請求項5記載の機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
  9. 入力部から入力された第一言語の入力文を、CPUが翻訳プログラムを実行することにより第二言語の文に翻訳する機械翻訳方法であって、
    入力部から入力された第一言語を入力バッファ領域に記憶し、
    当該入力バッファ領域に記憶された第一言語を記憶媒体に記憶された翻訳辞書と、記憶装置に記憶されたユーザー辞書とを参照して該当する単語があるかどうかを調べ、該当する単語のうちの最長のものを検索する形態素解析処理と、
    前記形態素解析処理によって得られた単語の並びを解析して、単語を句にまとめ上げたり、主語や目的語などの係り先を決め、且つ、各々の単語に見出し語と品詞と意味分類との情報を付与し、前記入力文の内部構造であるツリー構造を作る構文解析処理と、
    前記構文解析処理で解析された結果に基づいて、前記ユーザー辞書と前記翻訳辞書を参照しながら、各々の単語に第二言語の訳を当てると同時に、第二言語のツリー構造に変換し、また、第二言語の訳に反映させるために、前記構文解析処理で付与された第一言語の情報を第二言語の情報に付け替える構文変換処理と、
    前記翻訳辞書を参照しながら、前記構文変換処理により作られたツリー構造をもとにして、正しい英文を出すためのツリー構造にすると共に、英語の情報も各々のノードに付与する構文生成処理と、
    語尾変化などの調整を行う形態素生成処理と
    を行い、
    前記構文変換処理では、記憶媒体に記憶された前記翻訳プログラムに、ある見出し語が複数の単語より成る複合語の最後に出現した時、前記見出し語を親ノードとするツリー構造に変換することを特徴とする機械翻訳方法。
JP12680597A 1997-05-16 1997-05-16 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3680489B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12680597A JP3680489B2 (ja) 1997-05-16 1997-05-16 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12680597A JP3680489B2 (ja) 1997-05-16 1997-05-16 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH10320395A JPH10320395A (ja) 1998-12-04
JP3680489B2 true JP3680489B2 (ja) 2005-08-10

Family

ID=14944405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12680597A Expired - Fee Related JP3680489B2 (ja) 1997-05-16 1997-05-16 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3680489B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7361525B2 (ja) * 2019-08-07 2023-10-16 前田建設工業株式会社 用語辞書作成装置、用語辞書作成方法、及びプログラム

Also Published As

Publication number Publication date
JPH10320395A (ja) 1998-12-04

Similar Documents

Publication Publication Date Title
US5528491A (en) Apparatus and method for automated natural language translation
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
JP3476237B2 (ja) 構文解析装置
JP2005507524A (ja) 機械翻訳
JP2005507525A (ja) 機械翻訳
US20140039879A1 (en) Generic system for linguistic analysis and transformation
JP2002215617A (ja) 品詞タグ付けをする方法
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2006164293A (ja) 自動自然言語翻訳
US20050138005A1 (en) Systems and methods for searching each level of the inner structure of a string over a language having a vocabulary and a grammar
JPH0855123A (ja) イディオム登録機能を有する機械翻訳装置
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3876014B2 (ja) 機械翻訳装置
JP2632806B2 (ja) 言語解析装置
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム
Galicia-Haro Using electronic texts for an annotated corpus building
JPH07244669A (ja) 文書検索方式
JPH0561902A (ja) 機械翻訳システム
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
KR100413966B1 (ko) 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3884001B2 (ja) 言語解析システムおよび方法
JP3406462B2 (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050509

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080527

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090527

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090527

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100527

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees