JP2000207398A - 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 - Google Patents

機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Info

Publication number
JP2000207398A
JP2000207398A JP11008780A JP878099A JP2000207398A JP 2000207398 A JP2000207398 A JP 2000207398A JP 11008780 A JP11008780 A JP 11008780A JP 878099 A JP878099 A JP 878099A JP 2000207398 A JP2000207398 A JP 2000207398A
Authority
JP
Japan
Prior art keywords
speech
neural network
rule
machine translation
resolving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP11008780A
Other languages
English (en)
Inventor
Junzo Ikuta
淳三 生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11008780A priority Critical patent/JP2000207398A/ja
Publication of JP2000207398A publication Critical patent/JP2000207398A/ja
Ceased legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 ニューラルネットにより多品詞解消を行う機
械翻訳装置および機械翻訳方法ならびに機械翻訳プログ
ラムを記録した記録媒体を提供すること。 【解決手段】 原文の入力や、翻訳の指示を行う入力手
段1と、原文、翻訳の途中結果、翻訳結果を記憶する記
憶部2と、単語辞書を参照して入力された原文を形態素
に分割する形態素解析部3と、複数の品詞が候補となっ
た単語について、どの品詞による解釈によって解析を進
めるかをニューラルネットにより決定する多品詞解消部
4と、ルール辞書を参照して、原文の構文を解析する構
文解析部5と、前記構文解析部5の解析結果に基づき、
ルール辞書を参照して、目的言語の訳文を生成する目的
言語生成部6と、前記目的言語生成部6により生成され
た訳文を表示させる表示手段7とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば英語から日
本語へのに翻訳など、原言語を目的言語に翻訳する機械
翻訳装置および機械翻訳方法ならびに機械翻訳プログラ
ムを記録した記録媒体に関するものである。
【0002】
【従来の技術】近年、パーソナルコンピュータの普及や
情報通信ネットワークの発達に伴い、情報の国際化が急
速に進展してきており、他国語の情報を目にすることが
非常に多くなってきている。また、自ら情報を発信する
ために他国語の文書を作成する機会も増えてきている。
このような情報の活用、発信を行うために、機械翻訳装
置の利用機会が増大している。
【0003】
【発明が解決しようとする課題】従来の機械翻訳装置で
は、翻訳時に、複数の品詞が候補となった単語につい
て、どの品詞による解釈によって解析を進めるかを決定
する処理(以下「多品詞解消処理」と称する)を行うた
めには、開発者が対象となる言語の性質を解析した上
で、手作業により多品詞解消を行うための規則を記述す
ることが必要であった。
【0004】しかしながら、言語の表現は無数にあると
いってよく、人手によって多品詞解消の規則を書いて
も、全てを網羅することは困難であり、また、大量に規
則を記述しようとすれば開発コストが増大するため、あ
る程度限られた規則しか記述することができず、翻訳の
精度の低下の一原因となっていた。
【0005】本発明は、ニューラルネットを利用して多
品詞解消を行うことにより、多品詞解消を行うための知
識が自動的に獲得でき、精度の良い多品詞解消処理を行
うことのできる機械翻訳装置および機械翻訳方法ならび
に機械翻訳プログラム記録した記録媒体を提供すること
を目的とする。
【0006】
【課題を解決するための部】この課題を解決するために
本発明の機械翻訳装置は、原文の入力や、翻訳の指示を
行う入力手段と、原文、翻訳の途中結果、翻訳結果を記
憶する記憶部と、単語辞書を参照して入力された原文を
形態素に分割する形態素解析部と、複数の品詞が候補と
なった単語について、どの品詞による解釈によって解析
を進めるかをニューラルネットにより決定する多品詞解
消部と、ルール辞書を参照して、原文の構文を解析する
構文解析部と、前記構文解析部の解析結果に基づき、ル
ール辞書を参照して、目的言語の訳文を生成する目的言
語生成部と、前記目的言語生成部により生成された訳文
を表示させる表示手段と、を有する構成とした。
【0007】これにより、ニューラルネットを利用して
多品詞解消を行うことにより、多品詞解消を行うための
知識が自動的に獲得でき、精度の良い多品詞解消処理を
行うことのできる機械翻訳装置が得られる。
【0008】
【発明の実施の形態】本発明の請求項1記載の発明は、
原文の入力や、翻訳の指示を行う入力手段と、原文、翻
訳の途中結果、翻訳結果を記憶する記憶部と、単語辞書
を参照して入力された原文を形態素に分割する形態素解
析部と、複数の品詞が候補となった単語について、どの
品詞による解釈によって解析を進めるかをニューラルネ
ットにより決定する多品詞解消部と、ルール辞書を参照
して、原文の構文を解析する構文解析部と、前記構文解
析部の解析結果に基づき、ルール辞書を参照して、目的
言語の訳文を生成する目的言語生成部と、前記目的言語
生成部により生成された訳文を表示させる表示手段とを
備える構成としたことにより、機械翻訳装置の開発者に
とっては開発効率の向上をもたらし、利用者にとっては
高精度な多品詞解消を行うことができるという作用を有
する。
【0009】本発明の請求項2記載の発明は、請求項1
記載の発明において、ニューラルネットの学習・多品詞
解消時には、新規に計算すべきニューロンのみ再計算を
行うことえる構成としたことにより、高速に多品詞解消
が行えるという作用を有する。
【0010】本発明の請求項3記載の発明は、請求項1
または請求項2記載の発明において、多品詞解消部は、
ニューラルネットによるニューラルネット多品詞解消部
と、単語辞書およびルール辞書を参照しながら多品詞解
消を行うルール多品詞解消部の2つの部より構成され、
ニューラルネット多品詞解消部とルール多品詞解消部の
確信度の高い方の品詞が採用される構成としたことによ
り、従来的な規則による多品詞解消と、ニューラルネッ
トによる多品詞解消の精度の高いほうを採用できるとい
う作用を有する。
【0011】本発明の請求項4記載の発明は、請求項3
記載の発明において、多品詞解消部は、ニューラルネッ
トによるニューラルネット多品詞解消部と、ルール辞書
を参照しながら多品詞解消を行うルール多品詞解消部の
2つの手段より構成され、ニューラルネット多品詞解消
部とルール多品詞解消部の確信度の高い方の品詞が採用
された場合、優先度が一番高い品詞を決定した状態で、
再度多品詞解消を行う構成としたことにより、さらに精
度の高い多品詞解消ができるという作用を有する。
【0012】本発明の請求項5記載の発明は、請求項3
または請求項4の発明において、ニューラルネットによ
る多品詞解消部は、学習を行う場合に、確信度の高い品
詞を多品詞解消部により決定した後の条件のデータを学
習する構成としたことにより、起こる確率の高い状態を
学習することができるという作用を有する。
【0013】本発明の請求項6記載の発明は、請求項1
乃至請求項5記載の発明において、ニューラルネットに
よる多品詞解消部は、学習を行う場合に、品詞の頻度や
辞書の優先順位を使用するとを備える構成としたことに
より、より高精度な多品詞解消を行うことできるという
作用を有する。
【0014】本発明の請求項7記載の発明は、請求項1
乃至請求項6記載の発明において、ニューラルネットに
よる多品詞解消部は、多品詞解消を行う場合に、最近採
用された単語の品詞の優先度を高く設定する構成とした
ことにより、従来の枠組みでは行うことの出来なかった
文脈処理ができるという作用を有する。
【0015】以下、本発明の実施の形態について、図面
を参照しながら説明する。
【0016】(実施の形態1)第1の実施の形態につい
て説明する。
【0017】以下の説明では、原言語を英語、目的言語
を日本語として機械翻訳する例を示しているが、言語の
種類についてはこれらに限定されるものではない。
【0018】図1は本発明の第1の実施の形態における
機械翻訳装置の機能ブロック図であり、機能手段による
構成を示したものである。
【0019】図1において、1は原文の入力や、翻訳の
指示を行う入力手段、2は原文、翻訳の途中結果、翻訳
結果を記憶する記憶部、3は後述の単語辞書を参照して
入力された原文を形態素に分割する形態素解析部、4は
複数の品詞が候補となった単語について、どの品詞によ
る解釈によって解析を進めるかをニューラルネットによ
り決定する多品詞解消部、5は後述のルール辞書を参照
して、原文の構文を解析する構文解析部、6は構文解析
部5の解析結果に基づき、後述のルール辞書を参照し
て、目的言語の訳文を生成する目的言語生成部、7は目
的言語生成手段により生成された訳文を表示させる表示
手段である。
【0020】8は翻訳に必要な単語に関する情報を格納
している単語辞書、9は翻訳に必要な文法に関する情報
を格納しているルール辞書である。10は多品詞解消手
段4、構文解析手段5、目的言語生成手段6の各機能の
動作、および記憶手段2に格納されたデータの流れを制
御する翻訳制御手段である。
【0021】図2は本発明の第1の実施の形態における
機械翻訳装置の装置ブロック図であり、ハードウェアに
よる構成を示したものである。
【0022】図2において、11はキーボードやポイン
ティング・デバイスなどの入力装置である。12は装置
を制御する中央処理装置(CPU)である。13は陰極
線管ディスプレイ(CRT)などの表示装置である。1
4はデータを記憶するリード・オンリー・メモリ(RO
M)であり、CPU12が実行する制御プログラムを格
納するプログラム記憶領域を有する。15はデータを一
時的に記憶するランダム・アクセス・メモリ(RAM)
である。
【0023】図1の機能手段と図2のハードウェアとの
対応関係について説明する。
【0024】図1および図2に示すように、入力手段1
は入力装置11により実現される。記憶手段2はRAM
15により実現される。単語辞書8、ルール辞書9はR
OM14により実現される。表示手段7は表示装置13
により実現される。
【0025】また、形態素解析手段3、多品詞解消手段
4、構文解析手段5、目的言語生成手段6、翻訳制御手
段10は、CPU12が、ROM14およびRAM15
とデータのやりとりを行いながら、ROM14に格納さ
れている制御プログラムを実行することにより実現され
る。
【0026】なお、本実施の形態では、CPU12によ
り実行される制御プログラムがROM14に記憶された
形態を示しているが、制御プログラムは、CD−ROM
などの可搬性の記録媒体に記録され、読取装置を介し、
内部メモリに移して実行する形態であっても良い。この
ような形態とすることにより、本願発明を汎用コンピュ
ータ等で容易に実現可能とすることができる。
【0027】以上のように構成された機械翻訳装置につ
いて、以下にその動作を説明する。
【0028】図3は本発明の第1の実施の形態における
機械翻訳装置の動作フローチャートであり、翻訳動作に
ついて示している。本実施の形態では、翻訳対象文とな
る原文が既に原文・訳文記憶手段2に記憶されているも
のとする。
【0029】図3に示すように、まず、入力手段1から
翻訳を実行する指示があると、翻訳制御手段10は、記
憶手段2から翻訳対象とする一文を取り出し、形態素解
析手段3に送る(ステップ1)。ここでは、入力文は "
Yet her dance stops and starts with the music."と
して説明を行なう。
【0030】形態素解析手段3は、翻訳対象文の形態素
解析を行い、翻訳対象文を個々の形態素に分割する(ス
テップ2)。その結果は図4に示すような解析結果とな
る。
【0031】多品詞解消部4は、形態素解析部3が出力
した解析結果のうち、複数の品詞が存在するものに関し
てどの品詞を採用するかを決定する(ステップ3)。そ
の結果を図5に示すような結果となる。多品詞解消処理
については詳細な説明を後で行う。
【0032】構文解析部5は、多品詞解消部の出力結果
を解析し、原文の構文を解析する(ステップ4)。その
結果を図6に示す。
【0033】目的言語生成部6は、構文解析部の出力結
果を変換し、目的言語の表現を生成する(ステップ
5)。その結果を図7に示す。
【0034】表示手段7は、目的言語生成部の出力をC
RTを通じ、出力する。
【0035】以下に、ステップ3における多品詞解消処
理について詳しく説明する。
【0036】ニューラルネットによって多品詞解消を行
うため、まず品詞のパターンをあらかじめ学習させてお
く。学習が如何に行われるかを図8のフローチャートを
用いて説明する。
【0037】本発明の実施の形態1のニューラルネット
においては、大量の英文に対して、どの品詞で使われて
いるかを示した、いわゆる品詞タグ付きコーパスを学習
するものとする。コーパスの例を図9に示す。このよう
な品詞の並びをニューラルネットに学習させることによ
り、多品詞解消を行うものである。
【0038】なお、本説明においてはニューラルネット
は、図10に示すような一般的な3階層のニューラルネ
ットを使うものとするが、より階層が深いニューラルネ
ットや別の形式のニューラルネットでもよいことは言う
までもない。
【0039】図8に示すように、まず、次の1文を取り
出す(ステップ101)。始めてなので1文目、"Yet h
er dance ..."が取り出される。次に、次の1単語が取
り出される(ステップ102)。文の最初なので"Yet"
が取り出される。より一般性を増すため、ステップ10
2から109を繰り返して、"stops"が取り出された状
態を用いて説明を行う。
【0040】次に入力層へデータのセットを行う(ステ
ップ103)。図10に示したニューラルネットの入力
層は、本発明の実施の形態1においては、より詳細には
図11のようになっており、注目する単語、ここでは"s
tops" を中心に、周辺数単語の品詞の可能性を入力する
ようにする。この説明では周辺の単語数は2にセットし
てあるが、他の数でも良いことは言うまでもない。"sto
ps"という単語には、名詞の複数形の場合と、動詞の3
人称、単数、現在の2つの場合があるので、名詞と動詞
のデータを1にセットする。その他のデータは0にセッ
トする。周辺の単語も同様に、品詞の可能性があれば
1、品詞の可能性がなければ0にセットする。例え
ば、"dance"においては、名詞と動詞の可能性があるの
で、名詞と動詞のデータを1に、その他のデータを0に
セットする。
【0041】次に、ニューラルネットの前向き伝播を行
う(ステップ104)。ここではニューラルネットの一
般的前向き伝播を行うものとする。その結果を図12に
示す。
【0042】次に、正解との誤差計算を行う(ステップ
105)。図9に示す品詞タグ付きコーパスでは、"sto
ps"は動詞であると示されているので、正解データとし
ては、動詞が1、その他の品詞が0である。出力層の出
力と、正解データの差分を計算し、誤差とする。ここで
は、名詞の誤差が0.263、動詞の誤差が-0.175である。
【0043】次に進み、誤差を後ろ向きに伝播させ、ニ
ューラルネットの重みの変更を行う(ステップ106、
ステップ107)。このステップはニューラルネットの
一般的なアルゴリズムによって行うものとする。
【0044】次に、全ての単語の処理が終わったかどう
か調べる(ステップ108)。終わっていなければステ
ップ102に戻り、次の単語の処理を行う。終わってい
ればステップ109に進む。
【0045】ステップ109では、全ての文の処理が終
わったかどうか調べる。終わっていなければステップ1
01に戻り、次の文の処理を行う。終わっていればステ
ップ110に進む。
【0046】ステップ110では、十分な回数学習を行
ったかどうかを調べる。十分な回数とは、誤差がある一
定値以下になった、ある固定回数行った、重みの変更が
ある一定値以下になったなど、一般的なニューラルネッ
トの判断基準で構わない。十分な回数学習が行われたと
判断されれば学習を終了する。十分な回数の学習が行わ
れていないと判断されればステップ111に進む。
【0047】ステップ111では、対象となる文を最初
の文に戻し、ステップ101に戻った際に、最初の文か
ら処理されるようにして、ステップ101に戻る。
【0048】以上で図8を使った学習の様子を示した。
このように学習したニューラルネットを用いて、如何に
多品詞解消を行うかを図14のフローチャートを用いて
説明する。
【0049】図14に示すように、まず、翻訳対象とな
る1文を取り出す(ステップ201)。ここでは学習の
ときに説明した、"Yet her dance ..."が取り出される
ものとする。
【0050】次に、次の1単語が取り出される(ステッ
プ202)。文の最初なので"Yet"が取り出される。よ
り一般性を増すため、ステップ202から206を繰り
返して、"stops"が取り出された状態を用いて説明を行
う。
【0051】次に入力層へデータのセットを行う(ステ
ップ203)。図15に示すごとく、ニューラルネット
の入力層にデータをセットするものとする。学習の場合
と同じように、注目する単語、ここでは"stops" を中心
に、周辺数単語の品詞の可能性を入力するようにする。
"stops"という単語には、名詞の複数形の場合と、動詞
の3人称、単数、現在の2つの場合があるので、名詞と
動詞のデータを1にセットする。その他のデータは0に
セットする。周辺の単語も同様に、品詞の可能性があれ
ば1、品詞の可能性がなければ0にセットする。例え
ば、"dance"においては、名詞と動詞の可能性があるの
で、名詞と動詞のデータを1に、その他のデータを0に
セットする。
【0052】次に、ニューラルネットの前向き伝播を行
う(ステップ204)。ここではニューラルネットの一
般的前向き伝播を行うものとする。図15は前向き伝播
を行った結果も含んでいる。
【0053】次に、品詞の決定を行う(ステップ20
5)。図15に示すように、出力層の中では動詞が一番
大きい値を持つため、"stops"の品詞は動詞であると決
定される。
【0054】次に、全ての単語の処理が終わったかどう
か調べる(ステップ206)。終わっていなければステ
ップ102に戻り、次の単語の処理を行う。終わってい
れば多品詞解消処理を終わる。ステップ102からステ
ップ206を繰り返し行うことにより、1文中の全ての
単語の品詞が決定去れる。
【0055】このようにして、ニューラルネットにより
多品詞解消を行うことができる。
【0056】(実施の形態2)本発明の実施の形態2に
おいては、実施の形態1に示すニューラルネットの学習
および多品詞解消時に、新規に計算すべきニューロンの
み再計算を行う構成とする場合の説明を行う。図8や図
14に示すごとく、ニューラルネットは全ての単語を1
つづつ品詞の学習や多品詞解消を行う。対象とする単語
が"stops"から"and" に移動した状態を図16に示す。
【0057】一般に、1つの単語に多種の品詞の可能性
があるわけではなく、ほとんどの1〜3個の可能性であ
り、それ以外の品詞のデータは0にセットされる。その
ため、次の単語に移動しても、0のままになっているデ
ータが多く、再計算する必要がない。また、単語が移動
しても偶然1のままである入力データもあり、これも再
計算する必要がない。図16中には、再計算の必要のな
い入力層を太い丸で示している。図16に示すごとく、
再計算の必要がない入力層の方が多く、かなりの計算量
削減が可能である。
【0058】本発明の実施の形態2においては、値が変
わらない入力層については再計算をしないことにより、
高速に学習や多品詞解消が行えるというものである。
【0059】(実施の形態3)本発明の実施の形態3に
おいては、実施の形態1および実施の形態2で示した機
械翻訳装置に、従来の規則による多品詞解消を統合する
というものである。以下、図を用いてその動作を説明す
る。
【0060】図17に、"Yet her dance stops and sta
rts ..."という文の多品詞解消を、それぞれニューラル
ネットと、従来の規則によって行い、それぞれの単語と
品詞に対する確信度(その品詞がどのぐらい確かだと判
定されるかを示す数値)を示している。ニューラルネッ
トによる確信度は出力層の値をそのまま使うものとす
る。従来の規則による確信度は、従来の規則に確信度が
付与されている場合はその値を、または付与されていな
い場合であっても、品詞が決定される順番などを基に確
信度を付与するものとする。
【0061】図17においては、"Yet"には副詞と接続
詞の2つの可能性があるが、ニューラルネットよる多品
詞解消では、副詞の確信度が0.026、接続詞の確信
度が0.965であることを示している。また、従来の
規則による多品詞解消では、副詞の確信度が0.5、接
続詞の確信度が0.1であることを示す。
【0062】ニューラルネットによる多品詞解消では、
該当するようなパターンの文が学習されたかされていな
いかで確信度が変わる。また、従来の規則による確信度
では、開発者の判断により、確信度が与えられる。いず
れにしろ、確信度が高い品詞ほど確からしさが大きいと
考えられるので、それぞれの確信度のうち、高い方の品
詞を採用するものとする。
【0063】図17においては、"Yet"はニューラルネ
ットによる確信度が一番高い接続詞が採用される。その
他の単語に関してはニューラルネットによる多品詞解消
も、従来の規則による多品詞解消も、同一の品詞と判定
されているので、問題無く、確信度の高い方の品詞、例
えば "dance"では名詞を採用する。
【0064】以上のように、本発明の実施の形態3にお
いては、2つの方式のうち、より確からしい方を採用す
ることにより、文全体として正確さの増した多品詞解消
を行うことができ、ひいては正確な機械翻訳装置が提供
できる。
【0065】(実施の形態4)本発明の実施の形態4に
おいては、実施の形態3で示した機械翻訳装置に加え、
確信度がもっとも高い品詞が決定され、その品詞のみが
決定されたものとして再度多品詞解消を行い、高精度な
多品詞解消を実現するものである。以下、図を用いてそ
の動作を説明する。
【0066】図17に示すように、"Yet her dance sto
ps and starts ..."という文の多品詞解消を行うものと
する。本発明の実施の形態3における機械翻訳装置で
は、"dance"の多品詞解消を行うためには図18に示す
ような入力層で多品詞解消を行う。
【0067】これらの単語のうち、もっとも確信度の高
いものが"Yet"の接続詞である。したがって、"Yet"を接
続詞と判定する。次に、その接続詞が確定したものとし
て、再度他の単語の多品詞解消を行う。
【0068】"dance"の多品詞解消を行うためには図1
9に示すように、 "Yet"の部分は接続詞のみ1であり、
副詞は0にした入力層で多品詞解消を行う。
【0069】これにより、擬似的に、より簡単なパター
ンの文に対して多品詞解消を行うことになり、高精度な
多品詞解消を実現できる。
【0070】(実施の形態5)本発明の実施の形態5に
おいては、本発明の実施の形態3または4で示した機械
翻訳装置において、ニューラルネットの学習を行う際
に、さらに学習データを増加させ、高精度な多品詞解消
を実現するものである。以下、図を用いてその動作を説
明する。
【0071】図17に示すように、"Yet her dance sto
ps and starts ..."という文の学習を行うものとする。
本発明の実施の形態3における機械翻訳装置では、図1
8に示すような入力層の状態で学習を行うものである。
【0072】これらの単語のうち、もっとも確信度の高
いものが"Yet"の接続詞である。したがって、"Yet"を接
続詞とした場合の状態で学習を行う。すなわち、図20
の文を学習させる。図4と比べれば、"Yet"の品詞の可
能性が減少していることがわかるが、このようにするこ
とにより、擬似的により多くのパターンを学習させるこ
とになり、高精度な多品詞解消を実現できる。
【0073】また、本発明の実施の形態4では、確信度
がもっとも高い品詞が決定され、その品詞のみが決定さ
れたものとして多品詞解消を行うが、その状態を学習し
ているため、本発明の実施の形態4に対する効果が非常
に大である。
【0074】(実施の形態6)本発明の実施の形態6に
おいては、本発明の実施の形態1から5のいずれかの機
械翻訳装置において、品詞の頻度や辞書の優先順位を使
用することにより、高精度な多品詞解消を実現するもの
である。以下、図を用いてその動作を説明する。
【0075】例えば、"dance"という単語は10対3の
割合で名詞と動詞で使われており、"stop"という単語は
5:10の割合で名詞と動詞で使われており、 "start
s"という単語は7:10の割合で名詞と動詞で使われて
いるとする。この情報を利用して、ニューラルネットの
入力層にデータをセットする(図21)。例えば、"sto
p"の名詞には0.5、動詞には1をセットする。
【0076】このように、品詞のパターンだけでなく、
単語がどの品詞で使われやすいかを利用することによ
り、元々使われやすい品詞は採用されることになり、高
精度な多品詞解消を実現するものである。
【0077】(実施の形態7)本発明の実施の形態7に
おいては、本発明の実施の形態1から6のいずれかの機
械翻訳装置において、最近採用された単語の品詞の優先
度を高く設定することにより、文脈情報を利用するもの
である。以下、図を用いてその動作を説明する。
【0078】ある文である単語がある品詞で使われた場
合、その文章中では同一の品詞で使われる可能性が増加
する。例えば、ある文"... in her will if he ..."に
おいては、willは名詞として使われているものとす
る。"will"は通常助動詞として使われる場合が多いが、
一度"will"が名詞として表れた文章では、再度"will"が
名詞として使われる可能性が増加する。
【0079】本発明の実施の形態7においてはこのよう
な性質を利用して多品詞解消に文脈処理的な処理を行わ
せ、高精度な多品詞解消を行わせるものである。例であ
げたように、"will"が名詞として使われた場合、以降
の"will"の名詞の入力の値を増やす。例えば、図22に
示すように、 "... the good will left on .."という
文の"will"の入力の値は、名詞の値を増やして2とし、
助動詞の値を1とする。この事により、名詞が採用され
やすくする。
【0080】このように、一度使われた品詞の入力の値
を増加させることにより、文脈処理的な処理を行わせ、
高精度な多品詞解消を行わせるものである。
【0081】以上、本発明の実施の形態では、対象言語
を英語として説明したが、英語のみに限定したアルゴリ
ズムではなく、さまざまな言語の処理に応用可能な発明
である。また、本発明においては機械翻訳装置に関して
説明を行ったが、本発明によれば、機械翻訳装置のみな
らず、文章校正装置や自動要約装置など、自然言語処理
を行う装置には容易に適応可能なのは言うまでもない。
【0082】
【発明の効果】以上のように本発明によれば、原文の入
力や、翻訳の指示を行う入力手段と、原文、翻訳の途中
結果、翻訳結果を記憶する記憶部と、単語辞書を参照し
て入力された原文を形態素に分割する形態素解析部と、
複数の品詞が候補となった単語について、どの品詞によ
る解釈によって解析を進めるかをニューラルネットによ
り決定する多品詞解消部と、ルール辞書を参照して、原
文の構文を解析する構文解析部と、前記構文解析部の解
析結果に基づき、ルール辞書を参照して目的言語の訳文
を生成する目的言語生成部と、前記目的言語生成部によ
り生成された訳文を表示させる表示手段とを備える構成
としたことにより、機械翻訳装置の開発者にとっては開
発効率の向上をもたらし、利用者にとっては高精度な多
品詞解消を行うことができるという有利な効果が得られ
る。
【0083】また、ニューラルネットの学習・多品詞解
消時には、新規に計算すべきニューロンのみ再計算を行
う構成としたことにより、高速に多品詞解消が行えると
いう有利な効果が得られる。
【0084】また、多品詞解消部は、ニューラルネット
によるニューラルネット多品詞解消部と、ルール辞書を
参照しながら多品詞解消を行うルール多品詞解消部の2
つの部より構成され、ニューラルネット多品詞解消部と
ルール多品詞解消部の確信度の高い方の品詞が採用され
る構成としたことにより、従来的な規則による多品詞解
消と、ニューラルネットによる多品詞解消の精度の高い
ほうを採用できるという有利な効果が得られる。
【0085】また、多品詞解消部は、ニューラルネット
によるニューラルネット多品詞解消部と、ルール辞書を
参照しながら多品詞解消を行うルール多品詞解消手段の
2つの部より構成され、ニューラルネット多品詞解消部
とルール多品詞解消部の確信度の高い方の品詞が採用さ
れた場合、優先度が一番高い品詞を決定した状態で、再
度多品詞解消を行う構成としたことにより、さらに精度
の高い多品詞解消ができるという有利な効果が得られ
る。
【0086】また、ニューラルネットによる多品詞解消
部は、学習を行う場合に、確信度の高い品詞を多品詞解
消部により決定した後の条件のデータを学習する構成と
したことにより、起こる確率の高い状態を学習すること
ができるという有利な効果が得られる。
【0087】また、ニューラルネットによる多品詞解消
部は、学習を行う場合に、品詞の頻度や辞書の優先順位
を使用するとを備える構成としたことにより、より高精
度な多品詞解消を行うことできるという有利な効果が得
られる。
【0088】また、ニューラルネットによる多品詞解消
部は、多品詞解消を行う場合に、最近採用された単語の
品詞の優先度を高く設定する構成としたことにより、従
来の枠組みでは行うことの出来なかった文脈処理ができ
るという有利な効果が得られる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における機械翻訳装
置の機能ブロック図
【図2】本発明の第1の実施の形態における機械翻訳装
置を示す装置ブロック図
【図3】本発明の第1の実施の形態における機械翻訳装
置の動作フローチャート
【図4】本発明の第1の実施の形態における形態素解析
後の解析状態を示す図
【図5】本発明の第1の実施の形態における多品詞解消
後の解析状態を示す図
【図6】本発明の第1の実施の形態における構文解析後
の解析状態を示す図
【図7】本発明の第1の実施の形態における目的言語生
成後の目的言語を示す図
【図8】本発明の第1の実施の形態におけるニューラル
ネットの学習動作を示すフローチャート
【図9】本発明の第1の実施の形態における学習例文を
示す図
【図10】本発明の第1の実施の形態におけるニューラ
ルネットの構成を示す図
【図11】本発明の第1の実施の形態におけるニューラ
ルネットの入力を示す図
【図12】本発明の実施の形態1におけるニューラルネ
ットの前向き伝播を示す図
【図13】本発明の第1の実施の形態におけるニューラ
ルネットの誤差計算を示す図
【図14】本発明の第1の実施の形態におけるニューラ
ルネットによる多品詞解消動作を示すフローチャート
【図15】本発明の第1の実施の形態におけるニューラ
ルネットの多品詞解消を示す図
【図16】本発明の第2の実施の形態におけるニューラ
ルネットの再計算の要/不要を示す図
【図17】本発明の第3の実施の形態における2つの多
品詞解消方式の途中結果を示す図
【図18】本発明の第4の実施の形態におけるニューラ
ルネットの入力層を示す図
【図19】本発明の第4の実施の形態におけるニューラ
ルネットの入力層を示す図
【図20】本発明の第5の実施の形態における学習例文
を示す図
【図21】本発明の第6の実施の形態におけるニューラ
ルネットの入力層を示す図
【図22】本発明の第7の実施の形態におけるニューラ
ルネットの入力層を示す図
【符号の説明】
1 入力手段 2 記憶部 3 形態素解析部 4 多品詞解消部 5 構文解析部 6 目的言語生成部 7 表示手段 8 単語辞書 9 ルール辞書 10 翻訳制御部 11 キーボード 12 中央処理装置(CPU) 13 陰極線管ディスプレイ(CRT) 14 リード・オンリー・メモリ(ROM) 15 ランダム・アクセス・メモリ(RAM)

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】原文の入力や翻訳の指示を行う入力手段
    と、原文、翻訳の途中結果、翻訳結果を記憶する記憶部
    と、単語辞書を参照して入力された原文を形態素に分割
    する形態素解析部と、複数の品詞が候補となった単語に
    ついて、どの品詞による解釈によって解析を進めるかを
    ニューラルネットにより決定する多品詞解消部と、ルー
    ル辞書を参照して原文の構文を解析する構文解析部と、
    前記構文解析部の解析結果に基づき、ルール辞書を参照
    して目的言語の訳文を生成する目的言語生成部と、前記
    目的言語生成部により生成された訳文を表示させる表示
    手段と、を有することを特徴とする機械翻訳装置。
  2. 【請求項2】前記多品詞解消部は、ニューラルネットの
    学習・多品詞解消時には、新規に計算すべきニューロン
    のみ再計算を行うことを特徴とする請求項1記載の機械
    翻訳装置。
  3. 【請求項3】前記多品詞解消部は、ニューラルネットに
    よるニューラルネット多品詞解消部と、ルール辞書を参
    照しながら多品詞解消を行うルール多品詞解消部とを備
    え、前記ニューラルネット多品詞解消部と前記ルール多
    品詞解消部とのうち、確信度の高い方の品詞を採用する
    ことを特徴とする請求項1または請求項2記載の機械翻
    訳装置。
  4. 【請求項4】前記多品詞解消部は、前記ニューラルネッ
    ト多品詞解消部と前記ルール多品詞解消部の確信度の高
    い方の品詞が採用した場合、優先度が一番高い品詞を決
    定した状態で、再度多品詞解消を行うことを特徴とする
    請求項3記載の機械翻訳装置。
  5. 【請求項5】前記ニューラルネット多品詞解消部は、学
    習を行う場合に、確信度の高い品詞を、前記多品詞解消
    部により決定した後の条件のデータを学習することを特
    徴とする請求項3または請求項4記載の機械翻訳装置。
  6. 【請求項6】ニューラルネットによる多品詞解消部は、
    学習を行う場合に、品詞の頻度や辞書の優先順位を使用
    することを特徴とする請求項1乃至請求項5記載の機械
    翻訳装置。
  7. 【請求項7】ニューラルネットによる多品詞解消部は、
    多品詞解消を行う場合に、最近採用された単語の品詞の
    優先度を高く設定することを特徴とする請求項1乃至請
    求項6記載の機械翻訳装置。
  8. 【請求項8】データを記憶する記憶装置と、データを表
    示する表示装置とを備える装置を制御する機械翻訳方法
    であって、 記憶装置に記憶された原文を取り出す第1のステップ
    と、単語辞書を参照して取り出した原文を形態素に分割
    する第2のステップと、複数の品詞が候補となった単語
    について、どの品詞による解釈によって解析を進めるか
    をニューラルネットにより決定する第3のステップと、
    ルール辞書を参照して原文の構文を解析する第4のステ
    ップと、前記第4のステップにおける解析結果に基づ
    き、ルール辞書を参照して目的言語の訳文を生成する第
    5のステップと、前記第5のステップで生成された訳文
    を表示させる第6のステップと、を有することを特徴と
    する機械翻訳方法。
  9. 【請求項9】複数の品詞が候補となった単語について、
    どの品詞による解釈によって解析を進めるかをニューラ
    ルネットにより決定するステップにおいて、新規に計算
    すべきニューロンのみ再計算を行うことを特徴とする請
    求項8記載の機械翻訳方法。
  10. 【請求項10】複数の品詞が候補となった単語につい
    て、どの品詞による解釈によって解析を進めるかを決定
    する多品詞解消ステップは、ニューラルネットによるニ
    ューラルネット多品詞解消ステップと、ルール辞書を参
    照しながら多品詞解消を行うルール多品詞解消ステップ
    との2つのステップより構成され、ニューラルネット多
    品詞解消ステップとルール多品詞解消ステップの確信度
    の高い方の品詞を採用することを特徴とする請求項8ま
    たは請求項9記載の機械翻訳方法。
  11. 【請求項11】複数の品詞が候補となった単語につい
    て、どの品詞による解釈によって解析を進めるかを決定
    する多品詞解消ステップは、ニューラルネットによるニ
    ューラルネット多品詞解消ステップと、ルール辞書を参
    照しながら多品詞解消を行うルール多品詞解消ステップ
    の2つのステップより構成され、ニューラルネット多品
    詞解消ステップとルール多品詞解消ステップの確信度の
    高い方の品詞が採用された場合、優先度が一番高い品詞
    を決定した状態で、再度多品詞解消を行うことを特徴と
    する請求項10記載の機械翻訳方法。
  12. 【請求項12】ニューラルネットにより学習を行う場合
    に、確信度の高い品詞を多品詞解消ステップにより決定
    した後の条件のデータを学習することを特徴とする請求
    項9または請求項10記載の機械翻訳方法。
  13. 【請求項13】ニューラルネットにより学習を行う場合
    に、品詞の頻度や辞書の優先順位を使用することを特徴
    とする請求項8乃至請求項12に記載の機械翻訳方法。
  14. 【請求項14】ニューラルネットにより学習を行う場合
    に、最近採用された単語の品詞の優先度を高く設定する
    ことを特徴とする請求項8乃至請求項13に記載の機械
    翻訳方法。
  15. 【請求項15】データを記憶する記憶装置と、データを
    表示する表示装置とを備える装置を制御する機械翻訳プ
    ログラムを記録した記録媒体であって、 記憶装置に記憶された原文を取り出す第1のステップ
    と、単語辞書を参照して取り出した原文を形態素に分割
    する第2のステップと、複数の品詞が候補となった単語
    について、どの品詞による解釈によって解析を進めるか
    をニューラルネットにより決定する第3のステップと、
    ルール辞書を参照して原文の構文を解析する第4のステ
    ップと、前記第4のステップにおける解析結果に基づ
    き、ルール辞書を参照して目的言語の訳文を生成する第
    5のステップと、前記第5のステップで生成された訳文
    を表示させる第6のステップと、を有することを特徴と
    する機械翻訳プログラムを記録した記録媒体。
  16. 【請求項16】複数の品詞が候補となった単語につい
    て、どの品詞による解釈によって解析を進めるかをニュ
    ーラルネットにより決定するステップにおいて、新規に
    計算すべきニューロンのみ再計算を行うことを特徴とす
    る請求項15記載の機械翻訳プログラムを記録した記録
    媒体。
  17. 【請求項17】複数の品詞が候補となった単語につい
    て、どの品詞による解釈によって解析を進めるかを決定
    する多品詞解消ステップは、ニューラルネットによるニ
    ューラルネット多品詞解消ステップと、ルール辞書を参
    照しながら多品詞解消を行うルール多品詞解消ステップ
    との2つのステップより構成され、ニューラルネット多
    品詞解消ステップとルール多品詞解消ステップの確信度
    の高い方の品詞を採用することを特徴とする請求項15
    または請求項16記載の機械翻訳プログラムを記録した
    記録媒体。
  18. 【請求項18】複数の品詞が候補となった単語につい
    て、どの品詞による解釈によって解析を進めるかを決定
    する多品詞解消ステップは、ニューラルネットによるニ
    ューラルネット多品詞解消ステップと、ルール辞書を参
    照しながら多品詞解消を行うルール多品詞解消ステップ
    の2つのステップより構成され、ニューラルネット多品
    詞解消ステップとルール多品詞解消ステップの確信度の
    高い方の品詞が採用された場合、優先度が一番高い品詞
    を決定した状態で、再度多品詞解消を行うことを特徴と
    する請求項17記載の機械翻訳プログラムを記録した記
    録媒体。
  19. 【請求項19】ニューラルネットにより学習を行う場合
    に、確信度の高い品詞を多品詞解消ステップにより決定
    した後の条件のデータを学習することを特徴とする請求
    項17または請求項18記載の機械翻訳プログラムを記
    録した記録媒体。
  20. 【請求項20】ニューラルネットにより学習を行う場合
    に、品詞の頻度や辞書の優先順位を使用することを特徴
    とする請求項15乃至請求項19に記載の機械翻訳プロ
    グラムを記録した記録媒体。
  21. 【請求項21】ニューラルネットにより学習を行う場合
    に、最近採用された単語の品詞の優先度を高く設定する
    ことを特徴とする請求項15乃至請求項20に記載の機
    械翻訳プログラムを記録した記録媒体。
JP11008780A 1999-01-18 1999-01-18 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 Ceased JP2000207398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11008780A JP2000207398A (ja) 1999-01-18 1999-01-18 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11008780A JP2000207398A (ja) 1999-01-18 1999-01-18 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000207398A true JP2000207398A (ja) 2000-07-28

Family

ID=11702405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11008780A Ceased JP2000207398A (ja) 1999-01-18 1999-01-18 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000207398A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019107624A1 (ko) * 2017-11-30 2019-06-06 주식회사 시스트란인터내셔널 시퀀스-대-시퀀스 번역 방법 및 이를 위한 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019107624A1 (ko) * 2017-11-30 2019-06-06 주식회사 시스트란인터내셔널 시퀀스-대-시퀀스 번역 방법 및 이를 위한 장치

Similar Documents

Publication Publication Date Title
KR100911621B1 (ko) 한영 자동번역 방법 및 장치
US6760695B1 (en) Automated natural language processing
JP5377889B2 (ja) 言語処理装置およびプログラム
US5610812A (en) Contextual tagger utilizing deterministic finite state transducer
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
KR20120006489A (ko) 입력 방법 편집기
JPH06251057A (ja) 機械翻訳方法及び機械翻訳装置
Lee et al. Deep learning-based context-sensitive spelling typing error correction
WO2010046782A2 (en) Hybrid machine translation
JPS62163173A (ja) 機械翻訳方法
WO2002039318A1 (en) User alterable weighting of translations
WO1997040453A1 (en) Automated natural language processing
Antony et al. A survey of advanced methods for efficient text summarization
Ganfure et al. Design and implementation of morphology based spell checker
Galley et al. Hybrid natural language generation for spoken dialogue systems
Forsati et al. Novel harmony search-based algorithms for part-of-speech tagging
Lee N-Gram Language Model
Garay-Vitoria et al. Modelling text prediction systems in low-and high-inflected languages
JP2000207398A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
Babhulgaonkar et al. Experimenting with factored language model and generalized back-off for Hindi
Nou et al. Khmer POS tagger: a transformation-based approach with hybrid unknown word handling
Tohma et al. Challenges Encountered in Turkish Natural Language Processing Studies
CN115577090B (zh) 基于成语理解的语音对话方法、装置、设备及存储介质
JP2007102530A (ja) 特定言語の文法を生成する装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051209

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070523

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070612

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20071023