JP3388153B2 - 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents
機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体Info
- Publication number
- JP3388153B2 JP3388153B2 JP26613097A JP26613097A JP3388153B2 JP 3388153 B2 JP3388153 B2 JP 3388153B2 JP 26613097 A JP26613097 A JP 26613097A JP 26613097 A JP26613097 A JP 26613097A JP 3388153 B2 JP3388153 B2 JP 3388153B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- translation
- input
- degree
- semantic feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
2言語の文に翻訳する機械翻訳装置に関するものであ
る。
等で海外に出かける機会が多くなった現在では、外国で
の会話に困らないように多くの会話表現を集めた会話用
例集が多く出版されている。また、これらの会話用例集
を電子化し、キー操作等で会話用例文を選び出して、選
び出された会話用例文の翻訳文を表示する機械翻訳装置
が提案されており、例えば、特開平6−325072号
公報に記載されたものがある。
よって最適な会話用例文を自動的に選択してその翻訳文
を表示する機械翻訳装置が提案されている。この方式で
は、会話用例文と各例文を特徴づける語句を類語ごとに
グルーピングされたものを、多数記憶している。前者を
定型文、後者を意味素性と呼んでいる。
し、それらの組み合わせのパターンの近い定型文を検索
する。その際、入力文と各定型文が、意味素性の組み合
わせのパターンとしてどのくらい一致しているかを判定
する必要がある。
度を各単語単位の一致によって算出し、ある閾値以上の
定型文だけ表示する方法をとっている。
度がすべて閾値に満たない場合がありうる。そのような
場合、従来では、利用者に対し、単に該当する例文がな
いことを表示するのみであった。
れたものであって、請求項1記載の発明は、第1言語の
会話の文と、その翻訳文である第2言語の文との対であ
る対訳用例と、意味素性とを対応付けて格納する対訳デ
ータベースと、意味素性とその意味素性として抽出する
表記を定義して格納した意味素性辞書と、第1言語の入
力文を入力する入力手段と、前記入力手段から入力され
た入力文に基づいて、前記意味素性辞書および前記対訳
データベースを検索して対訳用例を抽出する検索手段
と、前記検索手段によって抽出された対訳用例と、前記
入力手段によって入力された入力文との一致度を算出
し、一致度が閾値以上の対訳用例が存在する場合は、一
致度が閾値未満の対訳用例を出力せずに前記一致度が閾
値以上の対訳用例を出力し、一致度が閾値未満の対訳用
例しか存在しない場合は、その一致度が閾値未満である
抽出された対訳用例を出力する出力手段を具備すること
を特徴とする機械翻訳装置である。
1記載の機械翻訳装置において、前記出力手段は、一致
度の高い順に対訳用例を出力することを特徴とする機械
翻訳装置である。
1または請求項2に記載の機械翻訳装置において、前記
出力手段は、一致度が同一の対訳用例が複数ある場合、
その対訳用例の第1言語の文の長さに基づいた順序で前
記対訳用例を出力することを特徴とする機械翻訳装置で
ある。
1から請求項3のいずれかに記載の機械翻訳装置におい
て、前記出力手段は、入力文と一致する部分を他と区別
して対訳用例を出力することを特徴とする機械翻訳装置
である。
会話の文と、その翻訳文である第2言語の文との対であ
る対訳用例と、意味素性とを対応付けて格納する対訳デ
ータベースと、意味素性とその意味素性として抽出する
表記を定義して格納した意味素性辞書と、第1言語の単
語と第2言語の翻訳文を対応付けて格納した電子辞書
と、第1言語の入力文を入力する入力手段と、前記入力
手段から入力された入力文に基づいて、前記意味素性辞
書および前記対訳データベースを検索して対訳用例を抽
出する検索手段と、前記検索手段によって抽出された対
訳用例と、前記入力手段によって入力された入力文との
一致度を算出し、一致度が閾値未満の対訳用例しか存在
しないか否かを判断する判断手段と前記判断手段によっ
て一致度が閾値未満の対訳用例しか存在しないと判断さ
れた場合は、前記電子辞書を検索して前記入力文に含ま
れる単語の翻訳文を出力する出力手段を具備することを
特徴とする機械翻訳装置である。
会話の文と、その翻訳文である第2言語の文との対であ
る対訳用例と、意味素性とを対応付けて格納する対訳デ
ータベースと、意味素性とその意味素性として抽出する
表記を定義して格納した意味素性辞書と、第1言語の入
力文を入力する入力手段と、前記入力手段から入力され
た入力文に基づいて、前記意味素性辞書および前記対訳
データベースを検索して対訳用例を抽出する検索手段
と、前記検索手段によって抽出された対訳用例と、前記
入力手段によって入力された入力文との一致度を算出
し、一致度が閾値以上の対訳用例が存在する場合は、一
致度が閾値未満の対訳用例を出力せずに前記一致度が閾
値以上の対訳用例を出力し、一致度が閾値未満の対訳用
例しか存在しない場合は、その一致度が閾値未満である
抽出された対訳用例を出力する出力手段を実現させるた
めの機械翻訳プログラムを記載したコンピュータ読み取
り可能な記録媒体である。
説明する。なお、これによって本発明は限定されるもの
ではない。特に、ここでは、第一言語を日本語とし、第
二言語を英語とする。
である。
PU(中央処理装置)1と液晶ディスプレイ2と表示用
ドライバ3と入力認識部4と作業用メモリ5とRAM6
aと記録媒体6bとバス19とから構成される。
すものであり、データバス等のバス19を通じてRAM
6a、作業用メモリ5、表示用ドライバ3、入力認識部
4のそれぞれと接続されている。
対話文などを表示する際のドライバである。入力認識部
4は手書き入力されたデータを認識するものである。
て必要とされるデータを一時的に格納するためのメモリ
である。
プログラムや、多数のフレーズ等を格納することのでき
るメモリである。
ためのプログラム以外に、対話データベース7、意味素
性辞書8、電子辞書9が格納される。対話データベース
7は例えば番地0〜50000、意味素性辞書8は番地
50001〜70000、電子辞書9は番地70001
〜100000というように格納される。
行うためのプログラムは、CPU1で実行される動作の
性質から解析部10、検索部11、制御部(正常系)1
2、制御部(異常系)13、単語抽出部14に分けられ
る。
れた入力データを解析するプログラムである。検索部1
1は対話データベース7、意味素性辞書8を検索するプ
ログラムである。制御部(正常系)12は画面表示の制
御など、上記以外の正常な処理の制御を行うプログラム
である。また、制御(異常系)13は対訳文が見つから
ないといったエラーの表示など異常が起こった場合の制
御を行うプログラムである。単語抽出部14は電子辞書
9を検索するプログラムである。
書8、電子辞書9といったデータ、および解析部10、
検索部11、制御部(正常系)12、制御部(異常系)
13、単語抽出部14といったプログラムはPCカード
やDVDなどの記録媒体6bに記録されており、この記
録媒体6bを装置本体に装着して、RAM6aに読み込
まれて格納される。
翻訳して現地の人に伝えたい有用な文例が図2のような
形で多数定義されている。ここで、文例の一行目は表示
される日本文であり、二行目はその訳文で、翻訳結果と
して日本文と一緒に表示される英文である。また、三行
目はこの対訳文に対応付けられている意味素性の集合で
あり、意味素性列と呼ぶ。
ードとなる文字列であり、各日本文の一文節にひとつず
つ割当てられることが多い。文例1の「チェックインを
お願いします」においては、「チェックイン」、「お願
いします」がこの文の意味素性となっている。正確には
これらは意味素性の名称であり、どういう文字列をこれ
らの意味素性として定義するかは意味素性辞書8に記述
してある。
その意味素性として抽出する日本語文字列が定義されて
いる。例えば「チェックイン」、「お願いします」とい
う意味素性は意味素性辞書8に図3のように定義されて
いる。
名称の意味素性として定義している、という意味であ
る。例えば、「お願いいたします」という文字列は「お
願い」という名称の意味素性として定義されている。
および英語の訳語が定義されている。例えば、「学
校」、「添乗員」という単語の品詞と訳語は、電子辞書
9に図4のように定義されている。
し、品詞が名詞であり、英語訳がschoolであると
いう意味である。なお、電子辞書は、本装置のために新
規に作成する必要はなく、既存の電子辞書を流用してよ
い。
る。図5において、内部に日本語と英語の文例を対にし
て多数記憶しており、これらを液晶ディスプレイ15に
表示できるようになっている。また、この装置はインタ
ーフェースとして専用ペン16による手書き文字認識を
用いる。
5以外のものを用いることも可能であるし、入力手段と
しては音声やキーボード入力などの他の手段も可能であ
る。
する。この装置の基本動作の概略は、ユーザが被翻訳文
を入力し、その文から意味素性を検出し、その意味素性
から定型文を検出し、その定型文中の可変意味素性を置
換し表示する、というものである。ここでは、ユーザが
入力した被翻訳文を入力文、装置が格納している日本文
を定型文という。定型文とその翻訳文の英語文の対を言
う際は対訳文という。
る。説明は図6のフローチャート図の各ステップについ
て詳細を示す形で行う。「チェックインをお願いしま
す」という文を翻訳する過程を例にとる(以下、この文
を入力文1と呼ぶ)。
12が、表示用ドライバ3を通じて液晶ディスプレイ1
5に図7の「被翻訳文入力画面」を表示する。
翻訳文入力画面において、手書き入力ボード17に専用
ペン16によって「チェックインをお願いします」と手
書きで入力する。図8は入力途中の図であり、図9は入
力が終了した状態の図である。
訳アイコン18を押す。この入力文は入力認識部4によ
って認識され、作業用メモリ5に格納される。その後、
ステップA4に移る。
テップA3で作業用メモリ5に格納した入力文1から、
部分文字列を作成し、作業用メモリ5に格納する。次
に、ステップA5に移る。
テップA4において作業用メモリ5に格納した入力文1
の部分文字列をキーに、ROM6に格納されている意味
素性辞書8を検索する。部分文字列のうち意味素性辞書
8に意味素性として定義されている文字列があれば、C
PU1の検索部11はその文字列と意味素性の名称を対
で作業用メモリ5に格納し、ステップA6に移る。なけ
ればステップA14に移る。
検索し、その順序を保存しておくことによって、各意味
素性の入力文での出現順も保存しておく。
キーとして意味素性辞書8を検索する過程を説明する。
る意味素性辞書8を50001番地から順に一行ずつ読
み込み、作業用メモリ5に格納する。意味素性辞書8の
各行には左側に各意味素性の名称が、右側にその意味素
性として定義される文字列が記述してある。
いします」が意味素性辞書8に定義されているので、検
索部11はその左側にある意味素性の名称「お願い」
と、入力文の部分文字列「お願いします」を対で作業用
メモリ5に格納しなおす。
「お願いします」という文字列は定義されていないの
で、意味素性辞書8の検索を終了する。
列について行うと、 [部分文字列と対応する意味素性] 「チェックイン」=「チェックイン」 「お願い」=「お願いします」 が検出された。
り、それぞれ左辺の文字列は右辺の名称の意味素性とし
て検出されたことを意味する。
は、上の対応表の上から下の順番で検出されたものとす
る。この順序は作業用メモリ5内で保存されている。
テップA5において作業用メモリ5に格納した意味素性
の名称をキーに、RAM6aに格納されている対訳デー
タベース7を検索する。意味素性の名称のうち、対訳デ
ータべ−ス7に現れるものがあれば、その意味素性が現
れている定型文を、その翻訳文の英文、意味素性列と共
に作業用メモリ5に格納し、ステップA7に移る。なけ
ればステップA14に移る。
細を説明する。まず、検索部11はステップA5で作業
用メモリ5に格納した意味素性の集合のうちのひとつを
キーに、対訳データべ−ス7を検索する。まず、意味素
性「チェックイン」をキーに対訳データベース7を検索
する。
な文例が定義されていると、文例1には意味素性列の中
に「チェックイン」意味素性が含まれている。よって、
検索部11は文例1を作業用メモリ5に格納する。
5に格納されているすべての意味素性について行う。い
ま、すべての意味素性についての検索が終了した後、図
2の文例1、文例3が作業用メモリ5に格納されている
とする。なお、文例3は意味素性「お願いします」によ
って検索された。
テップA6において作業用メモリ5に格納した定型文の
うち、先頭に格納されている1文を選択する。選択した
定型文には解析済フラグを立てておく。ここでは、文例
1を選択し、解析済フラグを立てておく。
テップA7において選択した定型文の入力文との一致度
を計算する。ここでは、定型文の各意味素性のうち入力
文中の意味素性と一致しているものの個数を用いて計算
する。そして、定型文と一致度の対を作業用メモリ5に
格納し、一致度がある閾値以上であればステップA9に
移り、閾値未満であればステップA11に移る。ここで
は閾値を100点とする。
文例1の意味素性「チェックイン」、「お願い」は全て
入力文中にあるので、一致している個数に100を掛け
て、この定型文の入力文との一致度を200点とする。
そして、文例1と一致度200点を作業用メモリ5に格
納する。文例1の一致度200点は閾値100点を超え
ているので、ステップA9に移る。
業用メモリ5に、解析済フラグの立っていない定型文が
存在するかどうか調べる。存在すればステップA10
に、存在しなければステップA12に移る。いま、文例
3には解析済フラグが立っていないので、ステップA1
0に移る。
作業用メモリ5内の解析済フラグの立っていない定型文
を1文選択しフラグを立て、ステップA8に移る。ここ
では文例3に解析済フラグを立ててステップA8に移
る。
例3の一致度を計算する。文例3の意味素性のうち、入
力文中にあるのは「お願い」の1つである。残りの「紅
茶」は入力文中には存在しない。また、入力文中の「チ
ェックイン」という意味素性は文例3に存在しない。よ
って、一致している個数1に100を掛けたものから、
一致していない個数2に50を掛けたものを引いた0点
を、この定型文の入力文との一致度とする。よって文例
3と一致度0点を作業用メモリ5に格納する。文例3の
一致度0点は閾値100点より低いので、ステップA1
1に移る。
ステップA8で作業用メモリ5に格納された、一致度が
閾値未満の定型文について、作業用メモリ5に消去フラ
グを立てる。そして、ステップA9に移る。いま、一致
度が0点である文例3について、作業用メモリ5に消去
フラグを立て、ステップA9に移る。
業用メモリ5に、解析済みフラグの立っていない定型文
が存在しないことを察知し、ステップA12に移る。
表示用ドライバ3を通じて液晶ディスプレイ15を図9
の自由文通訳入力画面から図10の対訳文表示画面に切
り換える。その後、ステップA13に移る。
作業用メモリ5に格納してある文例のうち、消去フラグ
の付いていない日本文と英文を、表示用ドライバ3を通
じて液晶ディスプレイ15に図11のように対訳で表示
する。また、表示する際には一致度の高い定型文から順
に表示する。いま、作業用メモリ5に格納されているの
は文例1のみである。この日本文と英文を図11のよう
に表示する。
意味素性あるいは定型文が検索されなかった場合、ステ
ップA14に移る。
系)13は、翻訳不能と判断して、表示用ドライバ3を
通じて液晶ディスプレイ15を図9の自由文通訳入力画
面から、図12の翻訳不可能画面に切り換え、翻訳不能
の旨を表示する。
表示したが、日本文のみ、英文のみ表示してもよい。
度として、一致している意味素性の数に100を掛けた
ものから、一致していない意味素性の数に50を掛けた
ものを引いた数字を用いたが、これ以外にも、入力文中
の意味素性の個数で割って100点満点の相対評価にす
る、など様々な方法が考えられる。
する。
のフローチャート図の処理)とステップA13を除いて
同様である。
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例4と文例5が検索されたとする。
入力文との一致度を計算すると、文例4の意味素性、
「昨日」、「新聞」、「ある」のうち、「ある」は入力
文中にある。残りの「昨日」、「新聞」意味素性は入力
文中には存在しない。また、入力文中の「日本」、「ビ
ール」なる意味素性は文例4に存在しない。
けたものから、一致していない個数4に50を掛けたも
のを引いた−100点が、この文例4の入力文との一致
度になる。
閾値100点より低いので、次のステップA11におい
て消去フラグが付けられ、ステップA13において表示
されない。
り、閾値より低いので、次のステップA11において消
去フラグが付けられ、ステップA13において表示され
ない。ここで、実施例1では、このように閾値以上の一
致度をとる定型文が無かったときに、一致度が閾値以下
でも、一致する意味素性のある定型文とその翻訳文を表
示できるようにするものである。
13を図13のステップB1〜B3に置き換える。
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップB2へ、そうでなければステップB3に
移る。
5には消去フラグが付いている。従って、ステップB2
に移る。
た全ての文例の日本語文と英語文を、表示用ドライバ3
を通じて液晶ディスプレイ15に対訳で表示する。ここ
では、文例4と文例5が、図14のように表示される。
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
する。
のフローチャート図の処理)とステップA13を除いて
同様である。
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例6〜7が検索されたとする。
の一致度を計算すると、文例6、7、8の一致度はそれ
ぞれ、0点、−100点、−100点になる。従って、
3つ文例ともに一致度は閾値より低くなり、次のステッ
プA11において消去フラグが付けられる。
15のステップC1〜4に置き換える。
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップC2へ、そうでなければステップC4に
移る。
8には全て消去フラグが付いている。したがって、ステ
ップC2に移る。
た全ての文例の日本語文と英語文を、一致度の高い順に
並べ、ステップC3に移る。この場合、文例6、7、8
の一致度はそれぞれ、0,−100,−100なので、
一致度の高い文から順に、文例6、文例7、文例8と並
べられる。
び変えられた文例の日本語文と英語文を、表示用ドライ
バ3を通じて液晶ディスプレイ15に対訳で表示する。
ここでは、文例6、文例7、文例8が、図16のように
表示される。
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
する。
のフローチャート図の処理)とステップA13を除いて
同様である。
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例6〜7が検索されたとする。
の一致度を計算すると、文例6、7、8の一致度はそれ
ぞれ、0点、−100点、−100点になる。従って、
3つ文例ともに一致度は閾値より低くなり、次のステッ
プA11において消去フラグが付けられる。
17のステップD1〜4に置き換える。
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップD2へ、そうでなければステップD4に
移る。
8には全て消去フラグが付いている。したがって、ステ
ップD2に移る。
た全ての文例の日本語文と英語文を、一致度の高い順に
並べ、さらに一致度が同じ文例は文の長さの短い順に並
べ、ステップD3に移る。
ぞれ、0、−100、−100なので、一致度の高い文
から順に、文例6、文例7、文例8と並べられる。また
文例7と文例8では、文例7の日本語文の方が文の長さ
が短いので、文例7、文例8の順に並べられる。
び変えられた文例の日本語文と英語文を、表示用ドライ
バ3を通じて液晶ディスプレイ15に対訳で表示する。
ここでは、文例6、文例7、文例8が、図16のように
表示される。
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
する。
のフローチャート図の処理)とステップA13を除いて
同様である。
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例6〜7が検索されたとする。
の一致度を計算すると、文例6、7、8の一致度はそれ
ぞれ、0点、−100点、−100点になる。従って、
3つ文例ともに一致度は閾値より低くなり、次のステッ
プA11において消去フラグが付けられる。
18のステップE1〜4に置き換える。
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップE2へ、そうでなければステップE4に
移る。
8には全て消去フラグが付いている。したがって、ステ
ップE2に移る。
た全ての文例の日本語文について、入力文と一致した文
字列を選び出し、ステップE3に移る。
に該当する文字列は、「日本」と「ビール」である。同
様に、文例7、8では、入力文と一致した特徴に該当す
る文字列は「ビール」である。
び変えられた文例の日本語文と英語文を、表示用ドライ
バ3を通じて液晶ディスプレイ15に対訳で表示し、さ
らに、入力文と一致した特徴に該当する文字列の下にア
ンダーラインを引く。ここでは、文例6、文例7、文例
8が、図19のように表示される。
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
する。
のフローチャート図の処理)とステップA13を除いて
同様である。
ステップA1〜2において「栓抜きをください」と入力
されると、ステップA3〜6において、図2の文例9、
10が検索されたとする。
の一致度を計算すると、文例9、10の一致度はともに
50点になる。従って、2つ文例ともに一致度は閾値よ
り低くなり、次のステップA11において消去フラグが
付けられる。
20のステップF1〜4に置き換える。
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップF2へ、そうでなければステップF4に
移る。
付いた文例9、10が存在する。したがって、ステップ
F2に移る。
が、ステップA4で作業用メモリ5に格納した入力文1
の部分文字列をキーに、RAM6aに格納されている電
子辞書9を検索する。部分文字列のうち電子辞書9に見
出し語として定義されている文字列があれば、CPU1
の単語抽出部(図示せず)は、その文字列と第二言語で
の訳語を対で作業用メモリ5に格納し、ステップF3に
移る。
ップF2で作業用メモリ6に格納された第二言語の訳語
を、表示用ドライバ3を通じて液晶ディスプレイ15に
対訳で表示する。ここでは、入力文の単語「栓抜き」と
その訳語が、図21のように表示される。
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
は、第1言語の会話の用例と、その翻訳文である第2言
語の文と、意味素性とを対応付けて格納する対話データ
ベースと、意味素性とその意味素性として抽出する表記
を定義して格納した意味素性辞書と、第1言語の入力文
を入力する入力手段と、前記入力手段から入力された入
力文に基づいて、前記対話データベースおよび前記意味
素性辞書を検索する検索手段と、前記検索手段によって
検索された用例と、前記入力手段によって入力された入
力文との一致度を算出し、一致度が閾値以下の用例しか
存在しない場合は、その用例を出力する出力手段とを具
備するので、入力文にいくらかでも関連のある文とその
対訳を取り出し、ユーザが入力した文に関連のある有益
な文とその対訳を確実に表示することができる。
項1記載の機械翻訳装置において、前記出力手段は、一
致度の高い順に用例を出力するので、入力文にいくらか
でも関連のある文とその対訳を取り出し、そのような例
文が複数ある場合、一致度の高い順に並べて出力するこ
とにより、ユーザが入力した文に関連のある有益な文と
その対訳を確実に表示することができる。
項1記載の機械翻訳装置において、前記出力手段は、用
例の文の長さの短い順に出力するので、入力文にいくら
かでも関連のある文とその対訳を取り出し、そのような
例文が複数ある場合、文の長さが短いものから順に並べ
て出力することにより、ユーザが入力した文に関連のあ
る有益な文とその対訳を確実に表示することができる。
1記載の機械翻訳装置において、前記出力手段は、入力
文と一致する部分を他と区別して用例を出力するので、
入力文にいくらかでも関連のある文とその対訳を取り出
し、例文と対訳を表示する際に、入力文と一致する部分
を他と区別して表示するので、ユーザが入力した文と表
示された文との関連性を判断しやすくすることができ
る。
会話の用例と、その翻訳文である第2言語の文と、意味
素性とを対応付けて格納する対話データベースと、意味
素性とその意味素性として抽出する表記を定義して格納
した意味素性辞書と、第1言語の単語と第2言語の翻訳
文を対応付けて格納した電子辞書と、第1言語の入力文
を入力する入力手段と、前記入力手段から入力された入
力文に基づいて、前記対話データベースおよび前記意味
素性辞書を検索する検索手段と、前記検索手段によって
検索された用例と、前記入力手段によって入力された入
力文との一致度を算出し、一致度が閾値以下であるか否
かを判断する判断手段と、前記判断手段によって一致度
が閾値以下である場合は、前記電子辞書を検索して単語
の翻訳文を出力する出力手段とを具備するので、閾値以
上の一致度をとる例文が無かった場合に、電子辞書から
入力文に現れた単語の訳語を表示することにより、ユー
ザが欲しがっている第2言語の単語に関する情報を確実
に表示することができる。
会話の用例と、その翻訳文である第2言語の文と、意味
素性とを対応付けて格納する対話データベースと、意味
素性とその意味素性として抽出する表記を定義して格納
した意味素性辞書と、第1言語の入力文を入力する入力
手段と、前記入力手段から入力された入力文に基づい
て、前記対話データベースおよび前記意味素性辞書を検
索する検索手段と、前記検索手段によって検索された用
例と、前記入力手段によって入力された入力文との一致
度を算出し、一致度が閾値以下の用例しか存在しない場
合は、その用例を出力する出力手段とを実現させるの
で、入力文にいくらかでも関連のある文とその対訳を取
り出し、ユーザが入力した文に関連のある有益な文とそ
の対訳を確実に表示することができる。
Claims (6)
- 【請求項1】 第1言語の会話の文と、その翻訳文であ
る第2言語の文との対である対訳用例と、意味素性とを
対応付けて格納する対訳データベースと、 意味素性とその意味素性として抽出する表記を定義して
格納した意味素性辞書と、 第1言語の入力文を入力する入力手段と、 前記入力手段から入力された入力文に基づいて、前記意
味素性辞書および前記対訳データベースを検索して対訳
用例を抽出する検索手段と、 前記検索手段によって抽出された対訳用例と、前記入力
手段によって入力された入力文との一致度を算出し、一
致度が閾値以上の対訳用例が存在する場合は、一致度が
閾値未満の対訳用例を出力せずに前記一致度が閾値以上
の対訳用例を出力し、一致度が閾値未満の対訳用例しか
存在しない場合は、その一致度が閾値未満である抽出さ
れた対訳用例を出力する出力手段を具備することを特徴
とする機械翻訳装置。 - 【請求項2】 前記請求項1記載の機械翻訳装置におい
て、 前記出力手段は、一致度の高い順に対訳用例を出力する
ことを特徴とする機械翻訳装置。 - 【請求項3】 前記請求項1または請求項2に記載の機
械翻訳装置において、 前記出力手段は、一致度が同一の対訳用例が複数ある場
合、その対訳用例の第1言語の文の長さに基づいた順序
で前記対訳用例を出力することを特徴とする機械翻訳装
置。 - 【請求項4】 前記請求項1から請求項3のいずれかに
記載の機械翻訳装置において、 前記出力手段は、入力文と一致する部分を他と区別して
対訳用例を出力することを特徴とする横械翻訳装置。 - 【請求項5】 第1言語の会話の文と、その翻訳文であ
る第2言語の文との対である対訳用例と、意味素性とを
対応付けて格納する対訳データベースと、 意味素性とその意味素性として抽出する表記を定義して
格納した意味素性辞書と、 第1言語の単語と第2言語の翻訳文を対応付けて格納し
た電子辞書と、 第1言語の入力文を入力する入力手段と、 前記入力手段から入力された入力文に基づいて、前記意
味素性辞書および前記対訳データベースを検索して対訳
用例を抽出する検索手段と、 前記検索手段によって抽出された対訳用例と、前記入力
手段によって入力された入力文との一致度を算出し、一
致度が閾値未満の対訳用例しか存在しないか否かを判断
する判断手段と前記判断手段によって一致度が閾値未満
の対訳用例しか存在しないと判断された場合は、前記電
子辞書を検索して前記入力文に含まれる単語の翻訳文を
出力する出力手段を具備することを特徴とする機械翻訳
装置。 - 【請求項6】 第1言語の会話の文と、その翻訳文であ
る第2言語の文との対である対訳用例と、意味素性とを
対応付けて格納する対訳データベースと、 意味素性とその意味素性として抽出する表記を定義して
格納した意味素性辞書と、 第1言語の入力文を入力する入力手段と、 前記入力手段から入力された入力文に基づいて、前記意
味素性辞書および前記対訳データベースを検索して対訳
用例を抽出する検索手段と、 前記検索手段によって抽出された対訳用例と、前記入力
手段によって入力された入力文との一致度を算出し、一
致度が閾値以上の対訳用例が存在する場合は、一致度が
閾値未満の対訳用例を出力せずに前記一致度が閾値以上
の対訳用例を出力し、一致度が閾値未満の対訳用例しか
存在しない場合は、その一致度が閾値未満である抽出さ
れた対訳用例を出力する出力手段を実現させるための機
械翻訳プログラムを記載したコンピュータ読み取り可能
な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26613097A JP3388153B2 (ja) | 1997-09-30 | 1997-09-30 | 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26613097A JP3388153B2 (ja) | 1997-09-30 | 1997-09-30 | 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11110387A JPH11110387A (ja) | 1999-04-23 |
JP3388153B2 true JP3388153B2 (ja) | 2003-03-17 |
Family
ID=17426755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26613097A Expired - Fee Related JP3388153B2 (ja) | 1997-09-30 | 1997-09-30 | 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3388153B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3933449B2 (ja) | 2001-11-22 | 2007-06-20 | 株式会社東芝 | コミュニケーション支援装置 |
-
1997
- 1997-09-30 JP JP26613097A patent/JP3388153B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11110387A (ja) | 1999-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4777600A (en) | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms | |
JPH08235182A (ja) | 文章処理方法とその装置 | |
JP3388153B2 (ja) | 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP3393173B2 (ja) | 機械翻訳装置 | |
JPS634206B2 (ja) | ||
CN107870905B (zh) | 一种特定词汇的识别方法 | |
JPH1097538A (ja) | 機械翻訳装置 | |
JP3377942B2 (ja) | 電子辞書検索装置および電子辞書検索装置制御用プログラムを記憶したコンピュータ読取可能な記憶媒体 | |
JP3274652B2 (ja) | 翻訳装置 | |
JPS63118868A (ja) | 日本語文章校正装置 | |
JPH0561902A (ja) | 機械翻訳システム | |
JPH07334526A (ja) | 辞書検索表示装置 | |
JP2022148873A (ja) | 情報検索装置、情報検索方法およびプログラム | |
JPS63163956A (ja) | 文書作成・校正支援装置 | |
JPS62143178A (ja) | 自然言語翻訳方式 | |
JPH04174069A (ja) | 言語理解支援装置 | |
JPS60207948A (ja) | カナ漢字変換処理装置 | |
JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
JPH05233686A (ja) | 日本語処理装置 | |
JPH0682366B2 (ja) | 文字列訂正方式 | |
JPH11232003A (ja) | ドキュメント表示装置,表示方法および記憶媒体 | |
JPH01181154A (ja) | かな漢字変換装置 | |
JPS63136264A (ja) | 機械翻訳装置 | |
JPH04268669A (ja) | 日本語解析装置 | |
JPS5840650A (ja) | 日本文入力方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080110 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100110 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120110 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130110 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130110 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |