JP3388153B2 - 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents

機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体

Info

Publication number
JP3388153B2
JP3388153B2 JP26613097A JP26613097A JP3388153B2 JP 3388153 B2 JP3388153 B2 JP 3388153B2 JP 26613097 A JP26613097 A JP 26613097A JP 26613097 A JP26613097 A JP 26613097A JP 3388153 B2 JP3388153 B2 JP 3388153B2
Authority
JP
Japan
Prior art keywords
sentence
translation
input
degree
semantic feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26613097A
Other languages
English (en)
Other versions
JPH11110387A (ja
Inventor
収 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP26613097A priority Critical patent/JP3388153B2/ja
Publication of JPH11110387A publication Critical patent/JPH11110387A/ja
Application granted granted Critical
Publication of JP3388153B2 publication Critical patent/JP3388153B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、第1言語の文を第
2言語の文に翻訳する機械翻訳装置に関するものであ
る。
【0002】
【従来の技術および発明が解決しようとする課題】観光
等で海外に出かける機会が多くなった現在では、外国で
の会話に困らないように多くの会話表現を集めた会話用
例集が多く出版されている。また、これらの会話用例集
を電子化し、キー操作等で会話用例文を選び出して、選
び出された会話用例文の翻訳文を表示する機械翻訳装置
が提案されており、例えば、特開平6−325072号
公報に記載されたものがある。
【0003】また、翻訳した文を自由に入力することに
よって最適な会話用例文を自動的に選択してその翻訳文
を表示する機械翻訳装置が提案されている。この方式で
は、会話用例文と各例文を特徴づける語句を類語ごとに
グルーピングされたものを、多数記憶している。前者を
定型文、後者を意味素性と呼んでいる。
【0004】この方式では、入力文から意味素性を抽出
し、それらの組み合わせのパターンの近い定型文を検索
する。その際、入力文と各定型文が、意味素性の組み合
わせのパターンとしてどのくらい一致しているかを判定
する必要がある。
【0005】従来の技術では、入力文と各定型文の一致
度を各単語単位の一致によって算出し、ある閾値以上の
定型文だけ表示する方法をとっている。
【0006】しかしながら、入力文と各定型文との一致
度がすべて閾値に満たない場合がありうる。そのような
場合、従来では、利用者に対し、単に該当する例文がな
いことを表示するのみであった。
【0007】本発明は上記課題の解決を目的としてなさ
れたものであって、請求項1記載の発明は、第1言語の
会話の文と、その翻訳文である第2言語の文との対であ
る対訳用例と、意味素性とを対応付けて格納する対訳デ
ータベースと、意味素性とその意味素性として抽出する
表記を定義して格納した意味素性辞書と、第1言語の入
力文を入力する入力手段と、前記入力手段から入力され
た入力文に基づいて、前記意味素性辞書および前記対訳
データベースを検索して対訳用例を抽出する検索手段
と、前記検索手段によって抽出された対訳用例と、前記
入力手段によって入力された入力文との一致度を算出
し、一致度が閾値以上の対訳用例が存在する場合は、一
致度が閾値未満の対訳用例を出力せずに前記一致度が閾
値以上の対訳用例を出力し、一致度が閾値未満の対訳用
例しか存在しない場合は、その一致度が閾値未満である
抽出された対訳用例を出力する出力手段を具備すること
を特徴とする機械翻訳装置である。
【0008】また、請求項2記載の発明は、前記請求項
1記載の機械翻訳装置において、前記出力手段は、一致
度の高い順に対訳用例を出力することを特徴とする機械
翻訳装置である。
【0009】また、請求項3記載の発明は、前記請求項
または請求項2に記載の機械翻訳装置において、前記
出力手段は、一致度が同一の対訳用例が複数ある場合、
その対訳用例の第1言語の文の長さに基づいた順序で前
記対訳用例を出力することを特徴とする機械翻訳装置で
ある。
【0010】また、請求項4記載の発明は、前記請求項
1から請求項3のいずれかに記載の機械翻訳装置におい
て、前記出力手段は、入力文と一致する部分を他と区別
して対訳用例を出力することを特徴とする機械翻訳装置
である。
【0011】また、請求項5記載の発明は、第1言語の
会話のと、その翻訳文である第2言語の文との対であ
る対訳用例と、意味素性とを対応付けて格納する対
ータベースと、意味素性とその意味素性として抽出する
表記を定義して格納した意味素性辞書と、第1言語の単
語と第2言語の翻訳文を対応付けて格納した電子辞書
と、第1言語の入力文を入力する入力手段と、前記入力
手段から入力された入力文に基づいて、前記意味素性辞
書および前記対訳データベースを検索して対訳用例を抽
する検索手段と、前記検索手段によって抽出された
用例と、前記入力手段によって入力された入力文との
一致度を算出し、一致度が閾値未満の対訳用例しか存在
しないか否かを判断する判断手段と前記判断手段によっ
て一致度が閾値未満の対訳用例しか存在しないと判断さ
れた場合は、前記電子辞書を検索して前記入力文に含ま
れる単語の翻訳文を出力する出力手段を具備することを
特徴とする機械翻訳装置である。
【0012】また、請求項6記載の発明は、第1言語の
会話のと、その翻訳文である第2言語の文との対であ
る対訳用例と、意味素性とを対応付けて格納する対
ータベースと、意味素性とその意味素性として抽出する
表記を定義して格納した意味素性辞書と、第1言語の入
力文を入力する入力手段と、前記入力手段から入力され
た入力文に基づいて、前記意味素性辞書および前記対訳
データベースを検索して対訳用例を抽出する検索手段
と、前記検索手段によって抽出された対訳用例と、前記
入力手段によって入力された入力文との一致度を算出
し、一致度が閾値以上の対訳用例が存在する場合は、一
致度が閾値未満の対訳用例を出力せずに前記一致度が閾
値以上の対訳用例を出力し、一致度が閾値未満対訳
例しか存在しない場合は、その一致度が閾値未満である
抽出された対訳用例を出力する出力手段を実現させるた
めの機械翻訳プログラムを記載したコンピュータ読み取
り可能な記録媒体である。
【0013】
【発明の実施の形態】以下、図をもとに本発明について
説明する。なお、これによって本発明は限定されるもの
ではない。特に、ここでは、第一言語を日本語とし、第
二言語を英語とする。
【0014】図1は本発明を採用した装置のブロック図
である。
【0015】図1において、本発明を採用した装置はC
PU(中央処理装置)1と液晶ディスプレイ2と表示用
ドライバ3と入力認識部4と作業用メモリ5とRAM6
aと記録媒体6bとバス19とから構成される。
【0016】CPU1は各種制御の中枢的な機能を果た
すものであり、データバス等のバス19を通じてRAM
6a、作業用メモリ5、表示用ドライバ3、入力認識部
4のそれぞれと接続されている。
【0017】表示用ドライバ3は液晶ディスプレイ2に
対話文などを表示する際のドライバである。入力認識部
4は手書き入力されたデータを認識するものである。
【0018】作業用メモリ5はプログラムの実行に際し
て必要とされるデータを一時的に格納するためのメモリ
である。
【0019】RAM6aは装置の各種制御を行うための
プログラムや、多数のフレーズ等を格納することのでき
るメモリである。
【0020】RAM6a内には、装置の各種制御を行う
ためのプログラム以外に、対話データベース7、意味素
性辞書8、電子辞書9が格納される。対話データベース
7は例えば番地0〜50000、意味素性辞書8は番地
50001〜70000、電子辞書9は番地70001
〜100000というように格納される。
【0021】RAM6aに格納される装置の各種制御を
行うためのプログラムは、CPU1で実行される動作の
性質から解析部10、検索部11、制御部(正常系)1
2、制御部(異常系)13、単語抽出部14に分けられ
る。
【0022】解析部10は入力認識部4によって認識さ
れた入力データを解析するプログラムである。検索部1
1は対話データベース7、意味素性辞書8を検索するプ
ログラムである。制御部(正常系)12は画面表示の制
御など、上記以外の正常な処理の制御を行うプログラム
である。また、制御(異常系)13は対訳文が見つから
ないといったエラーの表示など異常が起こった場合の制
御を行うプログラムである。単語抽出部14は電子辞書
9を検索するプログラムである。
【0023】そして、対話データベース7、意味素性辞
書8、電子辞書9といったデータ、および解析部10、
検索部11、制御部(正常系)12、制御部(異常系)
13、単語抽出部14といったプログラムはPCカード
やDVDなどの記録媒体6bに記録されており、この記
録媒体6bを装置本体に装着して、RAM6aに読み込
まれて格納される。
【0024】対話データベース7には、海外旅行の際に
翻訳して現地の人に伝えたい有用な文例が図2のような
形で多数定義されている。ここで、文例の一行目は表示
される日本文であり、二行目はその訳文で、翻訳結果と
して日本文と一緒に表示される英文である。また、三行
目はこの対訳文に対応付けられている意味素性の集合で
あり、意味素性列と呼ぶ。
【0025】意味素性とは、文例を検索する際のキーワ
ードとなる文字列であり、各日本文の一文節にひとつず
つ割当てられることが多い。文例1の「チェックインを
お願いします」においては、「チェックイン」、「お願
いします」がこの文の意味素性となっている。正確には
これらは意味素性の名称であり、どういう文字列をこれ
らの意味素性として定義するかは意味素性辞書8に記述
してある。
【0026】意味素性辞書8には、意味素性の名称と、
その意味素性として抽出する日本語文字列が定義されて
いる。例えば「チェックイン」、「お願いします」とい
う意味素性は意味素性辞書8に図3のように定義されて
いる。
【0027】図3では、右側の日本語文字列を、左側の
名称の意味素性として定義している、という意味であ
る。例えば、「お願いいたします」という文字列は「お
願い」という名称の意味素性として定義されている。
【0028】電子辞書9には、日本語の見出し語と品詞
および英語の訳語が定義されている。例えば、「学
校」、「添乗員」という単語の品詞と訳語は、電子辞書
9に図4のように定義されている。
【0029】図4では、学校という日本語の文字列に対
し、品詞が名詞であり、英語訳がschoolであると
いう意味である。なお、電子辞書は、本装置のために新
規に作成する必要はなく、既存の電子辞書を流用してよ
い。
【0030】図5は本発明を採用した装置の外観図であ
る。図5において、内部に日本語と英語の文例を対にし
て多数記憶しており、これらを液晶ディスプレイ15に
表示できるようになっている。また、この装置はインタ
ーフェースとして専用ペン16による手書き文字認識を
用いる。
【0031】なお、表示装置として液晶ディスプレイ1
5以外のものを用いることも可能であるし、入力手段と
しては音声やキーボード入力などの他の手段も可能であ
る。
【0032】以下、本発明を採用した装置の動作を説明
する。この装置の基本動作の概略は、ユーザが被翻訳文
を入力し、その文から意味素性を検出し、その意味素性
から定型文を検出し、その定型文中の可変意味素性を置
換し表示する、というものである。ここでは、ユーザが
入力した被翻訳文を入力文、装置が格納している日本文
を定型文という。定型文とその翻訳文の英語文の対を言
う際は対訳文という。
【0033】図6のフローチャート図に沿って説明す
る。説明は図6のフローチャート図の各ステップについ
て詳細を示す形で行う。「チェックインをお願いしま
す」という文を翻訳する過程を例にとる(以下、この文
を入力文1と呼ぶ)。
【0034】ステップA1において、制御部(正常系)
12が、表示用ドライバ3を通じて液晶ディスプレイ1
5に図7の「被翻訳文入力画面」を表示する。
【0035】ステップA2において、ユーザが図7の被
翻訳文入力画面において、手書き入力ボード17に専用
ペン16によって「チェックインをお願いします」と手
書きで入力する。図8は入力途中の図であり、図9は入
力が終了した状態の図である。
【0036】ステップA3において、ユーザが図9の通
訳アイコン18を押す。この入力文は入力認識部4によ
って認識され、作業用メモリ5に格納される。その後、
ステップA4に移る。
【0037】ステップA4において、解析部10が、ス
テップA3で作業用メモリ5に格納した入力文1から、
部分文字列を作成し、作業用メモリ5に格納する。次
に、ステップA5に移る。
【0038】入力文1の部分文字列には、 があり、これらを作業用メモリ5に格納しておく。
【0039】ステップA5において、検索部11が、ス
テップA4において作業用メモリ5に格納した入力文1
の部分文字列をキーに、ROM6に格納されている意味
素性辞書8を検索する。部分文字列のうち意味素性辞書
8に意味素性として定義されている文字列があれば、C
PU1の検索部11はその文字列と意味素性の名称を対
で作業用メモリ5に格納し、ステップA6に移る。なけ
ればステップA14に移る。
【0040】また、この時、部分文字列を前から順番に
検索し、その順序を保存しておくことによって、各意味
素性の入力文での出現順も保存しておく。
【0041】以下に入力文1の部分文字列「お願い」を
キーとして意味素性辞書8を検索する過程を説明する。
【0042】検索部11が、RAM6aに格納されてい
る意味素性辞書8を50001番地から順に一行ずつ読
み込み、作業用メモリ5に格納する。意味素性辞書8の
各行には左側に各意味素性の名称が、右側にその意味素
性として定義される文字列が記述してある。
【0043】図3の意味素性辞書8では、文字列「お願
いします」が意味素性辞書8に定義されているので、検
索部11はその左側にある意味素性の名称「お願い」
と、入力文の部分文字列「お願いします」を対で作業用
メモリ5に格納しなおす。
【0044】そして、意味素性辞書8には、他の箇所に
「お願いします」という文字列は定義されていないの
で、意味素性辞書8の検索を終了する。
【0045】以上の作業を入力文1のすべての部分文字
列について行うと、 [部分文字列と対応する意味素性] 「チェックイン」=「チェックイン」 「お願い」=「お願いします」 が検出された。
【0046】ここで、=の右辺は意味素性の名称であ
り、それぞれ左辺の文字列は右辺の名称の意味素性とし
て検出されたことを意味する。
【0047】また、入力文から検出された各意味素性
は、上の対応表の上から下の順番で検出されたものとす
る。この順序は作業用メモリ5内で保存されている。
【0048】ステップA6において、検索部11が、ス
テップA5において作業用メモリ5に格納した意味素性
の名称をキーに、RAM6aに格納されている対訳デー
タベース7を検索する。意味素性の名称のうち、対訳デ
ータべ−ス7に現れるものがあれば、その意味素性が現
れている定型文を、その翻訳文の英文、意味素性列と共
に作業用メモリ5に格納し、ステップA7に移る。なけ
ればステップA14に移る。
【0049】入力文1を例にとって、ステップA6の詳
細を説明する。まず、検索部11はステップA5で作業
用メモリ5に格納した意味素性の集合のうちのひとつを
キーに、対訳データべ−ス7を検索する。まず、意味素
性「チェックイン」をキーに対訳データベース7を検索
する。
【0050】いま、対訳データべ−スが図2に示すよう
な文例が定義されていると、文例1には意味素性列の中
に「チェックイン」意味素性が含まれている。よって、
検索部11は文例1を作業用メモリ5に格納する。
【0051】検索部11は、以上の作業を作業用メモリ
5に格納されているすべての意味素性について行う。い
ま、すべての意味素性についての検索が終了した後、図
2の文例1、文例3が作業用メモリ5に格納されている
とする。なお、文例3は意味素性「お願いします」によ
って検索された。
【0052】ステップA7において、解析部10は、ス
テップA6において作業用メモリ5に格納した定型文の
うち、先頭に格納されている1文を選択する。選択した
定型文には解析済フラグを立てておく。ここでは、文例
1を選択し、解析済フラグを立てておく。
【0053】ステップA8において、解析部10は、ス
テップA7において選択した定型文の入力文との一致度
を計算する。ここでは、定型文の各意味素性のうち入力
文中の意味素性と一致しているものの個数を用いて計算
する。そして、定型文と一致度の対を作業用メモリ5に
格納し、一致度がある閾値以上であればステップA9に
移り、閾値未満であればステップA11に移る。ここで
は閾値を100点とする。
【0054】いま、文例1が選択されているとすると、
文例1の意味素性「チェックイン」、「お願い」は全て
入力文中にあるので、一致している個数に100を掛け
て、この定型文の入力文との一致度を200点とする。
そして、文例1と一致度200点を作業用メモリ5に格
納する。文例1の一致度200点は閾値100点を超え
ているので、ステップA9に移る。
【0055】ステップA9において、解析部10は、作
業用メモリ5に、解析済フラグの立っていない定型文が
存在するかどうか調べる。存在すればステップA10
に、存在しなければステップA12に移る。いま、文例
3には解析済フラグが立っていないので、ステップA1
0に移る。
【0056】ステップA10において、解析部10は、
作業用メモリ5内の解析済フラグの立っていない定型文
を1文選択しフラグを立て、ステップA8に移る。ここ
では文例3に解析済フラグを立ててステップA8に移
る。
【0057】ステップA8において、解析部10は、文
例3の一致度を計算する。文例3の意味素性のうち、入
力文中にあるのは「お願い」の1つである。残りの「紅
茶」は入力文中には存在しない。また、入力文中の「チ
ェックイン」という意味素性は文例3に存在しない。よ
って、一致している個数1に100を掛けたものから、
一致していない個数2に50を掛けたものを引いた0点
を、この定型文の入力文との一致度とする。よって文例
3と一致度0点を作業用メモリ5に格納する。文例3の
一致度0点は閾値100点より低いので、ステップA1
1に移る。
【0058】ステップA11において、解析部10は、
ステップA8で作業用メモリ5に格納された、一致度が
閾値未満の定型文について、作業用メモリ5に消去フラ
グを立てる。そして、ステップA9に移る。いま、一致
度が0点である文例3について、作業用メモリ5に消去
フラグを立て、ステップA9に移る。
【0059】ステップA9において、解析部10は、作
業用メモリ5に、解析済みフラグの立っていない定型文
が存在しないことを察知し、ステップA12に移る。
【0060】ステップA12において、制御部13は、
表示用ドライバ3を通じて液晶ディスプレイ15を図9
の自由文通訳入力画面から図10の対訳文表示画面に切
り換える。その後、ステップA13に移る。
【0061】ステップA13において、制御部13は、
作業用メモリ5に格納してある文例のうち、消去フラグ
の付いていない日本文と英文を、表示用ドライバ3を通
じて液晶ディスプレイ15に図11のように対訳で表示
する。また、表示する際には一致度の高い定型文から順
に表示する。いま、作業用メモリ5に格納されているの
は文例1のみである。この日本文と英文を図11のよう
に表示する。
【0062】また、ステップA5あるいはA6において
意味素性あるいは定型文が検索されなかった場合、ステ
ップA14に移る。
【0063】ステップA14において、制御部(異常
系)13は、翻訳不能と判断して、表示用ドライバ3を
通じて液晶ディスプレイ15を図9の自由文通訳入力画
面から、図12の翻訳不可能画面に切り換え、翻訳不能
の旨を表示する。
【0064】なお、上記説明では検索された文は対訳で
表示したが、日本文のみ、英文のみ表示してもよい。
【0065】また、上記説明では入力文と定型文の一致
度として、一致している意味素性の数に100を掛けた
ものから、一致していない意味素性の数に50を掛けた
ものを引いた数字を用いたが、これ以外にも、入力文中
の意味素性の個数で割って100点満点の相対評価にす
る、など様々な方法が考えられる。
【0066】[実施例1]以下、実施例1について説明
する。
【0067】実施例1は上記で説明した基本動作(図6
のフローチャート図の処理)とステップA13を除いて
同様である。
【0068】まず、図6のフローチャート図に従って、
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例4と文例5が検索されたとする。
【0069】この時、ステップA8に基づいて文例4の
入力文との一致度を計算すると、文例4の意味素性、
「昨日」、「新聞」、「ある」のうち、「ある」は入力
文中にある。残りの「昨日」、「新聞」意味素性は入力
文中には存在しない。また、入力文中の「日本」、「ビ
ール」なる意味素性は文例4に存在しない。
【0070】よって、一致している個数1に100を掛
けたものから、一致していない個数4に50を掛けたも
のを引いた−100点が、この文例4の入力文との一致
度になる。
【0071】ところが、文例4の一致度−100点は、
閾値100点より低いので、次のステップA11におい
て消去フラグが付けられ、ステップA13において表示
されない。
【0072】同様に文例5の一致度も−100点であ
り、閾値より低いので、次のステップA11において消
去フラグが付けられ、ステップA13において表示され
ない。ここで、実施例1では、このように閾値以上の一
致度をとる定型文が無かったときに、一致度が閾値以下
でも、一致する意味素性のある定型文とその翻訳文を表
示できるようにするものである。
【0073】そこで、実施例1では、図6のステップA
13を図13のステップB1〜B3に置き換える。
【0074】ステップB1において、作業用メモリ5に
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップB2へ、そうでなければステップB3に
移る。
【0075】いま、作業用メモリ5にある文例4と文例
5には消去フラグが付いている。従って、ステップB2
に移る。
【0076】ステップB2において、消去フラグのつい
た全ての文例の日本語文と英語文を、表示用ドライバ3
を通じて液晶ディスプレイ15に対訳で表示する。ここ
では、文例4と文例5が、図14のように表示される。
【0077】ステップB3において、消去フラグのつい
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
【0078】以上で、一連の動作を終了する。
【0079】[実施例2]以下、実施例2について説明
する。
【0080】実施例2は上記で説明した基本動作(図6
のフローチャート図の処理)とステップA13を除いて
同様である。
【0081】まず、図6のフローチャート図に従って、
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例6〜7が検索されたとする。
【0082】そして、ステップA8において、入力文と
の一致度を計算すると、文例6、7、8の一致度はそれ
ぞれ、0点、−100点、−100点になる。従って、
3つ文例ともに一致度は閾値より低くなり、次のステッ
プA11において消去フラグが付けられる。
【0083】実施例2では、図6のステップA13を図
15のステップC1〜4に置き換える。
【0084】ステップC1において、作業用メモリ5に
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップC2へ、そうでなければステップC4に
移る。
【0085】いま、作業用メモリ5にある文例6、7、
8には全て消去フラグが付いている。したがって、ステ
ップC2に移る。
【0086】ステップC2において、消去フラグのつい
た全ての文例の日本語文と英語文を、一致度の高い順に
並べ、ステップC3に移る。この場合、文例6、7、8
の一致度はそれぞれ、0,−100,−100なので、
一致度の高い文から順に、文例6、文例7、文例8と並
べられる。
【0087】ステップC3において、ステップC2で並
び変えられた文例の日本語文と英語文を、表示用ドライ
バ3を通じて液晶ディスプレイ15に対訳で表示する。
ここでは、文例6、文例7、文例8が、図16のように
表示される。
【0088】ステップC4において、消去フラグのつい
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
【0089】以上で、一連の処理を終了する。
【0090】[実施例3]以下、実施例3について説明
する。
【0091】実施例3は上記で説明した基本動作(図6
のフローチャート図の処理)とステップA13を除いて
同様である。
【0092】まず、図6のフローチャート図に従って、
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例6〜7が検索されたとする。
【0093】そして、ステップA8において、入力文と
の一致度を計算すると、文例6、7、8の一致度はそれ
ぞれ、0点、−100点、−100点になる。従って、
3つ文例ともに一致度は閾値より低くなり、次のステッ
プA11において消去フラグが付けられる。
【0094】実施例3では、図6のステップA13を図
17のステップD1〜4に置き換える。
【0095】ステップD1において、作業用メモリ5に
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップD2へ、そうでなければステップD4に
移る。
【0096】いま、作業用メモリ5にある文例6、7、
8には全て消去フラグが付いている。したがって、ステ
ップD2に移る。
【0097】ステップD2において、消去フラグのつい
た全ての文例の日本語文と英語文を、一致度の高い順に
並べ、さらに一致度が同じ文例は文の長さの短い順に並
べ、ステップD3に移る。
【0098】この場合、文例6、7、8の一致度はそれ
ぞれ、0、−100、−100なので、一致度の高い文
から順に、文例6、文例7、文例8と並べられる。また
文例7と文例8では、文例7の日本語文の方が文の長さ
が短いので、文例7、文例8の順に並べられる。
【0099】ステップD3において、ステップD2で並
び変えられた文例の日本語文と英語文を、表示用ドライ
バ3を通じて液晶ディスプレイ15に対訳で表示する。
ここでは、文例6、文例7、文例8が、図16のように
表示される。
【0100】ステップD4において、消去フラグのつい
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
【0101】以上で、一連の処理を終了する。
【0102】[実施例4]以下、実施例4について説明
する。
【0103】実施例4は上記で説明した基本動作(図6
のフローチャート図の処理)とステップA13を除いて
同様である。
【0104】まず、図6のフローチャート図に従って、
ステップA1〜2において「日本のビールがあります
か」と入力されると、ステップA3〜6において、図2
の文例6〜7が検索されたとする。
【0105】そして、ステップA8において、入力文と
の一致度を計算すると、文例6、7、8の一致度はそれ
ぞれ、0点、−100点、−100点になる。従って、
3つ文例ともに一致度は閾値より低くなり、次のステッ
プA11において消去フラグが付けられる。
【0106】実施例4では、図6のステップA13を図
18のステップE1〜4に置き換える。
【0107】ステップE1において、作業用メモリ5に
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップE2へ、そうでなければステップE4に
移る。
【0108】いま、作業用メモリ5にある文例6、7、
8には全て消去フラグが付いている。したがって、ステ
ップE2に移る。
【0109】ステップE2において、消去フラグのつい
た全ての文例の日本語文について、入力文と一致した文
字列を選び出し、ステップE3に移る。
【0110】この場合、文例6で入力文と一致した特徴
に該当する文字列は、「日本」と「ビール」である。同
様に、文例7、8では、入力文と一致した特徴に該当す
る文字列は「ビール」である。
【0111】ステップE3において、ステップE2で並
び変えられた文例の日本語文と英語文を、表示用ドライ
バ3を通じて液晶ディスプレイ15に対訳で表示し、さ
らに、入力文と一致した特徴に該当する文字列の下にア
ンダーラインを引く。ここでは、文例6、文例7、文例
8が、図19のように表示される。
【0112】ステップE4において、消去フラグのつい
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
【0113】以上で、一連の処理を終了する。
【0114】[実施例5]以下、実施例5について説明
する。
【0115】実施例5は上記で説明した基本動作(図6
のフローチャート図の処理)とステップA13を除いて
同様である。
【0116】まず、図6のフローチャート図に従って、
ステップA1〜2において「栓抜きをください」と入力
されると、ステップA3〜6において、図2の文例9、
10が検索されたとする。
【0117】そして、ステップA8において、入力文と
の一致度を計算すると、文例9、10の一致度はともに
50点になる。従って、2つ文例ともに一致度は閾値よ
り低くなり、次のステップA11において消去フラグが
付けられる。
【0118】実施例5では、図6のステップA13を図
20のステップF1〜4に置き換える。
【0119】ステップF1において、作業用メモリ5に
格納してある文例全てに消去フラグが付いているかどう
かの検査を行う。もし文例全部に消去フラグが付いてい
たら、ステップF2へ、そうでなければステップF4に
移る。
【0120】いま、作業用メモリ5には、消去フラグの
付いた文例9、10が存在する。したがって、ステップ
F2に移る。
【0121】ステップF2において、単語抽出部14
が、ステップA4で作業用メモリ5に格納した入力文1
の部分文字列をキーに、RAM6aに格納されている電
子辞書9を検索する。部分文字列のうち電子辞書9に見
出し語として定義されている文字列があれば、CPU1
の単語抽出部(図示せず)は、その文字列と第二言語で
の訳語を対で作業用メモリ5に格納し、ステップF3に
移る。
【0122】ステップF3において、入力文1と、ステ
ップF2で作業用メモリ6に格納された第二言語の訳語
を、表示用ドライバ3を通じて液晶ディスプレイ15に
対訳で表示する。ここでは、入力文の単語「栓抜き」と
その訳語が、図21のように表示される。
【0123】ステップF4において、消去フラグのつい
ていない全ての文例の日本語文と英語文を、表示用ドラ
イバ3を通じて液晶ディスプレイ15に対訳で表示す
る。
【0124】以上で一連の処理を終了する。
【0125】
【発明の効果】本発明によれば、請求項1記載の発明で
は、第1言語の会話の用例と、その翻訳文である第2言
語の文と、意味素性とを対応付けて格納する対話データ
ベースと、意味素性とその意味素性として抽出する表記
を定義して格納した意味素性辞書と、第1言語の入力文
を入力する入力手段と、前記入力手段から入力された入
力文に基づいて、前記対話データベースおよび前記意味
素性辞書を検索する検索手段と、前記検索手段によって
検索された用例と、前記入力手段によって入力された入
力文との一致度を算出し、一致度が閾値以下の用例しか
存在しない場合は、その用例を出力する出力手段とを具
備するので、入力文にいくらかでも関連のある文とその
対訳を取り出し、ユーザが入力した文に関連のある有益
な文とその対訳を確実に表示することができる。
【0126】また、請求項2記載の発明では、前記請求
項1記載の機械翻訳装置において、前記出力手段は、一
致度の高い順に用例を出力するので、入力文にいくらか
でも関連のある文とその対訳を取り出し、そのような例
文が複数ある場合、一致度の高い順に並べて出力するこ
とにより、ユーザが入力した文に関連のある有益な文と
その対訳を確実に表示することができる。
【0127】また、請求項3記載の発明では、前記請求
項1記載の機械翻訳装置において、前記出力手段は、用
例の文の長さの短い順に出力するので、入力文にいくら
かでも関連のある文とその対訳を取り出し、そのような
例文が複数ある場合、文の長さが短いものから順に並べ
て出力することにより、ユーザが入力した文に関連のあ
る有益な文とその対訳を確実に表示することができる。
【0128】また、請求項4記載の発明は、前記請求項
1記載の機械翻訳装置において、前記出力手段は、入力
文と一致する部分を他と区別して用例を出力するので、
入力文にいくらかでも関連のある文とその対訳を取り出
し、例文と対訳を表示する際に、入力文と一致する部分
を他と区別して表示するので、ユーザが入力した文と表
示された文との関連性を判断しやすくすることができ
る。
【0129】また、請求項5記載の発明は、第1言語の
会話の用例と、その翻訳文である第2言語の文と、意味
素性とを対応付けて格納する対話データベースと、意味
素性とその意味素性として抽出する表記を定義して格納
した意味素性辞書と、第1言語の単語と第2言語の翻訳
文を対応付けて格納した電子辞書と、第1言語の入力文
を入力する入力手段と、前記入力手段から入力された入
力文に基づいて、前記対話データベースおよび前記意味
素性辞書を検索する検索手段と、前記検索手段によって
検索された用例と、前記入力手段によって入力された入
力文との一致度を算出し、一致度が閾値以下であるか否
かを判断する判断手段と、前記判断手段によって一致度
が閾値以下である場合は、前記電子辞書を検索して単語
の翻訳文を出力する出力手段とを具備するので、閾値以
上の一致度をとる例文が無かった場合に、電子辞書から
入力文に現れた単語の訳語を表示することにより、ユー
ザが欲しがっている第2言語の単語に関する情報を確実
に表示することができる。
【0130】また、請求項6記載の発明は、第1言語の
会話の用例と、その翻訳文である第2言語の文と、意味
素性とを対応付けて格納する対話データベースと、意味
素性とその意味素性として抽出する表記を定義して格納
した意味素性辞書と、第1言語の入力文を入力する入力
手段と、前記入力手段から入力された入力文に基づい
て、前記対話データベースおよび前記意味素性辞書を検
索する検索手段と、前記検索手段によって検索された用
例と、前記入力手段によって入力された入力文との一致
度を算出し、一致度が閾値以下の用例しか存在しない場
合は、その用例を出力する出力手段とを実現させるの
で、入力文にいくらかでも関連のある文とその対訳を取
り出し、ユーザが入力した文に関連のある有益な文とそ
の対訳を確実に表示することができる。
【図面の簡単な説明】
【図1】本発明を採用した装置のブロック図である。
【図2】対話データベースの記憶例を示す図である。
【図3】意味素性辞書の記憶例を示す図である。
【図4】電子辞書の記憶例を示す図である。
【図5】本発明を採用した装置の外観図である。
【図6】翻訳処理のフローチャート図である。
【図7】表示画面例を示す図である。
【図8】表示画面例を示す図である。
【図9】表示画面例を示す図である。
【図10】表示画面例を示す図である。
【図11】表示画面例を示す図である。
【図12】表示画面例を示す図である。
【図13】実施例1のフローチャート図である。
【図14】表示画面例を示す図である。
【図15】実施例2のフローチャート図である。
【図16】表示画面例を示す図である。
【図17】実施例3のフローチャート図である。
【図18】実施例4のフローチャート図である。
【図19】表示画面例を示す図である。
【図20】実施例5のフローチャート図である。
【図21】表示画面例を示す図である。
【符号の説明】
1 CPU(中央処理装置) 2 液晶ディスプレイ 3 表示用ドライバ 4 入力認識部 5 作業用メモリ 6a RAM 6b 記録媒体 19 バス

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1言語の会話のと、その翻訳文であ
    る第2言語の文との対である対訳用例と、意味素性とを
    対応付けて格納する対データベースと、 意味素性とその意味素性として抽出する表記を定義して
    格納した意味素性辞書と、 第1言語の入力文を入力する入力手段と、 前記入力手段から入力された入力文に基づいて、前記意
    味素性辞書および前記対訳データベースを検索して対訳
    用例を抽出する検索手段と、 前記検索手段によって抽出された対訳用例と、前記入力
    手段によって入力された入力文との一致度を算出し、
    致度が閾値以上の対訳用例が存在する場合は、一致度が
    閾値未満の対訳用例を出力せずに前記一致度が閾値以上
    の対訳用例を出力し、一致度が閾値未満対訳用例しか
    存在しない場合は、その一致度が閾値未満である抽出さ
    れた対訳用例を出力する出力手段を具備することを特徴
    とする機械翻訳装置。
  2. 【請求項2】 前記請求項1記載の機械翻訳装置におい
    て、 前記出力手段は、一致度の高い順に対訳用例を出力する
    ことを特徴とする機械翻訳装置。
  3. 【請求項3】 前記請求項1または請求項2に記載の機
    械翻訳装置において、 前記出力手段は、一致度が同一の対訳用例が複数ある場
    合、その対訳用例の第1言語の文の長さに基づいた順序
    で前記対訳用例を出力することを特徴とする機械翻訳装
    置。
  4. 【請求項4】 前記請求項1から請求項3のいずれかに
    記載の機械翻訳装置において、 前記出力手段は、入力文と一致する部分を他と区別して
    対訳用例を出力することを特徴とする横械翻訳装置。
  5. 【請求項5】 第1言語の会話のと、その翻訳文であ
    る第2言語の文との対である対訳用例と、意味素性とを
    対応付けて格納する対データベースと、 意味素性とその意味素性として抽出する表記を定義して
    格納した意味素性辞書と、 第1言語の単語と第2言語の翻訳文を対応付けて格納し
    た電子辞書と、 第1言語の入力文を入力する入力手段と、 前記入力手段から入力された入力文に基づいて、前記意
    味素性辞書および前記対訳データベースを検索して対訳
    用例を抽出する検索手段と、 前記検索手段によって抽出された対訳用例と、前記入力
    手段によって入力された入力文との一致度を算出し、一
    致度が閾値未満の対訳用例しか存在しないか否かを判断
    する判断手段と前記判断手段によって一致度が閾値未満
    の対訳用例しか存在しないと判断された場合は、前記電
    子辞書を検索して前記入力文に含まれる単語の翻訳文を
    出力する出力手段を具備することを特徴とする機械翻訳
    装置。
  6. 【請求項6】 第1言語の会話のと、その翻訳文であ
    る第2言語の文との対である対訳用例と、意味素性とを
    対応付けて格納する対データベースと、 意味素性とその意味素性として抽出する表記を定義して
    格納した意味素性辞書と、 第1言語の入力文を入力する入力手段と、 前記入力手段から入力された入力文に基づいて、前記意
    味素性辞書および前記対訳データベースを検索して対訳
    用例を抽出する検索手段と、 前記検索手段によって抽出された対訳用例と、前記入力
    手段によって入力された入力文との一致度を算出し、
    致度が閾値以上の対訳用例が存在する場合は、一致度が
    閾値未満の対訳用例を出力せずに前記一致度が閾値以上
    の対訳用例を出力し、一致度が閾値未満対訳用例しか
    存在しない場合は、その一致度が閾値未満である抽出さ
    れた対訳用例を出力する出力手段を実現させるための機
    械翻訳プログラムを記載したコンピュータ読み取り可能
    な記録媒体。
JP26613097A 1997-09-30 1997-09-30 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 Expired - Fee Related JP3388153B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26613097A JP3388153B2 (ja) 1997-09-30 1997-09-30 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26613097A JP3388153B2 (ja) 1997-09-30 1997-09-30 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH11110387A JPH11110387A (ja) 1999-04-23
JP3388153B2 true JP3388153B2 (ja) 2003-03-17

Family

ID=17426755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26613097A Expired - Fee Related JP3388153B2 (ja) 1997-09-30 1997-09-30 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3388153B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3933449B2 (ja) 2001-11-22 2007-06-20 株式会社東芝 コミュニケーション支援装置

Also Published As

Publication number Publication date
JPH11110387A (ja) 1999-04-23

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH08235182A (ja) 文章処理方法とその装置
JP3388153B2 (ja) 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体
JP3393173B2 (ja) 機械翻訳装置
JPS634206B2 (ja)
CN107870905B (zh) 一种特定词汇的识别方法
JPH1097538A (ja) 機械翻訳装置
JP3377942B2 (ja) 電子辞書検索装置および電子辞書検索装置制御用プログラムを記憶したコンピュータ読取可能な記憶媒体
JP3274652B2 (ja) 翻訳装置
JPS63118868A (ja) 日本語文章校正装置
JPH0561902A (ja) 機械翻訳システム
JPH07334526A (ja) 辞書検索表示装置
JP2022148873A (ja) 情報検索装置、情報検索方法およびプログラム
JPS63163956A (ja) 文書作成・校正支援装置
JPS62143178A (ja) 自然言語翻訳方式
JPH04174069A (ja) 言語理解支援装置
JPS60207948A (ja) カナ漢字変換処理装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH05233686A (ja) 日本語処理装置
JPH0682366B2 (ja) 文字列訂正方式
JPH11232003A (ja) ドキュメント表示装置,表示方法および記憶媒体
JPH01181154A (ja) かな漢字変換装置
JPS63136264A (ja) 機械翻訳装置
JPH04268669A (ja) 日本語解析装置
JPS5840650A (ja) 日本文入力方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080110

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100110

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110110

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120110

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130110

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130110

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees