JPH03273360A - 機械翻訳方法及び装置 - Google Patents

機械翻訳方法及び装置

Info

Publication number
JPH03273360A
JPH03273360A JP2071857A JP7185790A JPH03273360A JP H03273360 A JPH03273360 A JP H03273360A JP 2071857 A JP2071857 A JP 2071857A JP 7185790 A JP7185790 A JP 7185790A JP H03273360 A JPH03273360 A JP H03273360A
Authority
JP
Japan
Prior art keywords
language
dictionary
keyword
word
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2071857A
Other languages
English (en)
Inventor
Masasuke Tominaga
冨永 雅介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2071857A priority Critical patent/JPH03273360A/ja
Publication of JPH03273360A publication Critical patent/JPH03273360A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明は、翻訳規則と辞書、シソーラス(thesau
rus:W4語辞典)を用いて5自然言語による文章を
翻訳処理する機械翻訳システムにおいて、類似文書に出
現するキーワードやキー概念を抽出し、それを用いて、
翻訳時の文の曖昧さの解消処理やユーザ辞書の作成をi
〒う機能を備えた機械翻訳方法および装置に関する。
〔従来の技術] 機械翻訳シスチムニこついては、情報処理Vo l 、
 26No、10 (1985)、第1174頁〜第1
183頁において論じられているが、概ね、翻訳対象言
語の文を、対象言語の単語に関する辞書情報と解析用文
法規則を用いて解析し、その解析結果二二対して生成用
文法規則を適用し、目標言語の単語の辞書情報を用いて
、目標言語の文f訳文)を生成するという方法か取られ
ている。
機械翻訳システムでは、訳文の譬を向上させるために、
従来の構文的な手法に加えて、意味的な情報も考慮して
、高度な処理を行おうとするものがある。例えば、ある
単語が、他のどのような単語と、如何なる関係を持って
同−千キスト上に出現しうるかといった共起関係情報を
辞書情報として蓄積しておき、それを利用して、自然言
語文の処理の過程において生しる文の構文的・意味的な
曖昧さを解消しようとする手法がある (特開昭632
9880号公報、上記文献□−情報処理一の表3参@)
つまり、構文的な解析だけでは、1つの文に対して複数
の解釈が得られることがあり、その中から意味的に不適
切な解釈を、共起関係情報などの書味的な情報を用いて
振るい落とし、正しい解釈を得ようとするものである。
しかし、意味や、さらに文脈を考慮した処理への高度化
は、現時点ではまだ不十分であり、また、理論的にも十
分に定式化されている訳ではない。
そこで、翻訳処理の対象とするテキストの種類を限定し
、自然言語の曖昧さをできる限り回避しようとする部分
言語の考え方や、例外的言語現象や曖昧さの多い表現を
人為的に制限しようとする制限言語の考え方もある(田
中穂積、辻井潤−編、1988年オーム社発行「自然言
語理解」第210頁〜第211頁参照) 。
′、発明か@失しようとする課題 F記従来技術では、共起関係情報などの意味的な情報を
用いても、文の曖昧さが解消さnない場七こ;ま あふ
かしめ定めみ1台7たイ憂先度に一たがって解釈が選j
Fされるため テキストの1帽こ応した訳し分けはでき
てぃなかった。この状況は、処理のレベルを文脈まであ
げても、その不一部分さのために同様である。
分野を表すコードを訳語に設定し、ユーザが指定するか
、テキストの出現単語の1頃向からシステムが対象分野
を推定するこ七によって訳し分ける方法も従案されてい
るがf特開昭59−103171号公報参照)、効果を
上げるためには、詳細な分野の分類か必要であり、また
システムが対象分野を推定したい場合に:よユーザ゛が
いちいち正」く分野を指定することが必要であった。
翻訳対象を特定のテキストや領域に限定する部分言語の
方法については、ユーザ自身が翻訳対象に適し、た辞書
や文法硯クリを構築したけn6ばならず、言語現象を調
査し、その結県を自動的に、/ステム↓こ反映させる効
率的な方法について′、よ、折本されm=いなかった。
したかつて、機械翻訳システムを、ある特定の対象に対
しでカスタマイズするユこは、多大な労力を要しでいた
。また、翻訳処理方式が、意味処理など高、変な手法を
取り入れた方式であるほど、辞書情報などの作成には言
語学的なセンスなど特別の能力を必要とし、一般のユー
ザにとっては負担が大きいという問題もあった。
しfがって、本発明の目的は、上記の問題点を解決じ、
翻訳するテキストの特徴を抽出し、その特徴にしたがっ
て曖昧さの解消を行うことにより、高精度の翻訳を実現
するIll械綜訳方法および装置を提供することにある
また、本発明の他の目的は、翻訳するテキストの特Φを
抽出し、その特徴に通したユーザ辞書を効率的に構築す
る手段を備えることによって、ユーザ辞書作成に要する
ユーザの労力の削減を可能とする機械翻訳方法および装
置を提供することにある。
1課題を解決するための手段; 上記目的を達成するたyl)に、本発明コよ、その基本
III想として、翻訳すべきテキスト (第1言語によ
る翻訳対象テキスト)とM似の内容を、翻訳対象言語(
第1言語)や目標言語(第2言語)あるいはその他の言
語(第3言語)により記述したテキスト (例えば、翻
訳対象テキストと専門分野が同一またはl1l(以する
内容のものを目標言語などで記述したテキスト)を′$
備し、この準備されたテキストから、キーワードを抽出
すると共に、抽出した各キーワードにその出現関度に基
づく優先度を付与する。そして、翻訳の際、翻訳対象言
語の単語に複数の語義・訳語があるとき、抽出したキー
ワード群中に存在する語義・訳語や、優先度の高い語義
・訳語を優先的に選択することにより、訳語レベルの曖
昧さをなくするよう↓こしたことを特徴とする。上記キ
ーワードに代え、言語独立のキー概念を抽出するように
してもよい。
具体的には、本発明は、翻訳するテキスト、または、そ
れと頚イ以の内容を記述した翻訳対象言語や目標言語、
あるいはその他の言語で記述′、−1こテキストから、
単語#薯やシソ−うス、さふにキーワードとして抽出す
る必要のない単語を登録5た不要語ファイルの情報を用
いて、キーワード・キー概念を抽出するキーワード抽出
手段、モー4概念抽出手段と、該抽出手段によって抽出
されたキーワード・キー概念の情報を基に、辞書から検
索じた情報中の複数の訳語や語義の優先度を変更し、翻
訳処理する翻訳手段を設けたことをvF徴とする。
また、上記他の目的を達成するために、本発明は、上記
の手段に加えて、キーワード抽出手段・キー概念抽出手
段で抽出したキーワード・キー概念の情報を基に、基本
辞書の辞書情報の中から、翻訳すべき特定の種類のテキ
ストに通した情報を抽出し、ユーザ辞書を作成する手段
を設けたことを特徴とする。
〔作 用] 上記構成に基づく作用を説明する。
本発明によれば、キーワード抽出手段・キー概、念抽出
手段は、翻訳すべきテキストあるいはそれと類似の内容
を記述巳た同じ分野・領域のテキストから、キーとなる
単語(キーワード)や概念(キー概念)を抽出する。
したかつて、翻訳の目標言語で記述された類似テキスト
からは、優先すべき目標言語の単語〈訳語の候補〉が抽
出されるので、翻訳処理の過程で解消されない単語の意
味の曖昧さが残った場合には、抽出されたキーワードの
集合に含まれる訳語を優先して選択することにより、キ
ーワーF′を抽出した特定の種類のテキストに応した訳
し分けが可能となる。
また、キー概念抽出手段を用いれば、特定の種類のテキ
ストに出現する、キーとなる概念が抽出される。したが
って、キーワード抽出手段を用いる場合と同様に、曖昧
な単語の複数の語義から、抽出したキー概念の集合に含
まれる語義を優先して選択するという方法で、翻訳テキ
スト中の単語の曖昧さを概念レベル(語義レベル)で解
消することができる。この場合、抽出すべき対象は言語
独立の (すなわら、どこの国の言語とも無関係な〕[
念であるから、キー概念抽出手段の入力は、目標言語で
記i8されf二子キヌ←に限らず、翻訳対象言語やその
他の言語の場合でも、そ4を解析するための辞書と解析
規すリがあわ“ず可能である。
また、辞書作成手段;よ、前記キーワード抽出手段・キ
ー概念抽出手段から抽出さ机たキーワード・キー概念を
基に、基本辞書の情報のうち、キーワード・キー概念を
抽出した特定の神声のテキストに通した部分、あるいは
優先しで翻訳に利用すべき部分を決定できるので、その
部分情報だけを抽出しユーザ辞書を作成することができ
る。例えば、2言語間の対訳辞書に8いて、ある単語が
、複数の訳語や語義を持っている場合、キーワードやキ
ー概念の集合に含まれる訳語や語義があれば、その部分
の情報を取り出すことによって、ユーザ辞書を作成すれ
ば良い。また、前記部分情報の優先度だけを変更して、
他の辞書情報とともにユーザ辞書に登録することも可能
である。
また、キー概念抽出手段やキー概念ファイルに蓄積され
た情報は、類似テキストを翻訳する際に、何度も使用す
ることができるし、その変に、キーワードやキー概念を
抽出・蓄積し、キー概念抽出手段やキー概念ファイルの
情報を充実させていくことも可能である。
以上の手段によって、ユーザは、翻訳すべきテキストと
類似の内容を記述したテキストを入力するという簡便な
方法で、それらのテキストに通したユーザ辞書を作成す
ることが可能であり、辞書作成に掛かる人的な労力を大
幅に削減することができる。
また、ユーザ辞書には、特定の種類のテキストに通した
情報だけを登録することができるので、曖昧さの問題を
できる限り回避することが可能となり、結果としての訳
文の賞も向上する。また、不要な情報を削除しているの
で、曖昧さが少なくなった分だけ、翻訳処理の効率も向
上する。
C実施例〕 以下に、本発明の実施例を図面に基づいて詳細に説明す
る5 まず、本発明の第1の実施例を図面に基づいて詳細に説
明する。本実施例で説明する第1言語(例えば英語)か
み第2言語(例えば日本語)への機械翻4Rノステムは
、翻訳対象領域の第2言語のテキストからキーワードを
抽出し、その第2言語のキーワードを利用することによ
って、翻訳処理過程において生しる訳語の曖昧さを解消
することを特徴とする。本実施例では、英語から日本語
に翻訳する機械翻訳システムについて説明するが、他の
言語対による機械翻訳システムに対しても同様に通用す
ることが可能である。
第2図は、本発明の第1の実施例を示す機械翻訳システ
ムのブロック図である。同図に8いて、■はキーワード
を抽出するテキストおよび翻訳するテキストを蓄えるテ
キストファイル、2は翻訳処理に用いる解析規則や生成
規則などの文法規則を蓄える翻訳規則ファイル、3はキ
ーワード抽出時にキーワードから除外する単語を蓄えた
不要語ファイル、4aは翻訳やキーワード抽出に用いる
対訳辞書や単一言語辞書等の辞8類をまとめた辞書、5
.1は酸語や概念の上位−下位関係1部分−全体関係、
連色関係などの意味関係を蓄えるシソ−らス、6シまキ
ーワード抽出゛拮果を再fll用するためユこ長明的に
蓄えるキー概念抽出手段、7aは翻訳、キーワードの抽
出、翻訳結果や抽出されたキーワードの膚1、データの
表示・入力などの各種処理を制御する制御手段、8aは
辞J4aやシソーラス5aの情報をi=、テキストファ
イルlに蓄えられたテキストやユーザが入力手段12か
ら入力したテキストに翻訳規則ファイル2に蓄、えらη
4た翻訳規則を通用して翻訳するための翻訳手段、9a
は不要語ファイル3や辞書4a、シソーラス5aの情報
を基にユーザが指定したテキストファイル1の中のテキ
ストからキーワードを抽出するためのキーワード抽出手
段、loaは翻訳結果やキーワード抽出結果を編集する
だめの編集手段、11は翻訳結果やキーワード抽出結果
をユーザに示すための表示手段、12はユーザが翻訳す
べきテキストやキーワード抽出対象のテキストなど処理
に必要な情報を入力するための入力手段を示している。
次に、本実施例の処理動作について説明する。
第1図は、本実施例によるキーワード抽出と翻訳処理の
方式を示すフローチャートである。
(ス壬2ノブ101) まず制御手段7aは、ユーザに対しでキーワード抽出を
行うか否かを、表示手段11を通じて尋ねる。
ユーザがキーワード抽出処理を指示すると、制御手段7
aは、キーワード抽出に必要なテキストと辞書の指示を
、ユーザに対して要求する。
(ステップ102) ユーザは、自分の目的に合わせて、翻訳すべきテキスト
と同し様な内容を記述した日本語のテキストを指定する
。例えば、自然言語処理や言語学関係(分野)の論文の
テキストを翻訳する場合には、キーワード抽出でも、同
様の分野や種類のテキストを指定する。
ユーザが、入力手段12から、キーワード抽出用のテキ
ストと辞書を指示すると、次に制御手段7aは、その情
報をキーワード抽出手段9aに転送して、キーワード抽
出処理を起動する。
(ステップ103.104) 第3図は、キーワード抽出処理番キーワードを用いた翻
訳処理を説明するための説明図である。
第3図において、キーワードテーブルTaを生成するま
での処理をキーワード抽出手段9aが行う。
本実施例では、英語から日本語に翻訳する機械翻訳方式
を一例として説明するので、ユーザは、日本語のテキス
トと辞書を、キーワード抽出処理に対して指定する。
次に、キーワード抽出処理について、第3図を基に説明
する。以下に説明するように、キーワード抽出処理は、
形態素解析処理と不要語削除処理によって構成されてい
る。
形態素解析処理では、指定された日本語のテキストを日
本語辞書の情報を用いて形態素解析し、単語列に分解し
たあと、同一の単語を一つにまとめてその出現頻度を求
め、出現単語テーブルTbに登録する。日本語の形態素
解析の方法としては、最長−成性や文節数最小法など、
各種の手法が折戸されているが、未発明で:よ持定巳な
い。
次に、キーワード抽出手段9aは不要語ファイル3の情
報を基に出現単語チー7′ルTbからキーワードとして
不適切な亘語を削除する不要語削除処理を行っ。日本語
では、不要語として、「が、。
「で、、rlこ−等の助詞を含む機能語と呼ばれる単語
を設定しでおくことが考えられるが、もちろん、ユーザ
ニよ目的に応して任意に設定することが可能である。ま
たこの際、ユーザが予め設定しておいた閾値より出現頻
度の小さい単語も削除するような処理を追加することも
可能である。
以上の処理で残ったキーワードはキーワードテーブルT
aに蓄えられる。第3図では、自然言語処理や言語学関
係の論文のテキストを指定した場合、「解析」、「生成
」、「構文Jなどの単語がキーワードとして抽出された
ことを示している(以上ステップ103)。また、キー
ワードの出現頻度から求めた優先度も設定されている。
この優先度は、大きい数はど出現頻度が高いことを示し
ているが、出現頻度にあらか−め設定しておいた係数を
掛けるなどの方法で求ぬることができる。この計算方法
については、本発明では特定したい(以上ステップ10
4)。
(ステップ105) 次に、キーワード抽出処理が終了すると、キーワード抽
出手段9aは、制御手段7aを遥して、抽出したキーワ
ードをキー概念抽出手段6に蓄積するか否かを、ユーザ
に確認する。
(ステップ1106 )積する場合には、抽出したキーワードをキワードテー
ブルTaにまとめ、検索のためのコードとともにキー概
念抽出手段6に蓄積する。したがって、後で述べる翻訳
処理においてキーワードを用いるとき、キー概念抽出手
段6に蓄積したキーワードを、ユーザの指定に応して何
度も使用することが可能である。
(ステップ107) 蓄積したい場合には、抽出したキーワードは、全体の処
理が終了するまで、そのままバッファ領域に記憶される
以上のキーワード抽出手段9aの処理が終了すると、次
に制御手段7aは、処理を続行するか否か、ユーザに確
認する(以上ステップ107)。
翻訳処理もキーワード抽出処理も行わない場合は、全体
の処理二よ終了する。
次に、ユーザが翻訳処理を指示した場合について説明す
る。
(ステップ108 、109 ) ユーザが、翻訳処理を指示すると、制御手段7aは、ユ
ーザに対して、翻訳すべきテキスト (翻訳対象テキス
ト)と翻訳に用いる辞書、キーワードテーブルの指示を
要求する。本実施例では、英語たる日本語への翻訳を例
として説明するので、この場合、英語で書かれたテキス
)Ib(第3図)を指定する。ユーザは、テキストファ
イル1に蓄積したテキストを指定しても良いし、入力手
段12から直接テキストを入力しても良い。また、直前
にキーワード抽出を行った場合や、キーワードを用いな
い従来の翻訳処理を行う場合は、キーワードテーブルは
指定する必要はない。キーワードテ−フルを指定した場
合には、ユーザの選択によって、バッファ領域に蓄えら
れているキーワード抽出結果とマージすることも可能で
あるし、また、新たに指定したキーワードテーブルだけ
を用いて翻訳することも可能である。
翻訳に用いる辞書4aとしては、単一言語辞書、対訳辞
書など、翻訳方式によってさまざまな形態があるが、本
実施例では、対訳辞書4a2を用いる場合を例として説
明する。
(ステップ110) 次に制御手段7aは、ユーザが入力した情報を翻訳手段
8aに転送し、翻訳処理を起動する。
まず、翻訳手段8aは、ユーザが指定した翻訳テキスト
から1文読み込む。
(ステップ111) 次に、辞書検索し、形態素解析を行い、文を単語列に分
割する。辞書検索・形態素解析の手法としては、特願昭
ん一138586号に開示されているような、形態素解
析機能を有する辞書検索方法が適用できる。
形態素解析が終了すると、翻訳中の文は単語ごとに分割
され、各単語に対して辞書情報が読み込まれた状態にな
っている。
(ステップ112) 次に、翻訳手段8a二よ、辞書検索で読み込まれた辞書
情報の中で、キーワードチーフルTaに設定されている
キーワードと一致する訳語がないかどうか確認し、あれ
ば、キーワードテーブルに設定されている優先度に基シ
二各訳語の優先度を変更する。
ステップ109でキーワードテーブルTaが指定されず
、キーワード抽出も行っていない場合は、このステップ
では何も行わない。
例えば、第3図に示す英日対訳辞書4a2では、英単語
’ genera t ion Jに対して、r世代J
と「生成」の2つの訳語が設定されているが、キーワー
ドテーブルに「生成Jが優先度100で登録されている
ため、このキーワードの優先度にしたがって、訳語「生
成Jの優先度が変更される。したがって、このキーワー
ドテーブルTaにr世代ノというキーワードが登録され
ていないか、あるいは、登録されていてち「主成Jより
優先度が小さけれは、このキーワードテーブルを用いた
翻訳処理の中では、訳語「生成」の方が優先さ?Lる二
とになる。
また、辞書情報中の訳語に、あらかしめ優先雫が設定さ
れている場合には、訳語とそれに一致するキーワードの
優先度を加算するなどして合成することにより、訳語の
優先度を更新することも可能である。
(ステップ113) 次に、以上の処理で訳語の優先度を変更した辞書情報を
基に、翻訳規則ファイル2に蓄積された翻訳規則を適用
して、翻訳処理を行う、この際、翻訳処理の方法によっ
ては、シソーラス5aの情報を用いることも可能である
。具体的な翻訳処理の方法は、本発明では特定したい。
ただし、本発明によるキーワード抽出結果を用いれば、
翻訳処理の過程で、ある単語の訳語の候補が複数残った
際に、ステップ112で設定した訳語の優先崖を考慮す
ることによって、a釈テ牛ストに適した、尤もaしい訳
語を1!択することが可能である。
例えば第3図では、入力文rText generaL
ionis another difficult 1
ssue、 Jにおいて、英東語’ generati
on Jの訳語の候補を1つに絞り込めなかった場合、
キーワードとして抽出された「生成」という訳語を優先
することにより、rテキスト生成は、もう1つの難しい
問題である。」という正解状を得ることができる。
(ステップ114) 次に、翻訳処理が終了すると、他に翻訳すべき文が残っ
ていないか確認し、あれば、ステップ110にもどり、
上述の処理を繰り返す。残っていなければ、翻訳処理を
終了する(ステップ114終り)。
以上説明したごとく、本実施例によれば、ユーザは、翻
訳すべきテキストとfi(以の内容を記述じた、同じ分
野の目標言語によるテキストを用意しておけば、システ
ムが、その目標言語によるテキストからキーワードを抽
出し、翻訳テキストに適するように辞書情報中の訳語の
優先度を更新してくれるので、翻訳テキストにiliし
た訳し分けが可能になる。また、抽出したキーワードを
キー概念抽出手段6に蓄積じておけば、同し分野のテキ
ストを再度翻訳するときに、利用することが可能である
本実施例では、翻訳処理として、対訳辞書を用いる場合
を例として説明した。しかし、言語に依存したい中間言
語による表現を介して翻訳する中間言語方式では、解析
・生成それぞれに単一言語辞書が用いられる。この場合
、生成側の単一言語辞書は、中間言語の語宜である概念
語から目標言語の語!への写像を規定している。〕たが
って、本本実側による目標言語のキーワードを用いて、
ある概念語に対応する複数の目標言語の単語(訳語)の
優先度を変更するようにすれば、本実施例と同様の効果
が期待できる。
本実施例の変形と−で、キーワード抽出の際に、シソー
ラスの情報も参照することにより、キーワード抽出用に
指定したテキストに含まれないが、関連の深い単語につ
いても、キーワードとして抽第4図は、拡張したキーワ
ード抽出処理を説明するための処理概念図である。
第4図のキーワードチーフル1を生成するまでの処理は
、第3図で説明したキーワード抽出処理と同じ処理であ
る。
形態素解析と不要語削除処理を経て、指定されたテキス
トから抽出されたキーワードは、キーワードテーブルl
  (Tal)に設定される。
次に、拡張処理として、キーワードテーブルlのキーワ
ードの関連語をシソーラス5aから検索し、関連語テー
ブルTcに設定する関連語抽出処理を行う。
第5図は、シソーラスに蓄えられた単語や概念間の意味
関係を表した概念図である。例えば、「言語処理」の下
位語としては「解析Jや「生成jなどがあり、さらに、
「解析」の下位語としては、r形態素解析Jや「構文解
析Jなどがあることを示している。
第5図では、意味関係として上位−下位関係の例しか示
していないが、シソーラスには、それ以外の部分−全体
関係や連想関係なども設定することが可能である。
関連語抽出処理で:ま、シソーラスに登録された意味関
係にしたがって、キーワードテーブル1の各キーワード
に灯じで、その関連する単語を検索する。
第6図は、シソーラスの構成の一例を示す図である。例
えば、「たこ」という日本語の単語に対して、上位語、
下位語、関連語というエントリにそれぞれの対応する単
語が列挙されている。また、見出し語が、複数の語義を
持つ場合は、その語義ごとに各情報が登録される。「た
こ」の場合には、動物の「たこ」と、おもちゃの「たこ
」があるので、それぞれの語義に関して、意味関係を持
つ単語が登録されている。第6図には示していないが、
関連語については、意味関係の種類も明示するように拡
張することもできる。
関連語抽出処理では、このように1つの単語に、複数の
語義による意味関係が存在する場合、他のキーワードの
意味関係による関連語との整合性を考えて、語義を選択
じ、?X数のキーワード間で一貫性の取れた関連語を抽
出する。
第7図↓よ、複数の語義を持つキルワードを考慮した関
連語抽出処理のフローチャートである。
(ステップ701) まず、キルワードテーブルl  (Tal)に設定され
たキーワードを、語義を1つじか持たないキーワードと
複数持つキーワードに分類する。
(ステップ702) 次に、語義が1つのキーワードすべてについて、シソー
ラス5aからその関連語を検索し、関連語テーブルTc
に登録する。
(ステップ703) 次に、複数の語義を持つキーワードすべてについて、以
下の処理を行う。
(ステップ703(う まず、処理パラメータの初期化を行う。
第7図において、iは語義番号、Nは以下で説明する一
致度が最大の語義の番号、Maxはその最大の一致度を
設定する変数である。
ある語義の一致賓シま、例えば、その語義に対応する関
連語のうち、既に関連語テーブルに登録されている関連
語と一致するか、あるいは特定の意味関係にある単語の
数によって定義することができる。つまり、注目してい
る語義の関連語の集合を、 (word (i)IQ≦l≦n、nは関連語の数)と
し、関数rを、 単語Wが関連語テーブルに含まれるとき、f(W)=I
、 単語Wが関連語テーブル上の単語とシソーラス上で意味
関係を持つとき、 f  (w) =0.5 それ以外の場合には、 f  (W) =0 と定義する。このとき−成度Mは、 M=Σf(word  (i)) i=1 で計算できる。−成度の定義は、上述の方力以外にもさ
まざまなものが考えられる。
(ステップ7032.7033) 次に、i番目の語義に関する関連語をン′″−ラス5a
から検索し、関連語テーブルの関連語との一致度を計算
する。
(ステップ7034.7035) 次に、一致gMが、−成文の最大値Maxより大きいか
否かチエツクし、大きければ、パラメータNに現在の語
義番号lを保存し、最大の一致賀Maxの値を更新する
(ステップ7036.7037) 次に、語義番号1を1つ増やし、ステ・ツブ7032か
らの処理を、iの値が語義の数より大きくなるまで繰り
返す(ステップ7037終り)。
以上の処理によって、すべての語義に対応する関連語の
一致度の算出処理が終了し、バーt%−タNとMaxに
は、それぞれ、最大の一致度を持つ語義の番号とその一
致度が設定される。
(ステップ7038.7039) 次に、Maxの値が正の場合は、N番目の語義の関連語
を関連語テーブルTcに登録する。
Maxの値がOの場合は、ン主目しているキーワードの
すべての語義の関連語と、関連語テーブルの単語がマツ
チしたかったことを示しており、このキーワードに関す
る関連語は、関連語テーブルTcには登録されない(以
上ステップ7038.7039)。
ステップ703の処理がすべてのキーワードについて終
了すると、関連語抽出処理は終了する。
以上の関連語抽出処理で抽出された関連語は、関連語テ
ーブルTcに設定される。次に、第4図に示すように、
キーワードテーブル1 (Ta1)と関連語テーブルT
cの情報をマージするキーワード決定処理が起動される
キーワード決定処理では、キーワードテーブルlと関連
語テーブルに設定された単語をマージするだけではなく
、キーワードや関連語に設定された優先度を基に、ユー
ザの設定した優先度の閾値やキーワードの数の上限値か
ら、優先度の低い単語を削除したりすることも可能であ
る。
関連語の優先度の算出方法は、キーワードの優先度に、
関連語とキーワードの意味関係の11こよって定めたF
F、数を掛ける、ユとによって求めるなどの方法が可能
である。
以上のキーワード決定処理によって求められたキーワー
ドは、キーワードチーフル2  (Ta2)己こ設定さ
れ、第1図と第3図で説明したように、翻訳処理に利用
される。
キーワード抽出処理は、以上説明したように、自動的に
抽出するようシこすることも可能であるが、第4図に示
すように、入力手段12、表示手段11を用いて、ユー
ザが結果を確認し、誤ったキーワードや抜けているキー
ワードを、それぞれ削除・追加・修正するような編集処
理を追加することも可能である。また、キーワードテー
ブル1のキーワードをテキストから抽出するのではなく
、すべてをユーザに指定させるようにすることも可能で
ある。
以1説明したごとく、ユーザが1旨定したテキストから
キーワードを抽出するだけでなく、シソーラス5aを用
いて関連語も抽出するようにすnば、直接テキストに出
現したいキーワードも漏れなく抽出することが可能にな
る。
例えば、第3図に示した例のようコニ、キーワードとし
て「解析Jとr生成jのうち片方がテキストに出現して
いない場合でも、一方がキーワードテーブル1に抽出さ
れていれば、他方はシソーラス5aの情報を基に関連語
として抽出される。したがって、ユーザがキーワード抽
出用に指定したテキストが少なくても、シソーラス5a
から関連語を抽出できるので、翻訳すべきテキストの特
徴を表すキーワードを抜けなく抽出することが可能であ
る。
関連語抽出処理の方法としては、第7図に示した方法以
外にも、キーワードテーブル1に抽出されたキーワード
の関連語だけを抽出するだけでなく、抽出された関連語
の関連語というように、シソーラスをユーザの指定した
段数だけ複数回連る、または、シソーラス上の意味関係
に関係の強さを定義しておき、関連語間の関係の強さの
積算がある閾値を下回らない範囲で複数回連るという方
法を採ることによって、より多くの関連語を抽出するこ
とも可能である。
また複数の語義を持つキーワードに対しで、正しい語義
の関連語を抽出する方法にも、前述の意味関係の強さを
導入する二とで、別の方法が考えられる。
例えば、すべてのキーワードの語義の組合せを考え、異
なるキーワード間の関連語の意味関係の強さの緩和を算
出し、それが最大となるような語義の組合せに対する関
連語を抽出するようにすることが可能である。つまり、 キーワードの集合を に= (Kl 、  K2 、−−−、  Kn 1キ
ーワードKiの語義の集合を S em (i) = (Si1.  Si2.−=、
  51m言語義の組合せの集合を S = S e m(1)  X S e mc2)X
・−・−8e m(n)とじ、シソーラス上の任意の2
単語間(wi 。
wj)の意味関係の強さを、 ((wl 、   w)  )   C−f   (w
j  、   wi  l  )七二で定義してδ′ Sの各要素(キーワードの語義の耐合せ)に廿゛−で関
連語の集合Wを求め 関連語間の意味関係の強さの総和
[が鰻に大きい要毫を 未めるキーロードの語義の組合
せと1.て決定する二とができる。つまハ、Sのある要
素について、関連語の集合を W= (wl 、w2. ・−−−−−、wk lとす
る上、その要素シュ間する意味関係の強さの総和 I 
コ;;、 ■=    Σ      f  (wi、Wj  )
wl、wjgh、   i#j で算出できる。したがって、■が最大となる関連語の集
合WをキーワーVとすればよい。
干た、上述の方法以外にも、第4図に示したように、キ
ーワードテーブルlの結果をユーザが編集する際に 複
数の語義を持つ承諾2こ対−で、ユーザが正しい語義を
選択するようにすることも可能である。
以上説明しだように、関連語抽出処理を用いることによ
り、豊富なキーロードを抽出することが可能となる。
以下に未発明の第2の実施例を図面に基づいて説明する
本実施例で説明する第1言語から第2言語への機械翻訳
システムは、翻訳対象領域の第2言語のテキストから抽
出−たキーワードを、翻訳処理に直接利用するのではな
く、汎用の基本辞書からその翻訳対象領域に通りだ情報
を抽出し、ユーザ辞書を作成する処理に利用する所に特
徴がある。
本実施例では、英語から日本語へ翻訳する機械翻訳シス
テムについて説明するが、他の言語対の翻訳システムに
対しても通用可能である。
第8図は、本発明の一実施例を示す機械翻訳システムの
ブロック図である。図において、1はキーワードを抽出
するテキストおよび翻訳するテキストを蓄えるテキスト
ファイル、2は翻訳処理に用いる解析規則や生成規則な
どの文法規則を蓄える翻訳規則ファイル、3はキーワー
ド抽出時にキ−ワード力・ら除外する単語を蓄えた不要
語ファイル、4bは翻訳やキーワード抽出に用いる対訳
辞書や単一言語辞書をまとめた辞書、5bは単語や概念
のL泣−下位関係 部分−全体関係、連想関係なと゛の
意味関係を蓄えるシソーラス、14bは翻訳に用いる辞
書で、特に以マに説明する辞書作成手段13bを用いて
、ユーザが自分の翻訳対象であるテキストの固有の特徴
に合わせて作成しだユーザ辞書、6はキーワード抽出結
果を再利用するために長期的に蓄えるキー概念抽出手段
、7bは翻訳、キーワードの抽出、翻訳結果や抽出され
たキーワードの編集、デー々の表示・入力などの各種処
理を制御する制御手段、8b:ま基本辞書4bやユーザ
辞M14b 、及びシソーラス5b0)情報を基に、テ
キストファイルlに蓄積されたテキストやユーザが入力
手段12から入力じたテキストに、翻訳規則ファイル2
に蓄えられた翻訳規則を通用して翻訳するための翻訳手
段、9b’よ不要語ファイル3や基本辞書4し、シソー
ラス5bの情報を基にユーザが指定したテキストからキ
ーワードを抽出するためのキーロード抽出手段、13b
はキーワード抽出手段90によって抽出したキーワード
の情報を基に、基本辞書4hの情報のうちキーワードが
示す特定の種傾の子キス(・の翻訳に4巳た情報を取り
出し、ユーザ辞書+4bを作成する辞書作成手段、lO
bは翻訳結果やキーワード抽出結果、ユーザ辞書作成結
果を編集するための編集手段、11は翻訳結果やキーワ
ード抽出結果、ユーザ辞書作成結果をユーザに示すため
の表示手段、12は翻訳すべきテキストやキーワード抽
出対象のテキストなど処理に必要な情報を、ユーザが入
力するための人力手段を示している。
次に、本実施例の処理動作について説明する。
第9図は、キーワード抽出処理とユーザ辞書作成処理を
説明するための処理概念図である。第9図において、キ
ーワードテーブルTaにキーワードを抽出するまでの処
理は、第1の実施例で説明したキーワード抽出処理と同
じ処理を行う。本実施例では、抽出したキーワードの情
報を基にユーザ辞書を作成する方法について説明する。
また、第一の実施例と同様に、翻訳用の辞書としでは、
第9図に示す対訳辞書を用いる場合を例として説明する
第10図はキーワード抽出結果からユーザ辞書を作成す
る方式を示すフローチャートである。
ユーザが制御手段7bに辞書作成を指示すると、制御手
段7bは、第1の実施例の翻訳処理の場合と同様の方法
でキーワード抽出手段911.mよって抽出したキーワ
ードの情報を辞書作成手段L3b に転送し、辞書作成
処理を起動する。
この場合、第1の実施例の翻訳処理の場合と同様に、直
前に抽出したキーワードだシナでなく、キー概念抽出手
段6に蓄積したキーワードチーフルをユーザが指定する
ことも可能である。また、ユーザ辞書作成の基となる基
本辞書が複数存在する場合には、どの基本辞書を用いる
かを、ユーザが選択できるようにすることも可能である
次に、第10図を基に、辞書作成の処理について説明す
る。
(ステップ1001) 辞書作成処理が起動されると、辞書作成手段13bは、
まず制御手段7b力・ち送られてきたキーワードテーブ
ルの中かみ単語を1つ選択する。
(ステ゛ンブ1002) 次に辞書作成手段13b:よ、選択したキーワード′を
訳語として持つ見出し語とその辞書情報を基本辞書4i
l]から検索する0本実施例では、英日対訳辞書を用い
て、英語がち日本語へ翻訳する機械翻訳を例として説明
しているので、キーワードは日本語の単語であり、基本
辞書の見出−語は英語の単語である。特定の訳語を持つ
見出二倍を検索するためには、Inνerted fi
leを作成二でおけばよい。
(ステップ1003) ある特定の訳語(この場合日本語)を持つ見出7語(英
語)は、一般一二複数存在する。したがって、以下の処
理を検索されたすべての見出し語に対して行う。
(ステップ10031 ) まず、辞書作成手段13bは、その見出し語が複数の訳
語を持つかどうかをi認する。
(ステップ10032 ) 複数の訳語を持つ場合には、キーワードと訳語が一致す
る辞書情報のみを抽出する。訳語を1つしか持たない場
合、曖昧さがないのでユーザ辞書を作成する必要はない
(ステップ10033 ) 次に、辞書作成手段13bは抽出した辞書情報を制御手
段7bを通して表示手段11に表示し、ユーザに確認を
求める。ユーザは、指示された見出し語の辞書情報をそ
の訳語に対応する情報のみに限定してよいか!認する。
(ステップ10034 ) 表示手段11に表示された遺りで良い場合は、その情報
がユーザ辞書に登録される。
辞書作成手段13bの作成した結果が不適当な場合ハ、
ユーザは、編集手段10bを起動してその結果を修正し
、修正した辞書情報をユーザ辞書に登録することも可能
であるし、また、特定の訳語に限定するのが不適切な見
出し語の場合は、ユーザ辞書に登録する必要はない。
(ステップ1004) 以北の処理によって、指定されたキーワードを訳語とし
て持つ見出し語二二対するユーザ辞書作成処理が終了す
る。
辞書作成手段13bは、以上説明したユーザ辞書作成処
理をキーワードテーブルのすべてのキーワードに対して
繰り返す(以上で1004終了)。
以上の処理によって、ユーザ辞書の作成処理が終了する
。第9図では、英日対訳辞書の名詞’generati
orzの辞書情報が、キーワードr生成」によって、訳
語「生成」に対応する辞書情報のみに限定され、ユーザ
辞書の情報として登録されている。
以上説明したごとく、本実施例によれば、ユーザは翻訳
すべきテキストとN値の内容を記述した同じ分野の目標
言語によるテキストを用意しておけば、システムがその
目標言語のテキストからキーワードを抽出し、翻訳テキ
ストに通した情報を基本辞書から抽出することによって
、ユーザ辞書を作成して<n、る。
したかつて、二のニーW辞書を用いれ二だ、そのテキス
ト、 4こ通5た訳し分けが可能に11?)翻訳MIX
’が向上する。また ユーサ゛辞−M に登録された里
語は、基本辞書と比べて凌昧さカ・少なくなっているの
で、翻訳処理に2いて考書すべき文の解釈の可能性の数
が減少し、処理効率も向上する。さるに、上述の利点を
持ったユーザ辞書を作成するための人的労力も少なくて
済むという特徴を持っている。
また、作成したユーザ辞II:よ、類似のテキストを翻
訳する際に、再度指定することによって同様の効果を得
ることが可能である。
また、本実施例では、翻訳用の辞書としで対訳辞書を用
いる場合を例として説明したが、第1の実施例で説明し
たよう/二中間言語方式で単一言語辞書しか用いない場
合も、生成用の単一言語辞書に対して同様の手法を適用
じ、ユーザ辞書を作成することが可能である。
つまり、生成用辞書の見出じ語がある概念に対して、複
数の目標言語の単語(訳語)が対応している場合、キー
ワードとして抽出さ几た屯語に対応する情報だけを抽出
二で、ユーザ辞Mに登録すn、ばよい。
本実施例の変形として一翻訳対蒙言語のキーワードも用
いることにより、対訳辞再形弐のユーザ辞与の作成処理
を、より効果的に行うことが可能である。
第11図は、拡張したユーザ辞書作成処理を示すフロー
チャートである。
ユーザは、第1の実施例で説明−だような方法を用いて
、翻訳するテキストと同様の内容を記述した翻訳対象言
語のテキストと目標言語のテキストから、それぞれキー
ワードを抽出し、キー概念抽出手段に蓄積しているもの
とする。キーワード抽出処理は、形lLi素解析処理・
不要語ファイル・辞書などの言語に依存する部分を除い
ては、対象言語にかかわらず、同様の手法を用いろこと
が可能である。
次に、第1I図を基に、辞書作成処理について説明する
(ステップ1101) ユーザが制御手段7bに辞書作成を指示すると、制御手
段7bは、辞書作成処理に用いるキーワードテーブルの
指定を要求する。ユーザは、翻訳するテキストの内容に
合わせて、翻訳対象言語のキーワードを設定したキーワ
ードテーブルと目標言語のキーワードを設定したキーワ
ードテーブルを指定する。
ユーザがキーワードテーブルを指定すると、制御手段7
bはその情報を辞書作成手段13bに転送し、辞書作成
処理を起動する。
(ステップ1102) 次に辞書作成手段13bは、指定された目標言語のキー
ワードテーブルから単語を1つ選択する。
(ステップ1103) 次に辞書作成手段13bは、選択したキーワードを訳語
として持つ見出し語を基本辞書4bから検索する。
(ステップ1104) 次に、検索された1つ以上の見出し語すべてに対しで以
下の処理を行う。
(ステップ11041 ) まず、辞書作成手段13bは、検索された見出し語が、
ユーザが指定した翻訳対象言語のキーワードチーフルに
含まれでいるかどうが確認する。
翻訳対象言語のキーワードテーブルに含まれていない見
出し語は、ユーザ辞書作成の対象とはしたい。この処理
は、訳語が目標言語のキーワードと一致するというだけ
で、不適切な見出し語の辞書情報を限定するのを防いで
いる。
例えば、第9図において、日本語のキーワードとしてr
生成jが抽出されているが、訳語として「生成Jをもつ
単語は、’ genera t ion J以外にも存
在する可能性がある。しかし、ユーザ辞書作成の対象を
、英語のキーワードテーブルに含まれている単語に限定
することによって、この実施例のように自然言語処理や
言語学を対象分野とする場合には、英語のキーワードと
して抽出されている可能性が高い’ genera t
 ion Jだけがユーザ辞書作成の対象となる。
(ステップ11042 ) 次に、翻訳対象言語のキーワードテーブル↓こ含まれて
いる見出し語の場合は、辞M’f#報を検索するや (ステップ11043 、11044 )そじて、その
見出し語が、複数の訳語を持っている場合には、目(言
語のキーワードと一致する訳語に対応する辞書情報を抽
出する。訳語が1つしかない場合は、ユーザ辞書には登
録したい。
(ステップ11045 ) 次に辞書作成手段13bは、抽出じだ辞書情報を制御手
段7bを通して表示手段11に表示し、ユーザに1lI
I認を求める。ユーザは、指示された見出し語の辞書情
報を1つの訳語に対応する情報のみに限定してよいか確
認する。この際、キーワードと一致した訳語以外の、他
の訳語の候補も参照できるようにすることも可能である
(ステップ11046 ) 表示手段11シこ表示された辞書情報で良い場合には、
その情報がユーザ辞書の情報として登録される。
辞書作成手段の作成した結果か不通切な場合は、第10
図で説明′−たように、Wl!手段10bを起動してユ
ーザが直接修正するのも可能であるし、そうでなければ
、単にユーザ辞書に登録したいというようにすることも
できる(以上ステップ1104’)。
(ステップ1)05) 辞書作成手段13bは、ステップ1102から1104
の処理を、目標言語のすべてのキーワードに対して行い
、ユーザ辞書を作成する。
以上説明したように、ユーザ辞書を作成する見出し語を
、翻訳対象言語のテキストから抽出されたキーワードに
限定することにより、不要なユーザ辞書の作成を排除し
、適切な見出し語の選択を可能にする。したがって、自
動的に作成した辞書情報を、ユーザが確認する際に必要
な労力が少な(なり、効率的である。
以下に、本発明の第3の実施例を図面に基づいて詳細に
説明する。
本実施例で説明する第1言語から第2言語への機械翻訳
システムは、第1・第2の実晦例とは異なり、翻訳対象
領域の第2言語の斗キストから第2言語のキーワードを
抽出するのではなく、翻訳対象領域の任意の言語のテキ
スト力・ら、言語独立なキー概念を抽出し それを利用
することシこよって、翻訳処理で生じる語義の曖昧さを
解消したり、汎用の基本辞書からその翻訳対象領域に通
した情報を抽出し、ユーザ辞書を作成する所に特徴があ
る。
本実施例では、英語から日本語へ翻訳する機械翻訳シス
テムについて説明するが、他の言語対の翻訳システムに
対しても通用可能である。
第13図は、本発明の第3の実施例を示す機械翻訳シス
テムのブロック図である。図において、1はキー概念を
抽出するテキストおよび翻訳するテキストを蓄えるテキ
ストファイル、2は翻訳処理に用いる解析規則や性成規
則などの文法規則を蓄える翻訳規則ファイル、3はキー
概念抽出の前処理としてのキーワード抽出時にキーワー
ドから除外する単語を蓄えた不要語ファイル、4cは翻
訳やキー概念抽出に用いる対訳辞書や東−言語辞書等の
辞書類をまとめた19書、14cは翻訳に用いる辞書で
、特に以下に説明する辞書作成手段13cを用いて、ユ
ーザが自分の翻訳対象であるテキストの固有の特徴に合
わせて作成したニー4F辞オ、5Cは単語や概念の上位
−下位関係、部分−全体関係、連偲関係などの意味関係
を蓄えるシソーラス、16はキー概念抽出結果を再利用
するために長期的に蓄えるキー概念ファイル、7cは翻
訳、キー概念抽出、翻訳結果や抽出されたキー概念のy
4s、データの表示・入力などの各種処理を制御する制
御手段、8cは基本辞書4cやユーザ辞!14c 、及
びシソーラス5Cの情報を基に、テキストファイル1に
蓄積されたテキストやユーザが入力手段12から入力し
たテキストに、翻訳規則ファイル2に蓄えられた翻訳規
則を適用して翻訳するための翻訳手段、15は不要語フ
ァイル3め基本辞書4C、シソーラス5cの情報を暮に
ユーザが指定したテキストからキー概念を抽出するため
のキー概念抽出手段、13cはキー概念抽出手段15に
よって抽出したキー概念の情報を基2こ、基本辞書4c
の情報のうちキー概念を抽出した特定のテキストニこ適
した情報を取り出し、ユーザ辞Ji14r、を作成する
辞書作成手段、10cは翻訳結果やキー概念抽出結果、
ユーザ辞書作成結果を編集する1こめの′f@集手段、
11は翻訳結果やキー概念抽出結果、ユーザ辞書作成結
果をユーザに示すための表示手段、12は翻訳すべきテ
キストやキー概念抽出対象のテキストなど、処理に必要
な情報をユーザが入力するための入力手段を示している
本実施例では、第1の実施例と同様シこ、翻訳用の辞書
として対訳辞書形式の辞書を用いる場合を例として説明
する。
次に、本実施例の処理動作について説明する。
第12図は、未実施例によるキー概念抽出と翻訳処理、
及びユーザ辞書作成処理の方式を示すフロチャートであ
る。
(ステップ1201.1202.1203)まず制御手
段7cは、ユーザに対して、キー概念抽出・翻訳処理・
ユーザ辞書作成処理のうちどの処理を行うのか、表示手
段11を1して尋ねる。
以下では、と記3つの処理の内容について詳細↓こ説明
する。
(ステップ1204) ユーザがキー概念抽出処理を指示すると、制御手段7c
は、キー概念抽出に必要なテキストと辞書の指定を、ユ
ーザに対して要求する。
ユーザは、自分の目的に合わせて、翻訳すべきテキスト
と同じ襟な内容を記述したテキストを指定する。この場
合、第1の実施例と異なり、指定するテキストは目標言
語で記述している必要はなく、他の言語であっても良い
。但じ、以下で説明いるキー概念抽出処理に必要な辞書
やシソーラス、及び不要語ファイルなどのデータ、形態
素解析などの処理機能は、その言語に応じて用意してお
く必要がある。本実施例で二よ、翻訳対象言語である英
語で記述されたテキストを指定じだ場合を例として説明
する。
ユーザが、入力手段12から、キー概念抽出用のテキス
トと辞書を指定すると、次に制御手段7cは、その情報
をキー概念抽出手段15↓こ転送し、キー概念抽出処理
を起動する。
(ステップ1205> 第14図は、キー概念抽出処理とキー概念を用いた翻訳
処理を説明するための説明図である。
第14図において、キー概念テープを生成するまでの処
理をキー概念抽出手段15が行う。
次に、キー概念抽出処理について、第14図を基に説明
する。以下に説明するように、キー概念抽出処理は、形
態素解析処理と不要語削除処理、及び概念抽出処理によ
って構成されている。
第14図において、キーワードテーブルが生成されるま
での、形態素解析処理と不要語削除処理は、第1の実施
例で説明した処理と同じ処理である。
但し、本実施例で1よ、英語で記述されたテキストから
キーワードを抽出することになるので、辞書や不要語フ
ァイルのデータと形態素解析の方法は英語を対象とした
ちのである点が異なる。
不要語の候補としては、英語においては、’thej、
r aJなどの冠詞や、接続詞、前置詞、代名詞などが
考えられるが、ユーザは、目的に応じて任意に設定する
ことが可能である。
キーワードテーブルが生成されると、次にキー概念抽出
手段15は、シ゛/−ラス5Cを検索することによって
キーとなる概念を抽出する。つまり、キーワードのまま
では、言語に依存する単語の意味の曖昧さが残った状態
であるから、この曖昧さを解消し、指定されたテキスト
の中でキーワードが持つ意味(概念)を決定する。
第15図は、単語や概念の意味関係を表すシソーラス5
Cとキーワードテーブルに設定されたキーワードとの関
係を示す図である。単語から概念へのポインタは、第1
6図で示すようなシソーラスの情報から決定される。
例えば、英単語’ genera t ion Jは、
概念[GENE1?ATTONI ]とrGENERA
TTON2 ]に対応する2つの語義を持つ単語である
ということを示している。
概念[GENERATTONl ]と[GENERAT
TO〜2]は、それぞれ日本語では1世代」と「生成」
に対応している。尚、概念を表す記号は、図では大文字
のアルファへ一′トと数字を用いて便宜通に表現してい
る。
複数の語Mを持つキーワーにカ・あ、正・−〇語義に対
応する概念を決定する方法は、第1の実施例で説明した
関連語抽出処理と同様の方法を用いる。
つまり、複数のキーワードからポイントされる概念間の
意味関係で一貫性が取れるような概念を抽出する。
例えば、シソーラス上の任意の2つのll!を念間に、
その意味関係の強さを定義しておく。この意味関係の強
さを与える関数をfとすると、概念ci とcjの意味
関係の強きは、 f  (ci、cj)   (=f  (cj、ci)
)で与えられる。また、 キーワードの集合を に= (kl 、  k2 、−−−−、  kn 1
キーワードkiの語義に対応する(相当する)概念の集
合Ciを Ci −(cil、  ci2.−−−−、  cim
lキーワードの語義に対応する(相当する)概念の組合
せの集合Sを S = C1x C2x−−−−−−Y Cn(= (
sl 、  92 、−−−−、  s el )とす
る、Sの要素は、各キーワードの語義に対応する概念の
組合せである。このSの要素をsk= (ckl 、c
k2.−−−、ckn )とすると、skにおける概念
間の意味関係の強さの総和lは、 ■ =      Σ       f  (Cki、
c  kj)cki、ckjecsk、  i≠j 但しC3k−(c kl 、  c k2 、−−−、
  c kn )と定義できる。そして、Sのすべての
要素に対して1を求め、その最大値を与えるSの要素、
つまり概念の組合せを選択するようにすればよい。
例えば、第15図に8いて、キーワードが’gener
ationjと’analysisjだけだとすると、
S = f(GENERATTONl、 ANALYS
IS) 。
(GENERATTON2. A’!ALYSIS) 
1となる。第15図のノソーラスでは、[GENERA
TTONl ]より[GENERATTON2 ]のほ
うが[ANALYSIS]との意味関係が強いので、■
:ま後者の組合せが大きくなる。したがって、キー概念
としては、[GEすEI?ATTO〜2]と[ANAL
YSIS]が選択される。
以上の方法で、キーワードと同じ個数のキー概念を抽出
することが可能である。
より多(のキー概念を抽出するためには、上述の方法で
抽出した概念に対して、あらかじめ設定した閾値より強
い意味関係を持つ概念を抽出するようにすればよい。第
15図の例では、概念空間1で示す範囲の、キー概念と
意味関係の強い自然言語処理や言語学関係の概念が抽出
できるようになる。
キー概念の優先度を設定する場合は、キーワードの優先
度と概念間の意味関係の強さから算出するようにすれば
よい。
例えば、キーワードから直接ポイントされるキー概念の
優先度はキーワードの優先度と等しいとし、また、キー
概念の関連概念の優先度は、その概念間の意味関係の強
さに比例する係数をキー概念の優先度に掛けて求めるよ
うにすることができる。
(ステップ1206) 次に、キー概念抽出処理が終了すると、キー概念抽出手
段】5は、制御手段7cを通して、抽出したキー概念を
キー概念ファイル15に蓄積するか否かを、ユーザに確
認する。
(ステップ1207) 蓄積する場合は、抽出したキー概念をキー概念テーブル
にまとめ、検索のためのコードとともにキー概念ファイ
ル16に蓄積する。したがって、後で説明する翻訳処理
やユーザ辞書作成処理においてキー概念を用いるとき、
キー概念ファ・イル16に蓄積したキー概念を、ユーザ
の指定に応じて何度も使用することが可能である。
ステップ1206で、蓄積したい場合は、抽出したキー
概念は、新たにキー概念抽出処理が起動されたり、ユー
ザによって消去の指示が出されない限り、全体の処理が
終了するまでバッファ領域に記憶される。
(ステップ1216) 以上でキー概念処理が終了する。制御手段7cは、ユー
ザに対して処理の終了のfII!認を行い、終了したい
場合には、ステップ120口こもどり、ユーザに処理の
選択を指示する。
以上のキー概念抽出処理に対しで、第1の実施例の第4
図で示したような、ユーザによるキーワードおよびキー
概念のwI集処理を追加することも可能である。
次に、ステップ1202で翻訳処理を指示した場合につ
いて説明する。
(1208) まず制御手段7cは、ユーザに刺して、翻訳すべきテキ
ストと翻訳に用いる辞書、及びキー概念テーブルの指示
を要求する。本実施例では、英語で記述されたテキスト
を指定する。ユーザは、テキストファイル1に蓄積され
たテキストを指定しても良いし、入力手段12から直接
テキストを入力しても良い。
また、第1の実施例と同様に、直前にキー概念抽出を行
った場合には、キー概念テーブルは指定したくても良い
。キー概念テーブルを措定した場合は、バッファ領域の
キー概念テーブルとマージするか、バッファ領域を更新
するかはユーザの選択2こよってどちらも可能である。
(ステップ!209) 次に制御手段7cは、ユーザが人力しだ情報を翻訳手段
8cに転送し、翻訳処理を起動する。
まず、翻訳手段8cは、ユーザが指定した翻訳テキスト
から1文読み込む。
(ステップ12]0) 次に、第1の実施例と同様に、辞書検索・形態素解析を
行い、文を単語列に分割する。
形態素解析が終了すると、翻訳中の文は単語ごとに分割
され、各単語に対しで辞書情報が読み込まれた状態にな
っている。
(ステップ1211) 次に、翻訳手段8c4よ、辞書検索で読み込まれた辞書
m報の中で、キー概念テーブルに設定されているキー概
念と一致する語義を持つ単語がないかどうかi認し、あ
れば、キー概念テーブルに設定されている優先度を基に
、各語義の優先宴を変更する。
例えば、第14図では、英嘆語’generation
」に対して、[GIJERATTOン1]と[GENE
RATTO〜2]の2つの語義が設定さnているが、キ
ー概念チーフルに[GFJERATTO〜2]が優先度
100で登録されているため、このキー概念の優先度に
したがって、語義[GENER,ITTON2 ]の優
先度が変更される。したがって、このキー概念テーブル
[GENERATTONl ]というキー概念が登録さ
れていないか、登録されていても、優先度が[GE!I
ERATTON2 ]より小さければ、このキー概念テ
ーブルを用いた翻訳処理の中では、語義[GENERA
TTON2 ]の方が優先され、結果として、訳語「生
成」の方が優先して選択されることになる。
また、辞書情報中の語義に、あらかじめ優先度が設定さ
れている場合には、語義とそれに一致するキー概念の優
先度を加電するなどして合成することにより、新たな語
義の優先度とすることも可能である。
(ステ・ツブ1212) 次に、以上の処理で語義の優先度を変更した辞書情報を
基に、翻訳規則ファイル2に蓄積された翻訳規則を通用
して、翻訳処理を行う。この際、翻訳処理の方法によっ
ては、シソーラス5Cの情報を用いることも可能である
。具体的な翻訳処理の方法は、本発明では特定したい。
ただし、緒訳処理の過程で、ある単語の語義の候補が複
数残った際に、ステップ1211で設定した語義の優先
度を用いることによって、翻訳テキストに通した、尤も
らしい語義を選択することが可能である。
例えば第14図では、入力文’Text genera
tionis another difficult 
1ssue、 Jにおいて、英単語’generati
on」の語義の候補を1つに絞り込めなかった場合、キ
ー概念として抽出された[GENERATTON2 ]
という語義を優先することにより、「テキスト生成は、
もう1つの難しい問題である。jという正解釈を得るこ
とができる。
(ステップ1213) 次に、翻訳処理が終了すると、他に翻訳すべき文が残っ
ていないか確認し、あれば、ステップ12094こもど
り、上述の処理を繰り返す。残っていなければ、翻訳処
理を終了する。
(ステップ1216) 次に制御手段7cは、処理を終了するか否かをユーザに
rIvL認し、終了したい場合はステップ1201にも
どり、ユーザに処理の選択を指示する。
次にステップ1203でユーザ辞書の作成が指示された
場合について説明する。
第17図は、キー概念抽出処理とユーザ辞書作成処理を
説明するための処理概念図である。第17Mのキー概念
抽出処理についではすでに第14図で説明した。ユーザ
辞書作成処理では、第2の実施例と同し様な考え方で、
キー概念テーブルの情報を基に、基本辞書の情報の中か
ら、翻訳テキストに適した情報を抽出し、ユーザ辞書を
作成する。
(ステップ1214) ユーザが制御手段7cに辞書作成を指示すると、制御手
段7cは、ユーザ辞書作成に必要な基本辞書とキー概念
テーブルの指定を、ユーザに対して要求する。ユーザは
、翻訳対象のテキストの内容に合わせて、キー概念テー
ブルと基本辞霜を指定する。
(ステップ1215) 次に制御手段7cは、ユーザが入力した情報を辞書作成
手段13cに転送し、辞書作成処理を起動する。
第18図は、キー概念抽出結果からユーザ辞書を作成す
る方式を示すフローチャートである。
(ステップ1801) 次に、第18図を基に、辞書作成処理(ステップ122
5)の詳細について説明する。辞書作成処理が起動され
ると、辞書作成手段13cは、まず制御手段7cから送
られてきたキー概念テーブルの中から概念を一つ選択す
る。
(ステップ1802) 次に辞書作成手段13cは、キー概念を語義として持つ
、翻訳対象言語の見出し語と辞書情報を検索する。特定
の語義を持つ見出し語を検索するためには、1nver
ted fileを作成してお−すばよい。
(ステップ2803) ある特定の語義を持つ見出し語は、一般に複数存在する
ため、以下の処理を検索されたすべての見出仁2語に対
して行う。
(ステップ18031 ) まず、辞書作成手段13c↓ま、その見出し語が複数の
語義を持つかどうか確認する。
(ステップ18032 ) 複数の語義を持つ場合は、キー概念と語義が一致する辞
書情報のみを抽出する。語義が1つしかない場合には、
概念レベルで曖昧さがないので、ユーザ辞書に登録する
必要はない。
(ステップ18033 ’) 次に辞書作成手段13cは、抽出した辞書情報を制御手
段7CfiI!して表示手段11に表示し、ユーザに確
認を求める。ユーザーよ、指示された見出し語の辞書情
報を、その特定の語義に限定してよいか確認する。
(ステップ18034 ) 表示手段11に表示された通りで良い場合には、その情
報がユーザ辞書に登録される。
スキップ18033で辞書作成手段13cの作成した結
果が不適切である場合に、ユーザ辞書−\の登録を中止
するか、ま1こは、編集手段10cを起動して、辞書作
成結果をユーザが修正し、修正した辞書情報をユーザ辞
書に登録することも可能である。
(ステップ1804) 以上の処理によって、指定されたキー概念を語義として
持つ見出し語に対するユーザ辞書作成処理が終了する。
辞書作成手段13cは、以上説明したユーザ辞書作成処
理(ステップ1801〜1804)をキー概念テーブル
のすべてのキー概念に対して繰り返す。
以上の処理によって、ユーザ辞書の作成処理が終了する
。第17図では、英日対訳辞書の名詞’geriera
tionJの辞書情報が、キー概念[GEJERATT
ON2 ]によって訳語「作成Jに対応する辞書情報の
みに限定され、ユーザ辞書の情報として登録されている
6 (ステップ1216) 弊害作成処理がP7すると、制御011−段”Cは、処
理を終了するかどうかユーザC二確認°−1終了したい
場合は、第12図のステツー+’ + 201 にちこ
り、ユーザに処理選択を指示する。
以上説明したごとく、未実施例シこよnぼ、ユーザは、
翻訳すべきテキストと類似の内容を記述した同じ分野の
テキストを用意して8二すば、システムが、そのテキス
トからキー概念を抽出し、翻訳テキストに通するように
辞書情報由の訳語の優先度を変更してくれるので、翻訳
テキストに通した訳し分けが可能になる。また、抽出′
、、たキー概念をキー概念ファイル16に蓄積してお−
すば、同じ分野のテキストを再度翻訳するときに、利用
することが可能である。
キー概念抽出について:よ、第1の実施例と比較して、
言語に依存する辞書や不要語ファイルなどのデータおよ
び形態素処理機能さえ用意しておけば、キー概念を抽出
するための子ホストは、翻訳対象と1(以の内容を記述
した同ソ分野のテキストというだけで、記述言語に関す
る制約がないというfl+へかある。
つまり、記述言語に関係なく入手可能な類似テキストを
キー概念抽出処理に通用することにより、より豊iなモ
ー概念を抽出することが可能になる。
l−たがって、翻訳対象のテキスト自体からキー概念を
抽出するということも可能である。この場合、テキスト
に出現する単語の連想関係から、単語ごとの書味に一貫
性があるように、予め曖昧さを解消しておいてから、翻
訳処理を行うというプロセスになる。
また、本実施例で説明した機械翻訳システムは、辞書作
成手段を備えているので、キー概念を用いた翻訳結果が
望ましいと確認できた場合は、同じキー概念を用いて翻
訳用のユーザ辞書を作成することが可能である。ユーザ
辞書は、あるかしめ翻訳対象領域の特性に合わせて単語
の曖昧さが解消された形になっているので、それを翻訳
に用いれば、より効果的な翻訳処理が可能となる。
本実施例では、i駅用の辞書として対訳辞書を用いる場
合を例として説明したが、中間言語方式で、単一言語辞
書しか用いない場合にも同様に適用可能である。
つまり中間言語方式で二よ、解析用辞書で、翻訳対象言
語の単語から概念への対応を規定するが、ある翻訳対象
言語の単語に対して複数の概念が対応している場合、キ
ー概念と一致する語義(概念)があれば、その語義の優
先度を上げること↓こよって、翻訳処理における曖昧さ
の解消に利用することができる。また、ユーザ辞書の作
成は、前記単語の辞書情報から、キー概念と一致する語
義に対応する情報を抽出してユーザ辞書に登録するよう
にすれば、解析用のユーザ辞書が作成できる。
したがって、中間言語方式の翻訳処理に適用する場合、
本実施例の変型として、第1の実施例と第2の実施例に
よる、目標言語のキーワードを利用した翻訳処理とユー
ザ辞書作成処理とを組合せることも考えられる。
つまり、第3の実施例の方法で、解析辞書における翻訳
対象言語の単語の概念レベルの曖昧さをキー概念を用い
て解消し、第1の実施例の方法で、生成用辞書に登録し
ている概念に、複数の目噸言語の単語が対応していると
いう訳語レベルのy昧さを 目標言語のキーワードを用
いて解消することが可能である。
また、ユーザ辞書を作成する場合は、第3の実施例の方
法で解析用のユーザ辞書、第2の実施例の方法で生成用
のユーザ辞書をそれぞれ作成することが可能である。
以上の方法によって、中間言語方式の翻訳処理の場合も
、対訳辞書を用いる場合と同様の効果を得ることが可能
である。
〔発明の効果〕
以上説明したごとく、本発明によれば、特定の種類のテ
キスト対応にキーワードやキー概念を抽出しておけば、
翻訳処理で解消されない単語の曖昧さが存在しても、キ
ーワードやキー概念が示す特定の訳語や語義を優先して
選択することができるので、テキストの特性に合わせた
翻訳が可能になり、翻訳精度が向上するという効果を奏
する。
また、抽出したキーワードやキー概念をユーザ辞書の作
成にiJI用すれば、特定の挿塀のテキストに通した辞
書が作成可能である。二のユーザ辞書は、特定のテキス
トの特性に合わせて、単語の曖昧さが解消された形にな
っているので、翻訳処理において考慮すべき文の解釈の
可能性の数が少なくなり、高い精度で効率的な翻訳がt
i1能になる。
また、同時にユーザ辞書の作成に必要な人的労力も削減
することが可能であるという効果を奏する。
【図面の簡単な説明】
第1図は本発明の一実施例におけるキーワード抽出と翻
訳処理の方法を示す処理フロー図、第2図は本発明の一
実施例の機械翻訳ンステムのブロック図、第3図はキー
ワード抽出処理とキーワードを用いた翻訳処理を説明す
るための説明図、第NEJハ拡8L、タキーワード処理
を説明するための説明図、第5図はシソーラス中の単語
や概念の意味関係を示した概念図、第6図はシソーラス
のデータの一例を示す構成図、第7図は関連語抽出処理
の方式を示す処理フロー図、第8図は本発明の他の実施
例の機械翻訳システムのブロック図、第9図−よキーワ
ード抽出処理とニー+F辞書作成処哩を説明するための
説明図、第10図はキーワードを用いたユーザ辞書の作
成方式を示す処理フロー図、第11図は拡張したニー+
′辞覆作成処理の方式を示す処理フロー図、・第12図
は本発明の他の実施例−こ2けるキー概念抽出処理・翻
訳処理・ユーザ辞書作成処理の方式を示すフロー図、第
13図は本発明の一実施例の機械翻訳システムのブロッ
ク図、第14図:まキー概念抽出処理とキー概念を用い
た翻訳処理を説明するための説明図、第15図は概念決
定処理を説明するための説明図、第16図はシソーラス
のq−夕の一例を示す構成図、第17図はキー概念抽出
処理とユーザ辞書作成処理を説明するだめの説明図、第
18図はキー概念を用いたユーザ辞書作成処理の方式を
示す処理フロー図である。 1・・・テキストファイル、2・・・翻訳規則ファイル
、3・・・不要語ファイル、4a、4b、4c・・・基
本辞書、5a 、5b 、、5c・・・シソーラス、6
・・・キー概念抽出手段、7a、7b、7c・・・制御
手段、8a 、  8b 、  8cm翻訳手段、9a
 、  9b −・・キーワード抽出手段、loa 、
 10b 、 lOc・・・編集手段、目・・・表示手
段、12・・・入力手段、13b 、 l:1c・・・
辞書作成手段、14b 、 14c・・・ユーザ辞書、
■5・・・キー概念抽出手段、16・・・キー概念ファ
イル。

Claims (1)

  1. 【特許請求の範囲】 1、文法規則と辞書情報を用いて第1言語のテキストを
    第2言語の翻訳文に翻訳する機械翻訳方法において、前
    記第1言語のテキストと同一または類似の分野で第2言
    語により記述されたテキストから第2言語のキーワード
    を抽出するキーワード抽出ステツプと、翻訳処理で第1
    言語に対応する訳語が複数あるとき、前記キーワード抽
    出ステツプで抽出されたキーワードに一致する訳語を優
    先的に選択使用する翻訳ステツプを備えたことを特徴と
    する機械翻訳方法。 2、前記キーワード抽出ステツプは、 翻訳対象分野に応じて、翻訳すべき第1言語のテキスト
    と類似の内容を第2言語で記述したテキスト及びキーワ
    ード抽出処理用の辞書を指定するステツプと、 前記指定した第2言語のテキストを前記キーワード抽出
    処理用の辞書により形態素解析し、単語列に分解するス
    テップと、 前記単語列から、予め設定された、キーワードとして不
    適切な単語、及び、予め定めた閾値よりも小さい出現頻
    度の単語を削除して、第2言語のキーワードを抽出する
    ステップと、 前記抽出される第2言語のキーワードの優先度を、少な
    くとも各単語の出現頻度をもとに算出するステツプと、 抽出された翻訳対象分野のキーワードをまとめてキーワ
    ードフアイルに蓄積するステツプとを有していることを
    特徴とする請求項1記載の機械翻訳方法。 3、前記翻訳ステツプは、 少なくとも、翻訳すべき第1言語のテキスト、及び、前
    記キーワード抽出ステップで抽出された翻訳対象分野の
    第2言語のキーワードの集合を、指定するステツプと、 前記第1言語のテキストから1文ずつ読み込み、辞書を
    検索して形態解析を行い、単語列に分解するステップと
    、 該単語列中に、前記第2言語のキーワード集合中のキー
    ワードに一致する訳語を持つ第1言語の単語があるとき
    、この訳語をこの単語の訳として優先させるように該単
    語の訳語優先度を変更するステツプと、 該訳語優先度を利用して第1言語の文の翻訳を行うステ
    ツプとを有していることを特徴とする請求項1または2
    記載の機械翻訳方法。 4、前記訳語優先度は、前記第2言語のキーワード集合
    中のキーワードに一致する訳語を優先させるように、か
    つ、前記キーワード抽出ステツプで出現頻度をもとに算
    出したキーワードの優先度に基づいて、定めたことを特
    徴とする請求項3記載の機械翻訳方法。 5、前記第2言語で記述された翻訳対象分野のテキスト
    から抽出したキーワードに対し、該キーワードをキーと
    してシソーラスを参照して該キーワードと意味関係を持
    つ関連語を検索し、該関連語もキーワードとして前記テ
    キストから抽出したキーワードに付加するステツプを追
    加したことを特徴とする請求項1ないし4のいずれか1
    記載の機械翻訳方法。 6、第2言語で記述された翻訳対象分野のテキストから
    抽出したキーワード、及び、シソーラスから検索したキ
    ーワードに対し、更にユーザ入力部からキーワードを追
    加・修正・削除するステツプと、 これらのキーワードをまとめ、検索のためのコードを付
    与してキーワード用のフアイルに蓄積するステツプとを
    更に具備し、 また、前記第1言語の単語の訳語の優先度を変更するス
    テツプにおいて、テキストから抽出したキーワードだけ
    でなく、前記キーワード用のフアイルから、指定された
    キーワードも抽出して用いることを特徴とする請求項5
    記載の機械翻訳方法。 7、第2言語で記述された翻訳対象分野のテキストから
    抽出したキーワードとシソーラスから検索したキーワー
    ド、もしくは、キーワード用のファイルから検索したキ
    ーワード、またはこれらのキーワードを基に、翻訳用の
    基本辞書の見出し語のうち、前記キーワードに含まれる
    単語と一致する訳語を持つ見出し語の辞書情報から、該
    訳語に対応する辞書情報のみを抽出し、ユーザ辞書の情
    報として登録するユーザ辞書作成ステツプを更に具備し
    たことを特徴とする請求項6記載の機械翻訳方法。 8、第1言語で記述した翻訳対象テキストと類似の内容
    を記述した第1言語のテキストを形態素解析することに
    よつて単語列に分割する第1のステツプと、 該単語列に含まれる単語から、予め設定しておいた第1
    言語の不要語と、予め定めた閾値より小さい出現頻度の
    単語を削除して、第1言語におけるキーワードを抽出す
    る第2のステツプと、 前記第1言語のキーワードをキーとしてシソーラスを検
    索し、該キーワードと意味関係を持つ単語である関連語
    をキーワードとして追加する第3のステツプと、 前記第2および第3のステツプによつて抽出された第1
    言語のキーワードに対し、ユーザ入力部からキーワード
    を追加・修正・削除する第4のステップと、 第2言語のキーワードを基にユーザ辞書に登録する情報
    を作成するユーザ辞書作成ステツプにおいて、ユーザ辞
    書に登録する見出し語を、前記第1ないし第4のステツ
    プを経て抽出された第1言語のキーワードに含まれる単
    語に限定するステツプとを更に具備したことを特徴とす
    る請求項7記載の機械翻訳方法。 9、文法規則、辞書情報およびシソーラスを用いて、第
    1言語で記述した翻訳対象テキストを第2言語で記述し
    た翻訳文に翻訳する機械翻訳装置において、 第2言語のキーワードとして抽出する必要のない単語を
    蓄積した不要語フアイルと、 見出し語に対して、上位−下位関係、部分−全体関係、
    及び連想関係などの意味関係を持つ単語を記憶するシソ
    ーラスと、 前記第1言語で記述した翻訳対象テキストと類似の内容
    を持つ第2言語のテキストを形態素解析することによつ
    て単語列に分割し、該単語列に含まれる単語から、予め
    定めた閾値より小さい出現頻度の単語と前記不要語フア
    イルに登録されている単語を削除することによつて第2
    言語のキーワード(1)を抽出し、さらに、前記シソー
    ラスから検索した、前記キーワード(1)と意味関係を
    持つ単語をキーワード(2)として追加し、前記キーワ
    ード(1)およびキーワード(2)の優先度を算出する
    キーワード(1)および(2)の抽出手段と、前記キー
    ワード(1)および(2)の抽出手段で抽出したキーワ
    ードをまとめ、検索用のコードを付与して蓄積すること
    が可能なキーワードフアイルとを具備し、 前記機械翻訳装置は、更に、第1言語で記述された翻訳
    対象テキストを形態素解析することによつて単語列に分
    割し、該第1言語の単語を見出し語とする辞書情報を検
    索した後で、前記キーワード(1)あるいはキーワード
    (2)に含まれる単語と一致する訳語を持つた第1言語
    の単語が存在すれば、該第1言語の単語の辞書情報のう
    ち、キーワード(1)あるいはキーワード(2)に含ま
    れる単語と一致する訳語の優先度を、前記キーワードの
    優先度に基づいて変更するように構成されていることを
    特徴とする機械翻訳装置。 10、キーワード抽出手段によつて抽出したキーワード
    、もしくは、ユーザ入力部により指定されたキーワード
    フアイル中のキーワード、または、これらのキーワード
    を用いて、翻訳用の基本辞書の見出し語のうち、前記キ
    ーワードに含まれる単語と一致する訳語を持つ見出し語
    の辞書情報から、該訳語に対応する辞書情報のみを抽出
    し、ユーザ辞書の情報として登録することによつてユー
    ザ辞書を作成する手段を具備し、 前記機械翻訳装置は、複数の辞書をアクセスすることが
    可能で、ユーザ辞書と基本辞書の両方をアクセスする場
    合は、前記両方の辞書に登録されている見出し語に対し
    て、ユーザ辞書に登録されている辞書情報を優先して用
    いるように構成されていることを特徴とする請求項9記
    載の機械翻訳装置。 11、文法規則と辞書情報、及びシソーラスを用いて、
    第1言語のテキストを第2言語の翻訳文に翻訳する機械
    翻訳方法において、 指定された特定の種類のテキストから言語独立なキー概
    念を抽出するキー概念抽出ステツプと、 前記第1言語のテキストを翻訳処理する翻訳ステツプと
    を備え、 前記キー概念抽出ステツプは、 前記特定の種類のテキストとして、前記翻訳すべき第1
    言語のテキストと類似の内容を記述した第1言語のテキ
    ストを形態素解析することによつて単語列に分割するス
    テツプと、 該単語列に含まれる単語から、予め設定された不要語お
    よび予め定められた閾値よりも小さい出現頻度の単語を
    削除してキーワードを抽出するステツプと、 抽出されたキーワードをキーとしてシソーラスを検索し
    、該キーワードの上位概念に対応する概念を抽出し、そ
    れをキー概念とするステツプと、 ユーザ入力部からの指示に応じて、前記キー概念をまと
    めて検索用コードを付与し、キー概念用フアイルに蓄積
    するステツプとを具備し、前記翻訳ステツプは、 前記翻訳すべき第1言語のテキストを形態素解析するこ
    とによつて単語列に分割し、辞書情報を検索するステツ
    プと、 前記特定種類のテキストから抽出したキー概念、もしく
    はユーザ入力部からの指示により前記キー概念用ファイ
    ルから検索したキー概念、またはこれら双方のキー概念
    を基に、前記辞書情報検索した第1言語の単語のうち、
    前記キー概念を語義として持つ単語があるとき、該単語
    の語義の優先度を高めるように変更するステツプとを具
    備したことを特徴とする機械翻訳方法。 12、前記キー概念抽出ステツプおよび前記翻訳ステツ
    プに加え、更に、前記キー概念の情報を用いて、キー概
    念を抽出した特定の種類のテキストの翻訳に通したユー
    ザ辞書を作成するユーザ辞書作成処理ステツプを備え、 前記ユーザ辞書作成処理ステツプは、 前記特定の種類のテキストから抽出したキー概念、もし
    くはユーザ入力部からの指示によつて前記キー概念用フ
    アイルから検索したキー概念、またはこれら双方のキー
    概念を基に、翻訳用の基本辞書の見出し語のうち、前記
    キー概念に含まれる概念を語義として持つ見出し語が存
    在するとき、該見出し語の辞書情報から前記語義に対応
    する辞書情報のみを抽出し、ユーザ辞書の情報として登
    録するように構成したことを特徴とする請求項11記載
    の機械翻訳方法。 13、第1言語以外の言語を対象とする辞書と不要語フ
    アイルを含むデータ、及び、第1言語以外の言語で記述
    されたテキストを形態素解析する機能を更に具備し、以
    て、第1言語以外の言語で記述されたテキストからもキ
    ー概念を抽出するように構成したことを特徴とする請求
    項11もしくは12記載の機械翻訳方法。 14、文法規則、辞書情報およびシソーラスを用いて、
    第1言語のテキストを第2言語の翻訳文に翻訳する機械
    翻訳装置において、 第1言語のキーワードとして抽出する必要のない単語を
    蓄積した不要語フアイルと、 見出し語に対して、上位−下位関係、部分−全体関係、
    及び連想関係などの意味関係を持つ単語や概念を記憶す
    るシソーラスと、 翻訳すべき第1言語のテキストと類似の内容を記述した
    特定の種類の第1言語のテキストを形態素解析すること
    によつて単語列に分割し、該単語列に含まれる単語から
    、予め指定された閾値よりも小さい出現頻度の単語と前
    記不要語フアイルに登録されている単語を削除すること
    によつて第1言語のキーワードを抽出し、該キーワード
    の優先度を算出し、 さらに、前記キーワードをキーとしてシソーラスを検索
    し、キーワードの上位概念に対応する概念をキー概念と
    して抽出し、該キー概念の優先度を算出するように構成
    されているキー概念抽出手段と、 前記キー概念抽出手段で抽出したキー概念をまとめ、検
    索コードを付与して蓄積することが可能なキー概念ファ
    イルと、 翻訳手段とを具備し、 前記翻訳手段は、第1言語で記述された翻訳対象テキス
    トを形態素解析することによつて単語列に分割し、該第
    1言語の単語を見出し語とする辞書情報を検索した後で
    、前記キー概念に含まれる概念と一致する語義を持つた
    第1言語の単語が存在するとき、該第1言語の単語の辞
    書情報のうち、キー概念に含まれる概念と一致する語義
    の優先度を、キー概念の優先度に基づいて変更するよう
    に構成されていることを特徴とする機械翻訳装置。 15、第1言語以外の言語である第3言語を対象とする
    辞書と、 第3言語のキーワードとして抽出する必要のない単語を
    蓄積した第3言語の不要語フアイルと、 第3言語の単語からも、該単語と上位−下位関係、部分
    −全体関係、及び連想関係などの意味関係を持つ単語や
    概念を検索できるようにしたシソーラスとを具備し、 前記キー概念抽出手段は、第3言語のテキストからもキ
    ー概念を抽出することができるように、 第3言語のテキストを形態素解析することによつて単語
    列に分割し、該単語列に含まれる単語から、予め指定さ
    れた閾値より小さい出現頻度の単語と前記第3単語の不
    要語フアイルに登録されている単語とを削除することに
    よつて第3言語のキーワードを抽出し、該キーワードの
    優先度を算出し、 さらに、前記キーワードをキーとしてシソーラスを検索
    し、キーワードの上位概念に対応する概念をキー概念と
    して抽出し、該キー概念の優先度を算出する機能を具備
    したことを特徴とする請求項14記載の機械翻訳装置。 16、キー概念抽出手段によつて抽出したキー概念、も
    しくは、ユーザ入力部から指定されたキー概念フアイル
    中のキー概念、または、これらのキー概念を用いて翻訳
    用の基本辞書の見出し語のうち、前記キー概念に含まれ
    る概念と一致する語義を持つ見出し語の辞書情報から、
    該語義に対応する辞書情報のみを抽出し、ユーザ辞書の
    情報として登録することによつてユーザ辞書を作成する
    ユーザ辞書作成手段を具備し、 前記機械翻訳装置は、複数の辞書をアクセスすることが
    可能で、ユーザ辞書と基本辞書の双方をアクセスする場
    合は、前記双方の辞書に登録されている見出し語に対し
    て、ユーザ辞書に登録されている辞書情報を優先して用
    いるように構成されていることを特徴とする請求項15
    記載の機械翻訳装置。 17、第1言語に関する辞書情報を蓄積した基本辞書か
    ら、必要な情報を抽出することによつてユーザ辞書を作
    成する辞書作成装置において、第1言語のキーワードと
    して抽出する必要のない単語を蓄積した不要語フアイル
    と、 見出し語に対して、上位−下位関係、部分−全体関係、
    及び連想関係などの意味関係を持つ単語や概念を記憶す
    るシソーラスと、 翻訳すべき第1言語のテキストと類似の内容を記述した
    特定の種類の第1言語のテキストを形態素解析すること
    によつて単語列に分割し、該単語列に含まれる単語から
    、予め指定された閾値より小さい出現頻度の単語と前記
    不要語フアイルに登録されている単語とを削除すること
    によつて第1言語のキーワードを抽出し、該キーワード
    の優先度を算出し、 さらに、前記キーワードをキーとしてシソーラスを検索
    し、キーワードの上位概念に対応する概念をキー概念と
    して抽出し、該キー概念の優先度を算出するように構成
    されているキー概念抽出手段と、 前記キー概念抽出手段で抽出したキー概念をまとめ、検
    索コードを付与して蓄積することが可能なキー概念フア
    イルとを具備し、 前記辞書作成装置は、 キー概念抽出手段によつて抽出したキー概念、もしくは
    、ユーザか指定したキー概念フアイル中のキー概念、ま
    たは、前記両方のキー概念を用いて、基本辞書の見出し
    語のうち、前記キー概念に含まれる概念と一致する語義
    を持つ見出し語の辞書情報から、該語義に対応する辞書
    情報のみを抽出し、ユーザ辞書の情報として登録するよ
    うに構成したことを特徴とする辞書作成装置。 18、第1言語以外の言語である第2言語を対象とする
    辞書と、 第2言語にキーワードとして抽出する必要のない単語を
    蓄積した第2言語の不要語フアイルと、 第2言語の単語からも、該単語と上位−下位関係、部分
    −全体関係、及び連想関係などの意味関係を持つ単語や
    概念を検索できるようにしたシソーラスとを具備し、 前記キー概念抽出手段は、第2言語のテキストからもキ
    ー概念を抽出することができるように、 第2言語のテキストを形態素解析することによつて単語
    列に分割し、該単語列に含まれる単語から、ユーザが指
    定した閾値より小さい出現頻度の単語と前記第2言語の
    不要語フアイルに登録されている単語を削除することに
    よつて第2言語のキーワードを抽出し、該キーワードの
    優先度を算出し、 さらに、前記キーワードをキーとしてシソーラスを検索
    し、キーワードの上位概念に対応する概念をキー概念と
    して抽出し、該キー概念の優先度を算出する機能を追加
    したことを特徴とする請求項17記載の辞書作成装置。 19、文法規則とシソーラス、及び解析用辞書と生成用
    辞書の2種類の辞書を用いて、第1言語のテキストを第
    2言語のテキストに翻訳する中間言語方式の機械翻訳方
    法において、 翻訳すべき第1言語のテキストと類似の内容を第2言語
    で記述したテキストを形態素解析し、単語列に分割する
    ステツプと、 該単語列に含まれる単語から、予め設定しておいた不要
    語と予め定めた閾値より小さい出現頻度の単語とを削除
    して、第2言語におけるキーワードを抽出するステツプ
    と、 前記抽出した第2言語のキーワードの優先度を算出する
    ステツプと、 第2言語で記述されたテキストから抽出したキーワード
    に対し、該キーワードをキーとしてシソーラスを参照し
    、該キーワードと意味関係を持つ単語を検索し、キーワ
    ードとして加えるステツプと、 第2言語で記述されたテキストから抽出したキーワード
    、及び、シソーラスから検索したキーワードに対し、指
    定したキーワードを追加・修正・削除するステツプと、 ユーザ入力部からの指示に応じて前記両キーワードをま
    とめ、検索のためのコードを付与してキーワード用のフ
    アイルに蓄積するステツプとを具備し、 かつ、翻訳処理において、中間言語のある概念に対応す
    る第2言語の単語(訳語)を生成用の辞書から検索する
    際に、前記第2言語のテキストおよびシソーラスから抽
    出したキーワードと一致する第2言語の単語があれば、
    該第2言語の単語の優先度を高めるように変更するステ
    ツプを有することを特徴とする機械翻訳方法。 20、前記第2言語で記述されたテキストから抽出した
    キーワードとシソーラスから検索したキーワード、もし
    くは、ユーザの指示によつてキーワード用のフアイルか
    ら検索したキーワード、またはこれらのキーワードを基
    に、前記キーワードに含まれる第2言語の単語を訳語と
    してもつ概念を見出し語とする生成用辞書の情報から、
    該訳語に対応する辞書情報のみを抽出し、生成用のユー
    ザ辞書の情報として登録するステツプを追加した、生成
    用ユーザ辞書作成機能付きの請求項19記載の機械翻訳
    方法。 21、中間言語方式の機械翻訳方法であつて、翻訳用の
    対訳辞書に代えて、解析用辞書と生成用辞書の2種類の
    辞書を備え、翻訳処理において第1言語の単語をキーと
    して検索し、キー概念を用いて語義の優先度を変更する
    辞書、及び、ユーザ辞書の作成対象となる基本辞書は、
    解析用辞書であることを特徴とする請求項13記載の機
    械翻訳方法。 22、文法規則とシソーラス、及び解析用辞書と生成用
    辞書の2種類の辞書を用いて、第1言語のテキストを第
    2言語の翻訳文に翻訳する中間言語方式の機械翻訳装置
    において、 少なくとも、不要語フアイル、シソーラス、キーワード
    抽出手段、キーワードフアイル、キー概念抽出手段、キ
    ー概念フアイル、生成用ユーザ辞書作成手段、及び解析
    用ユーザ辞書作成手段とを具備しており、 前記不要語フアイルは、第1言語および第2言語のキー
    ワードとして抽出する必要のない単語を蓄積するように
    構成され、 前記シソーラスは、見出し語に対して、上位−下位関係
    、部分−全体関係、及び連想関係などの意味関係を持つ
    単語や概念を記憶しており、前記キーワード抽出手段は
    、 前記第1言語のテキストと類似の内容を記述した第2言
    語のテキストを形態素解析することによつて単語列に分
    割し、該単語列に含まれる単語から、予め指定された閾
    値より小さい出現頻度の単語と前記不要語フアイルに登
    録されている単語とを削除することによつて第2言語の
    キーワード(1)を抽出し、さらに、前記シソーラスか
    ら検索した、前記キーワード(1)と意味関係を持つ単
    語をキーワード(2)として追加し、前記キーワード(
    1)およびキーワード(2)の優先度を算出するように
    構成されており、 前記キーワードフアイルは、 前記キーワード抽出手段で抽出したキーワードをまとめ
    、検索用のコードを付与して蓄積することが可能なよう
    に構成されており、 前記キー概念抽出手段は、 翻訳すべき第1言語のテキストと類似の内容を記述した
    第1言語のテキストを形態素解析することによつて単語
    列に分割し、該単語列に含まれる単語から、予め指定さ
    れた閾値より小さい出現頻度の単語と前記不要語フアイ
    ルに登録されている単語を削除することによつて第1言
    語のキーワードを抽出し、該キーワードの優先度を算出
    し、 さらに、前記キーワードをキーとしてシソーラスを検索
    し、キーワードの上位概念に対応する概念をキー概念と
    して抽出し、該キー概念の優先度を算出するように構成
    されており、 前記キー概念フアイルは、 前記キー概念抽出手段で抽出したキー概念をまとめ、検
    索コードを付与して蓄積することが可能なように構成さ
    れており、 前記生成用ユーザ辞書作成手段は、 前記キーワード抽出手段を用いて抽出したキーワード、
    もしくは、指定されたキーワードフアイル中のキーワー
    ド、または、これらのキーワードを用いて、該キーワー
    ドに含まれる第2言語の単語を訳語としてもつ概念を見
    出し語とする生成用辞書の情報から、該訳語に対応する
    辞書情報のみを抽出し、生成用のユーザ辞書の情報とし
    て登録するように構成され、 前記解析用ユーザ辞書作成手段は、 前記キー概念抽出手段によつて抽出したキー概念、もし
    くは、予め指定されたキー概念フアイル中のキー概念、
    または、前記双方のキー概念を用いて、解析用辞書の第
    1言語の単語の見出し語のうち、前記キー概念に含まれ
    る概念と一致する語義を持つ見出し語の解析用辞書の情
    報から、該語義に対応する辞書情報のみを抽出し、解析
    用のユーザ辞書の情報として登録するように構成され、 前記機械翻訳装置は、 翻訳処理において、第1言語の単語に対応する概念を解
    析用辞書から検索する際に、ユーザ入力部により指定さ
    れたキー概念に含まれる概念と一致する語義を持つてい
    れば、該語義の優先度をキー概念の優先度に基づいて変
    更し、概念に対応する第2言語の単語(訳語)を生成用
    辞書から検索する際には、ユーザ入力部により指定され
    た第2言語のキーワードに含まれる単語と一致する訳語
    があれば、該訳語の優先度をキーワードの優先度に基づ
    いて変更するように構成されており、 さらに、前記機械翻訳装置は、同時に複数種類の辞書を
    アクセスすることが可能で、解析用ユーザ辞書と解析用
    基本辞書の両方をアクセスする場合、及び、生成用ユー
    ザ辞書と生成用基本辞書の両方をアクセスする場合は、
    それぞれユーザ辞書・基本辞書の両方の辞書に登録され
    ている見出し語に対して、ユーザ辞書に登録されている
    辞書情報を優先して用いるように構成したことを特徴と
    する機械翻訳装置。 23、第1言語以外の言語である第3言語を対象とする
    辞書と、 第3言語のキーワードとして抽出する必要のない単語を
    蓄積した第3言語の不要語フアイル第3言語の単語から
    も、該単語と上位−下位関係、部分−全体関係、及び連
    想関係などの意味関係を持つ単語や概念を検索できるよ
    うにしたシソーラスとを具備し、 キー概念抽出手段は、第3言語のテキストからもキー概
    念を抽出することができるように、第3言語のテキスト
    を形態素解析することによつて単語列に分割し、該単語
    列に含まれる単語から、ユーザ入力部により指定された
    閾値より小さい出現頻度の単語と前記第3言語の不要語
    フアイルに登録されている単語を削除することによつて
    第3言語のキーワードを抽出し、該キーワードの優先度
    を算出し、 さらに、前記キーワードをキーとしてシソーラスを検索
    し、キーワードの上位概念に対応する概念をキー概念と
    して抽出し、該キー概念の優先度を算出する機能を具備
    したことを特徴とする請求項22記載の機械翻訳装置。
JP2071857A 1990-03-23 1990-03-23 機械翻訳方法及び装置 Pending JPH03273360A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2071857A JPH03273360A (ja) 1990-03-23 1990-03-23 機械翻訳方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2071857A JPH03273360A (ja) 1990-03-23 1990-03-23 機械翻訳方法及び装置

Publications (1)

Publication Number Publication Date
JPH03273360A true JPH03273360A (ja) 1991-12-04

Family

ID=13472619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2071857A Pending JPH03273360A (ja) 1990-03-23 1990-03-23 機械翻訳方法及び装置

Country Status (1)

Country Link
JP (1) JPH03273360A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011651A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 文書処理装置
JP2010072963A (ja) * 2008-09-18 2010-04-02 Yahoo Japan Corp 広告入札用語句提案装置、広告入札用語句提案システムおよび広告入札用語句提案方法
CN103324646A (zh) * 2012-03-19 2013-09-25 株式会社东芝 检索支援装置及检索支援方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011651A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 文書処理装置
JP2010072963A (ja) * 2008-09-18 2010-04-02 Yahoo Japan Corp 広告入札用語句提案装置、広告入札用語句提案システムおよび広告入札用語句提案方法
CN103324646A (zh) * 2012-03-19 2013-09-25 株式会社东芝 检索支援装置及检索支援方法
JP2013196358A (ja) * 2012-03-19 2013-09-30 Toshiba Corp 検索支援装置および検索支援方法
CN103324646B (zh) * 2012-03-19 2017-03-01 株式会社东芝 检索支援装置及检索支援方法

Similar Documents

Publication Publication Date Title
KR920003498B1 (ko) 자연언어 처리방법 및 장치
JP2783558B2 (ja) 要約生成方法および要約生成装置
EP0645720B1 (en) Dictionary creation supporting system
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
KR20170106308A (ko) 어노테이션 보조 장치 및 그것을 위한 컴퓨터 프로그램
JPH05151260A (ja) 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JPH0567144A (ja) 前編集支援方法およびその装置
Belkebir et al. TALAA-ATSF: a global operation-based arabic text summarization framework
US5283737A (en) Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
EP0118187B1 (en) Menu-based natural language understanding system
JPH10312382A (ja) 類似用例翻訳システム
JPH03273360A (ja) 機械翻訳方法及び装置
JP3429612B2 (ja) 辞書登録装置及び機械翻訳装置
JPH04160473A (ja) 事例再利用型翻訳方法および装置
JPH08329108A (ja) テキストのハイパーテキスト化方法
KR950013129B1 (ko) 기계번역장치 및 방법
JPH0561902A (ja) 機械翻訳システム
JPH10149364A (ja) 訳語選択装置と記憶媒体
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JPH0410665B2 (ja)
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JP5032453B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Zhou Super-Function Based Machine Translation System for Business User
JP2024079138A (ja) 発想支援システム及び方法
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム