JP3450598B2 - 専門用語辞書選択装置 - Google Patents

専門用語辞書選択装置

Info

Publication number
JP3450598B2
JP3450598B2 JP16975996A JP16975996A JP3450598B2 JP 3450598 B2 JP3450598 B2 JP 3450598B2 JP 16975996 A JP16975996 A JP 16975996A JP 16975996 A JP16975996 A JP 16975996A JP 3450598 B2 JP3450598 B2 JP 3450598B2
Authority
JP
Japan
Prior art keywords
technical term
data
name
field
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16975996A
Other languages
English (en)
Other versions
JPH1021222A (ja
Inventor
聡 木下
孝之 酒匂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP16975996A priority Critical patent/JP3450598B2/ja
Publication of JPH1021222A publication Critical patent/JPH1021222A/ja
Application granted granted Critical
Publication of JP3450598B2 publication Critical patent/JP3450598B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子計算機を用い
て自然言語を翻訳する機械翻訳の際に用いる専門用語辞
書を選択する専門用語辞書選択装置に関する。
【0002】
【従来の技術】近年、インターネットを通じて、海外の
情報に容易にアクセスできるようになってきた。それに
伴い、英語で書かれた文書を機械翻訳システムを利用し
て日本語に翻訳して読むユーザが増えている。
【0003】現在の機械翻訳システムは、すべての文書
を100%正しく翻訳できるわけではないため、ユーザ
が望む翻訳結果により近い翻訳ができるよう、システム
の種々のパラメータを調整する必要がある。そのような
パラメータの代表的なものとして、翻訳辞書の選択があ
る。
【0004】現在、機械翻訳システムの多くは、以下の
3種類の翻訳辞書が利用できるようになっている。1つ
は、どのような専門分野においても広く使用される単語
を格納した「一般辞書」である。他の1つは、情報処理
分野や化学分野といった特定の専門分野の用語を格納し
た「専門用語辞書」である。さらに他の1つは、ユーザ
固有の単語や用法を登録するための「ユーザ辞書」であ
る。
【0005】従来のように、機械翻訳システムをマニュ
アルなどの大量の文書を短時間で翻訳するのに利用する
場合、ユーザが翻訳する文書は、特定の技術分野に関す
ることが多いため、上記で述べた翻訳辞書に関しても、
一度設定してしまえば、それ以降そのまま利用できる場
合が多く、翻訳の度に設定し直す必要はなかった。しか
しながら、インターネットを通じて大学や企業が公開し
ている様々な情報をアクセスする場合には、特定の技術
分野に関する文書だけをアクセスするとは限らない。そ
のため、ユーザは、適切な翻訳結果を得るために、その
都度適切な翻訳辞書の設定を行う必要がある。特に、専
門分野に応じた専門用語辞書を複数持つ場合、どの専門
用語辞書を使用するかによって翻訳結果が大きく左右さ
れ、その都度適切な専門用語辞書の設定を行う必要があ
り、繁雑であった。さらに、翻訳辞書の設定だけではな
く、他の翻訳処理に関する設定も、専門分野によって切
り換える場合があり、繁雑であった。
【0006】
【発明が解決しようとする課題】以上述べたように、従
来の機械翻訳システムでは、翻訳する文書に応じてユー
ザが翻訳結果に影響を与える各種設定の切り替えを(翻
訳環境の設定)を行わなければならなず、繁雑であると
いう問題があった。
【0007】本発明は、上記事情を考慮してなされたも
ので、自動的に文書の内容に応じた環境設定を行うこと
の可能な機械翻訳において、文書の内容に応じて翻訳の
際に用いる専門用語辞書を選択することの可能な専門用
語辞書選択装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明(請求項1)は、
入手すべき文書を特定する文書識別情報を用いてネット
ワークを介して入手した第1の言語の文書を第2の言語
に翻訳する際に用いる専門用語辞書を選択する専門用語
辞書選択装置であって、前記文書識別情報の全部または
一部からなる識別データと選択すべき専門用語辞書を指
示する分野データとを対応付けて登録した分野判定用デ
ータにおける識別データと、前記文書識別情報とを比較
し、この比較の結果に応じて、選択すべき専門用語辞書
を決定する専門用語辞書決定手段を具備し、前記分野判
定用データは、ホスト名、ホスト名およびディレクトリ
名の組、またはホスト名、ディレクトリ名およびファイ
ル名の組と、選択すべき専門用語辞書とを対応付けて登
録した第1の分野判定用データと、ディレクトリ名の一
部または全部と、選択すべき専門用語辞書とを対応付け
て登録した第2の分野判定用データからなり、前記比較
にあたって、前記文書識別情報のホスト名、ホスト名お
よびディレクトリ名の組、またはホスト名、ディレクト
リ名およびファイル名の組と、前記第1の分野判定用デ
ータに属するいずれかの識別データとが一致した場合に
は、前記専門用語辞書決定手段は最長一致した識別デー
タに対応する分野データにより選択すべき専門用語辞書
を決定し、前記第1の分野判定用データにより専門用語
辞書が決定できず、かつ、前記第2の分野判定用データ
に属する識別データのうちに前記文書識別情報に包含さ
れるものが存在する場合には、該文書識別情報に包含さ
れる識別データに対応する分野データにより選択すべき
専門用語辞書を決定することを特徴とする専門用語辞書
選択装置である
【0009】
【0010】
【0011】
【0012】
【0013】
【0014】本発明(請求項2)は、請求項1に記載の
発明において、前記文書識別情報は、プロトコル名、ホ
スト名、ディレクトリ名、ファイル名の要素からなるも
のであり、ホスト名、ディレクトリ名およびファイル名
のうちの少なくとも1つの要素をもとにして選択すべき
専門用語辞書を決定することを特徴とする。
【0015】本発明(請求項8)は、請求項7に記載の
発明において、前記分野判定用データは、ホスト名、ホ
スト名およびディレクトリ名の組、またはホスト名、デ
ィレクトリ名およびファイル名の組と、選択すべき専門
用語辞書とを対応付けて登録した第1の分野判定用デー
タと、ディレクトリ名の一部または全部と、選択すべき
専門用語辞書とを対応付けて登録した第2の分野判定用
データからなり、前記比較にあたって、前記文書識別情
報のホスト名、ホスト名およびディレクトリ名の組、ま
たはホスト名、ディレクトリ名およびファイル名の組
と、前記第1の分野判定用データに属するいずれかの識
別データとが一致した場合には、最長一致した識別デー
タに対応する分野データにより選択すべき専門用語辞書
を決定し、前記第1の分野判定用データにより専門用語
辞書が決定できず、かつ、前記第2の分野判定用データ
に属する識別データのうちに前記文書識別情報に包含さ
れるものが存在する場合には、該文書識別情報に包含さ
れる識別データに対応する分野データにより選択すべき
専門用語辞書を決定することを特徴とする。
【0016】なお、以上の各方法に係る発明は、装置に
係る説明としても成立する。本発明によれば、翻訳対象
となる文書を入手する際に用いた該文書を特定する文書
識別情報に応じて翻訳処理の基となる所定の条件を設定
する(例えば、翻訳処理に用いる専門用語辞書を選択す
る、あるいは訳文において用いるべき文体を指定する)
ようにしたので、ユーザは、その都度、翻訳すべき文書
の内容に応じて翻訳環境を適宜設定することが不要にな
る。したがって、従来に比べより短い時間で同等の精度
の翻訳結果を得ることができる。この結果、例えば、イ
ンターネットを通じて入手した英文文書を効率良く翻訳
し情報を入手することが可能となる。
【0017】ところで、上記の発明は、相当するプログ
ラムを格納した記憶媒体としても成立する。例えば、本
発明は、通信装置によりネットワークを介して他の計算
機上に格納された第1の言語の文書をアクセスさせ、こ
の入手した第1の言語の文書に、所定の条件に基づく翻
訳処理を施させて第2の言語の文書を生成させるプログ
ラムであって、前記翻訳処理の実行に先だって、前記ア
クセスの際に用いる前記第1の言語の文書を特定する文
書識別情報をもとにして、前記翻訳処理の基となる前記
所定の条件を設定させるようにコンピュータを制御する
ためのプログラムを格納したコンピュータ読取可能な記
録媒体である。
【0018】また、本発明は、入手すべき文書を特定す
る文書識別情報の指定を受けさせ、前記文書識別情報を
用いてネットワークを介して前記文書を入手させるとと
もに、前記文書識別情報をもとにして翻訳結果を調整可
能なパラメータを設定させ、設定された前記パラメータ
に基づいて、入手された前記文書を所定の言語に翻訳さ
せるようにコンピュータを制御するためのプログラムを
格納したコンピュータ読取可能な記録媒体である。
【0019】また、本発明は、入手すべき文書を特定す
る文書識別情報を用いてネットワークを介して入手させ
た第1の言語の文書を第2の言語に翻訳させる際に用い
る専門用語辞書を選択させるプログラムであって、前記
文書識別情報の全部または一部からなる識別データと選
択すべき専門用語辞書を指示する分野データとが対応付
けて登録された分野判定用データにおける識別データ
と、前記文書識別情報とを比較させ、この比較の結果に
応じて、選択すべき専門用語辞書を決定させるようにコ
ンピュータを制御するためのプログラムを格納したコン
ピュータ読取可能な記録媒体である。
【0020】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。本実施形態では、原語を英語、
訳語を日本語とする英日機械翻訳装置を例にとって説明
する。
【0021】本実施形態では、翻訳対象となる原文をネ
ットワークを経由して入手する場合を例にとって説明す
る。ここでは、ネットワークをインターネットとして説
明する。
【0022】図1は、本実施形態に係る機械翻訳装置の
概略的な構成を示す。本実施形態では、図1のように機
械翻訳装置100とインターネット用の閲覧装置200
とを接続して使用する。
【0023】閲覧装置200は、CRTあるいは液晶表
示装置などの表示装置とマウスやキーボード装置などの
入力装置を用いて構成され、ユーザから翻訳すべき文書
の識別情報の入力を受け付ける機能および該文書の翻訳
結果を画面全体あるいは画面中のウィンドウ内に表示す
る機能を少なくとも有するものである。
【0024】本実施例の機械翻訳装置100は、閲覧装
置200から入力した翻訳すべき文書の識別情報をもと
に通信部3によりインターネットにアクセスしてダウン
ロードした該文書を翻訳し、この翻訳結果をインターネ
ット用閲覧装置200に出力する。
【0025】インターネット用閲覧装置200は、例え
ば、いわゆるブラウザであり、この場合、計算機上でブ
ラウザ・ソフトウェアを実行することにより実現可能で
ある。また、機械翻訳装置100は、例えば、計算機上
で機械翻訳ソフトウェアを実行することにより実現可能
である。この場合、機械翻訳ソフトウェアを、(1)上
記のブラウザ・ソフトウェアを実行させる計算機上で実
行させる場合と、(2)上記のブラウザ・ソフトウェア
を実行させる計算機とは別の計算機上で実行させる場合
が考えられる。機械翻訳装置100とインターネット用
閲覧装置200との間の通信は、前者の(1)の場合、
プロセス間通信により実現される。一方、後者の(2)
の場合は、それぞれの計算機に備えられた通信装置(図
示せず)を用い通信回線を介して実現される。
【0026】また、この送信装置や上記の通信部3は、
例えば、通信回線に接続するためのインターフェース装
置(ネットワーク接続装置)と、このインターフェース
装置を使って通信を行うためのソフトウェア(ネットワ
ーク接続用ソフトウェア)からなる。ここでは、通信部
3は、機械翻訳ソフトウェアを搭載する計算機に備えた
ものを使用するものとする。また、上記の(2)の場合
に機械翻訳ソフトウェアを搭載する計算機側で必要な送
信装置は、通信部3を利用しても良いし、別の通信装置
を用いても良い。
【0027】さて、図1に示すように、本実施形態の機
械翻訳装置100は、制御部2、翻訳部4、翻訳用辞書
6、分野判定部7、分野判定用データ8を備えている。
まず、制御部2について説明する。
【0028】制御部2は、主として次のような4つの制
御を行う。 (a)前述のように通信装置を制御しあるいはプロセス
間通信を用いて、翻訳すべき文書の識別情報を閲覧装置
200から入力する。
【0029】(b)通信部3に文書の識別情報を渡し、
ネットワークから該文書をダウンロードさせ、図示しな
い記憶装置(例えばハードディスク装置あるいはRAM
等)に格納させる。
【0030】(c)入手した文書(あるいはその記憶場
所を示すポインタ情報)を翻訳部4に渡すとともに、専
門用語辞書の選択のために該文書の識別情報を渡し、翻
訳部4に、選択した専門用語辞書を用いて翻訳を実行さ
せる。
【0031】(d)前述のように通信装置を制御しある
いはプロセス間通信を用いて、翻訳部4による翻訳結果
をインターネット用閲覧装置200に送る。次に、翻訳
部4、翻訳用辞書6、分野判定部7、分野判定用データ
8について説明する。
【0032】翻訳用辞書6には、翻訳用の知識情報が納
められている。翻訳用辞書6は、磁気ディスクあるいは
光ディスクなどの記憶装置を用いて構成される。翻訳用
辞書6に格納される知識情報には、例えば、解析辞書6
a、翻訳辞書6b、訳文生成辞書6c、原語文法6d、
訳語文法6eなどがある。
【0033】翻訳辞書6bは、さらに一般辞書6b1、
専門用語辞書6b2、ユーザ辞書6b3に分かれる。ま
た、専門用語辞書6b2は、さらに専門分野に応じて複
数のものが容易される。ここでは、専門分野として情
報、化学、スポーツ、映画の4分野の辞書があるものと
し、それらを情報分野辞書6b2a、化学分野辞書6b
2b、スポーツ分野辞書6b2c、映画分野辞書6b2
dとする。
【0034】なお、一般辞書、各専門用語辞書、ユーザ
辞書は、基本的には同様の構成であるが、例えば、一般
辞書よりユーザ辞書や各専門用語辞書を優先するなどの
使い方がされる。なお、専門用語辞書は、選択されたも
のを使用するものとする。
【0035】分野判定部7は、制御部2から渡された文
書識別情報をもとに専門分野を推定するためのもので、
その際、分野判定用データ8を使用する。分野判定用デ
ータ8は、翻訳辞書6と同様、磁気ディスクあるいは光
ディスクなどの記憶装置を用いて構成される。
【0036】図2は、翻訳部4の基本的な構成を示すブ
ロック図である。なお、翻訳処理については例えば特開
平6−96115号公報「自然原語処理装置及び電子化
辞書装置」に詳しいので、ここでは要点だけを説明す
る。
【0037】翻訳部4は、形態素解析部4a、原文構造
解析部4b、構造変換部4c、訳文生成部4dを備えて
いる。まず、原文は、形態素解析部4aにおいて、解析
辞書6aを用いて、形態素解析がほどこされ、原語にお
いて処理を行う単位に分解される。
【0038】次に、原文構造解析部4bは、形態素解析
部4aの結果および原語文法6dを基に、入力文の構文
構造を得るために、構文解析を行う。その後、構造変換
部4cが、構文解析により得られた原文の構造を翻訳辞
書6bを用いて、原語の見出しを訳語に変換したり、原
文の構造を訳文の構造に変換する。なお、本実施形態で
は、専門用語辞書としては選択されたものを使用する。
【0039】最後に、訳文生成部4dが、その訳文の構
造から、訳文生成辞書6cおよび訳語文法6eを用い
て、訳文としての原語表現を生成する。なお、翻訳結果
(翻訳文)は、図示しない記憶装置(例えばハードディ
スク装置あるいはRAM等)に格納される。
【0040】形態素解析、構文解析、構造変換等の手法
に関しては、上記文献をはじめとして従来より数多く示
されており、本発明ではそれらのいずれの手法を使用す
ることも可能である。
【0041】次に、制御部2の処理手順について説明す
る。図3は、制御部2の処理の流れを示すフローチャー
トである。ステップS1では、まず、インターネット用
閲覧装置200に表示する文書の識別情報を図示しない
通信装置またはプロセス間通信を通じて入力する。
【0042】文書の識別情報の表現形式の一例を図4に
示す。インターネットにおいて、文書の識別情報の表現
形式としては、URLと呼ばれる形式が使用されること
が多く、これは図4に示す例の通り、プロトコル名、ホ
スト名、ディレクトリ名、ファイル名の要素からなる。
なお、インターネット以外の場合でも、各プロトコルに
応じて、適宜、文書識別情報を構成することが可能であ
る。
【0043】続いて、ステップS2では、ステップS1
で入手した文書識別情報を通信部3に送り、識別情報に
よって特定される文書の内容を入手させる。次に、ステ
ップS3では、文書識別情報を分野判定部7に送り、後
述する方法で、入手した文書の専門分野を決定させる。
なお、分野判定部7は、決定した専門分野に対応する専
門用語辞書を選択する命令を翻訳部4に送付する。
【0044】次に、ステップS4では、入手した文書を
翻訳部4に送って翻訳を実行させる。その際、翻訳部4
では、選択された専門用語辞書を使用して翻訳を行う。
最後に、ステップS5で、図示しない通信装置またはプ
ロセス間通信を通じて翻訳結果をインターネット用閲覧
装置200に送る。
【0045】閲覧装置200では、受け取った翻訳文書
を表示する。次に、分野別判定用データについて説明す
る。図5は、「分野別判定用データ」の内容形式の一例
とその内容の具体例を示す図である。
【0046】分野判定用データの各要素は、「データタ
イプ」、「識別データ」、「分野名」の3つのカラムで
構成される。「データタイプ」は、「識別データ」カラ
ムに格納されるデータの種類を示すためのもので、文字
「H」もしくは「D」が格納される。
【0047】データタイプが「H」の場合、「識別デー
タ」カラムには、URLで指定される文書識別情報のう
ち、(1)ホスト名、(2)ホスト名+ディレクトリ
名、(3)ホスト名+ディレクトリ名+ファイル名のい
ずれかを格納する。
【0048】データタイプが「D」の場合には、「識別
データ」として、分野識別情報のディレクトリ部分の全
部もしくは一部を格納する。「分野名」カラムには、デ
ータタイプに関わらず「識別データ」に対応する専門分
野に対応する専門分野名を格納しておく。
【0049】なお、インターネット以外の場合でも、各
プロトコルに応じて、適宜、分野別判定用データを構成
することが可能である。次に、分野判定部7の処理手順
について説明する。
【0050】図6は、分野判定部7の処理の流れを示す
フローチャートである。この処理は、大きく2つに分か
れており、ステップS110までは「データタイプ」が
「H」のデータを検索する処理、ステップS120以降
は「データタイプ」が「D」のデータを検索する処理で
ある。
【0051】まず、ステップS101で、制御部2から
受け取ったURL形式の文書識別情報から「文書の形
式」部分を取り除き、「ホスト名」以降のデータだけに
し、これを変数Xに代入する。
【0052】続くステップS102からステップS10
9で、与えられた文書識別情報ともっとも良く合致する
分野判定用データを検索する。すなわち、ステップS1
02で、変数I,Lにそれぞれ0をセットする。変数I
は、分野判定用データの要素Iを参照するのに用いられ
る。また、変数Lは、変数に代入された文書識別情報と
分野判定用データで文字列の先頭から一致した文字数を
格納するためのものである。
【0053】ステップS103でのチェックで、まだ、
比較していない分野判定用データが残っている場合に
は、ステップS103bでデータタイプが「H」か調べ
る。もしHなら、ステップS104で変数Nに、分野判
定用データの要素Iの識別データの長さを代入し、ステ
ップS105において、ステップS101で変数Xに代
入してある識別データと先頭のN文字が一致するか比較
する。もし違うなら、ステップS109で変数Iの値を
1加算し、ステップS103に戻る。
【0054】ステップS105で先頭のN文字が一致し
た場合には、続くステップS106で変数Nの値が変数
Lの値より大きいか調べる。もしNの値が小さい場合に
はステップS109に進む。もし変数Nの値が大きい場
合には、ステップS107で変数Lに変数Nの値を代入
し、さらに変数Tに分野判定用データの要素Iの分野名
を代入する。
【0055】以上、ステップS102からS109の処
理により、制御部2から与えられた文書識別情報にもっ
とも合致する専門分野が検索される。次に、ステップS
110で、変数Lの値が0か調べる。0なら専門分野が
決定できなかったことを意味するので、その場合は、デ
ータタイプがDのデータを使用して分野を決定するため
にステップS120に進む。
【0056】一方、ステップS110においてL=0で
なければ、ステップS111に進み、変数Tに格納され
た分野名を送付する。翻訳部4では、送付された分野名
をもとに、その分野に応じた専門用語辞書を選択する。
【0057】ステップS120では、分野判定データを
最初から検索するため変数Iの値を0にリセットする。
ステップS121でのチェックで、まだ比較していない
分野判定データが残っている場合には、ステップS12
2でデータタイプが「D」か調べる。もしDなら、ステ
ップS123で、ステップS101で変数Xに代入して
ある識別データが分野判定データの要素Iの識別データ
を含んでいるか調べる。もし含んでいないなら、ステッ
プS124で変数Iの値を1加算しステップS121に
戻る。
【0058】ステップS123で識別データを含んでい
ると分かった場合には、ステップS125で変数Tに分
野判定用データの要素Iの分野名を代入し、その後、ス
テップS111に進み、翻訳部4に変数Tに格納された
分野名を翻訳部4に送り処理を終了する。
【0059】なお、上記手順において、最終的に分野名
が選択されなかった場合、(1)前回に選択された専門
用語辞書と同じものを使う、(2)デフォルトを設定し
ておき、デフォルトの専門用語辞書を使う、あるいは
(3)専門用語辞書を使用しない、など種々の方法を取
ることができる。
【0060】以上のように本実施形態によれば、従来の
ように翻訳するにあたってその都度、文書の内容に応じ
た専門分野辞書を指定する必要がないため、インターネ
ットなどのネットワークを通じて入手した英文文書を効
率良く翻訳し情報を入手することが可能となる。
【0061】なお、本発明は、上記実施形態に限定され
るものではない。上記では専門分野辞書を1つ選択した
が、分野別判定用データの分野名の欄に必要に応じて複
数の分野を登録することで、識別別データに応じて専門
分野辞書を複数選択させることも可能である。なお、複
数の専門分野辞書を選択する場合、分野別判定用データ
に、翻訳にあたってそれら専門分野辞書を使用する優先
順位を登録しておき、翻訳部4は登録された優先準位に
従って複数の専門分野辞書を使用するようにするのが好
ましい。
【0062】本実施形態においては、文書識別情報を用
いて専門分野を決定し、それに基づいて専門分野辞書を
指定していたが、同様の形式で記述した知識を用いて、
翻訳システムに関連する種々のパラメータを変更するこ
とも可能である。例えば、文書の種類(マニュアル、ニ
ュース文、解説記事、商品の説明文など)を推定し、そ
れに応じて訳文における文体(「ですます調」と「であ
る調」)の指定も行うことも可能である。あるいは、文
書の種類を推定し、それに応じて訳文における表現形態
(例えば、英文の命令形を翻訳する場合における「〜し
なさい」と「〜して下さい」の相違)の指定も行うこと
も可能である。その他、翻訳処理に関する種々の設定に
対して本発明を適用することが可能である。
【0063】本実施形態では、分野判定用データとして
予め登録されているデータのみを用いて分野を決定して
いたが、CRTなどの表示装置とキーボード・マウスな
どの入力装置を使用することにより、分野判定用データ
を使って判定できなかった場合にユーザに問い合わせ、
その結果を分野判定用データとして追加するといったこ
とも可能である。
【0064】以下では、本実施形態の機械翻訳装置をコ
ンピュータ上で実現する場合のハードウェアとソフトウ
ェアの構成について説明する。本実施形態の機械翻訳装
置は、ハードウェア構成としては先に言及したように、
CPUと、プログラムや必要なデータを格納するための
RAMと、入出力装置と、ハードディスク装置などの記
憶装置と、通信装置とを用いて構成することができる。
また、図1の制御部2、翻訳部4および分野判定部7
は、それらの処理手順(例えば図2、図3の手順)を記
述したプログラムであって、コンピュータを制御するた
めのプログラムにより実現する。また、各種辞書や分野
判定用データなどは、ハードディスク装置などの記憶装
置に格納する。入手した原文や翻訳結果は、ハードディ
スク装置あるいはRAMなどの記憶装置に格納する。
【0065】そして、上記プログラムをRAMに格納
し、CPUにより実行させる。CPUは、RAMに格納
されたプログラムの手順に従い、演算や、入出力装置、
通信装置あるいは記憶装置の制御等を行って、所望の機
能を実現して行く。
【0066】上記プログラムは、ROMに格納したもの
を用いても良いが、次のように汎用コンピュータにプロ
グラムをインストールして実現することも可能である。
すなわち、まず、上記プログラムを、コンピュータ読取
可能な記録媒体(例えばフロッピー・ディスクあるいは
CR−ROM等の記録媒体)に記憶させておき、該記録
媒体に応じたディスクドライブ装置を用いて該プログラ
ム読取り、RAMに格納し、実行する。あるいは、一旦
ハードディスク装置等にインストールしておき、実行時
にハードディスク装置等からRAMに格納し、実行す
る。なお、プログラムを格納した記録媒体がICカード
である場合は、ICカードリーダーを用いて該プログラ
ム読取ることができる。あるいは、ネットワークを介し
て所定のインタフェース装置からプログラムを受け取る
こともできる。
【0067】なお、前述のように、機械翻訳装置のため
のプログラムと閲覧装置のためのプログラムとは、別の
計算機上で実現することも、同じ計算機上で実現するこ
とも可能である。
【0068】以上の本実施形態では、原語を英語、訳語
を日本語とする英日機械翻訳装置を例にとって説明した
が、本発明は、原語と訳語の組合せを限定するものでは
なく、例えば、原語をドイツ語、訳語を日本語とする機
械翻訳装置、あるいは原語を日本語、訳語を英語とする
機械翻訳装置など、種々の機械翻訳装置に適用すること
ができる。本発明は、上述した実施の形態に限定される
ものではなく、その技術的範囲において種々変形して実
施することができる。
【0069】
【発明の効果】本発明によれば、翻訳対象となる文書を
入手する際に用いた該文書を特定する文書識別情報に応
じて翻訳処理の基となる所定の条件(例えば翻訳に用い
る専門用語辞書)を設定するようにしたので、従来のよ
うにユーザはその都度翻訳すべき文書の内容に応じて翻
訳環境を適宜設定することが不要になる。したがって、
従来に比べより短い時間で翻訳し情報を閲覧することが
できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る機械翻訳システムの
基本的な構成を示すブロック図
【図2】同実施例の翻訳部の基本的な構成を示すブロッ
ク図
【図3】制御部における処理の流れを示すフローチャー
【図4】文書の識別情報の表現形式の一例を示す図
【図5】分野判定用データのデータ構造とデータの一例
を示す図
【図6】分野判定部における処理の流れを示すフローチ
ャート
【符号の説明】
1…入力部 2…制御部 3…通信部 4…翻訳部 5…出力部 6…翻訳用辞書 7…分野判定部 8…分野判定用データ 100…機械翻訳装置 200…インターネット用閲覧装置
フロントページの続き (56)参考文献 特開 平4−195460(JP,A) 特開 平6−318229(JP,A) 西野文人・中村直人,機械翻訳電子メ ールシステム,情報処理学会技術研究報 告90−NL−75−5,日本,1990年 1 月18日,Vol.90,No.5,p.1 −p.8 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入手すべき文書を特定する文書識別情報
    を用いてネットワークを介して入手した第1の言語の文
    書を第2の言語に翻訳する際に用いる専門用語辞書を選
    択する専門用語辞書選択装置であって、 前記文書識別情報の全部または一部からなる識別データ
    と選択すべき専門用語辞書を指示する分野データとを対
    応付けて登録した分野判定用データにおける識別データ
    と、前記文書識別情報とを比較し、この比較の結果に応
    じて、選択すべき専門用語辞書を決定する専門用語辞書
    決定手段を具備し、 前記分野判定用データは、ホスト名、ホスト名およびデ
    ィレクトリ名の組、またはホスト名、ディレクトリ名お
    よびファイル名の組と、選択すべき専門用語辞書とを対
    応付けて登録した第1の分野判定用データと、ディレク
    トリ名の一部または全部と、選択すべき専門用語辞書と
    を対応付けて登録した第2の分野判定用データからな
    り、 前記比較にあたって、前記文書識別情報のホスト名、ホ
    スト名およびディレクトリ名の組、またはホスト名、デ
    ィレクトリ名およびファイル名の組と、前記第1の分野
    判定用データに属するいずれかの識別データとが一致し
    た場合には、前記専門用語辞書決定手段は最長一致した
    識別データに対応する分野データにより選択すべき専門
    用語辞書を決定し、前記第1の分野判定用データにより
    専門用語辞書が決定できず、かつ、前記第2の分野判定
    用データに属する識別データのうちに前記文書識別情報
    に包含されるものが存在する場合には、該文書識別情報
    に包含される識別データに対応する分野データにより選
    択すべき専門用語辞書を決定することを特徴とする専門
    用語辞書選択装置。
  2. 【請求項2】前記文書識別情報は、プロトコル名、ホス
    ト名、ディレクトリ名、ファイル名の要素からなるもの
    であり、ホスト名、ディレクトリ名およびファイル名の
    うちの少なくとも1つの要素をもとにして選択すべき専
    門用語辞書を決定することを特徴とする請求項1に記載
    の専門用語辞書選択装置。
JP16975996A 1996-06-28 1996-06-28 専門用語辞書選択装置 Expired - Lifetime JP3450598B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16975996A JP3450598B2 (ja) 1996-06-28 1996-06-28 専門用語辞書選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16975996A JP3450598B2 (ja) 1996-06-28 1996-06-28 専門用語辞書選択装置

Publications (2)

Publication Number Publication Date
JPH1021222A JPH1021222A (ja) 1998-01-23
JP3450598B2 true JP3450598B2 (ja) 2003-09-29

Family

ID=15892333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16975996A Expired - Lifetime JP3450598B2 (ja) 1996-06-28 1996-06-28 専門用語辞書選択装置

Country Status (1)

Country Link
JP (1) JP3450598B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3960456B2 (ja) * 2000-08-30 2007-08-15 沖電気工業株式会社 翻訳サービス提供装置
JP3379090B2 (ja) 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
JP2003099665A (ja) * 2001-09-21 2003-04-04 Tsubasa System Co Ltd 外国車輌に関する情報取得方法
JP3452558B2 (ja) 2001-09-25 2003-09-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西野文人・中村直人,機械翻訳電子メールシステム,情報処理学会技術研究報告90−NL−75−5,日本,1990年 1月18日,Vol.90,No.5,p.1−p.8

Also Published As

Publication number Publication date
JPH1021222A (ja) 1998-01-23

Similar Documents

Publication Publication Date Title
US7756849B2 (en) Method of searching for text in browser frames
US7216298B1 (en) System and method for automatic generation of HTML based interfaces including alternative layout modes
US7490288B2 (en) Previewing documents on a computer system
JP4202041B2 (ja) 入力モードバイアスを適用するための方法およびシステム
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
US6311177B1 (en) Accessing databases when viewing text on the web
US20070073652A1 (en) Lightweight reference user interface
US20010021934A1 (en) Processing device for searching information in one language using search query in another language, and recording medium and method thereof
EP0740258B1 (en) Data management system
US20040268256A1 (en) Program, character inputting and editing method, apparatus and storage medium
US6615168B1 (en) Multilingual agent for use in computer systems
JP2004206476A (ja) データベースシステム、端末装置、検索データベースサーバ、検索キー入力支援方法及びプログラム
EP1677215B1 (en) Methods and apparatus for the evalution of aspects of a web page
US7895337B2 (en) Systems and methods of generating a content aware interface
EP1280055A1 (en) Method and computer system for creating and processing a browser compliant human interface description
US5946499A (en) Method and apparatus for processing text inputs from multiple input devices in a plurality of applications
JP3195252B2 (ja) 文書ブラウズ支援方法及びシステム
EP1510948A2 (en) Search system, search program, and personal computer
JP3450598B2 (ja) 専門用語辞書選択装置
US7131065B1 (en) Dynamically altering web page content based on a page's title properties
JPH0576067B2 (ja)
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
US20020007382A1 (en) Computer having character input function,method of carrying out process depending on input characters, and storage medium
JPH1125092A (ja) 文書管理支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JP2003296327A (ja) 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080711

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090711

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090711

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100711

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100711

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110711

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130711

Year of fee payment: 10

EXPY Cancellation because of completion of term