JPH1021222A - Machine translation method and terminology dictionary selecting method - Google Patents

Machine translation method and terminology dictionary selecting method

Info

Publication number
JPH1021222A
JPH1021222A JP8169759A JP16975996A JPH1021222A JP H1021222 A JPH1021222 A JP H1021222A JP 8169759 A JP8169759 A JP 8169759A JP 16975996 A JP16975996 A JP 16975996A JP H1021222 A JPH1021222 A JP H1021222A
Authority
JP
Japan
Prior art keywords
document
identification information
name
translation
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8169759A
Other languages
Japanese (ja)
Other versions
JP3450598B2 (en
Inventor
Satoshi Kinoshita
聡 木下
Takayuki Sako
孝之 酒匂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP16975996A priority Critical patent/JP3450598B2/en
Publication of JPH1021222A publication Critical patent/JPH1021222A/en
Application granted granted Critical
Publication of JP3450598B2 publication Critical patent/JP3450598B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To automatically set environment according to the contents of a document by setting a prescribed condition to be the base of translating processing according to document identification information specifying a document used at the time of obtaining a document to be a translating object. SOLUTION: A control part 2 inputs identification information of a document to translate from an inspecting device 200 by controlling a communication equipment or using communication between processors. Continually the part 2 sends obtained document identification information to a communication part 3 to obtain the content of the document specified by identification information. Next, the part 2 sends document identification information to a field judging part 7 to decide the special field of the obtained document. In addition the part 7 sends an instruction of selecting a terminology dictionary corresponding to the decided special field to a translation part 4. Next, the obtained document is sent to the translation part 4 to execute translation. At the time a translation part 4 translates by using the selected technical word. At last, a translating result is sent to the inspecting device 200 for internet through communication between processors.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、電子計算機を用い
て自然言語を翻訳する機械翻訳方法および翻訳の際に用
いる専門用語辞書を選択する専門用語辞書選択方法に関
する。
[0001] 1. Field of the Invention [0002] The present invention relates to a machine translation method for translating a natural language using an electronic computer and a technical term dictionary selecting method for selecting a technical term dictionary used for translation.

【0002】[0002]

【従来の技術】近年、インターネットを通じて、海外の
情報に容易にアクセスできるようになってきた。それに
伴い、英語で書かれた文書を機械翻訳システムを利用し
て日本語に翻訳して読むユーザが増えている。
2. Description of the Related Art In recent years, it has become easy to access overseas information through the Internet. Accordingly, users who translate documents written in English into Japanese using a machine translation system are increasing.

【0003】現在の機械翻訳システムは、すべての文書
を100%正しく翻訳できるわけではないため、ユーザ
が望む翻訳結果により近い翻訳ができるよう、システム
の種々のパラメータを調整する必要がある。そのような
パラメータの代表的なものとして、翻訳辞書の選択があ
る。
[0003] Since current machine translation systems do not translate 100% of all documents correctly, it is necessary to adjust various parameters of the system so that the translation can be made closer to the translation result desired by the user. A typical example of such a parameter is the selection of a translation dictionary.

【0004】現在、機械翻訳システムの多くは、以下の
3種類の翻訳辞書が利用できるようになっている。1つ
は、どのような専門分野においても広く使用される単語
を格納した「一般辞書」である。他の1つは、情報処理
分野や化学分野といった特定の専門分野の用語を格納し
た「専門用語辞書」である。さらに他の1つは、ユーザ
固有の単語や用法を登録するための「ユーザ辞書」であ
る。
At present, many types of machine translation systems can use the following three types of translation dictionaries. One is a “general dictionary” that stores words that are widely used in any specialized field. The other is a “technical term dictionary” that stores terms in a specific technical field such as the information processing field and the chemical field. Still another is a “user dictionary” for registering words and usages unique to the user.

【0005】従来のように、機械翻訳システムをマニュ
アルなどの大量の文書を短時間で翻訳するのに利用する
場合、ユーザが翻訳する文書は、特定の技術分野に関す
ることが多いため、上記で述べた翻訳辞書に関しても、
一度設定してしまえば、それ以降そのまま利用できる場
合が多く、翻訳の度に設定し直す必要はなかった。しか
しながら、インターネットを通じて大学や企業が公開し
ている様々な情報をアクセスする場合には、特定の技術
分野に関する文書だけをアクセスするとは限らない。そ
のため、ユーザは、適切な翻訳結果を得るために、その
都度適切な翻訳辞書の設定を行う必要がある。特に、専
門分野に応じた専門用語辞書を複数持つ場合、どの専門
用語辞書を使用するかによって翻訳結果が大きく左右さ
れ、その都度適切な専門用語辞書の設定を行う必要があ
り、繁雑であった。さらに、翻訳辞書の設定だけではな
く、他の翻訳処理に関する設定も、専門分野によって切
り換える場合があり、繁雑であった。
When a machine translation system is used to translate a large number of documents such as manuals in a short time as in the past, the documents translated by the user often relate to a specific technical field. Regarding translation dictionaries,
Once they were set, they were often usable as they were, so there was no need to set them again for each translation. However, when accessing various information published by universities and companies through the Internet, it is not always the case that only documents related to a specific technical field are accessed. Therefore, the user needs to set an appropriate translation dictionary each time to obtain an appropriate translation result. In particular, if there are multiple technical term dictionaries according to the specialty field, the translation result greatly depends on which technical term dictionary is used, and it is necessary to set an appropriate technical term dictionary each time, which is complicated. . Further, not only the setting of the translation dictionary but also the settings related to other translation processes may be switched depending on the specialized field, which is complicated.

【0006】[0006]

【発明が解決しようとする課題】以上述べたように、従
来の機械翻訳システムでは、翻訳する文書に応じてユー
ザが翻訳結果に影響を与える各種設定の切り替えを(翻
訳環境の設定)を行わなければならなず、繁雑であると
いう問題があった。
As described above, in the conventional machine translation system, the user must switch (set a translation environment) various settings that affect the translation result in accordance with the document to be translated. Had to be complicated.

【0007】本発明は、上記事情を考慮してなされたも
ので、自動的に文書の内容に応じた環境設定を行うこと
の可能な機械翻訳方法を提供することを目的とする。よ
り具体的には、文書の内容に応じて翻訳の際に用いる専
門用語辞書を選択することの可能な専門用語辞書選択方
法を提供することを目的とする。
[0007] The present invention has been made in consideration of the above circumstances, and has as its object to provide a machine translation method capable of automatically setting an environment according to the contents of a document. More specifically, an object of the present invention is to provide a technical term dictionary selection method capable of selecting a technical term dictionary used for translation according to the content of a document.

【0008】[0008]

【課題を解決するための手段】本発明(請求項1)は、
通信装置によりネットワークを介して他の計算機上に格
納された第1の言語の文書をアクセスし、この入手した
第1の言語の文書に、所定の条件に基づく翻訳処理を施
して第2の言語の文書を生成する機械翻訳方法であっ
て、前記翻訳処理の実行に先だって、前記アクセスの際
に用いる前記第1の言語の文書を特定する文書識別情報
をもとにして、前記翻訳処理の基となる前記所定の条件
を設定することを特徴とする。
Means for Solving the Problems The present invention (claim 1) provides:
A communication device accesses a document in a first language stored on another computer via a network, performs a translation process on the obtained document in the first language based on predetermined conditions, and executes a translation process on the second language. A machine translation method for generating a document according to claim 1, wherein prior to execution of the translation process, the translation process is performed based on document identification information for identifying the document in the first language used at the time of the access. The above-described predetermined condition is set.

【0009】本発明(請求項2)に係る機械翻訳方法
は、入手すべき文書を特定する文書識別情報の指定を受
け、前記文書識別情報を用いてネットワークを介して前
記文書を入手するとともに、前記文書識別情報をもとに
して翻訳結果を調整可能なパラメータを設定し、設定さ
れた前記パラメータに基づいて、入手された前記文書を
所定の言語に翻訳することを特徴とする。
A machine translation method according to the present invention (claim 2) receives document identification information for specifying a document to be obtained, obtains the document via a network using the document identification information, A parameter for adjusting a translation result is set based on the document identification information, and the obtained document is translated into a predetermined language based on the set parameter.

【0010】本発明(請求項3)は、請求項1または2
に記載の発明において、前記文書識別情報は、文書の形
式(例えばプロトコル名など)、ホスト名、ディレクト
リ名、ファイル名の要素からなるものであり、ホスト
名、ディレクトリ名およびファイル名のうちの少なくと
も1つの要素をもとにして前記所定の条件を設定するこ
とを特徴とする。
[0010] The present invention (claim 3) is based on claim 1 or 2
In the invention described in the above item, the document identification information includes elements of a document format (for example, a protocol name), a host name, a directory name, and a file name, and at least one of the host name, the directory name, and the file name. It is characterized in that the predetermined condition is set based on one element.

【0011】本発明(請求項4)は、請求項1ないし3
のいずれか1項に記載の発明において、前記所定の条件
は、翻訳の際に使用する専門用語辞書を示すものである
ことを特徴とする。
The present invention (Claim 4) provides Claims 1 to 3
In the invention according to any one of the above, the predetermined condition indicates a technical term dictionary used at the time of translation.

【0012】本発明(請求項5)は、請求項1ないし3
のいずれか1項に記載の発明において、前記所定の条件
は、訳文において用いるべき文体(例えば「ですます
調」と「である調」)を示すものであることを特徴とす
る。
The present invention (Claim 5) provides Claims 1 to 3
In the invention according to any one of the first to third aspects, the predetermined condition indicates a style to be used in a translated sentence (for example, “mass tone” and “mass tone”).

【0013】本発明(請求項6)は、入手すべき文書を
特定する文書識別情報を用いてネットワークを介して入
手した第1の言語の文書を第2の言語に翻訳する際に用
いる専門用語辞書を選択する専門用語辞書選択方法であ
って、前記文書識別情報の全部または一部からなる識別
データと選択すべき専門用語辞書を指示する分野データ
とを対応付けて登録した分野判定用データにおける識別
データと、前記文書識別情報とを比較し、この比較の結
果に応じて、選択すべき専門用語辞書を決定することを
特徴とする。
The present invention (claim 6) provides a technical term used when translating a document in a first language obtained through a network into a second language using document identification information for specifying a document to be obtained. A technical term dictionary selecting method for selecting a dictionary, wherein identification data consisting of all or a part of the document identification information and field data indicating a technical term dictionary to be selected are registered in association with field determination data. It is characterized in that the identification data is compared with the document identification information, and a terminology dictionary to be selected is determined according to the result of the comparison.

【0014】本発明(請求項7)は、請求項6に記載の
発明において、前記文書識別情報は、文書の形式(例え
ばプロトコル名など)、ホスト名、ディレクトリ名、フ
ァイル名の要素からなるものであり、ホスト名、ディレ
クトリ名およびファイル名のうちの少なくとも1つの要
素をもとにして選択すべき専門用語辞書を決定すること
を特徴とする。
According to the present invention (claim 7), in the invention according to claim 6, the document identification information includes elements of a document format (for example, a protocol name), a host name, a directory name, and a file name. And a terminology dictionary to be selected is determined based on at least one of a host name, a directory name, and a file name.

【0015】本発明(請求項8)は、請求項7に記載の
発明において、前記分野判定用データは、ホスト名、ホ
スト名およびディレクトリ名の組、またはホスト名、デ
ィレクトリ名およびファイル名の組と、選択すべき専門
用語辞書とを対応付けて登録した第1の分野判定用デー
タと、ディレクトリ名の一部または全部と、選択すべき
専門用語辞書とを対応付けて登録した第2の分野判定用
データからなり、前記比較にあたって、前記文書識別情
報のホスト名、ホスト名およびディレクトリ名の組、ま
たはホスト名、ディレクトリ名およびファイル名の組
と、前記第1の分野判定用データに属するいずれかの識
別データとが一致した場合には、最長一致した識別デー
タに対応する分野データにより選択すべき専門用語辞書
を決定し、前記第1の分野判定用データにより専門用語
辞書が決定できず、かつ、前記第2の分野判定用データ
に属する識別データのうちに前記文書識別情報に包含さ
れるものが存在する場合には、該文書識別情報に包含さ
れる識別データに対応する分野データにより選択すべき
専門用語辞書を決定することを特徴とする。
According to the present invention (claim 8), in the invention according to claim 7, the field determination data is a set of a host name, a host name and a directory name, or a set of a host name, a directory name and a file name. , A first field determination data registered in association with a technical term dictionary to be selected, a second field in which a part or all of the directory name is registered in association with the technical term dictionary to be selected In the comparison, a host name, a set of a host name and a directory name of the document identification information, or a set of a host name, a directory name and a file name of the document identification information, and any one of the sets belonging to the first field determination data. If the identification data matches, the technical term dictionary to be selected is determined based on the field data corresponding to the longest matching identification data, and the first term dictionary is determined. If the technical term dictionary cannot be determined from the field determination data, and if any of the identification data belonging to the second field determination data is included in the document identification information, the document identification information The terminology dictionary to be selected is determined based on the field data corresponding to the identification data included in (1).

【0016】なお、以上の各方法に係る発明は、装置に
係る説明としても成立する。本発明によれば、翻訳対象
となる文書を入手する際に用いた該文書を特定する文書
識別情報に応じて翻訳処理の基となる所定の条件を設定
する(例えば、翻訳処理に用いる専門用語辞書を選択す
る、あるいは訳文において用いるべき文体を指定する)
ようにしたので、ユーザは、その都度、翻訳すべき文書
の内容に応じて翻訳環境を適宜設定することが不要にな
る。したがって、従来に比べより短い時間で同等の精度
の翻訳結果を得ることができる。この結果、例えば、イ
ンターネットを通じて入手した英文文書を効率良く翻訳
し情報を入手することが可能となる。
The invention according to each of the above-described methods is also applicable to the description of the apparatus. According to the present invention, a predetermined condition serving as a base of a translation process is set in accordance with document identification information for specifying a document to be used for obtaining a document to be translated (for example, a technical term used in the translation process). Select a dictionary or specify the style to use in the translation)
This eliminates the need for the user to appropriately set the translation environment according to the content of the document to be translated each time. Therefore, a translation result with the same accuracy can be obtained in a shorter time than in the past. As a result, for example, it is possible to efficiently translate an English document obtained through the Internet and obtain information.

【0017】ところで、上記の発明は、相当するプログ
ラムを格納した記憶媒体としても成立する。例えば、本
発明は、通信装置によりネットワークを介して他の計算
機上に格納された第1の言語の文書をアクセスさせ、こ
の入手した第1の言語の文書に、所定の条件に基づく翻
訳処理を施させて第2の言語の文書を生成させるプログ
ラムであって、前記翻訳処理の実行に先だって、前記ア
クセスの際に用いる前記第1の言語の文書を特定する文
書識別情報をもとにして、前記翻訳処理の基となる前記
所定の条件を設定させるようにコンピュータを制御する
ためのプログラムを格納したコンピュータ読取可能な記
録媒体である。
Incidentally, the above-mentioned invention is also realized as a storage medium storing a corresponding program. For example, the present invention allows a communication device to access a document in a first language stored on another computer via a network, and performs a translation process on the obtained document in the first language based on predetermined conditions. And generating a document in a second language by performing document translation on the basis of document identification information for identifying the document in the first language used at the time of the access prior to the execution of the translation processing. A computer-readable recording medium storing a program for controlling a computer to set the predetermined condition serving as a basis of the translation processing.

【0018】また、本発明は、入手すべき文書を特定す
る文書識別情報の指定を受けさせ、前記文書識別情報を
用いてネットワークを介して前記文書を入手させるとと
もに、前記文書識別情報をもとにして翻訳結果を調整可
能なパラメータを設定させ、設定された前記パラメータ
に基づいて、入手された前記文書を所定の言語に翻訳さ
せるようにコンピュータを制御するためのプログラムを
格納したコンピュータ読取可能な記録媒体である。
Further, according to the present invention, the document identification information for specifying the document to be obtained is specified, the document is obtained via a network using the document identification information, and the document identification information is specified based on the document identification information. A computer-readable program that stores a program for controlling a computer to translate the obtained document into a predetermined language based on the set parameters, and to adjust a parameter that can adjust the translation result. It is a recording medium.

【0019】また、本発明は、入手すべき文書を特定す
る文書識別情報を用いてネットワークを介して入手させ
た第1の言語の文書を第2の言語に翻訳させる際に用い
る専門用語辞書を選択させるプログラムであって、前記
文書識別情報の全部または一部からなる識別データと選
択すべき専門用語辞書を指示する分野データとが対応付
けて登録された分野判定用データにおける識別データ
と、前記文書識別情報とを比較させ、この比較の結果に
応じて、選択すべき専門用語辞書を決定させるようにコ
ンピュータを制御するためのプログラムを格納したコン
ピュータ読取可能な記録媒体である。
Further, the present invention provides a technical term dictionary used when translating a document in a first language obtained through a network into a second language using document identification information for specifying a document to be obtained. A program to be selected, wherein identification data in field determination data in which identification data consisting of all or a part of the document identification information and field data indicating a technical term dictionary to be selected are registered in association with each other; This is a computer-readable recording medium storing a program for controlling a computer so as to compare with document identification information and determine a technical term dictionary to be selected according to the result of the comparison.

【0020】[0020]

【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。本実施形態では、原語を英語、
訳語を日本語とする英日機械翻訳装置を例にとって説明
する。
Embodiments of the present invention will be described below with reference to the drawings. In this embodiment, the original language is English,
An English-Japanese machine translator that translates into Japanese will be described as an example.

【0021】本実施形態では、翻訳対象となる原文をネ
ットワークを経由して入手する場合を例にとって説明す
る。ここでは、ネットワークをインターネットとして説
明する。
In the present embodiment, a case where the original text to be translated is obtained via a network will be described as an example. Here, the network is described as the Internet.

【0022】図1は、本実施形態に係る機械翻訳装置の
概略的な構成を示す。本実施形態では、図1のように機
械翻訳装置100とインターネット用の閲覧装置200
とを接続して使用する。
FIG. 1 shows a schematic configuration of a machine translation apparatus according to this embodiment. In this embodiment, as shown in FIG. 1, the machine translation device 100 and the Internet browsing device 200 are used.
Connect and use.

【0023】閲覧装置200は、CRTあるいは液晶表
示装置などの表示装置とマウスやキーボード装置などの
入力装置を用いて構成され、ユーザから翻訳すべき文書
の識別情報の入力を受け付ける機能および該文書の翻訳
結果を画面全体あるいは画面中のウィンドウ内に表示す
る機能を少なくとも有するものである。
The browsing device 200 is configured using a display device such as a CRT or a liquid crystal display device and an input device such as a mouse or a keyboard device, and has a function of receiving input of identification information of a document to be translated from a user, and a function of receiving the input of the document. It has at least a function of displaying the translation result on the entire screen or in a window in the screen.

【0024】本実施例の機械翻訳装置100は、閲覧装
置200から入力した翻訳すべき文書の識別情報をもと
に通信部3によりインターネットにアクセスしてダウン
ロードした該文書を翻訳し、この翻訳結果をインターネ
ット用閲覧装置200に出力する。
The machine translation apparatus 100 of this embodiment translates the downloaded document by accessing the Internet by the communication unit 3 based on the identification information of the document to be translated, which is input from the browsing apparatus 200, and translates the translation result. To the Internet browsing apparatus 200.

【0025】インターネット用閲覧装置200は、例え
ば、いわゆるブラウザであり、この場合、計算機上でブ
ラウザ・ソフトウェアを実行することにより実現可能で
ある。また、機械翻訳装置100は、例えば、計算機上
で機械翻訳ソフトウェアを実行することにより実現可能
である。この場合、機械翻訳ソフトウェアを、(1)上
記のブラウザ・ソフトウェアを実行させる計算機上で実
行させる場合と、(2)上記のブラウザ・ソフトウェア
を実行させる計算機とは別の計算機上で実行させる場合
が考えられる。機械翻訳装置100とインターネット用
閲覧装置200との間の通信は、前者の(1)の場合、
プロセス間通信により実現される。一方、後者の(2)
の場合は、それぞれの計算機に備えられた通信装置(図
示せず)を用い通信回線を介して実現される。
The Internet browsing apparatus 200 is, for example, a so-called browser, and in this case, can be realized by executing browser software on a computer. The machine translation device 100 can be realized by executing machine translation software on a computer, for example. In this case, the machine translation software may be executed on (1) a computer that executes the browser software described above, or (2) a machine translation software may be executed on a computer different from the computer that executes the browser software. Conceivable. The communication between the machine translation device 100 and the Internet browsing device 200 is the former (1),
This is realized by inter-process communication. On the other hand, the latter (2)
Is realized through a communication line using a communication device (not shown) provided in each computer.

【0026】また、この送信装置や上記の通信部3は、
例えば、通信回線に接続するためのインターフェース装
置(ネットワーク接続装置)と、このインターフェース
装置を使って通信を行うためのソフトウェア(ネットワ
ーク接続用ソフトウェア)からなる。ここでは、通信部
3は、機械翻訳ソフトウェアを搭載する計算機に備えた
ものを使用するものとする。また、上記の(2)の場合
に機械翻訳ソフトウェアを搭載する計算機側で必要な送
信装置は、通信部3を利用しても良いし、別の通信装置
を用いても良い。
The transmitting device and the communication unit 3 are:
For example, it is composed of an interface device (network connection device) for connecting to a communication line, and software (network connection software) for performing communication using this interface device. Here, it is assumed that the communication unit 3 is provided in a computer equipped with machine translation software. In the case of the above (2), the communication device 3 may be used as a transmission device necessary for the computer on which the machine translation software is installed, or another communication device may be used.

【0027】さて、図1に示すように、本実施形態の機
械翻訳装置100は、制御部2、翻訳部4、翻訳用辞書
6、分野判定部7、分野判定用データ8を備えている。
まず、制御部2について説明する。
As shown in FIG. 1, the machine translation apparatus 100 of the present embodiment includes a control unit 2, a translation unit 4, a translation dictionary 6, a field determination unit 7, and field determination data 8.
First, the control unit 2 will be described.

【0028】制御部2は、主として次のような4つの制
御を行う。 (a)前述のように通信装置を制御しあるいはプロセス
間通信を用いて、翻訳すべき文書の識別情報を閲覧装置
200から入力する。
The control section 2 mainly performs the following four controls. (A) Input the identification information of the document to be translated from the browsing device 200 by controlling the communication device as described above or by using the inter-process communication.

【0029】(b)通信部3に文書の識別情報を渡し、
ネットワークから該文書をダウンロードさせ、図示しな
い記憶装置(例えばハードディスク装置あるいはRAM
等)に格納させる。
(B) The document identification information is passed to the communication unit 3,
The user downloads the document from a network and stores the document in a storage device (not shown)
Etc.).

【0030】(c)入手した文書(あるいはその記憶場
所を示すポインタ情報)を翻訳部4に渡すとともに、専
門用語辞書の選択のために該文書の識別情報を渡し、翻
訳部4に、選択した専門用語辞書を用いて翻訳を実行さ
せる。
(C) The obtained document (or pointer information indicating the storage location) is passed to the translator 4, and the identification information of the document is passed for selection of a technical term dictionary. Perform translation using a technical term dictionary.

【0031】(d)前述のように通信装置を制御しある
いはプロセス間通信を用いて、翻訳部4による翻訳結果
をインターネット用閲覧装置200に送る。次に、翻訳
部4、翻訳用辞書6、分野判定部7、分野判定用データ
8について説明する。
(D) The result of translation by the translation unit 4 is sent to the Internet browsing device 200 by controlling the communication device or using inter-process communication as described above. Next, the translation unit 4, the translation dictionary 6, the field determination unit 7, and the field determination data 8 will be described.

【0032】翻訳用辞書6には、翻訳用の知識情報が納
められている。翻訳用辞書6は、磁気ディスクあるいは
光ディスクなどの記憶装置を用いて構成される。翻訳用
辞書6に格納される知識情報には、例えば、解析辞書6
a、翻訳辞書6b、訳文生成辞書6c、原語文法6d、
訳語文法6eなどがある。
The translation dictionary 6 stores knowledge information for translation. The translation dictionary 6 is configured using a storage device such as a magnetic disk or an optical disk. The knowledge information stored in the translation dictionary 6 includes, for example, the analysis dictionary 6
a, translation dictionary 6b, translation generation dictionary 6c, original grammar 6d,
There is a translated word grammar 6e.

【0033】翻訳辞書6bは、さらに一般辞書6b1、
専門用語辞書6b2、ユーザ辞書6b3に分かれる。ま
た、専門用語辞書6b2は、さらに専門分野に応じて複
数のものが容易される。ここでは、専門分野として情
報、化学、スポーツ、映画の4分野の辞書があるものと
し、それらを情報分野辞書6b2a、化学分野辞書6b
2b、スポーツ分野辞書6b2c、映画分野辞書6b2
dとする。
The translation dictionary 6b further includes a general dictionary 6b1,
It is divided into a technical term dictionary 6b2 and a user dictionary 6b3. In addition, a plurality of technical term dictionaries 6b2 are facilitated in accordance with specialty fields. Here, it is assumed that there are dictionaries in four fields of information, chemistry, sports, and movies as specialized fields, and these are referred to as an information field dictionary 6b2a and a chemical field dictionary 6b
2b, sports field dictionary 6b2c, movie field dictionary 6b2
d.

【0034】なお、一般辞書、各専門用語辞書、ユーザ
辞書は、基本的には同様の構成であるが、例えば、一般
辞書よりユーザ辞書や各専門用語辞書を優先するなどの
使い方がされる。なお、専門用語辞書は、選択されたも
のを使用するものとする。
The general dictionary, each technical term dictionary, and the user dictionary have basically the same configuration. For example, a user dictionary and each technical term dictionary are given priority over the general dictionary. Note that the selected terminology dictionary is used.

【0035】分野判定部7は、制御部2から渡された文
書識別情報をもとに専門分野を推定するためのもので、
その際、分野判定用データ8を使用する。分野判定用デ
ータ8は、翻訳辞書6と同様、磁気ディスクあるいは光
ディスクなどの記憶装置を用いて構成される。
The field judging section 7 is for estimating a special field based on the document identification information passed from the control section 2.
At this time, the field determination data 8 is used. The field determination data 8 is configured using a storage device such as a magnetic disk or an optical disk, like the translation dictionary 6.

【0036】図2は、翻訳部4の基本的な構成を示すブ
ロック図である。なお、翻訳処理については例えば特開
平6−96115号公報「自然原語処理装置及び電子化
辞書装置」に詳しいので、ここでは要点だけを説明す
る。
FIG. 2 is a block diagram showing a basic configuration of the translation unit 4. The translation process is described in detail in, for example, Japanese Patent Application Laid-Open No. 6-96115, entitled "Natural Original Language Processing Apparatus and Electronic Dictionary Apparatus", and only the essential points will be described here.

【0037】翻訳部4は、形態素解析部4a、原文構造
解析部4b、構造変換部4c、訳文生成部4dを備えて
いる。まず、原文は、形態素解析部4aにおいて、解析
辞書6aを用いて、形態素解析がほどこされ、原語にお
いて処理を行う単位に分解される。
The translation unit 4 includes a morphological analysis unit 4a, an original sentence structure analysis unit 4b, a structure conversion unit 4c, and a translated sentence generation unit 4d. First, the original sentence is subjected to morphological analysis using the analysis dictionary 6a in the morphological analysis unit 4a, and is decomposed into units for processing in the original language.

【0038】次に、原文構造解析部4bは、形態素解析
部4aの結果および原語文法6dを基に、入力文の構文
構造を得るために、構文解析を行う。その後、構造変換
部4cが、構文解析により得られた原文の構造を翻訳辞
書6bを用いて、原語の見出しを訳語に変換したり、原
文の構造を訳文の構造に変換する。なお、本実施形態で
は、専門用語辞書としては選択されたものを使用する。
Next, the original sentence structure analysis unit 4b performs syntax analysis based on the result of the morphological analysis unit 4a and the original grammar 6d to obtain the syntax structure of the input sentence. After that, the structure conversion unit 4c converts the heading of the original sentence into a translated word or converts the structure of the original sentence into a translated sentence using the translation dictionary 6b. In this embodiment, the selected terminology dictionary is used.

【0039】最後に、訳文生成部4dが、その訳文の構
造から、訳文生成辞書6cおよび訳語文法6eを用い
て、訳文としての原語表現を生成する。なお、翻訳結果
(翻訳文)は、図示しない記憶装置(例えばハードディ
スク装置あるいはRAM等)に格納される。
Finally, the translation generation unit 4d generates an original language expression as a translation from the structure of the translation using the translation generation dictionary 6c and the translation grammar 6e. The translation result (translated sentence) is stored in a storage device (not shown) (for example, a hard disk device or a RAM).

【0040】形態素解析、構文解析、構造変換等の手法
に関しては、上記文献をはじめとして従来より数多く示
されており、本発明ではそれらのいずれの手法を使用す
ることも可能である。
Many techniques such as morphological analysis, syntax analysis, and structure conversion have been described in the literature, including the above-mentioned literature, and any of these techniques can be used in the present invention.

【0041】次に、制御部2の処理手順について説明す
る。図3は、制御部2の処理の流れを示すフローチャー
トである。ステップS1では、まず、インターネット用
閲覧装置200に表示する文書の識別情報を図示しない
通信装置またはプロセス間通信を通じて入力する。
Next, the processing procedure of the control unit 2 will be described. FIG. 3 is a flowchart showing the flow of the processing of the control unit 2. In step S1, first, identification information of a document to be displayed on the Internet browsing device 200 is input through a communication device (not shown) or inter-process communication.

【0042】文書の識別情報の表現形式の一例を図4に
示す。インターネットにおいて、文書の識別情報の表現
形式としては、URLと呼ばれる形式が使用されること
が多く、これは図4に示す例の通り、文書の形式(プロ
トコル名など)、ホスト名、ディレクトリ名、ファイル
名の要素からなる。なお、インターネット以外の場合で
も、各プロトコルに応じて、適宜、文書識別情報を構成
することが可能である。
FIG. 4 shows an example of the expression format of the document identification information. In the Internet, a format called URL is often used as a format for expressing document identification information. As shown in FIG. 4, the format is a document format (eg, protocol name), a host name, a directory name, or the like. Consists of a file name element. Note that, even in a case other than the Internet, the document identification information can be appropriately configured according to each protocol.

【0043】続いて、ステップS2では、ステップS1
で入手した文書識別情報を通信部3に送り、識別情報に
よって特定される文書の内容を入手させる。次に、ステ
ップS3では、文書識別情報を分野判定部7に送り、後
述する方法で、入手した文書の専門分野を決定させる。
なお、分野判定部7は、決定した専門分野に対応する専
門用語辞書を選択する命令を翻訳部4に送付する。
Subsequently, in step S2, step S1
Is transmitted to the communication unit 3 to obtain the contents of the document specified by the identification information. Next, in step S3, the document identification information is sent to the field determination unit 7, and the specialized field of the obtained document is determined by the method described later.
In addition, the field determination unit 7 sends an instruction to select a technical term dictionary corresponding to the determined specialty field to the translation unit 4.

【0044】次に、ステップS4では、入手した文書を
翻訳部4に送って翻訳を実行させる。その際、翻訳部4
では、選択された専門用語辞書を使用して翻訳を行う。
最後に、ステップS5で、図示しない通信装置またはプ
ロセス間通信を通じて翻訳結果をインターネット用閲覧
装置200に送る。
Next, in step S4, the obtained document is sent to the translation unit 4 to be translated. At that time, the translator 4
Then, translation is performed using the selected technical term dictionary.
Finally, in step S5, the translation result is sent to the Internet browsing device 200 through a communication device (not shown) or inter-process communication.

【0045】閲覧装置200では、受け取った翻訳文書
を表示する。次に、分野別判定用データについて説明す
る。図5は、「分野別判定用データ」の内容形式の一例
とその内容の具体例を示す図である。
The browsing device 200 displays the received translated document. Next, the field-specific determination data will be described. FIG. 5 is a diagram illustrating an example of the content format of the “determination data for each field” and a specific example of the content.

【0046】分野判定用データの各要素は、「データタ
イプ」、「識別データ」、「分野名」の3つのカラムで
構成される。「データタイプ」は、「識別データ」カラ
ムに格納されるデータの種類を示すためのもので、文字
「H」もしくは「D」が格納される。
Each element of the field determination data is composed of three columns of "data type", "identification data", and "field name". The “data type” indicates the type of data stored in the “identification data” column, and stores a character “H” or “D”.

【0047】データタイプが「H」の場合、「識別デー
タ」カラムには、URLで指定される文書識別情報のう
ち、(1)ホスト名、(2)ホスト名+ディレクトリ
名、(3)ホスト名+ディレクトリ名+ファイル名のい
ずれかを格納する。
When the data type is “H”, the “identification data” column contains (1) host name, (2) host name + directory name, and (3) host name of the document identification information specified by the URL. Stores any one of name + directory name + file name.

【0048】データタイプが「D」の場合には、「識別
データ」として、分野識別情報のディレクトリ部分の全
部もしくは一部を格納する。「分野名」カラムには、デ
ータタイプに関わらず「識別データ」に対応する専門分
野に対応する専門分野名を格納しておく。
When the data type is "D", all or part of the directory part of the field identification information is stored as "identification data". In the “field name” column, a field name corresponding to the field corresponding to “identification data” regardless of the data type is stored.

【0049】なお、インターネット以外の場合でも、各
プロトコルに応じて、適宜、分野別判定用データを構成
することが可能である。次に、分野判定部7の処理手順
について説明する。
It should be noted that, even in cases other than the Internet, it is possible to appropriately configure the discrimination data for each field according to each protocol. Next, a processing procedure of the field determination unit 7 will be described.

【0050】図6は、分野判定部7の処理の流れを示す
フローチャートである。この処理は、大きく2つに分か
れており、ステップS110までは「データタイプ」が
「H」のデータを検索する処理、ステップS120以降
は「データタイプ」が「D」のデータを検索する処理で
ある。
FIG. 6 is a flowchart showing the flow of the process of the field determination section 7. This process is roughly divided into two processes. The process up to step S110 is a process of searching for data whose "data type" is "H", and the process after step S120 is a process of searching for data whose "data type" is "D". is there.

【0051】まず、ステップS101で、制御部2から
受け取ったURL形式の文書識別情報から「文書の形
式」部分を取り除き、「ホスト名」以降のデータだけに
し、これを変数Xに代入する。
First, in step S 101, the “document format” portion is removed from the document identification information in the URL format received from the control unit 2, and only the data after the “host name” is substituted for the variable X.

【0052】続くステップS102からステップS10
9で、与えられた文書識別情報ともっとも良く合致する
分野判定用データを検索する。すなわち、ステップS1
02で、変数I,Lにそれぞれ0をセットする。変数I
は、分野判定用データの要素Iを参照するのに用いられ
る。また、変数Lは、変数に代入された文書識別情報と
分野判定用データで文字列の先頭から一致した文字数を
格納するためのものである。
The following steps S102 to S10
In step 9, a search is made for field determination data that best matches the given document identification information. That is, step S1
In 02, 0 is set to each of the variables I and L. Variable I
Is used to refer to the element I of the field determination data. The variable L is for storing the number of matching characters from the beginning of the character string in the document identification information and the field determination data assigned to the variable.

【0053】ステップS103でのチェックで、まだ、
比較していない分野判定用データが残っている場合に
は、ステップS103bでデータタイプが「H」か調べ
る。もしHなら、ステップS104で変数Nに、分野判
定用データの要素Iの識別データの長さを代入し、ステ
ップS105において、ステップS101で変数Xに代
入してある識別データと先頭のN文字が一致するか比較
する。もし違うなら、ステップS109で変数Iの値を
1加算し、ステップS103に戻る。
In the check in step S103,
If there is data for field determination that has not been compared, it is checked in step S103b whether the data type is "H". If H, in step S104, the length of the identification data of the element I of the field determination data is substituted for the variable N, and in step S105, the identification data substituted for the variable X in step S101 and the first N characters are used. Compare for a match. If not, the value of the variable I is incremented by 1 in step S109, and the process returns to step S103.

【0054】ステップS105で先頭のN文字が一致し
た場合には、続くステップS106で変数Nの値が変数
Lの値より大きいか調べる。もしNの値が小さい場合に
はステップS109に進む。もし変数Nの値が大きい場
合には、ステップS107で変数Lに変数Nの値を代入
し、さらに変数Tに分野判定用データの要素Iの分野名
を代入する。
If the first N characters match in step S105, it is checked in next step S106 whether the value of the variable N is larger than the value of the variable L. If the value of N is small, the process proceeds to step S109. If the value of the variable N is large, the value of the variable N is substituted for the variable L in step S107, and the field name of the element I of the field determination data is substituted for the variable T.

【0055】以上、ステップS102からS109の処
理により、制御部2から与えられた文書識別情報にもっ
とも合致する専門分野が検索される。次に、ステップS
110で、変数Lの値が0か調べる。0なら専門分野が
決定できなかったことを意味するので、その場合は、デ
ータタイプがDのデータを使用して分野を決定するため
にステップS120に進む。
As described above, by the processes of steps S102 to S109, the specialized field which best matches the document identification information given from the control unit 2 is searched. Next, step S
At 110, it is checked whether the value of the variable L is 0. If it is 0, it means that the specialized field could not be determined. In that case, the process proceeds to step S120 to determine the field using the data of the data type D.

【0056】一方、ステップS110においてL=0で
なければ、ステップS111に進み、変数Tに格納され
た分野名を送付する。翻訳部4では、送付された分野名
をもとに、その分野に応じた専門用語辞書を選択する。
On the other hand, if L = 0 is not satisfied in step S110, the flow advances to step S111 to send the field name stored in the variable T. The translator 4 selects a technical term dictionary corresponding to the field based on the field name sent.

【0057】ステップS120では、分野判定データを
最初から検索するため変数Iの値を0にリセットする。
ステップS121でのチェックで、まだ比較していない
分野判定データが残っている場合には、ステップS12
2でデータタイプが「D」か調べる。もしDなら、ステ
ップS123で、ステップS101で変数Xに代入して
ある識別データが分野判定データの要素Iの識別データ
を含んでいるか調べる。もし含んでいないなら、ステッ
プS124で変数Iの値を1加算しステップS121に
戻る。
In step S120, the value of the variable I is reset to 0 in order to search the field determination data from the beginning.
If it is determined in step S121 that the field determination data that has not been compared remains, the process proceeds to step S12.
Step 2 checks whether the data type is "D". If D, it is checked in step S123 whether the identification data substituted in the variable X in step S101 includes the identification data of the element I of the field determination data. If not, the value of the variable I is incremented by 1 in step S124, and the process returns to step S121.

【0058】ステップS123で識別データを含んでい
ると分かった場合には、ステップS125で変数Tに分
野判定用データの要素Iの分野名を代入し、その後、ス
テップS111に進み、翻訳部4に変数Tに格納された
分野名を翻訳部4に送り処理を終了する。
If it is determined in step S123 that the identification data is included, the field name of the element I of the field determination data is substituted for the variable T in step S125. The field name stored in the variable T is sent to the translator 4 and the process is terminated.

【0059】なお、上記手順において、最終的に分野名
が選択されなかった場合、(1)前回に選択された専門
用語辞書と同じものを使う、(2)デフォルトを設定し
ておき、デフォルトの専門用語辞書を使う、あるいは
(3)専門用語辞書を使用しない、など種々の方法を取
ることができる。
In the above procedure, if a field name is not finally selected, (1) use the same terminology dictionary selected last time, (2) set a default, Various methods can be employed, such as using a technical term dictionary or (3) not using a technical term dictionary.

【0060】以上のように本実施形態によれば、従来の
ように翻訳するにあたってその都度、文書の内容に応じ
た専門分野辞書を指定する必要がないため、インターネ
ットなどのネットワークを通じて入手した英文文書を効
率良く翻訳し情報を入手することが可能となる。
As described above, according to the present embodiment, it is not necessary to designate a specialized field dictionary corresponding to the contents of a document each time a translation is performed as in the prior art. Can be efficiently translated and information can be obtained.

【0061】なお、本発明は、上記実施形態に限定され
るものではない。上記では専門分野辞書を1つ選択した
が、分野別判定用データの分野名の欄に必要に応じて複
数の分野を登録することで、識別別データに応じて専門
分野辞書を複数選択させることも可能である。なお、複
数の専門分野辞書を選択する場合、分野別判定用データ
に、翻訳にあたってそれら専門分野辞書を使用する優先
順位を登録しておき、翻訳部4は登録された優先準位に
従って複数の専門分野辞書を使用するようにするのが好
ましい。
The present invention is not limited to the above embodiment. In the above description, one specialized field dictionary was selected. However, by registering a plurality of fields as necessary in the field of the field name of the field-specific determination data, a plurality of specialized field dictionaries can be selected according to the identification-specific data. Is also possible. When a plurality of specialty dictionaries are selected, priorities for using these specialty dictionaries in translation are registered in the discrimination data for each field, and the translator 4 assigns a plurality of specialty dictionaries in accordance with the registered priority levels. Preferably, a field dictionary is used.

【0062】本実施形態においては、文書識別情報を用
いて専門分野を決定し、それに基づいて専門分野辞書を
指定していたが、同様の形式で記述した知識を用いて、
翻訳システムに関連する種々のパラメータを変更するこ
とも可能である。例えば、文書の種類(マニュアル、ニ
ュース文、解説記事、商品の説明文など)を推定し、そ
れに応じて訳文における文体(「ですます調」と「であ
る調」)の指定も行うことも可能である。あるいは、文
書の種類を推定し、それに応じて訳文における表現形態
(例えば、英文の命令形を翻訳する場合における「〜し
なさい」と「〜して下さい」の相違)の指定も行うこと
も可能である。その他、翻訳処理に関する種々の設定に
対して本発明を適用することが可能である。
In the present embodiment, the specialized field is determined using the document identification information, and the specialized field dictionary is specified based on the determined field. However, using the knowledge described in the same format,
It is also possible to change various parameters associated with the translation system. For example, it is also possible to estimate the type of document (manual, news, commentary, product description, etc.) and specify the style of the translated text (“Dama-San” and “Dana-Naru”) accordingly. It is. Alternatively, it is also possible to estimate the type of the document and specify the expression form in the translated sentence (for example, the difference between “-do” and “-do” when translating an English imperative form). It is. In addition, the present invention can be applied to various settings related to translation processing.

【0063】本実施形態では、分野判定用データとして
予め登録されているデータのみを用いて分野を決定して
いたが、CRTなどの表示装置とキーボード・マウスな
どの入力装置を使用することにより、分野判定用データ
を使って判定できなかった場合にユーザに問い合わせ、
その結果を分野判定用データとして追加するといったこ
とも可能である。
In this embodiment, the field is determined using only data registered in advance as field determination data. However, by using a display device such as a CRT and an input device such as a keyboard and a mouse, the field can be determined. If it is not possible to make a determination using the data for field determination, ask the user,
It is also possible to add the result as field determination data.

【0064】以下では、本実施形態の機械翻訳装置をコ
ンピュータ上で実現する場合のハードウェアとソフトウ
ェアの構成について説明する。本実施形態の機械翻訳装
置は、ハードウェア構成としては先に言及したように、
CPUと、プログラムや必要なデータを格納するための
RAMと、入出力装置と、ハードディスク装置などの記
憶装置と、通信装置とを用いて構成することができる。
また、図1の制御部2、翻訳部4および分野判定部7
は、それらの処理手順(例えば図2、図3の手順)を記
述したプログラムであって、コンピュータを制御するた
めのプログラムにより実現する。また、各種辞書や分野
判定用データなどは、ハードディスク装置などの記憶装
置に格納する。入手した原文や翻訳結果は、ハードディ
スク装置あるいはRAMなどの記憶装置に格納する。
Hereinafter, a description will be given of hardware and software configurations when the machine translation apparatus of the present embodiment is implemented on a computer. The machine translation device of the present embodiment has a hardware configuration as described above,
It can be configured using a CPU, a RAM for storing programs and necessary data, an input / output device, a storage device such as a hard disk device, and a communication device.
The control unit 2, the translation unit 4, and the field determination unit 7 in FIG.
Is a program describing these processing procedures (for example, the procedures in FIGS. 2 and 3), and is realized by a program for controlling a computer. Also, various dictionaries and field determination data are stored in a storage device such as a hard disk device. The obtained original text and translation result are stored in a storage device such as a hard disk device or a RAM.

【0065】そして、上記プログラムをRAMに格納
し、CPUにより実行させる。CPUは、RAMに格納
されたプログラムの手順に従い、演算や、入出力装置、
通信装置あるいは記憶装置の制御等を行って、所望の機
能を実現して行く。
Then, the above-mentioned program is stored in the RAM and executed by the CPU. The CPU performs operations, input / output devices,
A desired function is realized by controlling a communication device or a storage device.

【0066】上記プログラムは、ROMに格納したもの
を用いても良いが、次のように汎用コンピュータにプロ
グラムをインストールして実現することも可能である。
すなわち、まず、上記プログラムを、コンピュータ読取
可能な記録媒体(例えばフロッピー・ディスクあるいは
CR−ROM等の記録媒体)に記憶させておき、該記録
媒体に応じたディスクドライブ装置を用いて該プログラ
ム読取り、RAMに格納し、実行する。あるいは、一旦
ハードディスク装置等にインストールしておき、実行時
にハードディスク装置等からRAMに格納し、実行す
る。なお、プログラムを格納した記録媒体がICカード
である場合は、ICカードリーダーを用いて該プログラ
ム読取ることができる。あるいは、ネットワークを介し
て所定のインタフェース装置からプログラムを受け取る
こともできる。
The above program may be stored in a ROM, but may be realized by installing the program in a general-purpose computer as follows.
That is, first, the program is stored in a computer-readable recording medium (for example, a recording medium such as a floppy disk or a CR-ROM), and the program is read using a disk drive device corresponding to the recording medium. Store in RAM and execute. Alternatively, the program is temporarily installed in a hard disk device or the like, and is stored in the RAM from the hard disk device or the like at the time of execution and executed. If the recording medium storing the program is an IC card, the program can be read using an IC card reader. Alternatively, a program can be received from a predetermined interface device via a network.

【0067】なお、前述のように、機械翻訳装置のため
のプログラムと閲覧装置のためのプログラムとは、別の
計算機上で実現することも、同じ計算機上で実現するこ
とも可能である。
As described above, the program for the machine translation device and the program for the browsing device can be realized on different computers or on the same computer.

【0068】以上の本実施形態では、原語を英語、訳語
を日本語とする英日機械翻訳装置を例にとって説明した
が、本発明は、原語と訳語の組合せを限定するものでは
なく、例えば、原語をドイツ語、訳語を日本語とする機
械翻訳装置、あるいは原語を日本語、訳語を英語とする
機械翻訳装置など、種々の機械翻訳装置に適用すること
ができる。本発明は、上述した実施の形態に限定される
ものではなく、その技術的範囲において種々変形して実
施することができる。
In the above embodiment, an English-Japanese machine translation apparatus in which the original language is English and the translated word is Japanese has been described as an example. However, the present invention does not limit the combination of the original language and the translated word. The present invention can be applied to various machine translators such as a machine translator that uses German as the original language and Japanese as the translation, or a machine translator that uses Japanese as the original language and English as the translation. The present invention is not limited to the above-described embodiment, and can be implemented with various modifications within the technical scope.

【0069】[0069]

【発明の効果】本発明によれば、翻訳対象となる文書を
入手する際に用いた該文書を特定する文書識別情報に応
じて翻訳処理の基となる所定の条件(例えば翻訳に用い
る専門用語辞書)を設定するようにしたので、従来のよ
うにユーザはその都度翻訳すべき文書の内容に応じて翻
訳環境を適宜設定することが不要になる。したがって、
従来に比べより短い時間で翻訳し情報を閲覧することが
できる。
According to the present invention, a predetermined condition (for example, a technical term used in translation) is used as a basis for translation processing in accordance with document identification information for identifying a document used for obtaining the document to be translated. Since the dictionary is set, the user does not need to appropriately set the translation environment according to the content of the document to be translated each time as in the related art. Therefore,
It is possible to translate and browse information in a shorter time than before.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る機械翻訳システムの
基本的な構成を示すブロック図
FIG. 1 is a block diagram showing a basic configuration of a machine translation system according to an embodiment of the present invention.

【図2】同実施例の翻訳部の基本的な構成を示すブロッ
ク図
FIG. 2 is a block diagram showing a basic configuration of a translation unit according to the embodiment;

【図3】制御部における処理の流れを示すフローチャー
FIG. 3 is a flowchart showing a flow of processing in a control unit.

【図4】文書の識別情報の表現形式の一例を示す図FIG. 4 is a diagram showing an example of an expression format of document identification information.

【図5】分野判定用データのデータ構造とデータの一例
を示す図
FIG. 5 is a diagram showing a data structure of field determination data and an example of the data;

【図6】分野判定部における処理の流れを示すフローチ
ャート
FIG. 6 is a flowchart showing a flow of processing in a field determination unit.

【符号の説明】[Explanation of symbols]

1…入力部 2…制御部 3…通信部 4…翻訳部 5…出力部 6…翻訳用辞書 7…分野判定部 8…分野判定用データ 100…機械翻訳装置 200…インターネット用閲覧装置 DESCRIPTION OF SYMBOLS 1 ... Input part 2 ... Control part 3 ... Communication part 4 ... Translation part 5 ... Output part 6 ... Translation dictionary 7 ... Field determination part 8 ... Field determination data 100 ... Machine translation apparatus 200 ... Internet browsing apparatus

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】通信装置によりネットワークを介して他の
計算機上に格納された第1の言語の文書をアクセスし、
この入手した第1の言語の文書に、所定の条件に基づく
翻訳処理を施して第2の言語の文書を生成する機械翻訳
方法であって、 前記翻訳処理の実行に先だって、前記アクセスの際に用
いる前記第1の言語の文書を特定する文書識別情報をも
とにして、前記翻訳処理の基となる前記所定の条件を設
定することを特徴とする機械翻訳方法。
1. A document in a first language stored on another computer via a network by a communication device is accessed,
A machine translation method for performing a translation process based on a predetermined condition on the obtained document in the first language to generate a document in a second language, wherein, prior to performing the translation process, A machine translation method, wherein the predetermined condition serving as a basis for the translation processing is set based on document identification information for specifying a document in the first language to be used.
【請求項2】入手すべき文書を特定する文書識別情報の
指定を受け、 前記文書識別情報を用いてネットワークを介して前記文
書を入手するとともに、前記文書識別情報をもとにして
翻訳結果を調整可能なパラメータを設定し、 設定された前記パラメータに基づいて、入手された前記
文書を所定の言語に翻訳することを特徴とする機械翻訳
方法。
2. Receiving designation of document identification information for specifying a document to be obtained, obtaining the document via a network using the document identification information, and translating a translation result based on the document identification information. A machine translation method comprising: setting adjustable parameters; and translating the obtained document into a predetermined language based on the set parameters.
【請求項3】前記文書識別情報は、文書の形式、ホスト
名、ディレクトリ名、ファイル名の要素からなるもので
あり、 ホスト名、ディレクトリ名およびファイル名のうちの少
なくとも1つの要素をもとにして前記所定の条件を設定
することを特徴とする請求項1または2に記載の機械翻
訳方法。
3. The document identification information includes elements of a document format, a host name, a directory name, and a file name, and is based on at least one of the host name, the directory name, and the file name. The machine translation method according to claim 1, wherein the predetermined condition is set by setting.
【請求項4】前記所定の条件は、翻訳の際に使用する専
門用語辞書を示すものであることを特徴とする請求項1
ないし3のいずれか1項に記載の機械翻訳方法。
4. The system according to claim 1, wherein the predetermined condition indicates a technical term dictionary used for translation.
4. The machine translation method according to any one of items 3 to 3.
【請求項5】前記所定の条件は、訳文において用いるべ
き文体を示すものであることを特徴とする請求項1ない
し3のいずれか1項に記載の機械翻訳方法。
5. The machine translation method according to claim 1, wherein the predetermined condition indicates a style to be used in a translated sentence.
【請求項6】入手すべき文書を特定する文書識別情報を
用いてネットワークを介して入手した第1の言語の文書
を第2の言語に翻訳する際に用いる専門用語辞書を選択
する専門用語辞書選択方法であって、 前記文書識別情報の全部または一部からなる識別データ
と選択すべき専門用語辞書を指示する分野データとを対
応付けて登録した分野判定用データにおける識別データ
と、前記文書識別情報とを比較し、 この比較の結果に応じて、選択すべき専門用語辞書を決
定することを特徴とする専門用語辞書選択方法。
6. A technical term dictionary for selecting a technical term dictionary used when translating a document in a first language obtained through a network into a second language using document identification information for specifying a document to be obtained. A selection method, wherein identification data in field determination data registered in association with identification data consisting of all or a part of the document identification information and field data indicating a technical term dictionary to be selected; A technical term dictionary selecting method comprising comparing information with information and determining a technical term dictionary to be selected according to the result of the comparison.
【請求項7】前記文書識別情報は、文書の形式(プロト
コル名など)、ホスト名、ディレクトリ名、ファイル名
の要素からなるものであり、 ホスト名、ディレクトリ名およびファイル名のうちの少
なくとも1つの要素をもとにして選択すべき専門用語辞
書を決定することを特徴とする請求項6に記載の専門用
語辞書選択方法。
7. The document identification information includes elements of a document format (eg, protocol name), a host name, a directory name, and a file name, and at least one of a host name, a directory name, and a file name. 7. The technical term dictionary selection method according to claim 6, wherein a technical term dictionary to be selected is determined based on the element.
【請求項8】前記分野判定用データは、ホスト名、ホス
ト名およびディレクトリ名の組、またはホスト名、ディ
レクトリ名およびファイル名の組と、選択すべき専門用
語辞書とを対応付けて登録した第1の分野判定用データ
と、ディレクトリ名の一部または全部と、選択すべき専
門用語辞書とを対応付けて登録した第2の分野判定用デ
ータからなり、 前記比較にあたって、前記文書識別情報のホスト名、ホ
スト名およびディレクトリ名の組、またはホスト名、デ
ィレクトリ名およびファイル名の組と、前記第1の分野
判定用データに属するいずれかの識別データとが一致し
た場合には、最長一致した識別データに対応する分野デ
ータにより選択すべき専門用語辞書を決定し、前記第1
の分野判定用データにより専門用語辞書が決定できず、
かつ、前記第2の分野判定用データに属する識別データ
のうちに前記文書識別情報に包含されるものが存在する
場合には、該文書識別情報に包含される識別データに対
応する分野データにより選択すべき専門用語辞書を決定
することを特徴とする請求項7に記載の専門用語辞書選
択方法。
8. The data for discriminating fields includes a host name, a set of a host name and a directory name, or a set of a host name, a directory name and a file name and a terminology dictionary to be selected and registered in association with each other. 1 field determination data, part or all of a directory name, and second field determination data registered in association with a terminology dictionary to be selected. In the comparison, the host of the document identification information is used. If the set of name, host name and directory name, or the set of host name, directory name and file name matches any of the identification data belonging to the first field determination data, the longest matching identification A terminology dictionary to be selected is determined based on field data corresponding to the data,
The technical term dictionary could not be determined by the field judgment data of
In the case where there is identification data belonging to the document identification information among the identification data belonging to the second field determination data, the identification data is selected by the field data corresponding to the identification data included in the document identification information. 8. The technical term dictionary selection method according to claim 7, wherein a technical term dictionary to be determined is determined.
JP16975996A 1996-06-28 1996-06-28 Technical term dictionary selection device Expired - Lifetime JP3450598B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16975996A JP3450598B2 (en) 1996-06-28 1996-06-28 Technical term dictionary selection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16975996A JP3450598B2 (en) 1996-06-28 1996-06-28 Technical term dictionary selection device

Publications (2)

Publication Number Publication Date
JPH1021222A true JPH1021222A (en) 1998-01-23
JP3450598B2 JP3450598B2 (en) 2003-09-29

Family

ID=15892333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16975996A Expired - Lifetime JP3450598B2 (en) 1996-06-28 1996-06-28 Technical term dictionary selection device

Country Status (1)

Country Link
JP (1) JP3450598B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073604A (en) * 2000-08-30 2002-03-12 Oki Electric Ind Co Ltd Device for providing translation service
JP2003099665A (en) * 2001-09-21 2003-04-04 Tsubasa System Co Ltd Information acquisition method about foreign vehicle
US7089493B2 (en) 2001-09-25 2006-08-08 International Business Machines Corporation Method, system and program for associating a resource to be translated with a domain dictionary
US7318021B2 (en) 2001-03-02 2008-01-08 International Business Machines Corporation Machine translation system, method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073604A (en) * 2000-08-30 2002-03-12 Oki Electric Ind Co Ltd Device for providing translation service
US7318021B2 (en) 2001-03-02 2008-01-08 International Business Machines Corporation Machine translation system, method and program
JP2003099665A (en) * 2001-09-21 2003-04-04 Tsubasa System Co Ltd Information acquisition method about foreign vehicle
US7089493B2 (en) 2001-09-25 2006-08-08 International Business Machines Corporation Method, system and program for associating a resource to be translated with a domain dictionary

Also Published As

Publication number Publication date
JP3450598B2 (en) 2003-09-29

Similar Documents

Publication Publication Date Title
US10733259B2 (en) Web page access method and apparatus
US7234110B2 (en) Apparatus and method for providing dynamic multilingual web pages
US7877251B2 (en) Document translation system
US6101472A (en) Data processing system and method for navigating a network using a voice command
US8117021B2 (en) Method and apparatus for testing a software program using mock translation input method editor
US6119078A (en) Systems, methods and computer program products for automatically translating web pages
JP4344693B2 (en) System and method for browser document editing
JPH10124413A (en) Method for priority order down loading of buried web object and device therefor
US6615168B1 (en) Multilingual agent for use in computer systems
US7310627B2 (en) Method of searching for text in browser frames
US20060059247A1 (en) Automatic simultaneous entry of values in multiple web page fields
US20020152064A1 (en) Method, apparatus, and program for annotating documents to expand terms in a talking browser
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
KR20190033821A (en) Folder Recommending Method and Apparatus Thereof
US10853558B2 (en) Transforming digital text content using expressions
JPH1021222A (en) Machine translation method and terminology dictionary selecting method
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
JPH10143529A (en) Automatic pilot device
US20020087302A1 (en) Processing system, processing method and recording medium
JP4010589B2 (en) Document retrieval system and retrieval document presentation method applied to the system
JP3467159B2 (en) Multilingual communication system, server device, and document transmission method for server device
KR20020049417A (en) Method for making web document type of image and system for reading web document made by using of said method
WO2022061857A1 (en) Method for operating a terminal when accessing a web page defined by a code in a markup language
KR20080033689A (en) System and method for semi-automatic translating service
JPH11259477A (en) Document processing system and storage medium

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080711

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090711

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090711

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100711

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100711

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110711

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130711

Year of fee payment: 10

EXPY Cancellation because of completion of term