JP2001060195A - Machine translation system - Google Patents

Machine translation system

Info

Publication number
JP2001060195A
JP2001060195A JP11235112A JP23511299A JP2001060195A JP 2001060195 A JP2001060195 A JP 2001060195A JP 11235112 A JP11235112 A JP 11235112A JP 23511299 A JP23511299 A JP 23511299A JP 2001060195 A JP2001060195 A JP 2001060195A
Authority
JP
Japan
Prior art keywords
document
translation
dictionary
bilingual
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11235112A
Other languages
Japanese (ja)
Other versions
JP3761364B2 (en
Inventor
Tatsuya Sukehiro
達哉 介弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP23511299A priority Critical patent/JP3761364B2/en
Publication of JP2001060195A publication Critical patent/JP2001060195A/en
Application granted granted Critical
Publication of JP3761364B2 publication Critical patent/JP3761364B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To simplify operations, to improve hadleability and to provide the translated document of high quality by automatically setting a translation environment supply means for supplying a translation environment for translation corresponding to the correspondence relation of a translation origin document and a field instruction means or the like. SOLUTION: A communication control means 103 controls communications with an external network 108 and a perusal means 101, and a translation control means 104 is provided with a function for performing direct control to a machine translation means 105 such as which document is to be translated and which dictionary is to be used. That is, the setting of the translation environment to the machine translation means 105 is directly executed. The machine translation means 105 translates a supplied document to another language under the control of the translation control means 104. In this case, the field instruction means for indicating special fields to which the individual translation origin documents belong are correlated by a hierarchical structure corresponding to the relation of the respective special fields and managed, and the translation environment supply means for supplying the translation environment for the translation is automatically set in accordance with the correspondence relation of the translation document and the field instruction means and the relation among the field instruction means in the hierarchical structure.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は機械翻訳システムに
関し、例えば自動的に選択した適切な専門用語辞書を用
いて自然言語を機械翻訳する場合などに適用し得るもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation system, and can be applied to, for example, a case where a natural language is machine-translated using an appropriate technical term dictionary automatically selected.

【0002】[0002]

【従来の技術】従来の機械翻訳方法及び専門用語辞書選
択方法について記載したものとしては、次の文献1があ
る。
2. Description of the Related Art The following literature 1 describes a conventional machine translation method and a technical term dictionary selection method.

【0003】文献1:特開平10−21222号公報 上記文献1は、翻訳対象となる文書を入手する際に用い
た文書識別情報(URL(Uniform Resource Locato
r))の文字列を、予め設定してある分野判定用データ
と比較し、この比較で一致した文字数などに基づいて、
もっとも合致する専門分野を検索している。
Reference 1: Japanese Patent Application Laid-Open No. H10-21222 The above reference 1 discloses document identification information (URL (Uniform Resource Locato) used for obtaining a document to be translated.
r)) is compared with the field determination data set in advance, and based on the number of characters matched in this comparison, etc.
Searching for the best matching specialty.

【0004】そして、当該もっとも合致する専門分野に
応じた専門用語辞書を自動的に設定して機械翻訳を行う
ことにより、ユーザに複雑な設定を強いることなく、高
品質の翻訳結果を得ることができる。
[0004] By automatically setting up a technical term dictionary corresponding to the most specialized technical field and performing machine translation, a high-quality translation result can be obtained without forcing the user to make complicated settings. it can.

【0005】[0005]

【発明が解決しようとする課題】しかしながらURL
は、本来、その文書のある場所(Location)を一意に表
すための表記方法であって、必ずしも当該文書の内容の
所属分野を表す文字列をそのURLに使用しているとは
かぎらない。したがって、URLを調べただけでは、文
書の属する分野がわからないことも多い。
SUMMARY OF THE INVENTION However, URL
Is a notation method for uniquely representing a certain location of the document, and does not always use a character string representing the field to which the content of the document belongs in the URL. Therefore, it is often difficult to determine the field to which a document belongs simply by examining the URL.

【0006】すなわち、前記分野判定用データのうち、
あるURLに対しもっとも合致する分野判定用データ
が、正確にその翻訳対象文書の属する分野に対応してい
る保証はない。
That is, of the field determination data,
There is no guarantee that the field determination data that best matches a certain URL accurately corresponds to the field to which the translation target document belongs.

【0007】また、内容面から見ると、翻訳対象となる
任意の1文書は、複数の分野に属するものもあるし、そ
の専門性の高さについても、高低さまざまな内容を含ん
でいる可能性がある。
[0007] Further, from the viewpoint of the contents, an arbitrary document to be translated may belong to a plurality of fields, and the degree of specialization may include various contents. There is.

【0008】URLと分野判定用データの比較から、こ
れらの問題に適切に対応することは、翻訳対象文書の属
する分野を正確に特定する以上に困難であると考えられ
る。
From the comparison between the URL and the data for field determination, it is considered that it is more difficult to appropriately address these problems than to accurately specify the field to which the document to be translated belongs.

【0009】[0009]

【課題を解決するための手段】かかる課題を解決するた
めに、本発明では、受信した第1の言語の翻訳元文書
を、設定された翻訳環境下で、第2の言語の翻訳先文書
に翻訳する機械翻訳システムにおいて、(1)各翻訳元
文書が属する専門分野を示す分野指示手段を、各専門分
野の関係に応じた階層構造で関連付けて管理する階層型
分野管理手段と、(2)当該階層構造中の各分野指示手
段に対応した翻訳環境を供給する翻訳環境供給手段と、
(3)前記翻訳の際には、翻訳元文書と分野指示手段の
対応関係、及び前記階層構造中における分野指示手段間
の関係に応じて、当該翻訳のために翻訳環境を供給する
1又は複数の翻訳環境供給手段を自動的に設定する翻訳
環境設定手段とを備えることを特徴とする。
According to the present invention, in order to solve the above-mentioned problem, a received translation source document of a first language is converted into a translation destination document of a second language under a set translation environment. In a machine translation system for translation, (1) hierarchical field management means for managing field indicating means indicating a field of expertise to which each source document belongs in a hierarchical structure corresponding to the relationship of each field of specialization, and (2) Translation environment supply means for supplying a translation environment corresponding to each field instruction means in the hierarchical structure;
(3) At the time of the translation, one or more translation environments are provided for the translation in accordance with the correspondence between the source document and the field designating means and the relationship between the field designating means in the hierarchical structure. And a translation environment setting means for automatically setting the translation environment supply means.

【0010】[0010]

【発明の実施の形態】(A)実施形態 第1〜第5の実施形態の機械翻訳通信システムは、所定
の産業技術体系にしたがって分野を階層化し、文書をそ
の階層化された分野ごとに選別してあるディレクトリサ
ービスなどにおいて、翻訳に使用する(専門)用語辞書
を自動的に、きめ細かく設定することによって、簡単に
高品質の翻訳結果を得ることを特徴とする。
DESCRIPTION OF THE PREFERRED EMBODIMENTS (A) Embodiment The machine translation communication system according to the first to fifth embodiments hierarchizes fields according to a predetermined industrial technology system, and sorts documents according to the hierarchized fields. In a directory service or the like, a (specialized) term dictionary used for translation is automatically and finely set so that high-quality translation results can be easily obtained.

【0011】すなわち、第1〜第5の実施形態は、イン
ターネットなどのディレクトリサービスと連携すること
によって、簡単な操作で、高い翻訳品質を実現できるデ
ィレクトリサービス向け機械翻訳通信システムを提供す
るものである。
That is, the first to fifth embodiments provide a machine translation communication system for a directory service capable of realizing high translation quality with a simple operation by cooperating with a directory service such as the Internet. .

【0012】ここで、分野とは、例えば「通信」、「コ
ンピュータ」、「インターネット」などの工業技術、産
業技術や学術などのいずれかの専門分野のことも意味す
るが、それだけではなく、例えば、専門性が高くなくて
一般用語辞書を使用するようなケースでは、当該「一
般」も分野の1つである。
Here, the field means any specialized field such as industrial technology such as "communication", "computer", and "Internet", or any technical field such as industrial technology or academic field. In a case where a general term dictionary is used because of lack of specialty, the “general” is one of the fields.

【0013】用語辞書を決定し、機械翻訳を実行するデ
ィレクトリサーバの側では、各カテゴリ(分野)の関係
を忠実に反映したディレクトリの階層構造(木構造)を
用意している。
A directory server that determines a term dictionary and executes machine translation prepares a directory hierarchical structure (tree structure) that faithfully reflects the relationship between each category (field).

【0014】この階層構造では、最上位のルートから下
位にいくほど専門性が高まるようにカテゴリおよび用語
辞書を配置しているので、目的のカテゴリにアクセスす
るには、専門性が高まるほど下位に向かって階層構造を
たどっていくことになる。
In this hierarchical structure, the categories and term dictionaries are arranged so that the specialty increases from the highest level to the lower level. Therefore, in order to access a target category, the higher the degree of specialty is, the lower the level is. It follows a hierarchical structure.

【0015】通常のデータベースにおいては、階層型の
論理構造は、カテゴリ(データ)を上位から下位へだけ
たどる場合には適するが、反対に、下位から上位にたど
る必要がある場合には、目的のデータを見つけるまでの
手順が多く複雑になるために適さないとされている。
In an ordinary database, a hierarchical logical structure is suitable for tracing categories (data) from the top to the bottom. It is said that the procedure for finding the data is not suitable because it is complicated.

【0016】しかしながら本発明の各実施形態の階層構
造においては、下位から上位へのたどり方は、目的のデ
ータを見つけるためではなく、1つの機械翻訳に使用す
る辞書セットを構築するためであるから、下位から上位
へのアクセスは木構造のひとつづきの枝に沿って固定的
に行われ、手順を複雑化する危惧もない。産業技術体系
における各分野の位置づけに対応した階層構造を予めつ
くっておくことにより、このような簡単な処理で、所望
の辞書セットを構築することができる。
However, in the hierarchical structure of each embodiment of the present invention, the method of tracing from lower to higher is not to find target data but to construct a dictionary set used for one machine translation. The access from the lower level to the upper level is fixedly performed along each branch of the tree structure, and there is no danger of complicating the procedure. By creating a hierarchical structure corresponding to the position of each field in the industrial technology system in advance, a desired dictionary set can be constructed by such simple processing.

【0017】なお、第1〜第5の実施形態では、URL
はその本来の目的の通り、ネットワーク上で文書のある
場所を一意的に特定するために使用されるが、当該UR
Lは、各文書が、前記階層構造のなかでいずれのカテゴ
リに属するかを決定する際にも使用される。
In the first to fifth embodiments, the URL
Is used to uniquely identify the location of the document on the network, as its original purpose.
L is also used to determine which category each document belongs to in the hierarchical structure.

【0018】(A−1)第1の実施形態の構成 図1に本実施形態の機械翻訳通信システム10の構成を
示す。
(A-1) Configuration of First Embodiment FIG. 1 shows the configuration of a machine translation communication system 10 according to the present embodiment.

【0019】図1において、この機械翻訳通信システム
10は、閲覧手段(ユーザ端末)101と、ディレクト
リサーバ102と、外部ネットワーク108を備えてい
る。
In FIG. 1, the machine translation communication system 10 includes a browsing unit (user terminal) 101, a directory server 102, and an external network 108.

【0020】このうちディレクトリサーバ102は、通
信制御手段103と、翻訳制御手段104と、機械翻訳
手段105と、階層型データベース106と、辞書デー
タベース107とを備えている。辞書データベース10
7は、1例として、一般用語辞書D1と、情報辞書D2
と、コンピュータ辞書D3と、インターネット辞書D4
と、パソコン辞書D5と、パソコン通信辞書D6の各辞
書を備えているものとする。
The directory server 102 includes a communication control unit 103, a translation control unit 104, a machine translation unit 105, a hierarchical database 106, and a dictionary database 107. Dictionary database 10
7 is a general term dictionary D1 and an information dictionary D2 as an example.
, A computer dictionary D3, and an Internet dictionary D4
And a personal computer dictionary D5 and a personal computer communication dictionary D6.

【0021】前記閲覧手段101は、ネットワーク上の
指定したアドレス(URL)の情報を閲覧画面に表示し
てユーザに知らせる機能(閲覧ソフト、例えばWebブ
ラウザ)を搭載しているユーザ端末である。図1の例で
は、当該閲覧手段101はディレクトリサーバ102と
直接接続されているが、閲覧手段101とディレクトリ
サーバ102の接続は、ネットワーク108を介して行
われるようにしてもよい。
The browsing means 101 is a user terminal equipped with a function (browsing software, for example, a Web browser) for displaying information of a designated address (URL) on a network on a browsing screen to inform the user. In the example of FIG. 1, the browsing unit 101 is directly connected to the directory server 102. However, the connection between the browsing unit 101 and the directory server 102 may be performed via the network 108.

【0022】辞書データベース107はカテゴリ毎に分
類した翻訳用の辞書D1〜D6を蓄積し、管理している
データベースで、外部ネットワーク108はインターネ
ットなどのネットワークであり、当該ディレクトリサー
バ102も当該ネットワーク108上に配置されてい
る。
The dictionary database 107 is a database for storing and managing translation dictionaries D1 to D6 classified by category. The external network 108 is a network such as the Internet. Are located in

【0023】通信制御手段103は外部ネットワーク1
08や閲覧手段101との通信を制御する機能を備え、
翻訳制御手段104はどの文書を翻訳するか、どの辞書
を使用するかなどの機械翻訳手段105に対する直接的
な制御を行う機能を備えている。すなわち、機械翻訳手
段105に対する翻訳環境の設定を、直接実行する部分
である。
The communication control means 103 is connected to the external network 1
08 and a function of controlling communication with the browsing unit 101.
The translation control unit 104 has a function of directly controlling the machine translation unit 105 such as which document is to be translated and which dictionary is to be used. That is, it is a part for directly setting the translation environment for the machine translation means 105.

【0024】そして機械翻訳手段105は、翻訳制御手
段104の制御下で、与えられた文書を他の言語に翻訳
する。機械翻訳手段105としては、既存の機械翻訳シ
ステムを利用できる。翻訳対象となる文書は、ユーザ端
末101からの指定に基づいてディレクトリサーバ10
2がネットワーク108から入手する文書である。
The machine translation unit 105 translates the given document into another language under the control of the translation control unit 104. As the machine translation means 105, an existing machine translation system can be used. The document to be translated is stored in the directory server 10 based on the designation from the user terminal 101.
Reference numeral 2 denotes a document obtained from the network 108.

【0025】階層型データベース106は機能上、ディ
レクトリサーバ102の中心をなす部分で、図2に示す
ような階層ディレクトリ11を論理的に構成するため、
ネットワーク108上の文書の属性情報(文書アドレ
ス)を一元管理している。
The hierarchical database 106 is functionally a central part of the directory server 102, and logically constitutes the hierarchical directory 11 as shown in FIG.
The attribute information (document address) of the document on the network 108 is centrally managed.

【0026】すなわち、階層型データベース106は、
ネットワーク108上の文書を、図2に示す細かいカテ
ゴリごとに分類している。
That is, the hierarchical database 106
The documents on the network 108 are classified into fine categories shown in FIG.

【0027】図2において、楕円で示したものはひとつ
のカテゴリに相当し、各カテゴリは固有のアドレス(U
RL)によって指定される。各カテゴリはさらに細かな
カテゴリヘのリンクを持っている。それぞれのカテゴリ
はその専門用語辞書を持っているが、すべてのカテゴリ
が辞書を持つ必要はない。
In FIG. 2, the ellipses correspond to one category, and each category has a unique address (U
RL). Each category has links to more detailed categories. Each category has its own terminology dictionary, but not all categories need to have a dictionary.

【0028】また、それぞれのカテゴリは0個以上の外
部ネットワーク108ヘのリンクURL1〜URL7を
持っている(図で四角で示した部分)。
Each category has zero or more links URL1 to URL7 to the external network 108 (portions indicated by squares in the figure).

【0029】図2の階層ディレクトリ11は最上位の1
カテゴリであるルートCT1、最上位から2番目の階層
に属する趣味CT2、コンピュータCT3、情報CT4
の3つのカテゴリ、最上位から3番目の階層に属するイ
ンターネットCT5、コンピュータ雑誌CT6、ハード
ウエア(コンピュータ関連のハードウエア)CT7、ソ
フトウエアCT8の4カテゴリ、最上位から4番目の階
層に属するインターネット雑誌CT9、パソコン雑誌C
T10、Java雑誌CT11の3カテゴリを備えてい
る。
The hierarchical directory 11 shown in FIG.
Root CT1, which is a category, hobby CT2 belonging to the second highest hierarchy, computer CT3, information CT4
Internet CT5, computer magazine CT6, hardware (computer-related hardware) CT7, software CT8 belonging to the third category from the top, and Internet CT5 belonging to the fourth hierarchy from the top CT9, PC magazine C
It has three categories of T10 and Java magazine CT11.

【0030】このほか、各カテゴリCT3、CT5、C
T7、CT8には、上述した外部ネットワーク108へ
のリンクURL1〜URL7が存在する。
In addition, each category CT3, CT5, C
At T7 and CT8, there are links URL1 to URL7 to the external network 108 described above.

【0031】そして最上位のカテゴリCT1には専門性
のない一般的な用語や文章表現を収録した一般用語辞書
D1が接続され、最上位から2番目のコンピュータカテ
ゴリCT3には、コンピュータ関連のなかでは専門性の
低いコンピュータ辞書D3が接続され、情報カテゴリC
T4には情報関連の情報辞書D3が接続されている。
The top category CT1 is connected to a general term dictionary D1 containing general terms and sentence expressions having no specialty, and the second highest computer category CT3 is a computer-related category. A computer dictionary D3 with low expertise is connected, and information category C
An information dictionary D3 related to information is connected to T4.

【0032】最上位から3番目のインターネットカテゴ
リCT3には、コンピュータ関連のなかでも特にインタ
ーネット関連の用語や文章表現を収録したインターネッ
ト辞書D4が接続されている。インターネット辞書D4
はコンピュータ辞書D3に比べて、産業技術体系のなか
に占める範囲は狭く、専門性は高い。
To the third highest Internet category CT3, there is connected an Internet dictionary D4 containing Internet-related terms and sentence expressions among computer-related items. Internet dictionary D4
Has a smaller area in the industrial technology system than the computer dictionary D3, and has a high degree of specialty.

【0033】なお、図2には図1の辞書D5およびD6
については図示していないが、辞書D5、D6も通常、
図示しないどこかのカテゴリに接続される。
FIG. 2 shows the dictionaries D5 and D6 of FIG.
Are not shown, but the dictionaries D5 and D6 are usually
Connected to some category not shown.

【0034】内部に前記データベース106,107を
備えているディレクトリサーバ102は、全体として
も、ディレクトリサービスに登録された属性情報に関す
る一種の汎用的なデータベースとして機能する。ここで
は、当該属性情報として、前記各カテゴリに含まれるネ
ットワーク108上の各文書のアドレスを一元的に管理
している。
The directory server 102 having the databases 106 and 107 therein functions as a kind of general-purpose database relating to attribute information registered in the directory service as a whole. Here, as the attribute information, the addresses of the respective documents on the network 108 included in the respective categories are centrally managed.

【0035】したがってディレクトリサーバ102は、
管理している文書アドレスに関しては、このネットワー
ク108上の情報(文書)をカテゴリ毎に分類し、利用
者が欲しい情報を探すための手助けを行なうことができ
る。
Therefore, the directory server 102
With respect to the managed document addresses, the information (documents) on the network 108 are classified by category, and it is possible to assist the user in searching for desired information.

【0036】図4に、ディレクトリサービスのページの
表示例を示す。
FIG. 4 shows a display example of a directory service page.

【0037】図4において、ブラウザを表示するウイン
ドウ401のなかには、アドレスが表示されるテキスト
フィールド402と、当該アドレスの情報を表示する情
報エリア403とがある。
Referring to FIG. 4, a window 401 for displaying a browser includes a text field 402 for displaying an address and an information area 403 for displaying information on the address.

【0038】テキストフィールド402からは、閲覧し
たいネットワーク108上の文書のアドレスや、階層デ
ィレクトリ11中のカテゴリのアドレスを直接入力する
こともできる。
From the text field 402, the address of a document on the network 108 to be viewed or the address of a category in the hierarchical directory 11 can be directly input.

【0039】図4の例では、情報エリア403に表示さ
れている情報は、ディレクトリサービス内の前記「コン
ピュータ雑誌」のカテゴリCT6である。
In the example of FIG. 4, the information displayed in the information area 403 is the category CT6 of the "computer magazine" in the directory service.

【0040】情報エリア403中で、「コンピュータ雑
誌」の表記M1の下にある、「インターネット雑誌」の
表記M2、「パソコン雑誌」の表記M3、「Java雑
誌」の表記M4は、それぞれ現在のカテゴリであるコン
ピュータ雑誌よりも1つ下位のカテゴリCT9〜CT1
1を示していて、各表記M2〜M4を、例えばクリック
することにより、そのカテゴリヘ移動することができ
る。
In the information area 403, under the notation M1 of "computer magazine", the notation M2 of "Internet magazine", the notation M3 of "PC magazine", and the notation M4 of "Java magazine" are respectively the current category. Category CT9 to CT1 that is one level lower than the computer magazine
1, the notation M2 to M4 can be moved to the category by, for example, clicking.

【0041】情報エリア403のなかで、中央部のライ
ンL1より下に示された「××マガジン」の表記M5、
「PC△△△」の表記M6は、現在のカテゴリCT6に
分類された外部ネットワーク108上のタイトルを表示
していて、ここをクリックすることにより外部ネットワ
ーク108上の情報(文書の内容)を取得し表示するこ
とができる。
In the information area 403, the notation M5 of "XX magazine" shown below the center line L1,
The notation M6 of "PC @" indicates the title on the external network 108 classified into the current category CT6, and clicking this obtains information (contents of the document) on the external network 108. And can be displayed.

【0042】なお、前記「××マガジン」や「PC△△
△」は、当該ディレクトリサーバ102がその文書アド
レスを管理していて、なおかつその文書内容が階層ディ
レクトリ11のなかのいずれのカテゴリに属するかを予
め決定しているため、表記M5、M6として表示できる
ものである。
The "xx magazine" and "PC @
The symbol “Δ” can be displayed as notations M5 and M6 because the directory server 102 manages the document address and determines in advance which category of the hierarchical directory 11 the document content belongs to. Things.

【0043】ディレクトリサーバ102の管理範囲外の
ネットワーク108上の一般の文書については、各カテ
ゴリに属するかどうかが不明であり、このように表示す
ることはできない。
Regarding general documents on the network 108 outside the management range of the directory server 102, it is not known whether or not they belong to each category, and cannot be displayed in this way.

【0044】以上のようなウインドウ401の機能に着
目すると、ユーザが閲覧手段101で、図4の表示状態
を得るまでの手順は、まずディレクトリサーバ102の
URLを指定してルートカテゴリCT1の情報をウイン
ドウ401に表示し、次いで、「コンピュータ」の表記
をクリックしてコンピュータカテゴリCT3を選択し、
最後に「コンピュータ雑誌」の表記をクリックしてコン
ピュータ雑誌カテゴリCT6を選択するという手順とな
るのが普通である。この場合、ユーザは、階層ディレク
トリ11を上位から下位にたどっていることになる。
Focusing on the function of the window 401 as described above, the procedure until the user obtains the display state of FIG. 4 by the browsing means 101 is as follows. First, the URL of the directory server 102 is specified and the information of the root category CT1 is obtained. Displayed in window 401, then click on the word "computer" to select computer category CT3,
Finally, the procedure is usually such that the notation "computer magazine" is clicked to select the computer magazine category CT6. In this case, the user follows the hierarchical directory 11 from the upper level to the lower level.

【0045】もちろん、図4の状態でテキストフィール
ド402に表示されているコンピュータ雑誌カテゴリC
T6のURLを、ユーザが知っている場合には、当該U
RLを入力することで、最初から図4の表示状態を得る
こともできる。
Of course, the computer magazine category C displayed in the text field 402 in the state of FIG.
If the user knows the URL of T6,
By inputting RL, the display state of FIG. 4 can be obtained from the beginning.

【0046】本実施形態では、現在表示されているカテ
ゴリ(文書)の情報と、表示したい文書(ターゲット文
書)の情報がわかるように、この機能をCGI(Com
mon Gateway Interface)を用い
て実現するものとする。
In the present embodiment, this function is implemented by CGI (Comm) so that the information of the currently displayed category (document) and the information of the document to be displayed (target document) can be understood.
mon Gateway (Mon. Gateway Interface).

【0047】結局、図4の状態で、表記M5およびM6
を獲得するためには、当該文書アドレスがディレクトリ
サーバ102の管理範囲内であるとともに、CGIであ
ることが必要となる。
Eventually, in the state of FIG. 4, the notations M5 and M6
In order to obtain the document address, the document address must be within the management range of the directory server 102 and must be a CGI.

【0048】ネットワーク108から、ディレクトリサ
ーバ102が翻訳対象となる文書を受信し、当該翻訳対
象文書がディレクトリサーバ102の管理範囲内の文書
であった場合、ディレクトリサーバ102は当該文書に
翻訳環境識別子を付与することができる。
When the directory server 102 receives a document to be translated from the network 108 and the document to be translated is a document within the management range of the directory server 102, the directory server 102 assigns a translation environment identifier to the document. Can be granted.

【0049】翻訳環境識別子は、ディレクトリサーバ1
02の処理によって(翻訳対象)文書ごとに生成され、
文書に付与された形で、当該文書とともにユーザ端末1
01に送信される。
The translation environment identifier is stored in the directory server 1
02 for each document (to be translated)
The user terminal 1 together with the document in a form attached to the document
01 is sent.

【0050】ユーザ端末101に送られた1文書が、例
えば、複数の分野に属する場合には、当該複数分野のう
ち当該文書の内容に最もふさわしい1分野だけを、当該
翻訳環境識別子によって表示する。
If one document sent to the user terminal 101 belongs to, for example, a plurality of fields, only one of the plurality of fields that is most suitable for the contents of the document is displayed by the translation environment identifier.

【0051】最もふさわしい1分野を、当該文書のなか
で最も専門性の高い部分に対応した1分野とすること
で、当該複数分野が木構造(階層構造)のなかのひとつ
づきの枝に存在する複数のカテゴリである場合は、対応
することができる。
The most suitable one field is set as one field corresponding to the most specialized part in the document, so that the plurality of fields exist in each branch of the tree structure (hierarchical structure). If there are multiple categories, they can be handled.

【0052】この場合、ひとつづきの枝に存在する各カ
テゴリの辞書を、下位から上位へ統合して、当該1文書
の翻訳に使用する辞書セットを構築することができるか
らである。
In this case, the dictionaries of each category existing in one branch can be integrated from the lower order to the upper order, and a dictionary set used for translating the one document can be constructed.

【0053】しかし当該複数分野が分岐した別の枝(前
記ひとつづきの枝以外の枝)に存在する場合には、本実
施形態では対応することができない。
However, the present embodiment cannot cope with the case where the plurality of fields exist in different branches (branches other than the one-by-one branch).

【0054】どの分野が当該文書にとって最もふさわし
いかは、階層ディレクトリ11中のどのカテゴリにどの
文書が属するかを決定した段階で、すでに決まってい
る。
Which field is most suitable for the document has already been determined at the stage of determining which document belongs to which category in the hierarchical directory 11.

【0055】また、当該1文書が含んでいる専門性の高
さが相違する部分の翻訳については、木構造(階層構
造)のなかのひとつづきの枝に存在する複数のカテゴリ
の辞書を、下位から上位へ統合して、当該1文書の翻訳
に使用する辞書セットを構築することで対応することが
できる。
For the translation of a part of a document having a different level of specialty, the dictionary of a plurality of categories existing in each branch in a tree structure (hierarchical structure) is translated into a lower order. This can be dealt with by constructing a dictionary set to be used for translating the one document by integrating from the first to the upper.

【0056】この点から、各文書がいずれのカテゴリに
所属するかは、当該文書に想定される最も高い専門性を
基準に決定することが望ましい。
From this point, it is desirable to determine which category each document belongs to based on the highest specialty assumed for the document.

【0057】以下、上記のような構成を有する第1の実
施形態の動作について説明する。
Hereinafter, the operation of the first embodiment having the above configuration will be described.

【0058】(A−2)第1の実施形態の動作 機械翻訳通信システム10の動作手順を、図3のフロー
チャートに示す。
(A-2) Operation of the First Embodiment The operation procedure of the machine translation communication system 10 is shown in the flowchart of FIG.

【0059】図3において、当該フローチャートはステ
ップS301〜S312の各ステップからなる。
In FIG. 3, the flowchart includes steps S301 to S312.

【0060】最初のステップS301では、閲覧手段1
01においてユーザが表示したい文書のアドレスを入力
しディレクトリサーバ102に送信する。この操作はリ
ンクをクリックすることによっても実現できる。
In the first step S301, the browsing means 1
In step 01, the user inputs the address of the document to be displayed and sends it to the directory server 102. This operation can also be realized by clicking a link.

【0061】次に、ディレクトリサーバ102では、通
信制御手段103が送られてきたアドレスの情報を入手
し(S302)、送られてきた情報が翻訳要求かどうか
をしらべる(S303)。
Next, in the directory server 102, the communication control means 103 obtains the information of the transmitted address (S302), and checks whether the transmitted information is a translation request (S303).

【0062】ステップS303で、当該情報が翻訳要求
であれば処理はステップS311へ進み、翻訳要求でな
ければステップS304へ進む。
In step S303, if the information is a translation request, the process proceeds to step S311; otherwise, the process proceeds to step S304.

【0063】ステップS304では、送られてきたアド
レスがディレクトリサーバ102内のアドレス(ディレ
クトリサーバ102の管理範囲内のアドレス)かどうか
を、通信制御手段103が調べ、サーバ102内のアド
レスでなければステップS308へ進み、サーバ102
内のアドレスであればステップS305へ進む。
In step S304, the communication control means 103 checks whether or not the received address is an address in the directory server 102 (an address within the management range of the directory server 102). Proceeds to S308, where the server 102
If the address is within the range, the process proceeds to step S305.

【0064】サーバ内のアドレスかどうかの判定方法
は、一例として、システムのアドレスが“http://www.f
oo.co.jp/search/”であるとすると、それを含んだアド
レスであるかどうかで判断する方法が考えられる。
As an example of a method of determining whether or not the address is in the server, the address of the system is “http: //www.f
If it is oo.co.jp/search/ ”, a method of judging whether or not the address includes the address can be considered.

【0065】ステップS305では、通信制御手段10
3がCGIのアドレスかどうかを調べ、CGIでなけれ
ばステップS312へ進み、CGIであればステップS
306へ進む。S312へ進むのは、現在の文書よりも
下位層へのリンクが指定された場合である。
In step S305, the communication control means 10
It is checked whether 3 is an address of CGI. If not, the process proceeds to step S312.
Proceed to 306. Processing proceeds to S312 when a link to a lower layer than the current document is specified.

【0066】CGIのアドレスかどうかの判定は、一例
として、当該アドレスが“*.cgi”となっているかどう
かで行うようにすることもできる。
The determination as to whether or not the address is a CGI address can be made, for example, based on whether or not the address is “* .cgi”.

【0067】ステップS306では、通信制御手段10
3がCGIプログラムから現在の文書(カテゴリ(ハイ
パーテキスト:リンク付き文書))のアドレスとターゲ
ット文書(ハイパーテキスト:リンク付き文書)のアド
レスの情報を取得する。
In step S306, the communication control means 10
3 acquires the address information of the current document (category (hypertext: linked document)) and the address of the target document (hypertext: linked document) from the CGI program.

【0068】次に、翻訳制御手段104が階層型データ
ベース106内の現在の文書アドレスのノードを上にた
どり、そのノードに辞書があれば、翻訳に使用する辞書
として順番にセットしていく(S307)。
Next, the translation control means 104 traces up the node of the current document address in the hierarchical database 106, and if there is a dictionary at that node, sets it in order as a dictionary to be used for translation (S307). ).

【0069】例えば図2において文書のアドレスが「イ
ンターネット」カテゴリCT5を指定している場合、使
用する辞書は、インターネット辞書D4、コンピュータ
辞書D3、一般用語辞書D1で、D4、D3、D1から
構成される辞書セットを用いた翻訳となる。
For example, in FIG. 2, when the document address designates the "Internet" category CT5, the dictionaries to be used are the Internet dictionary D4, the computer dictionary D3, and the general term dictionary D1, and are composed of D4, D3, and D1. Translation using a dictionary set.

【0070】このケースにおいて、翻訳時には、インタ
ーネット辞書D4とコンピュータ辞書D3に同一の単語
が登録してあった場合は、インターネット辞書D4の訳
語が優先して使われる。すなわち、階層ディレクトリ1
1において翻訳対象文書の属するカテゴリに近い、下位
層のカテゴリに関連する辞書ほど優先度が高い。
In this case, at the time of translation, if the same word is registered in the Internet dictionary D4 and the computer dictionary D3, the translated word of the Internet dictionary D4 is used preferentially. That is, hierarchical directory 1
In 1, the closer to the category to which the document to be translated belongs, the lower the dictionary related to the category, the higher the priority.

【0071】またステップS308では、使用する辞書
を一般用語辞書D1とする。
In step S308, the dictionary to be used is the general term dictionary D1.

【0072】サーバ102内のアドレスでなければ、当
該文書が階層ディレクトリ11中のどのカテゴリに属す
るのか不明であるため、一律に一般用語辞書D1を適用
することとした。
If it is not an address in the server 102, it is unknown which category in the hierarchical directory 11 the document belongs to, so the general term dictionary D1 is applied uniformly.

【0073】ステップS309では指定されたアドレス
のデータ(すなわちハイパーテキストの文書データ)
を、ディレクトリサーバ102が、外部ネットワーク1
08から取得する。
In step S 309, data at the designated address (ie, hypertext document data)
To the external network 1
08.

【0074】そしてステップS310では、通信制御手
段103が、使用する辞書の情報(翻訳環境識別子)と
翻訳ボタンとを、取得した情報に付加し、閲覧手段10
1に送信する。
In step S310, the communication control means 103 adds the dictionary information to be used (translation environment identifier) and the translation button to the acquired information, and
Send to 1.

【0075】送信した画面の例を図5に示す。FIG. 5 shows an example of the transmitted screen.

【0076】図5において、この画面は、ウインドウ5
01と、テキストフィールド502と、情報エリア50
3を含んでいる。図5は、図4とほぼ同様であり、ウイ
ンドウ501は前記ウインドウ401に対応し、テキス
トフィールド502は前記テキストフィールド402に
対応し、情報エリア503は前記情報エリア403に対
応する。
In FIG. 5, this screen is displayed in window 5
01, a text field 502, and an information area 50
Contains three. FIG. 5 is substantially the same as FIG. 4, in which a window 501 corresponds to the window 401, a text field 502 corresponds to the text field 402, and an information area 503 corresponds to the information area 403.

【0077】情報エリア503内には、「○○会社ホー
ムページへようこそ」の表記M10と、「新着情報」の
表記M11と、「会社概要」の表記M12と、「採用情
報」の表記M13と、「関連企業」の表記M14があ
る。表記M10は前記表記M1に対応し、表記M11〜
14は前記表記M2〜M4に対応する。
In the information area 503, a notation M10 of “Welcome to the XX company homepage”, a notation M11 of “new arrival information”, a notation M12 of “company outline”, a notation M13 of “employment information”, There is a notation M14 of "related company". The notation M10 corresponds to the notation M1, and the notations M11 to M11.
14 corresponds to the above notations M2 to M4.

【0078】このほか、情報エリア503には、翻訳ボ
タン504が表示されている。ユーザは、閲覧手段10
1でこのウインドウ501を閲覧し、当該翻訳ボタン5
04をクリックすることにより、翻訳要求をディレクト
リサーバ102に送信し、翻訳結果を受け取ることがで
きる。
In addition, a translation button 504 is displayed in the information area 503. The user can access the browsing means 10
1 to browse this window 501, and
By clicking 04, a translation request can be transmitted to the directory server 102 and a translation result can be received.

【0079】翻訳するための情報を付加して送信し翻訳
結果を得る方法は、特開平8−202734号公報(文
献2)などに記述されている方法を使うことができる。
As a method for obtaining a translation result by adding information for translation and transmitting the information, a method described in Japanese Patent Application Laid-Open No. 8-202934 (Reference 2) or the like can be used.

【0080】文献2の原理(事前翻訳)を本実施形態に
適用すると、文書アドレスが入力され、当該アドレスの
情報が入手された段階で、自動的に、当該文書の機械翻
訳(前記管理範囲内であれば辞書セットの設定も行われ
る)を行って翻訳結果を訳文格納手段(メモリ)に格納
しておき、翻訳要求が出された場合には、格納している
当該翻訳結果を取り出してただちにユーザ端末101に
供給することにより、翻訳結果を得るまでの見かけ上の
時間を短縮し、ユーザの手数を低減することができる。
When the principle (pre-translation) of Document 2 is applied to the present embodiment, when a document address is input and the information of the address is obtained, machine translation of the document (within the management range) is automatically performed. If the translation is requested, the translation result is stored in the translation storage means (memory). If a translation request is issued, the stored translation result is immediately taken out. By supplying the translation to the user terminal 101, the apparent time required to obtain the translation result can be shortened, and the user's trouble can be reduced.

【0081】当該翻訳結果は、ユーザ端末101以外の
ユーザ端末にも供給可能であるので、システム全体とし
て翻訳結果を得るまでの処理量を削減することも可能に
なる。もしも翻訳要求が出された時点で、翻訳が途中で
あれば、翻訳途中の文書をユーザ端末に供給するように
してもよいし、翻訳が終了してからユーザ端末に供給す
るようにしてもよい。いずれの場合でも、ユーザにとっ
て、翻訳要求を送信してから訳文が得られるまでの時間
は、短くなる。
Since the translation result can be supplied to user terminals other than the user terminal 101, it is possible to reduce the amount of processing until the translation result is obtained in the entire system. If the translation is in progress at the time when the translation request is issued, the partially translated document may be supplied to the user terminal, or may be supplied to the user terminal after the translation is completed. . In any case, the time from when the translation request is transmitted to when the translated sentence is obtained becomes short for the user.

【0082】図3のフローチャートにもどると、ステッ
プS311では機械翻訳手段105が指定された辞書セ
ットを用いて機械翻訳を行ない、通信制御手段103
が、翻訳結果を閲覧手段101に送信する。
Returning to the flowchart of FIG. 3, in step S311, the machine translation means 105 performs machine translation using the specified dictionary set, and the communication control means 103
Transmits the translation result to the browsing unit 101.

【0083】なお、前記ステップS312では、CGI
でないため、現在の文書(カテゴリ(ハイパーテキス
ト))のアドレスとターゲット文書(ハイパーテキス
ト)のアドレスの情報を取得することができず、ただ単
に指定されたアドレスのデータ(文書)をユーザ端末1
01に送信するだけである。
In step S312, the CGI
Therefore, the information of the address of the current document (category (hypertext)) and the address of the target document (hypertext) cannot be obtained, and the data (document) of the specified address is simply stored in the user terminal 1.
Just send to 01.

【0084】ただし、ステップS312まで処理が進ん
だということは、ステップS304の分岐はY側であ
り、当該文書のアドレスはディレクトリサーバ102の
管理範囲内であることを意味する。したがって当該文書
がいずれのカテゴリに属するかは、ディレクトリサーバ
102が把握しており、当該文書をユーザ端末101で
閲覧したユーザが翻訳要求を送信してきた場合、ステッ
プS311の処理では、辞書セットの設定と当該辞書セ
ットを用いた機械翻訳を、一度に実行することができ
る。
However, the fact that the processing has proceeded to step S312 means that the branch of step S304 is on the Y side, and that the address of the document is within the management range of the directory server 102. Therefore, the directory server 102 knows which category the document belongs to, and when a user who browses the document on the user terminal 101 sends a translation request, the process of step S311 sets the dictionary set. And machine translation using the dictionary set can be performed at once.

【0085】また、図3のフローチャートのなかで可能
な処理の進行のうち、本実施形態にとって最も好ましい
のは、ステップS301,S302,S303,S30
4,S305,S306,S307,S309,S31
0の順番で処理が進行したあと、例えば図5のような画
面を閲覧したユーザが送信する翻訳要求を受けて、ステ
ップS301、S302、S303、S311の順番で
処理が進むケースである。
Of the progress of the processing that can be performed in the flowchart of FIG. 3, the most preferable one for this embodiment is steps S301, S302, S303, and S30.
4, S305, S306, S307, S309, S31
In this case, the processing proceeds in the order of steps S301, S302, S303, and S311 in response to a translation request transmitted by a user who has viewed the screen shown in FIG.

【0086】最も好ましくないのは、ステップS304
でN側に分岐し、機械翻訳が一般辞書D1だけを用いて
行われるケースである。この場合は、その他のケースに
比べて、翻訳結果の品質は低下する可能性が高い。
The least desirable is step S304.
, And the machine translation is performed using only the general dictionary D1. In this case, the quality of the translation result is likely to be lower than in other cases.

【0087】一方、ステップS305の分岐がN側にな
る上述したケースでは、使い勝手や操作性の観点からの
問題が生じる可能性はあるが、辞書セットの設定に関す
る限り、翻訳結果の品質は、上述した最も好ましいケー
スと同じである。
On the other hand, in the above-described case where the branch of step S305 is made on the N side, there is a possibility that a problem may occur from the viewpoint of usability and operability. This is the same as the most preferable case.

【0088】ネットワーク108中で、当該ディレクト
リサーバ102の管理範囲が広がるほど、最も好ましく
ないケースが発生する可能性が低下し、ユーザが高品質
な翻訳結果を得られる可能性が高まる。
As the management range of the directory server 102 in the network 108 increases, the possibility that the most unfavorable case occurs decreases, and the possibility that the user can obtain a high-quality translation result increases.

【0089】(A−3)第1の実施形態の効果 本実施形態によれば、1つの文書を機械翻訳するために
使用する1又は複数の専門用語辞書(辞書セット)を、
きめ細かく自動的に設定することができるので、ユーザ
に負担をかけることなく高品質な翻訳結果を得ることが
可能である。
(A-3) Effects of the First Embodiment According to the present embodiment, one or a plurality of technical term dictionaries (dictionary sets) used for machine translation of one document are provided.
Since the setting can be made automatically and finely, it is possible to obtain a high-quality translation result without putting a burden on the user.

【0090】(B)第2の実施形態 本実施形態は、第1の実施形態の各辞書に収録している
用語や文章表現を、自動的に更新することを特徴とす
る。
(B) Second Embodiment The present embodiment is characterized in that the terms and sentence expressions recorded in each dictionary of the first embodiment are automatically updated.

【0091】(B−1)第2の実施形態の構成および動
作 第1の実施形態と本実施形態の構成上、動作上の主要な
相違点は、辞書の内容の更新に関する点にかぎられる。
(B-1) Configuration and Operation of Second Embodiment In the configuration of the first embodiment and the configuration of the present embodiment, the main difference in operation is limited to the update of the contents of the dictionary.

【0092】以下では、本実施形態の構成、動作が、第
1の実施形態と異なる点についてのみ説明する。
Hereinafter, only the configuration and operation of the present embodiment that are different from those of the first embodiment will be described.

【0093】本実施形態の機械翻訳通信システム20の
構成を図11に示す。機械翻訳通信システム20は、閲
覧手段101と、外部ネットワーク108を備えている
点で、第1の実施形態の機械翻訳通信システム10と同
じであるが、ディレクトリサーバ200はディレクトリ
サーバ102と相違する点を有する。
FIG. 11 shows the configuration of the machine translation communication system 20 of the present embodiment. The machine translation communication system 20 is the same as the machine translation communication system 10 of the first embodiment in that it has a browsing unit 101 and an external network 108, but the directory server 200 is different from the directory server 102. Having.

【0094】図11において、閲覧手段101と、外部
ネットワーク108と、ディレクトリサーバ200中の
構成要素103,104,105,106は、その機能
面も含めて第1の実施形態の同一符号の各部と同じなの
でその詳しい説明は省略する。
In FIG. 11, the browsing means 101, the external network 108, and the components 103, 104, 105, and 106 in the directory server 200 are the same as those of the first embodiment, including their functional aspects. Since they are the same, their detailed description is omitted.

【0095】また、ディレクトリサーバ200中の辞書
データベースは辞書D1〜D6を備えているなど、前記
辞書データベース107とほぼ同じ機能を持つが、辞書
投入手段203からのはたらきかけを受けて辞書内容の
更新を行う機能も装備しているので、符号204を付し
て辞書データベース107と区別する。
The dictionary database in the directory server 200 has almost the same functions as the dictionary database 107, such as having the dictionaries D1 to D6, but receives the action from the dictionary input means 203 to update the dictionary contents. Since it is also provided with a function of performing, a reference numeral 204 is attached to distinguish it from the dictionary database 107.

【0096】構成要素103〜106と204以外に、
機械翻訳通信システム20のディレクトリサーバ200
は、対訳URL登録手段201と、対訳からの知識獲得
手段202と、辞書投入手段203とを備えている。
In addition to the constituent elements 103 to 106 and 204,
Directory server 200 of machine translation communication system 20
Includes a bilingual URL registration unit 201, a bilingual knowledge acquisition unit 202, and a dictionary input unit 203.

【0097】対訳URL登録手段201はユーザに自分
のホームページなどを登録させる手段である。
The bilingual URL registration means 201 is a means for allowing a user to register his / her home page and the like.

【0098】対訳からの知識獲得手段202は対訳文書
から知識を獲得し、文ごとに対応がついていない対訳文
書であっても、自動的に文の対応を付けることができ、
辞書データを自動で作成することができる。この知識獲
得手段202としては、例えば特開平10−11445
号公報(文献3)に記載されたものを用いることができ
る。
The bilingual knowledge acquisition means 202 acquires knowledge from a bilingual document, and can automatically associate a sentence even if the bilingual document has no correspondence for each sentence.
Dictionary data can be created automatically. As the knowledge acquiring means 202, for example, Japanese Patent Laid-Open No. Hei 10-11445
Japanese Unexamined Patent Publication (Kokai) No. 3 (Document 3) can be used.

【0099】文献3においては、対訳文書に対して統計
的処理(対訳単語推定処理)を行って翻訳パターンを作
成している。すなわち、原言語の文書と、この文書の対
訳である目的言語の文書とが、それぞれ文単位に対応付
けされた対訳文書において、原言語の文書中の特定の単
語の出現回数と、目的言語の文書中の特定の単語の出現
回数と、前記特定の単語同士が同一の訳文中に出現する
回数とが近い数であるほど値の高くなる単語対応度とい
う概念を導入し、当該単語対応度が最も高い値の単語同
士の単語ペアを対訳単語として抽出する。
In Document 3, a translation pattern is created by performing statistical processing (translation word estimation processing) on a bilingual document. That is, in a bilingual document in which a source language document and a target language document, which is a translation of this document, are associated with each sentence unit, the number of occurrences of a specific word in the source language document and the target language Introducing the concept of a word correspondence that has a higher value as the number of occurrences of a specific word in a document and the number of occurrences of the specific word in the same translation are closer to each other. A word pair between words having the highest value is extracted as a bilingual word.

【0100】これによれば、対訳文一文内の言語情報だ
けに依存せず文書全体から言語情報を得ることができ、
現実には実行困難なことが多い構文解析処理を行う必要
もなく、一般の対訳辞書には登録されていない専門用語
が多用された文書でも、対訳関係を同定することが可能
である。
According to this, the linguistic information can be obtained from the entire document without depending on only the linguistic information in one bilingual sentence.
In practice, it is not necessary to perform a parsing process that is often difficult to execute, and it is possible to identify a bilingual relationship even in a document in which technical terms that are not registered in a general bilingual dictionary are frequently used.

【0101】なお、文献3は、文書と対訳である目的言
語の文書とが、それぞれ文単位に対応付けされた対訳文
書が前提となっているが、自動的に文の対応付けを行う
ことも可能である。
The document 3 is based on the premise that a document and a document in the target language, which is a parallel translation, are respectively associated with each sentence, but sentences may be automatically associated with each other. It is possible.

【0102】例えば、自動的に文の対応付けを行う方法
としては、次の方法がある。
For example, as a method of automatically associating sentences, there is the following method.

【0103】原文1文と訳文3文または原文1文と訳文
2文が対応している場合もあるため、この方法ではま
ず、原文と訳文との対応組の組み合わせ(パス)をすべ
て求め、原文と訳文の文数により対応付けの最適解の可
能性が高い組み合わせを求める。
In some cases, one original sentence and three translated sentences or one original sentence and two translated sentences correspond to each other. In this method, first, all combinations (paths) of corresponding pairs of the original sentence and the translated sentence are obtained. And the number of sentences of the translated sentence and a combination having a high possibility of the optimal solution of the association are obtained.

【0104】次に、原文と訳文とが対応しているほど高
い値となる評価値を求めるとともに、原文と訳文との対
応付けの最適解の可能性が高い組み合わせに対し評価値
の和を求め暫定解とする。
Next, an evaluation value which becomes higher as the original sentence and the translated sentence correspond to each other is obtained, and a sum of the evaluation values is obtained for a combination which has a high possibility of the optimal solution of the correspondence between the original sentence and the translated sentence. Provisional solution.

【0105】その後、原文と訳文との組み合わせの評価
値の和の計算を、組み合わせの先頭の文から最後の文へ
順次計算するようにし、最後の文まで計算しても暫定解
を上回る値にならないと判断できた時点でその組み合わ
せの評価値の計算を中止して暫定解を最適解として文の
対応付けの解とする。
After that, the sum of the evaluation values of the combination of the original sentence and the translated sentence is calculated sequentially from the first sentence to the last sentence of the combination, and even if the calculation is performed up to the last sentence, the sum exceeds the provisional solution. When it is determined that the combination is not satisfied, the calculation of the evaluation value of the combination is stopped, and the provisional solution is determined as the optimal solution and used as the solution for associating sentences.

【0106】このような方法を使用し得る対訳からの知
識獲得手段202の出力の供給を受けて、図11の前記
辞書投入手段203は、辞書データベース204内の指
定された辞書に指定された辞書データ(対訳関係)を登
録する。
In response to the supply of the output of the knowledge acquiring means 202 from the bilingual translation which can use such a method, the dictionary input means 203 of FIG. Register the data (translation).

【0107】図9には、ユーザ端末101を介してユー
ザが見る対訳登録画面の例を示す。
FIG. 9 shows an example of a bilingual registration screen viewed by the user via the user terminal 101.

【0108】図9において、対訳登録画面900には、
ユーザが登録する英語のURLを記述するフォーム90
1と、ユーザが登録する日本語のURLを記述するフォ
ーム902と、ユーザが登録するカテゴリを選択するた
めのカテゴリリスト903と、記述が終った時にシステ
ムに送信するためのボタン904とが表示されている。
Referring to FIG. 9, a bilingual registration screen 900 includes
Form 90 describing English URL to be registered by user
1, a form 902 describing a Japanese URL to be registered by the user, a category list 903 for selecting a category to be registered by the user, and a button 904 for sending to the system when the description is completed is displayed. ing.

【0109】この例では、対訳登録画面900は英語と
日本語の対訳が登録される。
In this example, the bilingual registration screen 900 registers bilingual English and Japanese translations.

【0110】対訳登録画面900を介して行われるUR
L登録時のフローチャートを図6に示す。このフローチ
ャートはステップS601〜S605の各ステップから
なる。
UR performed via bilingual registration screen 900
FIG. 6 shows a flowchart at the time of L registration. This flowchart includes steps S601 to S605.

【0111】図6において、まずユーザが、対訳URL
登録のリンクをクリックするなどの操作を行うことで、
対訳URL登録手段201が対訳登録画面を表示する
(S601)。この対訳登録画面は、一例として、対訳
登録画面900のような画面である。
In FIG. 6, first, the user inputs a bilingual URL.
By performing operations such as clicking on the registration link,
The bilingual URL registration means 201 displays a bilingual registration screen (S601). The bilingual registration screen is, for example, a screen such as the bilingual registration screen 900.

【0112】次に、ユーザは、フォーム901,902
に対し、登録する対訳文書(英語文書と、日本語文書)
のURLと登録するカテゴリを記入し(S602)、送
信ボタン904を押す。
Next, the user inputs the forms 901 and 902
Translation documents to register (English and Japanese documents)
And the category to be registered are entered (S602), and a send button 904 is pressed.

【0113】対訳文書のURLと登録するカテゴリの情
報を受け取ったディレクトリサーバ200は、そのUR
Lの文書を通信制御手段103を介して外部ネットワー
ク108から入手し、その文書を知識獲得手段202に
送る(S603)。
The directory server 200, which has received the URL of the bilingual document and the information on the category to be registered,
The document of L is obtained from the external network 108 via the communication control means 103, and the document is sent to the knowledge acquisition means 202 (S603).

【0114】知識獲得手段202は、対訳文書を解析
し、辞書データを自動的に作成する(S604)。
The knowledge acquiring means 202 analyzes the bilingual document and automatically creates dictionary data (S604).

【0115】そして辞書投入手段203は、作成された
この辞書データを、選択されたカテゴリの辞書に登録す
る(S605)。
The dictionary input means 203 registers the created dictionary data in the dictionary of the selected category (S605).

【0116】(B)第2の実施形態の効果 本実施形態によれば、第1の実施形態と同等な効果を得
ることができる。
(B) Effects of the Second Embodiment According to the present embodiment, effects equivalent to those of the first embodiment can be obtained.

【0117】加えて、本実施形態によれば、ほとんどの
ディレクトリサービスに存在する、ユーザによるURL
登録を利用して、各専門用語辞書の辞書データを自動的
に更新するので、一つひとつの専門用語辞書の能力が向
上して高品質の翻訳結果が得られる。
In addition, according to the present embodiment, the URL by the user, which exists in most directory services,
Since the dictionary data of each technical term dictionary is automatically updated using the registration, the ability of each technical term dictionary is improved, and a high-quality translation result can be obtained.

【0118】したがって、それぞれのカテゴリ毎に専門
用語辞書を準備しなくても高品質の翻訳結果を得ること
が可能である。
Therefore, a high-quality translation result can be obtained without preparing a technical term dictionary for each category.

【0119】本実施形態では、前提として複数の言語で
書かれた文書(対訳文書)が必要になるが、現在はより
多くの人にみてもらうために同一内容を複数の言語で記
述したホームページが増えてきている。そのようなホー
ムページのオーナは多くの人に知ってもらうために対訳
登録を行うであろう。
In the present embodiment, a document (a bilingual document) written in a plurality of languages is required as a premise, but a home page describing the same contents in a plurality of languages is currently used in order to be seen by more people. It is increasing. The owner of such a home page will make a bilingual registration to make it known to many people.

【0120】(C)第3の実施形態 本実施形態は、第2の実施形態で必須であった対訳がな
くても、自動的に専門辞書を作ることができることを特
徴とする。
(C) Third Embodiment The present embodiment is characterized in that a specialized dictionary can be automatically created even without a translation required in the second embodiment.

【0121】(C−1)第3の実施形態の構成および動
作 第2の実施形態と本実施形態の構成上、動作上の主要な
相違点は、辞書データの作成処理に関する点にかぎられ
る。
(C-1) Configuration and Operation of Third Embodiment In the configuration of the second embodiment and the configuration of the present embodiment, the main difference in operation is limited to the point related to dictionary data creation processing.

【0122】以下では、本実施形態の構成、動作が、第
2の実施形態と異なる点についてのみ説明する。
In the following, only the structure and operation of this embodiment different from those of the second embodiment will be described.

【0123】本実施形態の機械翻訳通信システム30の
構成を図7に示す。機械翻訳通信システム30は、閲覧
手段101と、外部ネットワーク108を備えている点
で、第2の実施形態の機械翻訳通信システム10と同じ
であるが、ディレクトリサーバ300はディレクトリサ
ーバ200と相違する点を有する。
FIG. 7 shows the configuration of the machine translation communication system 30 of the present embodiment. The machine translation communication system 30 is the same as the machine translation communication system 10 of the second embodiment in that it has a browsing unit 101 and an external network 108, but the directory server 300 is different from the directory server 200. Having.

【0124】図7において、閲覧手段101と、外部ネ
ットワーク108と、ディレクトリサーバ300中の構
成要素103,104,105,106、203,20
4は、その機能面も含めて第2の実施形態の同一符号の
各部と同じなのでその詳しい説明は省略する。
In FIG. 7, browsing means 101, external network 108, and components 103, 104, 105, 106, 203, and 20 in directory server 300 are provided.
4 is the same as that of the second embodiment, including its functional aspects, and will not be described in detail.

【0125】構成要素103〜106、203、204
以外に、機械翻訳通信システム30のディレクトリサー
バ300は、URL登録手段301と、知識獲得手段3
02とを備えている。
Components 103 to 106, 203 and 204
In addition, the directory server 300 of the machine translation communication system 30 includes a URL registration unit 301 and a knowledge acquisition unit 3
02.

【0126】URL登録手段301は、ユーザに自分の
ホームページなどを登録させる手段である。
The URL registration means 301 is a means for allowing a user to register his / her home page and the like.

【0127】知識獲得手段302は、第2の実施形態の
知識獲得手段202が対訳文書に対する統計的処理(対
訳単語推定処理)を行ったのに対し、1言語の1文書か
ら所定の方法を用いて知識を獲得し、辞書データを自動
で作成するものである。
The knowledge acquiring means 302 uses a predetermined method from one document in one language, while the knowledge acquiring means 202 of the second embodiment performs statistical processing (translation word estimation processing) on a bilingual document. To acquire dictionary knowledge and automatically create dictionary data.

【0128】所定の方法としては、例えば特開平6−3
01717号公報(文献4)に記載された方法がある。
As a predetermined method, for example, Japanese Patent Laid-Open No. 6-3
There is a method described in Japanese Patent No. 01717 (Reference 4).

【0129】文献4では、機能語や句切り記号によって
挟まれた2形態素以上の文字列で構成される長単位語と
いう概念を導入し、入力文章から、長単位語、長単位語
の対訳情報、長単位語を構成する単語の属性または長単
位語を構成する単語の訳語等の情報を自動的に抽出す
る。したがって、抽出された訳語等の情報が既に辞書に
格納されている辞書データと異なる場合は、それを新た
な辞書データとして追加することで辞書の内容を更新す
ることが可能である。
Reference 4 introduces the concept of a long unit word composed of a character string of two or more morphemes sandwiched between functional words and punctuation marks, and converts a long unit word and long unit word bilingual information from an input sentence. And automatically extracts information such as the attributes of the words constituting the long unit words or the translations of the words constituting the long unit words. Therefore, when the information such as the extracted translated word is different from the dictionary data already stored in the dictionary, it is possible to update the contents of the dictionary by adding it as new dictionary data.

【0130】この方法は、前記文献3の方法と比べて、
抽出された情報の信頼性は低い可能性があるが、対訳を
必要としないという極めて大きな利点を持っている。
This method is different from the method of Reference 3 in that
Although the reliability of the extracted information may be low, it has the great advantage of not requiring a translation.

【0131】図10にURL登録画面の例を示す。FIG. 10 shows an example of a URL registration screen.

【0132】図10において、URL登録画面1000
は、ユーザが登録するURLを記述するフォーム100
1と、ユーザが登録する言語を指定するためのボタン1
002と、ユーザが登録するカテゴリを選択するための
カテゴリリスト1003と、記述が終った時にシステム
に送信するためのボタン1004とを備えている。
Referring to FIG. 10, a URL registration screen 1000 is displayed.
Is a form 100 describing a URL to be registered by the user.
1 and button 1 for specifying the language to be registered by the user
002, a category list 1003 for the user to select a category to be registered, and a button 1004 for sending to the system when the description is completed.

【0133】図8は、本実施形態のURL登録時のフロ
ーチャートを示している。このフローチャートは、ステ
ップS801〜S805の各ステップからなる。
FIG. 8 is a flowchart for registering a URL according to the present embodiment. This flowchart includes steps S801 to S805.

【0134】図8において、まずユーザは、URL登録
のリンクをクリックするなどの操作により、URL登録
手段301がユーザ端末101にURL登録画面(UR
L入力画面)を表示する(S801)。
In FIG. 8, the user first clicks a URL registration link, and the URL registration means 301 causes the user terminal 101 to display a URL registration screen (URL).
An L input screen is displayed (S801).

【0135】このURL登録画面は、一例として、前記
URL登録画面1000のようなものである。
The URL registration screen is, for example, like the URL registration screen 1000 described above.

【0136】次にユーザは、登録する文書のURLをフ
ォーム1001に記入するとともに、登録するカテゴリ
をカテゴリリスト1003に記入し(S802)、送信
ボタンを押す。
Next, the user enters the URL of the document to be registered in the form 1001 and the category to be registered in the category list 1003 (S802), and presses the send button.

【0137】これを受けてディレクトリサーバ300で
は、そのURLの文書およびそのカテゴリ内に登録され
ている他言語(登録したURLとは違う言語)の文書を
通信制御手段103を介して外部ネットワーク108か
ら入手し、その文書を知識獲得手段(知識獲得システ
ム)302に送る(S803)。
In response to this, the directory server 300 transmits the document of the URL and the document of another language (a language different from the registered URL) registered in the category from the external network 108 via the communication control means 103. Obtain and send the document to the knowledge acquisition means (knowledge acquisition system) 302 (S803).

【0138】そして知識獲得手段302が、文書を解析
し、辞書データを自動的に作成する(S804)。
Then, the knowledge acquiring unit 302 analyzes the document and automatically creates dictionary data (S804).

【0139】作成した辞書データは辞書投入手段203
が、選択されたカテゴリの辞書(D1〜D6のいずれ
か)に登録する。
The created dictionary data is stored in the dictionary input means 203.
Is registered in the dictionary (any one of D1 to D6) of the selected category.

【0140】なお、本実施形態では、対訳は英語と日本
語で説明したが、他の言語でも同様に実施できる。
In the present embodiment, the translation is described in English and Japanese, but the translation can be similarly performed in other languages.

【0141】(C−2)第3の実施形態の効果 本実施形態によれば、第2の実施形態の効果とほぼ同等
な効果を得ることができる。
(C-2) Effects of the Third Embodiment According to the present embodiment, it is possible to obtain effects substantially equivalent to the effects of the second embodiment.

【0142】ただし本実施形態では、第2の実施形態と
比べ更新する辞書データの精度は低下する可能性がある
が、対訳がなくても自動的に専門辞書を作ることができ
るという利点がある。
In this embodiment, however, the accuracy of the dictionary data to be updated may be lower than that in the second embodiment, but there is an advantage that a specialized dictionary can be automatically created without a translation. .

【0143】(D)第4の実施形態 本実施形態は、辞書データベースに登録する辞書の言語
を複数とすることを特徴とする。
(D) Fourth Embodiment This embodiment is characterized in that a dictionary is registered in a dictionary database in a plurality of languages.

【0144】(D−1)第4の実施形態の構成および動
作 第2の実施形態と本実施形態の構成上、動作上の主要な
相違点は、言語判定手段401の有無である。
(D-1) Configuration and Operation of the Fourth Embodiment In the configuration of the second embodiment and the present embodiment, the main difference in operation is the presence or absence of the language determination means 401.

【0145】以下では、本実施形態の構成、動作が、第
2の実施形態と異なる点についてのみ説明する。
Hereinafter, only the configuration and operation of the present embodiment that are different from those of the second embodiment will be described.

【0146】本実施形態の機械翻訳通信システム40の
構成を図12に示す。
FIG. 12 shows the configuration of the machine translation communication system 40 of the present embodiment.

【0147】図12において、構成要素101,10
3,104,105,106,108、201,20
2,203に関しては、機能面も含めて同一符号を付し
た第2の実施形態の各部と同じなので、その詳しい説明
は省略する。
In FIG. 12, constituent elements 101 and 10
3,104,105,106,108,201,20
The components 2 and 203 are the same as those of the second embodiment to which the same reference numerals are assigned, including the functional aspects, and therefore, detailed description thereof is omitted.

【0148】ただし辞書データベース402はカテゴリ
毎に分類した翻訳用の辞書を備えるデータベースである
点で第2の実施形態の辞書データベース204と同じで
あるが、日本語、英語、中国語、フランス語など各言語
ごとの辞書データを持っている。
The dictionary database 402 is the same as the dictionary database 204 of the second embodiment in that it has a dictionary for translation classified for each category. However, the dictionary database 402 includes Japanese, English, Chinese, and French. It has dictionary data for each language.

【0149】すなわち、一般用語辞書P1は英語から日
本語への翻訳、中国語から日本語への翻訳、フランス語
から日本語への翻訳などに使用することができる辞書デ
ータを備えている。
That is, the general term dictionary P1 includes dictionary data that can be used for translation from English to Japanese, from Chinese to Japanese, from French to Japanese, and so on.

【0150】この点は、他の辞書P2〜P6についても
同様である。
The same applies to the other dictionaries P2 to P6.

【0151】そして、前記言語判定手段401は文書が
どういう言語(日本語、英語、中国語など)で記述され
ているかを、文書内の言語情報やコード体系を調べ、自
動的に判定する機能を装備している。
The language judging means 401 has a function of automatically judging in what language (Japanese, English, Chinese, etc.) the document is described by examining the language information and code system in the document. Equipped.

【0152】この判定に応じて、任意の1翻訳に使用さ
れる辞書セットに該当するP1〜P6のいずれかの辞書
の内部で、当該翻訳に使用される部分(辞書データ)が
決定される。
According to this determination, a part (dictionary data) used for the translation is determined within any of the dictionaries P1 to P6 corresponding to the dictionary set used for any one translation.

【0153】例えば当該文書が英語で記述されている場
合は、辞書セットの辞書のなかの英語から日本語への翻
訳に対応する部分だけの使用が決定される。
For example, when the document is described in English, it is determined that only the portion corresponding to the translation from English to Japanese in the dictionary of the dictionary set is used.

【0154】(D−2)第4の実施形態の効果 以上述べたように、本実施形態によれば、第2の実施形
態の効果と同等な効果を得ることができる。
(D-2) Effects of the Fourth Embodiment As described above, according to the present embodiment, effects equivalent to the effects of the second embodiment can be obtained.

【0155】加えて、本実施形態では、データベースに
登録する文書の言語を、複数言語とすることができる
(混在させることができる)。この点は、ディレクトリ
サーバの管理範囲をワールドワイドに拡大する際にも、
有利である。
In addition, in this embodiment, the language of the document registered in the database can be a plurality of languages (can be mixed). This point is important when expanding the management scope of directory servers worldwide.
It is advantageous.

【0156】(E)第5の実施形態 本実施形態と第3の実施形態の関係は、第4の実施形態
と第2の実施形態の関係と同じである。
(E) Fifth Embodiment The relationship between the present embodiment and the third embodiment is the same as the relationship between the fourth embodiment and the second embodiment.

【0157】(E−1)第5の実施形態の構成および動
作 第3の実施形態と本実施形態の構成上、動作上の主要な
相違点は、言語判定手段501の有無である。
(E-1) Configuration and Operation of Fifth Embodiment In the configuration of the third embodiment and the present embodiment, the main difference in operation is the presence / absence of the language determination means 501.

【0158】以下では、本実施形態の構成、動作が、第
3の実施形態と異なる点についてのみ説明する。
In the following, only the configuration and operation of this embodiment different from those of the third embodiment will be described.

【0159】本実施形態の機械翻訳通信システム50の
構成を図13に示す。
FIG. 13 shows the configuration of the machine translation communication system 50 of the present embodiment.

【0160】図13において、構成要素101,10
3,104,105,106,108、301,30
2,203に関しては、機能面も含めて同一符号を付し
た第3の実施形態の各部と同じなので、その詳しい説明
は省略する。
In FIG. 13, the components 101 and 10
3,104,105,106,108,301,30
2 and 203 are the same as those of the third embodiment, which are denoted by the same reference numerals, including the functional aspects, and therefore, detailed description thereof is omitted.

【0161】また、本実施形態の辞書データベース40
2の構成および機能は、同一符号を付した第4の実施形
態の辞書データベースと同じである。
The dictionary database 40 of the present embodiment
The configuration and function of No. 2 are the same as those of the dictionary database of the fourth embodiment with the same reference numerals.

【0162】そして、前記言語判定手段501の機能
は、第4の実施形態の言語判定手段401と同じであ
る。
The function of the language determining means 501 is the same as that of the language determining means 401 of the fourth embodiment.

【0163】(E−2)第5の実施形態の効果 本実施形態によれば、第3の実施形態の効果と同等な効
果を得ることができる。
(E-2) Effects of the Fifth Embodiment According to the present embodiment, the same effects as those of the third embodiment can be obtained.

【0164】加えて、本実施形態によれば、データベー
スに登録する文書の言語を、複数言語とすることができ
る(混在させることができる)。この点は、ディレクト
リサーバの管理範囲をワールドワイドに拡大する際に
も、有利である。
In addition, according to the present embodiment, the language of the document registered in the database can be a plurality of languages (can be mixed). This is also advantageous when expanding the management range of the directory server worldwide.

【0165】(F)他の実施形態 第1〜第5の実施形態では、閲覧手段、ディレクトリサ
ーバ、外部ネットワークはそれぞれネットワークでつな
がれているものとしたが、これらは同一のコンピュータ
上にあっても構わない。
(F) Other Embodiments In the first to fifth embodiments, the browsing means, the directory server, and the external network are connected to each other by a network. I do not care.

【0166】また、第1〜第5の実施形態では、CGI
を用いて実現したが、Javaなどを用いても同様な機
能が実現できるし、閲覧手段の画面のリンクでしかアド
レスの情報を送ることができないようにすれば、サーバ
上で階層型データベースのノードの位置が把握できるの
で通常のハイパーリンクの仕組みでも実現することがで
きる。
In the first to fifth embodiments, the CGI
However, the same function can be realized by using Java or the like. If the address information can be transmitted only by the link on the screen of the browsing means, the node of the hierarchical database can be realized on the server. Can be realized by a normal hyperlink mechanism.

【0167】さらに、第1〜第5の実施形態において
は、翻訳環境識別子はディレクトリサーバ102によっ
て翻訳対象文書に付与されてユーザ端末101に送られ
るようにしたが、翻訳対象文書が該当するカテゴリが決
まれば翻訳に使用する辞書が自動的に決まる以上、必ず
しもそのようにする必要はない。
Further, in the first to fifth embodiments, the translation environment identifier is assigned to the document to be translated by the directory server 102 and is sent to the user terminal 101. This is not always necessary, as the dictionary used for translation is automatically determined.

【0168】また、第1〜第5の実施形態では、辞書D
1〜D6は、ディレクトリサーバ102が備えているも
のであったが、ネットワーク108上に存在する辞書
も、必要に応じてディレクトリサーバ102の機械翻訳
に使用できるようにしてもよい。
In the first to fifth embodiments, the dictionary D
Although 1 to D6 are provided in the directory server 102, dictionaries existing on the network 108 may be used for machine translation of the directory server 102 as necessary.

【0169】なお、第1〜第5の実施形態における辞書
の数は6つであったが、これはもっと多くてもよく少な
くてもよい。また、取り扱う階層ディレクトリは、図2
のものよりも、カテゴリの数や階層数が多くてもよく、
少なくてもよい。
Although the number of dictionaries in the first to fifth embodiments is six, the number of dictionaries may be more or less. The hierarchical directory handled is shown in FIG.
May have more categories and levels than
It may be less.

【0170】そして、カテゴリ数や階層数が増加して階
層ディレクトリが大規模化した場合、必ずしも最上位の
ルート(一般用語辞書)まで溯って辞書セットを構築す
る必要はない。途中まで溯って構築してもよいし、ま
た、下位方向へもたどるようにして、該当するカテゴリ
より例えば1階層分だけ下位のカテゴリも含めて辞書セ
ットを構築するようにしてもよい。
When the number of categories and the number of hierarchies increases and the hierarchical directory becomes large, it is not always necessary to construct a dictionary set by going back to the highest root (generic term dictionary). The dictionary set may be constructed halfway back, or the dictionary set may be constructed to include a category lower than the corresponding category by, for example, one hierarchy level.

【0171】さらに、下位から上位へたどる途中のカテ
ゴリから、例えば1階層だけ別な分岐を下位にたどっ
て、辞書セットに含まれる辞書を選択するようにしても
よい。これにより、翻訳対象文書が複数分野に属し、な
おかつ当該複数分野が分岐した別の枝に存在する上述し
たケースにも、ある程度対応することが可能になる。
Further, a dictionary included in the dictionary set may be selected by tracing another branch, for example, one level lower, from the category in the middle of tracing from lower to higher. This makes it possible to cope to some extent with the above-described case in which the document to be translated belongs to a plurality of fields and the plurality of fields exist in different branches.

【0172】また、第4および第5の実施形態では、日
本語、英語、中国語などを例示したが、言語の種類はこ
れに限定されない。
Further, in the fourth and fifth embodiments, Japanese, English, Chinese and the like are exemplified, but the type of language is not limited to this.

【0173】さらに、第4および第5の実施形態では、
翻訳元文書の言語が複数で翻訳先文書の言語は1種類で
あったが、翻訳先文書の言語も複数としてもよい。
Further, in the fourth and fifth embodiments,
Although the language of the translation source document is plural and the language of the translation destination document is one type, the language of the translation destination document may be plural.

【0174】なお、第1の実施形態などでは、事前翻訳
を行うようにしたが、これは必ずしも行わなくてもよ
い。
In the first embodiment and the like, pre-translation is performed, but this is not always necessary.

【0175】すなわち、本発明は、受信した第1の言語
の翻訳元文書を、設定された翻訳環境下で、第2の言語
の翻訳先文書に翻訳する機械翻訳システムについて、広
く適用することができる。
That is, the present invention can be widely applied to a machine translation system that translates a received source document in a first language into a destination document in a second language under a set translation environment. it can.

【0176】[0176]

【発明の効果】以上に説明したように、本発明によれ
ば、翻訳元文書が属する専門分野に応じて、翻訳環境を
供給する1又は複数の翻訳環境供給手段を自動的に設定
することができ、操作が簡単で使い勝手がよく、なおか
つ高品質の翻訳先文書を得ることが可能である。
As described above, according to the present invention, one or a plurality of translation environment supply means for supplying a translation environment can be automatically set according to the specialty to which the source document belongs. It is possible to obtain a high-quality translated document that is easy to operate, easy to use, and high in quality.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の実施形態に係る機械翻訳通信システムの
構成を示す概略図である。
FIG. 1 is a schematic diagram illustrating a configuration of a machine translation communication system according to a first embodiment.

【図2】第1〜第5の実施形態に係る階層ディレクトリ
の構成を示す概略図である。
FIG. 2 is a schematic diagram showing a configuration of a hierarchical directory according to the first to fifth embodiments.

【図3】第1〜第5の実施形態の動作を示すフローチャ
ートである。
FIG. 3 is a flowchart showing an operation of the first to fifth embodiments.

【図4】第1〜第5の実施形態の動作を示す画面表示の
一例である。
FIG. 4 is an example of a screen display showing an operation of the first to fifth embodiments.

【図5】第1〜第5の実施形態の動作を示す画面表示の
一例である。
FIG. 5 is an example of a screen display showing the operation of the first to fifth embodiments.

【図6】第2および第4の実施形態の動作を示すフロー
チャートである。
FIG. 6 is a flowchart showing the operation of the second and fourth embodiments.

【図7】第3の実施形態に係る機械翻訳通信システムの
構成を示す概略図である。
FIG. 7 is a schematic diagram illustrating a configuration of a machine translation communication system according to a third embodiment.

【図8】第3および第5の実施形態の動作を示すフロー
チャートである。
FIG. 8 is a flowchart showing the operation of the third and fifth embodiments.

【図9】第2および第4の実施形態の動作を示す画面表
示の一例である。
FIG. 9 is an example of a screen display showing the operation of the second and fourth embodiments.

【図10】第3および第5の実施形態の動作を示す画面
表示の一例である。
FIG. 10 is an example of a screen display showing operations of the third and fifth embodiments.

【図11】第2の実施形態に係る機械翻訳通信システム
の構成を示す概略図である。
FIG. 11 is a schematic diagram illustrating a configuration of a machine translation communication system according to a second embodiment.

【図12】第4の実施形態に係る機械翻訳通信システム
の構成を示す概略図である。
FIG. 12 is a schematic diagram illustrating a configuration of a machine translation communication system according to a fourth embodiment.

【図13】第5の実施形態に係る機械翻訳通信システム
の構成を示す概略図である。
FIG. 13 is a schematic diagram illustrating a configuration of a machine translation communication system according to a fifth embodiment.

【符号の説明】 10、20,30,40,50…機械翻訳通信システ
ム、11…階層ディレクトリ、101…ユーザ端末(閲
覧手段)、102,200,300,400,500…
ディレクトリサーバ、107,204,402…辞書デ
ータベース、103…通信制御手段、106…階層型デ
ータベース、108…(外部)ネットワーク、D1〜D
6…専門用語辞書、P1〜P6…専門用語辞書、CT1
〜CT11…カテゴリ。
[Description of References] 10, 20, 30, 40, 50: Machine translation communication system, 11: Hierarchical directory, 101: User terminal (browsing means), 102, 200, 300, 400, 500 ...
Directory server, 107, 204, 402 dictionary database, 103 communication control means, 106 hierarchical database, 108 (external) network, D1-D
6: Technical term dictionary, P1 to P6: Technical term dictionary, CT1
~ CT11 ... category.

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 受信した第1の言語の翻訳元文書を、設
定された翻訳環境下で、第2の言語の翻訳先文書に翻訳
する機械翻訳システムにおいて、 各翻訳元文書が属する専門分野を示す分野指示手段を、
各専門分野の関係に応じた階層構造で関連付けて管理す
る階層型分野管理手段と、 当該階層構造中の各分野指示手段に対応した翻訳環境を
供給する翻訳環境供給手段と、 前記翻訳の際には、翻訳元文書と分野指示手段の対応関
係、及び前記階層構造中における分野指示手段間の関係
に応じて、当該翻訳のために翻訳環境を供給する1又は
複数の翻訳環境供給手段を自動的に設定する翻訳環境設
定手段とを備えることを特徴とする機械翻訳システム。
In a machine translation system for translating a received source document in a first language into a target document in a second language under a set translation environment, a field of expertise to which each source document belongs is specified. The field indicating means shown
A hierarchical field management unit that manages the fields in association with each other in a hierarchical structure according to the relationship between the specialized fields; a translation environment supply unit that supplies a translation environment corresponding to each field designating unit in the hierarchical structure; Automatically activates one or more translation environment supply means for supplying a translation environment for the translation in accordance with the correspondence between the source document and the field designation means and the relationship between the field designation means in the hierarchical structure. And a translation environment setting means for setting the translation environment.
【請求項2】 請求項1の機械翻訳システムにおいて、 前記翻訳環境供給手段は、専門用語辞書であることを特
徴とする機械翻訳システム。
2. The machine translation system according to claim 1, wherein the translation environment supply unit is a technical term dictionary.
【請求項3】 請求項2の機械翻訳システムにおいて、 原言語の文書と、この文書の対訳である目的言語の文書
とが、それぞれ文単位に対応付けされた対訳文書の登録
を受ける対訳文書登録手段と、 当該対訳文書の比較により、自動的に辞書データを得る
対訳辞書データ獲得手段と、 ここで得られた辞書データを、当該対訳文書と同一専門
分野の専門用語辞書の内容に反映させる対訳辞書内容変
更手段とを備えることを特徴とする機械翻訳システム。
3. A machine translation system according to claim 2, wherein a document in the source language and a document in the target language, which is a translation of the document, are registered in a bilingual document corresponding to each sentence unit. Means, a bilingual dictionary data obtaining means for automatically obtaining dictionary data by comparing the bilingual document, and a bilingual translation for reflecting the obtained dictionary data to the contents of a technical term dictionary in the same technical field as the bilingual document. A machine translation system comprising: a dictionary content changing unit.
【請求項4】 請求項2の機械翻訳システムにおいて、 単一の文書の登録を受ける単一文書登録手段と、 当該文書に対する所定の処理に基づいて自動的に辞書デ
ータを得る単一辞書データ獲得手段と、 ここで得られた辞書データを、当該文書と同一専門分野
の専門用語辞書に反映させる単一辞書内容変更手段とを
備えることを特徴とする機械翻訳システム。
4. A machine translation system according to claim 2, wherein a single document registration means for registering a single document, and a single dictionary data acquisition for automatically obtaining dictionary data based on a predetermined process for said document A machine translation system comprising: a unit; and a single dictionary content changing unit that reflects the dictionary data obtained here to a technical term dictionary in the same technical field as the document.
【請求項5】 請求項2の機械翻訳システムにおいて、 原言語の文書と、この文書の対訳である目的言語の文書
とが、それぞれ文単位に対応付けされた対訳文書の登録
を受ける対訳文書登録手段と、 対訳文書の比較により、自動的に辞書データを得る対訳
辞書データ獲得手段とと、 ここで得られた辞書データを、当該対訳文書と同一専門
分野の専門用語辞書の内容に反映させる対訳辞書内容変
更手段とを備える対訳処理手段を具備すると共に、 単一の文書の登録を受ける単一文書登録手段と、 当該文書に対する所定の処理に基づいて自動的に辞書デ
ータを得る単一辞書データ獲得手段と、 ここで得られた辞書データを、当該文書と同一専門分野
の専門用語辞書に反映させる単一辞書内容変更手段とを
備える単一文書処理手段を具備し、 前記対訳処理手段又は単一文書処理手段のいずれか一方
を選択して動作させる選択手段を備えることを特徴とす
る機械翻訳システム。
5. The machine translation system according to claim 2, wherein a document in the source language and a document in the target language, which is a translation of the document, are registered in a bilingual document corresponding to each sentence. Means, a bilingual dictionary data acquiring means for automatically obtaining dictionary data by comparing the bilingual documents, and a bilingual translation for reflecting the obtained dictionary data to the contents of a technical term dictionary in the same technical field as the bilingual document. Single-document registration means for providing a bilingual translation processing means having dictionary content changing means and receiving registration of a single document; and single-dictionary data for automatically obtaining dictionary data based on predetermined processing for the document. A single document processing means comprising: an acquisition means; and a single dictionary content changing means for reflecting the dictionary data obtained here in a technical term dictionary in the same technical field as the document. Machine translation system characterized in that it comprises selecting means for operating to select one of translation processing means or a single document processor.
【請求項6】 請求項2〜5のいずれかの機械翻訳シス
テムにおいて、 前記専門用語辞書は、少なくとも第1の言語に関して
は、複数種類の言語に対応した複数言語用辞書であると
共に、 翻訳しようとする前記翻訳元文書の第1の言語の種類を
判定する翻訳元言語判定手段を備え、 複数の第1の言語から第2の言語への翻訳に対応するこ
とを特徴とする機械翻訳システム。
6. The machine translation system according to claim 2, wherein the technical term dictionary is a dictionary for a plurality of languages corresponding to a plurality of types of languages, at least for a first language. A machine translation system that includes a translation source language determining unit that determines a type of a first language of the translation source document, and that performs translation from a plurality of first languages to a second language.
JP23511299A 1999-08-23 1999-08-23 Machine translation system Expired - Fee Related JP3761364B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23511299A JP3761364B2 (en) 1999-08-23 1999-08-23 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23511299A JP3761364B2 (en) 1999-08-23 1999-08-23 Machine translation system

Publications (2)

Publication Number Publication Date
JP2001060195A true JP2001060195A (en) 2001-03-06
JP3761364B2 JP3761364B2 (en) 2006-03-29

Family

ID=16981243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23511299A Expired - Fee Related JP3761364B2 (en) 1999-08-23 1999-08-23 Machine translation system

Country Status (1)

Country Link
JP (1) JP3761364B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016066174A (en) * 2014-09-24 2016-04-28 富士ゼロックス株式会社 Dictionary selection device, document conversion system, program and document conversion method
JP2022188810A (en) * 2021-06-10 2022-12-22 Scalably株式会社 Information processing apparatus and information processing program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016066174A (en) * 2014-09-24 2016-04-28 富士ゼロックス株式会社 Dictionary selection device, document conversion system, program and document conversion method
JP2022188810A (en) * 2021-06-10 2022-12-22 Scalably株式会社 Information processing apparatus and information processing program

Also Published As

Publication number Publication date
JP3761364B2 (en) 2006-03-29

Similar Documents

Publication Publication Date Title
US6571241B1 (en) Multilingual patent information search system
JP3666004B2 (en) Multilingual document search system
US7447624B2 (en) Generation of localized software applications
JP2002215621A (en) Translation server, translation method and program
US20010021934A1 (en) Processing device for searching information in one language using search query in another language, and recording medium and method thereof
JPH11250105A (en) Method and system for retrieving multi-language information
JPH0256703B2 (en)
EP0150273B1 (en) Multi-lingual system across nodes
JPS59146381A (en) Language processing system
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
EP1315085B1 (en) Automatic image-button creation process
JP4017329B2 (en) Machine translation system
JP3761364B2 (en) Machine translation system
KR100714231B1 (en) Electronic dictionary with illustrative sentences
JPH10326277A (en) Translation service providing method and translation service system
JP3450598B2 (en) Technical term dictionary selection device
WO2001055901A1 (en) Machine translation system, translation server thereof, and client thereof
JPH08305728A (en) Inter multilingual retrieving system
JPH10260992A (en) Database processor and storage medium
JP2008065577A (en) Document retrieval system, document retrieval program and computer-readable recording medium recorded with document retrieval program
JP3294966B2 (en) Machine translation equipment
JP2806352B2 (en) Dictionary maintenance equipment for machine translation
KR20050023942A (en) Multi language translation system and method thereof and media that can record computer program sources thereof
JP2002183134A (en) Translating device
JPH10222516A (en) Multilingual correspondence communication system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051018

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060110

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100120

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100120

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110120

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110120

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120120

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130120

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140120

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees