JP2003016063A - 機械翻訳辞書自動選択装置および情報記憶媒体 - Google Patents
機械翻訳辞書自動選択装置および情報記憶媒体Info
- Publication number
- JP2003016063A JP2003016063A JP2001195595A JP2001195595A JP2003016063A JP 2003016063 A JP2003016063 A JP 2003016063A JP 2001195595 A JP2001195595 A JP 2001195595A JP 2001195595 A JP2001195595 A JP 2001195595A JP 2003016063 A JP2003016063 A JP 2003016063A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- translation
- machine translation
- document
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 機械翻訳システムにおいて、専門分野におけ
る翻訳精度の向上とシステム利用の利便性の向上ができ
る技術に関するものである。 【解決手段】機械翻訳用辞書を用意するために、コーパ
ス理論からの原語と対訳を人間が前もって翻訳した対訳
から辞書を作成するシステムを開発することにより、人
間の支援をもとに、専門用語辞書を抽出する辞書を開発
することが可能になります。特に特許翻訳分野において
は、日本語文の公表、再公表とPCT国際公開されてい
る英文や各国語の公報があり、対訳公報が公開されてい
るため、各IPC分野毎に翻訳辞書を作成可能です。こ
のより細かなIPC専門分野辞書を利用して特許公報文
献を機械翻訳するときに、文書のIPC分類からIPC
単位専門分野辞書を自動選択して、その文書により最適
な訳語を割り付け訳質の向上ができるようにする技術で
す。
る翻訳精度の向上とシステム利用の利便性の向上ができ
る技術に関するものである。 【解決手段】機械翻訳用辞書を用意するために、コーパ
ス理論からの原語と対訳を人間が前もって翻訳した対訳
から辞書を作成するシステムを開発することにより、人
間の支援をもとに、専門用語辞書を抽出する辞書を開発
することが可能になります。特に特許翻訳分野において
は、日本語文の公表、再公表とPCT国際公開されてい
る英文や各国語の公報があり、対訳公報が公開されてい
るため、各IPC分野毎に翻訳辞書を作成可能です。こ
のより細かなIPC専門分野辞書を利用して特許公報文
献を機械翻訳するときに、文書のIPC分類からIPC
単位専門分野辞書を自動選択して、その文書により最適
な訳語を割り付け訳質の向上ができるようにする技術で
す。
Description
【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は機械翻訳システムに
おいて、専門分野における翻訳精度の向上とシステム利
用の利便性の向上ができる技術に関するものである。 【0002】 【従来の技術】機械翻訳システムにおいて、従来技術で
は専門分野別の翻訳精度を上げるため、専門用語辞書を
用意して、その文書用と思われる専門用語辞書を利用者
が選択して機械翻訳をさせていました。この方法は利用
者が専門用語辞書を選択することで訳質向上に効果があ
りますが、機械翻訳時に専門用語辞書を選択する必要が
あり、分野が細かくなると専門用語辞書を選択するのが
難しい問題がありました。 【0003】 【発明が解決しようとする課題】訳質を向上させるため
により細かな分野の専門用語辞書を適用することは効果
がありますが、分野が細かくなると専門用語辞書を的確
に適用する必要があり、翻訳者の仕事としておこなう場
合は可能でしたが、インターネット時代になり、翻訳前
に利用者が専門用語辞書を選択する必要がでてきまし
た。また翻訳対象の分野を間違えると逆に訳質がより悪
くなることもありました。各分野単位で細かな分野の辞
書を用意したほうが訳質が向上しますが、より細かな分
野の辞書を用意しても適用分野を的確にあわせることが
必要とされます。いままでは翻訳者が支援して機械翻訳
の辞書を選択していましたが、インターネットでの利用
になり利用者がより簡単に専門用語辞書を選択できる方
式が必要になりました。利用者はより細かな専門分野辞
書を利用しているにも関わらず自身で辞書を選択する必
要がなく、最適な専門用語辞書を自動的に選択できるよ
うにすることです。 【0004】 【課題を解決するための手段】機械翻訳用辞書を用意す
るために、コーパス理論からの原語と対訳を人間が前も
って翻訳した対訳から辞書を作成するシステムを開発す
ることにより、人間の支援をもとに、専門用語辞書を抽
出する辞書を開発することが可能になります。特に特許
翻訳分野においては、日本語文の公表、再公表とPCT
国際公開されている英文や各国語の公報があり、対訳公
報が公開されているため、各IPC分野毎に翻訳辞書を
作成可能です。このより細かなIPC専門分野辞書を利
用して特許公報文献を機械翻訳するときに、文書のIP
C分類からIPC単位専門分野辞書を自動選択して、そ
の文書により最適な訳語を割り付け訳質の向上ができる
ようにする技術です。 【0005】 【発明の実施の形態】以下、本発明を図示する実施形態
に基づいて説明する。図1はこの実施形態に係わる機械
翻訳システムを示す。この翻訳システムの大きな構成要
素は、サーバとして機能するコンピュータと、通信回線
により結ばれたクライアントとして機能する翻訳依頼を
するコンピュータから、通信回線を経由して翻訳依頼i
が送信される。 【0006】この実施形態では翻訳コンピュータは、コ
ンテンツ配信業者の事業部に配置されたサーバ用コンピ
ュータによって構成されており、比較的大規模なサーバ
コンピュータである。 【0007】翻訳依頼を受け取った機械翻訳コンピュー
タは、翻訳対象文献を特定し、文書に分野を特定する情
報があるかを検査する。もし翻訳対象文献が特許公報の
場合は、IPC分類を調べて、翻訳対象文の分野を特定
する。 【0008】翻訳対象文の分類がIPC分類の場合は、
IPC単位専門分野辞書を選択して機械翻訳を開始し、
翻訳結果oを出力し、通信回線を介して利用者のクライ
アントコンピュータへ翻訳結果を送信する。 【0009】一方、翻訳対象文から文献の専門分野を特
定するための分類種別が特定できない場合は、翻訳対象
文献の単語の統計による特徴ベクトルを抽出して、専門
分野辞書の特徴ベクトルからもっとも近似度の高い専門
用語辞書を特定する 【0010】一方、専門用語辞書は、人間が前もって原
文と対訳文から翻訳した対訳データベースをもとに作ら
れる対訳辞書から専門用語辞書を作成する。 【発明の効果】以上のとおり本発明に係わる機械翻訳シ
ステムにおいて、翻訳された翻訳文は翻訳対象文献に最
適の専門用語辞書が自動的に選択されて翻訳されるた
め、翻訳後の訳質は高くなる。また利用者が翻訳辞書を
選択する必要がないため、利用者の利便性が高い機械翻
訳サービスを可能になる。
おいて、専門分野における翻訳精度の向上とシステム利
用の利便性の向上ができる技術に関するものである。 【0002】 【従来の技術】機械翻訳システムにおいて、従来技術で
は専門分野別の翻訳精度を上げるため、専門用語辞書を
用意して、その文書用と思われる専門用語辞書を利用者
が選択して機械翻訳をさせていました。この方法は利用
者が専門用語辞書を選択することで訳質向上に効果があ
りますが、機械翻訳時に専門用語辞書を選択する必要が
あり、分野が細かくなると専門用語辞書を選択するのが
難しい問題がありました。 【0003】 【発明が解決しようとする課題】訳質を向上させるため
により細かな分野の専門用語辞書を適用することは効果
がありますが、分野が細かくなると専門用語辞書を的確
に適用する必要があり、翻訳者の仕事としておこなう場
合は可能でしたが、インターネット時代になり、翻訳前
に利用者が専門用語辞書を選択する必要がでてきまし
た。また翻訳対象の分野を間違えると逆に訳質がより悪
くなることもありました。各分野単位で細かな分野の辞
書を用意したほうが訳質が向上しますが、より細かな分
野の辞書を用意しても適用分野を的確にあわせることが
必要とされます。いままでは翻訳者が支援して機械翻訳
の辞書を選択していましたが、インターネットでの利用
になり利用者がより簡単に専門用語辞書を選択できる方
式が必要になりました。利用者はより細かな専門分野辞
書を利用しているにも関わらず自身で辞書を選択する必
要がなく、最適な専門用語辞書を自動的に選択できるよ
うにすることです。 【0004】 【課題を解決するための手段】機械翻訳用辞書を用意す
るために、コーパス理論からの原語と対訳を人間が前も
って翻訳した対訳から辞書を作成するシステムを開発す
ることにより、人間の支援をもとに、専門用語辞書を抽
出する辞書を開発することが可能になります。特に特許
翻訳分野においては、日本語文の公表、再公表とPCT
国際公開されている英文や各国語の公報があり、対訳公
報が公開されているため、各IPC分野毎に翻訳辞書を
作成可能です。このより細かなIPC専門分野辞書を利
用して特許公報文献を機械翻訳するときに、文書のIP
C分類からIPC単位専門分野辞書を自動選択して、そ
の文書により最適な訳語を割り付け訳質の向上ができる
ようにする技術です。 【0005】 【発明の実施の形態】以下、本発明を図示する実施形態
に基づいて説明する。図1はこの実施形態に係わる機械
翻訳システムを示す。この翻訳システムの大きな構成要
素は、サーバとして機能するコンピュータと、通信回線
により結ばれたクライアントとして機能する翻訳依頼を
するコンピュータから、通信回線を経由して翻訳依頼i
が送信される。 【0006】この実施形態では翻訳コンピュータは、コ
ンテンツ配信業者の事業部に配置されたサーバ用コンピ
ュータによって構成されており、比較的大規模なサーバ
コンピュータである。 【0007】翻訳依頼を受け取った機械翻訳コンピュー
タは、翻訳対象文献を特定し、文書に分野を特定する情
報があるかを検査する。もし翻訳対象文献が特許公報の
場合は、IPC分類を調べて、翻訳対象文の分野を特定
する。 【0008】翻訳対象文の分類がIPC分類の場合は、
IPC単位専門分野辞書を選択して機械翻訳を開始し、
翻訳結果oを出力し、通信回線を介して利用者のクライ
アントコンピュータへ翻訳結果を送信する。 【0009】一方、翻訳対象文から文献の専門分野を特
定するための分類種別が特定できない場合は、翻訳対象
文献の単語の統計による特徴ベクトルを抽出して、専門
分野辞書の特徴ベクトルからもっとも近似度の高い専門
用語辞書を特定する 【0010】一方、専門用語辞書は、人間が前もって原
文と対訳文から翻訳した対訳データベースをもとに作ら
れる対訳辞書から専門用語辞書を作成する。 【発明の効果】以上のとおり本発明に係わる機械翻訳シ
ステムにおいて、翻訳された翻訳文は翻訳対象文献に最
適の専門用語辞書が自動的に選択されて翻訳されるた
め、翻訳後の訳質は高くなる。また利用者が翻訳辞書を
選択する必要がないため、利用者の利便性が高い機械翻
訳サービスを可能になる。
【図面の簡単な説明】
【図1】機械翻訳装置中で、翻訳対象文献(特許公報)
から翻訳文のIPC分類をもとに、機械翻訳の専門用語
辞書を自動選択する実施方法を示した説明図である。 【符号の説明】 i 翻訳依頼 o 翻訳結果 t 翻訳文のIPC分類 d IPC専門用語辞書
から翻訳文のIPC分類をもとに、機械翻訳の専門用語
辞書を自動選択する実施方法を示した説明図である。 【符号の説明】 i 翻訳依頼 o 翻訳結果 t 翻訳文のIPC分類 d IPC専門用語辞書
Claims (1)
- 【特許請求の範囲】 【請求項1 】 通信回線を介してクライアントとして機
能する利用者コンピュータから、サーバとして機能する
機械翻訳コンピュータへ、翻訳依頼をする場合に、利用
者が翻訳対象文献の専門分野を選択せずとも、その翻訳
文の専門分野辞書をサーバ側翻訳コンピュータが自動的
に選択して、その文書に最適な専門分野辞書を適用した
機械翻訳をする機械翻訳コンピュータシステムを特徴と
する。 【請求項2 】 請求項1 に記載のシステムにおいて、
ユーザが入力した翻訳依頼情報で特許情報の場合は、I
PCをもとに文献の分野を特定しIPC単位辞書により
機械翻訳時に利用する専門用語辞書を選択する。 【請求項3 】 請求項1 に記載のシステムにおいて、
ユーザが入力した翻訳依頼情報で専門分野が分類種別に
より特定できない文書の場合は、翻訳対象文献の単語の
統計による特徴ベクトルを抽出して、専門用語辞書の特
徴ベクトルからもっとも近似度の専門用語辞書を選択す
る。 【請求項4 】 請求項1 に記載のシステムにおいて、
細かな分野の専門分野辞書は、人間が前もって翻訳した
原文と対訳文からの対訳データベースをもとに作られる
対訳辞書を、専門用語辞書として利用することを可能に
する。 【請求項5 】 請求項1 〜4 のいずれかに記載のシス
テムにおいて、機械翻訳システムについての利用条件と
して、専門用語辞書を自動選択することが可能な機械翻
訳コンピュータシステム。 【請求項6 】 請求項1 〜6 のいずれかに記載のシス
テムにおいてコンピュータとして機能させるためのプロ
グラムを記録したコンピュータ読取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001195595A JP2003016063A (ja) | 2001-06-27 | 2001-06-27 | 機械翻訳辞書自動選択装置および情報記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001195595A JP2003016063A (ja) | 2001-06-27 | 2001-06-27 | 機械翻訳辞書自動選択装置および情報記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003016063A true JP2003016063A (ja) | 2003-01-17 |
Family
ID=19033544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001195595A Pending JP2003016063A (ja) | 2001-06-27 | 2001-06-27 | 機械翻訳辞書自動選択装置および情報記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003016063A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9081762B2 (en) | 2012-07-13 | 2015-07-14 | Enyuan Wu | Phrase-based dictionary extraction and translation quality evaluation |
US12091574B2 (en) | 2019-07-26 | 2024-09-17 | Jiangsu Favored Nanotechnology Co., Ltd. | Hydrophobic surface coating and preparation method therefor |
-
2001
- 2001-06-27 JP JP2001195595A patent/JP2003016063A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9081762B2 (en) | 2012-07-13 | 2015-07-14 | Enyuan Wu | Phrase-based dictionary extraction and translation quality evaluation |
US9652454B2 (en) | 2012-07-13 | 2017-05-16 | Microsoft Technology Licensing, Llc | Phrase-based dictionary extraction and translation quality evaluation |
US12091574B2 (en) | 2019-07-26 | 2024-09-17 | Jiangsu Favored Nanotechnology Co., Ltd. | Hydrophobic surface coating and preparation method therefor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20050149499A1 (en) | Systems and methods for improving search quality | |
US20080028305A1 (en) | Computer, server and method for translation of documents | |
US20010029442A1 (en) | Translation system, translation processing method and computer readable recording medium | |
US7283949B2 (en) | System, method and program product for bidirectional text translation | |
JP2004220266A (ja) | 機械翻訳装置および機械翻訳方法 | |
JP2003016063A (ja) | 機械翻訳辞書自動選択装置および情報記憶媒体 | |
JP3722976B2 (ja) | 翻訳サービス提供方法及び翻訳サービスシステム | |
JP6766384B2 (ja) | 情報処理装置及びプログラム | |
JP2019045953A (ja) | 類語処理装置、及びプログラム | |
Premjith et al. | A fast and efficient framework for creating parallel corpus | |
WO2001055901A1 (fr) | Systeme de traduction automatique, serveur et client de ce systeme | |
JP2003296327A (ja) | 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム | |
RU172882U1 (ru) | Устройство для автоматического перевода текста | |
JP5453779B2 (ja) | 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム | |
Landwehr et al. | OpenTIPE: An Open-source Translation Framework for Interactive Post-Editing Research | |
JP5387166B2 (ja) | 情報処理装置及びプログラム | |
JPH1115827A (ja) | 翻訳装置および記録媒体 | |
JP4035975B2 (ja) | 機械翻訳端末装置、機械翻訳システム、機械翻訳端末装置の制御方法、機械翻訳システムの制御方法、機械翻訳端末装置の制御プログラム及び記録媒体 | |
JP2003114890A (ja) | 翻訳装置、翻訳方法、翻訳サーバおよびプログラム | |
JP2742059B2 (ja) | 翻訳用辞書編集装置 | |
JP2002132764A (ja) | 機械翻訳前処理装置 | |
JP2016177341A (ja) | 対訳文生成装置、翻訳装置、対訳文生成方法、及びプログラム | |
Hasan et al. | A flexible architecture for CAT applications | |
JP2001350753A (ja) | 翻訳システム、翻訳処理装置、記録媒体およびプログラム | |
Zhechev | Term Translation Central: Up-to-date MT without Frequent Retraining |