JP2003006190A - 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法 - Google Patents

辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法

Info

Publication number
JP2003006190A
JP2003006190A JP2001193923A JP2001193923A JP2003006190A JP 2003006190 A JP2003006190 A JP 2003006190A JP 2001193923 A JP2001193923 A JP 2001193923A JP 2001193923 A JP2001193923 A JP 2001193923A JP 2003006190 A JP2003006190 A JP 2003006190A
Authority
JP
Japan
Prior art keywords
document
dictionary
field
data
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001193923A
Other languages
English (en)
Inventor
Seiji Takano
誠司 高野
Shinji Ichikawa
伸治 市川
Hidehisa Hiromoto
英久 廣本
Toru Takeuchi
徹 竹内
Takaharu Hoshino
隆治 星乃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2001193923A priority Critical patent/JP2003006190A/ja
Publication of JP2003006190A publication Critical patent/JP2003006190A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 一の言語で作成された文献と、この文献を他
の言語に翻訳した文献に基づいて作成された精度の高い
辞書を用いる自動翻訳装置を提供する。 【解決手段】辞書作成部2は、辞書作成処理部20を備
えており、第1文献データ記憶部4a及び第2文献デー
タ記憶部4bから文献データを取り込む文献データ取込
部22、作成した辞書を修正する辞書修正部24及び分
野毎に作成した辞書を記憶している分野別辞書データ記
憶部26a、26b、26c…が接続されている。翻訳
処理部6は、基本辞書データ記憶部10に記憶されてい
る基本辞書、ユーザ辞書データ記憶部12に記憶されて
いるユーザ辞書及び分野別辞書データ記憶部20a、2
6b、26c…に記憶されている分野別辞書を用いて一
の言語で作成された翻訳対象文書を他の言語へ翻訳す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、一の言語で作成
された翻訳対象文書を他の言語に翻訳する際に用いる所
定分野毎の辞書を作成する辞書作成装置、辞書作成方
法、辞書作成プログラム、辞書作成プログラムを記録し
たコンピュータ読み取り可能な記録媒体に関するもので
ある。
【0002】また、一の言語で作成された翻訳対象文書
を所定分野毎の辞書を用いて他の言語に翻訳する自動翻
訳装置、自動翻訳方法、自動翻訳プログラム、自動翻訳
プログラムを記録したコンピュータ読み取り可能な記録
媒体及び翻訳対象文書の翻訳文の製造方法に関するもの
である。
【0003】
【従来の技術】従来、一の言語で作成された文書を他の
言語へ翻訳する場合、一般的な辞書と翻訳対象文書の分
野に対応した分野別辞書を用いて翻訳を行う翻訳装置が
存在する。このような装置として、インターネット上に
掲載されている文書の翻訳をする際に使用する分野別辞
書をユーザが設定することなく、文書が掲載されている
アドレスに基づいて、既に設定されている分野別辞書の
中から翻訳に際して使用する分野別辞書を選択する翻訳
装置が存在する(特開平10−21222号公報)。
【0004】また、一度に参照するデータ量を減らし、
細分野毎の単語の訳し分けをすることができるように分
野別辞書を階層的な分野に分けて保持し、ユーザが翻訳
対象文書の分野に基づいて辞書を選択することができる
階層的辞書選択部を備えた機械翻訳装置が存在する(特
開平11−296517号公報)。
【0005】このようにして、分野別辞書を設け、かつ
翻訳対象文書の分野にあった辞書の選択を行うのは、こ
の分野別辞書の精度が翻訳の精度に与える影響が大きい
ためである。
【0006】
【発明が解決しようとする課題】ところで、同じ表記の
単語であっても分野によって意味が異なる単語が多数存
在するため、精度の高い分野別辞書を作成するのは容易
ではないという問題があった。また、翻訳対象文書の分
野をその記載内容から正確に把握し、翻訳対象文書の分
野に適切に対応した分野別辞書を選択することが必要と
なるが、この翻訳対象文書の分野を正確に把握するのが
困難であるという問題もあった。更に、分野別辞書を作
成する際の分野の特定方法及び翻訳対象文書の分野の特
定方法が異なっている場合には、翻訳対象文書の分野を
適切に把握した場合であっても、翻訳対象文書の分野に
一致した適切な分野別辞書を選択することが困難である
という問題もあった。
【0007】この発明の課題は、一の言語で作成された
文献と、この文献を他の言語に翻訳した文献に基づいて
精度の高い分野別辞書を作成する辞書作成装置、辞書作
成方法、辞書作成プログラム、辞書作成プログラムを記
録したコンピュータ読み取り可能な記録媒体を提供する
ことである。
【0008】また、一の言語で作成された翻訳対象文書
をこの分野別辞書を用いて、精度高く他の言語に翻訳す
ることができる自動翻訳装置、自動翻訳方法、自動翻訳
プログラム、自動翻訳プログラムを記録したコンピュー
タ読み取り可能な記録媒体及び翻訳対象文書の翻訳文の
製造方法を提供することである。
【0009】
【課題を解決するための手段】請求項1記載の辞書作成
装置は、一の言語で作成された文献であって、所定分野
に分類することができる第1の文献データが記憶されて
いる第1文献データ記憶手段と、前記第1の文献データ
を他の言語に翻訳した第2の文献データが記憶されてい
る第2文献データ記憶手段と、前記第1の文献の分野
を、前記第1の文献データから抽出された所定のデータ
に基づいて特定する分野特定手段と、前記第1の文献デ
ータの単語に対応し、同一の意味内容を有する単語を前
記第2の文献データの中から抽出する単語抽出手段と、
前記単語抽出手段により抽出された単語に基づいて前記
分野特定手段により特定された分野の辞書を作成する辞
書作成手段とを備えることを特徴とする。
【0010】また、請求項2記載の辞書作成装置は、前
記単語抽出手段により抽出された前記第1の文献データ
の単語に対応する前記第2の文献データの単語が適切で
ない場合に、前記単語を適切な単語に修正する辞書修正
手段を更に備えることを特徴とする。
【0011】また、請求項3記載の辞書作成装置は、前
記分野特定手段が、前記第1の文献が特許文献である場
合には、前記第1の文献データから抽出された特許分類
を示すデータに基づいて、前記第1の文献の分野を特定
することを特徴とする。
【0012】この請求項1〜請求項3に記載の辞書作成
装置によれば、一の言語で作成された第1の文献の分野
を、この第1の文献が特許文献である場合には、第1の
文献データから抽出された特許分類を示すデータに基づ
いて特定し、第1の文献データの単語に対応する単語を
第2の文献データの中から抽出し、必要な場合には第2
の文献データから抽出した単語を修正することによって
特定された分野の辞書を作成している。従って、同一の
文献について作成された一の言語の文献と、他の言語の
文献を用いて、特定された分野について分野別辞書の作
成を行っていることから、分野毎に精度の高い辞書を作
成することができる。
【0013】また、請求項4記載の自動翻訳装置は、一
の言語で作成された翻訳対象文書の分野を、前記翻訳対
象文書のデータから抽出された所定のデータに基づいて
特定する分野特定手段と、前記分野特定手段により特定
された分野に基づいて、前記翻訳対象文書を翻訳するた
めに使用する辞書を、一の言語で作成された文献であっ
て、所定分野に分類することができる第1の文献及びこ
の第1の文献を他の言語に翻訳した第2の文献を用いて
作成された所定分野毎の辞書の中から選択する辞書選択
手段と、前記辞書選択手段により選択された辞書を用い
て前記翻訳対象文書を翻訳する翻訳手段と、前記翻訳手
段により他の言語に翻訳された文書を出力する出力手段
とを備えることを特徴とする。
【0014】また、請求項5記載の自動翻訳装置は、前
記翻訳手段により、前記一の言語で作成された翻訳対象
文書を前記他の言語に翻訳した場合に、翻訳内容の修正
を行う翻訳修正手段を更に備えることを特徴とする。
【0015】また、請求項6記載の自動翻訳装置は、前
記翻訳修正手段により修正された内容を記憶する修正内
容記憶手段と、前記修正内容記憶手段により記憶された
修正内容に基づいて、前記翻訳手段において優先的に用
いられるユーザ辞書を作成するユーザ辞書作成手段とを
更に備えることを特徴とする。
【0016】また、請求項7記載の自動翻訳装置は、前
記辞書選択手段が、前記分野特定手段により特定された
前記翻訳対象文書の分野が複数ある場合に、対応する分
野の辞書を複数選択することを特徴とする。
【0017】また、請求項8記載の自動翻訳装置は、前
記辞書選択手段により複数の辞書が選択された場合に、
前記選択された複数の辞書のうち、何れの辞書を優先的
に使用するかの優先順位を指定する優先順位指定手段を
更に備えることを特徴とする。
【0018】また、請求項9記載の自動翻訳装置は、前
記分野特定手段が、前記翻訳対象文書が特許文献である
場合には、前記翻訳対象文書のデータから抽出された特
許分類を示すデータに基づいて、前記翻訳対象文書の分
野を特定することを特徴とする。
【0019】この請求項4〜請求項9記載の自動翻訳装
置は、翻訳対象文書の分野を、翻訳対象文書が特許文献
である場合には、翻訳対象文書から抽出された特許分類
を示すデータに基づいて特定し、翻訳の際に使用する辞
書を特定された分野に基づいて選択する。そして、翻訳
の際に優先的に使用されるユーザ辞書が作成されている
場合には、このユーザ辞書を優先的に使用して翻訳を行
い、必要がある場合には翻訳文の修正を行い、翻訳した
文書を出力する。従って、翻訳対象文書の分野を適切に
把握することができると共に、適切に把握された翻訳対
象文書の分野に対応する分野の辞書を選択して精度の高
い翻訳を行うことができる。更に、過去の翻訳修正内容
履歴に基づいて作成されたユーザ辞書を用いてより精度
の高い翻訳を行うことができる。
【0020】また、請求項10記載の自動翻訳装置は、
一の言語で作成された文献であって、所定分野に分類す
ることができる第1の文献データが記憶されている第1
文献データ記憶手段と、前記第1の文献データを他の言
語に翻訳した第2の文献データが記憶されている第2文
献データ記憶手段と、前記第1の文献の分野を、前記第
1の文献データから抽出された所定のデータに基づいて
特定する第1の分野特定手段と、前記第1の文献データ
の単語に対応し、同一の意味内容を有する単語を前記第
2の文献データの中から抽出する単語抽出手段と、前記
単語抽出手段により抽出された単語に基づいて前記第1
の分野特定手段により特定された分野の辞書を作成する
辞書作成手段と、一の言語で作成された翻訳対象文書の
分野を、前記翻訳対象文書のデータから抽出された所定
のデータに基づいて特定する第2の分野特定手段と、前
記第2の分野特定手段により特定された分野に基づい
て、前記翻訳対象文書を翻訳するために使用する辞書を
前記辞書作成装置により作成された所定分野毎の辞書の
中から選択する辞書選択手段と、前記辞書選択手段によ
り選択された辞書を用いて前記翻訳対象文書を翻訳する
翻訳手段と、前記翻訳手段により他の言語に翻訳された
文書を出力する出力手段とを備えることを特徴とする。
【0021】また、請求項11記載の自動翻訳装置は、
前記単語抽出手段により抽出された前記第1の文献デー
タの単語に対応する前記第2の文献データの単語が適切
でない場合に、前記単語を適切な単語に修正する辞書修
正手段を更に備えることを特徴とする。
【0022】また、請求項12記載の自動翻訳装置は、
前記一の言語で作成された翻訳対象文書を、前記翻訳手
段により他の言語へ翻訳した場合に、翻訳内容の修正を
する翻訳修正手段を更に備えることを特徴とする。
【0023】また、請求項13記載の自動翻訳装置は、
前記翻訳修正手段により修正された内容を記憶する修正
記憶手段と、前記修正記憶手段により記憶された修正内
容に基づいて、前記翻訳手段において優先的に用いられ
るユーザ辞書を作成するユーザ辞書作成手段とを更に備
えることを特徴とする。
【0024】また、請求項14記載の自動翻訳装置は、
前記辞書選択手段が、前記分野特定手段により特定され
た前記翻訳対象文書の分野が複数の場合に、対応する分
野の辞書を複数選択することを特徴とする。
【0025】また、請求項15記載の自動翻訳装置は、
前記辞書選択手段により複数の辞書が選択された場合
に、前記選択された複数の辞書のうち、何れの辞書を優
先的に使用するかの優先順位を指定する優先順位指定手
段を更に備えることを特徴とする。
【0026】また、請求項16記載の自動翻訳装置は、
前記第1の分野特定手段及び前記第2の分野特定手段
は、前記第1の文献又は前記翻訳対象文書が特許文献で
ある場合に、前記第1の文献データ又は前記翻訳対象文
書のデータから抽出された特許分類を示すデータに基づ
いて、前記第1の文献又は前記翻訳対象文書の分野を特
定することを特徴とする。
【0027】この請求項10〜請求項16に記載の自動
翻訳装置によれば、一の言語で作成された第1の文献の
分野を、この第1の文献が特許文献である場合には、第
1の文献データから抽出された特許分類を示すデータに
基づいて特定し、この第1の文献データと他の言語で作
成された第2の文献データに基づいて所定分野の辞書を
作成している。そして、翻訳対象文書の分野を、翻訳対
象文書が特許文献である場合には、翻訳対象文書から抽
出された特許分類を示すデータに基づいて特定し、この
特定された分野に基づいて翻訳の際に使用する辞書を選
択し、選択された分野毎の辞書、及び、作成されている
場合にはユーザ辞書を優先的に使用して翻訳を行ってい
る。従って、所定分野毎の辞書を作成するための一の言
語で作成された文献の分野と翻訳対象文書の分野を同一
の手法により特定しており、翻訳の際に使用する辞書を
的確に選択して精度の高い辞書を用いて翻訳を行うこと
ができると共に、過去の翻訳修正内容履歴に基づいて作
成されたユーザ辞書を用いて、より精度の高い翻訳を行
うことができる。
【0028】また、請求項17記載の辞書作成方法は、
一の言語で作成された第1の文献の分野を、前記第1の
文献のデータから抽出された所定のデータに基づいて特
定する分野特定ステップと、前記第1の文献データの単
語に対応し、同一の意味内容を有する単語を前記第1の
文献データを他の言語に翻訳した第2の文献データの中
から抽出する単語抽出ステップと、前記単語抽出ステッ
プにおいて抽出された単語に基づいて前記分野特定ステ
ップにより特定された分野の辞書を作成する辞書作成ス
テップとを含むことを特徴とする。
【0029】また、請求項18記載の辞書作成方法は、
前記分野特定ステップが、前記第1の文献が特許文献で
ある場合には、前記第1の文献データから抽出された特
許分類を示すデータに基づいて、前記第1の文献の分野
を特定することを特徴とする。
【0030】この請求項17及び請求項18記載の辞書
作成方法によれば、同一の文献について作成された一の
言語で作成された第1の文献と、この第1の文献を翻訳
した第2の文献データに基づいて所定の分野毎に辞書を
作成しているため、単語間の意味内容の不一致が少な
く、精度の高い辞書を作成することができる。
【0031】また、請求項19記載の自動翻訳方法は、
一の言語で作成された第1の文献の分野を、前記第1の
文献のデータから抽出された所定のデータに基づいて特
定する第1の分野特定ステップと、前記第1の文献デー
タの単語に対応し、同一の意味内容を有する単語を前記
第1の文献データを他の言語に翻訳した第2の文献デー
タの中から抽出する単語抽出ステップと、前記単語抽出
ステップにおいて抽出された単語に基づいて前記第1の
分野特定ステップにより特定された分野の辞書を作成す
る辞書作成ステップと、一の言語で作成された翻訳対象
文書の分野を、前記翻訳対象文書のデータから抽出され
た所定のデータに基づいて特定する第2の分野特定ステ
ップと、前記第2の分野特定ステップにおいて特定され
た分野に基づいて、前記翻訳対象文書を翻訳するために
使用する辞書を前記所定分野毎の辞書の中から選択する
辞書選択ステップと、前記辞書選択ステップにおいて選
択された辞書を用いて前記翻訳対象文書を翻訳する翻訳
ステップとを含むことを特徴とする。
【0032】また、請求項20記載の自動翻訳方法は、
前記第1の分野特定ステップ及び前記第2の分野特定ス
テップが、前記第1の文献又は前記翻訳対象文書が特許
文献である場合に、前記第1の文献又は前記翻訳対象文
書のデータから抽出された特許分類を示すデータに基づ
いて、前記第1の文献又は前記翻訳対象文書の分野を特
定することを特徴とする。
【0033】この請求項19及び請求項20記載の自動
翻訳方法によれば、分野毎の辞書を作成するために用い
る一の言語で作成された文献の分野と、翻訳対象文書の
分野とを同一手法により特定しているため、的確な分野
毎の辞書を選択することができ、精度の高い翻訳を行う
ことができる。
【0034】また、請求項21記載の辞書作成プログラ
ムは、一の言語で作成された文書を他の言語に翻訳する
際に用いる所定分野毎の辞書を作成するためにコンピュ
ータを、一の言語で作成された第1の文献の分野を、前
記第1の文献のデータから抽出された所定のデータに基
づいて特定する分野特定手段、前記第1の文献データの
単語に対応し、同一の意味内容を有する単語を前記第1
の文献データを他の言語に翻訳した第2の文献データの
中から抽出する単語抽出手段、前記単語抽出手段により
抽出された単語に基づいて前記分野特定手段により特定
された分野の辞書を作成する辞書作成手段として機能さ
せることを特徴とする。
【0035】この請求項21記載の辞書作成プログラム
によれば、精度の高い所定分野毎の辞書を作成すること
ができるようにコンピュータを機能させることができ
る。
【0036】また、請求項22記載の自動翻訳プログラ
ムは、所定分野毎の辞書を用いて一の言語で作成された
文書を他の言語に翻訳するためにコンピュータを、一の
言語で作成された第1の文献の分野を、前記第1の文献
のデータから抽出された所定のデータに基づいて特定す
る第1の分野特定手段、前記第1の文献データの単語に
対応し、同一の意味内容を有する単語を前記第1の文献
データを他の言語に翻訳した第2の文献データの中から
抽出する単語抽出手段、前記単語抽出手段により抽出さ
れた単語に基づいて前記第1の分野特定手段により特定
された分野の辞書を作成する辞書作成手段、一の言語で
作成された翻訳対象文書の分野を、前記翻訳対象文書の
データから抽出された所定のデータに基づいて特定する
第2の分野特定手段、前記第2の分野特定手段により特
定された分野に基づいて、前記翻訳対象文書を翻訳する
ために使用する辞書を前記所定分野毎の辞書の中から選
択する辞書選択手段、前記辞書選択手段により選択され
た辞書を用いて前記翻訳対象文書を翻訳する翻訳手段、
前記翻訳手段により他の言語に翻訳された文書を出力す
る出力手段として機能させることを特徴とする。
【0037】また、請求項23記載の自動翻訳プログラ
ムは、前記第1の分野特定手段及び前記第2の分野特定
手段を、前記第1の文献又は前記翻訳対象文書が特許文
献である場合に、前記第1の文献又は前記翻訳対象文書
のデータから抽出された特許分類を示すデータに基づい
て、前記第1の文献又は前記翻訳対象文書の分野を特定
するように機能させることを特徴とする。
【0038】この請求項22及び請求項23記載の自動
翻訳プログラムによれば、精度の高い所定分野の辞書を
作成し、この所定分野の辞書を用いて翻訳対象文書を翻
訳することができるようにコンピュータを機能させるこ
とができる。
【0039】また、請求項24記載の自動翻訳プログラ
ムを記録したコンピュータ読み取り可能な記録媒体は、
一の言語で作成された文書を他の言語に翻訳する際に用
いる所定分野毎の辞書を作成するためにコンピュータ
を、一の言語で作成された第1の文献の分野を、前記第
1の文献のデータから抽出された所定のデータに基づい
て特定する分野特定手段、前記第1の文献データの単語
に対応し、同一の意味内容を有する単語を前記第1の文
献データを他の言語に翻訳した第2の文献データの中か
ら抽出する単語抽出手段、前記単語抽出手段により抽出
された単語に基づいて前記分野特定手段により特定され
た分野の辞書を作成する辞書作成手段として機能させる
ための辞書作成プログラムを記録している。
【0040】この請求項24記載の辞書作成プログラム
を記録したコンピュータ読み取り可能な記録媒体によれ
ば、この記録媒体に記録されている辞書作成プログラム
をコンピュータに読み込むことにより精度の高い所定分
野毎の辞書を作成することができるようにコンピュータ
を機能させることができる。
【0041】また、請求項25記載の自動翻訳プログラ
ムを記録したコンピュータ読み取り可能な記録媒体は、
所定分野毎の辞書を用いて一の言語で作成された文書を
他の言語に翻訳するためにコンピュータを、一の言語で
作成された第1の文献の分野を、前記第1の文献のデー
タから抽出された所定のデータに基づいて特定する第1
の分野特定手段、前記第1の文献データの単語に対応
し、同一の意味内容を有する単語を前記第1の文献デー
タを他の言語に翻訳した第2の文献データの中から抽出
する単語抽出手段、前記単語抽出手段により抽出された
単語に基づいて前記第1の分野特定手段により特定され
た分野の辞書を作成する辞書作成手段、一の言語で作成
された翻訳対象文書の分野を、前記翻訳対象文書のデー
タから抽出された所定のデータに基づいて特定する第2
の分野特定手段、前記第2の分野特定手段により特定さ
れた分野に基づいて、前記翻訳対象文書を翻訳するため
に使用する辞書を前記所定分野毎の辞書の中から選択す
る辞書選択手段、前記辞書選択手段により選択された辞
書を用いて前記翻訳対象文書を翻訳する翻訳手段、前記
翻訳手段により他の言語に翻訳された文書を出力する出
力手段として機能させるための自動翻訳プログラムを記
録している。
【0042】また、請求項26記載の自動翻訳プログラ
ムを記録したコンピュータ読み取り可能な記録媒体は、
前記第1の分野特定手段及び前記第2の分野特定手段
を、前記第1の文献又は前記翻訳対象文書が特許文献で
ある場合に、前記第1の文献又は前記翻訳対象文書のデ
ータから抽出された特許分類を示すデータに基づいて、
前記第1の文献又は前記翻訳対象文書の分野を特定する
ように機能させることを特徴とする。
【0043】この請求項25及び請求項26記載の自動
翻訳プログラムを記録したコンピュータ読み取り可能な
記録媒体によれば、この記録媒体に記録された自動翻訳
プログラムをコンピュータに読み込ませることにより、
精度の高い所定分野の辞書を作成し、この所定分野の辞
書を用いて翻訳対象文書を翻訳することができるように
コンピュータを機能させることができる。
【0044】また、請求項27記載の翻訳文の製造方法
は、一の言語で作成された翻訳対象文書の分野を、前記
翻訳対象文書のデータから抽出された所定のデータに基
づいて特定する分野特定ステップと、前記分野特定ステ
ップにより特定された分野に基づいて、前記翻訳対象文
書を翻訳するために使用する辞書を、一の言語で作成さ
れた文献であって、所定分野に分類することができる第
1の文献及びこの第1の文献を他の言語に翻訳した第2
の文献を用いて作成した所定分野毎の辞書の中から選択
する辞書選択ステップと、前記辞書選択ステップにより
選択された辞書を用いて前記翻訳対象文書を翻訳する翻
訳ステップとを含むことを特徴とする。
【0045】また、請求項28記載の翻訳文の製造方法
は、一の言語で作成された第1の文献の分野を、前記第
1の文献のデータから抽出された所定のデータに基づい
て特定する第1の分野特定ステップと、前記第1の文献
データの単語に対応し、同一の意味内容を有する単語を
前記第1の文献データを他の言語に翻訳した第2の文献
データの中から抽出する単語抽出ステップと、前記単語
抽出ステップにおいて抽出された単語に基づいて前記第
1の分野特定ステップにより特定された分野の辞書を作
成する辞書作成ステップと、一の言語で作成された翻訳
対象文書の分野を、前記翻訳対象文書のデータから抽出
された所定のデータに基づいて特定する第2の分野特定
ステップと、前記第2の分野特定ステップにおいて特定
された分野に基づいて、前記翻訳対象文書を翻訳するた
めに使用する辞書を前記所定分野毎の辞書の中から選択
する辞書選択ステップと、前記辞書選択ステップにおい
て選択された辞書を用いて前記翻訳対象文書を翻訳する
翻訳ステップとを含むことを特徴とする。
【0046】この請求項27及び請求項28記載の翻訳
文の製造方法によれば、同一の文献について一の言語で
作成された第1の文献データと第1の文献を他の言語に
翻訳した第2の文献データを用いて所定の分野の辞書を
作成している。そして、この所定の分野の辞書を用いて
翻訳対象文書の翻訳を行っているため、精度の高い翻訳
文を製造することができる。
【0047】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態にかかる自動翻訳装置について説明する。
なお、以下においては、分野別辞書を作成するために用
いる文献データとして特許文献データを用い、一の言語
を英語とし、他の言語を日本語として、英語で作成され
た特許文献である翻訳対象文書を日本語に翻訳する場合
を例として説明する。
【0048】図1は、この発明の実施の形態にかかる自
動翻訳装置のブロック構成図である。図1に示すよう
に、自動翻訳装置は、分野毎の辞書を作成する辞書作成
部(辞書作成装置)2を備えており、この辞書作成部2
には、辞書作成に用いる英語で作成された特許文献が記
憶されている第1文献データ記憶部4a、英語で作成さ
れた特許文献に対応する日本語の特許文献を記憶してい
る第2文献データ記憶部4b、一の言語で作成された文
書を他の言語へ翻訳する翻訳処理部6が接続されてい
る。
【0049】なお、第1文献データ記憶部4aに記憶さ
れている第1の文献である特許文献は、例えば、国際特
許出願が行われ、英語により国際公開がされた文献(国
際公開公報)である。また、第2文献データ記憶部4b
に記憶されている特許文献は、第1の文献を日本語に翻
訳した第2の文献、即ち、日本国において国内公表され
た特許文献(公表公報)である。また、これらの文献デ
ータは、日本国特許庁等において公開されている情報か
ら、インターネット等のネットワークを経由してダウン
ロードすることができる。
【0050】辞書作成部2は、辞書作成処理部20を備
えており、この辞書作成処理部20には、第1文献デー
タ記憶部4a及び第2文献データ記憶部4bから文献デ
ータを取り込む文献データ取込部22、作成した辞書を
修正する辞書修正部24及び分野毎に作成した辞書を記
憶している分野別辞書データ記憶部26a、26b、2
6c…が接続されている。
【0051】また、翻訳処理部6には、翻訳対象文書を
入力する文書入力部8、翻訳対象文書を翻訳する際に使
用する基本辞書が記憶されている基本辞書データ記憶部
10、翻訳対象文書を翻訳する際に使用すると共に、翻
訳文の内容が修正された場合に修正内容を蓄積すること
により作成されるユーザ辞書が記憶されているユーザ辞
書データ記憶部12、翻訳文を修正する翻訳修正部14
及び翻訳された文書を出力する出力部16がそれぞれ接
続されている。
【0052】次に、図2のフローチャートを参照して、
この自動翻訳装置の辞書作成部2により行われる分野別
辞書作成処理について説明する。まず、図2に示すよう
に、分野別辞書を作成するために文献データを取込む
(ステップS10)。即ち、文献データ取込部22を介
して第1文献データ記憶部4aに記憶されている国際公
開公報、及び第2文献データ記憶部4bに記憶されてい
る公表公報のそれぞれの文献データを辞書作成処理部2
0に取込む。
【0053】次に、取込んだ第1の文献データの分野を
特定する(ステップS11)。即ち、辞書作成処理部2
0において、ステップS10において取込んだ第1の文
献データから、国際特許分類を示すデータを抽出し、抽
出したデータが国際特許分類の何れの分野に分類される
ものであるかを特定することにより第1文献データの分
野を特定する。具体的には、第1の文献データから抽出
した国際特許分類が「G」の分類である場合には、第1
文献データの分野は国際特許分類におけるGセクション
の分野、即ち、物理学の分野に分類される文献であると
特定する。
【0054】ここで、第1文献に複数の国際特許分類が
付与されている場合には、この第1文献データは複数の
分野に関する文献として特定する。なお、第1の文献が
特許文献以外の文献であり、国際特許分類を示すデータ
を抽出することができない場合には、その文献の分野を
文献データから抽出したキーワードに基づくキーワード
検索又は概念検索により分野を特定するようにしてもよ
い。
【0055】ここで、概念検索とは、文献データから所
定のデータ、例えば文献タイトルのデータを任意に抽出
し、抽出したデータを単語データに分解して文書ベクト
ルとして表することにより文献の分野を特定する手法で
ある。この文書ベクトルとは、約300次元のベクトル
空間内で定義されるベクトルであり、その向きが単語の
意味を表している。そして、個々の文書ベクトルの内積
に基づいて最も適切な分野を特定する。なお、文書ベク
トルは単語の意味のみでなく、文章の意味を表すことも
できるため、第1の文献から抽出した複数の文章デー
タ、例えば要約等を用いて文献の分野を特定することも
可能である。
【0056】次に、第1の文献データ中の単語に対応す
る第2の文献データ中の単語を抽出し(ステップS1
2)、抽出した単語を記憶する(ステップS13)。即
ち、第1の文献データの単語に対応し、同一の意味内容
を有する第2の文献データの単語を特定し、特定した単
語を抽出する。そして、第1の文献データの単語と、第
2の文献データから抽出された単語をステップS11に
おいて特定した分野に該当する辞書データ記憶部26
a、26b、26c…に、それらをセットとして記憶す
る。なお、ステップS11において第1文献データの分
野が特定された際に、抽出した単語を記憶するための、
該当する分野の辞書データ記憶部が、辞書データ記憶部
26a、26b、26c…から選択される。
【0057】また、第1の文献データの単語に対応し、
同一の意味内容を有する第2の文献データの単語が複数
存在する場合には、第2の文献データから該当する全て
の単語を抽出し、それらをセットとして該当する辞書デ
ータ記憶部26a、26b、26c…に記憶する。ま
た、ステップS11において、第1の文献の分野が複数
特定されている場合、即ち、複数の国際特許分類が付与
されている場合には、特定された分野に該当する辞書デ
ータ記憶部26a、26b、26c…のそれぞれに単語
のセットを記憶する。
【0058】次に、単語の修正を行う必要があるか否か
を判断する(ステップS14)。即ち、辞書修正部24
に設けられた図示しない表示部に表示された第1の文献
データに含まれていた単語と、この単語に対応し、同一
の意味内容を有する第2の文献データから抽出された単
語のセットが適切か否かを辞書作成者(該当する技術分
野について専門的知識を有する者)が確認し、修正を行
う必要があるか否かについて判断する。
【0059】通常、特許文献については、該当する技術
分野の知識を有する者が、第1の文献及び第2の文献を
チェックしている場合が多く、英語の単語と日本語の単
語の対応の誤りや、英語の単語に対応する日本語の単語
が統一して使用されていない場合は少ない。そのため、
一の言語で作成されている第1の文献と第1の文献を他
の言語に翻訳した第2の文献が存在する特許文献を用い
ることによって精度の高い辞書を作成することが可能に
なる。しかし、特許文献においても、極稀に不適切な翻
訳が成されている場合や英語の単語に対応する日本語の
単語が統一的に用いられていない場合もある。また、分
野によっては新規な単語が作り出されており、対応する
日本語が従来とは異なるものとなっている場合も考えら
れる。そのため、英語の単語に対応する日本語の単語が
適切であるか否かを念のため判断する必要がある。
【0060】単語の修正を行う必要がある場合には(ス
テップS14)、単語の修正を行い(ステップS1
5)、修正後の単語を記憶する(ステップS13)。即
ち、辞書修正部24の図示しない表示部に表示された単
語のセットを辞書作成者が確認し、辞書修正部24の図
示しない入力部において適切な日本語の単語を入力する
こと等により必要な修正を行う。必要な修正を行った
後、ステップS13に戻り修正した単語を該当する分野
の辞書データ記憶部26a、26b、26c…に記憶す
る。一方、修正を行う必要がないと判断した場合には
(ステップS14)、ステップS10に戻り、必要があ
る場合には更に別の文献データを取込み、辞書の作成処
理を継続する。
【0061】なお、上述の辞書翻訳装置は、辞書作成プ
ログラムをコンピュータに組み込むことによって、上述
の辞書作成処理を行うことができるようにコンピュータ
を機能させることができる。更に、複数のコンピュータ
がネットワークを介して相互に接続されている場合に
は、他のコンピュータがネットワークを介して辞書作成
プログラムが組み込まれた何れかのコンピュータに接続
されることにより、当該コンピュータにおいて辞書作成
処理を行うようにすることもできる。
【0062】また、前記の辞書作成プログラムは、上述
の辞書作成処理を行うことができるようにコンピュータ
を機能させることができる辞書作成プログラムを記録し
たコンピュータ読み取り可能な記録媒体により、コンピ
ュータに読み取らせることができる。なお、前記辞書作
成プログラムを記録したコンピュータ読み取り可能な記
録媒体は、前記辞書作成プログラムをフレキシブルディ
スク(FD)、CD−ROM、DVD等の記録媒体に記
録したものである。
【0063】次に、図3のフローチャートを参照して、
この自動翻訳装置の翻訳処理部6により行われる翻訳処
理について説明する。まず、翻訳対象文書を文書入力部
8において入力する(ステップS20)。即ち、翻訳対
象文書として英語で作成された国際公開公報のデータを
入力する。なお、文書入力部8は、キーボード、FDド
ライブ、CD−ROMドライブ、DVDドライブ、ネッ
トワーク接続手段等により構成されている。
【0064】次に、入力された翻訳対象文書の分野を特
定する(ステップS21)。即ち、翻訳処理部6におい
て、文書入力部8を介して入力された翻訳対象文書のデ
ータから国際特許分類を示すデータを抽出し、抽出した
データが国際特許分類の何れの分野に分類されるもので
あるかを特定することにより翻訳対象文書の分野を特定
する。なお、翻訳対象文書が特許文献以外の文書である
場合には、キーワード検索又は前述の概念検索を行うこ
とにより翻訳対象文書の分野を特定する。
【0065】次に、使用する分野別辞書を選択する(ス
テップS22)。即ち、ステップS21において特定し
た翻訳対象文書の分野に対応する分野の辞書データが記
憶されている辞書データ記憶部を、辞書データ記憶部2
6a、26b、26c…の中から選択する。
【0066】ここで、翻訳対象文書の分野が複数特定さ
れている場合には、翻訳文作成者(該当する技術分野に
ついて専門的知識を有する者)が翻訳対象文書の分野に
合わせて翻訳の際に使用する分野別辞書の優先順位を指
定することができる。また、国際特許分類が付与されて
いる順番に従って翻訳の際に使用する分野別辞書の優先
順位を指定するようにしてもよい。
【0067】次に、翻訳処理部6において基本辞書デー
タ記憶部10に記憶されている一般的な辞書である基本
辞書、ユーザ辞書が作成されている場合には、ユーザ辞
書データ記憶部12に記憶されているユーザ辞書及び該
当する分野の分野別辞書データ記憶部26a、26b、
26c…に記憶されている分野別辞書を用いて翻訳対象
文書の翻訳文を作成する(ステップS23)。なお、ユ
ーザ辞書が作成されている場合には、ユーザ辞書を最優
先に適用して翻訳文の作成を行う。
【0068】次に、翻訳文の修正を行う必要があるか否
かを判断する(ステップS24)。即ち、ステップS2
3において作成された翻訳文を出力部16において表示
(出力)し、表示された内容について不適切な表現や不
明瞭な翻訳がある等、翻訳文の修正を行う必要があるか
否かを翻訳文作成者(該当する技術分野について専門的
知識を有する者)が確認することにより判断する。
【0069】翻訳文の修正を行う必要がある場合には
(ステップS24)、翻訳修正部14の図示しない表示
部に表示された翻訳内容を、翻訳修正部14の図示しな
い入力部において翻訳文作成者が適切な翻訳文を入力す
ることにより必要な修正を行い(ステップS25)、修
正した内容をユーザ辞書データ記憶部12に記憶する
(ステップS26)。このように、修正内容をユーザ辞
書データ記憶部12に記憶することにより、修正内容を
蓄積してユーザ辞書の作成(更新)を行う。一方、翻訳
文の修正を行う必要がないと判断した場合には(ステッ
プS24)、そのままステップS27へ進む。
【0070】次に、作成した翻訳文を出力部16におい
て出力する(ステップS27)。なお、この出力部16
は、LCD、プリンタ、FDドライブ及びネットワーク
接続手段等により構成されている。
【0071】なお、上述の自動翻訳装置は、自動翻訳プ
ログラムをコンピュータに組み込むことによって、上述
の自動翻訳処理を行うことができるようにコンピュータ
を機能させることができる。更に、複数のコンピュータ
がネットワークを介して相互に接続されている場合に
は、他のコンピュータがネットワークを介して自動翻訳
プログラムが組み込まれた何れかのコンピュータに接続
されることにより、当該コンピュータにおいて自動翻訳
処理を行うようにすることもできる。
【0072】また、前記の自動翻訳プログラムは、上述
の翻訳処理を行うことができるようにコンピュータを機
能させることができる自動翻訳プログラムを記録したコ
ンピュータ読み取り可能な記録媒体により、コンピュー
タに読み取らせることができる。なお、前記自動翻訳プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体は、前記自動翻訳プログラムをフレキシブルディスク
(FD)、CD−ROM、DVD等の記録媒体に記録し
たものである。
【0073】この実施の形態によれば、所定の分野に分
類することができる一の言語で作成された第1の文献の
分野を、抽出された国際特許分類を示すデータに基づい
て特定すると共に、第1の文献データの単語に対応し、
同一の意味内容を有する単語を第2の文献データから抽
出することによって分野別辞書の作成を行っている。従
って、特定分野における最新の技術用語等を収録した精
度の高い分野別辞書を作成することができる。
【0074】また、翻訳対象文書の分野を国際特許分類
に基づいて特定し、特定された分野に対応する分野別辞
書及びユーザ辞書を用いて翻訳文の作成を行っている。
従って、翻訳対象文書の分野を的確に把握し、翻訳対象
文書の分野に対して適切な分野別辞書を選択し、分野に
より異なる単語の意味を的確に反映した翻訳を行うこと
ができると共に、ユーザ辞書を用いることにより、より
一層精度の高い翻訳文の作成を行うことができる。
【0075】また、分野別辞書を作成するための文献と
翻訳対象文書の双方の分野を特許分類に基づいて特定し
ているため、同一の基準に基づいて分野を特定すること
ができる。従って、翻訳対象文書の分野に的確に対応し
た精度の高い分野別辞書を選択し、精度の高い翻訳文の
作成を行うことができる。
【0076】なお、この発明の実施の形態においては、
分野別辞書の作成を特許文献に基づいて新規に作成して
いるが、既に分野別辞書が作成されている場合には、分
野別辞書の更新を行うようにしてもよい。また、定期的
に分野別辞書の更新を行う等により、常に最新の技術用
語を収録した精度の高い分野別辞書を用意することがで
きる。
【0077】また、分野別辞書の作成に用いる文献とし
ては、特許文献の他、例えば、技術論文や小説等の文献
であっても、同一の文献について一の言語と、この一の
言語で作成された文献を他の言語に翻訳した文献があれ
ば、そのような文献を用いて分野別辞書を作成すること
ができる。
【0078】また、翻訳文の修正を行った場合、修正内
容をユーザ辞書データ記憶部12に記憶し、ユーザ辞書
を作成しているが、この修正内容に基づいて翻訳の際に
使用した分野別辞書の内容を修正するようにしてもよ
い。
【0079】また、コンピュータに複数の自動翻訳プロ
グラムが組み込まれている場合には、翻訳文作成者が翻
訳対象文書の翻訳処理を行う自動翻訳プログラムを選択
することができるようにしてもよい。
【0080】また、上述の実施の形態においては、一の
言語を英語とし、他の言語を日本語として辞書の作成を
行う場合を例としているが、一の言語で作成された第1
の文献を他の言語に翻訳した第2の文献が、複数の言語
について存在する場合には、複数の言語についてそれぞ
れ分野別辞書を作成することができる。
【0081】また、複数の言語についての分野別辞書が
存在する場合には、一の言語で作成された翻訳対象文書
を他の言語に翻訳する際に、何れの言語に翻訳するかを
選択することができるようにしてもよい。更に、翻訳対
象文書を翻訳する言語を複数選択することができるよう
にしてもよい。
【0082】また、一の言語の単語が同一の表記である
が、他の言語においては当該単語が分野によって異なる
意味を有する場合に、既に作成された所定の分野別の辞
書(例えば、電気分野の辞書)を用いて翻訳文を作成し、
この翻訳文を異なる分野の分野別辞書(例えば、物理分
野の辞書)を用いて再度、翻訳文を作成するようにして
もよい。
【0083】
【発明の効果】この発明によれば、同一の文献について
作成された一の言語の文献と、他の言語の文献を用いて
特定された分野について分野別辞書の作成を行っている
ことから、分野毎に精度の高い辞書を作成することがで
きる。
【0084】また、同一の文献について一の言語で作成
された第1の文献データと第1の文献を他の言語に翻訳
した第2の文献データを用いて作成された所定分野の辞
書を用いて翻訳対象文書の翻訳を行っているため、精度
の高い翻訳を行うことができる。更に、所定分野毎の辞
書を作成するための一の言語で作成された文献の分野と
翻訳対象文書の分野を同一の手法により特定しているた
め、翻訳の際に使用する辞書を的確に選択して精度の高
い辞書を用いて翻訳を行うことができると共に、過去の
翻訳修正内容履歴に基づいて作成されたユーザ辞書を用
いて、より精度の高い翻訳を行うことができる。
【0085】また、同一の文献について一の言語で作成
された第1の文献データと第1の文献のデータを他の言
語に翻訳した第2の文献データを用いて作成された所定
分野の辞書を用いて翻訳対象文書の翻訳を行っているた
め、精度の高い翻訳文を製造することができる。
【図面の簡単な説明】
【図1】この発明の実施の形態にかかる自動翻訳装置の
ブロック構成図である。
【図2】この発明の実施の形態にかかる所定分野別の辞
書を作成する処理を説明するためのフローチャートであ
る。
【図3】この発明の実施の形態にかかる一の言語で作成
された文書を他の言語に翻訳する処理を説明するための
フローチャートである。
【符号の説明】
2…辞書作成部、4a…第1文献データ記憶部、4b…
第2文献データ記憶部、6…翻訳処理部、8…文書入力
部、10…基本辞書データ記憶部、12…ユーザ辞書デ
ータ記憶部、14…翻訳修正部、16…出力部、20…
辞書作成処理部、22…文献データ取込部、24…辞書
修正部、26a、26b、26c…辞書データ記憶部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 廣本 英久 東京都千代田区大手町二丁目2番1号 株 式会社野村総合研究所内 (72)発明者 竹内 徹 東京都千代田区大手町二丁目2番1号 株 式会社野村総合研究所内 (72)発明者 星乃 隆治 東京都千代田区大手町二丁目2番1号 株 式会社野村総合研究所内 Fターム(参考) 5B091 CC16 (54)【発明の名称】 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プ ログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プロ グラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法

Claims (28)

    【特許請求の範囲】
  1. 【請求項1】 一の言語で作成された文献であって、所
    定分野に分類することができる第1の文献データが記憶
    されている第1文献データ記憶手段と、 前記第1の文献データを他の言語に翻訳した第2の文献
    データが記憶されている第2文献データ記憶手段と、 前記第1の文献の分野を、前記第1の文献データから抽
    出された所定のデータに基づいて特定する分野特定手段
    と、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第2の文献データの中から抽出する
    単語抽出手段と、 前記単語抽出手段により抽出された単語に基づいて前記
    分野特定手段により特定された分野の辞書を作成する辞
    書作成手段とを備えることを特徴とする辞書作成装置。
  2. 【請求項2】 前記単語抽出手段により抽出された前記
    第1の文献データの単語に対応する前記第2の文献デー
    タの単語が適切でない場合に、前記単語を適切な単語に
    修正する辞書修正手段を更に備えることを特徴とする請
    求項1記載の辞書作成装置。
  3. 【請求項3】 前記分野特定手段は、前記第1の文献が
    特許文献である場合には、前記第1の文献データから抽
    出された特許分類を示すデータに基づいて、前記第1の
    文献の分野を特定することを特徴とする請求項1記載の
    辞書作成装置。
  4. 【請求項4】 一の言語で作成された翻訳対象文書の分
    野を、前記翻訳対象文書のデータから抽出された所定の
    データに基づいて特定する分野特定手段と、 前記分野特定手段により特定された分野に基づいて、前
    記翻訳対象文書を翻訳するために使用する辞書を、一の
    言語で作成された文献であって、所定分野に分類するこ
    とができる第1の文献及びこの第1の文献を他の言語に
    翻訳した第2の文献を用いて作成された所定分野毎の辞
    書の中から選択する辞書選択手段と、 前記辞書選択手段により選択された辞書を用いて前記翻
    訳対象文書を翻訳する翻訳手段と、 前記翻訳手段により他の言語に翻訳された文書を出力す
    る出力手段とを備えることを特徴とする自動翻訳装置。
  5. 【請求項5】 前記翻訳手段により、前記一の言語で作
    成された翻訳対象文書を前記他の言語に翻訳した場合
    に、翻訳内容の修正を行う翻訳修正手段を更に備えるこ
    とを特徴とする請求項4記載の自動翻訳装置。
  6. 【請求項6】 前記翻訳修正手段により修正された内容
    を記憶する修正内容記憶手段と、 前記修正内容記憶手段により記憶された修正内容に基づ
    いて、前記翻訳手段において優先的に用いられるユーザ
    辞書を作成するユーザ辞書作成手段とを更に備えること
    を特徴とする請求項5記載の自動翻訳装置。
  7. 【請求項7】 前記辞書選択手段は、前記分野特定手段
    により特定された前記翻訳対象文書の分野が複数ある場
    合に、対応する分野の辞書を複数選択することを特徴と
    する請求項4〜請求項6の何れか一項に記載の自動翻訳
    装置。
  8. 【請求項8】 前記辞書選択手段により複数の辞書が選
    択された場合に、前記選択された複数の辞書のうち、何
    れの辞書を優先的に使用するかの優先順位を指定する優
    先順位指定手段を更に備えることを特徴とする請求項7
    記載の自動翻訳装置。
  9. 【請求項9】 前記分野特定手段は、前記翻訳対象文書
    が特許文献である場合には、前記翻訳対象文書のデータ
    から抽出された特許分類を示すデータに基づいて、前記
    翻訳対象文書の分野を特定することを特徴とする請求項
    4〜請求項8の何れか一項に記載の自動翻訳装置。
  10. 【請求項10】 一の言語で作成された文献であって、
    所定分野に分類することができる第1の文献データが記
    憶されている第1文献データ記憶手段と、 前記第1の文献データを他の言語に翻訳した第2の文献
    データが記憶されている第2文献データ記憶手段と、 前記第1の文献の分野を、前記第1の文献データから抽
    出された所定のデータに基づいて特定する第1の分野特
    定手段と、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第2の文献データの中から抽出する
    単語抽出手段と、 前記単語抽出手段により抽出された単語に基づいて前記
    第1の分野特定手段により特定された分野の辞書を作成
    する辞書作成手段と、 一の言語で作成された翻訳対象文書の分野を、前記翻訳
    対象文書のデータから抽出された所定のデータに基づい
    て特定する第2の分野特定手段と、 前記第2の分野特定手段により特定された分野に基づい
    て、前記翻訳対象文書を翻訳するために使用する辞書を
    前記辞書作成装置により作成された所定分野毎の辞書の
    中から選択する辞書選択手段と、 前記辞書選択手段により選択された辞書を用いて前記翻
    訳対象文書を翻訳する翻訳手段と、 前記翻訳手段により他の言語に翻訳された文書を出力す
    る出力手段とを備えることを特徴とする自動翻訳装置。
  11. 【請求項11】 前記単語抽出手段により抽出された前
    記第1の文献データの単語に対応する前記第2の文献デ
    ータの単語が適切でない場合に、前記単語を適切な単語
    に修正する辞書修正手段を更に備えることを特徴とする
    請求項10記載の自動翻訳装置。
  12. 【請求項12】 前記一の言語で作成された翻訳対象文
    書を、前記翻訳手段により他の言語へ翻訳した場合に、
    翻訳内容の修正をする翻訳修正手段を更に備えることを
    特徴とする請求項10記載の自動翻訳装置。
  13. 【請求項13】 前記翻訳修正手段により修正された内
    容を記憶する修正記憶手段と、 前記修正記憶手段により記憶された修正内容に基づい
    て、前記翻訳手段において優先的に用いられるユーザ辞
    書を作成するユーザ辞書作成手段とを更に備えることを
    特徴とする請求項10記載の自動翻訳装置。
  14. 【請求項14】 前記辞書選択手段は、前記分野特定手
    段により特定された前記翻訳対象文書の分野が複数の場
    合に、対応する分野の辞書を複数選択することを特徴と
    する請求項10〜請求項13の何れか一項に記載の自動
    翻訳装置。
  15. 【請求項15】 前記辞書選択手段により複数の辞書が
    選択された場合に、前記選択された複数の辞書のうち、
    何れの辞書を優先的に使用するかの優先順位を指定する
    優先順位指定手段を更に備えることを特徴とする請求項
    14記載の自動翻訳装置。
  16. 【請求項16】 前記第1の分野特定手段及び前記第2
    の分野特定手段は、前記第1の文献又は前記翻訳対象文
    書が特許文献である場合に、前記第1の文献データ又は
    前記翻訳対象文書のデータから抽出された特許分類を示
    すデータに基づいて、前記第1の文献又は前記翻訳対象
    文書の分野を特定することを特徴とする請求項10〜請
    求項15の何れか一項に記載の自動翻訳装置。
  17. 【請求項17】 一の言語で作成された第1の文献の分
    野を、前記第1の文献のデータから抽出された所定のデ
    ータに基づいて特定する分野特定ステップと、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出ステッ
    プと、 前記単語抽出ステップにおいて抽出された単語に基づい
    て前記分野特定ステップにより特定された分野の辞書を
    作成する辞書作成ステップとを含むことを特徴とする辞
    書作成方法。
  18. 【請求項18】 前記分野特定ステップは、前記第1の
    文献が特許文献である場合には、前記第1の文献データ
    から抽出された特許分類を示すデータに基づいて、前記
    第1の文献の分野を特定することを特徴とする請求項1
    7記載の辞書作成方法。
  19. 【請求項19】 一の言語で作成された第1の文献の分
    野を、前記第1の文献のデータから抽出された所定のデ
    ータに基づいて特定する第1の分野特定ステップと、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出ステッ
    プと、 前記単語抽出ステップにおいて抽出された単語に基づい
    て前記第1の分野特定ステップにより特定された分野の
    辞書を作成する辞書作成ステップと、 一の言語で作成された翻訳対象文書の分野を、前記翻訳
    対象文書のデータから抽出された所定のデータに基づい
    て特定する第2の分野特定ステップと、 前記第2の分野特定ステップにおいて特定された分野に
    基づいて、前記翻訳対象文書を翻訳するために使用する
    辞書を前記所定分野毎の辞書の中から選択する辞書選択
    ステップと、 前記辞書選択ステップにおいて選択された辞書を用いて
    前記翻訳対象文書を翻訳する翻訳ステップとを含むこと
    を特徴とする自動翻訳方法。
  20. 【請求項20】 前記第1の分野特定ステップ及び前記
    第2の分野特定ステップは、前記第1の文献又は前記翻
    訳対象文書が特許文献である場合に、前記第1の文献又
    は前記翻訳対象文書のデータから抽出された特許分類を
    示すデータに基づいて、前記第1の文献又は前記翻訳対
    象文書の分野を特定することを特徴とする請求項19記
    載の自動翻訳方法。
  21. 【請求項21】 一の言語で作成された文書を他の言語
    に翻訳する際に用いる所定分野毎の辞書を作成するため
    にコンピュータを、 一の言語で作成された第1の文献の分野を、前記第1の
    文献のデータから抽出された所定のデータに基づいて特
    定する分野特定手段、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出手段、 前記単語抽出手段により抽出された単語に基づいて前記
    分野特定手段により特定された分野の辞書を作成する辞
    書作成手段として機能させるための辞書作成プログラ
    ム。
  22. 【請求項22】 所定分野毎の辞書を用いて一の言語で
    作成された文書を他の言語に翻訳するためにコンピュー
    タを、 一の言語で作成された第1の文献の分野を、前記第1の
    文献のデータから抽出された所定のデータに基づいて特
    定する第1の分野特定手段、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出手段、 前記単語抽出手段により抽出された単語に基づいて前記
    第1の分野特定手段により特定された分野の辞書を作成
    する辞書作成手段、 一の言語で作成された翻訳対象文書の分野を、前記翻訳
    対象文書のデータから抽出された所定のデータに基づい
    て特定する第2の分野特定手段、 前記第2の分野特定手段により特定された分野に基づい
    て、前記翻訳対象文書を翻訳するために使用する辞書を
    前記所定分野毎の辞書の中から選択する辞書選択手段、 前記辞書選択手段により選択された辞書を用いて前記翻
    訳対象文書を翻訳する翻訳手段、 前記翻訳手段により他の言語に翻訳された文書を出力す
    る出力手段として機能させるための自動翻訳プログラ
    ム。
  23. 【請求項23】 前記第1の分野特定手段及び前記第2
    の分野特定手段を、前記第1の文献又は前記翻訳対象文
    書が特許文献である場合に、前記第1の文献又は前記翻
    訳対象文書のデータから抽出された特許分類を示すデー
    タに基づいて、前記第1の文献又は前記翻訳対象文書の
    分野を特定するように機能させる請求項22記載の自動
    翻訳プログラム。
  24. 【請求項24】 一の言語で作成された文書を他の言語
    に翻訳する際に用いる所定分野毎の辞書を作成するため
    にコンピュータを、 一の言語で作成された第1の文献の分野を、前記第1の
    文献のデータから抽出された所定のデータに基づいて特
    定する分野特定手段、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出手段、 前記単語抽出手段により抽出された単語に基づいて前記
    分野特定手段により特定された分野の辞書を作成する辞
    書作成手段として機能させるための辞書作成プログラム
    を記録したコンピュータ読み取り可能な記録媒体。
  25. 【請求項25】 所定分野毎の辞書を用いて一の言語で
    作成された文書を他の言語に翻訳するためにコンピュー
    タを、 一の言語で作成された第1の文献の分野を、前記第1の
    文献のデータから抽出された所定のデータに基づいて特
    定する第1の分野特定手段、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出手段、 前記単語抽出手段により抽出された単語に基づいて前記
    第1の分野特定手段により特定された分野の辞書を作成
    する辞書作成手段、 一の言語で作成された翻訳対象文書の分野を、前記翻訳
    対象文書のデータから抽出された所定のデータに基づい
    て特定する第2の分野特定手段、 前記第2の分野特定手段により特定された分野に基づい
    て、前記翻訳対象文書を翻訳するために使用する辞書を
    前記所定分野毎の辞書の中から選択する辞書選択手段、 前記辞書選択手段により選択された辞書を用いて前記翻
    訳対象文書を翻訳する翻訳手段、 前記翻訳手段により他の言語に翻訳された文書を出力す
    る出力手段として機能させるための自動翻訳プログラム
    を記録したコンピュータ読み取り可能な記録媒体。
  26. 【請求項26】 前記第1の分野特定手段及び前記第2
    の分野特定手段を、前記第1の文献又は前記翻訳対象文
    書が特許文献である場合に、前記第1の文献又は前記翻
    訳対象文書のデータから抽出された特許分類を示すデー
    タに基づいて、前記第1の文献又は前記翻訳対象文書の
    分野を特定するように機能させる請求項25記載の自動
    翻訳プログラムを記録したコンピュータ読み取り可能な
    記録媒体。
  27. 【請求項27】 一の言語で作成された翻訳対象文書の
    分野を、前記翻訳対象文書のデータから抽出された所定
    のデータに基づいて特定する分野特定ステップと、 前記分野特定ステップにより特定された分野に基づい
    て、前記翻訳対象文書を翻訳するために使用する辞書
    を、一の言語で作成された文献であって、所定分野に分
    類することができる第1の文献及びこの第1の文献を他
    の言語に翻訳した第2の文献を用いて作成した所定分野
    毎の辞書の中から選択する辞書選択ステップと、 前記辞書選択ステップにより選択された辞書を用いて前
    記翻訳対象文書を翻訳する翻訳ステップとを含むことを
    特徴とする翻訳文の製造方法。
  28. 【請求項28】 一の言語で作成された第1の文献の分
    野を、前記第1の文献のデータから抽出された所定のデ
    ータに基づいて特定する第1の分野特定ステップと、 前記第1の文献データの単語に対応し、同一の意味内容
    を有する単語を前記第1の文献データを他の言語に翻訳
    した第2の文献データの中から抽出する単語抽出ステッ
    プと、 前記単語抽出ステップにおいて抽出された単語に基づい
    て前記第1の分野特定ステップにより特定された分野の
    辞書を作成する辞書作成ステップと、 一の言語で作成された翻訳対象文書の分野を、前記翻訳
    対象文書のデータから抽出された所定のデータに基づい
    て特定する第2の分野特定ステップと、 前記第2の分野特定ステップにおいて特定された分野に
    基づいて、前記翻訳対象文書を翻訳するために使用する
    辞書を前記所定分野毎の辞書の中から選択する辞書選択
    ステップと、 前記辞書選択ステップにおいて選択された辞書を用いて
    前記翻訳対象文書を翻訳する翻訳ステップとを含むこと
    を特徴とする翻訳文の製造方法。
JP2001193923A 2001-06-27 2001-06-27 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法 Pending JP2003006190A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001193923A JP2003006190A (ja) 2001-06-27 2001-06-27 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001193923A JP2003006190A (ja) 2001-06-27 2001-06-27 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法

Publications (1)

Publication Number Publication Date
JP2003006190A true JP2003006190A (ja) 2003-01-10

Family

ID=19032120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001193923A Pending JP2003006190A (ja) 2001-06-27 2001-06-27 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法

Country Status (1)

Country Link
JP (1) JP2003006190A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140138648A (ko) * 2012-03-15 2014-12-04 셉트 시스템즈 게엠베하 텍스트의 의미 처리를 위한 방법, 장치 및 제품
JP2017182763A (ja) * 2016-03-29 2017-10-05 ネイバー コーポレーションNAVER Corporation イメージを用いた翻訳文提供方法、ユーザ端末、サーバ、システムおよびコンピュータプログラム
JP2018085109A (ja) * 2016-11-13 2018-05-31 石川サポート・アンド・サービス株式会社 機械翻訳システムおよび機械翻訳方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140138648A (ko) * 2012-03-15 2014-12-04 셉트 시스템즈 게엠베하 텍스트의 의미 처리를 위한 방법, 장치 및 제품
KR102055656B1 (ko) 2012-03-15 2020-01-22 코티칼.아이오 아게 텍스트의 의미 처리를 위한 방법, 장치 및 제품
JP2017182763A (ja) * 2016-03-29 2017-10-05 ネイバー コーポレーションNAVER Corporation イメージを用いた翻訳文提供方法、ユーザ端末、サーバ、システムおよびコンピュータプログラム
US10372829B2 (en) 2016-03-29 2019-08-06 Naver Corporation Method and computer readable recording medium for providing translation using image
JP2018085109A (ja) * 2016-11-13 2018-05-31 石川サポート・アンド・サービス株式会社 機械翻訳システムおよび機械翻訳方法
JP7011124B2 (ja) 2016-11-13 2022-01-26 石川サポート・アンド・サービス株式会社 機械翻訳システムおよび機械翻訳方法

Similar Documents

Publication Publication Date Title
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
US8775918B2 (en) System and method for automatic improvement of electronic presentations
US8185372B2 (en) Apparatus, method and computer program product for translating speech input using example
US9645979B2 (en) Device, method and program for generating accurate corpus data for presentation target for searching
US10089975B2 (en) Transliteration work support device, transliteration work support method, and computer program product
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
JP5430312B2 (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2007058706A (ja) 文書検索システム、文書検索方法及び文書検索プログラム
US8135573B2 (en) Apparatus, method, and computer program product for creating data for learning word translation
JP2010061176A (ja) テキストマイニング装置、テキストマイニング方法、および、テキストマイニングプログラム
JP5577546B2 (ja) 計算機システム
US20120150530A1 (en) Information processing device and display control method
CN115577694B (zh) 标准编写的智能推荐方法
JPWO2008018287A1 (ja) 検索装置及び検索データベース生成装置
JP2003006190A (ja) 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JP7074785B2 (ja) 曖昧箇所訂正支援装置及び方法
CN111143374B (zh) 一种数据辅助识别的方法、系统、计算设备及存储介质
JP2011065322A (ja) 文字認識システム及び文字認識プログラム、並びに音声認識システム及び音声認識プログラム
WO2007114182A1 (ja) データ入力装置、方法、及びプログラム
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
JP5172308B2 (ja) テキスト整形規則獲得装置、構造判定装置、それらのプログラム
WO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JP2000268033A (ja) 情報列に対してタグ情報を付与するための方法および装置ならびに同方法が記録される記録媒体
JP6323828B2 (ja) 支援装置、情報処理方法、及び、プログラム