JP3949874B2 - 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム - Google Patents

翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム Download PDF

Info

Publication number
JP3949874B2
JP3949874B2 JP2000163037A JP2000163037A JP3949874B2 JP 3949874 B2 JP3949874 B2 JP 3949874B2 JP 2000163037 A JP2000163037 A JP 2000163037A JP 2000163037 A JP2000163037 A JP 2000163037A JP 3949874 B2 JP3949874 B2 JP 3949874B2
Authority
JP
Japan
Prior art keywords
translation
language
word
document
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000163037A
Other languages
English (en)
Other versions
JP2001344236A (ja
Inventor
貴志 澁谷
直子 瀧川
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000163037A priority Critical patent/JP3949874B2/ja
Publication of JP2001344236A publication Critical patent/JP2001344236A/ja
Application granted granted Critical
Publication of JP3949874B2 publication Critical patent/JP3949874B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、第一言語の文書と第二言語の文書とを用いて第一言語の各単語の訳語を学習し、翻訳処理に反映させる翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システムに関する。
【0002】
【従来の技術】
一般に、翻訳システムでは、予め分野別の辞書を用意し、翻訳したい第一言語の文書の分野を特定し、その分野と同一分野の第二言語に関する辞書を用いて、第一言語の文書を翻訳することが行われている。
【0003】
しかしながら、一般的な辞書はともかく、より専門的な分野別辞書を用意することは価格的に非常に高価なものとなり、また科学・技術の進歩に伴ってめまぐるしく新しい単語が出てくることから、それに対応する辞書を順次用意していかなければならない問題がある。
【0004】
そこで、従来の翻訳システムでは、ある分野にあった訳語を学習し翻訳結果に反映させる場合、次のような幾つかの学習方法が用いられている。
【0005】
その1つは、原文を翻訳した後、原文の分野において正しい訳語と判定できる知識をもったユーザが、一文づつ、原文と訳文とを表示比較し、対話的に訳語を変更しながら適切と思われる1つの訳語を見つけ出し、その訳語を保存する方法である。
【0006】
他の1つは、ある特定の単語が原文中に現れたとき、その原文の分野を判断し、その分野にあった訳語を見つけ出し、その訳語を保存する方法である。
【0007】
【発明が解決しようとする課題】
ところで、以上のような2つの方法のうち、前者の訳語学習方法は、常に原文とその原文の分野に詳しい専門的知識をもつユーザでなければ訳語の学習が難しく、また対話的に訳語を変更しつつ適切な訳語を見つけ出す必要があることから、非常に根気と時間がかかる作業である。
【0008】
また、後者の訳語学習方法については、特定の単語に基づいて訳語を見つけ出しているので、ある特定の単語が原文中に現れる前後の文により、翻訳結果に反映させる訳語が突然変わったり、或いは同一文書内に異なる分野の特定の単語が複数現れたとき、統一性のない翻訳結果となる問題がある。
【0009】
本発明は上記事情に鑑みてなされたもので、第一言語の文書と第二言語の文書とを用いて、第一言語の文書の分野にあった訳語を自動的に学習可能とする翻訳訳語学習方法、翻訳訳語学習装置及び記憶媒体を提供することを目的とする。
【0010】
また、本発明の他の目的は、自動的に学習した訳語を翻訳に有効に活用する翻訳システムを提供することにある。
【0011】
【課題を解決するための手段】
上記課題を解決するために、本発明に係わる翻訳訳語学習方法は、文書入力部、第一言語の文書の単語及び第二言語の文書の単語翻訳必要な各種辞書第一言語・第二言語の文法規則を記憶する翻訳辞書記憶部、使用訳語判定処理部、第一及び第二用言語テーブルを有する判定処理データ記憶部、使用訳語を学習する学習辞書記憶部を備えたコンピュータによって、同一分野の第一言語の文書と第二言語の文書とを用いて訳語を学習する翻訳訳語学習方法であって、
前記文書入力部が、同一分野の第一言語及び第二言語の文書を入力する文書入力手順と、前記使用訳語判定処理部が、前記翻訳辞書記憶部を用いて、前記文書入力手順により入力される第一言語の文書の各単語を見出し語とするとともに、各単語の品詞を決定し、前記見出し語と品詞とをペアとし、1つ以上の訳語情報を抽出し前記判定処理データ記憶部の第一言語テーブルに登録する手順と、前記翻訳辞書記憶部を用いて、前記文書入力手順から入力される第一言語の分野と同一分野の第二言語の文書の各単語を見出し語とするとともに、当該各単語の品詞を決定し、当該見出し語と品詞とをペアとし、1つ以上の訳語を抽出し前記判定処理データ記憶部の第二言語テーブルに登録する手順と、前記第一言語テーブルから得られる各単語の訳語情報に対し、前記第二言語テーブルに登録される見出し語を順次検索し、各単語の訳語情報と検索された見出し語とが一致したとき、使用訳語として前記学習辞書記憶部に学習記憶する訳語学習手順とを具備した翻訳訳語学習方法である。
【0012】
本発明に係わる翻訳訳語学習装置は、同一分野における第一言語及び第二の言語の文書を入力する文書入力部と、この文書入力部から入力された第一言語の文書の各単語を見出し語とするとともに、各単語の品詞を決定する第一言語単語品詞決定手段と、この品詞決定手段による品詞決定後、前記見出し語と品詞とをペアとし、少なくとも1つ以上の訳語情報を抽出し登録する第1の訳語情報抽出手段と、前記文書入力部から入力された第言語の文書の分野と同一分野の第二言語の文書の各単語を見出し語とするとともに、当該各単語の品詞を決定する第二言語単語品詞決定手段と、この品詞決定手段による品詞決定後、当該見出し語と品詞とをペアとし、少なくとも1つ以上の訳語情報を抽出し登録する第2の訳語情報抽出手段と、前記第1の訳語情報抽出手段により登録される訳語情報に対し、前記第2の訳語情報抽出手段により登録される見出し語を順次検索し、当該訳語情報と当該見出し語とが一致した時、使用訳語として学習する訳語学習手段とを有する使用訳語判定処理部とを備えた構成である。
【0013】
本発明は、以上のような構成とすることにより、文書入力手段が予め同一分野の第一言語の文書と第二言語の文書を確保し、訳語学習可能な状態を生成する。この状態において、使用訳語判定処理部は、第一言語の文書を構成する単語の1つ以上の第1訳語情報と前記第二の言語の文書を構成する単語とを比較し、この単語と一致する訳語情報を前記第一言語の単語の使用訳語として自動的に学習し、各種分野の参考資料等に基づいて多数の訳語を蓄積することが可能である。
【0014】
また、本発明に係わる翻訳システムは、前述した翻訳訳語学習装置の構成に新たに、前記第一言語の文書の翻訳時、前記学習された使用訳語を用いて前記第一言語の文書の翻訳処理を行う翻訳処理部を設けた構成である。
【0015】
この発明は以上のような構成とすることにより、自動的に学習した訳語を翻訳に有効に活用することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
【0017】
先ず、本発明に係わる翻訳訳語学習方法の一実施の形態について説明する。
【0018】
(1) 翻訳したい第一言語(例えば英語)の文書の各文の単語を見出し語とし、当該単語の品詞を決定し、この見出し語と品詞とをペアとして翻訳辞書から当該単語の少なくとも1つ以上の訳語情報を取り出し、第一言語用訳語テーブルに保存する。ここで、第一言語の文書とは、例えばファイルなどに記録されている特定分野の英文参考資料であるとか、或いはユーザが特定分野の英文参考資料に基づいてキーボードなどから入力される情報であったり、HTML言語で記述される英語ホームページおよびそれにリンクされているWebページなどである。
【0019】
(2) 次に、前記第一言語の分野(例えばスポーツ分野)と同一分野の第二言語(例えば日本語)の文書の各文の単語を見出し語とし、当該単語の品詞を決定し、この見出し語と品詞とをペアとして翻訳辞書から当該単語の少なくとも1つ以上の訳語情報を取り出し、第二言語用訳語テーブルに保存する。ここで、第二言語の文書とは、例えばファイルなどに記録されている特定分野の日本語参考資料であるとか、或いはユーザが特定分野の日本語参考資料に基づいてキーボードなどから入力される情報であったり、さらにはHTML言語で記述される日本語ホームページおよびそれにリンクされているWebページなどである。
【0020】
(3) 前記訳語テーブルに記憶された第一言語の文書の見出し語、品詞、訳語情報と第二言語の文書の見出し語、品詞、訳語情報との関係において、第一言語の文書のある見出し語に対応する1つの訳語情報を取り出し、当該訳語情報をもとに前記訳語テーブルに記憶される第二言語文書の見出し語の中に一致する見出し語があれば、その見出し語を、第一言語の文書の見出し語に対応する学習候補訳語として順次記憶し、最終的に1つの使用訳語として自動的に学習する。
【0021】
(4) 以上述べた(1)〜(3)の処理ステップを自動的に繰り返し処理することにより、順次使用訳語を蓄積していく。
【0022】
従って、以上のような翻訳訳語学習方法によれば、言語の異なる同一分野の参考資料等を利用し、第二言語の特定分野の訳語を自動的に学習することができ、しかもその分野に関する専門的な知識を必要とせずに文書の分野にあった訳語を順次蓄積することができる。
【0023】
次に、本発明に係わる翻訳訳語学習装置を含む翻訳システムの一実施の形態について図1を参照して説明する。
【0024】
同図において1は同一分野の異なる言語で記述される文書を入力する文書入力手段であって、外部からの読み取り指示に基づいて例えば磁気テープ、CD−ROM、フロッピーディスク等のファイル1aに記録されている同一分野の異なる言語の参考資料等の文書を読み出し、文書記憶手段2に記憶する。なお、ファイル1aそれ自体を文書記憶手段2と考えてもよい。また、文書入力手段1としては、ユーザが同一分野の異なる言語で記述する適当な参考資料例えば文献,スポーツ新聞,雑誌等を参照しながらキーボード1bなどから入力し、文書記憶手段2に記憶したり、或いは同一分野の異なる言語で記述されるホームページ等から必要な情報を取り込んで文書記憶手段2に記憶することにより、同一分野の異なる言語で記述される文書を取得することもできる。なお、ユーザによるアクセスにより、同一画面に同一分野の異なる言語で記述するホームページを表示することにより、翻訳処理する場合にはこれらホームページを文書記憶手段2に含めてもよい。
【0025】
3はファイル1a,ホームページ情報を含む文書記憶手段2に記憶される同一分野の異なる言語,例えば翻訳したい第一言語である例えば英語文書と第二言語である日本語文書とから翻訳処理に使用する訳語を見つけ出し自動的に学習するCPUで構成される使用訳語判定処理部であって、この判定処理部3には翻訳辞書記憶部4、訳語学習用記憶媒体5、判定処理データ記憶部6および学習辞書記憶部7が接続されている。
【0026】
前記翻訳辞書記憶部4は、第一言語(原語)の文を解析するのに必要な情報をもつ辞書,第一言語の単語を第二言語の単語に置換する辞書,第二言語の文を生成するのに必要な情報をもつ辞書その他必要な辞書の他、第一言語および第二言語に関する文法規則等が記録されている。
【0027】
前記記憶媒体5は、後記する訳語学習用プログラムを記憶するものであって、例えば磁気ディスク、磁気テープ、CD−ROM、DVD−ROM、フロッピーディスク、MO、CD−R、メモリカードその他の記憶用媒体が用いられる。
【0028】
前記判定処理データ記憶部6は、記憶媒体5に記憶される訳語学習用プログラムに従って使用訳語判定処理を行っている途中データを順次整然と格納する部分であって、例えば図2に示すように第一言語用訳語テーブル6a、第二言語用訳語テーブル6b及び使用訳語候補テーブル6cなどによって構成されている。
【0029】
この第一言語用訳語テーブル6aは、見出し語、品詞、訳語情報のエリアに分けられ、見出し語エリアには第一言語の文書中の各文を構成する各単語が登録され、品詞エリアには当該単語の品詞が登録され、訳語情報エリアには当該単語に対して少なくとも1つ以上の訳語情報が登録される。また、第二言語用訳語テーブル6bは、第一言語用訳語テーブル6aと同様に見出し語、品詞、訳語情報のエリアに分けられ、これらエリアにはそれぞれ第二言語の文書中の各文を構成する各単語、当該単語の品詞および訳語情報が登録され、さらに使用訳語候補テーブル6cは、見出し語、品詞、訳語情報,見出し名のエリアに分けられ、見出し語エリアには第一言語の単語に対する使用可能な訳語の候補、見出し名エリアには候補訳語に関連する第一言語の見出し語がそれぞれ登録される。
【0030】
前記学習辞書記憶部7は、前記訳語学習用プログラムに従って行われた使用訳語判定結果のデータである使用訳語が学習記憶される。
【0031】
なお、前記テーブル6a〜6cに見出し語、品詞、訳語情報等の他、分野も保存しておけば、学習辞書記憶部7には分野ごとに分けて使用訳語を登録することができ、後の翻訳処理時に有効に利用できる。
【0032】
また、各記憶部2,4,6,7はそれぞれ個別に設けられているが、任意の複数の記憶部に相当するエリアを形成し、1つの記憶部で必要なデータを格納する構成であってもよい。
【0033】
さらに、使用訳語判定処理部3は、機能的には図3に示すように、文書記憶手段2からある特定の分野の第一言語の文書を読み出し、この文書を翻訳辞書記憶部4の辞書および文法規則に基づいて構文解析した後、それら各単語を見出し語とするとともに、当該見出し語である単語の品詞を決定する第一言語単語品詞決定手段31と、この品詞決定手段31による品詞を決定した後、前記見出し語と品詞とをペアとして翻訳辞書記憶部4の辞書に基づいて少なくとも1つ以上の訳語情報を抽出し、第一言語用訳語テーブル6aに登録する第1の訳語情報抽出手段32と、前記文書記憶手段2から前記第一言語の文書の分野と同一分野の第二言語の文書を読み出し、この文書を翻訳辞書記憶部4の辞書および文法規則に基づいて構文解析した後、それら各単語を見出し語とするとともに、当該見出し語である単語の品詞を決定する第二言語単語品詞決定手段33と、この品詞決定手段33による品詞を決定した後、前記見出し語と品詞とをペアとして翻訳辞書記憶部4の辞書に基づいて少なくとも1つ以上の訳語情報を抽出し、第二言語用訳語テーブル6bに登録する第2の訳語情報抽出手段34と、前記第一言語用訳語テーブル6aに登録される各見出し語の訳語情報に対し、前記第二言語用訳語テーブル6bの見出し語を順次検索し、当該訳語情報と当該見出し語とが一致した時、学習辞書の使用訳語として学習辞書記憶部7に記憶する訳語学習手段35とが設けられている。
【0034】
8は翻訳処理用プログラムに基づき、翻訳辞書記憶部4の必要な辞書及び文法規則を用い、かつ、学習辞書記憶部7に記憶される辞書訳語を用いて、第一言語の文書を第二言語の文書に翻訳処理する翻訳処理部、9は翻訳処理部8の翻訳処理過程で分野その他の要請指示のもとに第一言語の単語を受けたとき、学習辞書記憶部7に記憶される辞書を読み出して翻訳処理に反映させる翻訳処理反映部である。
【0035】
前記翻訳処理部8により翻訳処理された文書は翻訳結果出力手段10から出力される。この翻訳結果出力手段10は、ファイル10aに保存され、或いは表示部10bに表示され、或いはプリンタ10cに印字出力することになる。
【0036】
次に、以上のような翻訳訳語学習装置を含む翻訳システムの動作ないし記録媒体5に記憶される訳語学習用プログラムによるCPUの機能実現例について図5ないし図8を参照して説明する。
【0037】
システムの動作が開始すると、記録媒体5から訳語学習用プログラムを読み取って適宜なメモリに記憶した後、そのプログラムに従って所定の処理を実行する。
【0038】
すなわち、使用訳語判定処理部3は、図5示すように、ファイル1a,ホームページ情報1cを含む予め文書記憶手段2に記憶される同一分野の異なる言語の参考資料等の文書のうち、ある特定の分野の第一言語の文書を読み込んだ後、この文書の各文を個別に取り出し、翻訳辞書記憶部4に記憶される文法規則に基づいて構文解析を行い、各単語の品詞を決定していく(S1〜S4:第一言語単語品詞決定機能)。これらステップS1〜S4の処理を繰り返すことにより、ある1つの文を構成する各単語ごとの品詞を決定する。例えば第一言語である英語文書の中のある文が「He is a reliever」に対し、図4に示すごとく各単語ごとに品詞を決定する。
【0039】
引き続き、j←0を設定し、j番目の単語を取り出し、既に抽出されている当該単語の見出し語と品詞とのペアを確認した後、翻訳辞書記憶部4に記憶される辞書のもとに訳語情報を抽出し、見出し語、品詞、訳語情報の順に第一言語用訳語テーブル6a(図2a参照)に登録していく(S5〜S9:第1の訳語情報抽出機能)。この場合、例えば英単語「reliever」に対し、「救済者」,「リリーフ投手」,…が訳語情報として抽出される。
【0040】
第一言語の文書に関し、以後、i番目の文の全単語について訳語情報を抽出した後(S10)、次の文から最後の文まで前述の処理を繰り返し実行する(S11)。
【0041】
次に、使用訳語判定処理部3は、図6に示すように、ファイル1a,ホームページ情報1cを含む予め文書記憶手段2から前記第一言語の文書と同一分野の第二言語例えば日本語の参考資料等の文書を読み込んだ後、この文書の各文を個別に取り出し、翻訳辞書記憶部4に記憶される文法規則に基づいて構文解析を行い、各単語の品詞を決定していく(S11〜S15:第二言語単語品詞決定機能)。これらステップS11〜S15の処理を繰り返すことにより、ある1つの文を構成する各単語ごとの品詞を決定する。
【0042】
引き続き、j←0を設定し、j番目の単語を取り出し、既に抽出されている当該単語の見出し語と品詞とのペアを確認した後、翻訳辞書記憶部4に記憶される辞書のもとに訳語情報を抽出し、見出し語、品詞、訳語情報の順に第二言語用訳語テーブル6b(図2b照)に登録していく(S16〜S20:第2の訳語情報抽出機能)。この場合、前記第一言語の文書がスポーツ分野であれば、同じく同一分野であるスポーツ分野の日本語単語「リリーフ投手」の場合には、図2(b)に示すように、「reliever」,…が訳語情報として抽出される。
【0043】
第二言語の文書に関し、以後、i番目の文の全単語について訳語情報を抽出した後(S21)、次の文から最後の文まで前述の処理を繰り返し実行する(S22)。
【0044】
さらに、使用訳語判定処理部3は、図7に示すように、判定処理データ記憶部6の第一言語用訳語テーブル6aの内容を読み取り(S23)、その中のi番目の見出し語「例えばreliever」を取り出し(S24,S25)、j←0,k←0を設定し(S26)、j番目の訳語情報「救済者」を取り出す。しかる後、このj番目の訳語情報「救済者」のもとに、第二言語用訳語テーブル6bを検索し(S27,S28)、見出し語の中に「救済者」に一致する見出し語があるか否かを判断する(S29)。この場合には不一致となるので、引き続き、ステップS32を介して次の訳語情報「リリーフ投手」について同様に第二言語用訳語テーブル6bの見出し語を検索すると、見出し語「リリーフ投手」が存在することから一致と判断し、図2(c)に示すごとく、使用訳語候補テーブル6cに第一言語の単語である見出し語、品詞の他、一致した「リリーフ投手」を学習訳語候補として登録する(S23〜S30:学習候補訳語抽出機能)。そして、学習候補訳語「リリーフ投手」に対する見出し名として、「reliever」の他にあるかについて(S31)、前述する同様の処理を実行し、ステップS29について一致すれば、見出し名として追加登録する。
【0045】
引き続き、ステップS33に移行し、学習候補訳語が1つか否かを判断し、1つであれば、使用訳語候補テーブル6cの少なくとも見出し語と学習候補訳語を取り出して学習辞書記憶部7に登録し、必要に応じて品詞,見出し名、さらに当該文書の分野を登録すれば、翻訳処理に反映させる場合に有効となる。
【0046】
ステップS33において学習候補訳語が1つでない場合には、ステップS35に移行し、学習候補訳語が2つ以上か否かを判断し(S35)、2つ以上の場合には学習候補訳語の中に見出し語と一致するものだけ学習辞書記憶部7に登録する(S35〜S40)。
【0047】
しかる後、第一言語用訳語テーブル6aに記憶される最後の見出し語まで処理したか否かを判断し、処理した場合には終了するか、或いは図8に示すように翻訳処理に移行する。
【0048】
この翻訳処理部8は、使用訳語判定処理部3から訳語学習の処理終了を受けたとき、翻訳処理用プログラム(図示せず)に従って翻訳処理を実行する。すなわち、翻訳処理部8は、i←0を設定し、第一言語の文書のi番目の文を取り出し、翻訳処理を実行する(S51〜S53)。ところで、翻訳処理にあっては、第一言語の文書に関して既に学習辞書が作成されているか、或いは優先的に学習辞書を理由する場合には、第一言語の文書の各単語に関し、翻訳処理反映部9に要請し、学習辞書記憶部7に登録されている学習辞書を用いて訳文を生成する(S54,S55)。そして、第一言語の最後の文まで翻訳し終了する(S56)。
【0049】
従って、以上のような実施の形態によれば、同一分野の異なる第一言語および第二言語において、第一言語の文書の各単語を見出し語とするとともに品詞を決定し、これら見出し語と品詞とをペアとして1つ以上の訳語情報を抽出する。第二言語についても同様に見出し語と品詞とをペアとし、1つ以上の訳語情報を抽出する。そして、第一言語の文書の訳語情報をもとに、第二言語の文書にて決定された見出し語を検索し、訳語情報と同一の見出し語があれば、該当分野の前記訳語情報を使用訳語として学習するので、種々の参考文献等の文書から分野に合った適切な訳語を選択し学習辞書を作成できる。また、高価な専門分野の辞書を備えることなく、種々の専門分野の辞書を逐次作成でき、実用的価値の高いものとして利用可能である。
【0050】
また、種々の電子的な情報を取り込んで、特定分野の使用訳語を自動的に学習でき、人手を要することなく、また熟練を必要とせずに学習辞書を容易に作成できる。
【0051】
しかも、同一分野の異なる言語の文書から使用訳語を学習することから、同一分野の第一言語の文書について学習辞書を用いて翻訳しても、訳語が突然変わることがなく、統一性のある翻訳を行うことができる。
【0052】
なお、本願発明は、上記実施の形態に限定されるものでなく、その要旨を逸脱しない範囲で種々変形して実施できる。また、各実施の形態は可能な限り組み合わせて実施することが可能であり、その場合には組み合わせによる効果が得られる。さらに、上記各実施の形態には種々の上位,下位段階の発明が含まれており、開示された複数の構成要素の適宜な組み合わせにより種々の発明が抽出され得るものである。例えば問題点を解決するための手段に記載される全構成要件から幾つかの構成要件が省略されうることで発明が抽出された場合には、その抽出された発明を実施する場合には省略部分が周知慣用技術で適宜補われるものである。
【0053】
【発明の効果】
以上説明したように本発明によれば、第一言語の文書と第二言語の文書とから、第一言語の文書の分野にあった訳語を自動的に学習でき、さらに専門分野の辞書を持たずに種々の専門分野の辞書を容易に作成できる翻訳訳語学習方法、翻訳訳語学習装置及び記憶媒体を提供できる。
【0054】
また、本発明は、自動的に学習した訳語を用いることにより、その分野に合った適切な訳語を用いて訳文を生成できる翻訳システムを提供できる。
【図面の簡単な説明】
【図1】 本発明に係わる翻訳訳語学習装置含む翻訳システムの一実施の形態を示す構成図。
【図2】 図1に示す判定処理データ記憶部におけるデータの一配列例を示す図。
【図3】 図1に示す使用訳語判定処理部3の一機能を説明するブロック構成図。
【図4】 第一言語の文書のある文における訳語情報を説明する図。
【図5】 本発明に係わる翻訳訳語学習装置の動作及び記憶媒体の訳語学習用プログラムを説明する図。
【図6】 同じく本発明に係わる翻訳訳語学習装置の動作及び記憶媒体の訳語学習用プログラムに関し、図5に続けて説明する図。
【図7】 同じく本発明に係わる翻訳訳語学習装置の動作及び記憶媒体の訳語学習用プログラムに関し、図6に続けて説明する図。
【図8】 翻訳処理の動作を説明するフローチャート。
【符号の説明】
1…文書入力手段
3…使用訳語判定処理部
4…翻訳辞書記憶部
5…記憶媒体
6…判定処理データ記憶部
7…学習辞書記憶部
8…翻訳処理部
9…翻訳処理反映部
10…翻訳結果出力手段

Claims (4)

  1. 文書入力部、第一言語の文書の単語及び第二言語の文書の単語翻訳必要な各種辞書第一言語・第二言語の文法規則を記憶する翻訳辞書記憶部、使用訳語判定処理部、第一言語及び第二言語のテーブルを有する判定処理データ記憶部、使用訳語を学習する学習辞書記憶部を備えたコンピュータによって、同一分野の第一言語の文書と第二言語の文書とを用いて訳語を学習する翻訳訳語学習方法であって、
    前記文書入力部が、同一分野の第一言語及び第二言語の文書を入力する文書入力手順と、
    前記使用訳語判定処理部が、前記翻訳辞書記憶部を用いて、前記文書入力手順により入力される第一言語の文書の各単語を見出し語とするとともに、各単語の品詞を決定し、前記見出し語と品詞とをペアとし、1つ以上の訳語情報を抽出し前記判定処理データ記憶部の第一言語テーブルに登録する手順と、前記翻訳辞書記憶部を用いて、前記文書入力手順から入力される第一言語の文書の分野と同一分野の第二言語の文書の各単語を見出し語とするとともに、当該各単語の品詞を決定し、当該見出し語と品詞とをペアとし、1つ以上の訳語を抽出し前記判定処理データ記憶部の第二言語テーブルに登録する手順と、前記第一言語テーブルから得られる各単語の訳語情報に対し、前記第二言語テーブルに登録される見出し語を順次検索し、各単語の訳語情報と検索された見出し語とが一致したとき、使用訳語として前記学習辞書記憶部に学習記憶する訳語学習手順とを具備したことを特徴とする翻訳訳語学習方法。
  2. 同一分野の第一および第二の言語の文書を入力する文書入力部と、
    この文書入力部から入力された第一言語の文書の各単語を見出し語とするとともに、各単語の品詞を決定する第一言語単語品詞決定手段と、この品詞決定手段による品詞決定後、前記見出し語と品詞とをペアとし、少なくとも1つ以上の訳語情報を抽出し登録する第1の訳語情報抽出手段と、前記文書入力部から入力された第一言語の文書の分野と同一分野の第二言語の文書の各単語を見出し語とするとともに、当該各単語の品詞を決定する第二言語単語品詞決定手段と、この品詞決定手段による品詞決定後、前記見出し語と品詞とをペアとし、少なくとも1つ以上の訳語情報を抽出し登録する第2の訳語情報抽出手段と、前記第1の訳語情報抽出手段により登録される訳語情報に対し、前記第2の訳語情報抽出手段により登録される見出し語を順次検索し、当該訳語情報と当該見出し語とが一致した時、使用訳語として学習する訳語学習手段とを有する使用訳語判定処理部と
    を具備したことを特徴とする翻訳訳語学習装置。
  3. 請求項2記載の翻訳訳語学習装置の構成に、さらに前記第一言語の文書の翻訳時、前記学習された使用訳語を用いて前記第一言語の文書の翻訳処理を行う翻訳処理部を設けたことを特徴とする翻訳システム。
  4. 第一言語の文書の単語及び第二言語の文書の単語翻訳必要な各種辞書および第一言語・第二言語の文法規則を記憶する翻訳辞書記憶部、使用訳語判定処理部、第一言語及び第二言語テーブルを有する判定処理データ記憶部、使用訳語を学習する学習辞書記憶部を備えたコンピュータによって、同一分野の第一言語の文書と第二言語の文書とを用いて訳語を学習する訳語学習用プログラムを記憶する記憶媒体であって、
    前記コンピュータに、
    前記使用訳語判定処理部によって、前記翻訳辞書記憶部を用いて、前記第一言語の文書の各単語を見出し語とするとともに、各単語の品詞を決定する第一言語単語品詞決定機能と、この品詞決定機能による品詞決定後、前記見出し語と品詞とをペアとし、少なくとも1つ以上の訳語情報を抽出し前記判定処理データ記憶部の第一言語テーブルに登録する第1の訳語情報抽出機能と、前記翻訳辞書記憶部を用いて、前記第一言語の文書の分野と同一分野の第二言語の文書の各単語を見出し語とするとともに、当該各単語の品詞を決定する第二言語単語品詞決定機能と、この品詞決定機能による品詞決定後、前記見出し語と品詞とをペアとし、少なくとも1つ以上の訳語情報を抽出し前記判定処理データ記憶部の第二言語テーブルに登録する第2の訳語情報抽出機能と、前記第1の訳語情報抽出機能により登録される訳語情報をもとに、前記第2の訳語情報抽出機能により登録される見出し語を順次検索し、当該訳語情報と当該見出し語とが一致した時、使用訳語として前記学習辞書記憶部に学習記憶する訳語学習機能とを実現させるための前記訳語学習用プログラムを記録したコンピュータ読取り可能な記憶媒体。
JP2000163037A 2000-05-31 2000-05-31 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム Expired - Fee Related JP3949874B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000163037A JP3949874B2 (ja) 2000-05-31 2000-05-31 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000163037A JP3949874B2 (ja) 2000-05-31 2000-05-31 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム

Publications (2)

Publication Number Publication Date
JP2001344236A JP2001344236A (ja) 2001-12-14
JP3949874B2 true JP3949874B2 (ja) 2007-07-25

Family

ID=18666855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000163037A Expired - Fee Related JP3949874B2 (ja) 2000-05-31 2000-05-31 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム

Country Status (1)

Country Link
JP (1) JP3949874B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632212B (zh) * 2019-10-08 2024-03-15 腾讯科技(深圳)有限公司 一种待翻译词条的更新方法、装置、设备和介质

Also Published As

Publication number Publication date
JP2001344236A (ja) 2001-12-14

Similar Documents

Publication Publication Date Title
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
US5895446A (en) Pattern-based translation method and system
JP3220560B2 (ja) 機械翻訳装置
US5303150A (en) Wild-card word replacement system using a word dictionary
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP2783558B2 (ja) 要約生成方法および要約生成装置
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
US8041556B2 (en) Chinese to english translation tool
JP4431759B2 (ja) 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
Pinnis et al. Tilde MT platform for developing client specific MT solutions
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JP3766406B2 (ja) 機械翻訳装置
JP2000250913A (ja) 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体
JPH0561902A (ja) 機械翻訳システム
JP2002183134A (ja) 翻訳装置
JP2000250914A (ja) 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体
JP2003308319A (ja) 訳語選択装置、翻訳装置、訳語選択プログラム、及び翻訳プログラム
JPH05290030A (ja) 文書処理装置
JPH10149364A (ja) 訳語選択装置と記憶媒体
JPH03129568A (ja) 文書処理装置
JPH06266765A (ja) 文章検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070419

R151 Written notification of patent or utility model registration

Ref document number: 3949874

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100427

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees