JP2006163769A - 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム - Google Patents

利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム Download PDF

Info

Publication number
JP2006163769A
JP2006163769A JP2004353790A JP2004353790A JP2006163769A JP 2006163769 A JP2006163769 A JP 2006163769A JP 2004353790 A JP2004353790 A JP 2004353790A JP 2004353790 A JP2004353790 A JP 2004353790A JP 2006163769 A JP2006163769 A JP 2006163769A
Authority
JP
Japan
Prior art keywords
user
dictionary
registration
word
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004353790A
Other languages
English (en)
Inventor
Kyoko Kanehara
京子 金原
Shoji Shibazaki
庄二 柴崎
Makoto Konno
真 近野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004353790A priority Critical patent/JP2006163769A/ja
Publication of JP2006163769A publication Critical patent/JP2006163769A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 利用者辞書作成装置によって提示された各問題語句の中から、登録費用も考慮して利用者が利用者辞書へ登録する問題語句を選択する。
【解決手段】 問題個所分析手段102が、原文に対する機械翻訳文と参考翻訳文との不一致部分を抽出すると共に不一致部分に対応する原文中の語句を問題語句として抽出する。問題表示・指定手段103は、上記不一致部分と問題語句とを対応付けて表示する問題表示画面を辞書利用者端末へ送る。利用者は、問題表示画面中の問題語句から、登録候補とする問題語句を選択する。登録候補・費用確定手段105は、選択された各問題語句の品詞に基づいて登録費用を算出し、算出した登録費用と問題語句とを対応付けて表示する登録候補費用表示画面を利用者端末へ送る。利用者は、登録候補費用表示画面中の各問題語句の中から、登録費用も考慮して利用者辞書119へ登録する問題語句を選択する。
【選択図】 図2

Description

本発明は、第1言語の文章を第2言語の文章に翻訳する機械翻訳技術に関し、特に、利用者辞書の作成を支援する技術に関する。
近年、コンピュータを利用して第1言語の文章を第2言語の文章に翻訳する機械翻訳システムが盛んに利用されるようになってきている。機械翻訳システムにおいては、一般に、単語辞書,複合語辞書,熟語辞書,構文辞書,語彙の関係を記述したパターン辞書などから構成される、システムに元々備わっている機械翻訳辞書を利用して原文の翻訳を行っている。しかし、システムに元々備わっている機械翻訳辞書だけでは、専門分野の文章などを正しく翻訳することができない場合がある。このため、利用者が扱う専門分野などに特有の語句(単語,句などを含む)に関する辞書データを登録した利用者辞書が従来から利用されている。なお、利用者辞書は、翻訳時において、機械翻訳辞書よりも優先的に利用される。
ところで、利用者辞書に辞書データを登録する場合、従来は、一般に、利用者が持っている対訳リストに基づいて人手で辞書データを作成し、この作成した辞書データを機械翻訳システムの登録機能を利用して利用者辞書に登録するようにしている。しかし、この作業は、非常に手間がかかるという問題があった。
そこで、このような問題点を解決するため、従来、原文と、この原文に対する正しい翻訳文とを入力して両者の対応部分を抽出し、抽出した対応部分に基づいて辞書データを作成し、作成した辞書データを翻訳辞書に登録するという辞書作成装置が提案された(例えば、特許文献1,2参照)。
特開2002−366546号公報 特開平7−85056号公報
上述した従来の辞書作成装置によれば、原文とその原文に対する正しい翻訳文とを入力するだけで、翻訳辞書に辞書データを登録することが可能になる。しかし、従来の辞書作成装置を利用して利用者辞書を作成するようにした場合には、次のような問題点が生じる。即ち、従来の辞書作成装置は、入力された原文および翻訳文に基づいて自動的に辞書データを作成し、作成した辞書データを翻訳辞書に登録するようにしているため、システムが元々備えている機械翻訳辞書に登録されている辞書データと同一の辞書データが利用者辞書に登録されてしまう場合があるという問題があった。そして、このような辞書データが利用者辞書に登録された場合には、無駄に記憶資源が消費されてしまう。更に、利用者が利用者辞書の作成を利用者辞書作成事業者に依頼しており、辞書作成料金が登録した辞書データ数に応じたものである場合には、不要な辞書データの登録費用も含んだ辞書作成料金を支払わなければならない。
〔発明の目的〕
そこで、本発明の目的は、利用者自身が、利用者辞書に登録すべき辞書データを確認できるようにすることにある。
本発明にかかる第1の利用者辞書作成システムは、
利用者辞書作成装置と、利用者端末とを含む利用者辞書作成システムであって、
前記利用者辞書作成装置が、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
該問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を前記利用者端末へ送信する問題表示・指定手段とを備えたことを特徴とする。
本発明にかかる第2の利用者辞書作成システムは、第1の利用者辞書作成システムにおいて、
前記利用者端末が、
前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択手段を有し、且つ、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする。
本発明にかかる第3の利用者辞書作成システムは、第1の利用者辞書作成システムにおいて、
前記利用者端末が、
前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択手段と、
登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択手段とを備え、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
前記登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする。
本発明にかかる第4の利用者辞書作成システムは、第3の利用者辞書作成システムにおいて、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする。
本発明にかかる第5の利用者辞書作成システムは、第3または第4の利用者辞書作成システムにおいて、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする。
本発明にかかる第6の利用者辞書作成システムは、第1〜第5の利用者辞書作成システムにおいて、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする。
本発明にかかる第7の利用者辞書作成システムは、第1〜第5の利用者辞書作成システムにおいて、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする。
本発明にかかる第1の利用者辞書作成装置は、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
該問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信する問題表示・指定手段とを備えたことを特徴とする。
本発明にかかる第2の利用者辞書作成装置は、第1の利用者辞書作成装置において、
前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする。
本発明にかかる第3の利用者辞書作成装置は、第1の利用者辞書作成装置において、
前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする。
本発明にかかる第4の利用者辞書作成装置は、第3の利用者辞書作成装置において、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする。
本発明にかかる第5の利用者辞書作成装置は、第3または第4の利用者辞書作成装置において、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする。
本発明にかかる第6の利用者辞書作成装置は、第1〜第5の利用者辞書作成装置において、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする。
本発明にかかる第7の利用者辞書作成装置は、第1〜第5の利用者辞書作成装置において、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする。
本発明にかかる第1の利用者辞書作成方法は、
利用者辞書作成装置が、
機械翻訳辞書を使用して原文を翻訳する機械翻訳ステップと、
該機械翻訳ステップで前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析ステップと、
該問題個所分析ステップで抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を前記利用者端末へ送信する問題表示・指定ステップとを実行することを特徴とする。
本発明にかかる第2の利用者辞書作成方法は、第1の利用者辞書作成方法において、
前記利用者端末が、
前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択ステップを実行し、且つ、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成ステップと、
該対訳辞書リスト作成ステップで作成された対訳辞書リストを利用者辞書に登録する辞書登録ステップとを実行することを特徴とする。
本発明にかかる第3の利用者辞書作成方法は、第1の利用者辞書作成方法において、
前記利用者端末が、
前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択ステップと、
登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択ステップとを実行し、
前記利用者辞書作成装置が、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップと、
前記登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成ステップと、
該対訳辞書リスト作成ステップで作成された対訳辞書リストを利用者辞書に登録する辞書登録ステップとを実行することを特徴とする。
本発明にかかる第4の利用者辞書作成方法は、第3の利用者辞書作成方法において、
前記登録候補・費用確定ステップの代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップを実行することを特徴とする。
本発明にかかる第5の利用者辞書作成方法は、第3または第4の利用者辞書作成方法において、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求ステップを実行することを特徴とする。
本発明にかかる第6の利用者辞書作成方法は、第1〜第5の利用者辞書作成方法において、
前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする。
本発明にかかる第7の利用者辞書作成方法は、第1〜第5の利用者辞書作成方法において、
前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする。
本発明にかかる第1のプログラムは、
コンピュータを、
機械翻訳辞書を使用して原文を翻訳する機械翻訳手段、
該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段、
該問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信する問題表示・指定手段として機能させる。
本発明にかかる第2のプログラムは、第1のプログラムにおいて、
前記コンピュータを、
前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段として機能させる。
本発明にかかる第3のプログラムは、第1のプログラムにおいて、
前記コンピュータを、
前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段、
前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段、
該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段として機能させる。
本発明にかかる第4のプログラムは、第3のプログラムにおいて、
前記コンピュータを、
前記登録候補・費用確定手段の代わりに、
前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段として機能させる。
本発明にかかる第5のプログラムは、第3または第4のプログラムにおいて、
前記コンピュータを、
前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段として機能させる。
〔作用〕
利用者辞書作成装置内の機械翻訳手段が、機械翻訳辞書を使用して原文を翻訳し、問題個所分析手段が、上記機械翻訳手段による機械翻訳文と、上記原文に対する参考翻訳文との不一致部分を抽出すると共に、抽出した不一致部分に対応する上記原文中の語句を問題語句として抽出する。更に、問題表示・指定手段が、問題個所分析手段で抽出された不一致部分と問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信する。
利用者端末の利用者は、利用者辞書作成装置から送られてきた問題表示画面を見て、利用者辞書に登録することが必要になる問題語句を認識する。そして、その問題語句を選択する。これにより、利用者端末内の登録候補選択手段が、問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を利用者辞書作成装置へ送信する。
利用者端末から登録候補選択情報が送られてくると、利用者辞書作成装置においては、対訳辞書リスト作成手段が、上記登録候補選択情報によって特定される問題語句と、上記参考翻訳文中の上記問題語句と対応する語句とを含む対訳辞書リストを作成し、辞書登録手段が、上記対訳辞書リストを利用者辞書に登録する。
本発明によれば、利用者自身が、利用者辞書に登録すべき辞書データを確認することが可能になる。その結果、利用者にとっては必要のない辞書データによって無駄に記憶資源が消費されたり、不当に高い利用者辞書作成料金を払うということがなくなる。その理由は、原文に対する機械翻訳文と参考翻訳文との不一致部分と、問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信するようにしているからである。
次に本発明の実施の形態について図面を参照して詳細に説明する。
〔第1の実施の形態の構成〕
図1を参照すると、本発明にかかる利用者辞書作成システムの第1の実施の形態は、利用者辞書作成装置1と、利用者辞書作成装置1の運営者に対して利用者辞書の作成を依頼している利用者(辞書利用者)の辞書利用者端末2と、利用者辞書作成装置1の運営者の辞書作成者端末3とから構成されており、それらはインターネット等のネットワーク4を介して相互に接続されている。
利用者辞書作成装置1は、コンピュータ等によって実現されるものであり、例えば、図2のブロック図に示すような構成を有する。図2を参照すると、利用者辞書作成装置1は、機械翻訳手段101と、問題個所分析手段102と、問題表示・指定手段103と、問題難易度分析手段104と、登録候補・費用確定手段105と、対訳辞書リスト作成手段106と、辞書登録手段107と、費用請求手段108と、送受信手段109と、機械翻訳辞書110と、原文データベース(DB)112,訳文DB113および対訳DB114が格納された利用者文書格納部111と、問題DB115と、辞書難易度DB116と、単価DB117と、課金情報DB118と、利用者辞書119と、辞書利用者DB120と、キーボード等の入力部121と、LCDなどの表示部122とから構成されている。尚、図2では、利用者文書格納部111を1つしか図示していないが、利用者が複数存在する場合には、各利用者毎に利用者文書格納部111を用意する。また、利用者文書格納部111は、必ずしも利用者辞書作成装置1上に配置する必要はなく、ネットワークを介して利用者辞書作成装置1からアクセス可能な他のコンピュータ上に配置しても良い。
機械翻訳辞書110には、単語辞書,複合語辞書,熟語辞書,構文辞書,語彙の関係を記述したパターン辞書やルール辞書など、機械翻訳手段101が機械翻訳を行う上で必要になる各種辞書が含まれている。更に、機械翻訳辞書110には、翻訳メモリも含まれている。
原文DB112には、辞書利用者端末2の利用者によって指定された翻訳対象となる原文が格納される。訳文DB113には、利用者によって指定された翻訳文が格納される。対訳DB114には、利用者によって指定された原文と、その原文に対する正しい翻訳文が格納される。なお、対訳DB114に格納する原文と翻訳文との対は、市販の辞書の対訳例文に基づいて作成したり、ネットワーク上の日本語サイト,英文翻訳サイトから収集した原文,翻訳文に基づいて作成することができる。
機械翻訳手段101は、原文DB112や対訳DB114に登録されている原文の内の、辞書利用者端末2から指定された原文を、機械翻訳辞書110を利用して翻訳し、その翻訳結果(機械翻訳文)を問題個所分析手段102に渡す機能を有する。尚、機械翻訳手段101が、英日機械翻訳および日英機械翻訳というような2種類の翻訳機能を有している場合には、原文DB112が訳文DBとなり、訳文DB114が原文DBとなる場合もある。
問題個所分析手段102は、機械翻訳手段101から渡された原文に対する機械翻訳文と上記原文に対する参考訳文との不一致部分を抽出すると共に、抽出した不一致部分に対応する原文中の語句(単語,句など)を問題語句として抽出する機能などを有する。例えば、原文が「The power turns off.」、機械翻訳文が「パワーが切れます。」、参考翻訳文が「電源が切れます。」であれば、不一致部分として「パワー」「電源」を抽出し、問題語句として「power」を抽出する。なお、参考翻訳文は、辞書利用者端末2から指定された原文が対訳DB114に登録されているものである場合には、その原文に対応付けて登録されている正しい翻訳文とすることができる。また、辞書利用者端末2から指定された原文が原文DB112に登録されているものである場合には、翻訳メモリやパターン辞書などを使用して生成した翻訳文とすることができる。例えば、翻訳メモリを利用して参考翻訳文を作成する場合には、翻訳メモリに登録されている原文の中から、利用者によって指定された原文と最も一致度の高いものを選択し、選択した原文に対応付けて登録されている翻訳文を参考翻訳文とする。更に、問題個所分析手段102は、各問題語句に関する情報を問題DB115に登録する機能も有する。図4に問題DB115の内容例を示す。
問題表示・指定手段103は、問題個所分析手段102が抽出した不一致部分と問題語句とを対応付けて配置した問題表示画面であって、利用者辞書119への登録候補にする問題語句を利用者が選択できるようにした問題表示画面を作成し、辞書利用者端末2へ送信する機能を有する。更に、問題表示・指定手段103は、利用者が問題表示画面を用いて選択した問題語句に従って問題DB115を更新する機能を有する。
図3に問題表示画面30の一例を示す。同図を参照すると、問題表示画面30は、データ番号部300と、原文部301と、機械翻訳文部302と、参考翻訳文部303と、問題個所部304と、問題語句部305と、品詞部306と、選択部307とから構成されている。データ番号部300には、問題語句に対するデータ番号が設定される。原文部301には、原文が設定され、機械翻訳文部302,参考翻訳文部303には、原文に対する機械翻訳文,参考翻訳文が設定される。また、原文部301に設定されている原文中の問題語句は括弧で囲まれ、機械翻訳文,参考翻訳文中の不一致部分も括弧で囲まれ、それらは視覚的に他の部分と区別できるようになっている。問題個所部304には、問題語句が、原文の何語目であるかを示す情報が設定される。問題語句部305には、問題語句が設定される。品詞部306には、問題語句の品詞(名詞,動詞,助動詞,動詞句,動詞慣用句など)が設定される。選択部307は、利用者が利用者辞書119への登録候補にする問題語句を選択する際に使用する選択欄である。尚、図3の例では、問題語句および不一致部分を括弧で囲むことにより、それらを視覚的に他の部分と区別できるようにしたが、視覚的に区別できるのであれば、表示色を他の部分と異なるものにする等の他の方法を採用しても良い。
辞書難易度DB116には、品詞に対応付けて、その品詞の問題語句を利用者辞書119に登録する際の難易度が登録されている。図5に辞書難易度DB116の一例を示す。同図の例では、名詞,動詞,助動詞,動詞句,動詞慣用句の難易度がそれぞれ1,3,5,8,10となっている。なお、各品詞の難易度は、例えば、辞書作成者が経験的に得た値とすることができる。
問題難易度分析手段104は、問題DB115に登録されている各問題語句の難易度を辞書難易度DB116から取得し、登録候補・費用確定手段105に渡す機能を有する。
単価DB117には、難易度の1ポイントに対する単価が登録される。図6に単価DB117の内容例を示す。同図の例は、難易度の1ポイントに対する単価が「100円」となっている。
登録候補・費用確定手段105は、問題難易度分析手段104から渡された各問題語句の難易度と、単価DB117に登録されている単価とに基づいて、各問題語句を利用者辞書119に登録する際に必要になる登録費用を算出する機能を有する。更に、登録候補・費用確定手段105は、問題語句とその語句の登録費用とを対応付けて配置した登録候補費用表示画面であって、利用者辞書119への登録対象にする問題語句を利用者が選択できるようにした登録候補費用表示画面を作成し、それを辞書利用者端末2へ送信する機能を有する。更に、登録候補・費用確定手段105は、辞書利用者端末2の利用者が登録候補費用表示画面を用いて選択した問題語句のリスト(登録対象リスト)を作成する機能や、利用者が選択した問題語句を利用者辞書119に登録する際の登録費用(合計金額)を再計算する機能を有する。
図7は登録候補費用表示画面700の一例を示した図であり、データ番号部70と、問題語句部71と、品詞部72と、難易度部73と、語句登録費用部74と、選択部75とを含んでいる。データ番号部70には、各問題語句のデータ番号(このデータ番号によって登録候補費用表示画面700上の各問題語句と、問題表示画面30上の各問題語句や問題DB115に登録されている各問題語句とが対応付けられる)が設定される。問題語句部71には、問題表示画面30を用いて利用者が選択した、利用者辞書119への登録候補にする問題語句が設定される。品詞部72には、問題語句の品詞が設定される。難易度部73には、問題語句を利用者辞書119に登録する際の難易度が設定される。語句登録費用部74には、問題語句を利用者辞書119に登録する際に必要になる各問題語句毎の登録費用と、合計金額とが設定される。選択部75は、利用者が利用者辞書119へ登録する問題語句(登録対象問題語句)を選択する際に使用する選択欄である。
対訳辞書リスト作成手段106は、利用者によって選択された登録対象問題語句と、利用者辞書119への登録内容とを含んだ対訳辞書リストを、辞書作成者端末3を利用して作成する機能や、作成した対訳辞書リストを辞書利用者端末2へ送信し、利用者に利用者辞書119への登録内容を事前に確認させる機能を有する。
図8は対訳辞書リスト作成手段106が作成する対訳辞書リスト80の一例を示す図である。同図の例では、問題語句(remove等)に対応付けて、参考翻訳文中の不一致部分に存在する語句(取り外す等の訳語)と、取り得る構文やパターン(SVO等)とが設定されているが、他の情報(例えば、品詞や文法情報など)が設定されていても良い。尚、図8では、図示を省略しているが、各問題語句に対応付けてデータ番号も設定されている。
辞書登録手段107は、対訳辞書リストの内容を利用者辞書119に登録する機能を有する。
辞書利用者DB120には、辞書利用者端末2の利用者の利用者情報(例えば、氏名,住所,会社名,メールアドレス,口座番号等)が登録されている。
費用請求手段108は、課金情報DB118の内容と利用者辞書119への登録内容とに基づいて、請求金額を算出する機能や、辞書利用者DB120に登録されているメールアドレスに、上記請求金額を含む請求書を送信する機能などを有する。図9に利用者に送信する請求書の一例を示す。
送受信手段109は、ネットワーク4を介してデータを送受信する機能を有する。
なお、利用者辞書作成装置1をコンピュータによって実現する場合には、例えば、コンピュータを利用者辞書作成装置1として機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、機械翻訳手段101、問題個所分析手段102、問題表示・指定手段103、問題難易度分析手段104、登録候補・費用確定手段105、対訳辞書リスト作成手段106、辞書登録手段107、費用請求手段108、送受信手段109を実現する。
図10は辞書利用者端末2の構成例を示すブロック図であり、送受信手段21と、登録候補選択手段22と、登録対象選択手段23と、登録内容確認手段24と、キーボード等の入力部25と、LCD等の表示部26とを備えている。
送受信手段21は、ネットワーク4を介してデータを送受信する機能を有する。
登録候補選択手段22は、利用者辞書作成装置1から送られてきた問題表示画面30を表示部26に表示する機能や、問題表示画面30に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報を利用者辞書作成装置1へ送信する機能を有する。
登録対象選択手段23は、利用者辞書作成装置1から送られてきた登録候補費用表示画面70を表示部26に表示する機能や、登録候補費用表示画面700に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を利用者辞書作成装置1へ送信する機能を有する。
登録内容確認手段24は、利用者辞書作成装置1から送られてきた対訳辞書リストを表示部26に表示する機能を有する。更に、利用者が入力部25から入力した削除指示に従って、利用者によって削除指示された問題語句に関する情報を対訳辞書リストから削除する機能や、利用者が入力部25から入力する送信指示に従って編集済みの対訳辞書リスト(利用者が削除指示を入力しなかった場合は、対訳辞書リスト作成手段106から送られてきた対訳辞書リストとなる)を利用者辞書作成装置1へ送信する機能を有する。
辞書利用者端末2は、コンピュータにより実現可能なものであり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを辞書利用者端末2として機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、送受信手段21、登録候補選択手段22、登録対象選択手段23、登録内容確認手段24を実現する。
図11は、辞書作成者端末3の構成例を示すブロック図であり、送受信手段31と、対訳辞書リスト作成支援手段32と、キーボード等の入力部33と、LCD等の表示部34とを備えている。
送受信手段31は、ネットワーク4を介してデータを送受信する機能を有する。
対訳辞書リスト作成支援手段32は、利用者辞書作成装置1内の対訳辞書リスト作成手段106から送られてきた情報(問題DB115に格納されている情報など)を表示部34に表示する機能や、辞書作成者が入力部33を用いて作成した対訳辞書リストを対訳辞書リスト作成手段106へ送信する機能を有する。
辞書作成者端末3は、コンピュータによって実現可能なものであり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを辞書作成者端末3として機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に送受信手段31、対訳辞書リスト作成支援手段32を実現する。
〔第1の実施の形態の動作〕
次に、本実施の形態の動作について詳細に説明する。
機械翻訳手段101は、辞書利用者端末2の利用者或いは辞書作成者端末3の作成者によって翻訳対象にする原文が指定されると、原文DB112或いは対訳DB114から指定された原文(テキスト文書)を取得し(図12のステップS120)、機械翻訳辞書110を参照しながら機械翻訳文を生成する(ステップS121)。なお、本実施の形態では、利用者文書格納部111に格納されている原文の中から翻訳対象にする原文を選択するようにしたが、辞書利用者端末2や辞書作成者端末3から翻訳対象にする原文を機械翻訳手段101へ送信するようにしても良い。
機械翻訳手段101が、原文に対する機械翻訳文を生成すると、問題個所分析手段102が、原文に対する参考翻訳文を取得する(ステップS122)。例えば、原文が対訳DB114に格納されているものである場合には、原文と対応付けて登録されている翻訳文を参考翻訳文とする。また、原文が原文DB112に登録されているものである場合には、翻訳メモリやパターン辞書などを使用して翻訳文を作成し、それを参考翻訳文とする。
その後、問題個所分析手段102は、機械翻訳手段101が生成した機械翻訳文と、ステップS122で取得した参考翻訳文との対応する部分(例えば、対応する文章など)を比較することにより不一致部分を抽出する(ステップS123)。次いで、問題個所分析手段102は、不一致部分に対応する原文中の語句を問題語句として抽出すると共に、問題語句が原文中の何語目に存在するのかを示す問題個所および問題語句の品詞を求める(ステップS124)。その後、原文,機械翻訳文,参考翻訳文,問題個所,問題語句,品詞を対応付けて問題DB115に登録する(ステップS125)。
上述したステップS123〜S125の処理を詳しく説明すると、次のようになる。今、例えば、原文中の或る文章「The power turns off.」に対する機械翻訳文が「パワーが切れます。」、参考翻訳文が「電源が切れます。」であったとすると、ステップS123では、不一致部分として「パワー」,「電源」を抽出する。
次のステップS124では、問題語句「power」,問題個所「2語目」,品詞「名詞」を抽出する。ここで、問題語句「power」の抽出方法としては、例えば、機械翻訳文中の不一致部分「パワー」に対応する語句を機械翻訳辞書110から抽出し、更に、抽出した語句の中から原文中に存在する語句を選択するという方法を採用することができる。また、機械翻訳文を生成する際、機械翻訳時に使用した辞書内容を機械翻訳文と対応付けて内部データとして保存しておき、この内部データから不一致部分「パワー」に対応する語句を抽出し、更に、抽出した語句の中から原文中に存在する語句を選択するという方法を採用することもできる。
次の、ステップS125では、原文「The power turns off.」、機械翻訳文「パワーが切れます。」、参考翻訳文「電源が切れます。」、問題個所「2語目」、問題語句「power」、品詞「名詞」を対応付けて問題DB115に登録する(図4参照)。なお、問題語句,不一致部分を明確にするために、問題語句「power」,不一致部分「パワー」,「電源」は括弧で囲むようにする。以上が、ステップS123〜S125で行う処理の詳細である。
問題個所分析手段102が、問題DB115に図4に示すような情報を格納すると、問題表示・指定手段103は、問題DB115の内容に基づいて図3に示すような問題表示画面30を作成し、辞書利用者端末2へ送信する(ステップS126)。
辞書利用者端末2内の登録候補選択手段22は、利用者辞書作成装置1から送られてきた問題表示画面30を表示部26に表示する。利用者は、問題表示画面30に表示されている各問題語句の中から、利用者辞書119への登録候補とする問題語句を選択する(選択部307をチェックする)。登録候補選択手段22は、選択された問題語句を示す登録候補選択情報(例えば、選択された問題語句のデータ番号を含む)を利用者辞書作成装置1へ送信する(ステップS127)。
利用者辞書作成装置1内の問題表示・指定手段103は、辞書利用者端末2から登録候補選択情報が送られてくると、問題DB115に登録されている各問題語句に関連する情報の内、利用者によって選択されなかった問題語句に関する情報を削除する(ステップS128)。この処理により、問題DB115内には、利用者によって選択された問題語句に関する情報のみが残る。
その後、問題難易度分析手段104が、辞書難易度DB116を参照し、問題DB115に登録されている各問題語句の難易度(品詞に応じた難易度)を取得する(図13のステップS131,S132)。その後、登録候補・費用確定手段105が、問題難易度分析手段104によって取得された各問題語句の難易度と、単価DB117に登録されている単価とに基づいて、各問題語句毎に、利用者辞書119への登録費用を算出する。例えば、辞書難易度DB116,単価DB117の内容が、それぞれ図5,図6に示すものであるとすると、問題語句「wear」の登録費用は、登録費用=難易度×単価=3×100=300円となる(ステップS133)。その後、登録候補・費用確定手段105は、図7に示すような登録候補費用表示画面700を作成し、辞書利用者端末2へ送信する(ステップS134)。
辞書利用者端末2内の登録対象選択手段23は、利用者辞書作成装置1から送られてきた登録候補費用表示画面700を表示部26に表示する。利用者は、登録候補費用表示画面700に表示されている問題語句の中から、登録費用を考慮して、利用者辞書119への登録対象にする問題語句を選択する(選択部75をチェックする)。これにより、登録対象選択手段23は、選択された問題語句を示す登録対象選択情報(例えば、選択された問題語句のデータ番号を含む)を利用者辞書作成装置1へ送信する(ステップS135)。
登録候補・費用確定手段105は、辞書利用者端末2から登録対象選択情報が送られてくると、利用者によって選択された問題語句のデータ番号と、その語句の登録費用とを対応付けて課金情報DB118に登録する(ステップS136)。その後、登録候補・費用確定手段105は、利用者が登録対象にした問題語句のデータ番号のリスト(登録対象リスト)を作成し、対訳辞書リスト作成手段106に渡す(ステップS137)。
対訳辞書リスト作成手段106は、登録候補・費用確定手段105から登録対象リストが渡されると、問題DB115に登録されている各情報の中から、登録対象リストに含まれているデータ番号と対応付けて登録されている情報を取得し、取得した情報を辞書作成者端末3へ送信する。辞書作成者端末3内の対訳辞書リスト作成支援手段32は、利用者辞書作成装置1から送られてきた情報を表示部34に表示する。辞書作成者は、この情報を見て、各問題語句毎に、辞書登録内容を設定した図8に示すような対訳辞書リストを作成し、対訳辞書リスト作成手段106に返す。対訳辞書リスト作成手段106は辞書作成者端末3から送られてきた対訳辞書リストを辞書利用者端末2へ送信する(ステップS141)。尚、本実施の形態では、対訳辞書リスト作成手段106が、登録対象リスト中のデータ番号によって特定される問題DB115中の情報のみを辞書作成者端末3へ送信するようにしたが、それ以外に、機械辞書110や対訳DB114から対訳辞書リストの作成の手助けになる情報を抽出し、この抽出した情報も辞書作成者端末3へ送信するようにしても良い。
辞書利用者端末2内の登録内容確認手段24は、利用者辞書作成装置1から送られていた対訳辞書リストを表示部26に表示する。利用者は、表示された対訳辞書リストを見て、対訳辞書リスト中の全ての問題語句に関する情報を、利用者辞書119に登録することが必要であると判断した場合は、入力部25から送信指示を入力する。これに対して、対訳辞書リスト中に、利用者辞書119への登録は不要な問題語句に関する情報が含まれていると判断した場合は、入力部25から削除指示を入力して該当する問題語句に関する情報を対訳辞書リストから削除した後、入力部25から送信指示を入力する。登録内容確認手段24は、送信指示が入力されると、現在表示されている対訳辞書リストの内容を対訳辞書リスト作成手段106へ送信する(ステップS142)。
対訳辞書リスト作成手段106は、辞書利用者端末2から対訳辞書リストが送られてくると、それを辞書登録手段107に渡す。これにより、辞書登録手段107は、利用者辞書119に対訳辞書リストの内容を登録する(ステップS143)。その後、費用請求手段108が、ステップS143において利用者辞書119へ登録された問題語句のデータ番号と、ステップS136において課金情報DB118に登録された各問題語句(データ番号に対応付けて登録されている)の登録費用と、辞書利用者DB120の内容とに基づいて、図9に示すような請求書を作成し、それを電子メールにより利用者へ送信する(ステップS144〜S146)。即ち、利用者辞書119へ登録された各問題語句のデータ番号と、課金情報DB118にデータ番号と対応付けて登録されている各問題語句の登録費用とに基づいて、実際に利用者辞書119へ登録を行った各問題語句の登録費用及びその合計金額を求め、図9に示すような請求書を作成する。
なお、上述した実施の形態では、辞書作成時に、利用者辞書119を利用者辞書作成装置1上に配置するようにしたが、ネットワーク4上の他のコンピュータ上に配置しても良い。また、利用者辞書119の作成作業が完了した後、利用者辞書作成装置1上でそのまま利用しても良いし、或いは利用者専用に機械翻訳手段101と同様の機械翻訳手段を導入したコンピュータ上に移動して利用しても良い。
また、本実施の形態では、辞書利用者に請求書を送信するようにしたが、辞書利用者が指定した銀行口座などから登録費用を引き落とすようにしても良い。
〔第1の実施の形態の効果〕
本実施の形態によれば、利用者自身が、利用者辞書119に登録すべき辞書データを確認することが可能になる。その結果、利用者にとっては必要のない辞書データによって無駄に記憶資源が消費されたり、不当に高い利用者辞書作成料金を払うということがなくなる。その理由は、原文に対する機械翻訳文と参考翻訳文との不一致部分と、問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信する問題表示・指定手段103を備えているからである。
更に、本実施の形態によれば、利用者自身が利用者辞書119に辞書データを登録する問題語句を選択することが可能になる。その理由は、辞書利用者端末2が、問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を利用者辞書作成装置1へ送信する登録候補選択手段22を備えているからである。
また、本実施の形態によれば、利用者辞書の作成に要する費用を利用者に明確に、且つ利用者が納得する形で提示することが可能になる。その理由は、各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、この算出した登録費用と問題語句とを対応付けて表示する登録候補費用表示画面700を利用者辞書作成装置1へ送信する登録候補・費用確定手段105を備えているからである。
〔第2の実施の形態の構成〕
次に、本発明にかかる利用者辞書作成システムの第2の実施の形態について説明する。本実施の形態は、問題語句の品詞だけでなく、機械翻訳文と参考翻訳文とに不一致部分が発生した要因(問題種別)も考慮して、利用者辞書への登録費用を算出することを特徴とする。
本実施の形態にかかる利用者辞書作成システムは、図1において、利用者辞書作成装置1の代わりに図15に示す利用者辞書作成装置1aを使用することにより実現される。
図15に示す本実施の形態で使用する利用者辞書作成装置1aと、図2に示した第1の実施の形態で使用する利用者辞書作成装置1との相違点は、問題個所分析手段102の代わりに問題個所分析手段102aを備えている点、問題難易度分析手段104の代わりに問題難易度分析手段104aを備えている点、登録候補・費用確定手段105の代わりに登録候補・費用確定手段105aを備えている点、機械翻訳辞書110の代わりに機械翻訳辞書110aを備えている点、問題DB115の代わりに問題種別DB115aを備えている点、辞書難易度DB116の代わりに辞書難易度DB116aを備えている点、および翻訳知識DB123が追加されている点である。
機械翻訳辞書110aは、単語辞書に加えて複合語辞書,構文辞書,語彙の関係を記述したパターン辞書やルール辞書を含む。翻訳知識DB123は、翻訳メモリなどを含む。
問題個所分析手段102aは、問題個所分析手段102が備えている機能に加え、機械翻訳文と参考翻訳文とに不一致部分が生じた要因(問題種別)を抽出する機能を有している。
辞書難易度DB116aには、問題語句の品詞に応じた難易度と、問題種別に応じた難易度とが登録されている。図16に辞書難易度DB116aの構成例を示す。同図に示すように、辞書難易度DB116aは、品詞部1161と、問題種別部1162とから構成されている。品詞部1161には、品詞に対応付けて難易度(品詞難易度)が登録され、問題種別部1162には、問題種別に対応付けて難易度(種別難易度)が登録されている。
問題難易度分析手段104aは、辞書難易度DB116aから各問題語句に対する品詞難易度,種別難易度を取得し、登録候補・費用確定手段105aに渡す機能を有する。
登録候補・費用確定手段105aは、各問題語句についての登録費用を、品詞難易度および種別難易度に基づいて算出する機能を有する。
なお、利用者辞書作成装置1aはコンピュータによって実現可能なものであり、コンピュータによって実現する場合には、例えば、次のようにする。コンピュータを利用者辞書作成装置1aとして機能させるためのプログラムを記録したディスク,半導体メモリ,その他の記録媒体を用意し、上記プログラムをコンピュータに読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、機械翻訳手段101、問題個所分析手段102a、問題表示・指定手段103、問題難易度分析手段104a、登録候補・費用確定手段105a、対訳辞書リスト作成手段106、辞書登録手段107、費用請求手段108、送受信手段109を実現する。
〔第2の実施の形態の動作〕
機械翻訳手段101は、辞書利用者端末2の利用者或いは辞書作成者端末3の作成者によって翻訳対象にする原文が指定されると、原文DB112或いは対訳DB114から指定された原文(テキスト文書)を取得し(図17のステップS120)、機械翻訳辞書110aを参照しながら機械翻訳文を生成する(ステップS121)。
機械翻訳手段101が、原文に対する機械翻訳文を生成すると、問題個所分析手段102aが、原文に対する参考翻訳文を取得する(ステップS122)。その後、問題個所分析手段102aは、機械翻訳手段101が生成した機械翻訳文と、ステップS122で取得した参考翻訳文との対応する部分とを比較することにより、不一致部分を抽出し(ステップS123)、更に、不一致部分に対応する問題語句,問題個所,品詞および問題種別を求める(ステップS124a)。図12に示したステップS124とステップS124aとの相違点は、問題種別を求めているか否かである。その後、問題個所分析手段102aは、原文,機械翻訳文,参考翻訳文,問題個所,問題語句,品詞および問題種別を対応付けて問題種別DB115aに登録する(ステップS125a)。図19に問題種別DB115aの内容例を示す。
ここで、ステップS124aにおいて、どのようにして問題種別を求めているのか、その一例について説明する。問題語句が名詞の場合は、問題種別を「訳語誤り」とする。問題語句が動詞の場合は、対応する訳語が異なっていれば「訳語誤り」とし、構文辞書、パターン辞書、ルール辞書,翻訳メモリから取得するSVOなどの文法情報と訳出された助詞「てにをは」の対応が間違っていれば「構文誤り」、各助詞が取り得る名詞に条件があれば「動詞パターン認定誤り」とする。問題語句が動詞慣用句の場合には、「慣用句認定誤り」とする。以上はあくまで一例であり、他の方法により、問題種別を決定しても良い。
問題個所分析手段102aが、問題種別DB115aに図19に示すような情報を格納すると、問題表示・指定手段103は、問題種別DB115aの内容に基づいて図20に示すような問題表示画面30aを作成し、辞書利用者端末2へ送信する(ステップS126)。問題表示画面30aと問題表示画面30との相違点は、問題種別が設定される問題種別部308が追加されている点である。
辞書利用者端末2内の登録候補選択手段22は、利用者辞書作成装置1aから送られてきた問題表示画面30aを表示部26に表示する。利用者は、問題表示画面30aに表示されている各問題語句の中から、利用者辞書119への登録候補とする問題語句を選択する(選択部307をチェックする)。登録候補選択手段22は、選択された問題語句を示す登録候補選択情報を利用者辞書作成装置1aへ送信する(ステップS127)。
利用者辞書作成装置1a内の問題表示・指定手段103は、辞書利用者端末2から登録候補選択情報が送られてくると、問題種別DB115aに登録されている各問題語句に関連する情報の内、利用者によって選択されたなかった問題語句に関する情報を削除する(ステップS128a)。この処理により、問題種別DB115a内には、利用者によって選択された問題語句に関する情報のみが残る。
その後、問題難易度分析手段104aが、辞書難易度DB116aを参照し、問題種別DB115aに登録されている各問題語句の品詞難易度および種別難易度を取得する(図18のステップS131,S132a)。その後、登録候補・費用確定手段105aが、問題難易度分析手段104aによって取得された各問題語句の品詞難易度および種別難易度と、単価DB117に登録されている単価とに基づいて、各問題語句毎に、利用者辞書119への登録費用を算出する(ステップS133a)。例えば、辞書難易度DB116a,単価DB117の内容が、それぞれ図16,図6に示すものであり、問題種別DB115aの内容が図19に示すものであるとすると、問題語句「wear」の登録費用は、登録費用=(品詞難易度+種別難易度)×単価=(3+2)×100=500円となる。なお、登録費用の算出方法は、これに限られるものではなく、更に、問題語句の出現頻度も考慮しても良い。即ち、登録費用=(品詞難易度+種別難易度)×出現頻度×単価とするようにしても良い。
その後、登録候補・費用確定手段105aは、図21に示すような登録候補費用表示画面2100を作成し、辞書利用者端末2へ送信する(ステップS134)。図21に示すように、登録候補費用表示画面2100は、データ番号部2101と、問題語句部2102と、品詞部2103と、品詞難易度部2104と、問題種別部2105と、種別難易度部2106と、合計難易度部2107と、登録費用部2108と、選択部2109とを備えている。データ番号部2101には、データ番号が設定される。問題語句部2102には、問題語句が設定される。品詞部2103には、問題語句の品詞が設定される。品詞難易度部2104には、問題語句の品詞難易度が設定される。問題種別部2105には、問題種別が設定される。種別難易度部2106には、種別難易度が設定される。合計難易度2107には、品詞難易度と種別難易度との合計値が設定される。登録費用部2108には、登録費用が設定される。選択部2109は、利用者が利用者辞書119に登録する問題語句を選択する際に使用する選択欄である。
辞書利用者端末2内の登録対象選択手段23は、利用者辞書作成装置1aから送られてきた登録候補費用表示画面2100を表示部26に表示する。利用者は、登録候補費用表示画面2100に表示されている問題語句の中から、登録費用を考慮して、利用者辞書119への登録対象にする問題語句を選択する(選択部2109をチェックする)。これにより、登録対象選択手段23は、選択された問題語句を示す登録対象選択情報を利用者辞書作成装置1aへ送信する(ステップS135)。
登録候補・費用確定手段105aは、辞書利用者端末2から登録対象選択情報が送られてくると、利用者によって選択された問題語句のデータ番号と、その語句の登録費用とを対応付けて課金情報DB118に登録する(ステップS136)。その後、登録候補・費用確定手段105aは、利用者が登録対象にした問題語句のデータ番号のリスト(登録対象リスト)を作成し、対訳辞書リスト作成手段106に渡す(ステップS137)。この後、図14のフローチャートに示した処理と同様の処理が行われ、利用者辞書作成装置1aに図22に示すような請求書が送られる。
〔第2の実施の形態の効果〕
本実施の形態は、第1の実施の形態が有している効果に加え、登録費用をきめ細かく設定することが可能になるという効果を有する。その理由は、問題語句の品詞だけでなく、機械翻訳文と参考翻訳文とに不一致部分が発生した要因(問題種別)も考慮して登録費用を算出する登録候補・費用確定手段105aを備えているからである。
本発明によれば、機械翻訳システムの利用者辞書開発ビジネスといった用途に適用できる。また、本発明によれば、機械翻訳システムの利用者知識DB開発ビジネスといった用途に適用できる。
本発明にかかる利用者辞書作成システムの第1の実施の形態の構成例を示すブロック図である。 利用者辞書作成装置1の構成例を示すブロック図である。 問題表示画面30の一例を示す図である。 問題DB115の一例を示す図である。 辞書難易度DB116の一例を示す図である。 単価DB117の一例を示す図である。 登録候補費用表示画面700の一例を示す図である。 対訳辞書リスト80の一例を示す図である。 請求書の一例を示す図である。 辞書利用者端末2の構成例を示すブロック図である。 辞書作成者端末3の構成例を示すブロック図である。 機械翻訳手段101,問題個所分析手段102,問題表示・指定手段103の処理例を示すフローチャートである。 問題難易度分析手段104,登録候補・費用確定手段105の処理例を示すフローチャートである。 対訳辞書リスト作成手段106,辞書登録手段107,費用請求手段108の処理例を示すフローチャートである。 本発明にかかる利用者辞書作成システムの第2の実施の形態で使用する利用者辞書作成装置1aの構成例を示すブロック図である。 辞書難易度DB116aの一例を示す図である。 機械翻訳手段101,問題個所分析手段102a,問題表示・指定手段103の処理例を示すフローチャートである。 問題難易度分析手段104a,登録候補・費用確定手段105a,対訳辞書リスト作成手段106,辞書登録手段107,費用請求手段108の処理例を示すフローチャートである。 問題種別DB115aの一例を示す図である。 問題表示画面30aの一例を示す図である。 登録候補費用表示画面2100の一例を示す図である。 請求書の一例を示す図である。
符号の説明
1,1a…利用者辞書作成装置
101…機械翻訳手段
102,102a…問題個所分析手段
103…問題表示・指定手段
104,104a…問題難易度分析手段
105,105a…登録候補・費用確定手段
106…対訳辞書リスト作成手段
107…辞書登録手段
108…費用請求手段
109…送受信手段
110,110a…機械翻訳辞書
111…利用者文書格納部
112…原文DB
113…訳文DB
114…対訳DB
115…問題DB
115a…問題種別DB
116,116a…辞書難易度DB
117…単価DB
118…課金情報DB
119…利用者辞書
120…辞書利用者DB
121…入力部
122…表示部
123…翻訳知識DB
2…辞書利用者端末
21…送受信手段
22…登録候補選択手段
23…登録対象選択手段
24…登録内容確認手段
25…入力部
26…表示部
3…辞書作成者端末
31…送受信手段
32…対訳辞書リスト作成支援手段
33…入力部
34…表示部
4…ネットワーク

Claims (26)

  1. 利用者辞書作成装置と、利用者端末とを含む利用者辞書作成システムであって、
    前記利用者辞書作成装置が、
    機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
    該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
    該問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を前記利用者端末へ送信する問題表示・指定手段とを備えたことを特徴とする利用者辞書作成システム。
  2. 請求項1記載の利用者辞書作成システムにおいて、
    前記利用者端末が、
    前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択手段を有し、且つ、
    前記利用者辞書作成装置が、
    前記登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
    該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする利用者辞書作成システム。
  3. 請求項1記載の利用者辞書作成システムにおいて、
    前記利用者端末が、
    前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択手段と、
    登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択手段とを備え、
    前記利用者辞書作成装置が、
    前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
    前記登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
    該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする利用者辞書作成システム。
  4. 請求項3記載の利用者辞書作成システムにおいて、
    前記登録候補・費用確定手段の代わりに、
    前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする利用者辞書作成システム。
  5. 請求項3または4記載の利用者辞書作成システムにおいて、
    前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする利用者辞書作成システム。
  6. 請求項1乃至5の何れか1項に記載した利用者辞書作成システムにおいて、
    前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする利用者辞書作成システム。
  7. 請求項1乃至5の何れか1項に記載した利用者辞書作成システムにおいて、
    前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする利用者辞書作成システム。
  8. 機械翻訳辞書を使用して原文を翻訳する機械翻訳手段と、
    該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段と、
    該問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信する問題表示・指定手段とを備えたことを特徴とする利用者辞書作成装置。
  9. 請求項8記載の利用者辞書作成装置において、
    前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
    該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする利用者辞書作成装置。
  10. 請求項8記載の利用者辞書作成装置において、
    前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段と、
    前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
    該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段とを備えたことを特徴とする利用者辞書作成装置。
  11. 請求項10記載の利用者辞書作成装置において、
    前記登録候補・費用確定手段の代わりに、
    前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段を備えたことを特徴とする利用者辞書作成装置。
  12. 請求項10または11記載の利用者辞書作成装置において、
    前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段を備えたことを特徴とする利用者辞書作成装置。
  13. 請求項8乃至12の何れか1項に記載した利用者辞書作成装置において、
    前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする利用者辞書作成装置。
  14. 請求項8乃至12の何れか1項に記載した利用者辞書作成装置において、
    前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする利用者辞書作成装置。
  15. 利用者辞書作成装置が、
    機械翻訳辞書を使用して原文を翻訳する機械翻訳ステップと、
    該機械翻訳ステップで前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析ステップと、
    該問題個所分析ステップで抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を前記利用者端末へ送信する問題表示・指定ステップとを実行することを特徴とする利用者辞書作成方法。
  16. 請求項15記載の利用者辞書作成方法において、
    前記利用者端末が、
    前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択ステップを実行し、且つ、
    前記利用者辞書作成装置が、
    前記登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成ステップと、
    該対訳辞書リスト作成ステップで作成された対訳辞書リストを利用者辞書に登録する辞書登録ステップとを実行することを特徴とする利用者辞書作成方法。
  17. 請求項15記載の利用者辞書作成方法において、
    前記利用者端末が、
    前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報を前記利用者辞書作成装置へ送信する登録候補選択ステップと、
    登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報を前記利用者辞書作成装置へ送信する登録対象選択ステップとを実行し、
    前記利用者辞書作成装置が、
    前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップと、
    前記登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成ステップと、
    該対訳辞書リスト作成ステップで作成された対訳辞書リストを利用者辞書に登録する辞書登録ステップとを実行することを特徴とする利用者辞書作成方法。
  18. 請求項17記載の利用者辞書作成方法において、
    前記登録候補・費用確定ステップの代わりに、
    前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定ステップを実行することを特徴とする利用者辞書作成方法。
  19. 請求項17または18記載の利用者辞書作成方法において、
    前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求ステップを実行することを特徴とする利用者辞書作成方法。
  20. 請求項15乃至19の何れか1項に記載した利用者辞書作成方法において、
    前記参考翻訳文が、前記原文に対して前記利用者が指示した翻訳文であることを特徴とする利用者辞書作成方法。
  21. 請求項15乃至19の何れか1項に記載した利用者辞書作成方法において、
    前記参考翻訳文が、翻訳メモリを利用して作成された翻訳文であることを特徴とする利用者辞書作成方法。
  22. コンピュータを、
    機械翻訳辞書を使用して原文を翻訳する機械翻訳手段、
    該機械翻訳手段で前記原文を翻訳した際の機械翻訳文と前記原文に対する参考翻訳文との不一致部分を抽出すると共に、該抽出した不一致部分に対応する前記原文中の語句を問題語句として抽出する問題個所分析手段、
    該問題個所分析手段が抽出した不一致部分と問題語句とを対応付けて表示する問題表示画面を利用者端末へ送信する問題表示・指定手段として機能させるためのプログラム。
  23. 請求項22記載のプログラムにおいて、
    前記コンピュータを、
    前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を示す登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段と、
    該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段として機能させるためのプログラム。
  24. 請求項22記載のプログラムにおいて、
    前記コンピュータを、
    前記利用者端末から前記問題表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録候補選択情報が送られてきたとき、該登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞に応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段、
    前記利用者端末から前記登録候補費用表示画面に表示されている問題語句の内の、利用者によって選択された問題語句を特定する登録対象選択情報が送られてきたとき、該登録対象選択情報によって特定される問題語句と、前記参考翻訳文中の前記問題語句と対応する語句とを含む対訳辞書リストを作成する対訳辞書リスト作成手段、
    該対訳辞書リスト作成手段で作成された対訳辞書リストを利用者辞書に登録する辞書登録手段として機能させるためのプログラム。
  25. 請求項24記載のプログラムにおいて、
    前記コンピュータを、
    前記登録候補・費用確定手段の代わりに、
    前記登録候補選択情報によって特定される各問題語句毎に、その問題語句の品詞と、その問題語句に対応する不一致部分が発生した要因とに応じた登録費用を算出し、該算出した登録費用と対応する問題語句とを表示する登録候補費用表示画面を前記利用者端末へ送信する登録候補・費用確定手段として機能させるプログラム。
  26. 請求項24または25記載のプログラムにおいて、
    前記コンピュータを、
    前記利用者辞書に登録した問題語句と、前記登録候補・費用確定手段で算出した前記問題語句に対する登録費用とを含む請求書を作成する費用請求手段として機能させるプログラム。
JP2004353790A 2004-12-07 2004-12-07 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム Pending JP2006163769A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004353790A JP2006163769A (ja) 2004-12-07 2004-12-07 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004353790A JP2006163769A (ja) 2004-12-07 2004-12-07 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2006163769A true JP2006163769A (ja) 2006-06-22

Family

ID=36665724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004353790A Pending JP2006163769A (ja) 2004-12-07 2004-12-07 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2006163769A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011016078A1 (ja) * 2009-08-04 2011-02-10 株式会社 東芝 機械翻訳装置および翻訳プログラム
CN117313754A (zh) * 2023-11-24 2023-12-29 深圳市贝铂智能科技有限公司 智能翻译方法、装置以及翻译机

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011016078A1 (ja) * 2009-08-04 2011-02-10 株式会社 東芝 機械翻訳装置および翻訳プログラム
US8655641B2 (en) 2009-08-04 2014-02-18 Kabushiki Kaisha Toshiba Machine translation apparatus and non-transitory computer readable medium
JP5525529B2 (ja) * 2009-08-04 2014-06-18 株式会社東芝 機械翻訳装置および翻訳プログラム
CN117313754A (zh) * 2023-11-24 2023-12-29 深圳市贝铂智能科技有限公司 智能翻译方法、装置以及翻译机
CN117313754B (zh) * 2023-11-24 2024-01-30 深圳市贝铂智能科技有限公司 智能翻译方法、装置以及翻译机

Similar Documents

Publication Publication Date Title
KR101099196B1 (ko) 적응형 기계 번역
US7383542B2 (en) Adaptive machine translation service
US5652896A (en) Language conversion system and text creating system using such
US5850561A (en) Glossary construction tool
JP5235344B2 (ja) 機械翻訳を行う装置、方法およびプログラム
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
JP2008152760A (ja) マシンアシスト翻訳ツール
US20200372209A1 (en) Automated electronic form generation
US20050171757A1 (en) Machine translation
JPH06508941A (ja) 機械翻訳兼遠隔通信装置
EP1969490A2 (en) A text editing apparatus and method
Blain et al. Qualitative analysis of post-editing for high quality machine translation
Glass et al. A naive salience-based method for speaker identification in fiction books
JP2006163769A (ja) 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム
KR101068073B1 (ko) 웹을 기반으로 한 번역 용어구축과 감수에 관한 협업 시스템
Love Benchmarking the performance of Two Automated Term-extraction systems: LOGOS and ATAO
JP2006163768A (ja) 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム
Bernth et al. Terminology extraction for global content management
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JPS62177627A (ja) 部品切り出しプログラム作成方法
JP2928246B2 (ja) 翻訳支援装置
JP2004021857A (ja) グループウェアにおけるユーザの対話支援装置
JPH045760A (ja) 自然語処理方法および自然語処理システム
JPWO2008123081A1 (ja) 文字データ処理方法、コンピュータプログラム及び文字データ処理システム