JP2004206307A - 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体 - Google Patents

辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP2004206307A
JP2004206307A JP2002373122A JP2002373122A JP2004206307A JP 2004206307 A JP2004206307 A JP 2004206307A JP 2002373122 A JP2002373122 A JP 2002373122A JP 2002373122 A JP2002373122 A JP 2002373122A JP 2004206307 A JP2004206307 A JP 2004206307A
Authority
JP
Japan
Prior art keywords
dictionary
information
update
conversion
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002373122A
Other languages
English (en)
Other versions
JP4398144B2 (ja
Inventor
Hidenobu Beppu
秀信 別府
Harumi Ito
晴美 伊藤
Tomohiro Miyahira
知博 宮平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2002373122A priority Critical patent/JP4398144B2/ja
Priority to US10/740,007 priority patent/US20040148381A1/en
Priority to CNA2003101230360A priority patent/CN1510595A/zh
Publication of JP2004206307A publication Critical patent/JP2004206307A/ja
Application granted granted Critical
Publication of JP4398144B2 publication Critical patent/JP4398144B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】端末に設けられた辞書を適切に更新する。
【解決手段】入力された変換元情報を変換先情報に変換する第1辞書を有する端末と、ネットワークを介して端末の第1辞書を更新させる更新処理サーバとを備えた辞書更新システムは、端末は、第1辞書を格納する第1辞書格納部と、第1辞書に基づき変換元情報を変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、変換処理情報を更新処理サーバに送信する変換処理情報送信部とを有し、更新処理サーバは、変換処理情報に基づいて、第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、辞書更新情報を端末に送信する辞書更新情報送信部とを有する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体に関する。特に本発明は、利用者の利用状況に応じて辞書を更新する辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体に関する。
【0002】
【従来の技術】
従来、機械翻訳システムにおいて、利用者は、翻訳の精度を向上させるために、新たな語句を辞書に追加することができる。しかし、利用者が新たな語句を辞書に追加する作業は煩雑であり、特に辞書が複数の分野に分割されている場合においては、適切な分野を選択するのは困難であった。そこで、例えば、特許文献1に提案されている機械翻訳システムは、利用者から指定された追加すべき語句に基づいて、追加先の辞書の種類を選択することにより、利用者の利便性を高めている。
【0003】
【特許文献1】
特開平10−269220号公報
【0004】
【発明が解決しようとする課題】
しかしながら、上記システムは利用者が自分でユーザー辞書に新たな語句を登録する際の補助を目的としており、利用者の使用履歴等に基づいて自動的にユーザー辞書に新たな語が追加されるわけではない。また、一般の機械翻訳システムでは分野辞書を追加インストールすることができるものもあるが、そのような場合であっても、どの分野辞書をインストールするかは利用者が明示的に指示する必要があり、自動的にインストールすべき辞書が選択されるわけではない。 そこで本発明は、上記の課題を解決することのできる辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体を提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
【0005】
【課題を解決するための手段】
即ち、本発明の第1の形態によると、入力された変換元情報を変換先情報に変換する第1辞書を有する端末と、ネットワークを介して端末の第1辞書を更新させる更新処理サーバとを備えた辞書更新システムであって、端末は、第1辞書を格納する第1辞書格納部と、第1辞書に基づき変換元情報を変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、変換処理情報を更新処理サーバに送信する変換処理情報送信部とを有し、更新処理サーバは、変換処理情報に基づいて、第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、辞書更新情報を端末に送信する辞書更新情報送信部とを有することを特徴とする辞書更新システム、当該更新処理サーバ、当該端末、当該辞書更新システムを制御する制御方法、当該辞書更新システムを実現するプログラム及び記録媒体を提供する。
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションも又発明となりうる。
【0006】
【発明の実施の形態】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、又実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0007】
図1は、辞書更新システム10の機能ブロック図を示す。辞書更新システム10は、入力された変換元情報を変換先情報に変換する第1辞書を有する端末100と、ネットワーク20を介して端末100の第1辞書を更新させる更新処理サーバ200とを備える。端末100は、例えば、PDAなどの携帯通信端末であり、無線通信網及びインターネットを含むネットワーク20を介して更新処理サーバ200と接続されている。端末100は、HTTPやFTP等のプロトコルにより更新処理サーバ200と通信してもよいし、電子メール等の手段により更新処理サーバ200と通信してもよい。これに代えて、端末100は、ネットワーク20として、USB等のI/Oポート接続を介して、更新処理サーバ200と接続されてもよい。
端末100は、機械翻訳などに代表される語句の変換処理に用いられる第1辞書を有している。そして、端末100は、利用者からの指示に応じて第1辞書を用いた翻訳を行い、翻訳の結果を示す変換処理情報、例えば、翻訳に失敗した場合の翻訳対象の語句等を格納する。更新処理サーバ200は、変換処理情報に応じて、第1辞書を更新し、以降の翻訳精度を高めることができる。
【0008】
端末100は、第1辞書格納部110と、翻訳部120と、変換処理情報格納部130と、変換処理情報送信部140とを有する。第1辞書格納部110は、第1言語で記述された変換元情報を、第2言語で記述された変換先情報に翻訳する第1辞書を格納する。これに代えて、第1辞書格納部110は、第1辞書として、かなで記述された変換元情報を、漢字を含む変換先情報に変換するかな漢字変換の辞書を格納してもよい。第1言語とは、例えば英語であり、第2言語とは、例えば日本語である。この場合、第1辞書格納部110は、英和翻訳を行う第1辞書を格納する。これに代えて、第1辞書とは、和英辞書であってもよいし、そのほかの複数の言語間の翻訳を行うための辞書であってもよい。
そして、第1辞書格納部110は、第1辞書を更新する辞書更新情報を、辞書更新情報送信部240から受け取り、当該辞書更新情報に応じて第1辞書を更新する。辞書更新情報とは、例えば、第1辞書に新たに追加する変換元情報及び変換先情報の組合せである。
【0009】
翻訳部120は、変換元情報を第1辞書に基づいて変換先情報に翻訳する。翻訳部120は、変換元情報を第1辞書に基づいてかな漢字変換し、変換先情報を生成してもよい。そして、翻訳部120は、翻訳する処理中に得られる変換処理情報を、変換処理情報格納部130に送る。変換処理情報とは、翻訳の結果生じたログ情報であり、代表的には、第1辞書に登録されていないために翻訳できなかった変換元情報である。変換処理情報格納部130は、変換処理情報を翻訳部120から受け取り、変換処理情報送信部140に送る。変換処理情報送信部140は、受け取った変換処理情報をネットワーク20を介して辞書更新情報生成部230に送る。
【0010】
変換処理情報を送信するタイミングとしては、例えば、変換処理情報送信部140は、利用者からの指示を受けた時に変換処理情報を送る。これに代えて、変換処理情報送信部140は、変換処理情報格納部130内の変換処理情報が更新される毎に変換処理情報を送ってもよいし、予め定められた時間毎に定期的に変換処理情報を送ってもよいし、端末100内に設けられた電池の充電を開始する毎に変換処理情報を送ってもよいし、外部と通信するための接続装置(クレードル等)に接続された場合に変換処理情報を送ってもよい。
【0011】
更新処理サーバ200は、第2辞書格納部210と、翻訳部220と、容量管理部225と、辞書更新情報生成部230と、辞書更新情報送信部240とを有する。第2辞書格納部210は、変換元情報から変換先情報を生成する第2辞書を格納する。翻訳部220は、辞書更新情報生成部230から受け取った変換元情報を、第2辞書格納部210から取得した第2辞書を用いて翻訳し、翻訳の確からしさを示す確信度を当該変換元情報に対応付けて辞書更新情報生成部230に出力する。
【0012】
容量管理部225は、端末100に設けられた記憶装置の空き容量を示す空き容量情報を管理し、辞書更新情報生成部230に送る。例えば、容量管理部225は、空き容量情報を定期的に端末100から受け取ってもよいし、更新処理サーバ200から端末100に送信されたデータのサイズに基づいて推定される空き容量を空き容量情報として算出してもよい。
【0013】
辞書更新情報生成部230は、変換処理情報送信部140から受け取った変換処理情報に基づいて、第1辞書を更新する辞書更新情報を第2辞書格納部210から選択することにより生成する。例えば、辞書更新情報生成部230は、変換処理情報に含まれる変換元情報を翻訳部220に翻訳させ、翻訳部220による翻訳に用いられたデータを第2辞書格納部210から選択し、第1辞書に追加する辞書更新情報として生成する。更に、辞書更新情報生成部230は、容量管理部225から受け取った空き容量情報に基づいて、第1辞書の一部を削除する旨の削除指示を辞書更新情報として生成してもよい。そして、辞書更新情報生成部230は、生成した辞書更新情報を辞書更新情報送信部240に送る。辞書更新情報送信部240は、受け取った辞書更新情報をネットワーク20を介して第1辞書格納部110に送る。
なお、辞書更新情報は、第1辞書に追加する情報に加え、既に第1辞書格納部110に格納されている第1辞書を含んでもよい。この場合、辞書更新情報生成部230は、第1辞書に追加する情報及び既に第1辞書格納部110に格納されている第1辞書の双方を、第1辞書を更新する辞書更新情報として生成する。即ち、第1辞書格納部110は、受け取った辞書更新情報を単に第1辞書と置き換えることにより、第1辞書を更新することができるので、端末100側での処理を簡素化することが出来る。
【0014】
図2は、第1辞書格納部110及び第2辞書格納部210の一例を示し、図2(a)は、第1辞書格納部110に格納される第1辞書を示す。第1辞書格納部110は、第1辞書として複数の第1部分辞書、例えば、基本辞書118、コンピュータ部分辞書112、料理部分辞書114、及びペット部分辞書116を格納している。また、図2(b)は、第2辞書格納部210に格納される第2辞書を示す。第2辞書格納部210は、第2辞書として、複数の第1部分辞書のそれぞれに対応付けられた複数の第2部分辞書、例えば、基本辞書218、コンピュータ部分辞書212、料理部分辞書214、及びペット部分辞書216を格納している。基本辞書118及び基本辞書218のそれぞれは、例えば、代名詞、基本的な動詞、及び基本的な単語・複合語・文法ルールを格納している。
【0015】
基本辞書218、コンピュータ部分辞書212、料理部分辞書214、及びペット部分辞書216のそれぞれは、基本辞書118、コンピュータ部分辞書112、料理部分辞書114、及びペット部分辞書116のそれぞれと同一の分野の語句を格納してもよいし、同一の識別情報に対応付けられていてもよい。例えば、コンピュータ部分辞書212及びコンピュータ部分辞書112のそれぞれは、コンピュータ分野の語句を格納しているコンピュータ分野辞書である。また、識別情報の例として、コンピュータ部分辞書212及びコンピュータ部分辞書112のそれぞれは、「コンピュータ」という分野名称に対応付けられて格納されていてもよいし、コンピュータ分野辞書である旨を示す識別番号、例えば「0001」に対応付けられて格納されていてもよい。即ち、辞書更新情報生成部230は、分野名称又は識別番号を検索することにより、第2部分辞書及び第1部分辞書の対応付けを容易に認識することが出来る。
【0016】
また、第2辞書は、第1辞書を含んでおり、基本辞書218、コンピュータ部分辞書212、料理部分辞書214、及びペット部分辞書216のそれぞれは、基本辞書118、コンピュータ部分辞書112、料理部分辞書114、及びペット部分辞書116のそれぞれを包含していてもよい。例えば、コンピュータ部分辞書112は、コンピュータ部分辞書212に格納されたコンピュータ分野の語句のうち、使用頻度が高い基本的な語句のみを選択することによって作成される。
【0017】
このように、第2辞書格納部210に格納される第2部分辞書は、第1辞書格納部110に格納される第1部分辞書に対応付けられている。従って、後述する辞書更新情報生成部230は、第1部分辞書に対応付けられた第2部分辞書を適切に選択できる。例えば、辞書更新情報生成部230は、図3(c)の説明において後述するように、一の第1部分辞書の使用頻度が所定頻度より高い場合に、この一の第1部分辞書に対応付けられた第2部分辞書を適切に選択し、第1辞書に追加させることができる。
なお、辞書を複数の部分辞書に分類する形態は、本図に示したものに限定されない。例えば、第1辞書格納部110は、使用頻度の高低により分類された複数の第1部分辞書を格納してもよい。
【0018】
図3は、変換処理情報格納部130の一例を示す。図3(a)において、変換処理情報格納部130は、第1辞書により変換できなかった変換元情報である未知語を変換処理情報として格納する。翻訳部120は、翻訳処理の過程で未知語を検出した場合に、本図で示すように、変換処理情報として未知語を変換処理情報格納部130に格納する。この場合、辞書更新情報生成部230は、辞書更新情報として、未知語に対応する変換先情報を第2辞書から選択し送信させる。従って、第1辞書格納部110は、未知語に対応する変換先情報を第1辞書に追加するので、未知語として検出された語句を、以降の翻訳処理において適切に翻訳させることができる。
【0019】
図3(b)において、変換処理情報格納部130は、変換元情報である翻訳対象の文章を、翻訳結果の確信度に対応付けて格納する。翻訳の確信度とは、翻訳の確からしさの目安を表す数値であり、算出方法の一例については、図6にて後述する。翻訳部120は、翻訳対象の文章を翻訳する毎に、翻訳対象の文章を、翻訳の確信度に対応付けて変換処理情報格納部130に順次格納する。そして、翻訳部220は、受け取った翻訳対象の文章を、第2辞書を用いて翻訳し、翻訳の確信度を辞書更新情報生成部230に出力する。辞書更新情報生成部230は、翻訳対象の文章に対応付けて変換処理情報送信部140から受け取った確信度が、翻訳部220により翻訳された場合の確信度を下回る場合に、翻訳部220による翻訳に用いられた情報を第2辞書から選択し、辞書更新情報として第1辞書格納部110に送る。これを受けて、第1辞書格納部110は、より確信度の高い翻訳を行うための情報を第1辞書に追加することができる。
【0020】
図3(c)において、変換処理情報格納部130は、複数の第1部分辞書のそれぞれを識別する第1部分辞書識別情報に対応付けて、当該第1部分辞書の分野を示す分野識別情報及び当該第1部分辞書の使用頻度を格納する。使用頻度とは、例えば、第1部分辞書を以前に更新してから現在までの使用回数である。これに代えて、使用頻度は、予め定められた期間内に使用された回数であってもよい。第1部分辞書の使用回数とは、例えば、第1部分辞書に格納された語句を翻訳に用いた回数でもよいし、第1部分辞書を用いて翻訳した文の数であってもよい。
【0021】
また、翻訳部120が、それぞれに使用優先順位を対応付けた複数の第1部分辞書を翻訳に用いる形態においては、以下のように算出された回数を使用頻度としてもよい。翻訳部120は、複数の第1部分辞書を、使用優先順位に応じて使い分ける、例えば、使用優先順位の高い一の第1部分辞書と、使用優先順位の低い他の第1部分辞書との双方に、同一の変換元情報が登録されていた場合に、使用優先順位の高い一の第1部分辞書に基づいた変換先情報を翻訳結果とする。ここで、翻訳部120は、翻訳の精度を向上させるために、翻訳結果及び利用者からの指示等に応じて、翻訳対象の文毎に使用優先順位を変更する。この場合、翻訳部120は、一の第1部分辞書の使用優先順位が全ての第1部分辞書の中で最高であった場合に翻訳された文の数を、当該一の第1部分辞書の使用頻度として変換処理情報格納部130に格納する。
【0022】
図4は、辞書更新システム10の動作フローを示す。翻訳部120は、入力された変換元情報を、第1辞書を用いて変換先情報に翻訳する(S100)。そして、翻訳部120による翻訳結果に応じて、変換処理情報格納部130は、第1辞書により変換できなかった変換元情報の一例である未知語を変換処理情報として格納する(S110)。変換処理情報格納部130は、翻訳の確信度が予め定められた基準確信度より低い場合に、当該確信度に対応する当該変換元情報、例えば翻訳対象の文を、確信度に対応付けて変換処理情報として格納する(S120)。これに代えて、変換処理情報格納部130は、確信度の低い順に予め定められた数の変換元情報を選択して格納してもよいし、変換処理情報格納部130の容量に空きがある場合においては、全ての変換元情報を格納してもよい。
続いて、変換処理情報格納部130は、複数の第1部分辞書のそれぞれの使用頻度を、第1部分辞書のそれぞれを識別する情報に対応付けて変換処理情報として格納する(S130)。
【0023】
変換処理情報送信部140は、第1辞書の更新処理を開始する旨の更新指示を利用者から受け取っていない場合に(S140:NO)、S100に処理を戻す。一方、変換処理情報送信部140は、更新指示を利用者から受け取った場合に(S140:YES)、変換処理情報格納部130内に格納された全ての変換処理情報を取得し、辞書更新情報生成部230に送信する(S150)。
【0024】
辞書更新情報生成部230は、変換処理情報を変換処理情報送信部140から受け取る(S200)。そして、辞書更新情報生成部230は、変換処理情報として未知語を受け取った場合に、未知語に対応する変換先情報を、第2辞書から選択することにより辞書更新情報を生成する(S210)。例えば、辞書更新情報生成部230は、変換処理情報として未知語である英単語「resentence」を受け取った場合に、未知語に対応する変換先情報として、「再判決を下す」という動詞と、「再判決」という名詞の双方を、辞書更新情報として生成する。更に、辞書更新情報生成部230は、未知語を含む複合語の変換先情報を、第2辞書から選択することにより辞書更新情報を生成する。例えば、英単語「toxicity」が未知語であった場合には、辞書更新情報生成部230は、「acute toxicity」及び「toxicity equivalency factor」等の複合語の変換先情報を、辞書更新情報として生成する。
【0025】
また、辞書更新情報生成部230は、変換処理情報として、基準確信度より小さい確信度の変換元情報を受け取った場合に、当該変換元情報に基づいて辞書更新情報を生成する(S220)。また、辞書更新情報生成部230は、変換処理情報として、第1部分辞書を識別する識別情報に対応付けられた使用頻度を受け取った場合に、当該使用頻度に基づいて辞書更新情報を生成する(S230)。そして、辞書更新情報送信部240は、生成された辞書更新情報を第1辞書格納部110に送る(S240)。更新処理サーバ200は、変換処理情報を受信するたびに上記の一連の処理を繰り返す。
【0026】
第1辞書格納部110は、第1辞書を更新する辞書更新情報を更新処理サーバ200から受け取った場合に、当該辞書更新情報に基づき、第1辞書を更新する(S160)。例えば、第1辞書格納部110は、未知語に対応する変換先情報を受け取った場合には、当該変換先情報を第1辞書に追加する。また、第1辞書格納部110は、S120において生成した確信度に応じた辞書更新情報を更新処理サーバ200から受け取った場合には、当該辞書更新情報に含まれる語句を第1辞書に追加する。また、第1辞書格納部110は、予め定められた第1頻度より高い使用頻度を有する一の第1部分辞書に対応付けられた第2部分辞書を更新処理サーバ200から受信した場合には、当該第2部分辞書を第1辞書に追加する。
【0027】
そして、変換処理情報送信部140は、変換処理情報を更新処理サーバ200に送信した場合に、変換処理情報格納部130に格納されている変換処理情報を削除する(S170)。変換処理情報送信部140は、変換処理情報を送信(S150)した後、かつ第1辞書を更新(S160)する前に、変換処理情報を削除してもよい。しかしながら、変換処理情報送信部140は、辞書の更新が適切に行われたことを確認するまで変換処理情報を保持するために、第1辞書が更新された後に変換処理情報を削除するのが望ましい。
【0028】
図5は、図4に示したS120の詳細を示す。翻訳部120は、変換元情報における翻訳の確信度を計算する(S1210)。例えば、翻訳部120は、翻訳の確信度を、確信度が最も高いことを示す100%から、確信度が最も低いことを示す0%までの数値で計算する。そして、変換処理情報格納部130は、変換元情報における翻訳の確信度が、予め定められた基準確信度より低い場合に(S1220:YES)、当該変換元情報を確信度に対応付けて格納する(S1230)。
【0029】
図6は、確信度を算出する一例、即ち、図5のS1210の詳細を示す。翻訳部120は、英日翻訳において、英文600「I can play」を日本語文610「私は遊ぶことができる」に翻訳する場合に、翻訳の確信度を100%と算出する。一方、翻訳部120は、英文600「I can play」を日本語文620「私は遊びを缶詰にする」に翻訳する場合に、翻訳の確信度を10%と算出する。確信度の算出過程を以下に示す。なお、翻訳部220が確信度を出力する処理も、本図で説明する処理と略同一であるので説明を省略する。
【0030】
まず、各英単語に対応付けて、当該英単語が用いられる品詞毎に、使用頻度の低さを示すコストが予め定められている。例えば、英単語「can」が助動詞として用いられる場合のコストは5であり、動詞として用いられる場合のコストは400である。本図において、上記のコストを、各品詞名の直後の括弧内に示した。同様に、各句を構成する規則に対しても予めコストが対応付けられている。例えば、助動詞と動詞を動詞句としてまとめる規則のコストは18である。
【0031】
翻訳部120は、翻訳対象の英文600を受け取ると、分解可能な全ての組合せにより英文600を品詞分解する。そして、分解された複数の品詞について、文法規則によって可能な全ての組合せにより句を生成する。翻訳部120は、このように解析された全ての文のそれぞれについて、合計のコストを計算する。例えば、英文600を日本語文610に翻訳する場合のコストは、式「5+5+5+18+18+18」により69と計算される。一方、英文600を日本語文620に翻訳する場合のコストは、式「5+400+5+18+80+18+18」により544と計算される。そして、翻訳部120は、全ての文の中から最小のコストを有する文を選択する等の方法で、変換先情報を生成する。
【0032】
翻訳部120は、変換先情報の生成に用いられたコストから、以下のような条件に基づき、翻訳の確信度を算出する。
条件1.コストが150以下の場合、確信度は100%
条件2.解析不能(構文解析の失敗等)であった場合、確信度は0%
条件3.それ以外の場合、確信度は、100%から(コスト÷単語数)を減じた値。ただし、10%を最低とする。
従って、翻訳部120は、日本語文610の確信度を端末100%と、日本語文620の確信度を10%とそれぞれ計算する。以上で説明したコスト付けや確信度の計算方法は一例であり、複数の翻訳結果の中から最も確からしい結果を選択する他の処理方法に置き換えることも出来る。
【0033】
図7は、S220の詳細を示す。辞書更新情報生成部230は、変換処理情報として、基準確信度より小さい確信度の変換元情報を変換処理情報送信部140から受け取った場合に、変換元情報の一例である翻訳対象の文を、翻訳部220に送信する。これを受けて、翻訳部220は、第2辞書を用いて文を翻訳する(S2210)。そして、翻訳部220は、図6で説明した方法により、翻訳の確信度を算出し出力する(S2220)。辞書更新情報生成部230は、変換元情報に対応付けて端末100から受け取った確信度が、翻訳部220により翻訳された場合の確信度を下回る場合に(S2230:YES)、翻訳部220による変換元情報の翻訳に用いられた情報を第2辞書から選択し(S2240)、辞書更新情報として生成する(S2250)。例えば、辞書更新情報生成部230は、翻訳部220による変換元情報の翻訳に用いられた情報の中で、翻訳に用いた語句を含む複合語のデータや、構文解析で用いた句をまとめる規則のデータを、第2部分辞書から選択して辞書更新情報として生成する。
【0034】
図8は、図4に示したS230の詳細の一例を示す。辞書更新情報生成部230は、一の第1部分辞書の使用頻度が、予め定められた第1頻度より高いか否かを判断する(S2320)。一の第1部分辞書の使用頻度が、第1頻度より高い場合に(S2320:YES)、辞書更新情報生成部230は、一の第1部分辞書に対応する第2部分辞書を辞書更新情報として生成する(S2330)。他の例として、辞書更新情報生成部230は、空き容量情報が示す空き容量が、予め定められた容量より小さいか否かを判断してもよい。この場合、空き容量が、予め定められた容量より小さい場合に、辞書更新情報生成部230は、辞書更新情報を生成しなくてもよい。そして、辞書更新情報生成部230は、全ての第1部分辞書について使用頻度を調べ終わった場合に(S2335:YES)、処理を終了する。全ての第1部分辞書について未だ使用頻度を調べ終わっていない場合に(S2335:NO)、辞書更新情報生成部230は、S2320に処理を戻し、他の第1部分辞書について同様に処理させる。
【0035】
一方、一の第1部分辞書の使用頻度が、第1頻度より高くない場合に(S2320:NO)、辞書更新情報生成部230は、当該一の第1部分辞書の使用頻度が、予め定められた第2頻度より低いか否かを判断する(S2340)。一の第1部分辞書の使用頻度が第2頻度より低くない場合に(S2340:NO)、辞書更新情報生成部230は、S2335に処理を移す。一の第1部分辞書の使用頻度が第2頻度より低い場合に(S2340:YES)、辞書更新情報生成部230は、空き容量情報が示す空き容量が、予め定められた容量より小さいか否かを判断する(S2350)。空き容量が、予め定められた容量以上である場合に(S2350:NO)、辞書更新情報生成部230は、S2335に処理を移す。空き容量が、予め定められた容量より小さいことを条件として(S2350:YES)、辞書更新情報生成部230は、当該一の第1部分辞書を削除する旨を示す削除指示を辞書更新情報として生成し、S2335に処理を移す。
【0036】
図9は、本実施形態の変形例における辞書更新システム10の機能ブロック図を示す。本変形例における端末100は、図1に示した端末100に加えて、更に、電子メール送信部150を有する。辞書更新システム10が備える他の構成については図1における辞書更新システム10と略同一であるので、相違点のみを説明する。
【0037】
電子メール送信部150は、変換元情報を翻訳した変換先情報を翻訳部120から受け取り、利用者等の指示に応じて、変換先情報を電子メールとして外部の端末に送信する。電子メール送信部150は、更に、この電子メールを変換処理情報格納部130に送ると伴に、電子メールを送信した旨を変換処理情報送信部140に通知する。変換処理情報格納部130は、電子メールを、変換処理情報として格納する。
【0038】
そして、変換処理情報送信部140は、電子メールを送信した旨の通知を受け取る毎に、即ち、電子メール送信部150により電子メールが送信される毎に、電子メールを含む変換処理情報を変換処理情報格納部130から取得し電子メールとして辞書更新情報生成部230に送る。例えば、変換処理情報送信部140は、電子メールの宛先(TO欄)として、利用者から入力された電子メールの受取人を指定し、電子メールのカーボンコピーの宛先(CC欄)として、更新処理サーバ200に対応付けられたメールアドレスを指定する。そして、辞書更新情報生成部230は、受け取った電子メールに基づいて辞書更新情報を作成し、第1辞書格納部110に送信する。
なお、変換処理情報送信部140は、電子メール中の文章における複数の語句間の語順を入れ替えることにより変換処理情報を生成することが望ましい。ネットワーク20が、不特定多数により共用されるオープンネットワークである場合や、更新処理サーバ200が、不特定多数により利用されるASPサーバである場合であっても、電子メールの内容を盗聴されることを防止できるからである。更に、更新処理サーバ200は、語順が入れ替えられた電子メールの文章を受け取った場合であっても、語句の出現頻度等を適切に認識することが出来る。すなわち、更新処理サーバ200は、暗号の復号処理等の追加処理を行うことなく、内容の秘匿性をある程度保ちつつ、変換処理情報を受信することが出来る。
【0039】
このように、端末100は、利用者が翻訳により作成した電子メールを送信する毎に、当該電子メールを更新処理サーバ200に送る。従って、端末100の利用者は、第1辞書を更新させるために煩雑な操作を行うことなく、第1辞書を更新させることができる。
【0040】
図10は、変形例における辞書更新システム10の動作フローを示す。本変形例における動作フローは、図4に示した動作フローのS140に代えて、S180を有する。その他の構成については、図3に示した動作フローと略同一であるので、相違点のみを説明する。
【0041】
電子メール送信部150は、利用者からメール送信指示を受け取ったか否かを判断する(S180)。メール送信指示を受け取った場合に(S180:YES)、変換処理情報送信部140は、翻訳により生成された電子メールを更新処理サーバ200に送る(S150)。変換処理情報送信部140は、更に、変換処理情報格納部130に格納されている変換処理情報を更新処理サーバ200に送ってもよい。
【0042】
図11は、本実施形態及び変形例に係る更新処理サーバ200のハードウェア構成の一例を示す。本実施形態に係る更新処理サーバ200は、ホストコントローラ1082により相互に接続されるCPU1000、RAM1020、グラフィックコントローラ1075、及び表示装置1080を有するCPU周辺部と、入出力コントローラ1084によりホストコントローラ1082に接続される通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を有する入出力部と、入出力コントローラ1084に接続されるROM1010、フレキシブルディスクドライブ1050、及び入出力チップ1070を有するレガシー入出力部とを備える。
【0043】
ホストコントローラ1082は、RAM1020と、高い転送レートでRAM1020をアクセスするCPU1000及びグラフィックコントローラ1075とを接続する。CPU1000は、ROM1010及びRAM1020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィックコントローラ1075は、CPU1000等がRAM1020内に設けたフレームバッファ上に生成する画像データを取得し、表示装置1080上に表示させる。これに代えて、グラフィックコントローラ1075は、CPU1000等が生成する画像データを格納するフレームバッファを、内部に含んでもよい。
【0044】
入出力コントローラ1084は、ホストコントローラ1082と、比較的高速な入出力装置である通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を接続する。通信インターフェイス1030は、ネットワークを介して他の装置と通信する。ハードディスクドライブ1040は、更新処理サーバ200が使用するプログラム及びデータを格納する。CD−ROMドライブ1060は、CD−ROM1095からプログラム又はデータを読み取り、入出力コントローラ1084を介してRAM1020に提供する。
【0045】
また、入出力コントローラ1084には、ROM1010と、フレキシブルディスクドライブ1050や入出力チップ1070等の比較的低速な入出力装置とが接続される。ROM1010は、更新処理サーバ200の起動時にCPU1000が実行するブートプログラムや、更新処理サーバ200のハードウェアに依存するプログラム等を格納する。フレキシブルディスクドライブ1050は、フレキシブルディスク1090からプログラム又はデータを読み取り、入出力コントローラ1084を介してRAM1020に提供する。入出力チップ1070は、フレキシブルディスク1090や、例えばパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して各種の入出力装置を接続する。
【0046】
更新処理サーバ200に提供されるプログラムは、フレキシブルディスク1090、CD−ROM1095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、入出力コントローラ1084を介して更新処理サーバ200にインストールされ、更新処理サーバ200において実行される。
【0047】
更新処理サーバ200にインストールされて実行されるプログラムは、第1辞書格納モジュールと、翻訳モジュールと、変換処理情報格納モジュールと、変換処理情報送信モジュールと、電子メール送信モジュールとを含む。各モジュールが更新処理サーバ200に働きかけて行わせる動作は、図1から図10において説明した更新処理サーバ200における、対応する部材の動作と同一であるから、説明を省略する。
【0048】
以上に示したプログラム又はモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク1090、CD−ROM1095の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを更新処理サーバ200に提供してもよい。
【0049】
図12は、本実施形態及び変形例に係る端末100のハードウェア構成の一例を示す。端末100が備える部材は、図11における同一符号の各部材と略同一であるので、相違点のみを説明する。端末100は、ハードディスクドライブ1040、CD−ROMドライブ1060、及びフレキシブルディスクドライブ1050を備えなくともよい。端末100は、図11に示した構成に加え、更にICカードスロット1055を備えてもよい。端末100は、更に、通信インターフェイス1030に接続された無線通信部を備えてもよい。端末100を実現するプログラムは、記録媒体に格納され端末100に提供されてもよいし、更新処理サーバ200からネットワークを介してインストールされてもよい。端末100にインストールされて実行されるプログラムは、第2辞書格納モジュールと、翻訳モジュールと、容量管理モジュールと、辞書更新情報生成モジュールと、辞書更新情報送信モジュールとを含む。各モジュールが端末100に働きかけて行わせる動作は、図1から図10において説明した端末100における、対応する部材の動作と同一であるから、説明を省略する。
【0050】
以上に示したプログラム又はモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク、CD−ROMの他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード1092等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを端末100に提供してもよい。
【0051】
以上の説明から明らかなように、辞書更新システム10は、翻訳の処理結果を示す変換処理情報に基づいて、端末100内の第1辞書を自動的に更新することができる。例えば、利用者が翻訳処理又はメール送信処理のみを行わせている場合であっても、辞書更新システム10は、端末100内の第1辞書を、更新処理サーバ200内の第2辞書を用いて更新し、以降の翻訳精度を高めることができる。
【0052】
また、辞書更新システム10は、端末100の利用者に応じて適切に第1辞書をカスタマイズすることができる。特に、辞書更新システム10は、利用者が翻訳を行わせる毎に、変換処理情報を生成することにより第1辞書を更新するので、利用者が第1辞書を用いた翻訳を繰り返す毎に、翻訳精度を高めることができる。
【0053】
従って、端末100がPDA等の携帯通信端末等であり、比較的小さい記憶領域に第1辞書を格納する場合であっても、辞書更新システム10は、第1辞書を随時更新することにより、翻訳の精度を高めることができる。即ち、翻訳の精度を下げることなく、端末100の記憶領域を小さくできるので、端末100の小型化及び低消費電力化を実現できる。
【0054】
以上で説明した実施形態によれば、以下に示す辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体を実現することができる。
(項目1) 入力された変換元情報を変換先情報に変換する第1辞書を有する端末と、ネットワークを介して前記端末の前記第1辞書を更新させる更新処理サーバとを備えた辞書更新システムであって、前記端末は、前記第1辞書を格納する第1辞書格納部と、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、前記変換処理情報を前記更新処理サーバに送信する変換処理情報送信部とを有し、前記更新処理サーバは、前記変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、前記辞書更新情報を前記端末に送信する辞書更新情報送信部とを有することを特徴とする辞書更新システム。
(項目2) 前記更新処理サーバは、変換元情報を変換先情報に変換する第2辞書を格納する第2辞書格納部を更に有し、前記辞書更新情報生成部は、前記変換処理情報に基づいて、前記第1辞書に追加すべき情報を前記第2辞書から選択し、前記辞書更新情報として生成することを特徴とする項目1記載の辞書更新システム。
【0055】
(項目3) 前記第1辞書格納部は、第1言語で記述された前記変換元情報を、第2言語で記述された前記変換先情報に翻訳する前記第1辞書を格納し、前記変換処理情報格納部は、前記変換処理情報として、前記変換元情報を、翻訳結果の確信度に対応付けた情報を格納し、前記更新処理サーバは、受け取った前記変換元情報を、前記第2辞書を用いて翻訳し、翻訳の確信度を出力する翻訳部を更に有し、前記辞書更新情報生成部は、前記変換元情報に対応付けて受け取った前記確信度が、前記翻訳部により翻訳された場合の確信度を下回る場合に、前記翻訳部による前記変換元情報の翻訳に用いられた情報を前記第2辞書から選択し、前記辞書更新情報として生成することを特徴とする項目2記載の辞書更新システム。
(項目4) 前記変換処理情報格納部は、前記変換元情報における翻訳の前記確信度が、予め定められた基準確信度より低い場合に、当該変換元情報を格納することを特徴とする項目3記載の辞書更新システム。
(項目5) 前記変換処理情報格納部は、前記第1辞書により変換できなかった前記変換元情報を、前記変換処理情報として格納し、前記辞書更新情報生成部は、前記辞書更新情報として、前記変換処理情報に対応する変換先情報を、前記第2辞書から選択することを特徴とする項目2記載の辞書更新システム。
【0056】
(項目6) 前記辞書更新情報生成部は、更に、前記変換処理情報を含む複合語の変換先の情報を、前記第2辞書から選択することを特徴とする項目5記載の辞書更新システム。
(項目7) 前記第1辞書格納部は、前記第1辞書として複数の第1部分辞書を格納し、前記変換処理情報格納部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として格納し、前記変換処理情報送信部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として前記更新処理サーバに送信し、前記第2辞書格納部は、前記第2辞書として、前記複数の第1部分辞書のそれぞれに対応付けられた複数の第2部分辞書を格納し、前記辞書更新情報生成部は、一の第1部分辞書の前記使用頻度が予め定められた第1頻度より高い場合に、前記一の第1部分辞書に対応する一の前記第2部分辞書を、前記辞書更新情報として生成することを特徴とする項目2記載の辞書更新システム。
(項目8) 前記第2辞書は、前記第1辞書を含み、前記辞書更新情報生成部は、他の前記第1部分辞書の前記使用頻度が予め定められた第2頻度より低い場合に、前記他の第1部分辞書を削除する旨の削除指示を前記辞書更新情報として生成することを特徴とする項目7記載の辞書更新システム。
【0057】
(項目9) 前記更新処理サーバは、前記端末に設けられた記憶装置の空き容量を示す容量情報を管理する容量管理部を更に有し、前記辞書更新情報生成部は、前記空き容量情報が示す空き容量が、予め定められた容量より小さいことを更に条件として、前記削除指示を生成することを特徴とする項目8記載の辞書更新システム。
(項目10) 前記端末は、前記変換元情報を変換した前記変換先情報を、外部の端末に電子メールにより送信する電子メール送信部を更に備え、前記変換処理情報送信部は、前記電子メールが送信される毎に、更に、当該電子メールを前記変換処理情報として前記更新処理サーバに送信し、前記辞書更新情報送信部は、前記電子メールに基づいて、前記辞書更新情報を作成し、前記端末に送信することを特徴とする項目1記載の辞書更新システム。
(項目11) 前記変換処理情報送信部は、前記電子メール中の文章における複数の語句間の語順を入れ替えることにより前記変換処理情報を生成することを特徴とする項目10記載の辞書更新システム。
(項目12) 前記変換処理情報送信部は、前記変換処理情報を前記更新処理サーバに送信した場合に、前記変換処理情報格納部に格納されている前記変換処理情報を削除することを特徴とする項目1記載の辞書更新システム。
【0058】
(項目13) 入力された変換元情報を変換先情報に変換する第1辞書を有し、外部に設けられた更新処理サーバに当該第1辞書を更新させる端末であって、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、前記変換処理情報を前記更新処理サーバに送信する変換処理情報送信部と、前記第1辞書を格納し、前記第1辞書を更新する辞書更新情報を前記更新処理サーバから受け取った場合に、当該第1辞書を更新する第1辞書格納部とを備えることを特徴とする端末。
(項目14) 第1言語で記述された前記変換元情報を、前記第1辞書を用いて、第2言語で記述された前記変換先情報に翻訳する翻訳部を更に備え、前記変換処理情報送信部は、前記変換処理情報として、前記変換元情報を、翻訳結果の確信度に対応付けた情報を前記更新サーバに送信し、前記第1辞書格納部は、前記確信度に応じて前記更新処理サーバから返送された前記辞書更新情報に基づき、前記第1辞書を更新することを特徴とする項目13記載の端末。
(項目15) 前記変換処理情報格納部は、前記第1辞書により変換できなかった前記変換元情報を、前記変換処理情報として格納し、前記第1辞書格納部は、前記辞書更新情報として、前記変換処理情報に対応する変換先情報を、前記更新処理サーバから受信し、当該変換先情報を追加することにより前記第1辞書を更新することを特徴とする項目13記載の端末。
【0059】
(項目16) 前記第1辞書格納部は、前記第1辞書として複数の第1部分辞書を格納し、前記変換処理情報格納部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として格納し、前記変換処理情報送信部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として前記更新処理サーバに送信し、前記第1辞書格納部は、予め定められた第1頻度より高い使用頻度を有する一の前記第1部分辞書に対応付けられた他の部分辞書を、前記更新処理サーバから受信し、当該他の部分辞書を追加することにより前記第1辞書を更新することを特徴とする項目13記載の端末。
(項目17) 入力された変換元情報を変換先情報に変換する第1辞書を有する端末に、当該第1辞書を更新するための辞書更新情報を送信する更新処理サーバであって、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を前記端末から受け取り、当該変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、前記辞書更新情報を前記端末に送信することにより、前記第1辞書を更新させる辞書更新情報送信部とを備えることを特徴とする更新処理サーバ。
(項目18) 入力された変換元情報を変換先情報に変換する第1辞書を有する端末と、ネットワークを介して前記端末の前記第1辞書を更新させる更新処理サーバとを制御する制御方法であって、前記端末に、前記第1辞書を格納させる段階と、前記端末に、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納させる段階と、前記端末に、前記変換処理情報を前記更新処理サーバに送信させる段階と、前記更新処理サーバに、前記変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成させる段階と、前記更新処理サーバに、前記辞書更新情報を前記端末に送信させる段階とを備えることを特徴とする制御方法。
【0060】
(項目19) 入力された変換元情報を変換先情報に変換する第1辞書を有する端末に、当該第1辞書を更新するための辞書更新情報を送信する更新処理サーバとしてコンピュータを機能させるプログラムであって、前記コンピュータを、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を前記端末から受け取り、当該変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、前記辞書更新情報を前記端末に送信することにより、前記第1辞書を更新させる辞書更新情報送信部として機能させることを特徴とするプログラム。
(項目20) 入力された変換元情報を変換先情報に変換する第1辞書を有し、外部に設けられた更新処理サーバに当該第1辞書を更新させる端末としてコンピュータを機能させるプログラムであって、前記コンピュータを、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、前記変換処理情報を前記更新処理サーバに送信する変換処理情報送信部と、前記第1辞書を格納し、前記第1辞書を更新する辞書更新情報を前記更新サーバから受け取った場合に、当該第1辞書を更新する第1辞書格納部として機能させることを特徴とするプログラム。
(項目21) 項目19又は項目20記載のプログラムを記録した記録媒体。
【0061】
以上、本発明を実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更または改良を加えることができる。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。例えば、端末100は、翻訳部120を備えなくてよい。この場合の端末100とは、例えば、他の端末に、翻訳の辞書を付加機能として提供する端末である。即ち、第1辞書格納部端末110は、他の端末に設けられた翻訳部により用いられる第1辞書を格納してもよい。
【0062】
【発明の効果】
上記説明から明らかなように、本発明によれば端末に設けられた辞書を適切に更新することができる。
【図面の簡単な説明】
【図1】図1は、辞書更新システム10の機能ブロック図。
【図2】図2は、第1辞書格納部110及び第2辞書格納部210の一例を示す図。
【図3】図3は、変換処理情報格納部130の一例を示す図。
【図4】図4は、辞書更新システム10の動作フロー図。
【図5】図5は、S120の詳細を示すフロー図。
【図6】図6は、確信度を算出する一例を示す図。
【図7】図7は、図4に示したS220の詳細を示すフロー図。
【図8】図8は、図4に示したS230の詳細の一例を示すフロー図。
【図9】図9は、本実施形態の変形例における辞書更新システム10の機能ブロック図。
【図10】図10は、変形例における辞書更新システム10の動作フロー図。
【図11】図11は、本実施形態及び変形例に係る更新処理サーバ200のハードウェア構成の一例を示す図。
【図12】図12は、本実施形態及び変形例に係る端末100のハードウェア構成の一例を示す図。
【符号の説明】
10 辞書更新システム
20 ネットワーク
100 端末
110 第1辞書格納部
112 コンピュータ部分辞書
114 料理部分辞書
116 ペット部分辞書
118 基本辞書
120 翻訳部
130 変換処理情報格納部
140 変換処理情報送信部
150 電子メール送信部
200 更新処理サーバ
210 第2辞書格納部
212 コンピュータ部分辞書
214 料理部分辞書
216 ペット部分辞書
218 基本辞書
220 翻訳部
225 容量管理部
230 辞書更新情報生成部
240 辞書更新情報送信部
600 英文
610 日本語文
620 日本語文

Claims (21)

  1. 入力された変換元情報を変換先情報に変換する第1辞書を有する端末と、ネットワークを介して前記端末の前記第1辞書を更新させる更新処理サーバとを備えた辞書更新システムであって、
    前記端末は、
    前記第1辞書を格納する第1辞書格納部と、
    前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、
    前記変換処理情報を前記更新処理サーバに送信する変換処理情報送信部と
    を有し、
    前記更新処理サーバは、
    前記変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、
    前記辞書更新情報を前記端末に送信する辞書更新情報送信部と
    を有することを特徴とする辞書更新システム。
  2. 前記更新処理サーバは、変換元情報を変換先情報に変換する第2辞書を格納する第2辞書格納部を更に有し、
    前記辞書更新情報生成部は、前記変換処理情報に基づいて、前記第1辞書に追加すべき情報を前記第2辞書から選択し、前記辞書更新情報として生成することを特徴とする請求項1記載の辞書更新システム。
  3. 前記第1辞書格納部は、第1言語で記述された前記変換元情報を、第2言語で記述された前記変換先情報に翻訳する前記第1辞書を格納し、前記変換処理情報格納部は、前記変換処理情報として、前記変換元情報を、翻訳結果の確信度に対応付けた情報を格納し、
    前記更新処理サーバは、受け取った前記変換元情報を、前記第2辞書を用いて翻訳し、翻訳の確信度を出力する翻訳部を更に有し、
    前記辞書更新情報生成部は、前記変換元情報に対応付けて受け取った前記確信度が、前記翻訳部により翻訳された場合の確信度を下回る場合に、前記翻訳部による前記変換元情報の翻訳に用いられた情報を前記第2辞書から選択し、前記辞書更新情報として生成することを特徴とする請求項2記載の辞書更新システム。
  4. 前記変換処理情報格納部は、前記変換元情報における翻訳の前記確信度が、予め定められた基準確信度より低い場合に、当該変換元情報を格納することを特徴とする請求項3記載の辞書更新システム。
  5. 前記変換処理情報格納部は、前記第1辞書により変換できなかった前記変換元情報を、前記変換処理情報として格納し、
    前記辞書更新情報生成部は、前記辞書更新情報として、前記変換処理情報に対応する変換先情報を、前記第2辞書から選択することを特徴とする請求項2記載の辞書更新システム。
  6. 前記辞書更新情報生成部は、更に、前記変換処理情報を含む複合語の変換先の情報を、前記第2辞書から選択することを特徴とする請求項5記載の辞書更新システム。
  7. 前記第1辞書格納部は、前記第1辞書として複数の第1部分辞書を格納し、
    前記変換処理情報格納部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として格納し、
    前記変換処理情報送信部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として前記更新処理サーバに送信し、
    前記第2辞書格納部は、前記第2辞書として、前記複数の第1部分辞書のそれぞれに対応付けられた複数の第2部分辞書を格納し、
    前記辞書更新情報生成部は、一の第1部分辞書の前記使用頻度が予め定められた第1頻度より高い場合に、前記一の第1部分辞書に対応する一の前記第2部分辞書を、前記辞書更新情報として生成することを特徴とする請求項2記載の辞書更新システム。
  8. 前記第2辞書は、前記第1辞書を含み、
    前記辞書更新情報生成部は、他の前記第1部分辞書の前記使用頻度が予め定められた第2頻度より低い場合に、前記他の第1部分辞書を削除する旨の削除指示を前記辞書更新情報として生成することを特徴とする請求項7記載の辞書更新システム。
  9. 前記更新処理サーバは、前記端末に設けられた記憶装置の空き容量を示す容量情報を管理する容量管理部を更に有し、
    前記辞書更新情報生成部は、前記空き容量情報が示す空き容量が、予め定められた容量より小さいことを更に条件として、前記削除指示を生成することを特徴とする請求項8記載の辞書更新システム。
  10. 前記端末は、
    前記変換元情報を変換した前記変換先情報を、外部の端末に電子メールにより送信する電子メール送信部を更に備え、
    前記変換処理情報送信部は、前記電子メールが送信される毎に、更に、当該電子メールを前記変換処理情報として前記更新処理サーバに送信し、
    前記辞書更新情報送信部は、前記電子メールに基づいて、前記辞書更新情報を作成し、前記端末に送信することを特徴とする請求項1記載の辞書更新システム。
  11. 前記変換処理情報送信部は、前記電子メール中の文章における複数の語句間の語順を入れ替えることにより前記変換処理情報を生成することを特徴とする請求項10記載の辞書更新システム。
  12. 前記変換処理情報送信部は、前記変換処理情報を前記更新処理サーバに送信した場合に、前記変換処理情報格納部に格納されている前記変換処理情報を削除することを特徴とする請求項1記載の辞書更新システム。
  13. 入力された変換元情報を変換先情報に変換する第1辞書を有し、外部に設けられた更新処理サーバに当該第1辞書を更新させる端末であって、
    前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、
    前記変換処理情報を前記更新処理サーバに送信する変換処理情報送信部と、
    前記第1辞書を格納し、前記第1辞書を更新する辞書更新情報を前記更新処理サーバから受け取った場合に、当該第1辞書を更新する第1辞書格納部と
    を備えることを特徴とする端末。
  14. 第1言語で記述された前記変換元情報を、前記第1辞書を用いて、第2言語で記述された前記変換先情報に翻訳する翻訳部を更に備え、
    前記変換処理情報送信部は、前記変換処理情報として、前記変換元情報を、翻訳結果の確信度に対応付けた情報を前記更新サーバに送信し、
    前記第1辞書格納部は、前記確信度に応じて前記更新処理サーバから返送された前記辞書更新情報に基づき、前記第1辞書を更新することを特徴とする請求項13記載の端末。
  15. 前記変換処理情報格納部は、前記第1辞書により変換できなかった前記変換元情報を、前記変換処理情報として格納し、
    前記第1辞書格納部は、前記辞書更新情報として、前記変換処理情報に対応する変換先情報を、前記更新処理サーバから受信し、当該変換先情報を追加することにより前記第1辞書を更新することを特徴とする請求項13記載の端末。
  16. 前記第1辞書格納部は、前記第1辞書として複数の第1部分辞書を格納し、
    前記変換処理情報格納部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として格納し、
    前記変換処理情報送信部は、前記複数の第1部分辞書のそれぞれの使用頻度を、前記変換処理情報として前記更新処理サーバに送信し、
    前記第1辞書格納部は、予め定められた第1頻度より高い使用頻度を有する一の前記第1部分辞書に対応付けられた他の部分辞書を、前記更新処理サーバから受信し、当該他の部分辞書を追加することにより前記第1辞書を更新することを特徴とする請求項13記載の端末。
  17. 入力された変換元情報を変換先情報に変換する第1辞書を有する端末に、当該第1辞書を更新するための辞書更新情報を送信する更新処理サーバであって、
    前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を前記端末から受け取り、当該変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、
    前記辞書更新情報を前記端末に送信することにより、前記第1辞書を更新させる辞書更新情報送信部と
    を備えることを特徴とする更新処理サーバ。
  18. 入力された変換元情報を変換先情報に変換する第1辞書を有する端末と、ネットワークを介して前記端末の前記第1辞書を更新させる更新処理サーバとを制御する制御方法であって、
    前記端末に、前記第1辞書を格納させる段階と、
    前記端末に、前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納させる段階と、
    前記端末に、前記変換処理情報を前記更新処理サーバに送信させる段階と、
    前記更新処理サーバに、前記変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成させる段階と、
    前記更新処理サーバに、前記辞書更新情報を前記端末に送信させる段階と
    を備えることを特徴とする制御方法。
  19. 入力された変換元情報を変換先情報に変換する第1辞書を有する端末に、当該第1辞書を更新するための辞書更新情報を送信する更新処理サーバとしてコンピュータを機能させるプログラムであって、
    前記コンピュータを、
    前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を前記端末から受け取り、当該変換処理情報に基づいて、前記第1辞書を更新する辞書更新情報を生成する辞書更新情報生成部と、
    前記辞書更新情報を前記端末に送信することにより、前記第1辞書を更新させる辞書更新情報送信部と
    して機能させることを特徴とするプログラム。
  20. 入力された変換元情報を変換先情報に変換する第1辞書を有し、外部に設けられた更新処理サーバに当該第1辞書を更新させる端末としてコンピュータを機能させるプログラムであって、
    前記コンピュータを、
    前記第1辞書に基づき前記変換元情報を前記変換先情報に変換する処理中に得られる変換処理情報を格納する変換処理情報格納部と、
    前記変換処理情報を前記更新処理サーバに送信する変換処理情報送信部と、
    前記第1辞書を格納し、前記第1辞書を更新する辞書更新情報を前記更新サーバから受け取った場合に、当該第1辞書を更新する第1辞書格納部と
    して機能させることを特徴とするプログラム。
  21. 請求項19又は請求項20記載のプログラムを記録した記録媒体。
JP2002373122A 2002-12-24 2002-12-24 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体 Expired - Fee Related JP4398144B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002373122A JP4398144B2 (ja) 2002-12-24 2002-12-24 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体
US10/740,007 US20040148381A1 (en) 2002-12-24 2003-12-18 Dictionary updating system, updating processing server, terminal, control method, program and recording medium
CNA2003101230360A CN1510595A (zh) 2002-12-24 2003-12-23 词典更新系统、更新处理服务器、终端、控制方法、程序、记录媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002373122A JP4398144B2 (ja) 2002-12-24 2002-12-24 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2004206307A true JP2004206307A (ja) 2004-07-22
JP4398144B2 JP4398144B2 (ja) 2010-01-13

Family

ID=32732709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002373122A Expired - Fee Related JP4398144B2 (ja) 2002-12-24 2002-12-24 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体

Country Status (3)

Country Link
US (1) US20040148381A1 (ja)
JP (1) JP4398144B2 (ja)
CN (1) CN1510595A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122145A (ja) * 2005-10-25 2007-05-17 Just Syst Corp 電子メール評価装置および電子メール評価方法
JP2012194674A (ja) * 2011-03-15 2012-10-11 Omron Corp 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020078437A1 (en) * 2000-12-15 2002-06-20 International Business Machines Corporation Code load distribution
US20050283724A1 (en) * 2004-06-18 2005-12-22 Research In Motion Limited Predictive text dictionary population
US7627816B2 (en) * 2005-04-12 2009-12-01 International Business Machines Corporation Method for providing a transient dictionary that travels with an original electronic document
US7861239B2 (en) * 2005-05-23 2010-12-28 International Business Machines Corporation Data migration between versions of software
GB0611303D0 (en) * 2006-06-08 2006-07-19 Ibm A method, apparatus and software for selecting terms for a glossary in a document processing system
US7680893B2 (en) * 2007-01-05 2010-03-16 International Business Machines Corporation Method for implementing electronic mail dictionary transporter
TWI502380B (zh) * 2007-03-29 2015-10-01 Nokia Corp 配合預測式本文輸入使用之方法、裝置、伺服器、系統及電腦程式產品
CN100464308C (zh) * 2007-04-20 2009-02-25 北京搜狗科技发展有限公司 一种用户词库同步更新的方法和系统
CN101464876B (zh) * 2007-12-19 2012-08-08 金宝电子(中国)有限公司 电子词典机数据更新方法
CN102479228B (zh) * 2010-11-30 2013-09-18 英业达股份有限公司 在线词典更新资料的推送方法
CN102073527B (zh) * 2011-01-26 2013-04-10 百度在线网络技术(北京)有限公司 一种输入法词库的升级方法和装置
US20120296983A1 (en) * 2011-05-17 2012-11-22 Microsoft Corporation Managing compression dictionaries
US20150113072A1 (en) * 2013-10-17 2015-04-23 International Business Machines Corporation Messaging auto-correction using recipient feedback
JP2016177348A (ja) * 2015-03-18 2016-10-06 株式会社東芝 更新支援装置、方法およびプログラム
JP6545633B2 (ja) * 2016-03-17 2019-07-17 株式会社東芝 単語スコア計算装置、単語スコア計算方法及びプログラム
JP6555553B2 (ja) * 2016-03-25 2019-08-07 パナソニックIpマネジメント株式会社 翻訳装置
JP2020046563A (ja) * 2018-09-20 2020-03-26 Dynabook株式会社 電子機器、音声認識方法及びプログラム
CN109684611B (zh) * 2018-12-18 2024-02-20 北京城市网邻信息技术有限公司 一种字典转码方法、装置、存储介质及终端
CN109918665B (zh) * 2019-03-05 2021-11-02 湖北亿咖通科技有限公司 文本的分词方法、装置和电子设备
CN111368035A (zh) * 2020-03-03 2020-07-03 新疆大学 一种基于神经网络的汉维-维汉机构名词典的挖掘系统
CN112256669A (zh) * 2020-09-27 2021-01-22 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH077419B2 (ja) * 1989-06-30 1995-01-30 シャープ株式会社 機械翻訳装置における略称付き固有名詞処理方法
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
JP3466857B2 (ja) * 1997-03-06 2003-11-17 株式会社東芝 辞書更新方法および辞書更新システム
JP3556425B2 (ja) * 1997-03-18 2004-08-18 株式会社東芝 共有辞書更新方法および辞書サーバ
DE69712485T2 (de) * 1997-10-23 2002-12-12 Sony Int Europe Gmbh Sprachschnittstelle für ein Hausnetzwerk
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6338033B1 (en) * 1999-04-20 2002-01-08 Alis Technologies, Inc. System and method for network-based teletranslation from one natural language to another
JP2001101185A (ja) * 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
US6456975B1 (en) * 2000-01-13 2002-09-24 Microsoft Corporation Automated centralized updating of speech recognition systems

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122145A (ja) * 2005-10-25 2007-05-17 Just Syst Corp 電子メール評価装置および電子メール評価方法
JP2012194674A (ja) * 2011-03-15 2012-10-11 Omron Corp 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム

Also Published As

Publication number Publication date
US20040148381A1 (en) 2004-07-29
JP4398144B2 (ja) 2010-01-13
CN1510595A (zh) 2004-07-07

Similar Documents

Publication Publication Date Title
JP4398144B2 (ja) 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体
US7536293B2 (en) Methods and systems for language translation
US8935150B2 (en) Dynamic generation of auto-suggest dictionary for natural language translation
JP4974445B2 (ja) 確認文を提供する方法およびシステム
US8041557B2 (en) Word translation device, translation method, and computer readable medium
JP2007257644A (ja) 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置
JP2007141133A (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP2010205268A (ja) コンピュータ支援自然言語翻訳
JP2000066823A (ja) あるキ―ボ―ドモ―ドに対応するテキストを他のキ―ボ―ドモ―ドに対応するテキストに変換する方法
JP6227179B1 (ja) 翻訳支援システム等
JP2004280574A (ja) 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体
JP2005107597A (ja) 類似文検索装置、類似文検索方法、およびプログラム
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JP2003323425A (ja) 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム
Chalabi MT-based transparent Arabization of the internet TARJIM. COM
US20030009490A1 (en) Information processing apparatus, information processing method, recording medium, program, and electronic-publishing-data providing system
JP2002183127A (ja) ユーザ辞書生成登録システム、辞書サーバ、端末、ユーザ辞書生成方法、ユーザ辞書登録方法、ならびに、情報記録媒体
JP2007213109A (ja) 辞書作成システム、辞書サーバ、携帯端末、辞書作成方法、および、辞書作成プログラム
JP2004151881A (ja) 情報検索支援方法及び装置及び情報検索支援プログラム
JP3267168B2 (ja) 自然言語変換システム
JP2001282789A (ja) 翻訳システム
JP2008210216A (ja) 利用者を検索する装置、方法およびプログラム
JP3353873B2 (ja) 機械翻訳装置
JP2003296326A (ja) 機械翻訳装置、機械翻訳方法、及び機械翻訳プログラム
KR20130042822A (ko) 패턴 기반 번역과 번역 예문 기반 번역을 사용한 번역 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061003

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070219

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070416

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070803

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20090805

R155 Notification before disposition of declining of application

Free format text: JAPANESE INTERMEDIATE CODE: R155

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091022

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees