JP6519131B2 - Dictionary selection device, document conversion system, program, and document conversion method - Google Patents
Dictionary selection device, document conversion system, program, and document conversion method Download PDFInfo
- Publication number
- JP6519131B2 JP6519131B2 JP2014193785A JP2014193785A JP6519131B2 JP 6519131 B2 JP6519131 B2 JP 6519131B2 JP 2014193785 A JP2014193785 A JP 2014193785A JP 2014193785 A JP2014193785 A JP 2014193785A JP 6519131 B2 JP6519131 B2 JP 6519131B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- score
- directory
- dictionary
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明は、辞書選択装置、文書変換システム、プログラム及び文書変換方法に関する。 The present invention relates to a dictionary selection device, a document conversion system, a program, and a document conversion method.
機械翻訳を行うための辞書を選択する技術として、例えば特許文献1には、ファイル名などの文書識別情報に基づいて専門用語辞書を設定することが記載されている。また、特許文献2には、特許公報に関連付けられたIPC(国際特許分類)に基づいて、当該特許公報に応じた辞書を自動選択することが記載されている。
As a technique for selecting a dictionary for performing machine translation, for example,
本発明の目的は、文書に用いるべき辞書を当該文書とディレクトリとの関係性に基づいて選択できるようにすることにある。 An object of the present invention is to make it possible to select a dictionary to be used for a document based on the relationship between the document and the directory.
本発明の請求項1に係る辞書選択装置は、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算する計算部と、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた文書に用いられる1又は複数の辞書を選択する選択部とを備える構成である。
The dictionary selection device according to
本発明の請求項2に係る辞書選択装置は、請求項1に記載の構成において、前記計算部が、第1ディレクトリに格納された文書と、該第1ディレクトリの下位に属する第2ディレクトリに格納された文書とを用いて、該第1ディレクトリに対するスコアを計算する構成である。
本発明の請求項3に係る辞書選択装置は、請求項1又は2に記載の構成において、前記選択部により選択された複数の辞書をユーザに選択肢として提示する提示部と、前記提示された複数の辞書のうち特定の辞書を選択する操作を前記ユーザから受け付ける受付部とを備える構成である。
本発明の請求項4に係る辞書選択装置は、請求項3に記載の構成において、前記計算部は、前記受付部により受け付けられた操作で選択された回数に応じた値を前記スコアに反映させる構成である。
本発明の請求項5に係る辞書選択装置は、請求項1ないし4のいずれか1項に記載の構成において、前記計算部は、文書毎に複数の辞書のそれぞれのスコアを計算するとともに、ディレクトリ毎に辞書のそれぞれのスコアを該ディレクトリに格納されている文書毎に計算した複数の辞書のそれぞれのスコアを用いて計算する構成である。
本発明の請求項6に係る辞書選択装置は、請求項1ないし5のいずれか1項に記載の構成において、前記計算部が、あるディレクトリに文書が新たに格納された場合に、該ディレクトリに対するスコアを再計算する構成である。
In the dictionary selection device according to a second aspect of the present invention, in the configuration according to the first aspect, the calculation unit stores the document stored in the first directory and the second directory belonging to the lower level of the first directory. Calculating the score for the first directory using the selected document.
A dictionary selecting apparatus according to a third aspect of the present invention is the configuration according to the first or second aspect, further comprising: a presenting section for presenting a plurality of dictionaries selected by the selecting section to the user as options; And a receiving unit for receiving from the user an operation of selecting a specific dictionary among the dictionaries.
In the dictionary selection device according to a fourth aspect of the present invention, in the configuration according to the third aspect, the calculation unit causes the score to reflect a value according to the number of times selected by the operation received by the reception unit. It is a structure.
In the dictionary selection device according to a fifth aspect of the present invention, in the configuration according to any one of the first to fourth aspects, the calculation unit calculates a score of each of a plurality of dictionaries for each document, and a directory each score of the dictionary is configured to be calculated using the respective scores of the plurality of dictionaries calculated for each document stored in the directory for each.
In the dictionary selection device according to a sixth aspect of the present invention, in the configuration according to any one of the first to fifth aspects, in the case where a document is newly stored in a certain directory, the calculation unit The score is recalculated.
本発明の請求項7に係る文書変換システムは、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算する計算部と、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた特定の文書に用いられる1又は複数の辞書を選択する選択部と、前記選択された辞書を用いて前記特定の文書の一部又は全部を変換する変換部とを備える構成である。 The document conversion system according to claim 7 of the present invention includes scores of a plurality of dictionaries used for a document, for each directory in which the documents are stored, using the documents stored in the directories and including them in the dictionaries. The total number of documents including the words of the first language, the score calculated by the total number of documents stored in the directory, and the total number of documents including the words of the second language which is a parallel translation of the words of the first language; From the score calculated by the total number of documents stored in the directory, a score is calculated for each pair of the first language word and the second language, and the score for each dictionary is calculated for each directory from the pair score Selection of selecting one or more dictionaries to be stored in a certain directory or used for a specific document based on the calculated calculation unit and the calculated score When a configuration including a conversion section for converting a part or all of the specific document by using the selected dictionary.
本発明の請求項8に係るプログラムは、コンピュータに、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算するステップと、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた文書に用いられる1又は複数の辞書を選択するステップとを実行させるものである。 Program according to claim 8 of the present invention causes a computer, a score of a plurality of dictionaries to be used in the document, for each directory that the document is stored, with the documents stored in the directory, included in the dictionary The total number of documents including the words of the first language and the score calculated by the total number of documents stored in the directory, and the total number of documents including the words of the second language which is a translation of the words of the first language From the score calculated by the total number of documents stored in the directory and the score, the score is calculated for each pair of the first language word and the second language, and the score of each dictionary is calculated for each directory from the score for each pair calculating a, on the basis of the calculated scores, stored in a directory, or select one or more dictionaries used in the document associated with the directory It is intended to execute the steps.
本発明の請求項9に係る文書変換方法は、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算し、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた特定の文書に用いられる1又は複数の辞書を選択し、前記選択された辞書を用いて前記特定の文書の一部又は全部を変換するものである。 In the document conversion method according to claim 9 of the present invention, scores of a plurality of dictionaries used for a document are included in the dictionary for each directory in which the document is stored, using the document stored in the directory. The total number of documents including the words of the first language, the score calculated by the total number of documents stored in the directory, and the total number of documents including the words of the second language which is a parallel translation of the words of the first language; From the score calculated by the total number of documents stored in the directory, a score is calculated for each pair of the first language word and the second language, and the score for each dictionary is calculated for each directory from the pair score Select one or more dictionaries to be calculated and stored in a directory based on the calculated scores, or used for a specific document associated with the directory, the selected dictionary It is to convert part or all of the specific document by using.
請求項1、7、8、9に係る発明によれば、文書に用いるべき辞書を当該文書とディレクトリとの関係性に基づいて選択することが可能である。
請求項2に係る発明によれば、文書が格納されている階層構造に応じたスコアを計算することが可能である。
請求項3に係る発明によれば、文書に用いるべき辞書をスコアとユーザの操作と似基づいて選択することが可能である。
請求項4に係る発明によれば、ユーザによって実際に選択されたか否かによって辞書のスコアを変えることが可能である。
請求項5に係る発明によれば、ディレクトリに格納された複数の文書のスコアを参酌して当該ディレクトリのスコアを計算することが可能である。
請求項6に係る発明によれば、スコアに変化がないディレクトリについてもスコアを再計算する場合に比べ、スコアの再計算に要する負荷を軽減させることが可能である。
According to the invention of
According to the second aspect of the present invention, it is possible to calculate a score according to the hierarchical structure in which the document is stored.
According to the invention of claim 3, it is possible to select the dictionary to be used for the document based on the similarity between the score and the operation of the user.
According to the invention of claim 4, it is possible to change the score of the dictionary depending on whether or not it is actually selected by the user.
According to the invention of claim 5, it is possible to calculate the score of the directory by taking into consideration the scores of a plurality of documents stored in the directory.
According to the sixth aspect of the present invention, it is possible to reduce the load required to recalculate the score as compared with the case where the score is recalculated even for a directory in which there is no change in the score.
[第1実施例]
図1は、本発明の一実施例に係る文書変換システム10の機能的構成を示すブロック図である。文書変換システム10は、本発明に係る辞書選択装置を含んで構成された情報処理システムである。
[First embodiment]
FIG. 1 is a block diagram showing a functional configuration of a
文書変換システム10は、辞書を用いて文書の一部又は全部を変換するためのシステムである。ここでいう変換は、例えば翻訳、すなわちある言語の語句を別の言語の語句に変換するものであるが、ある語句を共通の意味の別の語句(同義語)に置き換えたり、ある語句の意味や定義などを提示したりするものであってもよい。例えば、文書変換システム10は、ある文書の全文を翻訳したり、ユーザによって指定された特定の箇所の語句の意味や定義を(元の語句とともに)表示したりする。
The
本実施例における文書とは、文字情報を含んだデータ(ファイル)をいう。ここでいう文書は、いわゆるテキストデータ、すなわち文字コード(ASCII、UNICODEなど)によって記述される文字列を含むデータであってもよいが、OCR(Optical Character Recognition)技術を用いた文字認識処理によって文字列を抽出可能な画像データであってもよいし、テキストデータと画像データとが組み合わされて構成されたデータであってもよい。ただし、文書変換システム10は、画像データを含む文書に対して翻訳等の処理を実行する場合には、文字認識処理によって文字列を事前に抽出しておく。
The document in the present embodiment means data (file) including character information. The document referred to here may be so-called text data, that is, data including a character string described by a character code (ASCII, UNICODE, etc.), but the character recognition processing using an optical character recognition (OCR) technology It may be image data from which a column can be extracted, or data formed by combining text data and image data. However, when the
また、文書変換システム10は、ディレクトリによって文書を階層的に管理している。本明細書においては、ディレクトリはフォルダと同義であるとする。特に、ディレクトリが視覚的に表現される場合には、これをフォルダと称するのが一般的である。ただし、これらの呼称は、ファイルシステムやOS(Operating System)によって異なり得る。
Also, the
文書変換システム10において、それぞれのディレクトリには、互いに関連性を有する文書が格納される。例えば、同一のディレクトリに格納される文書は、文書の内容(ジャンル、分野、著者、言語など)に共通性を有する。また、文書が複数のユーザ(あるサービスの加入者や企業等の従業員など)によってアクセスされ得る場合であって、当該複数のユーザがいくつかのグループに分類される場合には、それぞれのグループ毎に異なるディレクトリが文書の格納場所として割り当てられる。この場合、同一のグループに属するユーザは、共通の専門分野について研究を行っているとか、趣味・嗜好が共通する、といったように、共通する属性を有している。各ユーザは、自身が属するグループに応じたディレクトリにアクセスし、文書をアップロード又はダウンロードする。
In the
また、本実施例における辞書とは、第1の語句と第2の語句とを対応付けて記憶したデータの集合をいう。例えば、ここでいう辞書が英和辞典であれば、第1の語句は英語の単語であり、第2の語句は当該単語に対応する日本語の単語である。文書変換システム10は、複数の辞書を記憶し、適用対象の文書に応じた辞書を選択して変換に用いるように構成されている。
Further, the dictionary in the present embodiment is a set of data stored in association with the first word and the second word. For example, if the dictionary referred to here is an English-Japanese dictionary, the first word is an English word, and the second word is a Japanese word corresponding to the word. The
なお、本実施例の辞書には、文書毎又はディレクトリ毎にスコアが付与される。ここでいうスコアとは、当該辞書を文書に使用することの適切さを数値化したものをいう。例えば、ある文書に対する第1の辞書のスコアが当該文書に対する第2の辞書のスコアよりも高い場合には、第1の辞書の方が第2の辞書よりも当該文書への使用に適している(可能性が高い)ことを示している。また、ディレクトリに対するスコアは、当該辞書を当該ディレクトリに格納された文書に使用することの適切さを示すものである。なお、ある辞書のある文書に対するスコアと当該文書が格納されたディレクトリに対するスコアとは、必ずしも一致しない。 In the dictionary of this embodiment, a score is assigned to each document or directory. The term "score" as used herein refers to a numerical expression of the appropriateness of using the dictionary in a document. For example, if the score of the first dictionary for a document is higher than the score of the second dictionary for the document, the first dictionary is more suitable for use with the document than the second dictionary. It indicates that it is (probable). Also, the score for the directory indicates the appropriateness of using the dictionary for the documents stored in the directory. Note that the score for a certain document in a certain dictionary does not necessarily match the score for the directory in which the document is stored.
図1に示したように、本実施例に係る文書変換システム10は、文書管理部11と、辞書管理部12と、計算部13と、選択部14と、変換部15と、出力部16とを備える。なお、文書変換システム10は、一のコンピュータ装置によって構成されてもよいが、複数のコンピュータ装置(例えば、サーバ装置とクライアント装置)の協働によって構成されてもよい。
As shown in FIG. 1, the
文書管理部11は、文書を管理する手段である。文書管理部11は、ユーザの操作に応じて文書のアップロード及びダウンロードを管理する。例えば、文書管理部11は、複数のユーザが文書にアクセスする場合には、ユーザとそのグループ(すなわちディレクトリ)の対応付けに基づいて、文書のアップロード及びダウンロードを管理する。この場合、文書管理部11は、あるユーザが文書にアクセスする場合に、当該ユーザに応じたディレクトリにアクセスするよう制御する。
The
辞書管理部12は、辞書を管理する手段である。また、辞書管理部12は、それぞれの辞書について、文書管理部11により管理されている文書(すなわち格納済みの文書)毎のスコアと各文書が格納されているディレクトリ毎のスコアを管理している。
The
計算部13は、スコアを計算する手段である。計算部13は、辞書管理部12により管理されているそれぞれの辞書について、文書毎及びディレクトリ毎のスコアを計算する。また、計算部13は、文書が新たに追加され、特定のディレクトリに格納された場合に、当該文書に対するスコアを新たに算出するとともに、当該ディレクトリに対するスコアを再計算する。このとき、計算部13は、新たに追加された文書がスコアに影響を与えないディレクトリについては、スコアを再計算しなくてよい。
The
選択部14は、文書に用いる辞書を選択する手段である。選択部14は、計算部13により計算された各辞書のスコアに基づいて、あるディレクトリに格納された文書に用いるのに適した辞書を1又は複数選択する。あるいは、選択部14は、あるディレクトリに関連付けられた文書に用いるのに適した辞書を選択する。ここでいう関連付けは、例えば、ユーザの操作によって行われる。
The
変換部15は、文書の一部又は全部を変換する手段である。変換部15は、選択部14により選択された辞書を用いて、変換対象である文書を変換する。なお、変換部15は、一の文書に対して複数の辞書を個別に用いて複数の変換結果を出力するように構成されてもよい。
The
出力部16は、変換部15による変換結果を出力する手段である。出力部16による出力は、例えば変換結果を表示することを意味するが、変換結果を表すファイルを生成し、これを記録したり他の装置に送信したりすることであってもよい。例えば、出力部16は、ある文書の翻訳結果として別の文書を生成し、PDF(Portable Document Format)などのあらかじめ決められたファイルフォーマットで保存してもよい。
The
図2は、文書変換システム10の具体例である翻訳装置100のハードウェア構成を示すブロック図である。翻訳装置100は、文書を第1言語から第2言語(ここでは、日本語から英語)に翻訳するためのコンピュータ装置である。翻訳装置100は、例えば、パーソナルコンピュータ、スマートフォン、タブレット端末などによって実現される。具体的には、翻訳装置100は、制御部110と、記憶部120と、入力部130と、出力部140と、通信部150とを備える。また、出力部140は、表示部141を含んで構成されている。
FIG. 2 is a block diagram showing a hardware configuration of a
制御部110は、翻訳装置100の各部の動作を制御する手段である。制御部110は、CPU(Central Processing Unit)などの演算処理装置と主記憶装置に相当するメモリとを備え、プログラムを実行することによってさまざまな処理を実行する。制御部110は、翻訳装置100の各部と協働し、文書変換システム10の文書管理部11、辞書管理部12、計算部13、選択部14及び変換部15に相当する機能を実現する。
The
記憶部120は、データを記憶する手段である。記憶部120は、ハードディスク、フラッシュメモリなどの記憶媒体を備え、制御部110が必要とするデータを記憶する。具体的には、記憶部120は、制御部110が実行するプログラムに加え、文書、辞書、スコアなどを記憶している。記憶部120において、文書は、ディレクトリによって分類された状態で格納されている。
The
入力部130は、ユーザの入力を受け付ける手段である。入力部130は、キーボード(又はキーパッド)やマウスであってもよいが、表示部141がタッチスクリーンディスプレイによって構成される場合であれば、電磁誘導方式、静電容量方式などのタッチセンサを含み得る。入力部130は、ユーザの操作に応じた情報(信号)を制御部110に供給する。
The
出力部140は、情報を出力する手段である。表示部141は、情報を表示(すなわち視覚的に出力)する手段である。表示部141は、液晶などの表示素子によって構成された表示パネルを備え、制御部110からの指示に応じた画像を表示する。また、出力部140は、表示部141のほかに、文書の一部又は全部を音声により再生する手段(スピーカなど)を備えてもよい。
The
通信部150は、ネットワーク又は他のコンピュータ装置と通信を行い、データを送受信する手段である。通信部150による通信は、有線と無線のいずれであってもよい。なお、通信部150は、文書や辞書を外部から受信したり、あるいは外部に送信したりしてもよいが、翻訳装置100にとって必須の構成要素ではない。
The
図3は、翻訳装置100に格納されている文書とそのディレクトリ構造を例示する図である。この例において、フォルダF1は、最上位のディレクトリに相当する。フォルダF1の下位(直下)には、フォルダF2とF4とがあり、さらにフォルダF2の下位にはフォルダF3がある。フォルダF2には文書D1、D2が格納されており、フォルダF2の下位のフォルダF3には文書D3、D4が格納されている。また、フォルダF4には文書D5、D6が格納されており、フォルダF4の下位のフォルダF5には文書D7、D8、D9が格納されている。
FIG. 3 is a diagram illustrating a document stored in the
なお、フォルダ及び文書のそれぞれには、ここでは便宜的な符号のみが示されているが、実際には、ユーザが各々を区別するのに適した名称が付与されている。フォルダ及び文書の名称は、機械的に付与されてもよいし、ユーザの操作によって決定されてもよい。 Although only the convenient code is shown here for each of the folder and the document, in actuality, a name suitable for the user to distinguish between each other is given. The names of the folder and the document may be given mechanically or may be determined by the operation of the user.
図4は、辞書のスコアの計算方法を示すフローチャートである。なお、図4に示す処理によって計算されるスコアは、文書毎のスコアである。文書毎のスコアを計算する場合、翻訳装置100の制御部110は、まず、スコアの計算対象である辞書を取得する(ステップSa1)。このとき取得される事象は、典型的には複数であるが、1つのみであってもよい。
FIG. 4 is a flowchart showing a method of calculating the score of the dictionary. The score calculated by the process shown in FIG. 4 is a score for each document. When calculating the score for each document, the
スコアの計算対象である辞書を取得したら、制御部110は、全ての辞書について繰り返すループ処理(ループ1)と全ての文書について繰り返すループ処理(ループ2)とを順次実行する(ステップSa2、Sa3)。具体的には、制御部110は、ある辞書についてのある文書に対するスコアを計算し(ステップSa4)、これを全ての文書について繰り返す。制御部110は、ステップSa5においてスコアが未計算の文書があるか判断し、スコアが未計算の文書があればステップSa3、Sa4の処理を実行する一方、スコアが未計算の文書がなければこのループ処理を終える。次に、制御部110は、ある辞書について文書毎のスコアの計算が終了したら、ステップSa6において、スコアが未計算の辞書があるか判断し、スコアが未計算の辞書があればステップSa2〜Sa5の処理を繰り返す。
After acquiring the dictionary for which the score is to be calculated, the
なお、文書毎及びディレクトリ毎のスコアの具体的な計算方法としては、例えば、以下の方法が考えられる。文書毎のスコアは、ここでは、「(辞書に収録された第1言語の語句のうち文書に含まれる語句の総数/辞書に収録された第1言語の語句の総数)+(辞書に収録された第2言語の語句のうち文書に含まれる語句の総数/辞書に収録された第2言語の語句の総数)」であるとする。 As a specific calculation method of the score for each document and each directory, for example, the following method can be considered. Here, the score for each document is “(total number of words contained in the document / word in the first language among the words contained in the first language / total number of words in the first language contained in the dictionary) + The total number of words / phrases contained in the document among the words / phrases in the second language / the total number of words / phrases in the second language included in the dictionary).
図5は、辞書の一例(辞書A)を示す図である。ここでは、説明の便宜上、辞書Aには2組の語句のみが収録されているものとする。ただし、実際の辞書には、より多くの語句が収録されていてもよい。辞書Aに収録されている語句は、「文書翻訳」とその対訳である「document translation」と、「専門辞書」とその対訳である「specialized dictionary」の4個である。 FIG. 5 is a diagram showing an example of the dictionary (dictionary A). Here, for convenience of explanation, it is assumed that only two pairs of words are recorded in the dictionary A. However, the actual dictionary may contain more words. There are four words contained in the dictionary A: “document translation” and its parallel translation “document translation”, and “specialized dictionary” and its parallel translation “specialized dictionary”.
この場合において、ある文書に「文書翻訳」及び「専門辞書」が含まれ、「document translation」及び「specialized dictionary」が含まれていない場合であれば、当該文書に対する辞書Aのスコアは「1(=2/2+0/2)」である。一方、ある文書にこれらの4個の語句が全て含まれている場合であれば、当該文書に対する辞書Aのスコアは「2(=2/2+2/2)」である。この計算方法の場合、スコアの最大値は「2」である。 In this case, if a document includes "document translation" and "specialized dictionary" and does not include "document translation" and "specialized dictionary", the score of dictionary A for the document is "1 ( = 2/2 + 0/2) ". On the other hand, in the case where a document includes all of these four words and phrases, the score of the dictionary A for the document is “2 (= 2/2 + 2/2)”. In the case of this calculation method, the maximum value of the score is "2".
図6〜8は、辞書Aのディレクトリ毎のスコアの計算方法を示す図である。制御部110は、辞書に収録されているそれぞれの語句が含まれているか否かを文書毎に判断する。図6は、辞書Aに収録されている「文書翻訳」という語句に関するスコアの計算方法を示している。この例において、各ディレクトリのスコア(暫定値)は、「(当該ディレクトリに格納されている当該語句(ここでは文書翻訳)を含む文書の総数)/(当該ディレクトリに格納されている文書の総数)」であるとする。なお、ここにおいて、「当該ディレクトリに格納されている文書」は、当該ディレクトリの下位のディレクトリに格納されている文書をも含むものである。
6 to 8 are diagrams showing a method of calculating a score for each directory of the dictionary A. The
ここで、文書D1、D2、D3、D7に「文書翻訳」が含まれているとすると、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.44」、「0.75」、「0.50」、「0.20」、「0.33」である。ここにおいて、スコアの値は、小数点第3位未満を四捨五入した値としている。 Here, assuming that "document translation" is included in the documents D1, D2, D3, and D7, the scores of the folders F1, F2, F3, F4, and F5 are "0.44" and "0.75", respectively. , “0.50”, “0.20”, and “0.33”. Here, the value of the score is a value rounded off to two decimal places.
図7は、辞書Aに収録されている「document translation」という語句に関するスコアの計算方法を示している。ここでは、当該語句が文書D4、D7に含まれているものとする。そうすると、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.22」、「0.25」、「0.50」、「0.20」、「0.33」である。 FIG. 7 shows how to calculate the score for the term "document translation" contained in the dictionary A. Here, it is assumed that the word / phrase is included in the documents D4 and D7. Then, the scores of the folders F1, F2, F3, F4, and F5 are “0.22”, “0.25”, “0.50”, “0.20”, and “0.33”, respectively.
これらの値を算出したら、制御部110は、各ディレクトリの「文書翻訳」に関するスコアと「document translation」に関するスコアとを加算し、これを「文書翻訳」とその対訳である「document translation」の組に関するスコアとする。すなわち、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.66」、「1.00」、「1.00」、「0.40」、「0.66」である。
After calculating these values, the
制御部110は、同様の計算を他の語句についても実行する。図8は、「専門辞書」とその対訳である「specialized dictionary」の組に関するスコアを示している。この例において、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.56」、「0.75」、「0.50」、「0.40」、「0.33」である。
The
最後に、制御部110は、このようにして得られた各組のスコアの平均値を算出し、これを辞書Aの各ディレクトリに対するスコアとする。この例において、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.61」、「0.88」、「0.75」、「0.40」、「0.50」である。制御部110は、他の辞書についても同様の要領でスコアを算出する。
Finally, the
なお、スコアの計算方法は、上述した例に限定されない。例えば、文書毎のスコアは、「辞書に収録された第1言語の語句のうち文書に含まれる語句の総数/辞書に収録された第1言語の語句の総数」と「辞書に収録された第2言語の語句のうち文書に含まれる語句の総数/辞書に収録された第2言語の語句の総数」の和ではなく、平均(相加平均又は相乗平均)としてもよい。また、ディレクトリ毎のスコアを計算する場合において、「当該ディレクトリに格納されている文書」には、当該ディレクトリの下位のディレクトリに格納されている文書を含まないものとしてもよい。 In addition, the calculation method of a score is not limited to the example mentioned above. For example, the score for each document is “total number of words / phrases contained in the document among words / phrases in first language / words contained in the dictionary / total number of words / phrases in first language contained in the dictionary” Instead of the sum of the total number of words / phrases contained in the document / total number of words / languages in the second language included in the dictionary among the words / languages, it may be an average (arithmetic average or geometric average). Further, in the case of calculating the score for each directory, the “document stored in the directory” may not include the document stored in the lower directory of the directory.
翻訳装置100は、このように計算されたスコアを用いて、文書の翻訳を実行する。具体的には、翻訳装置100は、あるフォルダに格納され、又は当該フォルダに関連付けられた文書に用いられる辞書を、当該フォルダのスコアに基づいて選択し、翻訳結果をユーザに提示する。ここにおいて、フォルダに関連付けられた文書とは、当該フォルダ上にドラッグされた文書をいう。この文書は、フォルダに重なるようにドラッグされた後にドロップ(すなわちドラッグ&ドロップ)されると、当該フォルダに格納される。すなわち、ここでいうフォルダに関連付けられた状態の文書とは、当該フォルダに格納される前の文書のことである。
The
図9は、翻訳結果の表示例を示す図である。翻訳装置100は、フォルダのアイコンの上に文書のアイコンがドラッグされると、当該フォルダに対するスコアが最も高い辞書を選択し、当該辞書による翻訳結果を吹き出し等によって表示する。このとき表示される翻訳結果は、翻訳された文書の全体である必要はなく、冒頭などの一部分であってもよい。また、翻訳装置100は、ドラッグされたフォルダに対するスコアが高い辞書をスコア順に複数個選択し、それぞれの辞書による翻訳結果を比較可能に表示してもよい。この場合、翻訳装置100は、表示された翻訳結果を選択する操作を受け付けると、元の文書を翻訳した文書を新たに生成してもよい。
FIG. 9 is a view showing a display example of a translation result. When the document icon is dragged onto the folder icon, the
図10は、翻訳装置100の翻訳時の動作を示すフローチャートである。翻訳装置100の制御部110は、文書のアイコンをフォルダのアイコンに重なるようにドラッグする操作を受け付けると(ステップSb1)、当該フォルダを特定し、各辞書の当該フォルダに対するスコアを特定する(ステップSb2)。なお、各辞書のスコアは、事前に計算されているものとする。
FIG. 10 is a flowchart showing an operation at the time of translation of the
制御部110は、ステップSb2において特定したスコアに基づいて辞書を選択し(ステップSb3)、選択した辞書を用いてドラッグされた文書を翻訳する(ステップSb4)。翻訳が終了したら、制御部110は、翻訳結果を表示部141に表示させる(ステップSb5)。なお、制御部110は、表示部141による表示に代えて、翻訳結果を合成音声によって読み上げてもよい。また、制御部110は、フォルダにドラッグされた文書に限らず、既にフォルダに格納されている文書に対しても、特定の操作を受け付けることによって翻訳結果を表示するようにしてもよい。
The
以上のとおり、本実施例においては、フォルダ(ディレクトリ)にスコアが付与されているため、文書の翻訳に際して当該文書自体にスコアが事前に付与されている必要がない。本実施例においては、文書がいずれかのフォルダに関連付けられれば、当該文書に適用されるべき辞書が自動的に(すなわちユーザの取捨選択によらずに)選択される。また、本実施例においては、文書を格納するフォルダが変わると、当該文書に用いられる辞書も変わり得る。 As described above, in the present embodiment, since the score is given to the folder (directory), it is not necessary to give the score in advance to the document itself when translating the document. In the present embodiment, when a document is associated with any folder, the dictionary to be applied to the document is automatically selected (ie, not based on the user's selection). Further, in the present embodiment, when the folder storing the document changes, the dictionary used for the document may also change.
また、本実施例においては、文書の内容によらずに当該文書に用いるべき辞書が選択され得るため、文字認識処理によって文字列を抽出する必要がある文書を翻訳等する場合において、当該文書に用いる辞書を選択する段階では当該文書から文字列が抽出されている必要がない。 Further, in the present embodiment, since the dictionary to be used for the document can be selected regardless of the content of the document, when translating a document for which a character string needs to be extracted by the character recognition process, At the stage of selecting the dictionary to be used, it is not necessary to extract character strings from the document.
[第2実施例]
図11は、本発明の別の実施例に係る文書変換システム20の機能的構成を示すブロック図である。文書変換システム20は、本発明に係る辞書選択装置を含んで構成された情報処理システムである。また、文書変換システム20は、第1実施例において例示された文書変換システム10との共通点を有する。本実施例においては、第1実施例と共通する部分については、説明を適宜省略する。
Second Embodiment
FIG. 11 is a block diagram showing a functional configuration of a
文書変換システム20は、文書変換システム10と同様に、辞書を用いて文書の一部又は全部を変換するためのシステムである。ただし、文書変換システム20は、辞書を用いて文書を変換する前に、当該文書に用いるべき辞書の選択肢をユーザに提示し、ユーザによって選択された辞書を用いる点において文書変換システム10と相違する。
The
文書変換システム20は、文書管理部11と、辞書管理部12と、計算部13と、選択部14と、提示部21と、受付部22と、変換部15と、出力部16とを備える。文書変換システム20の構成のうち、文書管理部11、辞書管理部12、計算部13、選択部14、変換部15及び出力部16は、第1実施例において説明された同一の符号の構成要素と共通の構成及び機能を有する。
The
提示部21は、選択部14により選択された辞書をユーザに選択肢として提示する手段である。提示部21は、ユーザに選択肢を提示してその選択を促す。なお、提示部21は、選択部14により選択された辞書が1つのみである場合には、選択肢の提示を行うことなく文書の変換を行うように構成されていてもよい。
The
受付部22は、ユーザの操作を受け付ける手段である。受付部22が受け付ける操作には、提示部21により提示された選択肢の中から特定の辞書を選択する操作が少なくとも含まれるが、他の操作も含まれ得る。
The receiving
図12は、文書変換システム20の具体例である翻訳システム200の構成を示すブロック図である。翻訳システム200は、文書管理装置200Aと翻訳装置200Bとを含んで構成される。文書管理装置200Aと翻訳装置200Bは、インターネット、無線LAN(Local Area Network)などのネットワークを介して接続される。
FIG. 12 is a block diagram showing a configuration of a
翻訳システム200は、いわゆるクライアント・サーバシステムであり、文書管理装置200Aがサーバ装置に相当し、翻訳装置200Bがクライアント装置に相当する。また、翻訳システム200は、複数のユーザによって辞書や文書が共用される点において第1実施例の翻訳装置100と異なる。文書管理装置200Aには、それぞれユーザが異なる複数の翻訳装置200Bが接続されてもよいし、翻訳装置200Bが複数のユーザによって共用されてもよい。
The
なお、翻訳装置200Bは、ハードウェア的には、第1実施例の翻訳装置100と同様の構成を有する。また、文書管理装置200Aは、サーバ装置としての一般的なハードウェア構成(制御手段、記憶手段、通信手段など)を少なくとも有する。これらの手段は、基本的な構成及び機能は翻訳装置100の制御部110、記憶部120、通信部150と同様である。
The
文書管理装置200Aは、辞書管理部210Aと、文書管理部220と、辞書取得部230と、計算部240と、翻訳情報送信部250とを備える。また、翻訳装置200Bは、辞書管理部210Bと、翻訳情報受信部260と、辞書選択部270と、翻訳部280とを備える。
The
辞書管理部210A、210Bは、文書変換システム20における辞書管理部12に相当する手段である。ただし、辞書管理部210Aによって管理されている辞書は、いずれのユーザも利用可能な辞書である一方、辞書管理部210Bによって管理されている辞書は、各ユーザ(又はグループ)のために個別に用意された辞書である。
The
文書管理部220は、文書変換システム20における文書管理部11に相当する手段である。翻訳システム200においては、文書は(翻訳装置200Bではなく)文書管理装置200Aに記憶されている。また、翻訳システム200においても、文書はディレクトリによって分類された状態で記憶されている。
The
辞書取得部230は、スコアの計算対象である辞書を取得する手段である。辞書取得部230は、辞書管理部210Aによって管理されている辞書に加え、辞書管理部210Bによって管理されている辞書を取得する。
The
計算部240は、文書変換システム20における計算部13に相当する手段である。計算部240は、辞書取得部230により取得された辞書について、文書毎及びディレクトリ毎のスコアを計算する。
The
翻訳情報送信部250は、翻訳情報を送信する手段である。ここにおいて、翻訳情報とは、翻訳の際に利用すべき辞書とそのスコアとを示す情報をいう。翻訳情報送信部250は、翻訳装置200Bのユーザが翻訳対象の文書を選択した場合に、計算部240により計算されたスコアに基づき、当該文書の翻訳に適した辞書を選択する。すなわち、翻訳情報送信部250は、文書変換システム20における選択部14に相当する手段である。なお、翻訳情報送信部250は、文書の翻訳に適した辞書として選択した辞書が辞書管理部210Aに記憶されている場合には、辞書そのものを送信する一方、当該選択した辞書が辞書管理部210Bに記憶されている場合には、当該辞書の識別情報(ファイル名等)を送信する。
The translation
翻訳情報受信部260は、翻訳情報送信部250により送信された翻訳情報を受信する手段である。辞書選択部270は、翻訳情報受信部260により受信された翻訳情報に基づいて、翻訳の際に利用すべき辞書を選択肢として表示し、ユーザに選択させる手段である。すなわち、辞書選択部270は、文書変換システム20における提示部21及び受付部22に相当する手段である。
The translation
翻訳部280は、文書変換システム20における変換部15及び出力部16に相当する手段である。翻訳部280は、ユーザによって選択された辞書を用いて文書を翻訳する。本実施例において、翻訳部280は、元の文書を翻訳して新たな文書(以下「翻訳文書」という。)を生成する。
The
図13は、翻訳システム200の翻訳時の動作を示すシーケンスチャートである。本実施例において、ユーザは、文書管理装置200Aの特定のディレクトリに格納されている文書を翻訳する。このとき、翻訳装置200Bは、文書管理装置200Aに格納された文書のいずれかを選択する操作を受け付ける(ステップSc1)。翻訳装置200Bは、文書管理装置200Aに格納された文書を一覧表示するなどして、ユーザの操作を受け付ける。
FIG. 13 is a sequence chart showing an operation of the
ユーザが文書を選択すると、翻訳装置200Bは、当該文書のファイル名を文書管理装置200Aに送信する(ステップSc2)。このとき、翻訳装置200Bは、自装置に記憶されている辞書があれば、当該辞書をあわせて送信する。文書管理装置200Aは、ステップSc2においてファイル名を受信すると、ユーザが選択した文書をファイル名に基づいて特定し、各辞書の当該文書に対するスコアを特定する(ステップSc3)。文書管理装置200Aは、自装置に記憶された辞書についてはあらかじめスコアを計算しているが、翻訳装置200Bに記憶された辞書については、翻訳装置200Bから受信してからスコアを計算する。ただし、文書管理装置200Aは、ステップSc2より前に、翻訳装置200Bに記憶されている辞書を受信しておき、スコアを事前に計算しておいてもよい。
When the user selects a document, the
なお、このとき文書管理装置200Aが辞書の評価に用いるスコアは、文書のスコアと当該文書が格納されたディレクトリのスコアのいずれであってもよく、また、これらのスコアを加算したり平均したりしたスコアを評価に用いてもよい。
At this time, the score used by the
文書管理装置200Aは、ステップSc3において特定したスコアによって各辞書を評価し、ユーザに選択肢として提示する辞書を選択する(ステップSc4)。ここでいう評価は、絶対評価と相対評価のいずれであってもよい。すなわち、文書管理装置200Aは、あらかじめ決められたスコアを上回る辞書を選択してもよいし、あらかじめ決められた数の辞書をスコア順に選択してもよい。文書管理装置200Aは、このようにして翻訳に適した辞書を選択したら、翻訳情報を生成し、ユーザによって選択された文書とともに送信する(ステップSc5)。
The
翻訳装置200Bは、ステップSc5において翻訳情報を受信すると、文書管理装置200Aによって選択された辞書を選択肢として表示する(ステップSc6)。その後、翻訳装置200Bは、選択肢として表示した辞書のいずれかを選択する操作を受け付ける(ステップSc7)。翻訳装置200Bは、ユーザの操作を受け付けると、ユーザが選択した辞書を用いて翻訳を実行する(ステップSc8)。
When receiving the translation information at step Sc5, the
図14は、選択肢の表示例を示す図である。翻訳装置200Bは、文書を翻訳するようにユーザに指示された場合に、このような画面を表示する。この例において、翻訳装置200Bは、文書管理装置200Aによって選択された辞書をそのスコアとともに表示する。ユーザは、表示された辞書のいずれかを選択し、翻訳装置200Bに翻訳の実行を指示する。
FIG. 14 is a diagram showing a display example of options. The
なお、ユーザは、選択肢として表示された辞書以外の辞書を選択してもよい。例えば、選択肢として表示された辞書よりも適切な辞書がある場合、ユーザは、当該辞書を用いて翻訳するように翻訳装置200Bに対して指示を行ってもよい。
The user may select a dictionary other than the dictionary displayed as an option. For example, if there is a dictionary more appropriate than the dictionary displayed as an option, the user may instruct the
[変形例]
本発明の実施の態様は、上述した実施例に限定されない。例えば、本発明は、以下に説明する態様によって実施されてもよい。また、本発明は、上述した実施例と1又は複数の変形例とを組み合わせて実施されてもよいし、2つの実施例の一方に記載された事項を他方に適用してもよい。
[Modification]
The embodiment of the present invention is not limited to the above-described embodiment. For example, the present invention may be embodied by the aspects described below. In addition, the present invention may be implemented by combining the embodiment described above with one or more modifications, and the matters described in one of the two embodiments may be applied to the other.
(1)スコアの計算方法は、実施例に記載されたものに限定されない。例えば、ある辞書のある文書に対するスコアは、当該辞書に収録されている語句が当該文書において使用されている回数(延べ数)を当該文書に含まれる語句の総数で除した値であってもよい。あるいは、あるディレクトリに格納された文書と、当該ディレクトリの下位に属するディレクトリに格納された文書とを用いてスコアを計算する場合、上位のディレクトリに格納されている文書のスコアと下位のディレクトリに格納されている文書のスコアとで重み付けを異ならせてもよい。 (1) The calculation method of the score is not limited to those described in the examples. For example, the score for a document in a certain dictionary may be a value obtained by dividing the number of times the words contained in the dictionary are used in the document (total number) by the total number of words contained in the document. Alternatively, when the score is calculated using a document stored in a certain directory and a document stored in a directory belonging to a lower directory of the directory, the score of the document stored in the upper directory is stored in the lower directory The weighting may be different depending on the score of the document being processed.
また、各辞書のスコアには、当該辞書が提示された場合にユーザによって実際に翻訳に使用されたか否か(すなわち、当該辞書を選択する操作が行われたか否か)が反映されてもよい。例えば、各辞書のスコアには、ユーザによって選択された回数に応じた値が加算されてもよい。これにより、ユーザにより多く用いられた辞書のスコアがより大きくなる。 Also, the score of each dictionary may reflect whether or not the user has actually been used for translation when the dictionary is presented (that is, whether an operation to select the dictionary has been performed). . For example, a value corresponding to the number of times selected by the user may be added to the score of each dictionary. This makes the score of the dictionary frequently used by the user higher.
(2)スコアの計算タイミングは、特に限定されない。文書変換システム10(又は20)は、文書や辞書が新たに追加される毎にスコアを計算(更新)してもよいが、例えば1時間に1回、1日に1回、といったように、あらかじめ決められた時間間隔でスコアを計算(更新)してもよい。また、文書変換システム10(又は20)は、システムの負荷が比較的低い時間帯(例えば深夜)にスコアの計算を行うようにしてもよい。 (2) The calculation timing of the score is not particularly limited. The document conversion system 10 (or 20) may calculate (update) the score every time a document or dictionary is newly added, for example, once an hour, once a day, etc. The score may be calculated (updated) at a predetermined time interval. In addition, the document conversion system 10 (or 20) may calculate the score in a time zone in which the load on the system is relatively low (for example, midnight).
(3)文書の分類は、人為的に行われてもよいし、機械的に行われてもよい。例えば、文書変換システム10(又は20)は、文書のファイル名、記述された言語、文書中に含まれる単語などによって文書を分類し、それぞれの文書に応じたディレクトリに格納してもよい。また、文書変換システム10(又は20)は、文書の属性を示すメタデータ(タグ等)が当該文書に含まれる場合には、メタデータを用いて文書を分類してもよい。 (3) Classification of documents may be performed artificially or mechanically. For example, the document conversion system 10 (or 20) may classify documents according to the file name of the document, the language described, the words included in the document, etc., and store the documents in a directory corresponding to each document. In addition, the document conversion system 10 (or 20) may classify the document using the metadata, when the metadata (tag or the like) indicating the attribute of the document is included in the document.
(4)本発明は、辞書選択装置や文書変換システムのほか、コンピュータを本発明に係る辞書選択装置として機能させるためのプログラム、辞書の選択方法などの形態でも提供され得る。また、本発明に係るプログラムは、光記録媒体、半導体メモリなどのコンピュータが読み取り可能な記録媒体に記憶した状態で提供されてもよい。かかるプログラムは、インターネットなどの通信手段を用いてコンピュータ装置にダウンロードされることによって利用可能になるものであってもよい。 (4) The present invention may be provided in the form of a program for causing a computer to function as the dictionary selection device according to the present invention, a method of selecting a dictionary, and the like in addition to the dictionary selection device and the document conversion system. Further, the program according to the present invention may be provided in a state of being stored in a computer readable recording medium such as an optical recording medium, a semiconductor memory, and the like. Such a program may be made available by being downloaded to a computer device using communication means such as the Internet.
10、20…文書変換システム、11…文書管理部、12…辞書管理部1、13…計算部、14…選択部、15…変換部、16…出力部、21…提示部、22…受付部、100…翻訳装置、200…翻訳システム、200A…文書管理装置、200B…翻訳装置
10, 20: document conversion system, 11: document management unit, 12:
Claims (9)
前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた文書に用いられる1又は複数の辞書を選択する選択部と
を備える辞書選択装置。 For each directory in which a document is stored, the score of a plurality of dictionaries used for the document is calculated using the documents stored in the directory, and the total number of documents including the word of the first language contained in the dictionary The score calculated by the total number of documents stored in the directory, the total number of documents including the second language phrase which is a translation of the first language phrase, and the total number of documents stored in the directory A calculation unit that calculates a score for each set of words / phrases in the first language and a word / language in the second language from the score, and calculates a score for each dictionary for each directory from the score for each set ;
A selector configured to select one or more dictionaries stored in a certain directory or used for a document associated with the directory based on the calculated score.
請求項1に記載の辞書選択装置。 The calculation unit calculates a score for the first directory using a document stored in a first directory and a document stored in a second directory belonging to a lower part of the first directory. Dictionary selection device.
前記提示された複数の辞書のうち特定の辞書を選択する操作を前記ユーザから受け付ける受付部と
を備える請求項1又は2に記載の辞書選択装置。 A presentation unit that presents the user with a plurality of dictionaries selected by the selection unit as options;
The dictionary selection device according to claim 1, further comprising: a reception unit that receives an operation of selecting a specific dictionary from the plurality of presented dictionaries from the user.
請求項3に記載の辞書選択装置。 The dictionary selection device according to claim 3, wherein the calculation unit reflects a value corresponding to the number of times selected by the operation received by the reception unit on the score.
請求項1ないし4のいずれか1項に記載の辞書選択装置。 The calculation unit calculates the score of each of the plurality of dictionaries for each document, and uses the score of each of the plurality of dictionaries calculated for each document stored in the directory for each directory. The dictionary selection device according to any one of claims 1 to 4, wherein the calculation is performed.
請求項1ないし5のいずれか1項に記載の辞書選択装置。 The dictionary selection device according to any one of claims 1 to 5, wherein the calculation unit recalculates a score for the directory when a document is newly stored in a certain directory.
前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた特定の文書に用いられる1又は複数の辞書を選択する選択部と、
前記選択された辞書を用いて前記特定の文書の一部又は全部を変換する変換部と
を備える文書変換システム。 For each directory in which a document is stored, the score of a plurality of dictionaries used for the document is calculated using the documents stored in the directory, and the total number of documents including the word of the first language contained in the dictionary The score calculated by the total number of documents stored in the directory, the total number of documents including the second language phrase which is a translation of the first language phrase, and the total number of documents stored in the directory A calculation unit that calculates a score for each set of words / phrases in the first language and a word / language in the second language from the score, and calculates a score for each dictionary for each directory from the score for each set ;
A selection unit for selecting one or more dictionaries to be stored in a directory or used for a specific document based on the calculated score;
A conversion unit configured to convert part or all of the specific document using the selected dictionary.
文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算するステップと、
前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた文書に用いられる1又は複数の辞書を選択するステップと
を実行させるためのプログラム。 On the computer
For each directory in which a document is stored, the score of a plurality of dictionaries used for the document is calculated using the documents stored in the directory, and the total number of documents including the word of the first language contained in the dictionary The score calculated by the total number of documents stored in the directory, the total number of documents including the second language phrase which is a translation of the first language phrase, and the total number of documents stored in the directory Calculating a score for each set of words / phrases in the first language and a word / language in the second language from the score, and calculating a score for each dictionary for each directory from the scores for the sets ;
Selecting one or more dictionaries stored in a directory or used for a document based on the calculated score.
前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた特定の文書に用いられる1又は複数の辞書を選択し、
前記選択された辞書を用いて前記特定の文書の一部又は全部を変換する
文書変換方法。 For each directory in which a document is stored, the score of a plurality of dictionaries used for the document is calculated using the documents stored in the directory, and the total number of documents including the word of the first language contained in the dictionary The score calculated by the total number of documents stored in the directory, the total number of documents including the second language phrase which is a translation of the first language phrase, and the total number of documents stored in the directory From the score, a score is calculated for each set of words in the first language and a word in the second language, and a score for each dictionary is calculated for each directory from the score for each set ,
Based on the calculated score, select one or more dictionaries which are stored in a directory or used for a specific document associated with the directory,
A document conversion method for converting a part or all of the specific document using the selected dictionary.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193785A JP6519131B2 (en) | 2014-09-24 | 2014-09-24 | Dictionary selection device, document conversion system, program, and document conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193785A JP6519131B2 (en) | 2014-09-24 | 2014-09-24 | Dictionary selection device, document conversion system, program, and document conversion method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016066174A JP2016066174A (en) | 2016-04-28 |
JP6519131B2 true JP6519131B2 (en) | 2019-05-29 |
Family
ID=55804150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014193785A Active JP6519131B2 (en) | 2014-09-24 | 2014-09-24 | Dictionary selection device, document conversion system, program, and document conversion method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6519131B2 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6484368A (en) * | 1987-09-26 | 1989-03-29 | Toshiba Corp | Document checking device |
JP3429612B2 (en) * | 1995-09-28 | 2003-07-22 | 沖電気工業株式会社 | Dictionary registration device and machine translation device |
JP3761364B2 (en) * | 1999-08-23 | 2006-03-29 | 沖電気工業株式会社 | Machine translation system |
JP2007034871A (en) * | 2005-07-29 | 2007-02-08 | Sanyo Electric Co Ltd | Character input apparatus and character input apparatus program |
JP2007080221A (en) * | 2005-09-16 | 2007-03-29 | Fuji Xerox Co Ltd | Apparatus, method and program for machine translation |
JPWO2008108061A1 (en) * | 2007-03-01 | 2010-06-10 | 日本電気株式会社 | Language processing system, language processing method, language processing program, and recording medium |
-
2014
- 2014-09-24 JP JP2014193785A patent/JP6519131B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016066174A (en) | 2016-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9262403B2 (en) | Dynamic generation of auto-suggest dictionary for natural language translation | |
US9672529B2 (en) | Advertisement translation device, advertisement display device, and method for translating an advertisement | |
US9767186B2 (en) | Retrieving a specific sentence from a document | |
US10929603B2 (en) | Context-based text auto completion | |
US10552539B2 (en) | Dynamic highlighting of text in electronic documents | |
CN104462030B (en) | Character conversion equipment, character conversion method | |
US11397740B2 (en) | Method and apparatus for providing information by using degree of association between reserved word and attribute language | |
JP2016505955A (en) | Conversion from flat book to rich book in electronic reader | |
JP6932162B2 (en) | Area-based item recommendation terminal device and item recommendation information provision method. | |
JP6908644B2 (en) | Document search device and document search method | |
JP6373243B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2012203569A (en) | Generation method and generation device of synonym list, retrieval method and retrieval device using synonym list and computer program | |
CN104424166A (en) | Text Processing Apparatus And Text Display System | |
US20130226619A1 (en) | Input support device and input support method | |
JP6519131B2 (en) | Dictionary selection device, document conversion system, program, and document conversion method | |
JP2014219833A (en) | Document reading comprehension support device, document reading comprehension support system, and program | |
JP2020009330A (en) | Creation support device and creation support method | |
JP2019121164A (en) | Document creating apparatus, document creating method, database construction apparatus, database construction method, and program | |
JP2013175136A (en) | Tracing support device, tracing support system, tracing support method, and tracing support program | |
JP5344649B2 (en) | Character string conversion apparatus, character string conversion method, program, and recording medium | |
CN108121692A (en) | character conversion method, device, system and storage medium | |
US20150112465A1 (en) | Method and Apparatus for On-Demand Conversion and Delivery of Selected Electronic Content to a Designated Mobile Device for Audio Consumption | |
JP7421859B2 (en) | Creation support device and creation support method | |
JP5288569B2 (en) | Electronic publication processing apparatus, electronic publication processing method, and program | |
CN111581363A (en) | Knowledge extraction method, device, equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170831 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180814 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6519131 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |