JP2008165415A - Document processor, document processing method, and program - Google Patents
Document processor, document processing method, and program Download PDFInfo
- Publication number
- JP2008165415A JP2008165415A JP2006352969A JP2006352969A JP2008165415A JP 2008165415 A JP2008165415 A JP 2008165415A JP 2006352969 A JP2006352969 A JP 2006352969A JP 2006352969 A JP2006352969 A JP 2006352969A JP 2008165415 A JP2008165415 A JP 2008165415A
- Authority
- JP
- Japan
- Prior art keywords
- document
- original document
- data
- translation
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、文書処理装置、文書処理方法およびプログラムに関する。 The present invention relates to a document processing apparatus, a document processing method, and a program.
近年、情報通信網、特にインターネットの発達に伴い、多言語の文書を作成・表示・検索等、処理する機会が増している。多言語の文書の処理では、例えば文書の読解や作成に際して言語障壁が問題となるが、この種の問題を解消するために、ある言語の文書を他の言語の文書に翻訳する翻訳システムが一般的に用いられている。 In recent years, with the development of information communication networks, particularly the Internet, opportunities for processing such as creation, display, and retrieval of multilingual documents have increased. In multilingual document processing, for example, language barriers become a problem in reading and creating documents. To solve this kind of problem, translation systems that translate documents in one language into documents in other languages are common. Has been used.
従来、この種の翻訳システムは、例えば分野毎等、予め複数の分類項目に分類された翻訳資源を有する翻訳辞書を備えており、利用者により文書毎に特定された分類項目に応じて翻訳資源を選択し、選択した翻訳資源を用いて翻訳対象の文書を翻訳する。一般的に、翻訳資源の量および翻訳資源の分類項目の細分化の程度に比例して、翻訳精度の向上が見込まれる。このため、利用者は、翻訳精度を高めるために、多くの分類項目から翻訳対象の文書毎に適切な分類項目を特定することになる。しかし、翻訳対象の文書の種類、例えば分野等は利用者毎にほぼ数種類に限定されていると考えられるので、多くの分類項目から翻訳対象の文書毎に適切な分類項目を特定する作業は利用者に負担を強いることになりかねない。 Conventionally, this type of translation system includes a translation dictionary having translation resources previously classified into a plurality of classification items, such as for each field, and the translation resources according to the classification items specified for each document by the user. And translate the document to be translated using the selected translation resource. Generally, improvement in translation accuracy is expected in proportion to the amount of translation resources and the degree of segmentation of translation resource classification items. For this reason, in order to improve the translation accuracy, the user specifies an appropriate classification item for each document to be translated from many classification items. However, since the types of documents to be translated, such as fields, are considered to be limited to almost several types for each user, the task of identifying appropriate classification items for each document to be translated from many classification items is used. It can put a burden on the person.
一方、下記特許文献1には、この種のシステムの一例として、翻訳対象の文書が予め登録された文書タイプのいずれに属するかを判断し、特定された文書タイプ毎に適合する辞書を用いて翻訳する文書翻訳方法が開示されている。本方法では、辞書の内部に文書タイプ毎の文書構造に適合した部分を予め作成しておき、文書領域毎に適切な辞書が選択されると、当該文書領域内の文書が特定書式の文書と一致している部分があるか否かが判定され、辞書内部の特定分野の文書構造に適合した部分を用いて翻訳が行われる。 On the other hand, in Patent Document 1 below, as an example of this type of system, it is determined whether a document to be translated belongs to a pre-registered document type, and a dictionary suitable for each specified document type is used. A document translation method for translation is disclosed. In this method, a part suitable for the document structure for each document type is created in the dictionary in advance, and when an appropriate dictionary is selected for each document area, the document in the document area becomes a document of a specific format. It is determined whether or not there is a matching part, and translation is performed using a part that matches the document structure of a specific field in the dictionary.
しかしながら、従来の方法では、翻訳対象の文書の属する文書タイプをシステムが自動判定するので、必ずしも適切な辞書資源を選択することができない。また、従来の方法では、予め設定された書式に従って作成された文書のみを翻訳対象としており、例えば文書中に他の文書を引用する場合等、予め設定された書式以外の文書を翻訳対象として取り扱うことができない。 However, in the conventional method, since the system automatically determines the document type to which the document to be translated belongs, it is not always possible to select an appropriate dictionary resource. Further, in the conventional method, only documents created according to a preset format are subject to translation. For example, when a document other than the preset format is cited in the document, the document is handled as a translation subject. I can't.
本発明は上記問題点に鑑みてなされたものであり、その目的は、多言語の文書を効率的に作成・表示・検索等、処理する、新規かつ改良された、文書処理装置、文書処理方法およびプログラムを提供することにある。 SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and an object of the present invention is to provide a new and improved document processing apparatus and document processing method for efficiently creating, displaying and searching a multilingual document. And to provide a program.
上記課題を解決するために、本発明の第1の観点によれば、通信回線網を介して利用者端末により接続され、通信回線網を介して受信した原文書を処理するための文書処理装置が提供される。本装置は、複数の分類項目に分類された翻訳資源を有する翻訳辞書部と、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、通信回線網を介して受信するためのデータ受信部と、入力データおよび分類小項目を利用者毎に記録するためのデータ記録部と、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源を翻訳辞書部から選択するための辞書選択部と、選択された翻訳資源に基づいて、入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳部と、利用者端末からの操作指令に応じて、所定の入力データをデータ記録部から読出し、読出された入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成部と、出力データを通信回線網を介して利用者端末に送信するためのデータ送信部と、を備える。 In order to solve the above problems, according to a first aspect of the present invention, a document processing apparatus connected to a user terminal via a communication line network and processing an original document received via the communication line network Is provided. The apparatus corresponds to one of a translation dictionary unit having translation resources classified into a plurality of classification items and a small classification item registered by a user in association with at least one of the translation resource classification items. A data receiving unit for receiving input data including classification information for classifying an original document, language information for distinguishing a creation language of the original document, and the original document via a communication network; A data recording unit for recording input data and small classification items for each user; a dictionary selection unit for selecting translation resources related to the classification items associated with the classification information in the input data from the translation dictionary unit; Based on the selected translation resource, the translation unit for translating the original document in the input data into at least one other language and the predetermined input data in accordance with the operation command from the user terminal. A data creation unit for creating output data including at least one of an original document in the input data read from the recording unit and the original document translated by the translation unit, and the output data in the communication network And a data transmission unit for transmitting to the user terminal via
かかる構成によれば、文書処理装置は、分類情報、言語情報および原文書を含む入力データを通信回線網を介して受信する。ここで、原文書は、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報とともに入力データとして処理される。このため、原文書は、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。また、文書処理装置は、所定の入力データをデータ記録部から読出し、読出された入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成する。このため、原文書および翻訳された翻訳文書の少なくともいずれかを含む出力データが利用者端末に出力される。また、入力データおよび分類小項目が利用者毎に記録されているので、翻訳資源の分類項目が利用者毎に容易に特定される。 According to such a configuration, the document processing apparatus receives the input data including the classification information, the linguistic information, and the original document via the communication line network. Here, the original document includes classification information for classifying the original document so as to correspond to any of the classification sub-items registered by the user in association with at least one of the translation resource classification items, and the original document. Are processed as input data together with language information for distinguishing the creation language. Therefore, the original document is translated into at least one other language based on the translation resource related to the classification item associated with the classification information in the input data. The document processing apparatus reads predetermined input data from the data recording unit, and creates output data including at least one of the original document in the read input data and the translated document of the original document translated by the translation unit. . For this reason, output data including at least one of the original document and the translated translation document is output to the user terminal. Moreover, since the input data and the small classification items are recorded for each user, the translation resource classification items are easily specified for each user.
また、操作情報を作成するための操作情報作成部をさらに備え、データ送信部が操作情報を利用者端末に送信するようにしてもよい。かかる構成によれば、操作情報が利用者端末に送信されるので、文書処理装置の各種機能が利用者端末により操作される。 Further, an operation information creation unit for creating operation information may be further provided, and the data transmission unit may transmit the operation information to the user terminal. According to such a configuration, since the operation information is transmitted to the user terminal, various functions of the document processing apparatus are operated by the user terminal.
また、上記操作情報作成部は、出力データに対応する入力データ中の原文書を少なくとも1つの他の言語に翻訳するための操作情報、および/または出力データに対応する翻訳文書を原文書に戻すための操作情報を作成するようにしてもよい。かかる構成によれば、入力データ中の原文書の表示言語を切替えるための操作情報が利用者端末に送信されるので、出力データに対応する入力データ中の原文書の表示言語が利用者端末により切替えられる。 In addition, the operation information creation unit returns the operation information for translating the original document in the input data corresponding to the output data into at least one other language and / or the translated document corresponding to the output data to the original document. Operation information may be created. According to such a configuration, the operation information for switching the display language of the original document in the input data is transmitted to the user terminal. Therefore, the display language of the original document in the input data corresponding to the output data is determined by the user terminal. Switched.
また、上記操作情報作成部は、入力データ中の原文書に追加される引用文書を少なくとも1つの他の言語に翻訳するための操作情報、および/または入力データ中の原文書に追加される引用文書の翻訳文書を原文書に戻すための操作情報を作成するようにしてもよい。かかる構成によれば、入力データ中の引用文書の表示言語を切替えるための操作情報が利用者端末に送信されるので、入力データ中の引用文書の表示言語が利用者端末により切替えられる。 In addition, the operation information creation unit may include operation information for translating the cited document added to the original document in the input data into at least one other language and / or a citation added to the original document in the input data. Operation information for returning the translated document of the document to the original document may be created. According to this configuration, the operation information for switching the display language of the cited document in the input data is transmitted to the user terminal, so that the display language of the cited document in the input data is switched by the user terminal.
また、上記操作情報作成部は、原文書が他の言語に翻訳された場合には、翻訳部により当該他の言語に翻訳された操作情報を作成し、翻訳文書が元の言語に戻された場合には、当該元の言語に戻された操作情報を作成するようにしてもよい。かかる構成によれば、原文書の表示言語に対応するように、操作情報の表示言語が切替えられる。 In addition, when the original document is translated into another language, the operation information creation unit creates operation information translated into the other language by the translation unit, and the translated document is returned to the original language. In this case, the operation information returned to the original language may be created. According to this configuration, the display language of the operation information is switched so as to correspond to the display language of the original document.
また、上記入力データとして原文書と原文書中に追加される引用文書とを区別するための引用情報をさらに含み、データ作成部が引用情報に基づいて出力データを作成するようにしてもよい。かかる構成によれば、原文書と引用文書とが引用情報により区別されるので、出力データが引用情報に基づいて作成される。 Further, the input data may further include citation information for distinguishing the original document and the citation document added to the original document, and the data creation unit may create output data based on the citation information. According to this configuration, since the original document and the cited document are distinguished from each other by the citation information, the output data is created based on the citation information.
また、上記入力データとして原文書および原文書中の引用文書の各々で作成言語を区別するための言語情報をさらに含むようにしてもよい。かかる構成によれば、原文書および引用文書の各々で言語情報により作成言語が区別される。 Further, the input data may further include language information for distinguishing the created language in each of the original document and the cited document in the original document. According to this configuration, the created language is distinguished by the language information in each of the original document and the cited document.
また、上記入力データ中の原文書および/または翻訳文書の要約を作成する要約作成部をさらに備えるようにしてもよい。かかる構成によれば、入力データ中の原文書および/または翻訳文書の要約が作成されるので、原文書および/または翻訳文書の代わりに当該文書の要約が用いられる。 Moreover, you may make it further provide the summary preparation part which produces the summary of the original document in the said input data, and / or a translation document. According to such a configuration, since the summary of the original document and / or the translation document in the input data is created, the summary of the document is used instead of the original document and / or the translation document.
また、上記データ作成部は、所定の分類情報を有する少なくとも1つの入力データをデータ記録部から検索し、検索された入力データ中の原文書および/または翻訳部により翻訳された原文書の翻訳文書を含む出力データを作成するようにしてもよい。かかる構成によれば、所定の分類情報を有する少なくとも1つの入力データが検索されるので、検索された入力データ中の原文書および/または翻訳された翻訳文書を含む出力データが作成される。 The data creation unit retrieves at least one input data having predetermined classification information from the data recording unit, and the original document in the retrieved input data and / or the translated document of the original document translated by the translation unit You may make it produce the output data containing. According to this configuration, since at least one input data having predetermined classification information is searched, output data including the original document and / or the translated translation document in the searched input data is created.
また、上記利用者端末により基本言語情報が設定され、データ作成部は、検索された入力データ中の言語情報が基本言語情報と同一である場合には原文書を含む出力データを作成し、基本言語情報と異なる場合には翻訳部により基本言語情報に対応する言語に翻訳された原文書の翻訳文書を含む出力データを作成するようにしてもよい。かかる構成によれば、基本言語情報と入力データ中の言語情報とが対比されるので、基本言語情報に対応するように、検索された入力データ中の原文書または翻訳された翻訳文書を含む出力データが作成される。 In addition, when the basic language information is set by the user terminal and the language information in the searched input data is the same as the basic language information, the data creation unit creates output data including the original document, If it is different from the language information, output data including a translation document of the original document translated into a language corresponding to the basic language information by the translation unit may be created. According to such a configuration, since the basic language information and the language information in the input data are compared, an output including the original document or the translated translated document in the searched input data so as to correspond to the basic language information. Data is created.
また、上記データ記録部は、翻訳部により予め翻訳された入力データ中の原文書の翻訳文書を当該入力データ中に記録するようにしてもよい。かかる構成によれば、入力データ中の原文書が予め翻訳されて入力データ中に記録される。 Further, the data recording unit may record a translation document of the original document in the input data previously translated by the translation unit in the input data. According to this configuration, the original document in the input data is translated in advance and recorded in the input data.
また、上記データ記録部は、出力データ中の原文書または翻訳文書であって、利用者端末により修正された原文書または翻訳文書をデータ受信部により受信し、該当する入力データ中に記録するようにしてもよい。かかる構成によれば、出力データ中の原文書または翻訳文書が利用者端末により修正されて該当する入力データ中に記録される。 The data recording unit is an original document or a translation document in the output data, the original document or the translation document corrected by the user terminal is received by the data receiving unit, and is recorded in the corresponding input data. It may be. According to such a configuration, the original document or the translation document in the output data is corrected by the user terminal and recorded in the corresponding input data.
また、上記入力データ中の原文書の作成言語を判定するための言語判定部をさらに備えるようにしてもよい。かかる構成によれば、原文書の作成言語を区別するための言語情報を受信する代わりに、入力データ中の原文書の作成言語が判定され、言語情報の代わりに用いられる。 In addition, a language determination unit for determining the creation language of the original document in the input data may be further provided. According to this configuration, instead of receiving language information for distinguishing the original document creation language, the original document creation language in the input data is determined and used instead of the language information.
また、上記データ送信部が出力データとともに原文書の言語情報を利用者端末に送信するようにしてもよい。かかる構成によれば、原文書の言語情報が出力データとともに利用者端末に出力される。 The data transmission unit may transmit the language information of the original document together with the output data to the user terminal. According to this configuration, the language information of the original document is output to the user terminal together with the output data.
また、上記利用者端末から受信した検索条件に一致する原文書を通信回線網を介して接続された各種通信コンテンツ上で検索するためのデータ検索部をさらに備え、データ受信部は、データ検索部により検索された原文書とともに、当該原文書の分類情報と、当該原文書の作成言語を区別するための言語情報とを入力データとして受信するようにしてもよい。かかる構成によれば、検索条件に一致する原文書が通信回線網を介して接続された各種通信コンテンツ上で検索される。文書処理装置は、分類情報、原文書および言語情報を含む入力データを受信する。このため、原文書は、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。 The data receiving unit further includes a data search unit for searching on various communication contents connected via a communication network for an original document that matches the search condition received from the user terminal. In addition to the original document retrieved by the above, classification information of the original document and language information for distinguishing the creation language of the original document may be received as input data. According to such a configuration, the original document that matches the search condition is searched on various communication contents connected via the communication line network. The document processing apparatus receives input data including classification information, an original document, and language information. Therefore, the original document is translated into at least one other language based on the translation resource related to the classification item associated with the classification information in the input data.
また、上記検索条件として検索文書、検索時点、検索範囲および原文書の更新時点の少なくともいずれかが指定されるようにしてもよい。かかる構成によれば、検索文書、検索時点、検索範囲および原文書の更新時点等の検索条件が指定される。 Further, at least one of a search document, a search time, a search range, and an update time of the original document may be designated as the search condition. According to this configuration, search conditions such as a search document, a search time, a search range, and an update time of the original document are specified.
また、上記検索条件として検索文書が指定されると、データ検索部が検索文書とともに翻訳部により翻訳された当該検索文書を用いて原文書を検索するようにしてもよい。かかる構成によれば、検索文書が翻訳されるので、検索文書または翻訳された当該検索文書に一致する原文書が検索される。 When a search document is specified as the search condition, the data search unit may search for the original document using the search document translated by the translation unit together with the search document. According to this configuration, since the search document is translated, the search document or the original document that matches the translated search document is searched.
また、上記翻訳辞書部が階層形式の複数の項目に分類された翻訳資源を備えており、辞書選択部が入力データ中の分類情報に関連付けられた分類項目および当該分類項目より上位の階層に相当する分類項目の翻訳資源を翻訳辞書部から選択し、翻訳部が選択された翻訳資源に基づいて、より下位の階層の翻訳資源を優先的に利用して、入力データ中の原文書を少なくとも1つの他の言語に翻訳するようにしてもよい。かかる構成によれば、翻訳資源が階層形式の複数の分類項目に分類されているので、翻訳に際しては、分類情報に関連付けられた分類項目および当該分類項目より上位の階層に相当する分類項目の翻訳資源が選択され、より下位の階層の翻訳資源が優先的に利用される。 The translation dictionary unit includes translation resources classified into a plurality of hierarchical items, and the dictionary selection unit corresponds to a classification item associated with the classification information in the input data and a hierarchy higher than the classification item. The translation resource of the classification item to be selected is selected from the translation dictionary unit, and the translation unit selects at least one original document in the input data by preferentially using the lower level translation resources based on the selected translation resource. It may be translated into two other languages. According to such a configuration, since the translation resources are classified into a plurality of classification items in a hierarchical format, the translation of the classification item associated with the classification information and the classification item corresponding to the hierarchy higher than the classification item is performed at the time of translation. Resources are selected, and translation resources at lower levels are preferentially used.
また、本発明の第2の観点によれば、通信回線網を介して利用者端末により接続され、複数の分類項目に分類された翻訳資源を有する装置において、通信回線網を介して受信した原文書を処理するための文書処理方法が提供される。本方法は、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、通信回線網を介して受信するデータ受信ステップと、入力データおよび分類小項目を利用者毎に記録するデータ記録ステップと、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源を選択する辞書選択ステップと、選択された翻訳資源に基づいて、入力データ中の原文書を少なくとも1つの他の言語に翻訳する翻訳ステップと、利用者端末からの操作指令に応じて、記録された入力データから所定の入力データを読出し、読出された入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するデータ作成ステップと、出力データを通信回線網を介して利用者端末に送信するデータ送信ステップと、を含む。 In addition, according to the second aspect of the present invention, in an apparatus connected by a user terminal via a communication network and having translation resources classified into a plurality of classification items, the original received via the communication network is used. A document processing method for processing a document is provided. This method includes classification information for classifying an original document so as to correspond to one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource, and an original document creation language. A data receiving step for receiving input data including language information for distinguishing the original document and the original document via a communication network, a data recording step for recording the input data and small classification items for each user, and an input A dictionary selection step for selecting a translation resource related to the classification item associated with the classification information in the data, and a translation for translating the original document in the input data into at least one other language based on the selected translation resource In accordance with the step and the operation command from the user terminal, the predetermined input data is read out from the recorded input data, and the original document and the translation in the read input data are read. Comprising a data generating step of generating an output data including at least one of the original document translated document, a data transmission step of transmitting to the user terminal via the communication network output data.
また、本発明の第3の観点によれば、通信回線網を介して利用者端末により接続され、複数の分類項目に分類された翻訳資源を有する文書処理装置に用いられるプログラムが提供される。本プログラムは、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、通信回線網を介して受信するためのデータ受信手段、入力データおよび分類小項目を利用者毎に記録するためのデータ記録手段、入力データ中の分類情報に関連付けられて分類項目に関連する翻訳資源を選択するための辞書選択手段、選択された翻訳資源に基づいて、入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳手段、利用者端末からの操作指令に応じて、記録された入力データから所定の入力データを読出し、読出された入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成手段、出力データを通信回線網を介して利用者端末に送信するためのデータ送信手段、として機能させる。 According to a third aspect of the present invention, there is provided a program used in a document processing apparatus connected by a user terminal via a communication network and having translation resources classified into a plurality of classification items. This program includes classification information for classifying an original document so as to correspond to one of the classification sub-items registered by the user in association with at least one of the translation resource classification items, and the language for creating the original document. Data receiving means for receiving input data including linguistic information for distinguishing and original document via a communication network, data recording means for recording input data and small classification items for each user A dictionary selection means for selecting a translation resource related to the classification item associated with the classification information in the input data, and based on the selected translation resource, the original document in the input data is converted into at least one other language Translation means for translating, in accordance with an operation command from the user terminal, reading predetermined input data from the recorded input data, and an original document in the read input data, Data creating means for creating an output data including at least one of translated the original document translated document, the data transmitting means for transmitting to the user terminal via the communication network output data, to function as a.
以上説明したように、本発明によれば、多言語の文書を効率的に作成・表示・検索等、処理する文書処理装置、文書処理方法およびプログラムが提供される。 As described above, according to the present invention, there are provided a document processing apparatus, a document processing method, and a program for processing, such as efficiently creating, displaying, and searching a multilingual document.
以下に、添付した図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the present specification and drawings, components having substantially the same functional configuration are denoted by the same reference numerals, and redundant description is omitted.
図1は、本発明の第1の実施形態に係る文書処理装置を含む文書処理システムの構成例を示す説明図である。本システムは、少なくとも1つの利用者端末10、インターネット20、文書処理装置100等で構成される。利用者端末10と文書処理装置100とは、インターネット20を介して接続されており、例えばIP(Internet Protocol)の上位プロトコルであるHTTP(HyperText Transfer Protocol)等に則って相互通信する。そして利用者は、利用者端末10によりインターネット20を介して文書作成装置100に文書を処理させる。
FIG. 1 is an explanatory diagram showing a configuration example of a document processing system including a document processing apparatus according to the first embodiment of the present invention. This system includes at least one
利用者端末10は、例えば、通信機能およびウェブブラウズ機能等を有する一般的な携帯電話、PHS(Personal Handy-phone System)、PDA(Personal Desktop Assistance)およびノート型コンピュータ等の携帯機器またはデスクトップ型コンピュータ等である。利用者端末10は、後述するように、処理対象とされる多言語の文書等の各種データや操作情報・指令をインターネット20を介して文書処理装置100との間で送受信する。
The
ここで、利用者端末10は、例えば制御部、通信部、記憶部および入出力部等を備える。制御部は、例えばCPU(Central Processing Unit)やMPU(Micro Processing Unit)等として構成されており、前述の他の構成部等を制御することにより、例えば、通信機能、インターネット接続機能およびウェブブラウズ機能等、利用者端末10の有する各種機能を制御する。また、制御部は、送受信データの暗号・復号化処理機能を有するようにしてもよい。通信部は、例えばアンテナ等を含む送受信機として構成されており、例えば、他の利用者端末を含む通信機器やインターネット20に対する接続や、それらとの間で相互に音声・データ情報の伝達等を担う。
Here, the
また、記憶部は、例えばROM(Read Only Memory)、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の主記憶装置として構成されており、後述するように、例えば、通信アドレス、各種プログラム、各種データ等の情報を記憶する。入出力部は、例えば、携帯電話である場合には、液晶パネル等の画像表示部、操作ボタンやスイッチ等の入力操作部、音声認識・発信部や振動発生部等を含み、利用者による情報入力や利用者に対する情報出力を担う。なお、入出力部として、カメラ等の画像入力装置、または例えばタッチ式パネル等のように、画像表示部と入力操作部とが一体形成されてもよい。 The storage unit is configured as a main storage device such as a ROM (Read Only Memory), a DRAM (Dynamic Random Access Memory), or an SRAM (Static Random Access Memory), for example, as described later, for example, a communication address, Information such as various programs and various data is stored. For example, in the case of a mobile phone, the input / output unit includes an image display unit such as a liquid crystal panel, an input operation unit such as operation buttons and switches, a voice recognition / sending unit, a vibration generating unit, etc. Responsible for input and information output to users. In addition, as an input / output unit, an image display unit and an input operation unit may be integrally formed, such as an image input device such as a camera, or a touch panel, for example.
インターネット20は、利用者端末10および文書処理装置100等を含む不特定多数の機器を接続する通信ネットワークであり、通信回線網として用いられる。なお、インターネット20は、通信回線網の一例であって、例えば、LAN(Local Area Network)やWAN(Wide Area Network)等、利用者端末10および文書処理装置100を含む不特定多数の機器を接続する通信ネットワークで代用される場合もある。
The
文書処理装置100は、例えばインターネット20に接続されている接続サービス会社のシステムの一部として構成されており、インターネット20を介して利用者端末10等から受信した多言語の文書を作成、表示、検索等、処理する装置として用いられる。
The
本実施形態に係る文書処理装置100は、翻訳辞書部102、処理制御部120、記憶部104、データ受信部106、データ記録部108およびデータ送信部110等を備えた、例えばWebサーバ等として構成される。なお、本装置100では、上記構成部の少なくとも1つが別個に備えられるようにしてもよい。また、図1に示されている各構成部間の接続は、あくまでも例示であって、係る場合に限定されるものではない。
The
翻訳辞書部102は、例えばハードディスク媒体やリムーバブル媒体等の補助記憶装置として構成されており、分野毎に予め複数の分類項目に分類された翻訳資源が登録されたデータベースであって、見出語、訳語、品詞、意味等が翻訳資源として登録されている。翻訳辞書部102は、例えば図2に示すように、ルート、上位階層、中位階層および下位階層が各々に、例えば「一般」、大項目(例えば「自然科学」)、中項目(例えば「化学」)および小項目(例えば「無機化学」)に相当するように、分類項目が階層形式を有している。なお、図示する階層形式は、あくまで例示にすぎず、係る場合に限定されるものではない。
The
記憶部104は、例えばROM(Read Only Memory)、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の主記憶装置として構成されており、後述するように、例えば、処理制御部120上で実行される各種処理プログラムや、プログラム実行中の処理データ等、操作情報に関する所定の情報等を記憶する。
The
データ受信部106は、例えば、インターネット20上で各種データ等の伝達を行うための受信機として構成されており、例えば、原文書の分類情報、言語情報および原文書を含む入力データや操作指令等の各種データをインターネット20を介して利用者端末10から受信する。
For example, the
データ記録部108は、例えばROM等の主記憶装置として構成されており、後述するように、例えば、認証登録情報、入力データや分類小項目等のデータを利用者毎に記録する。なお、データ記録部108は、その一部が例えばハードディスク媒体やリムーバル媒体等の補助記憶装置として構成されており、必要な情報を補助記憶装置から読出すような構成を有するようにしてもよい。
The
データ送信部110は、例えば、インターネット20上で各種データ等の伝達を行うための送信機として構成されており、例えば、出力データや操作情報などの各種データをインターネット20を介して利用者端末10に送信する。なお、データ送信部110は、データ受信部106とともに一体的なデータ送受信部として構成されるようにしてもよい。
For example, the
処理制御部120は、例えばCPUやMPU等として構成されており、例えば文書処理装置100上で実行される処理プログラムの一部として各々に構成される、辞書選択部122、翻訳部124、データ作成部126、操作情報作成部128等により構成される。また、処理制御部120には、要約作成部130や言語判定部132が選択的に備えられるようにしてもよい。なお、処理プログラムは、例えば記憶部104等や補助記憶装置等に記憶されており、必要に応じて処理制御部120により読出されるようにしてもよい。
The
辞書選択部122は、例えば、入力データ中の分類情報に基づいて、分類情報に関連付けられた分類項目に関連する翻訳資源を翻訳辞書部102から選択する。
For example, the
翻訳部124は、例えば、辞書選択部122により選択された翻訳資源に基づいて、入力データ中の原文書や操作情報等を少なくとも1つの他の言語に翻訳する。ここで、翻訳部124で行われる翻訳処理とは、入力文(原文)を解析し、コンピュータで処理できる内部表現(中間表現)を得たあと、その内部表現から翻訳対象言語の文(訳文)を生成する一連の処理である。
For example, based on the translation resource selected by the
データ作成部126は、例えば、利用者端末10からの操作指令に応じて、所定の入力データをデータ記録部108から読出し、読出された入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成する。
For example, the
操作情報作成部128は、例えば、文書の作成、検索、表示等の処理に際して、利用者端末10に送信される各種操作情報を作成する。操作情報に関連する所定の情報は、予め記憶部104等に記憶されているようにしてもよい。なお、所定の操作情報は、記憶部104に記憶される代わりにデータ記録部108に記録されるようにしてもよい。
For example, the operation
要約作成部130は、例えば、入力文書中の文脈ベクトルを解析することによって、入力文書中の重要部分を抽出し、入力文書の要約を作成する。 For example, the summary creation unit 130 analyzes a context vector in the input document to extract an important part in the input document, and creates a summary of the input document.
言語判定部132は、例えば、入力文字列から、所定の規則に従って複数の部分文字列を生成し、辞書部に記憶された文字列を検索し、生成された部分文字列と一致する文字列を探し出し、各部分文字列が属する可能性がある言語とその可能性を評価することにより、入力文字列が属する言語を決定する。 For example, the language determination unit 132 generates a plurality of partial character strings from an input character string according to a predetermined rule, searches for a character string stored in the dictionary unit, and selects a character string that matches the generated partial character string. The language to which the input character string belongs is determined by searching and evaluating the language to which each partial character string may belong and its possibility.
文書処理に際して、利用者は、インターネット20を介して利用者端末10を文書処理装置100に接続させる。文書処理装置100への接続に際しては、利用者端末10のインターネット接続機能等を用いて、文書処理装置100である例えばWebサーバ等に関するURL等の接続アドレスがHTTPプロトコルなどに則り指定される。
In document processing, the user connects the
利用者端末10により接続されると、文書処理装置100では、認証画面を表示するための操作情報が利用者端末10に送信される。ここで、認証画面を表示するための情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて、データ送信部110により利用者端末10に送信される。
When connected by the
利用者は、認証画面上で、例えば予め定義された利用者番号や暗証番号等の認証情報を入力し、送信ボタン等の操作手段の操作により認証情報を文書処理装置100に送信する。なお、認証情報は、利用者のセキュリティ情報に該当する場合があるので、利用者端末10の制御部等により予め所定の暗号化処理を施した上で送信されるようにしてもよい。
On the authentication screen, the user inputs authentication information such as a predefined user number or password, and transmits the authentication information to the
文書処理装置100では、認証情報が受信されると、データ記録部108等に予め登録されている登録情報が検索され、認証情報に一致する登録情報を有する利用者エンティティの存在が確認される。そして、利用者エンティティの存在が確認された場合には、利用者による以下の処理操作が許可され、利用者エンティティの存在が確認されなかった場合には、利用者による処理操作が許可されない。
In the
図3は、原文書の分類に用いる分類小項目を登録するための画面表示の一例を示す説明図である。分類小項目は、翻訳辞書部102に登録されている翻訳資源の分類項目の少なくともいずれかに原文書を関連付けるために、利用者により定義・登録される。
FIG. 3 is an explanatory diagram showing an example of a screen display for registering small classification items used for classification of original documents. The classification sub-item is defined and registered by the user in order to associate the original document with at least one of the translation resource classification items registered in the
分類小項目の登録に際しては、図3に示すような登録画面300を表示するための操作情報が文書処理装置100から利用者端末10に送信される。ここで、登録画面300を表示するための所定の情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信される。
When registering the small classification items, operation information for displaying a
登録画面300には、表示枠310が設けられ、翻訳辞書部102に登録されている翻訳資源の分類項目312が階層形式で表示されており、分類項目312毎の選択を可能にする選択手段314(例えばラジオボタン、チェックボックス等)が設けられる。表示枠310には、利用者により分類小項目が入力される入力枠316(例えばダイアログボックス等)と、選択手段314により選択された分類項目312に入力された分類小項目を関連付けて登録するための操作手段318(例えば選択ボタン等)が設けられる。
The
利用者は、原文書の分類小項目(例えば「大リーグ」)を入力枠316に入力し、分類小項目に関連付けるべき翻訳資源の分類項目312(例えば「野球」)を選択手段314により選択した上で、操作手段318を操作する。これにより、分類小項目の情報が利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。
The user inputs the classification item of the original document (for example, “major league”) in the
なお、任意の分類小項目に複数の分類項目312が関連付けられるようにしてもよい。また、表示枠310には、利用者により登録された分類小項目が翻訳資源の分類項目312とともに表示されるようにしてもよい。
A plurality of
図4は、原文書の処理画面の表示例を示す説明図である。以下では、本実施形態に係る文書処理装置100により行われる、原文書の作成、更新、表示、言語表示の切替および検索の各処理について説明する。
FIG. 4 is an explanatory diagram showing a display example of the processing screen of the original document. Hereinafter, each process of creation, update, display, language display switching, and search of the original document performed by the
原文書の処理に際しては、図4に示すような処理画面400を表示するための操作情報が文書処理装置100から利用者端末10に送信される。ここで、処理画面400を表示するための所定の情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信される。
When processing the original document, operation information for displaying a
処理画面400には、利用者により予め登録された分類小項目が分類小項目毎の選択を可能にする選択手段402(例えば選択ボタン等)とともに一覧形式で設けられる。なお、分類小項目は、一覧形式で設けられる代わりに、例えばスクロール形式で設けられるようにしてもよい。処理画面400には、処理対象とされる文書(以下、「処理文書」とも称する。)毎の処理内容を表示する表示枠410が設けられる。
In the
表示枠410には、処理文書の言語を切替えるための選択手段412(例えば、「English」、「中文」等の選択ボタン等)、原文書を選択するための選択手段414(例えば、「前」、「後」等の選択ボタン等)、原文書の処理を選択するための選択手段416(例えば、「作成」、「更新」、「表示」、「引用」、「検索」、「登録」等の選択ボタン等)等が設けられる。表示枠410には、処理文書を表示するための文書枠、ここでは特に、原文書の表題部420と本文部430とで区別された文書枠が設けられる。
The
原文書の作成に際して、利用者は、原文書の分類小項目(例えば「大リーグ」)を選択手段402Dにより選択し、原文書の作成を選択手段416Aにより選択する。これにより、データ送信部110により送信された操作情報により空白の文書枠(図4中の文書枠には、既に文書が入力されている。)が表示枠410に表示される。利用者は、文書枠上で所望の原文書(ここでは、表題部420および本文部430)を作成し、原文書の登録を選択手段416Fにより選択する。これにより、原文書に関連付けられた分類小項目の情報である分類情報、原文書の作成言語を区別するための言語情報および原文書の少なくともいずれかを含む入力データが利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。
When creating the original document, the user selects a classification sub-item (for example, “major league”) of the original document by the
ここで、入力データには、原文書の作成・更新時点を示す更新情報が含まれるようにしてもよい。また、原文書の言語情報については、選択手段412により選択されるようにしてもよく、または、予め規定値として設定されているようにしてもよい。なお、原文書の言語情報が選択手段412により切替えられる場合には、後述するように、処理画面400に表示される各種操作情報の表示言語が切替えられるようにしてもよい。
Here, the input data may include update information indicating the creation / update time of the original document. The language information of the original document may be selected by the selection unit 412 or may be set as a predetermined value in advance. When the language information of the original document is switched by the selection unit 412, as described later, the display language of various operation information displayed on the
図5は、原文書の入力データの一例を示す説明図である。図5の1行目には、「<language>ja</language>」と記述されている。ここで、「<language>」および「</language>」は、文書の言語情報を示すタグ(言語タグ)であり、両タグの間のタグ情報「ja」(ここでは、日本語を意味する。)により言語が指定されている。2行目には、文書の分類情報を示すタグ(分類タグ<category>)が記述されており、タグ情報「大リーグ」により分類が指定されている。3行目には、原文書(表題部)を示すタグ(表題タグ<title>)が記述されており、タグ情報「サヨナラ勝ち」により原文書(表題部)が指定されている。4行目〜6行目には、原文書(本文部)を示すタグ(本文タグ<description>)が記述されており、タグ情報「今日の...ありました。」により原文書(本文部)が指定されている。なお、ここでは、入力データ中に、分類情報、言語情報および原文書が含まれる場合を示すが、一部の情報のみが含まれる場合もある。 FIG. 5 is an explanatory diagram illustrating an example of input data of an original document. In the first line of FIG. 5, “<language> ja </ language>” is described. Here, “<language>” and “</ language>” are tags (language tags) indicating the language information of the document, and tag information “ja” (here, meaning Japanese) between both tags. .) Specifies the language. In the second line, a tag (category tag <category>) indicating the classification information of the document is described, and the classification is specified by the tag information “major league”. In the third line, a tag (title tag <title>) indicating the original document (title part) is described, and the original document (title part) is designated by the tag information “goodbye wins”. In the 4th to 6th lines, a tag (text tag <description>) indicating the original document (text part) is described, and the original document (text part) was added according to the tag information "Today's ...". ) Is specified. Here, although the case where classification information, language information, and an original document are included in the input data is shown, only a part of the information may be included.
利用者は、選択手段416Bにより原文書の更新を選択することができる。利用者は、文書枠420および/または430上で原文書(ここでは、表題部および/または本文部)を更新し、原文書の登録を選択手段416Fにより選択する。原文書の更新では、入力データ中の例えば本文タグにより指定される原文書(本文部)の情報が更新される。これにより、更新された原文書(本文部)を含む入力データが利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。ここで、データ記録部108上では、更新される文書が例えば本文タグに基づいて特定される。入力データに更新情報が含まれる場合には、更新情報が同時に更新される。
The user can select update of the original document by the selection means 416B. The user updates the original document (here, the title part and / or the body part) on the
利用者は、選択手段416Cにより分類小項目毎に原文書を表示させることができる。利用者は、原文書の分類小項目(例えば「大リーグ」)を選択手段402により選択し、原文書の表示を選択手段416Cにより選択する。これにより、分類小項目の情報が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。
The user can display the original document for each classified small item by the selection means 416C. The user selects a small classification item (for example, “major league”) of the original document by the selection unit 402, and selects the display of the original document by the
データ作成部126では、選択された分類小項目に該当する分類情報を有する入力データがデータ記録部108に記録されている入力データから検索される。そして、検索された入力データから、例えば最新の更新情報を有する入力データ中の原文書を含む出力データが作成され、データ送信部110により利用者端末10に送信される。利用者端末10では、出力データが処理文書として文書枠、ここでは特に、文書の表題部420と本文部430とに区別されて出力される。ここで、データ記録部108上では、検索される入力データが分類タグにより特定される。また、データ作成部126では、分類タグ、言語タグ、表題タグおよび本文タグに基づいて出力データが作成される。
In the
利用者は、原文書を選択手段414により選択することができる。これにより、選択情報、例えば現在の処理文書の入力データよりも1つ前の入力データを選択するための選択情報414A(例えば「前」等)が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。データ作成部126では、該当する更新情報を有する入力データがデータ記録部108から検索される。そして、検索された入力データから出力データが作成され、データ送信部110により利用者端末10に送信される。利用者端末10では、出力データが処理文書として出力される。ここでも、データ作成部126では、各種タグに基づいて出力データが作成される。
The user can select the original document by the selection means 414. As a result,
利用者は、処理文書の表示言語を選択手段412により切替えることができる。これにより、選択された表示言語の情報(例えば「English」等)が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。データ作成部126では、処理文書の入力データがデータ記録部108から読出される。
The user can switch the display language of the processed document by the selection unit 412. As a result, information on the selected display language (for example, “English”) is transmitted from the
データ作成部126では、選択された表示言語が入力データ中の言語情報と同一である場合には、原文書の翻訳が必要とされないので、入力データ中の原文書を含む出力データが作成される。ここで、データ作成部126では、言語タグに基づいて入力データの言語情報が特定される。
In the
一方、選択された表示言語が入力データ中の言語情報と異なる場合には、原文書の翻訳が必要とされるので、入力データ中の分類情報(例えば「大リーグ」等)が辞書選択部122に伝達される。ここで、分類タグに基づいて入力データ中の分類情報が特定される。辞書選択部122では、分類情報に対応する分類項目(例えば「野球」等)および当該分類項目より上位の階層に相当する分類項目(例えば「スポーツ」、「一般」等)の翻訳資源が選択される。翻訳部124では、選択された翻訳資源に基づいて、特により下位の階層の翻訳資源が優先的に利用されるように、入力データ中の原文書が選択手段412により選択された他の言語に翻訳される。データ作成部126では、翻訳された翻訳文書を含む出力データが作成される。なお、翻訳された翻訳文書は、後述するように入力データの一部としてデータ記録部108に登録されるようにしてもよい。
On the other hand, if the selected display language is different from the language information in the input data, translation of the original document is required, so that the classification information (for example, “major league”) in the input data is used as the
そして、いずれの場合も、データ作成部126では、各種タグに基づいて出力データが作成され、作成された出力データがデータ送信部110により利用者端末10に送信される。利用者端末10では、原文書または選択手段412により選択された表示言語に翻訳された処理文書として、出力データが出力される。
In either case, the
図6は、処理文書の表示言語が切替られた場合の処理画面の表示例を示す説明図である。処理文書の表示言語の切替により、文書枠(ここでは、表題部520および本文部530)に表示される処理文書の表示言語が英語に切替えられている。そして、処理文書とともに処理画面500に表示される各種操作情報の表示言語も切替えられている。
FIG. 6 is an explanatory diagram showing a display example of the processing screen when the display language of the processing document is switched. By switching the display language of the processed document, the display language of the processed document displayed in the document frame (here, the
各種操作情報の表示言語の切替えに際しては、図6に示すような翻訳された操作情報が文書処理装置100から利用者端末10に送信される。ここで、翻訳された操作情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信されるようにしてもよい。または、利用者端末10からの操作指令に応じて、記憶部104等に記憶されている所定の情報が翻訳部124により翻訳され、操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信されるようにしてもよい。
When switching the display language of various operation information, translated operation information as shown in FIG. 6 is transmitted from the
なお、利用者は、選択手段512により表示言語を元の言語、ここでは日本語に切替えることができる。ここでは、表示言語が英語に切替えられる場合について示すが、例えば中国語等の他の言語に切替えられる場合についても同様である。 Note that the user can switch the display language to the original language, here Japanese, by the selection means 512. Although the case where the display language is switched to English is shown here, the same applies to the case where the display language is switched to another language such as Chinese.
利用者は、選択手段516D等により原文書中に引用文書を追加することができる。ここで、引用文書とは、利用者により原文書と区別されるようにして原文書に追加される文書を意味する。また、引用文書には、文書自体のみならず、例えばURL(Uniform Resource Locator)等、インターネット20に接続された通信コンテンツ上の文書ファイルの位置を示す識別子が含まれる場合もある。
The user can add the cited document to the original document by the selection means 516D or the like. Here, the cited document means a document added to the original document so as to be distinguished from the original document by the user. In addition, the cited document may include not only the document itself but also an identifier indicating the position of the document file on the communication content connected to the
図7は、原文書に引用文書を追加する場合の処理画面の表示例を示す説明図である。なお、図4を用いてすでに説明された操作情報等については、説明を省略する。 FIG. 7 is an explanatory diagram showing a display example of a processing screen when a cited document is added to an original document. Note that description of operation information and the like already described with reference to FIG. 4 is omitted.
引用文書の追加に際しては、図7に示すような処理画面600を表示するための操作情報が文書処理装置100から利用者端末10に送信される。ここで、処理画面600を表示するための所定の情報は、例えば記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信される。
When adding a cited document, operation information for displaying a
処理画面600の表示枠610には、処理文書を処理するための文書枠、ここでは特に、処理文書の表題部620と本文部630とで区別され、本文部630に追加された引用部640を含む文書枠が設けられる。
A
引用文書の追加に際して、利用者は、選択手段612等により引用文書の作成言語を選択した上で、引用文書の追加を選択手段616D等により選択する。これにより、データ送信部110により送信された操作情報により空白の引用部640(図7中の引用部640にはすでに引用文書が追加されている。)が表示枠610に作成される。利用者は、引用部640上で所望の引用文書を追加し、原文書の登録を選択手段618F等により選択する。これにより、原文書の分類情報、原文書の言語情報および原文書と、引用文書の作成言語を区別するための言語情報および引用文書との少なくともいずれかを含む入力データが利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。
When adding the cited document, the user selects the cited document creation language by the selection means 612 and the like, and then selects the addition of the cited document by the selection means 616D and the like. Thereby, a blank citation unit 640 (a citation document has already been added to the
図8は、引用文書を含む処理文書の入力データの一例を示す説明図である。なお、図5を用いてすでに説明されたタグ情報等については、説明を省略する。 FIG. 8 is an explanatory diagram showing an example of input data of a processed document including a cited document. Note that description of tag information and the like already described with reference to FIG. 5 is omitted.
図8の4行目〜10行目には、原文書(本文部)を示すタグ(本文タグ<description>)が記述されており、特に4行目〜6行目のタグ情報「今日の...ありました。」により原文書(本文部)が指定されている。原文書(本文部)に含まれる7〜9行目には、原文書(引用部)を示すタグ(引用タグ<quote lang=”en”>)が記述されており、タグ情報「His homerun ......」により原文書(引用部)が指定されている。そして、引用タグ中の「lang=”en”」により引用文書の言語情報(ここでは英語)が指定されている。なお、ここでは、入力データ中に、分類情報、言語情報、原文書および引用文書が含まれる場合を示すが、一部の情報のみが含まれる場合もある。 The tags (text tag <description>) indicating the original document (text part) are described in the 4th to 10th lines in FIG. 8. In particular, the tag information “Today. The original document (text part) is specified. On the 7th to 9th lines included in the original document (body part), a tag (quotation tag <quote lang = “en”>) indicating the original document (quotation part) is described, and the tag information “His homerun. ..... "specifies the original document (quoting part). The language information (English here) of the cited document is designated by “lang =“ en ”” in the quote tag. Here, the case where classification information, linguistic information, an original document, and a cited document are included in the input data is shown, but only a part of the information may be included.
なお、文書枠の引用部640には、引用文書の言語を切替えるための選択手段642(例えば、「English」等の選択ボタン等)が設けられる。利用者は、引用文書の表示言語を選択手段642により切替えることができる。これにより、引用文書の選択された表示言語の情報が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。データ作成部126では、引用文書を含む原文書の入力データがデータ記録部108から読出される。
The document
データ作成部126では、選択された表示言語が入力データ中の引用文書の言語情報と同一である場合には、原文書の翻訳が必要とされないので、入力データ中の引用文書を含む出力データが作成される。データ作成部126では、言語タグに基づいて入力データ中の引用文書の言語情報が特定される。
In the
一方、選択された表示言語が入力データ中の引用文書の言語情報と異なる場合には、引用文書の翻訳が必要とされるので、入力データ中の分類情報(例えば「大リーグ」等)が辞書選択部122に伝達される。ここで、分類タグに基づいて入力データ中の分類情報が特定される。辞書選択部122では、分類情報に対応する分類項目(例えば「野球」等)および当該分類項目より上位の階層に相当する分類項目(例えば「スポーツ」、「一般」等)の翻訳資源が選択される。翻訳部124では、選択された翻訳資源に基づいて、特により下位の階層の翻訳資源が優先的に利用されるように、入力データ中の引用文書が選択手段642等により選択された他の言語に翻訳される。データ作成部126では、翻訳された翻訳文書を含む出力データが作成される。なお、翻訳された翻訳文書は、後述するように入力データの一部としてデータ記録部108に登録されるようにしてもよい。
On the other hand, if the selected display language is different from the linguistic information of the cited document in the input data, it is necessary to translate the cited document. Therefore, the classification information (for example, “major league”) in the input data is stored in the dictionary. This is transmitted to the
そして、いずれの場合も、データ作成部126では、各種タグに基づいて出力データが作成され、作成された出力データがデータ送信部110により利用者端末10に送信される。利用者端末10では、引用文書または選択手段642等により選択された表示言語に翻訳された引用文書として、出力データが出力される。
In either case, the
図9は、引用文書を含む原文書から出力データを作成するための処理を説明するフロー図である。図9に示すように、データ作成部126では、図8に示すような入力データから出力データが作成される。まず、データ記録部108から読出された入力データ中のタグが読込まれる(S600)。タグが引用タグであるかが判断される(S602)。タグが引用タグであり、かつタグ情報が設定言語(ここでは、日本語)と異なる場合には、文書枠に切替手段642等を表示するための操作情報がデータ送信部110により利用者端末10に送信される(S606)。タグが引用タグでない場合には、タグに応じた処理、例えば題名部に所定の書式を設定する等、出力データを作成するための処理がなされる(S608)。当該タグに応じた処理が完了すると、入力データ中の次のタグの読込みが試みられ(S610)、次のタグが存在する場合には、タグが読込まれ(S600)、次のタグが存在しない場合には、出力データがデータ送信部110により利用者端末10に送信されて(S612)、処理が終了する。
FIG. 9 is a flowchart for explaining processing for creating output data from an original document including a cited document. As shown in FIG. 9, the
図10は、引用文書の表示言語が切替られた場合の処理画面の表示例を示す説明図である。引用文書の表示言語の切替により、処理画面700の文書枠710の引用部750に表示される引用文書の表示言語が日本語に切替えられている。なお、利用者は、選択手段752により表示言語を元の言語、ここでは英語に切替えることができる。ここでは、表示言語が日本語に切替えられる場合について示すが、例えば中国語等の他の言語に切替えられる場合についても同様である。
FIG. 10 is an explanatory diagram illustrating a display example of the processing screen when the display language of the cited document is switched. By switching the display language of the cited document, the display language of the cited document displayed in the
図11は、引用文書が対訳形式で表示される場合の処理画面の表示例を示す説明図である。図10に示す選択手段754により、対訳形式による表示が選択されると、文書枠には、原文部860と翻訳部862とに区別された引用部が設けられる。そして、引用部の一方860には、入力データ中の引用文書が表示され、他方862には入力データ中の引用文書を他の言語に翻訳した翻訳文書が表示される。この場合には、引用部862の表示を元の表示に戻すための選択手段864が設けられる。これにより、利用者は、原文書と翻訳文書とを容易に対比することができ、翻訳文書の修正を容易に行うことができる。
FIG. 11 is an explanatory diagram illustrating a display example of a processing screen when a cited document is displayed in a bilingual format. When the display in the bilingual format is selected by the
データ記録部108には、原文書または引用文書から翻訳された翻訳文書が入力データの一部として登録されるようにしてもよい。これにより、利用者は、翻訳文書の修正を行うことができるので、翻訳品質の向上が図られる。
In the
利用者は、翻訳文書が表示されている文書枠(例えば、図7中の表題部620、本文部630、引用部640等)を例えば入力カーソル等により選択し、翻訳文書の登録を選択手段616Fにより選択する。翻訳文書の登録では、原文書(翻訳部)を示すタグ(翻訳タグ<translate, lang-“en”>)を用いて、タグ情報「His homerun ......」としての翻訳文書が入力データ中に追加される。そして、翻訳タグ中の「lang=”ja”」により翻訳文書の言語情報(ここでは日本語)が指定されている。なお、選択された文書枠(例えば本文部640等)について、選択された言語(例えば日本語等)に対応する翻訳文書がすでに入力データ中に登録されている場合には、登録されている入力データの翻訳情報が更新される。
The user selects a document frame (for example, the
翻訳文書が入力データの一部として登録される場合には、原文書の登録に際して、入力データの有する言語情報と異なる他の言語により翻訳された翻訳文書が入力データの一部として同時に登録されるようにしてもよい。この場合には、翻訳されるべき言語が利用者により予め設定されるようにしてもよい。これにより、利用者は、原文書とともに翻訳文書をデータ記録部108に登録することができる。
When a translated document is registered as a part of input data, when the original document is registered, a translated document translated in another language different from the language information of the input data is simultaneously registered as a part of the input data. You may do it. In this case, the language to be translated may be set in advance by the user. Thereby, the user can register the translated document together with the original document in the
利用者は、検索条件を指定した上で選択手段616E等により原文書を検索することができる。利用者は、検索条件として指定した文書枠(例えば本文部620等)を例えば入力カーソル等により選択し、原文書の検索を選択手段616E等により選択する。これにより、例えば選択された文書枠620等に、データ送信部110により送信された操作情報により入力枠(例えばダイアログボックス等、不図示)が表示される。利用者は、入力枠上で所望の検索条件を入力し、例えば再び原文書の検索を選択手段616E等により選択する。これにより、検索条件が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。
The user can search for the original document with the selection means 616E or the like after designating the search conditions. The user selects a document frame (for example, the body portion 620) designated as the search condition by using, for example, an input cursor, and selects the original document search by the
データ作成部126では、選択された文書枠(例えば本文部)に該当し、かつ指定された検索条件に該当する文書を有する入力データがデータ記録部108に記録されている入力データから検索される。そして、検索された入力データから、例えば最新の更新情報を有する入力データ中の原文書を含む出力データが作成され、データ送信部110により利用者端末10に送信される。利用者端末10では、出力データが処理文書として選択された文書枠(例えば本文部620)に出力される。ここで、データ記録部108上では、検索される入力データが各種タグにより特定される。また、データ作成部126でも、各種タグに基づいて出力データが作成される。
In the
なお、検索に際して、検索条件として原文書の分類小項目(例えば「大リーグ」)を選択手段612等により選択するようにしてもよい。この場合には、検索された入力データの分類情報が分類タグに基づいて判定される。また、翻訳文書が入力データの一部として登録されている場合には、翻訳文書も検索対象に含まれるようにしてもよい。これにより、利用者は、検索条件および検索範囲をより詳細に設定することができるので、検索精度の向上が図られる。 At the time of the search, as a search condition, a classification small item (for example, “major league”) of the original document may be selected by the selection means 612 or the like. In this case, the classification information of the searched input data is determined based on the classification tag. In addition, when a translation document is registered as a part of input data, the translation document may be included in the search target. Thereby, the user can set the search condition and the search range in more detail, so that the search accuracy can be improved.
以上のように、本実施形態に係る文書処理装置100によれば、インターネット20を介して受信される原文書は、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報とともに入力データとして処理される。このため、原文書は、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。また、文書処理装置100は、入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成する。このため、原文書および翻訳された翻訳文書の少なくともいずれかを含む出力データが利用者端末10に出力される。また、入力データおよび分類小項目が利用者毎に記録されているので、翻訳資源の分類項目が利用者毎に容易に特定される。これにより、文書の読解や作成に際しての言語障壁が解消される等、多言語の文書の作成、検索、表示等の処理が効率化される。
As described above, according to the
図12は、本発明の第2の実施形態に係る文書処理装置を含む文書処理システムの構成例を示す説明図である。本システムの構成は、第1の実施形態に係る文書処理装置100を含む文書処理システムと基本的に同様である。ただし、本システムでは、文書処理装置200がインターネット20に接続された各種通信コンテンツ30上の文書ファイル等にもアクセスする。
FIG. 12 is an explanatory diagram showing a configuration example of a document processing system including a document processing apparatus according to the second embodiment of the present invention. The configuration of this system is basically the same as that of the document processing system including the
文書処理装置200の構成も、第1の実施形態に係る文書処理装置100と基本的に同様である。ただし、文書処理装置200は、データ検索部234をさらに備える。以下では、第1の実施形態に係る文書処理装置100と同様な構成要素については、説明を省略する。また、図12に示されている各構成部間の接続は、あくまでも例示であって、係る場合に限定されるものではない。
The configuration of the
ここで、データ検索部234は、例えば、文書処理装置200上で実行される処理プログラムの一部として、処理制御部220に含まれ、例えば、利用者端末10から受信した検索条件に一致する原文書をインターネット20を介して接続された各種通信コンテンツ30上で検索する。また、データ検索部232は、Webサーバ等である文書処理装置200に付随する検索サーバ等で代用されるようにしてもよい。
Here, the
図13は、原文書の処理画面の表示例を示す説明図である。文書処理装置200は、前述した第1の実施形態の文書処理装置100と同様に、原文書の作成、更新、表示、言語表示の切替および検索等、複数の処理を行うが、ここでは、特に原文書のインターネット検索および表示の各処理について説明する。なお、処理画面900の構成等、前述した項目については、説明を省略する。
FIG. 13 is an explanatory diagram showing a display example of the processing screen of the original document. The
原文書のインターネット検索に際して、利用者は、原文書の分類小項目を選択手段902により選択し、検索条件を指定した上で選択手段918により原文書をインターネット検索することができる。選択手段918によりインターネット検索が選択されると、データ送信部210により送信された操作情報により入力枠932(例えばダイアログボックス等)が例えば文書枠930に表示される。利用者は、入力枠932上で所望の検索条件を入力し、例えば再びインターネット検索を選択手段918により選択する。これにより、検索条件が利用者端末10から文書作成装置200に送信されてデータ検索部232に伝達される。
When searching the Internet for an original document, the user can select a small category item of the original document by the selection unit 902, specify a search condition, and search the Internet for the original document by the
検索条件は、一般に任意の単語や文節等の検索文書と考えられる。しかし、検索文書、定期的な検索時点(例えば、月曜日の正午等)、検索対象とすべき通信コンテンツの作成言語や作成組織(例えば研究機関のみ等)等の検索範囲、および原文書の更新時点(例えば、直近1ヶ月以内等)等の少なくともいずれかが検索条件として指定されるようにしてもよい。また、この種の検索条件毎の組合せ(例えば、検索文書と検索時点の組合せ)や、任意の検索条件同士の組合せ(検索文書1と検索文書2の組合せ)が検索条件として指定されるようにしてもよい。 The search condition is generally considered to be a search document such as an arbitrary word or phrase. However, the search range of the search document, the periodic search time (for example, Monday noon), the search range of the communication content creation language and the organization to be searched (for example, research institutes only), and the update time of the original document At least one of (for example, within the last month) may be specified as the search condition. In addition, a combination for each type of search condition (for example, a combination of a search document and a search point) or any combination of search conditions (a combination of search document 1 and search document 2) is designated as a search condition. May be.
また、検索条件として検索文書が入力された場合には、入力された検索文書が少なくとも1つの他の言語に翻訳され、入力された検索文書とともに翻訳された当該検索文書を用いて原文書が検索されるようにしてもよい。この場合には、データ検索部232に伝達された検索文書が翻訳部224により翻訳され、再びデータ検索部232に伝達される。これにより、利用者は、検索条件および検索範囲をより広範に設定することができるので、検索精度の向上が図られる。
When a search document is input as a search condition, the input search document is translated into at least one other language, and the original document is searched using the search document translated together with the input search document. You may be made to do. In this case, the search document transmitted to the
データ検索部232では、インターネット20に接続されている各種通信コンテンツ30の文書ファイル上で検索条件に該当する原文書が検索される。検索条件に該当する原文書は、インターネット20上に少なくとも1つ以上存在し、場合によっては存在しない場合もある。データ受信部206では、検索された原文書が、原文書の分類情報および言語情報とともに入力データとして受信され、入力データがデータ記録部208に登録される。
In the
なお、入力データの原文書は、通常のテキストデータのみならず、例えば原文書が含まれる文書ファイルのインターネット20上での位置を表す識別子(例えば、URL、RSS等)として登録されるようにしてもよい。この場合、データ作成部226では、識別子に対応する文書ファイルのテキストデータが予め作成された上で出力データが作成される。これにより、データ記録部208の容量負荷を解消することができる。
Note that the original document of the input data is registered not only as normal text data but also as an identifier (for example, URL, RSS, etc.) indicating the position of the document file containing the original document on the
図14は、原文書の入力データの一例を示す説明図である。図14には、3つの入力データが入力データの区切りを示すタグ(項目タグ<item>)を用いて記述されている。各入力データには、分類タグ(<category>)、言語タグ(<language>)、表題タグ(<title>)および本文タグ(<description>)を用いて、分類情報、言語情報、原文書(表題部、本文部)が含まれている。なお、ここでは、入力データ中に、分類情報、言語情報および原文書が含まれる場合を示すが、一部の情報のみが含まれる場合もある。 FIG. 14 is an explanatory diagram showing an example of input data of an original document. In FIG. 14, three pieces of input data are described using tags (item tag <item>) indicating the delimiters of the input data. Each input data uses classification tag (<category>), language tag (<language>), title tag (<title>), and body text tag (<description>). (Title section, text section). Here, although the case where classification information, language information, and an original document are included in the input data is shown, only a part of the information may be included.
データ作成部226では、図14に示すような入力データから、例えば新しい更新情報を有する少なくとも1つ以上の入力データ中の原文書を含む出力データが作成され、データ送信部210により利用者端末10に送信される。利用者端末10では、出力データが処理文書として出力される。
In the
なお、出力データの作成に際して、原文書の要約が要約作成部130により作成されて、原文書の代わりに出力データに含まれるようにしてもよい。また、原文書の一部がデータ作成部226により作成されて、原文書の全ての代わりに出力データに含まれるようにしてもよい。これにより、利用者は、一度に多数の出力データを容易に閲覧することができ、多数の文書の閲覧性が向上する。
When the output data is created, the summary of the original document may be created by the summary creating unit 130 and included in the output data instead of the original document. Also, a part of the original document may be created by the
図15は、図14に示すような入力データから作成された出力データの表示例を示す説明図である。なお、図15には、処理画面1000に表示枠1010が設けられ、入力データ中の項目タグに基づいて3つの文書枠1020、1030、1040が表示されており、各原文書に対応する入力データ中の言語情報、原文書に基づいて、指定された表示言語により原文書が表示されている。また、言語情報として英語の情報を有する入力データの文書枠1030には、原文書の表示言語(ここでは、日本語)を選択するための選択手段1032(例えば、選択ボタン等)が設けられる。
FIG. 15 is an explanatory diagram showing a display example of output data created from input data as shown in FIG. In FIG. 15, a
利用者は、選択手段1032により原文書の表示言語を切替えることができる。これにより、選択された表示言語の情報(例えば「English」等)が利用者端末10から文書作成装置100に送信されてデータ作成部226に伝達される。データ作成部226では、処理文書の入力データがデータ記録部208から読出され、必要に応じて翻訳が行われ、作成された出力データがデータ送信部210により利用者端末10に送信される。利用者端末10では、原文書または選択手段1022により選択された表示言語に翻訳された処理文書として、出力データが出力される。ここでも、データ作成部226では、各種タグに基づいて出力データが作成される。
The user can switch the display language of the original document by the
図16は、インターネット検索された原文書から出力データを作成するための処理を説明するフロー図である。図16に示すように、データ作成部226では、図14に示すような入力データから出力データが作成される。まず、利用者端末10からの操作指令に応じて、基本言語情報が設定される。基本言語情報とは、処理文書の検索や表示等、処理に際して用いる基本的な言語を設定するための情報である。データ作成部226では、データ記録部208から読出された入力データ中のタグが読込まれる(S1000)。タグが言語タグであるかが判定される(S1002)。タグが言語タグであり、かつタグ情報が基本言語情報と異なる場合には、文書枠1030に切替手段1032を表示するための操作情報が操作情報作成部228により作成され、データ送信部210により利用者端末10に送信される(S1006)。タグが言語タグでない場合には、タグに応じた処理、例えば題名部に所定の書式を設定する等、出力データを作成するための処理がなされる(S1008)。当該タグに応じた処理が完了すると、入力データ中の次のタグの読込みが試みられ(S1010)、次のタグが存在する場合には、タグが読込まれ(S1000)、次のタグが存在しない場合には、出力データがデータ送信部210により利用者端末10に送信される(S1012)て、処理が終了する。
FIG. 16 is a flowchart for explaining processing for creating output data from an original document searched on the Internet. As shown in FIG. 16, the
図17は、図15に示す表示例と同様な出力データの表示例を示す説明図である。図17の表示例では、処理画面1100に表示枠1110が設けられ、文書枠1130、1140、1150に入力データ中の言語情報が表示される。これにより、利用者は、入力データ中の言語情報を容易に判別することができる。文書枠1120、1130、1140には、全文表示と要約表示とを切替えるための選択手段1122、1134、1136、1142(例えば選択ボタン等)が設けられる。また、言語情報として英語の情報を有する入力データの文書枠1130には、原文書の表示言語(ここでは、日本語)を選択するための選択手段1132(例えば、選択ボタン等)が設けられる。
FIG. 17 is an explanatory diagram showing a display example of output data similar to the display example shown in FIG. In the display example of FIG. 17, a
図17に示す表示例は、基本言語情報として日本語が設定されている場合の表示例である。このため、出力データの作成に際して、基本言語(ここでは、日本語)と異なる言語情報(ここでは、英語)を有する入力データの原文書が予め翻訳部224により基本言語(日本語)に翻訳された上で翻訳文書として出力データが作成されている。これにより、利用者は、多数の文書を表示言語が統一された状態で閲覧することができるので、多言語の文書が効率的に処理される。
The display example shown in FIG. 17 is a display example when Japanese is set as the basic language information. Therefore, when creating the output data, the original document of the input data having language information (here, English) different from the basic language (here, Japanese) is translated into the basic language (Japanese) by the
以上のように、本実施形態に係る文書処理装置200によれば、検索条件に一致する原文書がインターネット20を介して接続された各種通信コンテンツ30上で検索され、分類情報、原文書および言語情報を含む入力データが作成される。このため、原文書は、入力データ中の分類情報に対応する分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。また、多言語で作成された複数の原文書が、予め設定された基本言語情報に対応する言語に翻訳されて一覧表示されるので、詳細な表示が望まれる所望の原文書を容易に特定することができる。これにより、文書の閲覧性が向上する等、多言語の文書の作成、検索、表示等の処理が効率化される。
As described above, according to the
本発明に基づく方法は、コンピュータプログラムの形式で実現されるようにしてもよい。この場合、コンピュータプログラムは、文書処理装置100、200上、特に処理制御部120、220上で実行可能であって、本発明に基づく方法を実行するためにプログラミングされている。この場合、本発明がコンピュータプログラムによって実行されるので、コンピュータプログラムは、コンピュータプログラムによる実行に適した方法と同様に、本発明を表す。コンピュータプログラムは、記憶部104、204上またはコンピュータ読取可能な媒体上に記憶されるようにしてもよい。
The method according to the invention may be implemented in the form of a computer program. In this case, the computer program can be executed on the
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、特許請求の範囲に記入された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, this invention is not limited to the example which concerns. It is obvious for those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea described in the scope of claims, and of course, the technical scope of the present invention is also possible. It is understood that it belongs to.
10 利用者端末
20 インターネット
30 通信コンテンツ
100、200 文書処理装置
102、202 翻訳辞書部
104、204 記憶部
106、206 データ受信部
108、208 データ記録部
110、210 データ送信部
120、220 処理制御部
122、222 辞書選択部
124、224 翻訳部
126、226 データ作成部
128、228 操作情報作成部
130、230 要約作成部
132、232 言語判定部
234 データ検索部
DESCRIPTION OF
Claims (20)
複数の分類項目に分類された翻訳資源を有する翻訳辞書部と、
前記翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、前記通信回線網を介して受信するためのデータ受信部と、
前記入力データおよび前記分類小項目を利用者毎に記録するためのデータ記録部と、
前記入力データ中の前記分類情報に関連付けられた分類項目に関連する前記翻訳資源を前記翻訳辞書部から選択するための辞書選択部と、
選択された前記翻訳資源に基づいて、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳部と、
前記利用者端末からの操作指令に応じて、所定の前記入力データを前記データ記録部から読出し、読出された前記入力データ中の原文書および前記翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成部と、
前記出力データを前記通信回線網を介して前記利用者端末に送信するためのデータ送信部と、
を備えることを特徴とする文書処理装置。 A document processing apparatus connected to a user terminal via a communication line network for processing an original document received via the communication line network,
A translation dictionary having translation resources classified into a plurality of classification items;
Classifying information for classifying an original document so as to correspond to any one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource is distinguished from the creation language of the original document A data receiving unit for receiving, via the communication line network, input data including language information for use and an original document;
A data recording unit for recording the input data and the small classification items for each user;
A dictionary selection unit for selecting, from the translation dictionary unit, the translation resource related to the classification item associated with the classification information in the input data;
A translation unit for translating the original document in the input data into at least one other language based on the selected translation resource;
In response to an operation command from the user terminal, the predetermined input data is read from the data recording unit, and at least the original document in the read input data and the translated document of the original document translated by the translation unit A data creation unit for creating output data including any of them,
A data transmission unit for transmitting the output data to the user terminal via the communication network;
A document processing apparatus comprising:
前記データ受信部は、前記データ検索部により検索された原文書とともに、当該原文書の分類情報と、当該原文書の作成言語を区別するための言語情報とを前記入力データとして受信することを特徴とする、請求項1に記載の文書処理装置。 A data search unit for searching on various communication contents connected via the communication line network for an original document that matches the search condition received from the user terminal;
The data receiving unit receives, as input data, classification information of the original document and language information for distinguishing a creation language of the original document together with the original document searched by the data search unit. The document processing apparatus according to claim 1.
前記翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、前記通信回線網を介して受信するデータ受信ステップと、
前記入力データおよび前記分類小項目を利用者毎に記録するデータ記録ステップと、
前記入力データ中の前記分類情報に関連付けられた分類項目に関連する前記翻訳資源を選択する辞書選択ステップと、
選択された前記翻訳資源に基づいて、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳する翻訳ステップと、
前記利用者端末からの操作指令に応じて、記録された前記入力データから所定の前記入力データを読出し、読出された前記入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するデータ作成ステップと、
前記出力データを前記通信回線網を介して前記利用者端末に送信するデータ送信ステップと、
を含むことを特徴とする文書処理方法。 A document processing method for processing an original document received via a communication line network in an apparatus connected by a user terminal via a communication line network and having translation resources classified into a plurality of classification items. ,
Classifying information for classifying an original document so as to correspond to any one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource is distinguished from the creation language of the original document A data receiving step for receiving input data including language information for use and an original document via the communication line network;
A data recording step for recording the input data and the small classification items for each user;
A dictionary selection step of selecting the translation resource associated with a classification item associated with the classification information in the input data;
Translating the original document in the input data into at least one other language based on the selected translation resource;
In response to an operation command from the user terminal, the predetermined input data is read from the recorded input data, and at least one of the original document in the read input data and the translated document of the translated original document A data creation step for creating output data including
A data transmission step of transmitting the output data to the user terminal via the communication line network;
A document processing method comprising:
前記翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、前記通信回線網を介して受信するためのデータ受信手段、
前記入力データおよび前記分類小項目を利用者毎に記録するためのデータ記録手段、
前記入力データ中の前記分類情報に関連付けられて分類項目に関連する前記翻訳資源を選択するための辞書選択手段、
選択された前記翻訳資源に基づいて、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳手段、
前記利用者端末からの操作指令に応じて、記録された前記入力データから所定の前記入力データを読出し、読出された前記入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成手段、
前記出力データを前記通信回線網を介して前記利用者端末に送信するためのデータ送信手段、
として機能させるためのプログラム。 A program used in a document processing apparatus connected by a user terminal via a communication network and having translation resources classified into a plurality of classification items, the document processing apparatus comprising:
Classifying information for classifying an original document so as to correspond to any one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource is distinguished from the language in which the original document is created Data receiving means for receiving input data including linguistic information and an original document via the communication line network,
Data recording means for recording the input data and the small classification items for each user;
A dictionary selection means for selecting the translation resource associated with the classification item associated with the classification information in the input data;
Translation means for translating the original document in the input data into at least one other language based on the selected translation resource;
In response to an operation command from the user terminal, the predetermined input data is read from the recorded input data, and at least one of the original document in the read input data and the translated document of the translated original document Data creation means for creating output data including
Data transmission means for transmitting the output data to the user terminal via the communication line network;
Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006352969A JP2008165415A (en) | 2006-12-27 | 2006-12-27 | Document processor, document processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006352969A JP2008165415A (en) | 2006-12-27 | 2006-12-27 | Document processor, document processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008165415A true JP2008165415A (en) | 2008-07-17 |
Family
ID=39694850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006352969A Pending JP2008165415A (en) | 2006-12-27 | 2006-12-27 | Document processor, document processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008165415A (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08202721A (en) * | 1995-01-31 | 1996-08-09 | Oki Electric Ind Co Ltd | Document retrieval and display system with translating function |
JPH1078965A (en) * | 1996-09-04 | 1998-03-24 | Matsushita Electric Ind Co Ltd | Document display device |
JP2002091965A (en) * | 2000-09-19 | 2002-03-29 | Oki Electric Ind Co Ltd | Dictionary device |
JP2003141018A (en) * | 2001-11-02 | 2003-05-16 | Fujitsu Ltd | Server, relay device, information providing method and program |
JP2004265423A (en) * | 1996-05-28 | 2004-09-24 | Ricoh Co Ltd | Document translation method |
-
2006
- 2006-12-27 JP JP2006352969A patent/JP2008165415A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08202721A (en) * | 1995-01-31 | 1996-08-09 | Oki Electric Ind Co Ltd | Document retrieval and display system with translating function |
JP2004265423A (en) * | 1996-05-28 | 2004-09-24 | Ricoh Co Ltd | Document translation method |
JPH1078965A (en) * | 1996-09-04 | 1998-03-24 | Matsushita Electric Ind Co Ltd | Document display device |
JP2002091965A (en) * | 2000-09-19 | 2002-03-29 | Oki Electric Ind Co Ltd | Dictionary device |
JP2003141018A (en) * | 2001-11-02 | 2003-05-16 | Fujitsu Ltd | Server, relay device, information providing method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10796076B2 (en) | Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine | |
KR101076858B1 (en) | Methods and systems for language translation | |
US7890506B2 (en) | User interface control apparatus and method thereof | |
US6697838B1 (en) | Method and system for annotating information resources in connection with browsing, in both connected and disconnected states | |
JP5264892B2 (en) | Multilingual information search | |
JP4810469B2 (en) | Search support device, program, and search support system | |
US20140032522A1 (en) | Systems and methods for contextual searching of semantic entities | |
US20100185600A1 (en) | Apparatus and method for integration search of web site | |
US20060059133A1 (en) | Hyperlink generation device, hyperlink generation method, and hyperlink generation program | |
US20070043736A1 (en) | Smart find | |
US20090313536A1 (en) | Dynamically Providing Relevant Browser Content | |
JP2015525929A (en) | Weight-based stemming to improve search quality | |
US20090282037A1 (en) | Method and system for providing convenient dictionary services | |
KR100747724B1 (en) | System and its method for web navigation for visually handicapped person | |
KR101537555B1 (en) | A direct search system for message on the instant messenger | |
JP5332128B2 (en) | Information retrieval apparatus, information retrieval method and program thereof | |
JP2008165415A (en) | Document processor, document processing method, and program | |
JP2003296327A (en) | Translation server, genre-classified online machine translation method, and program therefor | |
KR100516302B1 (en) | Method And System For Handling Wrongly Inputted Internet Address | |
JP2007065990A (en) | Information retrieval device | |
JP5843235B2 (en) | WEB information processing apparatus, WEB information processing method, and program | |
JPWO2018179228A1 (en) | Search system, method and program | |
JP2008065577A (en) | Document retrieval system, document retrieval program and computer-readable recording medium recorded with document retrieval program | |
JPH1021222A (en) | Machine translation method and terminology dictionary selecting method | |
JP2003122795A (en) | Device, method and program for displaying information, and computer readable recording medium stored with information display program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120619 |