JP2008165415A - Document processor, document processing method, and program - Google Patents

Document processor, document processing method, and program Download PDF

Info

Publication number
JP2008165415A
JP2008165415A JP2006352969A JP2006352969A JP2008165415A JP 2008165415 A JP2008165415 A JP 2008165415A JP 2006352969 A JP2006352969 A JP 2006352969A JP 2006352969 A JP2006352969 A JP 2006352969A JP 2008165415 A JP2008165415 A JP 2008165415A
Authority
JP
Japan
Prior art keywords
document
original document
data
translation
input data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006352969A
Other languages
Japanese (ja)
Inventor
Tatsuya Sukehiro
達哉 介弘
Toshiki Murata
稔樹 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2006352969A priority Critical patent/JP2008165415A/en
Publication of JP2008165415A publication Critical patent/JP2008165415A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a document processor for efficiently processing a document in multi-language. <P>SOLUTION: This document processor is provided with: a translation dictionary part 102 having translation resources classified into a plurality of items (1); a data reception part 106 for receiving input data including classification information for classifying an original document associated with at least any of the classification items of the translation resources so that it can be made to correspond to any of classification small items registered by a user, language information for discriminating the preparation language of the original document, and the original document through a communication line network 20 (2); a dictionary selection part 122 for selecting the translation resources associated with the classification items corresponding to the classification information in the input data from the translation dictionary part (3); a translation part 124 for translating the original document in the input data into the other language based on the selected translation resources (4); and a data preparation part 126 for preparing output data including at least either the original document in the input data or the translation document of the original document translated by the translation part according to an operation instruction from the user terminal 10 (5). <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、文書処理装置、文書処理方法およびプログラムに関する。   The present invention relates to a document processing apparatus, a document processing method, and a program.

近年、情報通信網、特にインターネットの発達に伴い、多言語の文書を作成・表示・検索等、処理する機会が増している。多言語の文書の処理では、例えば文書の読解や作成に際して言語障壁が問題となるが、この種の問題を解消するために、ある言語の文書を他の言語の文書に翻訳する翻訳システムが一般的に用いられている。   In recent years, with the development of information communication networks, particularly the Internet, opportunities for processing such as creation, display, and retrieval of multilingual documents have increased. In multilingual document processing, for example, language barriers become a problem in reading and creating documents. To solve this kind of problem, translation systems that translate documents in one language into documents in other languages are common. Has been used.

従来、この種の翻訳システムは、例えば分野毎等、予め複数の分類項目に分類された翻訳資源を有する翻訳辞書を備えており、利用者により文書毎に特定された分類項目に応じて翻訳資源を選択し、選択した翻訳資源を用いて翻訳対象の文書を翻訳する。一般的に、翻訳資源の量および翻訳資源の分類項目の細分化の程度に比例して、翻訳精度の向上が見込まれる。このため、利用者は、翻訳精度を高めるために、多くの分類項目から翻訳対象の文書毎に適切な分類項目を特定することになる。しかし、翻訳対象の文書の種類、例えば分野等は利用者毎にほぼ数種類に限定されていると考えられるので、多くの分類項目から翻訳対象の文書毎に適切な分類項目を特定する作業は利用者に負担を強いることになりかねない。   Conventionally, this type of translation system includes a translation dictionary having translation resources previously classified into a plurality of classification items, such as for each field, and the translation resources according to the classification items specified for each document by the user. And translate the document to be translated using the selected translation resource. Generally, improvement in translation accuracy is expected in proportion to the amount of translation resources and the degree of segmentation of translation resource classification items. For this reason, in order to improve the translation accuracy, the user specifies an appropriate classification item for each document to be translated from many classification items. However, since the types of documents to be translated, such as fields, are considered to be limited to almost several types for each user, the task of identifying appropriate classification items for each document to be translated from many classification items is used. It can put a burden on the person.

一方、下記特許文献1には、この種のシステムの一例として、翻訳対象の文書が予め登録された文書タイプのいずれに属するかを判断し、特定された文書タイプ毎に適合する辞書を用いて翻訳する文書翻訳方法が開示されている。本方法では、辞書の内部に文書タイプ毎の文書構造に適合した部分を予め作成しておき、文書領域毎に適切な辞書が選択されると、当該文書領域内の文書が特定書式の文書と一致している部分があるか否かが判定され、辞書内部の特定分野の文書構造に適合した部分を用いて翻訳が行われる。   On the other hand, in Patent Document 1 below, as an example of this type of system, it is determined whether a document to be translated belongs to a pre-registered document type, and a dictionary suitable for each specified document type is used. A document translation method for translation is disclosed. In this method, a part suitable for the document structure for each document type is created in the dictionary in advance, and when an appropriate dictionary is selected for each document area, the document in the document area becomes a document of a specific format. It is determined whether or not there is a matching part, and translation is performed using a part that matches the document structure of a specific field in the dictionary.

特開2004−265423号公報JP 2004-265423 A

しかしながら、従来の方法では、翻訳対象の文書の属する文書タイプをシステムが自動判定するので、必ずしも適切な辞書資源を選択することができない。また、従来の方法では、予め設定された書式に従って作成された文書のみを翻訳対象としており、例えば文書中に他の文書を引用する場合等、予め設定された書式以外の文書を翻訳対象として取り扱うことができない。   However, in the conventional method, since the system automatically determines the document type to which the document to be translated belongs, it is not always possible to select an appropriate dictionary resource. Further, in the conventional method, only documents created according to a preset format are subject to translation. For example, when a document other than the preset format is cited in the document, the document is handled as a translation subject. I can't.

本発明は上記問題点に鑑みてなされたものであり、その目的は、多言語の文書を効率的に作成・表示・検索等、処理する、新規かつ改良された、文書処理装置、文書処理方法およびプログラムを提供することにある。   SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and an object of the present invention is to provide a new and improved document processing apparatus and document processing method for efficiently creating, displaying and searching a multilingual document. And to provide a program.

上記課題を解決するために、本発明の第1の観点によれば、通信回線網を介して利用者端末により接続され、通信回線網を介して受信した原文書を処理するための文書処理装置が提供される。本装置は、複数の分類項目に分類された翻訳資源を有する翻訳辞書部と、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、通信回線網を介して受信するためのデータ受信部と、入力データおよび分類小項目を利用者毎に記録するためのデータ記録部と、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源を翻訳辞書部から選択するための辞書選択部と、選択された翻訳資源に基づいて、入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳部と、利用者端末からの操作指令に応じて、所定の入力データをデータ記録部から読出し、読出された入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成部と、出力データを通信回線網を介して利用者端末に送信するためのデータ送信部と、を備える。   In order to solve the above problems, according to a first aspect of the present invention, a document processing apparatus connected to a user terminal via a communication line network and processing an original document received via the communication line network Is provided. The apparatus corresponds to one of a translation dictionary unit having translation resources classified into a plurality of classification items and a small classification item registered by a user in association with at least one of the translation resource classification items. A data receiving unit for receiving input data including classification information for classifying an original document, language information for distinguishing a creation language of the original document, and the original document via a communication network; A data recording unit for recording input data and small classification items for each user; a dictionary selection unit for selecting translation resources related to the classification items associated with the classification information in the input data from the translation dictionary unit; Based on the selected translation resource, the translation unit for translating the original document in the input data into at least one other language and the predetermined input data in accordance with the operation command from the user terminal. A data creation unit for creating output data including at least one of an original document in the input data read from the recording unit and the original document translated by the translation unit, and the output data in the communication network And a data transmission unit for transmitting to the user terminal via

かかる構成によれば、文書処理装置は、分類情報、言語情報および原文書を含む入力データを通信回線網を介して受信する。ここで、原文書は、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報とともに入力データとして処理される。このため、原文書は、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。また、文書処理装置は、所定の入力データをデータ記録部から読出し、読出された入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成する。このため、原文書および翻訳された翻訳文書の少なくともいずれかを含む出力データが利用者端末に出力される。また、入力データおよび分類小項目が利用者毎に記録されているので、翻訳資源の分類項目が利用者毎に容易に特定される。   According to such a configuration, the document processing apparatus receives the input data including the classification information, the linguistic information, and the original document via the communication line network. Here, the original document includes classification information for classifying the original document so as to correspond to any of the classification sub-items registered by the user in association with at least one of the translation resource classification items, and the original document. Are processed as input data together with language information for distinguishing the creation language. Therefore, the original document is translated into at least one other language based on the translation resource related to the classification item associated with the classification information in the input data. The document processing apparatus reads predetermined input data from the data recording unit, and creates output data including at least one of the original document in the read input data and the translated document of the original document translated by the translation unit. . For this reason, output data including at least one of the original document and the translated translation document is output to the user terminal. Moreover, since the input data and the small classification items are recorded for each user, the translation resource classification items are easily specified for each user.

また、操作情報を作成するための操作情報作成部をさらに備え、データ送信部が操作情報を利用者端末に送信するようにしてもよい。かかる構成によれば、操作情報が利用者端末に送信されるので、文書処理装置の各種機能が利用者端末により操作される。   Further, an operation information creation unit for creating operation information may be further provided, and the data transmission unit may transmit the operation information to the user terminal. According to such a configuration, since the operation information is transmitted to the user terminal, various functions of the document processing apparatus are operated by the user terminal.

また、上記操作情報作成部は、出力データに対応する入力データ中の原文書を少なくとも1つの他の言語に翻訳するための操作情報、および/または出力データに対応する翻訳文書を原文書に戻すための操作情報を作成するようにしてもよい。かかる構成によれば、入力データ中の原文書の表示言語を切替えるための操作情報が利用者端末に送信されるので、出力データに対応する入力データ中の原文書の表示言語が利用者端末により切替えられる。   In addition, the operation information creation unit returns the operation information for translating the original document in the input data corresponding to the output data into at least one other language and / or the translated document corresponding to the output data to the original document. Operation information may be created. According to such a configuration, the operation information for switching the display language of the original document in the input data is transmitted to the user terminal. Therefore, the display language of the original document in the input data corresponding to the output data is determined by the user terminal. Switched.

また、上記操作情報作成部は、入力データ中の原文書に追加される引用文書を少なくとも1つの他の言語に翻訳するための操作情報、および/または入力データ中の原文書に追加される引用文書の翻訳文書を原文書に戻すための操作情報を作成するようにしてもよい。かかる構成によれば、入力データ中の引用文書の表示言語を切替えるための操作情報が利用者端末に送信されるので、入力データ中の引用文書の表示言語が利用者端末により切替えられる。   In addition, the operation information creation unit may include operation information for translating the cited document added to the original document in the input data into at least one other language and / or a citation added to the original document in the input data. Operation information for returning the translated document of the document to the original document may be created. According to this configuration, the operation information for switching the display language of the cited document in the input data is transmitted to the user terminal, so that the display language of the cited document in the input data is switched by the user terminal.

また、上記操作情報作成部は、原文書が他の言語に翻訳された場合には、翻訳部により当該他の言語に翻訳された操作情報を作成し、翻訳文書が元の言語に戻された場合には、当該元の言語に戻された操作情報を作成するようにしてもよい。かかる構成によれば、原文書の表示言語に対応するように、操作情報の表示言語が切替えられる。   In addition, when the original document is translated into another language, the operation information creation unit creates operation information translated into the other language by the translation unit, and the translated document is returned to the original language. In this case, the operation information returned to the original language may be created. According to this configuration, the display language of the operation information is switched so as to correspond to the display language of the original document.

また、上記入力データとして原文書と原文書中に追加される引用文書とを区別するための引用情報をさらに含み、データ作成部が引用情報に基づいて出力データを作成するようにしてもよい。かかる構成によれば、原文書と引用文書とが引用情報により区別されるので、出力データが引用情報に基づいて作成される。   Further, the input data may further include citation information for distinguishing the original document and the citation document added to the original document, and the data creation unit may create output data based on the citation information. According to this configuration, since the original document and the cited document are distinguished from each other by the citation information, the output data is created based on the citation information.

また、上記入力データとして原文書および原文書中の引用文書の各々で作成言語を区別するための言語情報をさらに含むようにしてもよい。かかる構成によれば、原文書および引用文書の各々で言語情報により作成言語が区別される。   Further, the input data may further include language information for distinguishing the created language in each of the original document and the cited document in the original document. According to this configuration, the created language is distinguished by the language information in each of the original document and the cited document.

また、上記入力データ中の原文書および/または翻訳文書の要約を作成する要約作成部をさらに備えるようにしてもよい。かかる構成によれば、入力データ中の原文書および/または翻訳文書の要約が作成されるので、原文書および/または翻訳文書の代わりに当該文書の要約が用いられる。   Moreover, you may make it further provide the summary preparation part which produces the summary of the original document in the said input data, and / or a translation document. According to such a configuration, since the summary of the original document and / or the translation document in the input data is created, the summary of the document is used instead of the original document and / or the translation document.

また、上記データ作成部は、所定の分類情報を有する少なくとも1つの入力データをデータ記録部から検索し、検索された入力データ中の原文書および/または翻訳部により翻訳された原文書の翻訳文書を含む出力データを作成するようにしてもよい。かかる構成によれば、所定の分類情報を有する少なくとも1つの入力データが検索されるので、検索された入力データ中の原文書および/または翻訳された翻訳文書を含む出力データが作成される。   The data creation unit retrieves at least one input data having predetermined classification information from the data recording unit, and the original document in the retrieved input data and / or the translated document of the original document translated by the translation unit You may make it produce the output data containing. According to this configuration, since at least one input data having predetermined classification information is searched, output data including the original document and / or the translated translation document in the searched input data is created.

また、上記利用者端末により基本言語情報が設定され、データ作成部は、検索された入力データ中の言語情報が基本言語情報と同一である場合には原文書を含む出力データを作成し、基本言語情報と異なる場合には翻訳部により基本言語情報に対応する言語に翻訳された原文書の翻訳文書を含む出力データを作成するようにしてもよい。かかる構成によれば、基本言語情報と入力データ中の言語情報とが対比されるので、基本言語情報に対応するように、検索された入力データ中の原文書または翻訳された翻訳文書を含む出力データが作成される。   In addition, when the basic language information is set by the user terminal and the language information in the searched input data is the same as the basic language information, the data creation unit creates output data including the original document, If it is different from the language information, output data including a translation document of the original document translated into a language corresponding to the basic language information by the translation unit may be created. According to such a configuration, since the basic language information and the language information in the input data are compared, an output including the original document or the translated translated document in the searched input data so as to correspond to the basic language information. Data is created.

また、上記データ記録部は、翻訳部により予め翻訳された入力データ中の原文書の翻訳文書を当該入力データ中に記録するようにしてもよい。かかる構成によれば、入力データ中の原文書が予め翻訳されて入力データ中に記録される。   Further, the data recording unit may record a translation document of the original document in the input data previously translated by the translation unit in the input data. According to this configuration, the original document in the input data is translated in advance and recorded in the input data.

また、上記データ記録部は、出力データ中の原文書または翻訳文書であって、利用者端末により修正された原文書または翻訳文書をデータ受信部により受信し、該当する入力データ中に記録するようにしてもよい。かかる構成によれば、出力データ中の原文書または翻訳文書が利用者端末により修正されて該当する入力データ中に記録される。   The data recording unit is an original document or a translation document in the output data, the original document or the translation document corrected by the user terminal is received by the data receiving unit, and is recorded in the corresponding input data. It may be. According to such a configuration, the original document or the translation document in the output data is corrected by the user terminal and recorded in the corresponding input data.

また、上記入力データ中の原文書の作成言語を判定するための言語判定部をさらに備えるようにしてもよい。かかる構成によれば、原文書の作成言語を区別するための言語情報を受信する代わりに、入力データ中の原文書の作成言語が判定され、言語情報の代わりに用いられる。   In addition, a language determination unit for determining the creation language of the original document in the input data may be further provided. According to this configuration, instead of receiving language information for distinguishing the original document creation language, the original document creation language in the input data is determined and used instead of the language information.

また、上記データ送信部が出力データとともに原文書の言語情報を利用者端末に送信するようにしてもよい。かかる構成によれば、原文書の言語情報が出力データとともに利用者端末に出力される。   The data transmission unit may transmit the language information of the original document together with the output data to the user terminal. According to this configuration, the language information of the original document is output to the user terminal together with the output data.

また、上記利用者端末から受信した検索条件に一致する原文書を通信回線網を介して接続された各種通信コンテンツ上で検索するためのデータ検索部をさらに備え、データ受信部は、データ検索部により検索された原文書とともに、当該原文書の分類情報と、当該原文書の作成言語を区別するための言語情報とを入力データとして受信するようにしてもよい。かかる構成によれば、検索条件に一致する原文書が通信回線網を介して接続された各種通信コンテンツ上で検索される。文書処理装置は、分類情報、原文書および言語情報を含む入力データを受信する。このため、原文書は、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。   The data receiving unit further includes a data search unit for searching on various communication contents connected via a communication network for an original document that matches the search condition received from the user terminal. In addition to the original document retrieved by the above, classification information of the original document and language information for distinguishing the creation language of the original document may be received as input data. According to such a configuration, the original document that matches the search condition is searched on various communication contents connected via the communication line network. The document processing apparatus receives input data including classification information, an original document, and language information. Therefore, the original document is translated into at least one other language based on the translation resource related to the classification item associated with the classification information in the input data.

また、上記検索条件として検索文書、検索時点、検索範囲および原文書の更新時点の少なくともいずれかが指定されるようにしてもよい。かかる構成によれば、検索文書、検索時点、検索範囲および原文書の更新時点等の検索条件が指定される。   Further, at least one of a search document, a search time, a search range, and an update time of the original document may be designated as the search condition. According to this configuration, search conditions such as a search document, a search time, a search range, and an update time of the original document are specified.

また、上記検索条件として検索文書が指定されると、データ検索部が検索文書とともに翻訳部により翻訳された当該検索文書を用いて原文書を検索するようにしてもよい。かかる構成によれば、検索文書が翻訳されるので、検索文書または翻訳された当該検索文書に一致する原文書が検索される。   When a search document is specified as the search condition, the data search unit may search for the original document using the search document translated by the translation unit together with the search document. According to this configuration, since the search document is translated, the search document or the original document that matches the translated search document is searched.

また、上記翻訳辞書部が階層形式の複数の項目に分類された翻訳資源を備えており、辞書選択部が入力データ中の分類情報に関連付けられた分類項目および当該分類項目より上位の階層に相当する分類項目の翻訳資源を翻訳辞書部から選択し、翻訳部が選択された翻訳資源に基づいて、より下位の階層の翻訳資源を優先的に利用して、入力データ中の原文書を少なくとも1つの他の言語に翻訳するようにしてもよい。かかる構成によれば、翻訳資源が階層形式の複数の分類項目に分類されているので、翻訳に際しては、分類情報に関連付けられた分類項目および当該分類項目より上位の階層に相当する分類項目の翻訳資源が選択され、より下位の階層の翻訳資源が優先的に利用される。   The translation dictionary unit includes translation resources classified into a plurality of hierarchical items, and the dictionary selection unit corresponds to a classification item associated with the classification information in the input data and a hierarchy higher than the classification item. The translation resource of the classification item to be selected is selected from the translation dictionary unit, and the translation unit selects at least one original document in the input data by preferentially using the lower level translation resources based on the selected translation resource. It may be translated into two other languages. According to such a configuration, since the translation resources are classified into a plurality of classification items in a hierarchical format, the translation of the classification item associated with the classification information and the classification item corresponding to the hierarchy higher than the classification item is performed at the time of translation. Resources are selected, and translation resources at lower levels are preferentially used.

また、本発明の第2の観点によれば、通信回線網を介して利用者端末により接続され、複数の分類項目に分類された翻訳資源を有する装置において、通信回線網を介して受信した原文書を処理するための文書処理方法が提供される。本方法は、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、通信回線網を介して受信するデータ受信ステップと、入力データおよび分類小項目を利用者毎に記録するデータ記録ステップと、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源を選択する辞書選択ステップと、選択された翻訳資源に基づいて、入力データ中の原文書を少なくとも1つの他の言語に翻訳する翻訳ステップと、利用者端末からの操作指令に応じて、記録された入力データから所定の入力データを読出し、読出された入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するデータ作成ステップと、出力データを通信回線網を介して利用者端末に送信するデータ送信ステップと、を含む。   In addition, according to the second aspect of the present invention, in an apparatus connected by a user terminal via a communication network and having translation resources classified into a plurality of classification items, the original received via the communication network is used. A document processing method for processing a document is provided. This method includes classification information for classifying an original document so as to correspond to one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource, and an original document creation language. A data receiving step for receiving input data including language information for distinguishing the original document and the original document via a communication network, a data recording step for recording the input data and small classification items for each user, and an input A dictionary selection step for selecting a translation resource related to the classification item associated with the classification information in the data, and a translation for translating the original document in the input data into at least one other language based on the selected translation resource In accordance with the step and the operation command from the user terminal, the predetermined input data is read out from the recorded input data, and the original document and the translation in the read input data are read. Comprising a data generating step of generating an output data including at least one of the original document translated document, a data transmission step of transmitting to the user terminal via the communication network output data.

また、本発明の第3の観点によれば、通信回線網を介して利用者端末により接続され、複数の分類項目に分類された翻訳資源を有する文書処理装置に用いられるプログラムが提供される。本プログラムは、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、通信回線網を介して受信するためのデータ受信手段、入力データおよび分類小項目を利用者毎に記録するためのデータ記録手段、入力データ中の分類情報に関連付けられて分類項目に関連する翻訳資源を選択するための辞書選択手段、選択された翻訳資源に基づいて、入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳手段、利用者端末からの操作指令に応じて、記録された入力データから所定の入力データを読出し、読出された入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成手段、出力データを通信回線網を介して利用者端末に送信するためのデータ送信手段、として機能させる。   According to a third aspect of the present invention, there is provided a program used in a document processing apparatus connected by a user terminal via a communication network and having translation resources classified into a plurality of classification items. This program includes classification information for classifying an original document so as to correspond to one of the classification sub-items registered by the user in association with at least one of the translation resource classification items, and the language for creating the original document. Data receiving means for receiving input data including linguistic information for distinguishing and original document via a communication network, data recording means for recording input data and small classification items for each user A dictionary selection means for selecting a translation resource related to the classification item associated with the classification information in the input data, and based on the selected translation resource, the original document in the input data is converted into at least one other language Translation means for translating, in accordance with an operation command from the user terminal, reading predetermined input data from the recorded input data, and an original document in the read input data, Data creating means for creating an output data including at least one of translated the original document translated document, the data transmitting means for transmitting to the user terminal via the communication network output data, to function as a.

以上説明したように、本発明によれば、多言語の文書を効率的に作成・表示・検索等、処理する文書処理装置、文書処理方法およびプログラムが提供される。   As described above, according to the present invention, there are provided a document processing apparatus, a document processing method, and a program for processing, such as efficiently creating, displaying, and searching a multilingual document.

以下に、添付した図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。   Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the present specification and drawings, components having substantially the same functional configuration are denoted by the same reference numerals, and redundant description is omitted.

図1は、本発明の第1の実施形態に係る文書処理装置を含む文書処理システムの構成例を示す説明図である。本システムは、少なくとも1つの利用者端末10、インターネット20、文書処理装置100等で構成される。利用者端末10と文書処理装置100とは、インターネット20を介して接続されており、例えばIP(Internet Protocol)の上位プロトコルであるHTTP(HyperText Transfer Protocol)等に則って相互通信する。そして利用者は、利用者端末10によりインターネット20を介して文書作成装置100に文書を処理させる。   FIG. 1 is an explanatory diagram showing a configuration example of a document processing system including a document processing apparatus according to the first embodiment of the present invention. This system includes at least one user terminal 10, the Internet 20, a document processing apparatus 100, and the like. The user terminal 10 and the document processing apparatus 100 are connected via the Internet 20 and communicate with each other in accordance with, for example, HTTP (HyperText Transfer Protocol) which is an upper protocol of IP (Internet Protocol). Then, the user causes the document creation apparatus 100 to process the document via the Internet 20 using the user terminal 10.

利用者端末10は、例えば、通信機能およびウェブブラウズ機能等を有する一般的な携帯電話、PHS(Personal Handy-phone System)、PDA(Personal Desktop Assistance)およびノート型コンピュータ等の携帯機器またはデスクトップ型コンピュータ等である。利用者端末10は、後述するように、処理対象とされる多言語の文書等の各種データや操作情報・指令をインターネット20を介して文書処理装置100との間で送受信する。   The user terminal 10 is, for example, a general mobile phone having a communication function, a web browsing function, or the like, a mobile device such as a personal handy-phone system (PHS), a personal desktop assistance (PDA) and a notebook computer, or a desktop computer. Etc. As will be described later, the user terminal 10 transmits / receives various data such as multilingual documents to be processed and operation information / commands to / from the document processing apparatus 100 via the Internet 20.

ここで、利用者端末10は、例えば制御部、通信部、記憶部および入出力部等を備える。制御部は、例えばCPU(Central Processing Unit)やMPU(Micro Processing Unit)等として構成されており、前述の他の構成部等を制御することにより、例えば、通信機能、インターネット接続機能およびウェブブラウズ機能等、利用者端末10の有する各種機能を制御する。また、制御部は、送受信データの暗号・復号化処理機能を有するようにしてもよい。通信部は、例えばアンテナ等を含む送受信機として構成されており、例えば、他の利用者端末を含む通信機器やインターネット20に対する接続や、それらとの間で相互に音声・データ情報の伝達等を担う。   Here, the user terminal 10 includes, for example, a control unit, a communication unit, a storage unit, an input / output unit, and the like. The control unit is configured as, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like, and controls other components described above, for example, a communication function, an Internet connection function, and a web browsing function. For example, various functions of the user terminal 10 are controlled. Further, the control unit may have an encryption / decryption processing function for transmission / reception data. The communication unit is configured as a transmitter / receiver including an antenna, for example. For example, the communication unit is connected to communication devices including other user terminals and the Internet 20, and communicates voice / data information with each other. Bear.

また、記憶部は、例えばROM(Read Only Memory)、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の主記憶装置として構成されており、後述するように、例えば、通信アドレス、各種プログラム、各種データ等の情報を記憶する。入出力部は、例えば、携帯電話である場合には、液晶パネル等の画像表示部、操作ボタンやスイッチ等の入力操作部、音声認識・発信部や振動発生部等を含み、利用者による情報入力や利用者に対する情報出力を担う。なお、入出力部として、カメラ等の画像入力装置、または例えばタッチ式パネル等のように、画像表示部と入力操作部とが一体形成されてもよい。   The storage unit is configured as a main storage device such as a ROM (Read Only Memory), a DRAM (Dynamic Random Access Memory), or an SRAM (Static Random Access Memory), for example, as described later, for example, a communication address, Information such as various programs and various data is stored. For example, in the case of a mobile phone, the input / output unit includes an image display unit such as a liquid crystal panel, an input operation unit such as operation buttons and switches, a voice recognition / sending unit, a vibration generating unit, etc. Responsible for input and information output to users. In addition, as an input / output unit, an image display unit and an input operation unit may be integrally formed, such as an image input device such as a camera, or a touch panel, for example.

インターネット20は、利用者端末10および文書処理装置100等を含む不特定多数の機器を接続する通信ネットワークであり、通信回線網として用いられる。なお、インターネット20は、通信回線網の一例であって、例えば、LAN(Local Area Network)やWAN(Wide Area Network)等、利用者端末10および文書処理装置100を含む不特定多数の機器を接続する通信ネットワークで代用される場合もある。   The Internet 20 is a communication network that connects an unspecified number of devices including the user terminal 10 and the document processing apparatus 100, and is used as a communication line network. The Internet 20 is an example of a communication line network, and connects an unspecified number of devices including the user terminal 10 and the document processing apparatus 100 such as a LAN (Local Area Network) and a WAN (Wide Area Network). In some cases, a communication network is used instead.

文書処理装置100は、例えばインターネット20に接続されている接続サービス会社のシステムの一部として構成されており、インターネット20を介して利用者端末10等から受信した多言語の文書を作成、表示、検索等、処理する装置として用いられる。   The document processing apparatus 100 is configured as a part of a system of a connection service company connected to the Internet 20, for example, and creates and displays a multilingual document received from the user terminal 10 or the like via the Internet 20. Used as a device for processing such as searching.

本実施形態に係る文書処理装置100は、翻訳辞書部102、処理制御部120、記憶部104、データ受信部106、データ記録部108およびデータ送信部110等を備えた、例えばWebサーバ等として構成される。なお、本装置100では、上記構成部の少なくとも1つが別個に備えられるようにしてもよい。また、図1に示されている各構成部間の接続は、あくまでも例示であって、係る場合に限定されるものではない。   The document processing apparatus 100 according to the present embodiment is configured as, for example, a Web server that includes a translation dictionary unit 102, a processing control unit 120, a storage unit 104, a data reception unit 106, a data recording unit 108, a data transmission unit 110, and the like. Is done. In the present apparatus 100, at least one of the above-described components may be provided separately. Moreover, the connection between each structure part shown by FIG. 1 is an illustration to the last, Comprising: It is not limited to the case concerned.

翻訳辞書部102は、例えばハードディスク媒体やリムーバブル媒体等の補助記憶装置として構成されており、分野毎に予め複数の分類項目に分類された翻訳資源が登録されたデータベースであって、見出語、訳語、品詞、意味等が翻訳資源として登録されている。翻訳辞書部102は、例えば図2に示すように、ルート、上位階層、中位階層および下位階層が各々に、例えば「一般」、大項目(例えば「自然科学」)、中項目(例えば「化学」)および小項目(例えば「無機化学」)に相当するように、分類項目が階層形式を有している。なお、図示する階層形式は、あくまで例示にすぎず、係る場合に限定されるものではない。   The translation dictionary unit 102 is configured as an auxiliary storage device such as a hard disk medium or a removable medium, for example, and is a database in which translation resources classified into a plurality of classification items in advance for each field are registered. Translations, parts of speech, meanings, etc. are registered as translation resources. For example, as shown in FIG. 2, the translation dictionary unit 102 includes, for example, “general”, large items (for example, “natural science”), medium items (for example, “chemical” )) And sub-items (eg “inorganic chemistry”), the classification items have a hierarchical format. It should be noted that the illustrated hierarchical format is merely an example, and is not limited to such a case.

記憶部104は、例えばROM(Read Only Memory)、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の主記憶装置として構成されており、後述するように、例えば、処理制御部120上で実行される各種処理プログラムや、プログラム実行中の処理データ等、操作情報に関する所定の情報等を記憶する。   The storage unit 104 is configured as a main storage device such as a ROM (Read Only Memory), a DRAM (Dynamic Random Access Memory), or an SRAM (Static Random Access Memory), for example, as described later, for example, the processing control unit 120. Predetermined information related to operation information such as various processing programs executed above and processing data during program execution is stored.

データ受信部106は、例えば、インターネット20上で各種データ等の伝達を行うための受信機として構成されており、例えば、原文書の分類情報、言語情報および原文書を含む入力データや操作指令等の各種データをインターネット20を介して利用者端末10から受信する。   For example, the data receiving unit 106 is configured as a receiver for transmitting various data on the Internet 20, and includes, for example, classification information of the original document, language information, input data including the original document, operation commands, and the like. Are received from the user terminal 10 via the Internet 20.

データ記録部108は、例えばROM等の主記憶装置として構成されており、後述するように、例えば、認証登録情報、入力データや分類小項目等のデータを利用者毎に記録する。なお、データ記録部108は、その一部が例えばハードディスク媒体やリムーバル媒体等の補助記憶装置として構成されており、必要な情報を補助記憶装置から読出すような構成を有するようにしてもよい。   The data recording unit 108 is configured as a main storage device such as a ROM, for example, and records data such as authentication registration information, input data, and classification sub-items for each user, as will be described later. Note that a part of the data recording unit 108 is configured as an auxiliary storage device such as a hard disk medium or a removable medium, and may be configured to read necessary information from the auxiliary storage device.

データ送信部110は、例えば、インターネット20上で各種データ等の伝達を行うための送信機として構成されており、例えば、出力データや操作情報などの各種データをインターネット20を介して利用者端末10に送信する。なお、データ送信部110は、データ受信部106とともに一体的なデータ送受信部として構成されるようにしてもよい。   For example, the data transmission unit 110 is configured as a transmitter for transmitting various data on the Internet 20. For example, the data transmission unit 110 transmits various data such as output data and operation information via the Internet 20 to the user terminal 10. Send to. The data transmission unit 110 may be configured as an integral data transmission / reception unit together with the data reception unit 106.

処理制御部120は、例えばCPUやMPU等として構成されており、例えば文書処理装置100上で実行される処理プログラムの一部として各々に構成される、辞書選択部122、翻訳部124、データ作成部126、操作情報作成部128等により構成される。また、処理制御部120には、要約作成部130や言語判定部132が選択的に備えられるようにしてもよい。なお、処理プログラムは、例えば記憶部104等や補助記憶装置等に記憶されており、必要に応じて処理制御部120により読出されるようにしてもよい。   The processing control unit 120 is configured, for example, as a CPU, MPU, or the like. For example, the dictionary selection unit 122, the translation unit 124, and the data creation configured as part of a processing program executed on the document processing apparatus 100, for example. The unit 126, the operation information creation unit 128, and the like. The processing control unit 120 may be selectively provided with a summary creation unit 130 and a language determination unit 132. The processing program is stored in, for example, the storage unit 104 or an auxiliary storage device, and may be read by the processing control unit 120 as necessary.

辞書選択部122は、例えば、入力データ中の分類情報に基づいて、分類情報に関連付けられた分類項目に関連する翻訳資源を翻訳辞書部102から選択する。   For example, the dictionary selection unit 122 selects, from the translation dictionary unit 102, a translation resource related to the classification item associated with the classification information based on the classification information in the input data.

翻訳部124は、例えば、辞書選択部122により選択された翻訳資源に基づいて、入力データ中の原文書や操作情報等を少なくとも1つの他の言語に翻訳する。ここで、翻訳部124で行われる翻訳処理とは、入力文(原文)を解析し、コンピュータで処理できる内部表現(中間表現)を得たあと、その内部表現から翻訳対象言語の文(訳文)を生成する一連の処理である。   For example, based on the translation resource selected by the dictionary selection unit 122, the translation unit 124 translates the original document, operation information, and the like in the input data into at least one other language. Here, the translation processing performed by the translation unit 124 is an analysis of an input sentence (original sentence), obtaining an internal expression (intermediate expression) that can be processed by a computer, and then a sentence (translated sentence) of a language to be translated from the internal expression. Is a series of processes for generating.

データ作成部126は、例えば、利用者端末10からの操作指令に応じて、所定の入力データをデータ記録部108から読出し、読出された入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成する。   For example, the data creation unit 126 reads predetermined input data from the data recording unit 108 in response to an operation command from the user terminal 10, and the original document in the read input data and the original document translated by the translation unit Output data including at least one of the translated documents is created.

操作情報作成部128は、例えば、文書の作成、検索、表示等の処理に際して、利用者端末10に送信される各種操作情報を作成する。操作情報に関連する所定の情報は、予め記憶部104等に記憶されているようにしてもよい。なお、所定の操作情報は、記憶部104に記憶される代わりにデータ記録部108に記録されるようにしてもよい。   For example, the operation information creation unit 128 creates various operation information to be transmitted to the user terminal 10 during processing such as document creation, search, and display. Predetermined information related to the operation information may be stored in advance in the storage unit 104 or the like. The predetermined operation information may be recorded in the data recording unit 108 instead of being stored in the storage unit 104.

要約作成部130は、例えば、入力文書中の文脈ベクトルを解析することによって、入力文書中の重要部分を抽出し、入力文書の要約を作成する。   For example, the summary creation unit 130 analyzes a context vector in the input document to extract an important part in the input document, and creates a summary of the input document.

言語判定部132は、例えば、入力文字列から、所定の規則に従って複数の部分文字列を生成し、辞書部に記憶された文字列を検索し、生成された部分文字列と一致する文字列を探し出し、各部分文字列が属する可能性がある言語とその可能性を評価することにより、入力文字列が属する言語を決定する。   For example, the language determination unit 132 generates a plurality of partial character strings from an input character string according to a predetermined rule, searches for a character string stored in the dictionary unit, and selects a character string that matches the generated partial character string. The language to which the input character string belongs is determined by searching and evaluating the language to which each partial character string may belong and its possibility.

文書処理に際して、利用者は、インターネット20を介して利用者端末10を文書処理装置100に接続させる。文書処理装置100への接続に際しては、利用者端末10のインターネット接続機能等を用いて、文書処理装置100である例えばWebサーバ等に関するURL等の接続アドレスがHTTPプロトコルなどに則り指定される。   In document processing, the user connects the user terminal 10 to the document processing apparatus 100 via the Internet 20. When connecting to the document processing apparatus 100, using the Internet connection function of the user terminal 10 or the like, a connection address such as a URL related to the document processing apparatus 100 such as a Web server is designated according to the HTTP protocol or the like.

利用者端末10により接続されると、文書処理装置100では、認証画面を表示するための操作情報が利用者端末10に送信される。ここで、認証画面を表示するための情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて、データ送信部110により利用者端末10に送信される。   When connected by the user terminal 10, the document processing apparatus 100 transmits operation information for displaying an authentication screen to the user terminal 10. Here, the information for displaying the authentication screen is stored in advance in, for example, the storage unit 104 and transmitted to the user terminal 10 by the data transmission unit 110 in response to an operation command from the user terminal 10. The

利用者は、認証画面上で、例えば予め定義された利用者番号や暗証番号等の認証情報を入力し、送信ボタン等の操作手段の操作により認証情報を文書処理装置100に送信する。なお、認証情報は、利用者のセキュリティ情報に該当する場合があるので、利用者端末10の制御部等により予め所定の暗号化処理を施した上で送信されるようにしてもよい。   On the authentication screen, the user inputs authentication information such as a predefined user number or password, and transmits the authentication information to the document processing apparatus 100 by operating an operation means such as a send button. Since the authentication information may correspond to the user's security information, the authentication information may be transmitted after a predetermined encryption process is performed in advance by the control unit of the user terminal 10 or the like.

文書処理装置100では、認証情報が受信されると、データ記録部108等に予め登録されている登録情報が検索され、認証情報に一致する登録情報を有する利用者エンティティの存在が確認される。そして、利用者エンティティの存在が確認された場合には、利用者による以下の処理操作が許可され、利用者エンティティの存在が確認されなかった場合には、利用者による処理操作が許可されない。   In the document processing apparatus 100, when the authentication information is received, the registration information registered in advance in the data recording unit 108 or the like is searched, and the existence of a user entity having registration information that matches the authentication information is confirmed. When the existence of the user entity is confirmed, the following processing operation by the user is permitted. When the existence of the user entity is not confirmed, the processing operation by the user is not permitted.

図3は、原文書の分類に用いる分類小項目を登録するための画面表示の一例を示す説明図である。分類小項目は、翻訳辞書部102に登録されている翻訳資源の分類項目の少なくともいずれかに原文書を関連付けるために、利用者により定義・登録される。   FIG. 3 is an explanatory diagram showing an example of a screen display for registering small classification items used for classification of original documents. The classification sub-item is defined and registered by the user in order to associate the original document with at least one of the translation resource classification items registered in the translation dictionary unit 102.

分類小項目の登録に際しては、図3に示すような登録画面300を表示するための操作情報が文書処理装置100から利用者端末10に送信される。ここで、登録画面300を表示するための所定の情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信される。   When registering the small classification items, operation information for displaying a registration screen 300 as shown in FIG. 3 is transmitted from the document processing apparatus 100 to the user terminal 10. Here, the predetermined information for displaying the registration screen 300 is stored in advance in the storage unit 104 or the like, for example, and is processed by the operation information creation unit 128 in response to an operation command from the user terminal 10. Then, the data transmission unit 110 transmits the data to the user terminal 10.

登録画面300には、表示枠310が設けられ、翻訳辞書部102に登録されている翻訳資源の分類項目312が階層形式で表示されており、分類項目312毎の選択を可能にする選択手段314(例えばラジオボタン、チェックボックス等)が設けられる。表示枠310には、利用者により分類小項目が入力される入力枠316(例えばダイアログボックス等)と、選択手段314により選択された分類項目312に入力された分類小項目を関連付けて登録するための操作手段318(例えば選択ボタン等)が設けられる。   The registration screen 300 is provided with a display frame 310, and the translation resource classification items 312 registered in the translation dictionary unit 102 are displayed in a hierarchical format, and a selection unit 314 that enables selection for each classification item 312. (For example, radio buttons, check boxes, etc.) are provided. In the display frame 310, an input frame 316 (for example, a dialog box or the like) in which a small classification item is input by a user and a small classification item input to the classification item 312 selected by the selection unit 314 are associated and registered. Operating means 318 (for example, a selection button or the like) is provided.

利用者は、原文書の分類小項目(例えば「大リーグ」)を入力枠316に入力し、分類小項目に関連付けるべき翻訳資源の分類項目312(例えば「野球」)を選択手段314により選択した上で、操作手段318を操作する。これにより、分類小項目の情報が利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。   The user inputs the classification item of the original document (for example, “major league”) in the input frame 316 and selects the translation resource classification item 312 (for example, “baseball”) to be associated with the classification item by the selection means 314. Above, the operating means 318 is operated. As a result, the information on the small classification items is transmitted from the user terminal 10 to the document creation apparatus 100 and registered in the data recording unit 108.

なお、任意の分類小項目に複数の分類項目312が関連付けられるようにしてもよい。また、表示枠310には、利用者により登録された分類小項目が翻訳資源の分類項目312とともに表示されるようにしてもよい。   A plurality of classification items 312 may be associated with an arbitrary classification small item. The display frame 310 may display the classification sub-item registered by the user together with the translation resource classification item 312.

図4は、原文書の処理画面の表示例を示す説明図である。以下では、本実施形態に係る文書処理装置100により行われる、原文書の作成、更新、表示、言語表示の切替および検索の各処理について説明する。   FIG. 4 is an explanatory diagram showing a display example of the processing screen of the original document. Hereinafter, each process of creation, update, display, language display switching, and search of the original document performed by the document processing apparatus 100 according to the present embodiment will be described.

原文書の処理に際しては、図4に示すような処理画面400を表示するための操作情報が文書処理装置100から利用者端末10に送信される。ここで、処理画面400を表示するための所定の情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信される。   When processing the original document, operation information for displaying a processing screen 400 as shown in FIG. 4 is transmitted from the document processing apparatus 100 to the user terminal 10. Here, the predetermined information for displaying the processing screen 400 is stored in advance in the storage unit 104, for example, and is processed by the operation information creation unit 128 in response to an operation command from the user terminal 10. Then, the data transmission unit 110 transmits the data to the user terminal 10.

処理画面400には、利用者により予め登録された分類小項目が分類小項目毎の選択を可能にする選択手段402(例えば選択ボタン等)とともに一覧形式で設けられる。なお、分類小項目は、一覧形式で設けられる代わりに、例えばスクロール形式で設けられるようにしてもよい。処理画面400には、処理対象とされる文書(以下、「処理文書」とも称する。)毎の処理内容を表示する表示枠410が設けられる。   In the processing screen 400, classification sub-items registered in advance by the user are provided in a list format together with selection means 402 (for example, a selection button) that enables selection for each classification sub-item. The small classification items may be provided in, for example, a scroll format instead of being provided in a list format. The processing screen 400 is provided with a display frame 410 for displaying processing contents for each document to be processed (hereinafter also referred to as “processed document”).

表示枠410には、処理文書の言語を切替えるための選択手段412(例えば、「English」、「中文」等の選択ボタン等)、原文書を選択するための選択手段414(例えば、「前」、「後」等の選択ボタン等)、原文書の処理を選択するための選択手段416(例えば、「作成」、「更新」、「表示」、「引用」、「検索」、「登録」等の選択ボタン等)等が設けられる。表示枠410には、処理文書を表示するための文書枠、ここでは特に、原文書の表題部420と本文部430とで区別された文書枠が設けられる。   The display frame 410 includes a selection unit 412 for switching the language of the processed document (for example, a selection button such as “English” or “Chinese sentence”), and a selection unit 414 for selecting the original document (for example, “Previous”). A selection button 416 for selecting processing of the original document (for example, “Create”, “Update”, “Display”, “Quotation”, “Search”, “Register”, etc.) Etc.) are provided. The display frame 410 is provided with a document frame for displaying a processed document, here, in particular, a document frame distinguished between the title part 420 and the body part 430 of the original document.

原文書の作成に際して、利用者は、原文書の分類小項目(例えば「大リーグ」)を選択手段402Dにより選択し、原文書の作成を選択手段416Aにより選択する。これにより、データ送信部110により送信された操作情報により空白の文書枠(図4中の文書枠には、既に文書が入力されている。)が表示枠410に表示される。利用者は、文書枠上で所望の原文書(ここでは、表題部420および本文部430)を作成し、原文書の登録を選択手段416Fにより選択する。これにより、原文書に関連付けられた分類小項目の情報である分類情報、原文書の作成言語を区別するための言語情報および原文書の少なくともいずれかを含む入力データが利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。   When creating the original document, the user selects a classification sub-item (for example, “major league”) of the original document by the selection unit 402D, and selects creation of the original document by the selection unit 416A. As a result, a blank document frame (a document has already been input in the document frame in FIG. 4) is displayed in the display frame 410 by the operation information transmitted by the data transmission unit 110. The user creates a desired original document (here, the title part 420 and the body part 430) on the document frame, and selects registration of the original document by the selection unit 416F. As a result, input data including at least one of classification information, which is classification sub-item information associated with the original document, language information for distinguishing the original document creation language, and the original document is created from the user terminal 10. The data is transmitted to the apparatus 100 and registered in the data recording unit 108.

ここで、入力データには、原文書の作成・更新時点を示す更新情報が含まれるようにしてもよい。また、原文書の言語情報については、選択手段412により選択されるようにしてもよく、または、予め規定値として設定されているようにしてもよい。なお、原文書の言語情報が選択手段412により切替えられる場合には、後述するように、処理画面400に表示される各種操作情報の表示言語が切替えられるようにしてもよい。   Here, the input data may include update information indicating the creation / update time of the original document. The language information of the original document may be selected by the selection unit 412 or may be set as a predetermined value in advance. When the language information of the original document is switched by the selection unit 412, as described later, the display language of various operation information displayed on the processing screen 400 may be switched.

図5は、原文書の入力データの一例を示す説明図である。図5の1行目には、「<language>ja</language>」と記述されている。ここで、「<language>」および「</language>」は、文書の言語情報を示すタグ(言語タグ)であり、両タグの間のタグ情報「ja」(ここでは、日本語を意味する。)により言語が指定されている。2行目には、文書の分類情報を示すタグ(分類タグ<category>)が記述されており、タグ情報「大リーグ」により分類が指定されている。3行目には、原文書(表題部)を示すタグ(表題タグ<title>)が記述されており、タグ情報「サヨナラ勝ち」により原文書(表題部)が指定されている。4行目〜6行目には、原文書(本文部)を示すタグ(本文タグ<description>)が記述されており、タグ情報「今日の...ありました。」により原文書(本文部)が指定されている。なお、ここでは、入力データ中に、分類情報、言語情報および原文書が含まれる場合を示すが、一部の情報のみが含まれる場合もある。   FIG. 5 is an explanatory diagram illustrating an example of input data of an original document. In the first line of FIG. 5, “<language> ja </ language>” is described. Here, “<language>” and “</ language>” are tags (language tags) indicating the language information of the document, and tag information “ja” (here, meaning Japanese) between both tags. .) Specifies the language. In the second line, a tag (category tag <category>) indicating the classification information of the document is described, and the classification is specified by the tag information “major league”. In the third line, a tag (title tag <title>) indicating the original document (title part) is described, and the original document (title part) is designated by the tag information “goodbye wins”. In the 4th to 6th lines, a tag (text tag <description>) indicating the original document (text part) is described, and the original document (text part) was added according to the tag information "Today's ...". ) Is specified. Here, although the case where classification information, language information, and an original document are included in the input data is shown, only a part of the information may be included.

利用者は、選択手段416Bにより原文書の更新を選択することができる。利用者は、文書枠420および/または430上で原文書(ここでは、表題部および/または本文部)を更新し、原文書の登録を選択手段416Fにより選択する。原文書の更新では、入力データ中の例えば本文タグにより指定される原文書(本文部)の情報が更新される。これにより、更新された原文書(本文部)を含む入力データが利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。ここで、データ記録部108上では、更新される文書が例えば本文タグに基づいて特定される。入力データに更新情報が含まれる場合には、更新情報が同時に更新される。   The user can select update of the original document by the selection means 416B. The user updates the original document (here, the title part and / or the body part) on the document frame 420 and / or 430, and selects registration of the original document by the selection unit 416F. In the update of the original document, information of the original document (text part) specified by, for example, a text tag in the input data is updated. As a result, the input data including the updated original document (body part) is transmitted from the user terminal 10 to the document creation apparatus 100 and registered in the data recording unit 108. Here, on the data recording unit 108, the document to be updated is specified based on, for example, a text tag. When update information is included in the input data, the update information is updated at the same time.

利用者は、選択手段416Cにより分類小項目毎に原文書を表示させることができる。利用者は、原文書の分類小項目(例えば「大リーグ」)を選択手段402により選択し、原文書の表示を選択手段416Cにより選択する。これにより、分類小項目の情報が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。   The user can display the original document for each classified small item by the selection means 416C. The user selects a small classification item (for example, “major league”) of the original document by the selection unit 402, and selects the display of the original document by the selection unit 416C. As a result, the information on the small classification items is transmitted from the user terminal 10 to the document creation apparatus 100 and transmitted to the data creation unit 126.

データ作成部126では、選択された分類小項目に該当する分類情報を有する入力データがデータ記録部108に記録されている入力データから検索される。そして、検索された入力データから、例えば最新の更新情報を有する入力データ中の原文書を含む出力データが作成され、データ送信部110により利用者端末10に送信される。利用者端末10では、出力データが処理文書として文書枠、ここでは特に、文書の表題部420と本文部430とに区別されて出力される。ここで、データ記録部108上では、検索される入力データが分類タグにより特定される。また、データ作成部126では、分類タグ、言語タグ、表題タグおよび本文タグに基づいて出力データが作成される。   In the data creation unit 126, input data having classification information corresponding to the selected classification subitem is retrieved from the input data recorded in the data recording unit 108. Then, for example, output data including the original document in the input data having the latest update information is created from the retrieved input data, and transmitted to the user terminal 10 by the data transmission unit 110. In the user terminal 10, the output data is output as a processed document by being distinguished into a document frame, in particular, a title part 420 and a body part 430 of the document. Here, on the data recording unit 108, the input data to be searched is specified by the classification tag. In addition, the data creation unit 126 creates output data based on the classification tag, language tag, title tag, and text tag.

利用者は、原文書を選択手段414により選択することができる。これにより、選択情報、例えば現在の処理文書の入力データよりも1つ前の入力データを選択するための選択情報414A(例えば「前」等)が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。データ作成部126では、該当する更新情報を有する入力データがデータ記録部108から検索される。そして、検索された入力データから出力データが作成され、データ送信部110により利用者端末10に送信される。利用者端末10では、出力データが処理文書として出力される。ここでも、データ作成部126では、各種タグに基づいて出力データが作成される。   The user can select the original document by the selection means 414. As a result, selection information 414A (for example, “Previous” or the like) for selecting selection information, for example, input data immediately before the input data of the current processing document is transmitted from the user terminal 10 to the document creation apparatus 100. Is transmitted to the data creation unit 126. In the data creation unit 126, input data having corresponding update information is retrieved from the data recording unit 108. Then, output data is created from the retrieved input data, and is transmitted to the user terminal 10 by the data transmission unit 110. In the user terminal 10, output data is output as a processed document. Again, the data creation unit 126 creates output data based on various tags.

利用者は、処理文書の表示言語を選択手段412により切替えることができる。これにより、選択された表示言語の情報(例えば「English」等)が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。データ作成部126では、処理文書の入力データがデータ記録部108から読出される。   The user can switch the display language of the processed document by the selection unit 412. As a result, information on the selected display language (for example, “English”) is transmitted from the user terminal 10 to the document creation device 100 and transmitted to the data creation unit 126. In the data creation unit 126, input data of the processed document is read from the data recording unit 108.

データ作成部126では、選択された表示言語が入力データ中の言語情報と同一である場合には、原文書の翻訳が必要とされないので、入力データ中の原文書を含む出力データが作成される。ここで、データ作成部126では、言語タグに基づいて入力データの言語情報が特定される。   In the data creation unit 126, when the selected display language is the same as the language information in the input data, the translation of the original document is not required, so that output data including the original document in the input data is created. . Here, in the data creation unit 126, the language information of the input data is specified based on the language tag.

一方、選択された表示言語が入力データ中の言語情報と異なる場合には、原文書の翻訳が必要とされるので、入力データ中の分類情報(例えば「大リーグ」等)が辞書選択部122に伝達される。ここで、分類タグに基づいて入力データ中の分類情報が特定される。辞書選択部122では、分類情報に対応する分類項目(例えば「野球」等)および当該分類項目より上位の階層に相当する分類項目(例えば「スポーツ」、「一般」等)の翻訳資源が選択される。翻訳部124では、選択された翻訳資源に基づいて、特により下位の階層の翻訳資源が優先的に利用されるように、入力データ中の原文書が選択手段412により選択された他の言語に翻訳される。データ作成部126では、翻訳された翻訳文書を含む出力データが作成される。なお、翻訳された翻訳文書は、後述するように入力データの一部としてデータ記録部108に登録されるようにしてもよい。   On the other hand, if the selected display language is different from the language information in the input data, translation of the original document is required, so that the classification information (for example, “major league”) in the input data is used as the dictionary selection unit 122. Is transmitted to. Here, the classification information in the input data is specified based on the classification tag. The dictionary selection unit 122 selects translation resources of a classification item (for example, “baseball”, etc.) corresponding to the classification information and a classification item (for example, “sports”, “general”, etc.) corresponding to a higher hierarchy than the classification item. The Based on the selected translation resource, the translation unit 124 converts the original document in the input data into another language selected by the selection means 412 so that the translation resource in the lower hierarchy is used preferentially. Translated. The data creation unit 126 creates output data including the translated translation document. The translated translation document may be registered in the data recording unit 108 as a part of input data as will be described later.

そして、いずれの場合も、データ作成部126では、各種タグに基づいて出力データが作成され、作成された出力データがデータ送信部110により利用者端末10に送信される。利用者端末10では、原文書または選択手段412により選択された表示言語に翻訳された処理文書として、出力データが出力される。   In either case, the data creation unit 126 creates output data based on various tags, and the created output data is transmitted to the user terminal 10 by the data transmission unit 110. In the user terminal 10, output data is output as an original document or a processed document translated into the display language selected by the selection means 412.

図6は、処理文書の表示言語が切替られた場合の処理画面の表示例を示す説明図である。処理文書の表示言語の切替により、文書枠(ここでは、表題部520および本文部530)に表示される処理文書の表示言語が英語に切替えられている。そして、処理文書とともに処理画面500に表示される各種操作情報の表示言語も切替えられている。   FIG. 6 is an explanatory diagram showing a display example of the processing screen when the display language of the processing document is switched. By switching the display language of the processed document, the display language of the processed document displayed in the document frame (here, the title part 520 and the body part 530) is switched to English. The display language of various operation information displayed on the processing screen 500 together with the processing document is also switched.

各種操作情報の表示言語の切替えに際しては、図6に示すような翻訳された操作情報が文書処理装置100から利用者端末10に送信される。ここで、翻訳された操作情報は、例えば、記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信されるようにしてもよい。または、利用者端末10からの操作指令に応じて、記憶部104等に記憶されている所定の情報が翻訳部124により翻訳され、操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信されるようにしてもよい。   When switching the display language of various operation information, translated operation information as shown in FIG. 6 is transmitted from the document processing apparatus 100 to the user terminal 10. Here, the translated operation information is stored in advance in the storage unit 104, for example, and is processed by the operation information creation unit 128 in accordance with an operation command from the user terminal 10, and then the data transmission unit 110. May be transmitted to the user terminal 10. Alternatively, in response to an operation command from the user terminal 10, predetermined information stored in the storage unit 104 or the like is translated by the translation unit 124 and processed by the operation information creation unit 128, and then the data transmission unit 110. May be transmitted to the user terminal 10.

なお、利用者は、選択手段512により表示言語を元の言語、ここでは日本語に切替えることができる。ここでは、表示言語が英語に切替えられる場合について示すが、例えば中国語等の他の言語に切替えられる場合についても同様である。   Note that the user can switch the display language to the original language, here Japanese, by the selection means 512. Although the case where the display language is switched to English is shown here, the same applies to the case where the display language is switched to another language such as Chinese.

利用者は、選択手段516D等により原文書中に引用文書を追加することができる。ここで、引用文書とは、利用者により原文書と区別されるようにして原文書に追加される文書を意味する。また、引用文書には、文書自体のみならず、例えばURL(Uniform Resource Locator)等、インターネット20に接続された通信コンテンツ上の文書ファイルの位置を示す識別子が含まれる場合もある。   The user can add the cited document to the original document by the selection means 516D or the like. Here, the cited document means a document added to the original document so as to be distinguished from the original document by the user. In addition, the cited document may include not only the document itself but also an identifier indicating the position of the document file on the communication content connected to the Internet 20, such as a URL (Uniform Resource Locator).

図7は、原文書に引用文書を追加する場合の処理画面の表示例を示す説明図である。なお、図4を用いてすでに説明された操作情報等については、説明を省略する。   FIG. 7 is an explanatory diagram showing a display example of a processing screen when a cited document is added to an original document. Note that description of operation information and the like already described with reference to FIG. 4 is omitted.

引用文書の追加に際しては、図7に示すような処理画面600を表示するための操作情報が文書処理装置100から利用者端末10に送信される。ここで、処理画面600を表示するための所定の情報は、例えば記憶部104等に予め記憶されており、利用者端末10からの操作指令に応じて操作情報作成部128により処理された上で、データ送信部110により利用者端末10に送信される。   When adding a cited document, operation information for displaying a processing screen 600 as shown in FIG. 7 is transmitted from the document processing apparatus 100 to the user terminal 10. Here, the predetermined information for displaying the processing screen 600 is stored in advance in the storage unit 104, for example, and is processed by the operation information creation unit 128 in accordance with an operation command from the user terminal 10. The data transmission unit 110 transmits the data to the user terminal 10.

処理画面600の表示枠610には、処理文書を処理するための文書枠、ここでは特に、処理文書の表題部620と本文部630とで区別され、本文部630に追加された引用部640を含む文書枠が設けられる。   A display frame 610 of the processing screen 600 includes a document frame for processing a processed document, specifically, a citation portion 640 that is distinguished from the title portion 620 and the body portion 630 of the processed document and added to the body portion 630. A document frame is included.

引用文書の追加に際して、利用者は、選択手段612等により引用文書の作成言語を選択した上で、引用文書の追加を選択手段616D等により選択する。これにより、データ送信部110により送信された操作情報により空白の引用部640(図7中の引用部640にはすでに引用文書が追加されている。)が表示枠610に作成される。利用者は、引用部640上で所望の引用文書を追加し、原文書の登録を選択手段618F等により選択する。これにより、原文書の分類情報、原文書の言語情報および原文書と、引用文書の作成言語を区別するための言語情報および引用文書との少なくともいずれかを含む入力データが利用者端末10から文書作成装置100に送信されてデータ記録部108に登録される。   When adding the cited document, the user selects the cited document creation language by the selection means 612 and the like, and then selects the addition of the cited document by the selection means 616D and the like. Thereby, a blank citation unit 640 (a citation document has already been added to the citation unit 640 in FIG. 7) is created in the display frame 610 by the operation information transmitted by the data transmission unit 110. The user adds a desired cited document on the quoting unit 640 and selects registration of the original document by the selecting means 618F or the like. As a result, the input data including at least one of the classification information of the original document, the language information of the original document and the original document, and the language information for distinguishing the creation language of the cited document and the cited document is sent from the user terminal 10 to the document. The data is transmitted to the creation apparatus 100 and registered in the data recording unit 108.

図8は、引用文書を含む処理文書の入力データの一例を示す説明図である。なお、図5を用いてすでに説明されたタグ情報等については、説明を省略する。   FIG. 8 is an explanatory diagram showing an example of input data of a processed document including a cited document. Note that description of tag information and the like already described with reference to FIG. 5 is omitted.

図8の4行目〜10行目には、原文書(本文部)を示すタグ(本文タグ<description>)が記述されており、特に4行目〜6行目のタグ情報「今日の...ありました。」により原文書(本文部)が指定されている。原文書(本文部)に含まれる7〜9行目には、原文書(引用部)を示すタグ(引用タグ<quote lang=”en”>)が記述されており、タグ情報「His homerun ......」により原文書(引用部)が指定されている。そして、引用タグ中の「lang=”en”」により引用文書の言語情報(ここでは英語)が指定されている。なお、ここでは、入力データ中に、分類情報、言語情報、原文書および引用文書が含まれる場合を示すが、一部の情報のみが含まれる場合もある。   The tags (text tag <description>) indicating the original document (text part) are described in the 4th to 10th lines in FIG. 8. In particular, the tag information “Today. The original document (text part) is specified. On the 7th to 9th lines included in the original document (body part), a tag (quotation tag <quote lang = “en”>) indicating the original document (quotation part) is described, and the tag information “His homerun. ..... "specifies the original document (quoting part). The language information (English here) of the cited document is designated by “lang =“ en ”” in the quote tag. Here, the case where classification information, linguistic information, an original document, and a cited document are included in the input data is shown, but only a part of the information may be included.

なお、文書枠の引用部640には、引用文書の言語を切替えるための選択手段642(例えば、「English」等の選択ボタン等)が設けられる。利用者は、引用文書の表示言語を選択手段642により切替えることができる。これにより、引用文書の選択された表示言語の情報が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。データ作成部126では、引用文書を含む原文書の入力データがデータ記録部108から読出される。   The document frame citation section 640 is provided with a selection means 642 (for example, a selection button such as “English”) for switching the language of the cited document. The user can switch the display language of the cited document by the selection means 642. As a result, the information of the selected display language of the cited document is transmitted from the user terminal 10 to the document creation device 100 and transmitted to the data creation unit 126. In the data creation unit 126, input data of the original document including the cited document is read from the data recording unit 108.

データ作成部126では、選択された表示言語が入力データ中の引用文書の言語情報と同一である場合には、原文書の翻訳が必要とされないので、入力データ中の引用文書を含む出力データが作成される。データ作成部126では、言語タグに基づいて入力データ中の引用文書の言語情報が特定される。   In the data creation unit 126, when the selected display language is the same as the language information of the cited document in the input data, the translation of the original document is not required. Therefore, the output data including the cited document in the input data is generated. Created. In the data creation unit 126, the language information of the cited document in the input data is specified based on the language tag.

一方、選択された表示言語が入力データ中の引用文書の言語情報と異なる場合には、引用文書の翻訳が必要とされるので、入力データ中の分類情報(例えば「大リーグ」等)が辞書選択部122に伝達される。ここで、分類タグに基づいて入力データ中の分類情報が特定される。辞書選択部122では、分類情報に対応する分類項目(例えば「野球」等)および当該分類項目より上位の階層に相当する分類項目(例えば「スポーツ」、「一般」等)の翻訳資源が選択される。翻訳部124では、選択された翻訳資源に基づいて、特により下位の階層の翻訳資源が優先的に利用されるように、入力データ中の引用文書が選択手段642等により選択された他の言語に翻訳される。データ作成部126では、翻訳された翻訳文書を含む出力データが作成される。なお、翻訳された翻訳文書は、後述するように入力データの一部としてデータ記録部108に登録されるようにしてもよい。   On the other hand, if the selected display language is different from the linguistic information of the cited document in the input data, it is necessary to translate the cited document. Therefore, the classification information (for example, “major league”) in the input data is stored in the dictionary. This is transmitted to the selection unit 122. Here, the classification information in the input data is specified based on the classification tag. The dictionary selection unit 122 selects translation resources of a classification item (for example, “baseball”, etc.) corresponding to the classification information and a classification item (for example, “sports”, “general”, etc.) corresponding to a higher hierarchy than the classification item. The In the translation unit 124, another language in which the cited document in the input data is selected by the selection unit 642 or the like so that the lower-level translation resource is used preferentially based on the selected translation resource. Translated into The data creation unit 126 creates output data including the translated translation document. The translated translation document may be registered in the data recording unit 108 as a part of input data as will be described later.

そして、いずれの場合も、データ作成部126では、各種タグに基づいて出力データが作成され、作成された出力データがデータ送信部110により利用者端末10に送信される。利用者端末10では、引用文書または選択手段642等により選択された表示言語に翻訳された引用文書として、出力データが出力される。   In either case, the data creation unit 126 creates output data based on various tags, and the created output data is transmitted to the user terminal 10 by the data transmission unit 110. In the user terminal 10, output data is output as a cited document or a cited document translated into the display language selected by the selection means 642 or the like.

図9は、引用文書を含む原文書から出力データを作成するための処理を説明するフロー図である。図9に示すように、データ作成部126では、図8に示すような入力データから出力データが作成される。まず、データ記録部108から読出された入力データ中のタグが読込まれる(S600)。タグが引用タグであるかが判断される(S602)。タグが引用タグであり、かつタグ情報が設定言語(ここでは、日本語)と異なる場合には、文書枠に切替手段642等を表示するための操作情報がデータ送信部110により利用者端末10に送信される(S606)。タグが引用タグでない場合には、タグに応じた処理、例えば題名部に所定の書式を設定する等、出力データを作成するための処理がなされる(S608)。当該タグに応じた処理が完了すると、入力データ中の次のタグの読込みが試みられ(S610)、次のタグが存在する場合には、タグが読込まれ(S600)、次のタグが存在しない場合には、出力データがデータ送信部110により利用者端末10に送信されて(S612)、処理が終了する。   FIG. 9 is a flowchart for explaining processing for creating output data from an original document including a cited document. As shown in FIG. 9, the data creation unit 126 creates output data from the input data as shown in FIG. First, the tag in the input data read from the data recording unit 108 is read (S600). It is determined whether the tag is a quote tag (S602). When the tag is a quotation tag and the tag information is different from the set language (here, Japanese), operation information for displaying the switching means 642 and the like in the document frame is sent by the data transmission unit 110 to the user terminal 10. (S606). If the tag is not a quotation tag, processing corresponding to the tag, for example, processing for creating output data, such as setting a predetermined format in the title portion, is performed (S608). When the processing corresponding to the tag is completed, an attempt is made to read the next tag in the input data (S610). If the next tag exists, the tag is read (S600), and the next tag does not exist. In this case, the output data is transmitted to the user terminal 10 by the data transmission unit 110 (S612), and the process ends.

図10は、引用文書の表示言語が切替られた場合の処理画面の表示例を示す説明図である。引用文書の表示言語の切替により、処理画面700の文書枠710の引用部750に表示される引用文書の表示言語が日本語に切替えられている。なお、利用者は、選択手段752により表示言語を元の言語、ここでは英語に切替えることができる。ここでは、表示言語が日本語に切替えられる場合について示すが、例えば中国語等の他の言語に切替えられる場合についても同様である。   FIG. 10 is an explanatory diagram illustrating a display example of the processing screen when the display language of the cited document is switched. By switching the display language of the cited document, the display language of the cited document displayed in the citation section 750 of the document frame 710 of the processing screen 700 is switched to Japanese. Note that the user can switch the display language to the original language, here English, by the selection means 752. Although the case where the display language is switched to Japanese is shown here, the same applies to the case where the display language is switched to another language such as Chinese.

図11は、引用文書が対訳形式で表示される場合の処理画面の表示例を示す説明図である。図10に示す選択手段754により、対訳形式による表示が選択されると、文書枠には、原文部860と翻訳部862とに区別された引用部が設けられる。そして、引用部の一方860には、入力データ中の引用文書が表示され、他方862には入力データ中の引用文書を他の言語に翻訳した翻訳文書が表示される。この場合には、引用部862の表示を元の表示に戻すための選択手段864が設けられる。これにより、利用者は、原文書と翻訳文書とを容易に対比することができ、翻訳文書の修正を容易に行うことができる。   FIG. 11 is an explanatory diagram illustrating a display example of a processing screen when a cited document is displayed in a bilingual format. When the display in the bilingual format is selected by the selection unit 754 shown in FIG. One 860 of the citation section displays a citation document in the input data, and the other 862 displays a translation document obtained by translating the citation document in the input data into another language. In this case, selection means 864 is provided for returning the display of the citation section 862 to the original display. Thus, the user can easily compare the original document with the translated document, and can easily correct the translated document.

データ記録部108には、原文書または引用文書から翻訳された翻訳文書が入力データの一部として登録されるようにしてもよい。これにより、利用者は、翻訳文書の修正を行うことができるので、翻訳品質の向上が図られる。   In the data recording unit 108, a translated document translated from the original document or the cited document may be registered as a part of the input data. Thereby, since the user can correct the translation document, the translation quality can be improved.

利用者は、翻訳文書が表示されている文書枠(例えば、図7中の表題部620、本文部630、引用部640等)を例えば入力カーソル等により選択し、翻訳文書の登録を選択手段616Fにより選択する。翻訳文書の登録では、原文書(翻訳部)を示すタグ(翻訳タグ<translate, lang-“en”>)を用いて、タグ情報「His homerun ......」としての翻訳文書が入力データ中に追加される。そして、翻訳タグ中の「lang=”ja”」により翻訳文書の言語情報(ここでは日本語)が指定されている。なお、選択された文書枠(例えば本文部640等)について、選択された言語(例えば日本語等)に対応する翻訳文書がすでに入力データ中に登録されている場合には、登録されている入力データの翻訳情報が更新される。   The user selects a document frame (for example, the title portion 620, the body portion 630, the citation portion 640, etc. in FIG. 7) with the input cursor or the like, and selects the translation document registration means 616F. Select by. When registering a translation document, the translation document as tag information “His homerun ......” is input using a tag (translation tag <translate, lang- “en”>) indicating the original document (translation part) Added to the data. The language information (here, Japanese) of the translated document is designated by “lang =“ ja ”” in the translation tag. For a selected document frame (for example, the body portion 640), if a translated document corresponding to the selected language (for example, Japanese language) has already been registered in the input data, the registered input Data translation information is updated.

翻訳文書が入力データの一部として登録される場合には、原文書の登録に際して、入力データの有する言語情報と異なる他の言語により翻訳された翻訳文書が入力データの一部として同時に登録されるようにしてもよい。この場合には、翻訳されるべき言語が利用者により予め設定されるようにしてもよい。これにより、利用者は、原文書とともに翻訳文書をデータ記録部108に登録することができる。   When a translated document is registered as a part of input data, when the original document is registered, a translated document translated in another language different from the language information of the input data is simultaneously registered as a part of the input data. You may do it. In this case, the language to be translated may be set in advance by the user. Thereby, the user can register the translated document together with the original document in the data recording unit 108.

利用者は、検索条件を指定した上で選択手段616E等により原文書を検索することができる。利用者は、検索条件として指定した文書枠(例えば本文部620等)を例えば入力カーソル等により選択し、原文書の検索を選択手段616E等により選択する。これにより、例えば選択された文書枠620等に、データ送信部110により送信された操作情報により入力枠(例えばダイアログボックス等、不図示)が表示される。利用者は、入力枠上で所望の検索条件を入力し、例えば再び原文書の検索を選択手段616E等により選択する。これにより、検索条件が利用者端末10から文書作成装置100に送信されてデータ作成部126に伝達される。   The user can search for the original document with the selection means 616E or the like after designating the search conditions. The user selects a document frame (for example, the body portion 620) designated as the search condition by using, for example, an input cursor, and selects the original document search by the selection unit 616E or the like. Thereby, for example, an input frame (for example, a dialog box or the like, not shown) is displayed on the selected document frame 620 or the like by the operation information transmitted by the data transmission unit 110. The user inputs a desired search condition on the input frame, and selects, for example, the search for the original document again by the selection means 616E or the like. Thereby, the search condition is transmitted from the user terminal 10 to the document creation device 100 and transmitted to the data creation unit 126.

データ作成部126では、選択された文書枠(例えば本文部)に該当し、かつ指定された検索条件に該当する文書を有する入力データがデータ記録部108に記録されている入力データから検索される。そして、検索された入力データから、例えば最新の更新情報を有する入力データ中の原文書を含む出力データが作成され、データ送信部110により利用者端末10に送信される。利用者端末10では、出力データが処理文書として選択された文書枠(例えば本文部620)に出力される。ここで、データ記録部108上では、検索される入力データが各種タグにより特定される。また、データ作成部126でも、各種タグに基づいて出力データが作成される。   In the data creation unit 126, input data having a document corresponding to the selected document frame (for example, a body part) and corresponding to the specified search condition is searched from the input data recorded in the data recording unit 108. . Then, for example, output data including the original document in the input data having the latest update information is created from the retrieved input data, and transmitted to the user terminal 10 by the data transmission unit 110. In the user terminal 10, the output data is output to the document frame (for example, the body part 620) selected as the processing document. Here, on the data recording unit 108, input data to be searched is specified by various tags. The data creation unit 126 also creates output data based on various tags.

なお、検索に際して、検索条件として原文書の分類小項目(例えば「大リーグ」)を選択手段612等により選択するようにしてもよい。この場合には、検索された入力データの分類情報が分類タグに基づいて判定される。また、翻訳文書が入力データの一部として登録されている場合には、翻訳文書も検索対象に含まれるようにしてもよい。これにより、利用者は、検索条件および検索範囲をより詳細に設定することができるので、検索精度の向上が図られる。   At the time of the search, as a search condition, a classification small item (for example, “major league”) of the original document may be selected by the selection means 612 or the like. In this case, the classification information of the searched input data is determined based on the classification tag. In addition, when a translation document is registered as a part of input data, the translation document may be included in the search target. Thereby, the user can set the search condition and the search range in more detail, so that the search accuracy can be improved.

以上のように、本実施形態に係る文書処理装置100によれば、インターネット20を介して受信される原文書は、翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報とともに入力データとして処理される。このため、原文書は、入力データ中の分類情報に関連付けられた分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。また、文書処理装置100は、入力データ中の原文書および翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成する。このため、原文書および翻訳された翻訳文書の少なくともいずれかを含む出力データが利用者端末10に出力される。また、入力データおよび分類小項目が利用者毎に記録されているので、翻訳資源の分類項目が利用者毎に容易に特定される。これにより、文書の読解や作成に際しての言語障壁が解消される等、多言語の文書の作成、検索、表示等の処理が効率化される。   As described above, according to the document processing apparatus 100 according to the present embodiment, the original document received via the Internet 20 is classified by the user in association with at least one of the translation resource classification items. It is processed as input data together with classification information for classifying the original document so as to correspond to one of the small items and language information for distinguishing the creation language of the original document. Therefore, the original document is translated into at least one other language based on the translation resource related to the classification item associated with the classification information in the input data. In addition, the document processing apparatus 100 creates output data including at least one of the original document in the input data and the translated document of the original document translated by the translation unit. For this reason, output data including at least one of the original document and the translated translation document is output to the user terminal 10. Moreover, since the input data and the small classification items are recorded for each user, the translation resource classification items are easily specified for each user. As a result, multilingual document creation, retrieval, display, and other processes are made more efficient, such as eliminating language barriers when reading and creating documents.

図12は、本発明の第2の実施形態に係る文書処理装置を含む文書処理システムの構成例を示す説明図である。本システムの構成は、第1の実施形態に係る文書処理装置100を含む文書処理システムと基本的に同様である。ただし、本システムでは、文書処理装置200がインターネット20に接続された各種通信コンテンツ30上の文書ファイル等にもアクセスする。   FIG. 12 is an explanatory diagram showing a configuration example of a document processing system including a document processing apparatus according to the second embodiment of the present invention. The configuration of this system is basically the same as that of the document processing system including the document processing apparatus 100 according to the first embodiment. However, in this system, the document processing apparatus 200 also accesses document files and the like on various communication contents 30 connected to the Internet 20.

文書処理装置200の構成も、第1の実施形態に係る文書処理装置100と基本的に同様である。ただし、文書処理装置200は、データ検索部234をさらに備える。以下では、第1の実施形態に係る文書処理装置100と同様な構成要素については、説明を省略する。また、図12に示されている各構成部間の接続は、あくまでも例示であって、係る場合に限定されるものではない。   The configuration of the document processing apparatus 200 is basically the same as that of the document processing apparatus 100 according to the first embodiment. However, the document processing apparatus 200 further includes a data search unit 234. Hereinafter, descriptions of the same components as those of the document processing apparatus 100 according to the first embodiment will be omitted. Moreover, the connection between each component shown by FIG. 12 is an illustration to the last, Comprising: It is not limited to the case concerned.

ここで、データ検索部234は、例えば、文書処理装置200上で実行される処理プログラムの一部として、処理制御部220に含まれ、例えば、利用者端末10から受信した検索条件に一致する原文書をインターネット20を介して接続された各種通信コンテンツ30上で検索する。また、データ検索部232は、Webサーバ等である文書処理装置200に付随する検索サーバ等で代用されるようにしてもよい。   Here, the data search unit 234 is included in the processing control unit 220 as a part of a processing program executed on the document processing apparatus 200, for example, and the original data that matches the search condition received from the user terminal 10, for example. A document is searched on various communication contents 30 connected via the Internet 20. Further, the data search unit 232 may be replaced with a search server or the like attached to the document processing apparatus 200 such as a Web server.

図13は、原文書の処理画面の表示例を示す説明図である。文書処理装置200は、前述した第1の実施形態の文書処理装置100と同様に、原文書の作成、更新、表示、言語表示の切替および検索等、複数の処理を行うが、ここでは、特に原文書のインターネット検索および表示の各処理について説明する。なお、処理画面900の構成等、前述した項目については、説明を省略する。   FIG. 13 is an explanatory diagram showing a display example of the processing screen of the original document. The document processing apparatus 200 performs a plurality of processes such as creation, update, display, switching of language display, and search, etc., as in the document processing apparatus 100 of the first embodiment described above. Each process of Internet search and display of the original document will be described. Note that the description of the above-described items such as the configuration of the processing screen 900 is omitted.

原文書のインターネット検索に際して、利用者は、原文書の分類小項目を選択手段902により選択し、検索条件を指定した上で選択手段918により原文書をインターネット検索することができる。選択手段918によりインターネット検索が選択されると、データ送信部210により送信された操作情報により入力枠932(例えばダイアログボックス等)が例えば文書枠930に表示される。利用者は、入力枠932上で所望の検索条件を入力し、例えば再びインターネット検索を選択手段918により選択する。これにより、検索条件が利用者端末10から文書作成装置200に送信されてデータ検索部232に伝達される。   When searching the Internet for an original document, the user can select a small category item of the original document by the selection unit 902, specify a search condition, and search the Internet for the original document by the selection unit 918. When the Internet search is selected by the selection unit 918, an input frame 932 (for example, a dialog box) is displayed in the document frame 930, for example, according to the operation information transmitted by the data transmission unit 210. The user inputs a desired search condition on the input frame 932 and selects, for example, the Internet search again by the selection unit 918. As a result, the search condition is transmitted from the user terminal 10 to the document creation device 200 and transmitted to the data search unit 232.

検索条件は、一般に任意の単語や文節等の検索文書と考えられる。しかし、検索文書、定期的な検索時点(例えば、月曜日の正午等)、検索対象とすべき通信コンテンツの作成言語や作成組織(例えば研究機関のみ等)等の検索範囲、および原文書の更新時点(例えば、直近1ヶ月以内等)等の少なくともいずれかが検索条件として指定されるようにしてもよい。また、この種の検索条件毎の組合せ(例えば、検索文書と検索時点の組合せ)や、任意の検索条件同士の組合せ(検索文書1と検索文書2の組合せ)が検索条件として指定されるようにしてもよい。   The search condition is generally considered to be a search document such as an arbitrary word or phrase. However, the search range of the search document, the periodic search time (for example, Monday noon), the search range of the communication content creation language and the organization to be searched (for example, research institutes only), and the update time of the original document At least one of (for example, within the last month) may be specified as the search condition. In addition, a combination for each type of search condition (for example, a combination of a search document and a search point) or any combination of search conditions (a combination of search document 1 and search document 2) is designated as a search condition. May be.

また、検索条件として検索文書が入力された場合には、入力された検索文書が少なくとも1つの他の言語に翻訳され、入力された検索文書とともに翻訳された当該検索文書を用いて原文書が検索されるようにしてもよい。この場合には、データ検索部232に伝達された検索文書が翻訳部224により翻訳され、再びデータ検索部232に伝達される。これにより、利用者は、検索条件および検索範囲をより広範に設定することができるので、検索精度の向上が図られる。   When a search document is input as a search condition, the input search document is translated into at least one other language, and the original document is searched using the search document translated together with the input search document. You may be made to do. In this case, the search document transmitted to the data search unit 232 is translated by the translation unit 224 and transmitted to the data search unit 232 again. Thereby, since the user can set the search condition and the search range more widely, the search accuracy can be improved.

データ検索部232では、インターネット20に接続されている各種通信コンテンツ30の文書ファイル上で検索条件に該当する原文書が検索される。検索条件に該当する原文書は、インターネット20上に少なくとも1つ以上存在し、場合によっては存在しない場合もある。データ受信部206では、検索された原文書が、原文書の分類情報および言語情報とともに入力データとして受信され、入力データがデータ記録部208に登録される。   In the data search unit 232, an original document corresponding to the search condition is searched on the document files of various communication contents 30 connected to the Internet 20. At least one or more original documents that meet the search conditions exist on the Internet 20, and may not exist depending on circumstances. In the data receiving unit 206, the retrieved original document is received as input data together with the original document classification information and language information, and the input data is registered in the data recording unit 208.

なお、入力データの原文書は、通常のテキストデータのみならず、例えば原文書が含まれる文書ファイルのインターネット20上での位置を表す識別子(例えば、URL、RSS等)として登録されるようにしてもよい。この場合、データ作成部226では、識別子に対応する文書ファイルのテキストデータが予め作成された上で出力データが作成される。これにより、データ記録部208の容量負荷を解消することができる。   Note that the original document of the input data is registered not only as normal text data but also as an identifier (for example, URL, RSS, etc.) indicating the position of the document file containing the original document on the Internet 20, for example. Also good. In this case, the data creation unit 226 creates output data after the text data of the document file corresponding to the identifier is created in advance. Thereby, the capacity load of the data recording unit 208 can be eliminated.

図14は、原文書の入力データの一例を示す説明図である。図14には、3つの入力データが入力データの区切りを示すタグ(項目タグ<item>)を用いて記述されている。各入力データには、分類タグ(<category>)、言語タグ(<language>)、表題タグ(<title>)および本文タグ(<description>)を用いて、分類情報、言語情報、原文書(表題部、本文部)が含まれている。なお、ここでは、入力データ中に、分類情報、言語情報および原文書が含まれる場合を示すが、一部の情報のみが含まれる場合もある。   FIG. 14 is an explanatory diagram showing an example of input data of an original document. In FIG. 14, three pieces of input data are described using tags (item tag <item>) indicating the delimiters of the input data. Each input data uses classification tag (<category>), language tag (<language>), title tag (<title>), and body text tag (<description>). (Title section, text section). Here, although the case where classification information, language information, and an original document are included in the input data is shown, only a part of the information may be included.

データ作成部226では、図14に示すような入力データから、例えば新しい更新情報を有する少なくとも1つ以上の入力データ中の原文書を含む出力データが作成され、データ送信部210により利用者端末10に送信される。利用者端末10では、出力データが処理文書として出力される。   In the data creation unit 226, output data including, for example, at least one original document in the input data having new update information is created from the input data as shown in FIG. Sent to. In the user terminal 10, output data is output as a processed document.

なお、出力データの作成に際して、原文書の要約が要約作成部130により作成されて、原文書の代わりに出力データに含まれるようにしてもよい。また、原文書の一部がデータ作成部226により作成されて、原文書の全ての代わりに出力データに含まれるようにしてもよい。これにより、利用者は、一度に多数の出力データを容易に閲覧することができ、多数の文書の閲覧性が向上する。   When the output data is created, the summary of the original document may be created by the summary creating unit 130 and included in the output data instead of the original document. Also, a part of the original document may be created by the data creation unit 226 and included in the output data instead of all of the original document. As a result, the user can easily view a large number of output data at a time, thereby improving the viewability of a large number of documents.

図15は、図14に示すような入力データから作成された出力データの表示例を示す説明図である。なお、図15には、処理画面1000に表示枠1010が設けられ、入力データ中の項目タグに基づいて3つの文書枠1020、1030、1040が表示されており、各原文書に対応する入力データ中の言語情報、原文書に基づいて、指定された表示言語により原文書が表示されている。また、言語情報として英語の情報を有する入力データの文書枠1030には、原文書の表示言語(ここでは、日本語)を選択するための選択手段1032(例えば、選択ボタン等)が設けられる。   FIG. 15 is an explanatory diagram showing a display example of output data created from input data as shown in FIG. In FIG. 15, a display frame 1010 is provided on the processing screen 1000, and three document frames 1020, 1030, and 1040 are displayed based on the item tags in the input data, and the input data corresponding to each original document. The original document is displayed in the designated display language based on the language information and the original document. The document frame 1030 for input data having English information as language information is provided with selection means 1032 (for example, a selection button) for selecting a display language (in this case, Japanese) of the original document.

利用者は、選択手段1032により原文書の表示言語を切替えることができる。これにより、選択された表示言語の情報(例えば「English」等)が利用者端末10から文書作成装置100に送信されてデータ作成部226に伝達される。データ作成部226では、処理文書の入力データがデータ記録部208から読出され、必要に応じて翻訳が行われ、作成された出力データがデータ送信部210により利用者端末10に送信される。利用者端末10では、原文書または選択手段1022により選択された表示言語に翻訳された処理文書として、出力データが出力される。ここでも、データ作成部226では、各種タグに基づいて出力データが作成される。   The user can switch the display language of the original document by the selection unit 1032. As a result, information on the selected display language (for example, “English”) is transmitted from the user terminal 10 to the document creation device 100 and transmitted to the data creation unit 226. In the data creation unit 226, the input data of the processed document is read from the data recording unit 208, translated as necessary, and the created output data is transmitted to the user terminal 10 by the data transmission unit 210. In the user terminal 10, output data is output as an original document or a processed document translated into the display language selected by the selection unit 1022. Again, the data creation unit 226 creates output data based on various tags.

図16は、インターネット検索された原文書から出力データを作成するための処理を説明するフロー図である。図16に示すように、データ作成部226では、図14に示すような入力データから出力データが作成される。まず、利用者端末10からの操作指令に応じて、基本言語情報が設定される。基本言語情報とは、処理文書の検索や表示等、処理に際して用いる基本的な言語を設定するための情報である。データ作成部226では、データ記録部208から読出された入力データ中のタグが読込まれる(S1000)。タグが言語タグであるかが判定される(S1002)。タグが言語タグであり、かつタグ情報が基本言語情報と異なる場合には、文書枠1030に切替手段1032を表示するための操作情報が操作情報作成部228により作成され、データ送信部210により利用者端末10に送信される(S1006)。タグが言語タグでない場合には、タグに応じた処理、例えば題名部に所定の書式を設定する等、出力データを作成するための処理がなされる(S1008)。当該タグに応じた処理が完了すると、入力データ中の次のタグの読込みが試みられ(S1010)、次のタグが存在する場合には、タグが読込まれ(S1000)、次のタグが存在しない場合には、出力データがデータ送信部210により利用者端末10に送信される(S1012)て、処理が終了する。   FIG. 16 is a flowchart for explaining processing for creating output data from an original document searched on the Internet. As shown in FIG. 16, the data creation unit 226 creates output data from the input data as shown in FIG. First, basic language information is set in accordance with an operation command from the user terminal 10. The basic language information is information for setting a basic language used for processing such as search and display of a processed document. Data creation unit 226 reads the tag in the input data read from data recording unit 208 (S1000). It is determined whether the tag is a language tag (S1002). When the tag is a language tag and the tag information is different from the basic language information, operation information for displaying the switching unit 1032 in the document frame 1030 is created by the operation information creation unit 228 and used by the data transmission unit 210. Is transmitted to the person terminal 10 (S1006). If the tag is not a language tag, processing corresponding to the tag, for example, processing for creating output data, such as setting a predetermined format in the title portion, is performed (S1008). When the processing corresponding to the tag is completed, an attempt is made to read the next tag in the input data (S1010). If the next tag exists, the tag is read (S1000), and the next tag does not exist. In this case, the output data is transmitted to the user terminal 10 by the data transmission unit 210 (S1012), and the process ends.

図17は、図15に示す表示例と同様な出力データの表示例を示す説明図である。図17の表示例では、処理画面1100に表示枠1110が設けられ、文書枠1130、1140、1150に入力データ中の言語情報が表示される。これにより、利用者は、入力データ中の言語情報を容易に判別することができる。文書枠1120、1130、1140には、全文表示と要約表示とを切替えるための選択手段1122、1134、1136、1142(例えば選択ボタン等)が設けられる。また、言語情報として英語の情報を有する入力データの文書枠1130には、原文書の表示言語(ここでは、日本語)を選択するための選択手段1132(例えば、選択ボタン等)が設けられる。   FIG. 17 is an explanatory diagram showing a display example of output data similar to the display example shown in FIG. In the display example of FIG. 17, a display frame 1110 is provided on the processing screen 1100, and language information in the input data is displayed in document frames 1130, 1140, and 1150. As a result, the user can easily determine the language information in the input data. The document frames 1120, 1130, and 1140 are provided with selection means 1122, 1134, 1136, and 1422 (for example, a selection button) for switching between full text display and summary display. Further, the input data document frame 1130 having English information as language information is provided with a selection means 1132 (for example, a selection button) for selecting a display language (in this case, Japanese) of the original document.

図17に示す表示例は、基本言語情報として日本語が設定されている場合の表示例である。このため、出力データの作成に際して、基本言語(ここでは、日本語)と異なる言語情報(ここでは、英語)を有する入力データの原文書が予め翻訳部224により基本言語(日本語)に翻訳された上で翻訳文書として出力データが作成されている。これにより、利用者は、多数の文書を表示言語が統一された状態で閲覧することができるので、多言語の文書が効率的に処理される。   The display example shown in FIG. 17 is a display example when Japanese is set as the basic language information. Therefore, when creating the output data, the original document of the input data having language information (here, English) different from the basic language (here, Japanese) is translated into the basic language (Japanese) by the translation unit 224 in advance. In addition, output data is created as a translated document. Thus, the user can browse a large number of documents in a state where the display language is unified, so that multilingual documents are efficiently processed.

以上のように、本実施形態に係る文書処理装置200によれば、検索条件に一致する原文書がインターネット20を介して接続された各種通信コンテンツ30上で検索され、分類情報、原文書および言語情報を含む入力データが作成される。このため、原文書は、入力データ中の分類情報に対応する分類項目に関連する翻訳資源に基づいて、少なくとも1つの他の言語に翻訳される。また、多言語で作成された複数の原文書が、予め設定された基本言語情報に対応する言語に翻訳されて一覧表示されるので、詳細な表示が望まれる所望の原文書を容易に特定することができる。これにより、文書の閲覧性が向上する等、多言語の文書の作成、検索、表示等の処理が効率化される。   As described above, according to the document processing apparatus 200 according to the present embodiment, the original document that matches the search condition is searched on the various communication contents 30 connected via the Internet 20, and the classification information, the original document, and the language are searched. Input data including information is created. Therefore, the original document is translated into at least one other language based on the translation resource related to the classification item corresponding to the classification information in the input data. In addition, since a plurality of original documents created in multiple languages are translated into languages corresponding to preset basic language information and displayed in a list, a desired original document that is desired to be displayed in detail is easily identified. be able to. Thereby, processing such as creation, retrieval, and display of a multilingual document is made more efficient, such as improved document browsing.

本発明に基づく方法は、コンピュータプログラムの形式で実現されるようにしてもよい。この場合、コンピュータプログラムは、文書処理装置100、200上、特に処理制御部120、220上で実行可能であって、本発明に基づく方法を実行するためにプログラミングされている。この場合、本発明がコンピュータプログラムによって実行されるので、コンピュータプログラムは、コンピュータプログラムによる実行に適した方法と同様に、本発明を表す。コンピュータプログラムは、記憶部104、204上またはコンピュータ読取可能な媒体上に記憶されるようにしてもよい。   The method according to the invention may be implemented in the form of a computer program. In this case, the computer program can be executed on the document processing devices 100 and 200, particularly on the processing control units 120 and 220, and is programmed to execute the method according to the present invention. In this case, since the present invention is executed by a computer program, the computer program represents the present invention as well as a method suitable for execution by a computer program. The computer program may be stored on the storage units 104 and 204 or on a computer-readable medium.

以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、特許請求の範囲に記入された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。   As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, this invention is not limited to the example which concerns. It is obvious for those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea described in the scope of claims, and of course, the technical scope of the present invention is also possible. It is understood that it belongs to.

本発明の第1の実施形態に係る文書処理装置を含む文書処理システムの構成例を示す説明図である。It is explanatory drawing which shows the structural example of the document processing system containing the document processing apparatus which concerns on the 1st Embodiment of this invention. 翻訳辞書部の階層形式で分類された項目を示す説明図である。It is explanatory drawing which shows the item classified by the hierarchical format of the translation dictionary part. 原文書の分類に用いる分類小項目を登録するための画面表示の一例を示す説明図である。It is explanatory drawing which shows an example of the screen display for registering the classification | category small item used for the classification | category of an original document. 原文書の処理画面の表示例を示す説明図である。It is explanatory drawing which shows the example of a display of the processing screen of an original document. 原文書の入力データの一例を示す説明図である。It is explanatory drawing which shows an example of the input data of an original document. 処理文書の表示言語が切替られた場合の処理画面の表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a process screen when the display language of a process document is switched. 原文書に引用文書を追加する場合の処理画面の表示例を示す説明図である。It is explanatory drawing which shows the example of a display of the process screen in the case of adding a cited document to an original document. 引用文書を含む処理文書の入力データの一例を示す説明図である。It is explanatory drawing which shows an example of the input data of the process document containing a cited document. 引用文書を含む原文書から出力データを作成するための処理を説明するフロー図である。It is a flowchart explaining the process for producing output data from the original document containing a cited document. 引用文書の表示言語が切替られた場合の処理画面の表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a process screen when the display language of a cited document is switched. 引用文書が対訳形式で表示される場合の処理画面の表示例を示す説明図である。It is explanatory drawing which shows the example of a display of a process screen when a cited document is displayed in a bilingual form. 本発明の第2の実施形態に係る文書処理装置を含む文書処理システムの構成例を示す説明図である。It is explanatory drawing which shows the structural example of the document processing system containing the document processing apparatus which concerns on the 2nd Embodiment of this invention. 原文書の処理画面の表示例を示す説明図である。It is explanatory drawing which shows the example of a display of the processing screen of an original document. 原文書の入力データの一例を示す説明図である。It is explanatory drawing which shows an example of the input data of an original document. 図14に示すような入力データから作成された出力データの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of the output data produced from the input data as shown in FIG. インターネット検索された原文書から出力データを作成するための処理を説明するフロー図である。It is a flowchart explaining the process for producing output data from the original document searched on the internet. 図15に示す表示例と同様な出力データの表示例を示す説明図である。It is explanatory drawing which shows the example of a display of the output data similar to the example of a display shown in FIG.

符号の説明Explanation of symbols

10 利用者端末
20 インターネット
30 通信コンテンツ
100、200 文書処理装置
102、202 翻訳辞書部
104、204 記憶部
106、206 データ受信部
108、208 データ記録部
110、210 データ送信部
120、220 処理制御部
122、222 辞書選択部
124、224 翻訳部
126、226 データ作成部
128、228 操作情報作成部
130、230 要約作成部
132、232 言語判定部
234 データ検索部
DESCRIPTION OF SYMBOLS 10 User terminal 20 Internet 30 Communication content 100, 200 Document processing apparatus 102, 202 Translation dictionary part 104, 204 Storage part 106, 206 Data receiving part 108, 208 Data recording part 110, 210 Data transmission part 120, 220 Processing control part 122, 222 Dictionary selection unit 124, 224 Translation unit 126, 226 Data creation unit 128, 228 Operation information creation unit 130, 230 Summary creation unit 132, 232 Language determination unit 234 Data search unit

Claims (20)

通信回線網を介して利用者端末により接続され、前記通信回線網を介して受信した原文書を処理するための文書処理装置であって、
複数の分類項目に分類された翻訳資源を有する翻訳辞書部と、
前記翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、前記通信回線網を介して受信するためのデータ受信部と、
前記入力データおよび前記分類小項目を利用者毎に記録するためのデータ記録部と、
前記入力データ中の前記分類情報に関連付けられた分類項目に関連する前記翻訳資源を前記翻訳辞書部から選択するための辞書選択部と、
選択された前記翻訳資源に基づいて、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳部と、
前記利用者端末からの操作指令に応じて、所定の前記入力データを前記データ記録部から読出し、読出された前記入力データ中の原文書および前記翻訳部により翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成部と、
前記出力データを前記通信回線網を介して前記利用者端末に送信するためのデータ送信部と、
を備えることを特徴とする文書処理装置。
A document processing apparatus connected to a user terminal via a communication line network for processing an original document received via the communication line network,
A translation dictionary having translation resources classified into a plurality of classification items;
Classifying information for classifying an original document so as to correspond to any one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource is distinguished from the creation language of the original document A data receiving unit for receiving, via the communication line network, input data including language information for use and an original document;
A data recording unit for recording the input data and the small classification items for each user;
A dictionary selection unit for selecting, from the translation dictionary unit, the translation resource related to the classification item associated with the classification information in the input data;
A translation unit for translating the original document in the input data into at least one other language based on the selected translation resource;
In response to an operation command from the user terminal, the predetermined input data is read from the data recording unit, and at least the original document in the read input data and the translated document of the original document translated by the translation unit A data creation unit for creating output data including any of them,
A data transmission unit for transmitting the output data to the user terminal via the communication network;
A document processing apparatus comprising:
操作情報を作成するための操作情報作成部をさらに備え、前記データ送信部が前記操作情報を前記利用者端末に送信することを特徴とする、請求項1に記載の文書処理装置。   The document processing apparatus according to claim 1, further comprising an operation information creation unit for creating operation information, wherein the data transmission unit transmits the operation information to the user terminal. 前記操作情報作成部は、前記出力データに対応する前記入力データ中の原文書を少なくとも1つの他の言語に翻訳するための前記操作情報、および/または前記出力データに対応する翻訳文書を原文書に戻すための前記操作情報を作成することを特徴とする、請求項2に記載の文書処理装置。   The operation information creation unit is configured to translate the operation information for translating the original document in the input data corresponding to the output data into at least one other language and / or the translation document corresponding to the output data. The document processing apparatus according to claim 2, wherein the operation information for returning to an operation is created. 前記操作情報作成部は、前記入力データ中の原文書に追加される引用文書を少なくとも1つの他の言語に翻訳するための前記操作情報、および/または前記入力データ中の原文書に追加される引用文書の翻訳文書を原文書に戻すための前記操作情報を作成することを特徴とする、請求項2に記載の文書処理装置。   The operation information creation unit is added to the operation information for translating the cited document added to the original document in the input data into at least one other language and / or the original document in the input data. The document processing apparatus according to claim 2, wherein the operation information for returning the translated document of the cited document to the original document is created. 前記操作情報作成部は、原文書が他の言語に翻訳された場合には、前記翻訳部により当該他の言語に翻訳された前記操作情報を作成し、翻訳文書が元の言語に戻された場合には、当該元の言語に戻された前記操作情報を作成することを特徴とする、請求項2に記載の文書処理装置。   The operation information creation unit creates the operation information translated into the other language by the translation unit when the original document is translated into another language, and the translated document is returned to the original language. 3. The document processing apparatus according to claim 2, wherein the operation information returned to the original language is created. 前記入力データとして原文書と原文書中に追加される引用文書とを区別するための引用情報をさらに含み、前記データ作成部が前記引用情報に基づいて前記出力データを作成することを特徴とする、請求項1に記載の文書処理装置。   The input data further includes citation information for distinguishing an original document and a citation document added to the original document, and the data creation unit creates the output data based on the citation information. The document processing apparatus according to claim 1. 前記入力データとして原文書および原文書中の引用文書の各々で作成言語を区別するための言語情報をさらに含むことを特徴とする、請求項6に記載の文書処理装置。   7. The document processing apparatus according to claim 6, further comprising language information for distinguishing a created language in each of an original document and a cited document in the original document as the input data. 前記入力データ中の原文書および/または翻訳文書の要約を作成するための要約作成部をさらに備えることを特徴とする、請求項1に記載の文書処理装置。   The document processing apparatus according to claim 1, further comprising a summary creation unit for creating a summary of an original document and / or a translation document in the input data. 前記データ作成部は、所定の前記分類情報を有する少なくとも1つの前記入力データを前記データ記録部から検索し、検索された前記入力データ中の原文書および/または前記翻訳部により翻訳された原文書の翻訳文書を含む前記出力データを作成することを特徴とする、請求項1に記載の文書処理装置。   The data creation unit retrieves at least one input data having the predetermined classification information from the data recording unit, and the original document in the retrieved input data and / or the original document translated by the translation unit The document processing apparatus according to claim 1, wherein the output data including the translated document is created. 前記利用者端末により基本言語情報が設定され、前記データ作成部は、検索された前記入力データ中の言語情報が前記基本言語情報と同一である場合には原文書を含む前記出力データを作成し、前記基本言語情報と異なる場合には前記翻訳部により前記基本言語情報に対応する言語に翻訳された原文書の翻訳文書を含む前記出力データを作成することを特徴とする、請求項9に記載の文書処理装置。   Basic language information is set by the user terminal, and the data creation unit creates the output data including an original document when the language information in the retrieved input data is the same as the basic language information. 10. The output data including a translated document of an original document translated into a language corresponding to the basic language information by the translation unit when the basic language information is different from the basic language information. Document processing device. 前記データ記録部は、前記翻訳部により予め翻訳された前記入力データ中の原文書の翻訳文書を当該入力データ中に記録することを特徴とする、請求項1に記載の文書処理装置。   The document processing apparatus according to claim 1, wherein the data recording unit records a translation document of an original document in the input data previously translated by the translation unit in the input data. 前記データ記録部は、前記出力データ中の原文書または翻訳文書であって、前記利用者端末により修正された原文書または翻訳文書を前記データ受信部により受信し、該当する前記入力データ中に記録することを特徴とする、請求項1に記載の文書処理装置。   The data recording unit is an original document or translation document in the output data, the original document or translation document modified by the user terminal is received by the data receiving unit, and recorded in the corresponding input data The document processing apparatus according to claim 1, wherein: 前記入力データ中の原文書の作成言語を判定するための言語判定部をさらに備えることを特徴とする、請求項1に記載の文書処理装置。   The document processing apparatus according to claim 1, further comprising a language determination unit for determining a creation language of an original document in the input data. 前記データ送信部が前記出力データとともに原文書の前記言語情報を前記利用者端末に送信することを特徴とする、請求項1に記載の文書処理装置。   The document processing apparatus according to claim 1, wherein the data transmission unit transmits the language information of the original document together with the output data to the user terminal. 前記利用者端末から受信した検索条件に一致する原文書を前記通信回線網を介して接続された各種通信コンテンツ上で検索するためのデータ検索部をさらに備え、
前記データ受信部は、前記データ検索部により検索された原文書とともに、当該原文書の分類情報と、当該原文書の作成言語を区別するための言語情報とを前記入力データとして受信することを特徴とする、請求項1に記載の文書処理装置。
A data search unit for searching on various communication contents connected via the communication line network for an original document that matches the search condition received from the user terminal;
The data receiving unit receives, as input data, classification information of the original document and language information for distinguishing a creation language of the original document together with the original document searched by the data search unit. The document processing apparatus according to claim 1.
前記検索条件として検索文書、検索時点、検索範囲および原文書の更新時点の少なくともいずれかが指定されることを特徴とする、請求項15に記載の文書処理装置。   The document processing apparatus according to claim 15, wherein at least one of a search document, a search time, a search range, and an update time of an original document is specified as the search condition. 前記検索条件として検索文書が指定されると、前記データ検索部が検索文書とともに前記翻訳部により翻訳された当該検索文書を用いて原文書を検索することを特徴とする、請求項17に記載の文書処理装置。   The search data according to claim 17, wherein when a search document is specified as the search condition, the data search unit searches the original document using the search document translated by the translation unit together with the search document. Document processing device. 前記翻訳辞書部が階層形式の複数の項目に分類された前記翻訳資源を備えており、前記辞書選択部が前記入力データ中の分類情報に関連付けられた分類項目および当該分類項目より上位の階層に相当する分類項目の前記翻訳資源を前記翻訳辞書部から選択し、前記翻訳部が選択された前記翻訳資源に基づいて、より下位の階層の前記翻訳資源を優先的に利用して、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳することを特徴とする、請求項1に記載の文書処理装置。   The translation dictionary unit includes the translation resources classified into a plurality of items in a hierarchical format, and the dictionary selection unit has a classification item associated with the classification information in the input data and a hierarchy higher than the classification item. Selecting the translation resource of the corresponding classification item from the translation dictionary unit, and preferentially using the translation resource in a lower hierarchy based on the translation resource selected by the translation unit, The document processing apparatus according to claim 1, wherein the original document is translated into at least one other language. 通信回線網を介して利用者端末により接続され、複数の分類項目に分類された翻訳資源を有する装置において、前記通信回線網を介して受信した原文書を処理するための文書処理方法であって、
前記翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、前記通信回線網を介して受信するデータ受信ステップと、
前記入力データおよび前記分類小項目を利用者毎に記録するデータ記録ステップと、
前記入力データ中の前記分類情報に関連付けられた分類項目に関連する前記翻訳資源を選択する辞書選択ステップと、
選択された前記翻訳資源に基づいて、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳する翻訳ステップと、
前記利用者端末からの操作指令に応じて、記録された前記入力データから所定の前記入力データを読出し、読出された前記入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するデータ作成ステップと、
前記出力データを前記通信回線網を介して前記利用者端末に送信するデータ送信ステップと、
を含むことを特徴とする文書処理方法。
A document processing method for processing an original document received via a communication line network in an apparatus connected by a user terminal via a communication line network and having translation resources classified into a plurality of classification items. ,
Classifying information for classifying an original document so as to correspond to any one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource is distinguished from the creation language of the original document A data receiving step for receiving input data including language information for use and an original document via the communication line network;
A data recording step for recording the input data and the small classification items for each user;
A dictionary selection step of selecting the translation resource associated with a classification item associated with the classification information in the input data;
Translating the original document in the input data into at least one other language based on the selected translation resource;
In response to an operation command from the user terminal, the predetermined input data is read from the recorded input data, and at least one of the original document in the read input data and the translated document of the translated original document A data creation step for creating output data including
A data transmission step of transmitting the output data to the user terminal via the communication line network;
A document processing method comprising:
通信回線網を介して利用者端末により接続され、複数の分類項目に分類された翻訳資源を有する文書処理装置に用いられるプログラムであって、前記文書処理装置を、
前記翻訳資源の分類項目の少なくともいずれかに関連付けられて利用者により登録される分類小項目のいずれかに対応するように原文書を分類するための分類情報と、原文書の作成言語を区別するための言語情報と、原文書とを含む入力データを、前記通信回線網を介して受信するためのデータ受信手段、
前記入力データおよび前記分類小項目を利用者毎に記録するためのデータ記録手段、
前記入力データ中の前記分類情報に関連付けられて分類項目に関連する前記翻訳資源を選択するための辞書選択手段、
選択された前記翻訳資源に基づいて、前記入力データ中の原文書を少なくとも1つの他の言語に翻訳するための翻訳手段、
前記利用者端末からの操作指令に応じて、記録された前記入力データから所定の前記入力データを読出し、読出された前記入力データ中の原文書および翻訳された原文書の翻訳文書の少なくともいずれかを含む出力データを作成するためのデータ作成手段、
前記出力データを前記通信回線網を介して前記利用者端末に送信するためのデータ送信手段、
として機能させるためのプログラム。
A program used in a document processing apparatus connected by a user terminal via a communication network and having translation resources classified into a plurality of classification items, the document processing apparatus comprising:
Classifying information for classifying an original document so as to correspond to any one of the classification sub-items registered by the user in association with at least one of the classification items of the translation resource is distinguished from the language in which the original document is created Data receiving means for receiving input data including linguistic information and an original document via the communication line network,
Data recording means for recording the input data and the small classification items for each user;
A dictionary selection means for selecting the translation resource associated with the classification item associated with the classification information in the input data;
Translation means for translating the original document in the input data into at least one other language based on the selected translation resource;
In response to an operation command from the user terminal, the predetermined input data is read from the recorded input data, and at least one of the original document in the read input data and the translated document of the translated original document Data creation means for creating output data including
Data transmission means for transmitting the output data to the user terminal via the communication line network;
Program to function as.
JP2006352969A 2006-12-27 2006-12-27 Document processor, document processing method, and program Pending JP2008165415A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006352969A JP2008165415A (en) 2006-12-27 2006-12-27 Document processor, document processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006352969A JP2008165415A (en) 2006-12-27 2006-12-27 Document processor, document processing method, and program

Publications (1)

Publication Number Publication Date
JP2008165415A true JP2008165415A (en) 2008-07-17

Family

ID=39694850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006352969A Pending JP2008165415A (en) 2006-12-27 2006-12-27 Document processor, document processing method, and program

Country Status (1)

Country Link
JP (1) JP2008165415A (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08202721A (en) * 1995-01-31 1996-08-09 Oki Electric Ind Co Ltd Document retrieval and display system with translating function
JPH1078965A (en) * 1996-09-04 1998-03-24 Matsushita Electric Ind Co Ltd Document display device
JP2002091965A (en) * 2000-09-19 2002-03-29 Oki Electric Ind Co Ltd Dictionary device
JP2003141018A (en) * 2001-11-02 2003-05-16 Fujitsu Ltd Server, relay device, information providing method and program
JP2004265423A (en) * 1996-05-28 2004-09-24 Ricoh Co Ltd Document translation method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08202721A (en) * 1995-01-31 1996-08-09 Oki Electric Ind Co Ltd Document retrieval and display system with translating function
JP2004265423A (en) * 1996-05-28 2004-09-24 Ricoh Co Ltd Document translation method
JPH1078965A (en) * 1996-09-04 1998-03-24 Matsushita Electric Ind Co Ltd Document display device
JP2002091965A (en) * 2000-09-19 2002-03-29 Oki Electric Ind Co Ltd Dictionary device
JP2003141018A (en) * 2001-11-02 2003-05-16 Fujitsu Ltd Server, relay device, information providing method and program

Similar Documents

Publication Publication Date Title
US10796076B2 (en) Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine
KR101076858B1 (en) Methods and systems for language translation
US7890506B2 (en) User interface control apparatus and method thereof
US6697838B1 (en) Method and system for annotating information resources in connection with browsing, in both connected and disconnected states
JP5264892B2 (en) Multilingual information search
JP4810469B2 (en) Search support device, program, and search support system
US20140032522A1 (en) Systems and methods for contextual searching of semantic entities
US20100185600A1 (en) Apparatus and method for integration search of web site
US20060059133A1 (en) Hyperlink generation device, hyperlink generation method, and hyperlink generation program
US20070043736A1 (en) Smart find
US20090313536A1 (en) Dynamically Providing Relevant Browser Content
JP2015525929A (en) Weight-based stemming to improve search quality
US20090282037A1 (en) Method and system for providing convenient dictionary services
KR100747724B1 (en) System and its method for web navigation for visually handicapped person
KR101537555B1 (en) A direct search system for message on the instant messenger
JP5332128B2 (en) Information retrieval apparatus, information retrieval method and program thereof
JP2008165415A (en) Document processor, document processing method, and program
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
KR100516302B1 (en) Method And System For Handling Wrongly Inputted Internet Address
JP2007065990A (en) Information retrieval device
JP5843235B2 (en) WEB information processing apparatus, WEB information processing method, and program
JPWO2018179228A1 (en) Search system, method and program
JP2008065577A (en) Document retrieval system, document retrieval program and computer-readable recording medium recorded with document retrieval program
JPH1021222A (en) Machine translation method and terminology dictionary selecting method
JP2003122795A (en) Device, method and program for displaying information, and computer readable recording medium stored with information display program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120619