JP2016009417A - Document processor and document processing program - Google Patents

Document processor and document processing program Download PDF

Info

Publication number
JP2016009417A
JP2016009417A JP2014130954A JP2014130954A JP2016009417A JP 2016009417 A JP2016009417 A JP 2016009417A JP 2014130954 A JP2014130954 A JP 2014130954A JP 2014130954 A JP2014130954 A JP 2014130954A JP 2016009417 A JP2016009417 A JP 2016009417A
Authority
JP
Japan
Prior art keywords
document
evaluation
unit
data
document processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014130954A
Other languages
Japanese (ja)
Other versions
JP6192603B2 (en
Inventor
徹 保井
Toru Yasui
徹 保井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2014130954A priority Critical patent/JP6192603B2/en
Priority to US14/751,155 priority patent/US20150381849A1/en
Publication of JP2016009417A publication Critical patent/JP2016009417A/en
Application granted granted Critical
Publication of JP6192603B2 publication Critical patent/JP6192603B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document processor and document processing program capable of readily producing metadata, which is used to evaluate the contents of a document, and outlining the document on the basis of the produced metadata.SOLUTION: Included are a memory unit that stores document data which contains at least one of character data and image data, an output unit that outputs the stored document data, a control unit that allows the output unit to output the stored document data so that the document data can be evaluated by one or more evaluators, and an input unit that receives pieces of position information in the document data concerning one or more evaluated points selected by the one or more evaluators who have evaluated the outputted document, and results of evaluations assigned to the respective evaluated points. The control unit allows the memory unit to store the pieces of position information and results of evaluations, which are received by the input unit, extracts the evaluated points from the document data on the basis of the stored pieces of position information, and creates an abstract.

Description

本発明は、メタデータに基づいて文書を処理する文書処理装置および文書処理プログラムに関する。   The present invention relates to a document processing apparatus and a document processing program for processing a document based on metadata.

近年、文書を登録し管理するサーバーや画像形成装置(MFP、Multifunction Peripheral)などの情報機器では、扱う文書数の増大に伴い、登録した文書の管理を効率化できる仕組みが求められていた。そして、以下のような仕組みが開発された。   In recent years, information devices such as servers for registering and managing documents and image forming apparatuses (MFP, Multifunction Peripheral) have been required to have a mechanism that can efficiently manage registered documents as the number of documents handled increases. The following mechanism was developed.

例えば、特許文献1において開示された技術では、まず、画像形成装置に登録する文書とその文書のメタデータをメモリーカードから読み込み、画像形成装置で扱う文書形式に変換して、文書とそのメタデータを蓄積する。そして、ユーザーが入力したキーワードとメタデータに登録しているキーワードとを照合して、登録した文書を検索する。   For example, in the technique disclosed in Patent Document 1, first, a document to be registered in the image forming apparatus and metadata of the document are read from a memory card, converted into a document format handled by the image forming apparatus, and the document and its metadata are converted. Accumulate. Then, the registered document is searched by comparing the keyword input by the user with the keyword registered in the metadata.

また、特許文献2に開示された技術では、分析する文章に対して、検索に用いるキーワードと、そのキーワードに対する評価を表す語句と、その語句が文中に現れた際に集計する評価値とを用いて様々な分析を行う。文章中のキーワードを検索し、探し出したキーワードの周囲にある評価を表す語句を抽出し、その語句の内容により、検索されたキーワードに対する著者の評価を得る。そして得た多くの評価を集計して分析するものである。   Further, the technique disclosed in Patent Document 2 uses a keyword used for a search for a sentence to be analyzed, a phrase representing evaluation for the keyword, and an evaluation value that is totaled when the phrase appears in the sentence. Perform various analyses. A keyword in a sentence is searched, a phrase representing an evaluation around the searched keyword is extracted, and an author's evaluation for the searched keyword is obtained based on the contents of the phrase. And many evaluations obtained are aggregated and analyzed.

また、特許文献3に開示された技術では、ウェブ・ページに広告を配信する際に、ウェブ・ページ内の単語を評価し、単語の評価から製品に対する意見を判定する。判定した意見に基づき、抽出要約または記述的要約を作成してテンプレートに入力することにより、その製品に対する広告を形成する。   In the technique disclosed in Patent Document 3, when an advertisement is distributed to a web page, words in the web page are evaluated, and an opinion on the product is determined from the word evaluation. Based on the determined opinion, an extracted summary or descriptive summary is created and entered into a template to form an advertisement for the product.

また、特許文献4に開示された技術では、ユーザーがある文書(閲覧文書)を閲覧中に、その文書中の単語等をキーワードとして他の文書を検索し、検索結果として挙がった文書のうちユーザーが参照した文書を参照文書とする。閲覧文書と参照文書との関係をメタデータとして蓄積し、各種分析を行う。   In the technique disclosed in Patent Document 4, while a user is browsing a document (browsing document), another document is searched using a word or the like in the document as a keyword, and the user among the documents listed as a search result. The document referred to by is used as the reference document. The relationship between the browsing document and the reference document is accumulated as metadata, and various analyzes are performed.

特開2008−299432号公報JP 2008-299432 A 特開2011−70252号公報JP 2011-70252 A 特表2011−519444号公報Special table 2011-519444 gazette 特開2007−102767号公報JP 2007-102767 A

上述したように、数多くの文書を管理したり分析したりするために、メタデータが活用されてきた。しかし、文書の内容を評価するためのメタデータの作成は、非常に手間のかかるものであった。   As described above, metadata has been used to manage and analyze a large number of documents. However, creation of metadata for evaluating the contents of a document is very time-consuming.

以上のような事情に鑑み、本発明の目的は、文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約できる文書処理装置および文書処理プログラムを提供することにある。   In view of the circumstances as described above, an object of the present invention is to provide a document processing apparatus and a document processing program capable of easily creating metadata for evaluating the contents of a document and summarizing the document based on the created metadata. There is.

上記目的を達成するため、本発明の一形態に係る文書処理装置は、文字データおよびイメージデータのうち少なくとも一方を含む文書データが記憶された記憶部と、前記記憶された前記文書データを出力する出力部と、前記記憶された文書データを1人以上の評価者に評価させるために前記出力部に出力させる制御部と、前記出力された文書を評価した前記1人以上の評価者により選択された1以上の評価箇所の前記文書データ内での位置情報と前記評価箇所ごとに付与された評価結果とを受け付ける入力部とを備え、前記制御部は更に、前記入力部が受け付けた前記位置情報および前記評価結果を前記記憶部に記憶させ、前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する。そのため、文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約できる。   To achieve the above object, a document processing apparatus according to an aspect of the present invention outputs a storage unit storing document data including at least one of character data and image data, and the stored document data. Selected by an output unit, a control unit that causes the output unit to output the stored document data for evaluation by one or more evaluators, and the one or more evaluators who evaluated the output document. An input unit that receives position information of the one or more evaluation points in the document data and an evaluation result assigned to each evaluation point, and the control unit further receives the position information received by the input unit. Then, the evaluation result is stored in the storage unit, and based on the stored position information, the evaluation part is extracted from the document data to create a summary. Therefore, metadata for evaluating the contents of the document can be easily created, and the document can be summarized based on the created metadata.

上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記位置情報に加え、前記評価結果に基づき、前記評価箇所を前記文書データから抽出して要約を作成する構成でもよい。   In order to achieve the above object, in the document processing apparatus according to an aspect of the present invention, the control unit creates the summary by extracting the evaluation portion from the document data based on the evaluation result in addition to the position information. The structure to do may be sufficient.

上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記評価箇所のうち、前記付与された評価結果の数が特定のしきい値を超えた評価箇所を前記要約として抽出する構成でもよい。   In order to achieve the above object, in the document processing apparatus according to an aspect of the present invention, the control unit includes, among the evaluation points, an evaluation point where the number of the assigned evaluation results exceeds a specific threshold value. It may be configured to extract as the summary.

上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記評価箇所を前記文書データから抽出するとき、前記評価箇所を含む文章全体を抽出する構成でもよい。   In order to achieve the above object, in the document processing apparatus according to an aspect of the present invention, the control unit may extract the entire sentence including the evaluation portion when the evaluation portion is extracted from the document data.

上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記評価結果として、前記入力部に、高評価および低評価のいずれか一方を受け付けさせる構成でもよい。   In order to achieve the above object, in the document processing apparatus according to an aspect of the present invention, the control unit may cause the input unit to accept either high evaluation or low evaluation as the evaluation result.

上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記作成する要約に、前記評価箇所ごとの、前記高評価および前記低評価の数を含める構成でもよい。   In order to achieve the above object, in the document processing apparatus according to an aspect of the present invention, the control unit may include the number of the high evaluation and the low evaluation for each evaluation portion in the generated summary. .

上記目的を達成するため、本発明の一形態に係る文書処理プログラムは、記憶部に記憶された、文字データおよびイメージデータのうち少なくとも一方を含む文書データを1人以上の評価者に評価させるために出力部に出力させ、入力部に、前記出力された文書データを評価した前記1人以上の評価者により選択された評価箇所の前記文書データ内での位置情報と前記評価箇所に対して付与された評価結果とを受け付けさせ、前記受け付けられた前記位置情報および前記評価結果を前記記憶部に記憶させ、前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する制御部としてコンピューターを機能させる。   In order to achieve the above object, a document processing program according to an aspect of the present invention causes one or more evaluators to evaluate document data including at least one of character data and image data stored in a storage unit. Output to the output unit, and to the input unit, the position information in the document data of the evaluation point selected by the one or more evaluators who evaluated the output document data and the evaluation point The received evaluation result, the received position information and the evaluation result are stored in the storage unit, and the evaluation part is extracted from the document data and summarized based on the stored position information. Make the computer function as a controller that creates

以上のように、本発明によれば、文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約できる。   As described above, according to the present invention, metadata for evaluating the content of a document can be easily created, and the document can be summarized based on the created metadata.

、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバー1として用いて実現する場合の、利用環境の具体的な例の構成図である。1 is a configuration diagram of a specific example of a usage environment in a case where a document processing apparatus according to an embodiment of the present invention is realized using a general computer as a document processing server 1. 文書処理装置として用いる文書処理サーバー1の構成図である。It is a block diagram of the document processing server 1 used as a document processing apparatus. 本発明の一実施形態に係る文書処理装置を、画像形成装置20として実現する場合の、利用環境の具体的な例の構成図である。FIG. 2 is a configuration diagram of a specific example of a usage environment when a document processing apparatus according to an embodiment of the present invention is realized as an image forming apparatus 20. 文書処理装置として用いる画像形成装置20の構成図である。1 is a configuration diagram of an image forming apparatus 20 used as a document processing apparatus. 文書処理サーバー1または画像形成装置20において、登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を示す具体例である。This is a specific example showing how the evaluator adds a Like attribute or a Dislike attribute to a specific part designated by the evaluator of the registered document in the document processing server 1 or the image forming apparatus 20. XMLなどの構造化言語フォーマットを用いて生成したメタデータの具体例である。It is a specific example of metadata generated using a structured language format such as XML. 評価者Cが文書Dの特定の箇所「MAXで8192KB」にLike属性を付与し、評価者Dが文書Dの特定の箇所(Test4のグラフ)にLike属性を付与する様子を示す図である。It is a figure which shows a mode that the evaluator C gives a Like attribute to the specific location "MAX of 8192KB" of the document D, and the evaluator D gives the Like attribute to the specific location (Graph of Test4) of the document D. 評価者B、C、およびDによる評価結果として生成されるメタデータ17bの例をまとめて示す図である。It is a figure which shows collectively the example of the metadata 17b produced | generated as an evaluation result by the evaluators B, C, and D. 集められたメタデータに基づいて生成される要約の例を示す図である。It is a figure which shows the example of the summary produced | generated based on the collected metadata. 要約D2にさらに属性付与の内訳を記載した要約D3の例を示す図である。It is a figure which shows the example of the summary D3 which described the breakdown of attribute addition further to the summary D2. 評価する文書を画像形成装置20に登録する第1の段階の処理の流れについて説明するためのフローチャートである。4 is a flowchart for explaining a flow of processing in a first stage in which a document to be evaluated is registered in the image forming apparatus. 画像形成装置20に登録した文書を評価する第2の段階の処理の流れについて説明するためのフローチャートである。10 is a flowchart for explaining a flow of processing in a second stage for evaluating a document registered in the image forming apparatus 20. 2人の評価者(評価者Aおよび評価者B)が、画像形成装置20において文書を評価する処理の具体例を説明するためのシーケンス図である。FIG. 10 is a sequence diagram for explaining a specific example of a process in which two evaluators (evaluator A and evaluator B) evaluate a document in the image forming apparatus 20. 第1の段階として文書を登録するユーザーが、第2の段階の評価者を兼ね、第1の段階と第2の段階をまとめて処理する具体例を説明するためのシーケンス図である。It is a sequence diagram for demonstrating the specific example which the user who registers a document as a 1st step serves as the evaluator of a 2nd step, and processes a 1st step and a 2nd step collectively. 収集された評価に関するメタデータに基づき、文書の要約を作成する第3の段階の処理の流れについて説明するためのフローチャートである。It is a flowchart for demonstrating the flow of a process of the 3rd step which produces the summary of a document based on the metadata regarding the collected evaluation. 第3の段階において、ユーザーの指示により要約が印刷されて出力されるまでの具体例を説明するためのシーケンス図である。It is a sequence diagram for demonstrating the example until a summary is printed and output by a user's instruction | indication in a 3rd step.

以下、図面を参照しながら、本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[概要]
最初に、本発明の概要について説明する。本発明は、「文書の登録」、「登録した文書の評価」、および「文書の評価をメタデータとして活用」の、3つの段階から構成される。
[Overview]
First, the outline of the present invention will be described. The present invention includes three stages: “document registration”, “evaluation of registered document”, and “utilization of document evaluation as metadata”.

第1の段階では、「文書の登録」を行う。具体的には、ユーザーが文書処理装置により処理したい文書を、文書処理装置に登録する。登録は、紙媒体に印刷された文書をスキャナーで読取り、OCR(Optical Character Recognition)処理して電子的な文字データやイメージデータとしたものを文書処理装置に登録してもよいし、最初から電子データである文書をそのまま文書処理装置に登録してもよい。   In the first stage, “document registration” is performed. Specifically, a document that the user wants to process by the document processing apparatus is registered in the document processing apparatus. The registration may be performed by reading a document printed on a paper medium with a scanner and performing OCR (Optical Character Recognition) processing to form electronic character data or image data in a document processing apparatus. A document that is data may be registered in the document processing apparatus as it is.

第2の段階では、第1の段階で「登録した文書の評価」を行う。評価は、文書を登録したユーザーが属するグループのメンバーが文書処理装置にアクセスして行ってもよいし、文書を登録したユーザーとは無関係な一般の人が文書処理装置にアクセス出来るようにして評価を集めてもよい。評価は、評価者が文書管理装置に登録された文書の一部を指定し、指定した箇所に対して「Like」(好き、高評価)属性または「Dislike」(嫌い、低評価)属性を付与することにより行う。   In the second stage, “evaluation of registered document” is performed in the first stage. The evaluation may be performed by accessing the document processing apparatus by a member of the group to which the user who registered the document belongs, or by allowing an ordinary person unrelated to the user who registered the document to access the document processing apparatus. May be collected. In the evaluation, the evaluator designates a part of the document registered in the document management apparatus, and assigns a “Like” (like, high evaluation) attribute or a “Dislike” (dislike, low evaluation) attribute to the designated portion. To do.

第3の段階では、第2の段階で集めた「文書の評価をメタデータとして活用」する。具体的には、登録された文書のうち、Like属性やDislike属性が多くの評価者により付与された箇所は、注目度が高い重要な箇所であると判断し、その部分を抽出することにより、登録された文書の要約を作成する。   In the third stage, “use document evaluation as metadata” collected in the second stage. Specifically, in a registered document, a portion where a Like attribute or Dislike attribute is given by many evaluators is determined to be an important portion with a high degree of attention, and by extracting that portion, Create a summary of registered documents.

上述した3段階を経ることにより、登録された文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約することが出来る。   Through the above three steps, metadata for evaluating the contents of the registered document can be easily created, and the document can be summarized based on the created metadata.

以上、本発明の概要について説明した。   The outline of the present invention has been described above.

[文書処理装置を利用する環境(その1)]
次に、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバーとして用いて実現する場合の、利用環境の具体的な構成例を説明する。図1は、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバー1として用いて実現する場合の、利用環境の具体的な例の構成図である。
[Environment using document processing device (part 1)]
Next, a specific configuration example of the usage environment when the document processing apparatus according to the embodiment of the present invention is realized using a general computer as a document processing server will be described. FIG. 1 is a configuration diagram of a specific example of a usage environment when a document processing apparatus according to an embodiment of the present invention is realized using a general computer as the document processing server 1.

この利用環境では、文書処理装置である文書処理サーバー1が、ネットワーク4を介して、PC(Personal Computer)2や画像形成装置3と接続されている。PC2および画像形成装置3は複数台あっても構わない。   In this usage environment, a document processing server 1 that is a document processing apparatus is connected to a PC (Personal Computer) 2 and an image forming apparatus 3 via a network 4. There may be a plurality of PCs 2 and image forming apparatuses 3.

「文書の登録」を行う第1の段階では、例えば、ユーザーが画像形成装置3のスキャナー機能を用いて紙文書をスキャンし、画像形成装置3の有するOCR機能により文書を文字データおよびイメージデータとして電子化し、電子化した文書をネットワーク4経由で文書処理サーバー1に登録する。   In the first stage of “document registration”, for example, a user scans a paper document using the scanner function of the image forming apparatus 3, and the document is converted into character data and image data by the OCR function of the image forming apparatus 3. The digitized document is registered in the document processing server 1 via the network 4.

また、第1の段階では、PC2から文字データやイメージデータを含む電子的な文書をネットワーク4経由で文書処理サーバー1に登録してもよい。   In the first stage, an electronic document including character data and image data may be registered from the PC 2 in the document processing server 1 via the network 4.

「登録した文書の評価」を行う第2の段階では、文書処理サーバー1に登録された文書を評価するために、評価者は、文書処理サーバー1に備えられた表示部や操作入力部を用いて文書に直接アクセスするか、PC2からネットワーク4を介して文書にアクセスする。   In the second stage of performing “evaluation of registered document”, the evaluator uses a display unit and an operation input unit provided in the document processing server 1 in order to evaluate the document registered in the document processing server 1. The document is directly accessed or the document is accessed from the PC 2 via the network 4.

「文書の評価をメタデータとして活用」する第3の段階では、第2の段階で文書内の特定の箇所に紐付けられたLike属性およびDislike属性を集計し、文書の要約を作成する。作成された要約を見るために、ユーザーは、文書処理サーバー1に備えられた表示部や操作入力部を用いて要約に直接アクセスするか、PC2を用いてネットワーク4経由で要約にアクセスする。   In the third stage of “utilizing document evaluation as metadata”, the Like attribute and Dislike attribute associated with a specific part in the document in the second stage are aggregated to create a summary of the document. In order to view the created summary, the user directly accesses the summary using the display unit and the operation input unit provided in the document processing server 1 or accesses the summary via the network 4 using the PC 2.

以上、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバー1として用いて実現する場合の、利用環境の具体的な構成例を説明した。   The specific configuration example of the usage environment has been described above in the case where the document processing apparatus according to the embodiment of the present invention is realized using a general computer as the document processing server 1.

[文書処理装置の構成(その1)]
次に、文書処理装置として用いる文書処理サーバー1の構成について説明する。図2は、文書処理装置として用いる文書処理サーバー1の構成図である。
[Configuration of Document Processing Apparatus (Part 1)]
Next, the configuration of the document processing server 1 used as the document processing apparatus will be described. FIG. 2 is a configuration diagram of the document processing server 1 used as a document processing apparatus.

図2に示すように、文書処理サーバー1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、操作入力部(入力部)14、ネットワークインターフェイス部(出力部)15、表示部(出力部)16、および記憶部17を有し、これら各ブロックがバス18を介して接続されている。   As shown in FIG. 2, the document processing server 1 includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, an operation input unit (input unit) 14, a network interface unit ( An output unit) 15, a display unit (output unit) 16, and a storage unit 17, and these blocks are connected via a bus 18.

ROM12は、各種の処理を実行するためのファームウェア等の複数のプログラムやデータを記憶する。RAM13は、CPU11の作業用領域として用いられ、OS(Operating System)、実行中の各種アプリケーション、処理中の各種データを一時的に保持する。   The ROM 12 stores a plurality of programs and data such as firmware for executing various processes. The RAM 13 is used as a work area for the CPU 11 and temporarily holds an OS (Operating System), various applications being executed, and various data being processed.

記憶部17は、例えばHDD(Hard Disk Drive)や、フラッシュメモリー、その他の不揮発性メモリーである。記憶部17には、OSや各種アプリケーションに加え、登録し評価される文書の文書データ17aや、文書を評価する事により特定の箇所に付加されたLike属性やDislike属性などのメタデータ17b、文書データ17aをメタデータ17bに基づいて処理して作成された要約データ17cが記憶される。   The storage unit 17 is, for example, an HDD (Hard Disk Drive), a flash memory, or other nonvolatile memory. In the storage unit 17, in addition to the OS and various applications, document data 17a of a document to be registered and evaluated, metadata 17b such as a Like attribute and a Dislike attribute added to a specific part by evaluating the document, a document Summary data 17c created by processing the data 17a based on the metadata 17b is stored.

ネットワークインターフェイス部15は、ネットワーク4と接続されており、PC2や画像形成装置3と情報のやりとりを行う。   The network interface unit 15 is connected to the network 4 and exchanges information with the PC 2 and the image forming apparatus 3.

CPU11は、ROM12や記憶部17に記憶された複数のプログラムのうち、操作入力部14やネットワーク4経由で与えられる命令に対応するプログラムをRAM13に展開し、この展開されたプログラムにしたがって、表示部16及び記憶部17を適宜制御する。   The CPU 11 expands a program corresponding to an instruction given via the operation input unit 14 or the network 4 among the plurality of programs stored in the ROM 12 or the storage unit 17 in the RAM 13, and displays the display unit according to the expanded program. 16 and the storage unit 17 are appropriately controlled.

また、CPU11は、ネットワーク4およびネットワークインターフェイス部15を介してユーザーが登録するために入力した電子的な文書データを記憶部17に記憶する。そして、CPU11は、評価者に対し、記憶した文書データ17aを提示し、評価者が提示された文書の特定の箇所に付加したLike属性およびDislike属性をメタデータ17bとして記憶部17に記憶する。   Further, the CPU 11 stores electronic document data input for registration by the user via the network 4 and the network interface unit 15 in the storage unit 17. Then, the CPU 11 presents the stored document data 17a to the evaluator, and stores the Like attribute and Dislike attribute added to a specific portion of the document presented by the evaluator in the storage unit 17 as metadata 17b.

そして、CPU11は、記憶されたメタデータ17bに基づいて、文書の要約を要約データ17cとして作成し、作成した要約をユーザーに提供する。   Then, the CPU 11 creates a summary of the document as summary data 17c based on the stored metadata 17b, and provides the created summary to the user.

操作入力部14は、例えばマウス等のポインティングデバイス、キーボード、タッチパネル、その他の操作装置である。   The operation input unit 14 is, for example, a pointing device such as a mouse, a keyboard, a touch panel, and other operation devices.

表示部16は、例えば液晶ディスプレイ、EL(Electro-Luminescence)ディスプレイ、プラズマディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等である。表示部16は、文書処理サーバー1に内蔵されていてもよいし、外部接続されていてもよい。   The display unit 16 is, for example, a liquid crystal display, an EL (Electro-Luminescence) display, a plasma display, a CRT (Cathode Ray Tube) display, or the like. The display unit 16 may be built in the document processing server 1 or may be externally connected.

以上、文書処理装置として用いる文書処理サーバー1の構成について説明した。   The configuration of the document processing server 1 used as the document processing apparatus has been described above.

[文書処理装置を利用する環境(その2)]
次に、本発明の一実施形態に係る文書処理装置を、画像形成装置として実現する場合の、利用環境の具体的な構成例を説明する。図3は、本発明の一実施形態に係る文書処理装置を、画像形成装置20として実現する場合の、利用環境の具体的な例の構成図である。
[Environment using document processing device (part 2)]
Next, a specific configuration example of the usage environment when the document processing apparatus according to an embodiment of the present invention is realized as an image forming apparatus will be described. FIG. 3 is a configuration diagram of a specific example of the usage environment when the document processing apparatus according to the embodiment of the present invention is realized as the image forming apparatus 20.

この利用環境では、文書処理装置である画像形成装置20が、上述した例の文書処理サーバー1を兼ねている。すなわち、画像形成装置20は、上述した文書処理サーバー1と一般的な画像形成装置3の機能を統合したものである。   In this usage environment, the image forming apparatus 20 that is a document processing apparatus also serves as the document processing server 1 in the above-described example. In other words, the image forming apparatus 20 integrates the functions of the document processing server 1 and the general image forming apparatus 3 described above.

画像形成装置20が文書処理サーバー1の機能を兼ねている点を除けば、図1に示した構成と同じなので、詳細な説明は省略する。   Except for the point that the image forming apparatus 20 also functions as the document processing server 1, the configuration is the same as that shown in FIG.

以上、本発明の一実施形態に係る文書処理装置を、画像形成装置20として実現する場合の、利用環境の具体的な構成例を説明した。   The specific configuration example of the usage environment when the document processing apparatus according to the embodiment of the present invention is realized as the image forming apparatus 20 has been described above.

[文書処理装置の構成(その2)]
次に、文書処理装置として用いる画像形成装置20の構成について説明する。図4は、文書処理装置として用いる画像形成装置20の構成図である。
[Configuration of Document Processing Device (Part 2)]
Next, the configuration of the image forming apparatus 20 used as the document processing apparatus will be described. FIG. 4 is a configuration diagram of the image forming apparatus 20 used as the document processing apparatus.

画像形成装置20は、制御部21を備える。制御部21は、CPU、RAM、ROM、および専用のハードウェア回路等から構成され、画像形成装置20の全体的な動作制御を司る。   The image forming apparatus 20 includes a control unit 21. The control unit 21 includes a CPU, a RAM, a ROM, a dedicated hardware circuit, and the like, and governs overall operation control of the image forming apparatus 20.

制御部21は、原稿読取部(スキャナー)22、画像処理部24、画像メモリー25、画像形成部(出力部)26、操作部(入力部)27、ファクシミリ通信部28、ネットワークインターフェイス部(出力部)29、記憶部31等と接続されている。制御部21は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。   The control unit 21 includes a document reading unit (scanner) 22, an image processing unit 24, an image memory 25, an image forming unit (output unit) 26, an operation unit (input unit) 27, a facsimile communication unit 28, a network interface unit (output unit). ) 29, connected to the storage unit 31 and the like. The control unit 21 performs operation control of each of the above connected units, and transmission / reception of signals or data to / from each unit.

また、制御部21は、ネットワーク4およびネットワークインターフェイス部15を介してユーザーが登録するためにPC2から入力した電子的な文書データを記憶部17に記憶する。または、制御部21は、ユーザーが登録するために原稿読取部22に読み取らせたイメージデータをOCR処理し、電子的な文書データ31aとして記憶部31に記憶させる。   Further, the control unit 21 stores electronic document data input from the PC 2 in the storage unit 17 for registration by the user via the network 4 and the network interface unit 15. Alternatively, the control unit 21 performs OCR processing on the image data read by the document reading unit 22 for registration by the user, and stores the image data in the storage unit 31 as electronic document data 31a.

そして、制御部21は、評価者に対し、記憶した文書データ31aを、表示部27aまたはネットワーク4経由で提示し、評価者が提示された文書の特定の箇所に付加したLike属性およびDislike属性をメタデータ31bとして記憶部31に記憶する。   Then, the control unit 21 presents the stored document data 31a to the evaluator via the display unit 27a or the network 4, and adds the Like attribute and the Dislike attribute added to a specific part of the document presented by the evaluator. The metadata 31b is stored in the storage unit 31.

そして、制御部21は、記憶されたメタデータ31bに基づいて、文書の要約を要約データ31cとして作成し、作成した要約をユーザーに提供する。   Then, the control unit 21 creates a summary of the document as summary data 31c based on the stored metadata 31b, and provides the created summary to the user.

制御部21は、ユーザーから、操作部27またはネッワーク接続されたPC2等を通じて入力されるジョブの実行指示に従って、スキャナー機能、印刷機能、コピー機能、およびファクシミリ送受信機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。   The control unit 21 performs operation control on each function such as a scanner function, a print function, a copy function, and a facsimile transmission / reception function in accordance with a job execution instruction input from the user through the operation unit 27 or the network-connected PC 2 or the like. Controls the drive and processing of the mechanisms necessary to execute.

また、制御部21は、OCR処理部21a等を有している。OCR処理部21a等は、ROMなどからRAMにロードされたプログラムがCPUにより実行されることで実現される機能ブロックである。   Further, the control unit 21 includes an OCR processing unit 21a and the like. The OCR processing unit 21a and the like are functional blocks that are realized by the CPU executing a program loaded from the ROM or the like to the RAM.

OCR処理部21aは、原稿読取部22により読み込まれたイメージデータをOCR処理し、文書データに変換したり、グラフや写真などのイメージデータを抽出したりする。   The OCR processing unit 21a performs OCR processing on the image data read by the document reading unit 22 and converts the image data into document data, or extracts image data such as graphs and photographs.

原稿読取部22は、原稿から画像を読み取る。   The document reading unit 22 reads an image from a document.

画像処理部24は、原稿読取部22で読み取られた画像のイメージデータを必要に応じて画像処理する。例えば、画像処理部24は、原稿読取部22により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。   The image processing unit 24 performs image processing on the image data of the image read by the document reading unit 22 as necessary. For example, the image processing unit 24 performs image processing such as shading correction in order to improve the quality after the image read by the document reading unit 22 is formed.

画像メモリー25は、原稿読取部22による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部26での印刷対象となるデータを一時的に記憶したりする領域である。   The image memory 25 is an area for temporarily storing document image data obtained by reading by the document reading unit 22 and temporarily storing data to be printed by the image forming unit 26.

画像形成部26は、原稿読取部22で読み取られたイメージデータ等の画像形成を行う。   The image forming unit 26 forms an image such as image data read by the document reading unit 22.

操作部27は、画像形成装置20が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたLCD(Liquid Crystal Display)等の表示部(出力部)27aを備えている。   The operation unit 27 includes a touch panel unit and operation key units that receive instructions from the user regarding various operations and processes that can be executed by the image forming apparatus 20. The touch panel unit includes a display unit (output unit) 27a such as an LCD (Liquid Crystal Display) provided with a touch panel.

ファクシミリ通信部28は、図示しない符号化/復号化部、変復調部、およびNCU(Network Control Unit)を備え、公衆電話回線網を用いてのファクシミリの送信を行う。   The facsimile communication unit 28 includes an encoding / decoding unit, a modulation / demodulation unit, and an NCU (Network Control Unit) (not shown), and performs facsimile transmission using a public telephone line network.

ネットワークインターフェイス部29は、LANボード等の通信モジュールから構成され、ネットワークインターフェイス部29に接続されたLAN等を介して、ローカルエリア内の装置(PC等)と種々のデータの送受信を行う。   The network interface unit 29 includes a communication module such as a LAN board, and transmits and receives various data to and from a device (such as a PC) in the local area via a LAN or the like connected to the network interface unit 29.

記憶部31は、原稿読取部22によって読み取られた原稿画像や、文書データ31a、メタデータ31b、要約データ31cを記憶する。記憶部31は、HDDなどの大容量の記憶装置である。なお、文書データ31a、メタデータ31b、および要約データ31cは、上述した文書データ17a、メタデータ17b、および要約データ17cと同じものである。   The storage unit 31 stores a document image read by the document reading unit 22, document data 31a, metadata 31b, and summary data 31c. The storage unit 31 is a large-capacity storage device such as an HDD. The document data 31a, metadata 31b, and summary data 31c are the same as the document data 17a, metadata 17b, and summary data 17c described above.

以上、文書処理装置として用いる画像形成装置20の構成について説明した。   The configuration of the image forming apparatus 20 used as the document processing apparatus has been described above.

[Like属性およびDislike属性の付加方法]
次に、上述した第2の段階において、文書処理サーバー1または画像形成装置20に登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を具体例で説明する。図5は、文書処理サーバー1または画像形成装置20において、登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を示す具体例である。なお、以下の例では、文書処理装置として文書処理サーバー1を用いて説明する。
[Method of adding Like attribute and Dislike attribute]
Next, in the second stage described above, the evaluator adds a Like attribute or a Dislike attribute to a specific part designated by the evaluator in the document registered in the document processing server 1 or the image forming apparatus 20. The situation will be described with a specific example. FIG. 5 is a specific example showing how the evaluator adds a Like attribute or a Dislike attribute to a specific part specified by the evaluator of the registered document in the document processing server 1 or the image forming apparatus 20. is there. In the following example, the document processing server 1 is used as a document processing apparatus.

最初に、ユーザーAが、「評価結果レポート」という文書Dを文書処理サーバー1に登録しているとする。   First, it is assumed that the user A registers the document D “evaluation result report” in the document processing server 1.

次に、評価者Bが、文書評価用アプリケーションプログラムを用いて、閲覧画面D1上で文書Dを閲覧する。そして、「4章 結果レポート」内の「Test2」の項目に記述されている、「パフォーマンス」の値が「3,000msec」である事を見て、この数値が気に入らないとする。   Next, the evaluator B browses the document D on the browsing screen D1 using the document evaluation application program. And if you see that the value of “Performance” described in the “Test2” item in “Chapter 4 Result Report” is “3,000 msec”, do not like this number.

評価者Bは、この数値が気に入らないという評価をするために、閲覧画面D1上で、「3,000msec」の箇所を選択し、Dislikeボタン(図示せず)をクリックする。   The evaluator B selects “3,000 msec” on the browsing screen D1 and clicks a Dislike button (not shown) in order to evaluate that this numerical value is not appreciated.

評価者がLikeボタン(図示せず)またはDislikeボタンをクリックすると、文書評価用アプリケーションプログラムは、例えば、図6に示すように、XML(Extensible Markup Language)などの構造化言語フォーマットを用いてメタデータ17bを生成する。   When the evaluator clicks a Like button (not shown) or a Dislike button, the document evaluation application program uses, for example, a structured language format such as XML (Extensible Markup Language) as shown in FIG. 17b is generated.

この構造化言語フォーマットのメタデータ17bでは、評価者が選択した箇所が文字列(text)であることや、章番号、選択開始位置のXY座標、選択終了位置のXY座標、選択された文字列が記録される。なお、さらに、選択された文字列を含み、意味のあるまとまりである1文として、<sentence>タグに対して「パフォーマンス : 3,000msec」が記録されてもよい。   In the structured language format metadata 17b, the part selected by the evaluator is a character string (text), the chapter number, the XY coordinates of the selection start position, the XY coordinates of the selection end position, and the selected character string. Is recorded. Furthermore, “performance: 3,000 msec” may be recorded for the <sentence> tag as one sentence that includes the selected character string and is meaningful.

同様にして、評価者Cが文書Dの特定の箇所「MAXで8192KB」にLike属性を付与し、評価者Dが文書Dの特定の箇所(Test4のグラフ)にLike属性を付与する様子を図7に示す。   Similarly, the evaluator C assigns a Like attribute to a specific part “MAX of 8192 KB” of the document D, and the evaluator D assigns a Like attribute to a specific part of the document D (graph of Test 4). 7 shows.

また、評価者B、C、およびDによる評価結果として生成されるメタデータ17bの例をまとめて図8に示す。なお、図8の上段に示すLike属性の部分が、評価者DによるTest4のグラフの特定箇所に対するLike属性の付加を示すものであり、<type>タグに対してイメージデータであることを示す「image」が指定されている。   Further, FIG. 8 collectively shows examples of metadata 17b generated as an evaluation result by the evaluators B, C, and D. Note that the Like attribute portion shown in the upper part of FIG. 8 indicates addition of the Like attribute to a specific part of the Test4 graph by the evaluator D, and indicates that the image data corresponds to the <type> tag. "image" is specified.

以上、文書処理サーバー1または画像形成装置20において、登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を具体例で説明した。   As described above, the document processing server 1 or the image forming apparatus 20 has described the manner in which the evaluator adds the Like attribute or the Dislike attribute to a specific portion designated by the evaluator of the registered document.

[生成される要約の例]
次に、上述した第3の段階において、集められたメタデータに基づいて生成される要約の例を説明する。図9は、集められたメタデータに基づいて生成される要約の例を示す図である。
[Example of generated summary]
Next, an example of a summary generated based on the collected metadata in the third stage described above will be described. FIG. 9 is a diagram illustrating an example of a summary generated based on the collected metadata.

図9に示す要約D2は、上述した文書Dに対して評価者がLike属性またはDislike属性を付加して生成されたメタデータ17bに基づいて生成されたものである。   The summary D2 illustrated in FIG. 9 is generated based on the metadata 17b generated by the evaluator adding a Like attribute or a Dislike attribute to the document D described above.

文書Dには、Like属性が「MAXで8192KB」の箇所とTest4のグラフに付与され、Dislike属性が「3,000msec」の箇所に付与されている。   In the document D, the Like attribute is assigned to the location “MAX with 8192 KB” and the Test 4 graph, and the Dislike attribute is assigned to the location “3,000 msec”.

そのため、要約D2では、「Like」の項目に、「MAXで8192KB」を含んだ1文である「メモリー消費は、MAXで8192KB、MINで4096KB。」と、Test4のグラフの全体とが記述されている。また、「Dislike」の項目には、「3,000msec」を含んだ1文である「パフォーマンス : 3,000msec」が記述されている。   Therefore, in the summary D2, the item “Like” includes “Memory consumption is 8192KB for MAX, 4096KB for MIN”, which includes “MAX is 8192KB”, and the entire graph of Test4 is described. ing. In the item “Dislike”, “performance: 3,000 msec”, which is one sentence including “3,000 msec”, is described.

文書を要約する際には、評価者が選択した箇所だけではなく、選択した箇所を含む、まとまった意味のある単位(例えば1文や1段落)を抽出することにより、生成される要約を理解し易いものとすることが出来る。   When summarizing a document, understand the summary generated by extracting not only the part selected by the evaluator but also a group of meaningful units (for example, one sentence or one paragraph) including the selected part. It can be made easy to do.

なお、要約には、文書中のどの箇所にどれだけのLike属性およびDislike属性が付与されたかの内訳を記述してもよい。図10は、上述した要約D2にさらに属性付与の内訳を記載した要約D3の例を示す図である。   The summary may describe the breakdown of how many Like and Dislike attributes are assigned to which part of the document. FIG. 10 is a diagram illustrating an example of a summary D3 in which a breakdown of attribute assignment is further described in the above-described summary D2.

図10に示す内訳を見ると、第1章から第3章までの内容については、評価者によるLike属性またはDislike属性の付与は行われておらず、第4章では8個のLike属性および3個のDislike属性が付与されていることが分かる。また、第4章に付与された8個のLike属性のうち、4個が「MAXで8192KB」の箇所に付与されたものであり、残り4個がTest4のグラフに付与されたものであることが分かる。   Looking at the breakdown shown in FIG. 10, the contents of Chapters 1 to 3 are not given the Like attribute or the Dislike attribute by the evaluator. In Chapter 4, there are 8 Like attributes and 3 It can be seen that a number of Dislike attributes are assigned. Also, of the 8 Like attributes assigned to Chapter 4, 4 are assigned to the “MAX with 8192KB” location, and the remaining 4 are assigned to the Test4 graph. I understand.

以上、上述した第3の段階において、集められたメタデータに基づいて生成される要約の例を説明した。   In the above, the example of the summary produced | generated based on the collected metadata in the 3rd step mentioned above was demonstrated.

[要約への採用基準]
次に、文書中で、Like属性やDislike属性が付与された箇所のうち、どの箇所を要約に採用するかの基準について説明する。
[Criteria for inclusion in the summary]
Next, a description will be given of the criteria for selecting which part of the document is given the Like attribute and the Dislike attribute in the summary.

採用基準として、例えば、Like属性が特定数以上の評価者から付与されていることや、Dislike属性が特定数以上の評価者から付与されていることなどを定めることが出来る。   As the employment standard, for example, it can be determined that the Like attribute is given from a specific number or more of evaluators, and the Dislike attribute is given from a specific number or more of evaluators.

本発明では、評価者が高評価や低評価を与えて注目している箇所が、要約に採用すべき箇所であるという前提に立っている。そのため、Like属性およびDislike属性の付与数に基づいて、特定の箇所を要約に採用するか否かを判断している。   In the present invention, it is based on the premise that the part that the evaluator gives high evaluation or low evaluation and pays attention to is the part that should be adopted in the summary. Therefore, it is determined whether or not to adopt a specific part for the summary based on the number of granted Like attributes and Dislike attributes.

以上、文書中で、Like属性やDislike属性が付与された箇所のうち、どの箇所を要約に採用するかの基準について説明した。   As described above, the criteria for determining which part of the document is given the Like attribute and the Dislike attribute for the summary has been described.

[要約の作成開始基準]
次に、集められたメタデータに基づいて要約を作成するタイミングの基準について説明する。
[Summary creation start criteria]
Next, the criteria for creating a summary based on the collected metadata will be described.

要約を作成するタイミングとしては、例えば、ユーザーから明示的に特定の文書に対する要約を作成する指示があった場合や、1つの文書に対し特定数以上の評価者により評価が行われた場合、1箇所に対して付与されるLike属性またはDislike属性が基準値を超えた場合、予め定められた評価期間が満了した場合などが考えられる。   As a timing for creating a summary, for example, when a user explicitly instructs to create a summary for a specific document, or when evaluation is performed by a specific number or more of evaluators for one document, 1 The case where the Like attribute or Dislike attribute assigned to the location exceeds the reference value, the case where a predetermined evaluation period expires, or the like can be considered.

以上、集められたメタデータに基づいて要約を作成するタイミングの基準について説明した。   The criteria for creating a summary based on the collected metadata have been described above.

[処理の流れ]
次に、文書処理装置である文書処理サーバー1および画像形成装置20で行われる処理の流れについて説明する。図11から図16は、文書処理装置である文書処理サーバー1および画像形成装置20で行われる処理の流れについて説明するためのフローチャートおよびシーケンス図である。
[Process flow]
Next, the flow of processing performed by the document processing server 1 and the image forming apparatus 20 that are document processing apparatuses will be described. FIGS. 11 to 16 are a flowchart and a sequence diagram for explaining the flow of processing performed in the document processing server 1 and the image forming apparatus 20 as document processing apparatuses.

なお、以下の説明では、画像形成装置20を例に説明する。また、説明は、第1の段階から第3の段階までに分けて説明する。   In the following description, the image forming apparatus 20 will be described as an example. The description will be divided into a first stage to a third stage.

<第1の段階(文書の登録)>
最初に、評価する文書を画像形成装置20に登録する第1の段階の処理の流れについて説明する。図11は、評価する文書を画像形成装置20に登録する第1の段階の処理の流れについて説明するためのフローチャートである。
<First stage (document registration)>
First, the process flow of the first stage for registering the document to be evaluated in the image forming apparatus 20 will be described. FIG. 11 is a flowchart for explaining a flow of processing in a first stage in which a document to be evaluated is registered in the image forming apparatus 20.

まず、ユーザーが、評価のために登録する文書は紙に印刷したものであるか否かを判断する(ステップS1)。   First, it is determined whether or not the document to be registered for evaluation is printed on paper (step S1).

紙に印刷したものである場合(ステップS1のY)、ユーザーは操作部27を介して制御部21に指示を与え、原稿読取部22に紙媒体をスキャンさせる(ステップS2)。   If it is printed on paper (Y in step S1), the user gives an instruction to the control unit 21 via the operation unit 27, and causes the document reading unit 22 to scan a paper medium (step S2).

次に、制御部21は、OCR処理部21aにスキャンデータをOCR処理させる(ステップS3)。OCR処理後のデータは記憶部31に記憶される。   Next, the control unit 21 causes the OCR processing unit 21a to perform OCR processing on the scan data (step S3). The data after the OCR process is stored in the storage unit 31.

文書が紙媒体に印刷されたものでない場合(ステップS1のN)、またはOCR処理の終了後、文書を構成する文書データは、電子的な文字データやイメージデータにより構成され、そのまま記憶部31に記憶される(ステップS4)。   If the document is not printed on a paper medium (N in Step S1), or after the OCR process is completed, the document data constituting the document is composed of electronic character data and image data, and is stored in the storage unit 31 as it is. Stored (step S4).

<第2の段階(登録した文書の評価)>
次に、画像形成装置20に登録した文書を評価する第2の段階の処理の流れについて説明する。図12は、画像形成装置20に登録した文書を評価する第2の段階の処理の流れについて説明するためのフローチャートである。
<Second stage (evaluation of registered document)>
Next, the flow of the second stage process for evaluating a document registered in the image forming apparatus 20 will be described. FIG. 12 is a flowchart for explaining the flow of processing in the second stage for evaluating a document registered in the image forming apparatus 20.

まず、文書を評価する評価者が、画像形成装置20に指示を与え、評価する文書を選択する(ステップS10)。   First, an evaluator who evaluates a document gives an instruction to the image forming apparatus 20 and selects a document to be evaluated (step S10).

次に、画像形成装置20の制御部21が、表示部27aを介して、評価者に、選択された文書を提示する(ステップS11)。   Next, the control unit 21 of the image forming apparatus 20 presents the selected document to the evaluator via the display unit 27a (step S11).

次に、評価者が、高評価または低評価の属性を付与したい箇所を、提示された文書中で選択する(ステップS12)。   Next, the evaluator selects a location to which a high or low evaluation attribute is desired in the presented document (step S12).

次に、評価者が、前ステップで選択した箇所に対し、LikeボタンまたはDislikeボタンを押して評価の属性を付与する(ステップS13)。   Next, the evaluator pushes the Like button or the Dislike button to the part selected in the previous step to give an evaluation attribute (step S13).

次に、画像形成装置20の制御部21は、評価者により選択された箇所の位置情報を付与された評価の属性とをメタデータ31bとして、記憶部31に記憶させる(ステップS14)。   Next, the control unit 21 of the image forming apparatus 20 causes the storage unit 31 to store, as metadata 31b, the attribute of the evaluation given the position information of the location selected by the evaluator (step S14).

<第2の段階の具体例>
次に、2人の評価者(評価者Aおよび評価者B)が、画像形成装置20において文書を評価する処理の具体例を説明する。図13は、2人の評価者(評価者Aおよび評価者B)が、画像形成装置20において文書を評価する処理の具体例を説明するためのシーケンス図である。
<Specific example of the second stage>
Next, a specific example of processing in which two evaluators (evaluator A and evaluator B) evaluate a document in the image forming apparatus 20 will be described. FIG. 13 is a sequence diagram for explaining a specific example of processing in which two evaluators (evaluator A and evaluator B) evaluate a document in the image forming apparatus 20.

なお、図13に示す例では、評価者Aおよび評価者Bは、別のPC2から画像形成装置にアクセスしており、PC2上では、上述した文書評価用アプリケーションプログラムを使用して選択した文書の評価を行うものとする。   In the example illustrated in FIG. 13, the evaluator A and the evaluator B access the image forming apparatus from another PC 2, and on the PC 2, the document selected by using the above-described document evaluation application program. Assess.

まず、評価者Aが、文書IDを指定して、画像形成装置20のネットワークインターフェイス部29および制御部21を介して、記憶部31に記憶されている文書データ31aを取得する。   First, the evaluator A designates the document ID and acquires the document data 31 a stored in the storage unit 31 via the network interface unit 29 and the control unit 21 of the image forming apparatus 20.

具体的には、図13に示すように、まず、評価者Aが、評価者AのPC2を介して、文書IDを指定して文書取得要求をネットワークインターフェイス部29に送信する。次いで、ネットワークインターフェイス部29が文書IDを制御部21に送信する。制御部21は、文書IDを受信すると文書BOXサービスを起動し、記憶部31から文書IDに対応する文書データ31aを取得する。制御部21は、ネットワークインターフェイス部29を介して、取得した文書データ31aを評価者AのPC2に送信する。これにより、評価者Aは、文書データ31aを取得する。なお、文書BOXサービスは、記憶部31に記憶されている文書データ31aの入出力等の管理を行うために提供される。   Specifically, as illustrated in FIG. 13, first, the evaluator A transmits a document acquisition request to the network interface unit 29 by designating the document ID via the PC 2 of the evaluator A. Next, the network interface unit 29 transmits the document ID to the control unit 21. When receiving the document ID, the control unit 21 activates the document BOX service, and acquires the document data 31 a corresponding to the document ID from the storage unit 31. The control unit 21 transmits the acquired document data 31a to the PC 2 of the evaluator A via the network interface unit 29. Thereby, the evaluator A acquires the document data 31a. The document BOX service is provided to manage input / output of the document data 31a stored in the storage unit 31.

次に、評価者Bが、評価者Aにおける処理と同様にして文書データ31aを取得する。   Next, the evaluator B acquires the document data 31a in the same manner as the process performed by the evaluator A.

次に、評価者Aが、取得した文書データ31aについて、評価の属性を付与したい箇所を選択し、Likeボタンを押して評価の属性を付与すると、PC2において稼働する文書評価用アプリケーションプログラムがメタデータ31bを生成する。(メタデータ31bは、画像形成装置20上で生成されてもよいし、PC2上で生成されてもよい。)   Next, when the evaluator A selects a location to which an evaluation attribute is to be added from the acquired document data 31a and presses the Like button to give the evaluation attribute, the document evaluation application program running on the PC 2 is set to the metadata 31b. Is generated. (The metadata 31b may be generated on the image forming apparatus 20 or may be generated on the PC 2.)

次に、評価者Aが使用している文書評価用アプリケーションプログラムが、文書IDを指定して、生成されたメタデータ31bを画像形成装置20のネットワークインターフェイス部29および制御部21を介して、記憶部31に記憶させる。   Next, the document evaluation application program used by the evaluator A specifies the document ID and stores the generated metadata 31b via the network interface unit 29 and the control unit 21 of the image forming apparatus 20. Store in the unit 31.

具体的には、図13に示すように、まず、評価者AのPC2が文書IDとメタデータ31bをネットワークインターフェイス部29に送信する。次いで、ネットワークインターフェイス部29が文書IDとメタデータ31bを制御部21に送信する。制御部21は、文書IDとメタデータ31bを受信すると、文書BOXサービスを起動し、メタデータ31bを文書IDと関連付けて記憶部31に記憶させる。その後、制御部21は、ネットワークインターフェイス部29を介して、評価者Aの評価を登録したことを評価者AのPC2に通知する。   Specifically, as shown in FIG. 13, first, the PC 2 of the evaluator A transmits the document ID and metadata 31 b to the network interface unit 29. Next, the network interface unit 29 transmits the document ID and metadata 31 b to the control unit 21. When the control unit 21 receives the document ID and the metadata 31b, the control unit 21 activates the document BOX service and stores the metadata 31b in the storage unit 31 in association with the document ID. Thereafter, the control unit 21 notifies the evaluator A's PC 2 that the evaluation of the evaluator A has been registered via the network interface unit 29.

次に、評価者Bに関しても、Dislikeボタンを押す以外は評価者Aにおける処理と同様にして処理が行われる。   Next, the process for the evaluator B is performed in the same manner as the process for the evaluator A except that the Dislike button is pressed.

なお、メタデータ31bを画像形成装置20上で生成する場合は、PC2が文書IDとメタデータ31bの生成要求(付与された評価の属性と箇所の情報を含む。)をネットワークインターフェイス部29に送信し、ネットワークインターフェイス部29が文書IDとメタデータ31bの生成要求を制御部21に送信する。制御部21は、生成要求に応じて、メタデータ31bを生成する。   When the metadata 31 b is generated on the image forming apparatus 20, the PC 2 transmits a document ID and a request to generate the metadata 31 b (including the assigned evaluation attribute and location information) to the network interface unit 29. Then, the network interface unit 29 transmits a document ID and metadata 31b generation request to the control unit 21. The control unit 21 generates the metadata 31b in response to the generation request.

<第1の段階と第2の段階をまとめて行う具体例>
次に、第1の段階として文書を登録するユーザーが、第2の段階の評価者を兼ね、第1の段階と第2の段階をまとめて処理する具体例を説明する。図14は、第1の段階として文書を登録するユーザーが、第2の段階の評価者を兼ね、第1の段階と第2の段階をまとめて処理する具体例を説明するためのシーケンス図である。
<Specific example of performing the first stage and the second stage together>
Next, a specific example will be described in which a user who registers a document as the first stage also serves as an evaluator in the second stage and processes the first stage and the second stage together. FIG. 14 is a sequence diagram for explaining a specific example in which a user who registers a document as the first stage also serves as an evaluator in the second stage and processes the first stage and the second stage together. is there.

まず、ユーザーが操作部27を介して、制御部21に紙に印刷した文書の電子化を指示する。   First, the user instructs the control unit 21 to digitize a document printed on paper via the operation unit 27.

次に、制御部21が、原稿読取部22に指示を与え、文書のスキャンが行われる。   Next, the control unit 21 gives an instruction to the document reading unit 22 to scan the document.

次に、制御部21が、OCR処理部21aに指示を与え、スキャンしたイメージデータから文字データへの変換が行われ、文書データが生成される。   Next, the control unit 21 gives an instruction to the OCR processing unit 21a, converts the scanned image data into character data, and generates document data.

次に、制御部21が、プレビュー確認のために、生成した文書データを操作部27の表示部27aに表示する。   Next, the control unit 21 displays the generated document data on the display unit 27a of the operation unit 27 for preview confirmation.

次に、ユーザーが評価者として、評価の属性を付与したい箇所を選択し、選択した箇所に、高評価または低評価の属性を付与する。   Next, as the evaluator, the user selects a portion to which an evaluation attribute is to be assigned, and assigns a high evaluation or low evaluation attribute to the selected portion.

次に、制御部21が、ユーザーの選択した箇所の位置情報を評価の属性を含んだメタデータ31bを生成する。   Next, the control part 21 produces | generates the metadata 31b containing the attribute of evaluation of the positional information on the location which the user selected.

次に、ユーザーの指示に基づき、制御部21は、生成した文書データ31aおよびメタデータ31bを記憶部31に記憶させる。   Next, based on a user instruction, the control unit 21 stores the generated document data 31 a and metadata 31 b in the storage unit 31.

最後に、制御部21は、評価者Aの評価を登録したことを表示部27aに表示する。   Finally, the control unit 21 displays on the display unit 27a that the evaluation of the evaluator A has been registered.

<第3段階(文書の評価をメタデータとして活用)>
次に、収集された評価に関するメタデータに基づき、文書の要約を作成する第3の段階の処理の流れについて説明する。図15は、収集された評価に関するメタデータに基づき、文書の要約を作成する第3の段階の処理の流れについて説明するためのフローチャートである。
<Stage 3 (using document evaluation as metadata)>
Next, a description will be given of the flow of processing in the third stage for creating a document summary based on the collected metadata relating to evaluation. FIG. 15 is a flowchart for explaining the flow of processing in the third stage for creating a summary of a document based on the collected metadata relating to evaluation.

まず、制御部21が、要約を作成する文書に関し、メタデータ31bが付与された箇所の位置情報を検索し、検索結果に基づいて、メタデータ31bが付与されている箇所のうち1つを選択する(ステップS20)。   First, the control unit 21 searches the position information of the part to which the metadata 31b is attached with respect to the document for which the summary is created, and selects one of the parts to which the metadata 31b is attached based on the search result. (Step S20).

次に、制御部21は、選択した箇所に付与されている高評価の合計数または低評価の合計数が特定のしきい値を超えているか否かを判断する(ステップS21)。   Next, the control unit 21 determines whether or not the total number of high evaluations or total number of low evaluations assigned to the selected location exceeds a specific threshold (step S21).

選択した箇所に付与されている高評価の合計数または低評価の合計数が特定のしきい値を超えている場合(ステップS21のY)、選択された箇所を含む意味のある単位(ここでは1文)を要約に入れるために採用し抽出する(ステップS22)。   When the total number of high evaluations or total number of low evaluations given to the selected location exceeds a specific threshold (Y in Step S21), a meaningful unit including the selected location (here, 1 sentence) is adopted and extracted for inclusion in the summary (step S22).

次に、制御部21は、メタデータ31bの付与された箇所がまだあるか否かを判断する(ステップS23)。   Next, the control unit 21 determines whether there is still a part to which the metadata 31b is assigned (step S23).

メタデータ31bの付与された箇所がまだある場合(ステップS23のY)、制御部21は、メタデータ31bが付与された次の箇所を選択し(ステップS24)、ステップS21の処理に戻る。   If there is still a location to which the metadata 31b is assigned (Y in step S23), the control unit 21 selects the next location to which the metadata 31b is assigned (step S24), and returns to the process of step S21.

メタデータ31bの付与された箇所がもう無い場合(ステップS23のN)、制御部21は、抽出したデータをまとめて要約を作成する(ステップS25)。   When there is no more portion to which the metadata 31b is assigned (N in Step S23), the control unit 21 creates a summary by collecting the extracted data (Step S25).

<第3の段階の具体例>
次に、第3の段階において、ユーザーの指示により要約が印刷されて出力されるまでの具体例を説明する。図16は、第3の段階において、ユーザーの指示により要約が印刷されて出力されるまでの具体例を説明するためのシーケンス図である。
<Specific example of the third stage>
Next, a specific example until the summary is printed and output in accordance with a user instruction in the third stage will be described. FIG. 16 is a sequence diagram for explaining a specific example until a summary is printed and output in accordance with a user instruction in the third stage.

まず、ユーザーが、画像形成装置20の操作部27を介して、制御部21に、特定の文書の要約を印刷するよう、指示を出す。   First, the user instructs the control unit 21 to print a summary of a specific document via the operation unit 27 of the image forming apparatus 20.

次に、制御部21が、記憶部31から該当する文書の文書データ31aおよびメタデータ31bを取得する。   Next, the control unit 21 acquires the document data 31 a and metadata 31 b of the corresponding document from the storage unit 31.

次に、制御部21が、取得した文書データ31aおよびメタデータ31bを用いて、要約を作成する。   Next, the control unit 21 creates a summary using the acquired document data 31a and metadata 31b.

次に、制御部21が、画像形成部26に印刷指示を出し、要約が印刷され、出力される。   Next, the control unit 21 issues a print instruction to the image forming unit 26, and the summary is printed and output.

以上、文書処理装置である文書処理サーバー1および画像形成装置20で行われる処理の流れについて説明した。   The flow of processing performed by the document processing server 1 and the image forming apparatus 20 that are document processing apparatuses has been described above.

[補足事項]
その他、本発明は、上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
[Additional notes]
In addition, this invention is not limited only to the above-mentioned embodiment, Of course, various changes can be added within the range which does not deviate from the summary of this invention.

1 … 文書処理サーバー
2 … PC
3 … 画像形成装置
4 … ネットワーク
11 … CPU
12 … ROM
13 … RAM
14 … 操作入力部
15 … ネットワークインターフェイス部
16 … 表示部
17 … 記憶部
18 … バス
20 … 画像形成装置
21 … 制御部
22 … 原稿読取部
24 … 画像処理部
25 … 画像メモリー
26 … 画像形成部
27 … 操作部
27a… 表示部
28 … ファクシミリ通信部
29 … ネットワークインターフェイス部
31 … 記憶部
1 ... Document processing server 2 ... PC
3 ... Image forming apparatus 4 ... Network 11 ... CPU
12… ROM
13 ... RAM
DESCRIPTION OF SYMBOLS 14 ... Operation input part 15 ... Network interface part 16 ... Display part 17 ... Memory | storage part 18 ... Bus 20 ... Image forming apparatus 21 ... Control part 22 ... Document reading part 24 ... Image processing part 25 ... Image memory 26 ... Image forming part 27 Operation unit 27a Display unit 28 Facsimile communication unit 29 Network interface unit 31 Storage unit

Claims (7)

文字データおよびイメージデータのうち少なくとも一方を含む文書データが記憶された記憶部と、
前記記憶された前記文書データを出力する出力部と、
前記記憶された文書データを1人以上の評価者に評価させるために前記出力部に出力させる制御部と、
前記出力された文書を評価した前記1人以上の評価者により選択された1以上の評価箇所の前記文書データ内での位置情報と前記評価箇所ごとに付与された評価結果とを受け付ける入力部と
を備え、
前記制御部は更に、
前記入力部が受け付けた前記位置情報および前記評価結果を前記記憶部に記憶させ、
前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する
文書処理装置。
A storage unit storing document data including at least one of character data and image data;
An output unit for outputting the stored document data;
A control unit that causes the output unit to output the stored document data to allow one or more evaluators to evaluate the document data;
An input unit that receives position information in the document data of one or more evaluation points selected by the one or more evaluators who evaluated the output document and an evaluation result assigned to each evaluation point; With
The control unit further includes:
The position information received by the input unit and the evaluation result are stored in the storage unit,
A document processing apparatus that creates a summary by extracting the evaluation portion from the document data based on the stored position information.
請求項1に記載の文書処理装置であって、
前記制御部は、
前記位置情報に加え、前記評価結果に基づき、前記評価箇所を前記文書データから抽出して要約を作成する
文書処理装置。
The document processing apparatus according to claim 1,
The controller is
A document processing apparatus that extracts the evaluation portion from the document data and creates a summary based on the evaluation result in addition to the position information.
請求項2に記載の文書処理装置であって、
前記制御部は、
前記評価箇所のうち、前記付与された評価結果の数が特定のしきい値を超えた評価箇所を前記要約として抽出する
文書処理装置。
The document processing apparatus according to claim 2,
The controller is
A document processing apparatus that extracts, as the summary, an evaluation portion in which the number of the assigned evaluation results exceeds a specific threshold among the evaluation portions.
請求項3に記載の文書処理装置であって、
前記制御部は、
前記評価箇所を前記文書データから抽出するとき、前記評価箇所を含む文章全体を抽出する
文書処理装置。
The document processing apparatus according to claim 3,
The controller is
A document processing device that extracts an entire sentence including the evaluation portion when the evaluation portion is extracted from the document data.
請求項4に記載の文書処理装置であって、
前記制御部は、
前記評価結果として、前記入力部に、高評価および低評価のいずれか一方を受け付けさせる
文書処理装置。
The document processing apparatus according to claim 4,
The controller is
A document processing apparatus that causes the input unit to accept either high evaluation or low evaluation as the evaluation result.
請求項5に記載の文書処理装置であって、
前記制御部は、
前記作成する要約に、前記評価箇所ごとの、前記高評価および前記低評価の数を含める
文書処理装置。
The document processing apparatus according to claim 5,
The controller is
The document processing apparatus that includes the number of the high evaluation and the low evaluation for each evaluation portion in the summary to be created.
記憶部に記憶された、文字データおよびイメージデータのうち少なくとも一方を含む文書データを1人以上の評価者に評価させるために出力部に出力させ、
入力部に、前記出力された文書データを評価した前記1人以上の評価者により選択された評価箇所の前記文書データ内での位置情報と前記評価箇所に対して付与された評価結果とを受け付けさせ、
前記受け付けられた前記位置情報および前記評価結果を前記記憶部に記憶させ、
前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する
制御部としてコンピューターを機能させるための
文書処理プログラム。
Document data including at least one of character data and image data stored in the storage unit is output to the output unit in order to have one or more evaluators evaluate,
The input unit accepts position information in the document data of the evaluation part selected by the one or more evaluators who evaluated the output document data and the evaluation result given to the evaluation part. Let
Storing the received position information and the evaluation result in the storage unit;
A document processing program for causing a computer to function as a control unit that extracts the evaluation portion from the document data and creates a summary based on the stored position information.
JP2014130954A 2014-06-26 2014-06-26 Document processing apparatus and document processing program Expired - Fee Related JP6192603B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014130954A JP6192603B2 (en) 2014-06-26 2014-06-26 Document processing apparatus and document processing program
US14/751,155 US20150381849A1 (en) 2014-06-26 2015-06-26 Document Processing Device That Facilitates Evaluation of Document, Document Processing Method, and Recording Medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014130954A JP6192603B2 (en) 2014-06-26 2014-06-26 Document processing apparatus and document processing program

Publications (2)

Publication Number Publication Date
JP2016009417A true JP2016009417A (en) 2016-01-18
JP6192603B2 JP6192603B2 (en) 2017-09-06

Family

ID=55226911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014130954A Expired - Fee Related JP6192603B2 (en) 2014-06-26 2014-06-26 Document processing apparatus and document processing program

Country Status (1)

Country Link
JP (1) JP6192603B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0764979A (en) * 1993-08-31 1995-03-10 Hitachi Ltd Document information processor
JP2004199408A (en) * 2002-12-18 2004-07-15 Fuji Xerox Co Ltd Method for processing document, method for display processing of information, system for display processing of information, management server, client terminal, and program
JP2004348310A (en) * 2003-05-21 2004-12-09 Hitachi Ltd Review support apparatus, method, and program
JP2012137840A (en) * 2010-12-24 2012-07-19 Dainippon Printing Co Ltd Electronic book trial reading data creation device and creation method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0764979A (en) * 1993-08-31 1995-03-10 Hitachi Ltd Document information processor
JP2004199408A (en) * 2002-12-18 2004-07-15 Fuji Xerox Co Ltd Method for processing document, method for display processing of information, system for display processing of information, management server, client terminal, and program
JP2004348310A (en) * 2003-05-21 2004-12-09 Hitachi Ltd Review support apparatus, method, and program
JP2012137840A (en) * 2010-12-24 2012-07-19 Dainippon Printing Co Ltd Electronic book trial reading data creation device and creation method

Also Published As

Publication number Publication date
JP6192603B2 (en) 2017-09-06

Similar Documents

Publication Publication Date Title
US7715625B2 (en) Image processing device, image processing method, and storage medium storing program therefor
US10114940B2 (en) Information processing system, information processing apparatus, and information processing method
US8479095B2 (en) Workflow executing device, preview creating method
KR101814120B1 (en) Method and apparatus for inserting image to electrical document
JP2006120125A (en) Document image information management apparatus and document image information management program
US8385650B2 (en) Image processing apparatus, information processing apparatus, and information processing method
JP2019164571A (en) Information processing system, information processing device, and information processing method
US8150799B2 (en) Document management apparatus, document management method and computer readable storage medium
US20120050802A1 (en) Interaction system, image processing apparatus and interaction control method
JP4956319B2 (en) Image processing apparatus, control method thereof, program thereof, and storage medium
JP2007058622A (en) Document management device and document management method
US10817646B2 (en) Information processing system and control method therefor
JP2020024303A (en) Image processing apparatus and method for controlling the same, and program
JP2009075977A (en) Portable terminal browsing document distribution server, portable terminal, and portable terminal browsing document distribution system
JP6262708B2 (en) Document detection method for detecting original electronic files from hard copy and objectification with deep searchability
US20170154022A1 (en) Information processing apparatus, method for controlling the same, and storage medium
US9864750B2 (en) Objectification with deep searchability
US9798724B2 (en) Document discovery strategy to find original electronic file from hardcopy version
JP2010092383A (en) Electronic document file search device, electronic document file search method, and computer program
JP4747828B2 (en) History management device
JP6192603B2 (en) Document processing apparatus and document processing program
US20120144169A1 (en) Information processing apparatus, information processing method, and computer readable medium
US20120239662A1 (en) Document management apparatus and document management method
JP4903078B2 (en) Electronic device, Web page generation method, and Web page generation program
JP2007249700A (en) Document management device, document retrieval method, document retrieval program and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170808

R150 Certificate of patent or registration of utility model

Ref document number: 6192603

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees