JP2009070299A - Document processor, program, and document processing method - Google Patents

Document processor, program, and document processing method Download PDF

Info

Publication number
JP2009070299A
JP2009070299A JP2007240125A JP2007240125A JP2009070299A JP 2009070299 A JP2009070299 A JP 2009070299A JP 2007240125 A JP2007240125 A JP 2007240125A JP 2007240125 A JP2007240125 A JP 2007240125A JP 2009070299 A JP2009070299 A JP 2009070299A
Authority
JP
Japan
Prior art keywords
task
event information
document
existing
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007240125A
Other languages
Japanese (ja)
Inventor
Nahoko Sato
奈穂子 佐藤
Tetsuo Nagatsuka
哲郎 長束
Eiji Kenmochi
栄治 剣持
Masashi Nakaomi
政司 中臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007240125A priority Critical patent/JP2009070299A/en
Publication of JP2009070299A publication Critical patent/JP2009070299A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a document processor capable of contributing to the improvement of business efficiency by reducing labor of a user, and to provide a program, and a document processing method. <P>SOLUTION: An event information extracting part 12 extracts event information from an accessed electronic document, and a task predicting part 13 predicts existence of relation to an existing task. When relation to the existing task is judged, a task relating part 14 performs relating to the existing task, to update the registration document of the existing task. Consequently, it is predicted that the document is not related to any existing tasks. Even in this case, the new task is easily generated without allowing the user neither to read the content of the document nor to take time, labor and cost. Then the event information of the task is compensated, so that the document can be related to the new task. Thus, the labor of the user is further reduced compared with the conventional manner, and contribution to the improvement of business efficiency is attained. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、文書処理装置、プログラムおよび文書処理方法に関する。   The present invention relates to a document processing apparatus, a program, and a document processing method.

目的達成のための最小の仕事の単位であるタスクには、タスク名、期日、優先度などが付随することがある。また、タスク管理とは、タスクの期日や優先度、実施/未実施などを把握することである。タスク管理を行うことで、仕事量の把握や仕事効率の向上、仕事の優先度を確認することができる。また、タスク管理を行うことで、ミスを減らしリスク回避を行うことも可能である。例えば、特許文献1に開示されている情報管理システムにおいては、スケジュールや電子メール文書、報告書などの業務に関連する情報を、タスクで管理するようにしている。   A task, which is a minimum unit of work for achieving an objective, may be accompanied by a task name, due date, priority, and the like. Task management refers to grasping task due dates, priorities, execution / non-execution, and the like. By performing task management, it is possible to grasp the amount of work, improve work efficiency, and check work priorities. In addition, by managing tasks, it is possible to reduce mistakes and avoid risks. For example, in the information management system disclosed in Patent Document 1, information related to work such as a schedule, an electronic mail document, and a report is managed by a task.

ところで、従来においては、タスクの登録、タスクと各種文書の関連づけは、人手により行われていた。特許文献1の情報管理システムによれば、タスク登録、タスク選択をユーザに委ねている。より詳細には、上述したようにユーザが情報管理システムに文書を登録する際には、その文書がどのタスクに属するものか、新規なタスクなのかを、文書の内容によりユーザが判断しなければならない。このような問題は、文書の振り分けや関連付け、タスクの登録における文書やタスクの増加に伴い、手間と労力を要するようになっている。特に、文書作成者以外がこの作業をする場合は顕著である。   Conventionally, task registration and association between tasks and various documents have been performed manually. According to the information management system of Patent Document 1, task registration and task selection are left to the user. More specifically, as described above, when a user registers a document in the information management system, the user has to determine which task the document belongs to or a new task based on the content of the document. Don't be. Such a problem requires labor and labor as the number of documents and tasks increases in document sorting and association and task registration. This is particularly noticeable when someone other than the document creator performs this task.

そこで、特許文献2においては、対象文書が特定の1つまたは複数のカテゴリに属するかどうかを判断するための辞書を用いたルールベースの方法により、各種文書を自動でタスクに振り分ける技術が提案されている。より詳細には、特許文献2に開示されている技術によれば、タスクと文書の関係(ルール)を記述した辞書を用いている。例えば、特許文献2では、文書中の属性値エントリと対応する分類カテゴリ「仮説形成のための情報の収集・分類」「該情報の分析」「仮説の生成と検証」「該検証結果に基づく知識の共有」を記述した分類ルールを適用している。その他、キーワードを設定しておき、振り分け対象文書とのキーワードの一致度などを規則化した辞書を適用する方法もある。   Therefore, Patent Document 2 proposes a technique for automatically assigning various documents to tasks by a rule-based method using a dictionary for determining whether a target document belongs to one or more specific categories. ing. More specifically, according to the technique disclosed in Patent Document 2, a dictionary describing the relationship (rule) between tasks and documents is used. For example, in Patent Document 2, a classification category corresponding to an attribute value entry in a document “information collection / classification for hypothesis formation” “analysis of the information” “generation and verification of hypothesis” “knowledge based on the verification result” Classification rules describing "sharing of". In addition, there is a method of setting a keyword and applying a dictionary in which the degree of matching of the keyword with the distribution target document is made regular.

特開2006−099581号公報JP 2006-099581 A 特開2006−065508号公報JP 2006-066558 A

しかしながら、特許文献2に開示されている技術によれば、文書中の属性値やキーワードが辞書のエントリに無い場合には、分類対象外になってしまうという問題点がある。このように分類対象外になるような場合には、ユーザが判断しなければならならない。   However, according to the technique disclosed in Patent Document 2, there is a problem that if an attribute value or a keyword in a document is not included in a dictionary entry, the document is not classified. In such a case, it is necessary for the user to make a judgment when it is not classified.

本発明は、上記に鑑みてなされたものであって、ユーザの労力が軽減され、業務効率の向上に寄与することができる文書処理装置、プログラムおよび文書処理方法を提供することを目的とする。   The present invention has been made in view of the above, and an object of the present invention is to provide a document processing apparatus, a program, and a document processing method that can reduce the user's labor and contribute to the improvement of business efficiency.

上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、テキスト文書を処理する文書処理装置において、前記テキスト文書からイベントを表すイベント情報を抽出するイベント情報抽出手段と、既存のタスクのイベント情報を格納するタスク格納手段と、前記イベント情報抽出手段で抽出された前記イベント情報について、前記タスク格納手段に格納されている既存のタスクのイベント情報を用いて既存のタスクとの関連を予測するタスク予測手段と、前記タスク予測手段で既存のタスクと関連があると予測された前記イベント情報を有している前記テキスト文書を、該当する既存のタスクと関連付け、前記タスク格納手段に格納されているタスクを更新するタスク関連付け手段と、を備える。   In order to solve the above-described problem and achieve the object, the invention according to claim 1 is an event information extraction unit that extracts event information representing an event from the text document in a document processing apparatus that processes the text document; Task storage means for storing event information of an existing task, and for the event information extracted by the event information extraction means, an existing task is stored using the event information of the existing task stored in the task storage means. A task prediction unit that predicts the association of the text document and the text document having the event information predicted to be associated with the existing task by the task prediction unit, and the task storage Task association means for updating a task stored in the means.

また、請求項2にかかる発明は、請求項1記載の文書処理装置において、前記タスク予測手段で既存のタスクと関連がないと予測された場合、前記テキスト文書のイベント情報を用いて新規にタスクを生成するタスク生成手段と、前記タスク生成手段により新規に生成されたタスクを、前記テキスト文書のイベント情報と共に前記タスク格納手段に登録するタスク登録手段と、を備える。   According to a second aspect of the present invention, in the document processing device according to the first aspect, when it is predicted that the task prediction unit has no relation to an existing task, a new task is generated using event information of the text document. And a task registration unit for registering a task newly generated by the task generation unit in the task storage unit together with event information of the text document.

また、請求項3にかかる発明は、請求項2記載の文書処理装置において、前記タスク生成手段は、既存のタスクと関連がないと予測された前記イベント情報を有している前記テキスト文書から取得したイベント情報の語句を用いて新規タスク名および新規タスクのイベント情報を生成する。   According to a third aspect of the present invention, in the document processing apparatus according to the second aspect, the task generation means is acquired from the text document having the event information predicted to be unrelated to an existing task. The new task name and the event information of the new task are generated using the event information phrases.

また、請求項4にかかる発明は、請求項2記載の文書処理装置において、前記タスク登録手段は、前記タスク生成手段により新規に生成されたタスクに対して、新規登録フラグを立てる。   According to a fourth aspect of the present invention, in the document processing apparatus according to the second aspect, the task registration unit sets a new registration flag for a task newly generated by the task generation unit.

また、請求項5にかかる発明は、請求項1ないし4のいずれか一記載の文書処理装置において、前記イベント情報抽出手段は、前記テキスト文書を文法の観点から分解した構造の関係性を明示した統合構造を用いて前記イベント情報を抽出する。   The invention according to claim 5 is the document processing device according to any one of claims 1 to 4, wherein the event information extraction means clearly indicates the relationship of the structure obtained by decomposing the text document from the viewpoint of grammar. The event information is extracted using an integrated structure.

また、請求項6にかかる発明は、請求項5記載の文書処理装置において、前記イベント情報抽出手段は、機械可読なデータ形式であって、前記テキスト文書中の互いに関連しあう5W1Hおよび述語関連情報を、前記イベント情報として抽出する。   The invention according to claim 6 is the document processing apparatus according to claim 5, wherein the event information extraction unit has a machine-readable data format, and the 5W1H and the predicate related information that are related to each other in the text document. Are extracted as the event information.

また、請求項7にかかる発明は、請求項1ないし6のいずれか一記載の文書処理装置において、前記タスク予測手段は、前記テキスト文書のイベント情報について、前記タスク格納手段に格納されている既存のタスクのイベント情報を用いてタスクの適合性を判断するタスク適合性判断手段を備え、前記タスク予測手段は、前記タスク適合性判断手段による適合性判断に基づいて、既存のタスクとの関連を予測する。   According to a seventh aspect of the present invention, in the document processing apparatus according to any one of the first to sixth aspects, the task prediction means stores the event information of the text document in the existing task storage means. Task suitability judging means for judging suitability of the task using event information of the task, and the task predicting means is related to an existing task based on the suitability judgment by the task suitability judging means. Predict.

また、請求項8にかかる発明は、請求項1ないし7のいずれか一記載の文書処理装置において、電子化文書にアクセスする文書アクセス手段を備え、前記イベント情報抽出手段は、前記電子化文書中のテキスト文書を読み込む。   The invention according to claim 8 is the document processing apparatus according to any one of claims 1 to 7, further comprising document access means for accessing the digitized document, wherein the event information extraction means is included in the digitized document. Load text documents.

また、請求項9にかかる発明は、請求項1ないし7のいずれか一記載の文書処理装置において、画像読取手段を介して紙文書を読み取る読み取り走査手段と、前記読み取り走査手段で読み取った紙文書のイメージデータ中のテキスト文書を取得する文字認識手段と、を備え、前記イベント情報抽出手段は、前記イメージデータ中のテキスト文書を読み込む。   According to a ninth aspect of the present invention, there is provided the document processing apparatus according to any one of the first to seventh aspects, wherein the scanning document reading device reads the paper document via the image reading device, and the paper document read by the scanning scanning device. Character recognition means for acquiring a text document in the image data, and the event information extraction means reads the text document in the image data.

また、請求項10にかかる発明は、テキスト文書を処理する文書処理をコンピュータに実行させるプログラムであって、前記テキスト文書からイベントを表すイベント情報を抽出するイベント情報抽出機能と、既存のタスクのイベント情報を記憶部に格納するタスク格納機能と、前記イベント情報抽出機能で抽出された前記イベント情報について、前記タスク格納機能で前記記憶部に格納された既存のタスクのイベント情報を用いて既存のタスクとの関連を予測するタスク予測機能と、前記タスク予測機能で既存のタスクと関連があると予測された前記イベント情報を有している前記テキスト文書を、該当する既存のタスクと関連付け、前記タスク格納機能で前記記憶部に格納されたタスクを更新するタスク関連付け機能と、を前記コンピュータに実行させる。   The invention according to claim 10 is a program for causing a computer to execute document processing for processing a text document, and an event information extraction function for extracting event information representing an event from the text document, and an event of an existing task A task storage function for storing information in a storage unit, and an existing task using event information of an existing task stored in the storage unit by the task storage function for the event information extracted by the event information extraction function A task prediction function for predicting the association with the task, and the text document having the event information predicted to be associated with the existing task by the task prediction function is associated with the corresponding existing task, and the task A task association function for updating a task stored in the storage unit with a storage function; To be executed by the data.

また、請求項11にかかる発明は、請求項10記載のプログラムにおいて、前記タスク予測機能で既存のタスクと関連がないと予測された場合、前記テキスト文書のイベント情報を用いて新規にタスクを生成するタスク生成機能と、前記タスク生成機能により新規に生成されたタスクを、前記テキスト文書のイベント情報と共に前記記憶部に登録するタスク登録機能と、を前記コンピュータに実行させる。   Further, in the invention according to claim 11, in the program according to claim 10, when it is predicted that the task prediction function is not related to an existing task, a new task is generated using the event information of the text document And a task registration function for registering a task newly generated by the task generation function in the storage unit together with event information of the text document.

また、請求項12にかかる発明は、請求項11記載のプログラムにおいて、前記タスク生成機能は、既存のタスクと関連がないと予測された前記イベント情報を有している前記テキスト文書から取得したイベント情報の語句を用いて新規タスク名および新規タスクのイベント情報を生成する。   According to a twelfth aspect of the present invention, in the program according to the eleventh aspect, the task generation function is an event acquired from the text document having the event information predicted to be unrelated to an existing task. A new task name and event information of the new task are generated using the information phrase.

また、請求項13にかかる発明は、請求項11記載のプログラムにおいて、前記タスク登録機能は、前記タスク生成機能により新規に生成されたタスクに対して、新規登録フラグを立てる。   The invention according to claim 13 is the program according to claim 11, wherein the task registration function sets a new registration flag for a task newly generated by the task generation function.

また、請求項14にかかる発明は、請求項10ないし13のいずれか一記載のプログラムにおいて、前記イベント情報抽出機能は、前記テキスト文書を文法の観点から分解した構造の関係性を明示した統合構造を用いて前記イベント情報を抽出する。   Further, the invention according to claim 14 is the program according to any one of claims 10 to 13, wherein the event information extraction function is an integrated structure in which the relationship of the structure in which the text document is decomposed from the viewpoint of grammar is specified. The event information is extracted using.

また、請求項15にかかる発明は、請求項14記載のプログラムにおいて、前記イベント情報抽出機能は、機械可読なデータ形式であって、前記テキスト文書中の互いに関連しあう5W1Hおよび述語関連情報を、前記イベント情報として抽出する。   The invention according to claim 15 is the program according to claim 14, wherein the event information extraction function is a machine-readable data format, and the 5W1H and the predicate related information in the text document are related to each other. Extracted as the event information.

また、請求項16にかかる発明は、請求項10ないし15のいずれか一記載のプログラムにおいて、前記タスク予測機能は、前記テキスト文書のイベント情報について、前記記憶部に格納されている既存のタスクのイベント情報を用いてタスクの適合性を判断するタスク適合性判断機能を含み、前記タスク予測機能は、前記タスク適合性判断機能による適合性判断に基づいて、既存のタスクとの関連を予測する。   According to a sixteenth aspect of the present invention, in the program according to any one of the tenth to fifteenth aspects, the task prediction function is configured to store existing task information stored in the storage unit with respect to event information of the text document. It includes a task suitability determination function that determines task suitability using event information, and the task prediction function predicts an association with an existing task based on the suitability determination by the task suitability determination function.

また、請求項17にかかる発明は、請求項10ないし16のいずれか一記載のプログラムにおいて、電子化文書にアクセスする文書アクセス機能を前記コンピュータに更に実行させ、前記イベント情報抽出機能は、前記電子化文書中のテキスト文書を読み込む。   According to a seventeenth aspect of the present invention, in the program according to any one of the tenth to sixteenth aspects, the computer further executes a document access function for accessing the digitized document, and the event information extraction function includes the electronic information document. A text document in a document is read.

また、請求項18にかかる発明は、請求項10ないし16のいずれか一記載のプログラムにおいて、画像読取手段を介して紙文書を読み取る読み取り走査機能と、前記読み取り走査機能で読み取った紙文書のイメージデータ中のテキスト文書を取得する文字認識機能と、を前記コンピュータに更に実行させ、前記イベント情報抽出機能は、前記イメージデータ中のテキスト文書を読み込む。   According to an eighteenth aspect of the present invention, in the program according to any one of the tenth to sixteenth aspects, a read scanning function for reading a paper document via an image reading means, and an image of the paper document read by the read scanning function. A character recognition function for acquiring a text document in the data is further executed by the computer, and the event information extraction function reads the text document in the image data.

また、請求項19にかかる発明は、テキスト文書を処理する文書処理する文書処理装置における文書処理方法であって、前記テキスト文書からイベントを表すイベント情報を抽出するイベント情報抽出工程と、既存のタスクのイベント情報を記憶部に格納するタスク格納工程と、前記イベント情報抽出工程で抽出された前記イベント情報について、前記タスク格納工程で前記記憶部に格納された既存のタスクのイベント情報を用いて既存のタスクとの関連を予測するタスク予測工程と、前記タスク予測工程で既存のタスクと関連があると予測された前記イベント情報を有している前記テキスト文書を、該当する既存のタスクと関連付け、前記タスク格納工程で前記記憶部に格納されたタスクを更新するタスク関連付け工程と、を含む。   The invention according to claim 19 is a document processing method in a document processing apparatus for processing a text document, wherein an event information extraction step for extracting event information representing an event from the text document, and an existing task A task storage step for storing the event information in the storage unit, and the event information extracted in the event information extraction step, using the event information of the existing task stored in the storage unit in the task storage step A task prediction step for predicting the association with the task, and the text document having the event information predicted to be related to the existing task in the task prediction step, and the corresponding existing task, A task association step of updating the task stored in the storage unit in the task storage step.

本発明によれば、アクセスした電子化文書中からイベント情報を抽出し、既存のタスクとの関連の有無を予測し、既存のタスクと関連があると判断すると、既存のタスクと関連付け、既存タスクの登録文書の更新を行うことにより、文書がどの既存タスクとも関連しないと予測でき、その場合にもユーザが文書の中身を読むことなく、手間やコストをかけずに非常に容易に新規タスクを生成し、そのタスクのイベント情報を補完し、該文書を新規タスクに関連付けすることが可能になるため、ユーザの労力が従来より大幅に軽減され、業務効率の向上に寄与することができる、という効果を奏する。   According to the present invention, event information is extracted from the accessed electronic document, the presence / absence of association with an existing task is predicted, and when it is determined to be associated with an existing task, the existing task is associated with the existing task. By updating the registered document, it is possible to predict that the document is not related to any existing task, and even in this case, it is very easy to perform a new task without reading the contents of the document and without the effort and cost. It is possible to generate and supplement the event information of the task and associate the document with the new task, so that the user's labor is greatly reduced compared to the conventional, and it can contribute to the improvement of business efficiency. There is an effect.

以下に添付図面を参照して、この発明にかかる文書処理装置、プログラムおよび文書処理方法の最良な実施の形態を詳細に説明する。   Exemplary embodiments of a document processing apparatus, a program, and a document processing method according to the present invention will be explained below in detail with reference to the accompanying drawings.

[第1の実施の形態]
本発明の第1の実施の形態を図1ないし図10に基づいて説明する。本実施の形態は文書処理装置としてサーバコンピュータを適用した例である。
[First Embodiment]
A first embodiment of the present invention will be described with reference to FIGS. This embodiment is an example in which a server computer is applied as a document processing apparatus.

図1は、本発明の第1の実施の形態にかかる文書処理装置1のモジュール構成図である。文書処理装置1は、例えば、一般的なパーソナルコンピュータである。   FIG. 1 is a module configuration diagram of a document processing apparatus 1 according to the first embodiment of the present invention. The document processing apparatus 1 is, for example, a general personal computer.

図1に示すように、文書処理装置1は、情報処理を行うCPU(Central Processing Unit)101、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)102、各種データを書換え可能に記憶するRAM(Random Access Memory)103、各種データベースとして機能するとともに各種のプログラムを格納する記憶部であるHDD(Hard Disk Drive)104、記憶媒体110を用いて情報を保管したり外部に情報を配布したり外部から情報を入手するためのCD−ROMドライブ等の媒体駆動装置105、ネットワーク2を介してイントラネットやインターネットなどに接続されているサーバなどと通信により情報を伝達するための通信制御装置106、処理経過や結果等を操作者に表示するCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の表示部107、並びに操作者がCPU101に命令や情報等を入力するためのキーボードやマウス等の入力部108等から構成されており、これらの各部間で送受信されるデータをバスコントローラ109が調停して動作する。   As shown in FIG. 1, a document processing apparatus 1 includes a CPU (Central Processing Unit) 101 that performs information processing, a ROM (Read Only Memory) 102 that is a read-only memory storing a BIOS, and various data that can be rewritten. Random Access Memory (RAM) 103, HDD (Hard Disk Drive) 104, which functions as various databases and stores various programs, and stores information using a storage medium 110 or distributes information to the outside. A medium drive device 105 such as a CD-ROM drive for obtaining information from the outside, a communication control device 106 for transmitting information by communication with a server connected to an intranet or the Internet via the network 2, CRT (Cathode Ray Tube) or LCD (Liquid Crystal Disp) that displays processing progress and results to the operator lay) and the like, and an input unit 108 such as a keyboard and a mouse for an operator to input commands and information to the CPU 101. Data transmitted and received between these units is a bus controller. 109 operates in arbitration.

このような文書処理装置1では、ユーザが電源を投入するとCPU101がROM102内のローダーというプログラムを起動させ、HDD104よりOS(Operating System)というコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM103に読み込み、このOSを起動させる。このようなOSは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。OSのうち代表的なものとしては、Windows(登録商標)等が知られている。これらのOS上で走る動作プログラムをアプリケーションプログラムと呼んでいる。なお、アプリケーションプログラムは、所定のOS上で動作するものに限らず、後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。   In such a document processing apparatus 1, when the user turns on the power, the CPU 101 activates a program called a loader in the ROM 102, and loads a program for managing computer hardware and software called an OS (Operating System) from the HDD 104 into the RAM 103. This OS is started. Such an OS activates a program, reads information, and stores information in accordance with a user operation. As a representative OS, Windows (registered trademark) and the like are known. These operation programs running on the OS are called application programs. The application program is not limited to one that runs on a predetermined OS, and may be one that causes the OS to execute some of the various processes described below, or constitutes predetermined application software, an OS, or the like. It may be included as part of a group of program files.

ここで、文書処理装置1は、アプリケーションプログラムとして、文書処理プログラムをHDD104に記憶している。この意味で、HDD104は、文書処理プログラムを記憶する記憶媒体として機能する。   Here, the document processing apparatus 1 stores a document processing program in the HDD 104 as an application program. In this sense, the HDD 104 functions as a storage medium that stores the document processing program.

また、一般的には、文書処理装置1のHDD104にインストールされるアプリケーションプログラムは、CD−ROMやDVDなどの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク、半導体メモリ等の各種方式のメディア等の記憶媒体110に記録され、この記憶媒体110に記録された動作プログラムがHDD104にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体110も、アプリケーションプログラムを記憶する記憶媒体となり得る。さらには、アプリケーションプログラムは、例えば通信制御装置106を介して外部から取り込まれ、HDD104にインストールされても良い。   In general, application programs installed in the HDD 104 of the document processing apparatus 1 include various optical disks such as CD-ROM and DVD, various magnetic disks such as various magneto-optical disks and flexible disks, and various kinds of semiconductor memories. The operation program recorded on the storage medium 110 such as a system medium is recorded on the storage medium 110 and installed in the HDD 104. Therefore, the portable storage medium 110 such as an optical information recording medium such as a CD-ROM or a magnetic medium such as an FD can also be a storage medium for storing an application program. Furthermore, the application program may be imported from the outside via the communication control device 106 and installed in the HDD 104, for example.

文書処理装置1は、OS上で動作する文書処理プログラムが起動すると、この文書処理プログラムに従い、CPU101が各種の演算処理を実行して各部を集中的に制御する。文書処理装置1のCPU101が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。   In the document processing apparatus 1, when a document processing program operating on the OS is started, the CPU 101 executes various arithmetic processes according to the document processing program and centrally controls each unit. Of the various types of arithmetic processing executed by the CPU 101 of the document processing apparatus 1, characteristic processing of the present embodiment will be described below.

図2は、文書処理装置1の概略構成を示すブロック図である。図2に示すように、文書処理装置1は、文書処理プログラムに従うことにより、文書アクセス手段として機能する文書アクセス部11と、イベント情報抽出手段として機能するイベント情報抽出部12と、タスク予測手段として機能するタスク予測部13と、タスク関連付け手段として機能するタスク関連付け部14と、タスク生成手段として機能するタスク生成部15と、タスク登録手段として機能するタスク登録部16と、情報記憶部17と、を備える。   FIG. 2 is a block diagram illustrating a schematic configuration of the document processing apparatus 1. As shown in FIG. 2, the document processing apparatus 1 follows a document processing program, whereby a document access unit 11 that functions as a document access unit, an event information extraction unit 12 that functions as an event information extraction unit, and a task prediction unit. A task prediction unit 13 that functions, a task association unit 14 that functions as a task association unit, a task generation unit 15 that functions as a task generation unit, a task registration unit 16 that functions as a task registration unit, an information storage unit 17, Is provided.

また、文書処理装置1は、文書処理プログラムに従うことにより、記憶部であるHDD104に、電子化文書を格納する文書リスト21と、イベント情報を格納するイベントリスト22と、既存のタスクのイベント情報を格納するタスク格納手段として機能するタスクDB23と、を形成する。   Also, the document processing apparatus 1 follows the document processing program to store the document list 21 for storing the digitized document, the event list 22 for storing the event information, and the event information of the existing task in the HDD 104 that is the storage unit. And a task DB 23 functioning as a task storage means for storing.

次に、各部について説明する。   Next, each part will be described.

文書アクセス部11は、例えばインターネットやイントラネットを介し、メールサーバ3、文書サーバ4、掲示板サーバ5、スケジューラ6など、ネットワーク2を使ってアクセス可能な文書データベースを有するシステムに記憶されている電子化文書群にアクセスして、文書リストDB21に格納する。文書アクセス部11は、アクセスした電子化文書に対して、文書IDを振る。図3は、アクセスされた電子文書の一例である。   The document access unit 11 is an electronic document stored in a system having a document database that can be accessed using the network 2, such as a mail server 3, a document server 4, a bulletin board server 5, and a scheduler 6 via, for example, the Internet or an intranet. The group is accessed and stored in the document list DB 21. The document access unit 11 assigns a document ID to the accessed electronic document. FIG. 3 is an example of an accessed electronic document.

イベント情報抽出部12は、文書アクセス部11でアクセスした電子化文書を読み込み、電子化文書内で取得でき得るイベント情報を全て抽出して、イベントリスト22に格納する。   The event information extraction unit 12 reads the digitized document accessed by the document access unit 11, extracts all event information that can be acquired in the digitized document, and stores it in the event list 22.

ここで、電子化文書内からのイベント情報の抽出処理について図4のフローチャートを参照しつつ説明する。図4に示すように、イベント抽出処理は、文書アクセス部11でアクセスした電子化文書にテキストがある場合には(ステップS1のYes)、電子化文書中のテキストを読み込み(ステップS2)、テキストの統語構造を取得する(ステップS3)。統語構造とは、文の構造を文法の観点から分解し、その関係性を明示したものであり、統語構造取得には、既存の自然言語解析技術を用いる。図5は、図3の文書例のテキストからの統語構造抽出例である。図5に示すように、統語構造は、文を構成する文節表記と、文節の文法属性である文節品詞と、文節と文節の係り受け関係(係り先番号)とにより構成されている。なお、図5に示す構成の他に、文節を構成する単語情報や、係り受け関係名などの情報などがあっても良い。また、統語構造の表現方法についても、図5右部のような構造以外に、グラフ構造や木構造であっても良い。   Here, the event information extraction process from the digitized document will be described with reference to the flowchart of FIG. As shown in FIG. 4, in the event extraction process, when there is a text in the digitized document accessed by the document access unit 11 (Yes in step S1), the text in the digitized document is read (step S2). Is obtained (step S3). The syntactic structure is a structure in which the structure of a sentence is disassembled from the viewpoint of grammar and its relationship is clarified, and an existing natural language analysis technique is used to acquire the syntactic structure. FIG. 5 is an example of syntactic structure extraction from the text of the example document of FIG. As shown in FIG. 5, the syntactic structure is composed of a phrase notation that constitutes a sentence, a phrase part of speech that is a grammatical attribute of the phrase, and a dependency relation between the phrase and the phrase (relation destination number). In addition to the configuration shown in FIG. 5, there may be information such as word information constituting a clause, dependency relationship name, and the like. The syntactic structure expression method may be a graph structure or a tree structure in addition to the structure shown in the right part of FIG.

上述のようにして統語構造が得られたら、続くステップS4において、文の統語構造を用いてイベントを表すイベント情報を抽出する。イベント情報抽出においては、5W1H(When=いつ、Where=どこで、Who=誰が、What=何を、Why=なぜ、How=(どのくらい・どうやって))+述語の各要素から成るイベント情報を抽出する。本実施の形態においては、文法特性を利用した知識を記述した知識辞書を参照する。図6は、知識辞書の記載の一例を示す模式図である。知識辞書は、少なくとも、文の統語構造、対応する5W1Hの各イベント属性、また見出し語文節とその各イベント属性が記載された辞書である。なお、辞書の構成要素として、5W1Hの意味解釈に、更なる意味属性を付与しても良い。図6では「範囲基点」「範囲終点」など、When情報、Where情報に、詳細な意味属性を与えている。また、図6の記述方法以外に、文法情報を正規表現で表現した形式の記述でも良く、さらにシステム実装の場合は、これらの知識をプログラムコードの形式に書き下した規則を用いるのが適当である。イベント情報抽出部12は、まず、最初の文の統語構造の文末から述語文節を検索し、述語文節毎に述語文節と係り受け関係にある文節の要素がイベント情報たりえるかについて知識辞書を用いて判断し、イベント情報と判断されると、述語文節と該当文節にイベントIDを付加してイベントリストに文書ID、イベントIDと共にイベント属性とイベント要素を登録する。イベント情報抽出部12は、1文書内に別の述語文節があり、イベント要素がある場合には、イベント情報がなくなるまでイベント情報抽出を繰り返す。さらに、イベント情報抽出部12は、テキスト中の箇条書きの個所では、見出し語があれば、見出し語をイベント属性として利用し、その要素をイベント要素として抽出する。   When the syntactic structure is obtained as described above, event information representing an event is extracted using the syntactic structure of the sentence in the subsequent step S4. In the event information extraction, event information including each element of 5W1H (When = when, Where = where, Who = who, What = what, Why = why, How = (how and how)) + predicate is extracted. In this embodiment, a knowledge dictionary describing knowledge using grammatical characteristics is referred to. FIG. 6 is a schematic diagram illustrating an example of description in the knowledge dictionary. The knowledge dictionary is a dictionary in which at least a sentence syntactic structure, corresponding 5W1H event attributes, a headword phrase and each event attribute are described. Further, as a constituent element of the dictionary, a further semantic attribute may be added to the semantic interpretation of 5W1H. In FIG. 6, detailed semantic attributes are given to When information and Where information such as “range base point” and “range end point”. In addition to the description method shown in FIG. 6, the description may be in a form in which grammatical information is expressed in regular expressions. In the case of a system implementation, it is appropriate to use a rule in which such knowledge is written down in the form of a program code. . The event information extraction unit 12 first searches for a predicate clause from the end of the syntactic structure of the first sentence, and uses a knowledge dictionary to determine whether the elements of the clause having a dependency relationship with the predicate clause can be event information for each predicate clause. If event information is determined, an event ID is added to the predicate clause and the corresponding clause, and an event attribute and an event element are registered in the event list together with the document ID and event ID. If there is another predicate clause in one document and there is an event element, the event information extraction unit 12 repeats the event information extraction until there is no event information. Furthermore, if there is a headword at the itemized part in the text, the event information extraction unit 12 uses the headword as an event attribute and extracts the element as an event element.

イベント情報が抽出された場合には(ステップS5のYes)、イベントIDを付加して(ステップS6)、イベントリスト22にイベント情報、文書ID、イベントIDと共に登録する(ステップS7)。   When event information is extracted (Yes in step S5), an event ID is added (step S6), and the event information is registered in the event list 22 together with the event information, document ID, and event ID (step S7).

このようなステップS4〜S7の処理は、文書アクセス部11でアクセスした電子化文書内にイベント情報がなくなるまで(ステップS8のNo)、繰り返される。   Such processing in steps S4 to S7 is repeated until there is no event information in the digitized document accessed by the document access unit 11 (No in step S8).

なお、文書アクセス部11でアクセスした電子化文書からイベント情報が抽出されなかった場合には(ステップS5のNo)、表示部107にエラー表示を表示して(ステップS9)、処理を終了する。   If event information is not extracted from the digitized document accessed by the document access unit 11 (No in step S5), an error display is displayed on the display unit 107 (step S9), and the process ends.

図7は、図5のテキストの統語構造から図6の知識辞書を用いて抽出したイベント情報の例を示している。それぞれのイベント情報は、文書IDと、イベントIDと、When,Whoなどのイベント属性と、イベント要素である文節表記または文節表記列と、から成る。   FIG. 7 shows an example of event information extracted from the syntactic structure of the text of FIG. 5 using the knowledge dictionary of FIG. Each event information includes a document ID, an event ID, an event attribute such as When and Who, and a phrase notation or a phrase notation sequence that is an event element.

ここで、図7のイベント情報の抽出例について詳述する。まず、文書IDを検出し記憶する。次に、テキストのうち先頭であり隅付括弧で囲まれたテキスト部分を文書のタイプとして抽出し、記憶する。次に、右寄せであり文字の大きさが異なっている日付文節を文書発行日として解釈し、同じく右寄せであり文字の大きさが異なっていた組織/場所文節を発行元として解釈する。本実施の形態では、これらを記憶していないが、これらを予め記憶するようにしてもよい。   Here, an example of extracting event information in FIG. 7 will be described in detail. First, the document ID is detected and stored. Next, the text portion at the beginning of the text and enclosed in corner brackets is extracted as a document type and stored. Next, a date clause that is right-justified and has a different character size is interpreted as a document issuance date, and an organization / location clause that is also right-justified and has a different character size is interpreted as an issuer. In the present embodiment, these are not stored, but may be stored in advance.

次に、先頭文から順に述語文節を検索する。最初に述語「なりますので、」を見つけ、内容語を終止形「なる」に変換し、記憶する。この述語文節に係る文節を検索し、「事業所LANが」「不通に」を見つける。図6の知識辞書を参照し、「事業所LANが」は、内容語が名詞で、かつ、ガ格修飾文節であることから、What属性を持つ、「不通に」は、内容語が形容動詞で、かつ、ニ格修飾文節であることから、How属性を持つ、ということを判断し、これらをイベント情報としてイベントIDと共に記憶する。   Next, predicate clauses are searched in order from the first sentence. First, the predicate “I will become” is found, and the content word is converted into the final form “is” and stored. The clause related to the predicate clause is searched, and “establishment LAN is” and “disconnect” are found. Referring to the knowledge dictionary in FIG. 6, “established LAN” has a What attribute because the content word is a noun and is a case-qualified clause, and “disconnected” has the content word as an adjective verb In addition, since it is a dignity modification clause, it is determined that it has a How attribute, and these are stored as event information together with the event ID.

次の述語文節を検索し、「ご注意ください。」を見つけ、内容語を終止形「注意する」に変換し、記憶する。この述語文節に係る文節を検索し、「関係者は」を見つける。知識辞書を参照し、「関係者は」が、イベント属性を持たないと判断し、この文節関係はイベント情報ではないと判断する。   Search for the next predicate clause, find "Please note", convert the content word to the final form "Caution" and store it. The clause related to this predicate clause is searched, and “related party” is found. With reference to the knowledge dictionary, it is determined that “the person concerned” does not have an event attribute, and this phrase relation is not event information.

ところで、次文以降には述語がでてこないが、番号付き独立文節があるため、箇条書きが存在すると判断し、箇条書きの見出し語をイベント属性として利用する。   By the way, a predicate does not appear after the next sentence, but since there are numbered independent clauses, it is determined that a bullet is present, and the bulleted headword is used as an event attribute.

まず、「1.理由」が、図6の知識辞書の見出し語{理由}と一致するため、イベント属性Whyとして、後続の要素「電気設備法廷点検に伴なうネットワークの停止」をイベント要素として記憶する。次に「2.日時」が、見出し語{日付}と一致するため、イベント属性Whenとして、後続の要素「6月24日(土)」「8:00 〜 14:00」「(日本時間)」をイベント要素とする。実施例では、知識辞書を用いて、Whenの内訳属性をそれぞれwhen−date,when−time−range,when−otherなどと分け、要素を細分して記憶させているが、まとめてWhen情報として要素を「6月24日(土)8:00 〜 14:00(日本時間)」としても良い。次に「3.範囲」が、見出し語{時刻:範囲}、もしくは見出し語{場所:範囲}と一致し、後続の要素が場所を示す内容語を含むため、見出し語{場所:範囲}と特定し、イベント属性をWhere-rangeとして、後続の要素「横浜事業所全区間」をイベント要素とする。さらに、「4.問い合わせ先」が、見出し語{問い合わせ先}と一致するため、イベント属性Whomとして、後続の要素「XXシステムズ(株)」「Tel:045-111-2222」をイベント要素とする。実施例では、知識辞書を用いてWhomの内訳属性をそれぞれWhomとWhom−Telなどと分け、要素を分割して記憶させているが、まとめてWhom情報として要素を「XXシステムズ(株)Tel:045-111-2222」としても良い。   First, since “1. reason” matches the entry word {reason} in the knowledge dictionary in FIG. 6, the event element “Why” is set as the event element “whether the network is stopped due to the electrical equipment forensic inspection” as the event element. Remember. Next, since “2. Date and time” matches the headword {date}, the event element “When” has the following elements “Saturday, June 24” “8:00 to 14:00” “(Japan time) As an event element. In the embodiment, the breakdown attribute of When is divided into when-date, when-time-range, when-other, and the like by using a knowledge dictionary, and the elements are subdivided and stored. May be "Saturday, June 24, 8:00 to 14:00 (Japan time)". Next, since “3. Range” matches the headword {time: range} or the headword {location: range}, and the subsequent element includes a content word indicating the location, the headword {location: range} Specify the event attribute as “Where-range” and the subsequent element “all sections of the Yokohama office” as the event element. Furthermore, since “4. inquiry destination” matches the headword {inquiry destination}, the subsequent element “XX Systems Co., Ltd.” “Tel: 045-111-2222” is used as the event element as the event attribute Whom. . In the embodiment, the breakdown attribute of Whom is divided into Whom and Whom-Tel using the knowledge dictionary, and the elements are divided and stored. However, the elements are collectively referred to as “XX Systems, Inc. Tel: 045-111-2222 ".

この結果、図5の左側の統語構造例から、図7の右側のイベント情報例に示すようなイベントID001〜005のイベント属性付きのイベント情報が取得できる。図4の処理フローのうち、イベント情報抽出処理(ステップS4)から終了までが、この部分にあたる。   As a result, event information with event attributes of event IDs 001 to 005 as shown in the event information example on the right side of FIG. 7 can be acquired from the syntactic structure example on the left side of FIG. In the processing flow of FIG. 4, this part is from the event information extraction process (step S4) to the end.

タスク予測部13は、1文書からイベント情報が全て抽出できると、タスク予測を実施する。より詳細には、タスク予測部13は、タスク適合性判断手段として機能するタスク適合性判断部13aを有しており、対象となる電子化文書のイベント情報について、タスクDB23に格納されている既存のタスクのイベント情報を用いてタスクの適合性を判断し、対象となる電子化文書のタスクを予測し、後続処理を振り分ける。後続処理の振り分けは、適合するイベント要素があれば、イベント要素に対して適合情報を付与することにより行う。なお、表示部107にタスク予測結果を複数表示し、入力部108を介してユーザに所望のタスクを選択させるようにしても良い。   The task prediction unit 13 performs task prediction when all event information can be extracted from one document. More specifically, the task prediction unit 13 includes a task suitability determination unit 13a that functions as a task suitability determination unit, and the event information of the target electronic document is stored in the task DB 23. The suitability of the task is determined using the event information of the task, the task of the target digitized document is predicted, and the subsequent processing is distributed. If there is a matching event element, the subsequent process is distributed by assigning matching information to the event element. Note that a plurality of task prediction results may be displayed on the display unit 107, and the user may select a desired task via the input unit.

タスク関連付け部14は、タスク予測部13で既存のタスクと関連があると予測された電子化文書を、該当する既存のタスクと関連付け、情報記憶部17を介してタスクDB23に格納されているタスクを更新する。   The task association unit 14 associates the computerized document predicted to be related to the existing task by the task prediction unit 13 with the corresponding existing task, and stores the task stored in the task DB 23 via the information storage unit 17. Update.

タスク生成部15は、タスク予測部13で既存のタスクには関連がないと予測された電子化文書のために、電子化文書のイベント情報を用いて新規にタスクを生成する。   The task generation unit 15 generates a new task using the event information of the digitized document for the digitized document predicted to be unrelated to the existing task by the task prediction unit 13.

タスク登録部16は、タスク生成部15で新規に生成されたタスクを、イベント情報と共に登録し、情報記憶部17を介してタスクDB23に格納されているタスクを更新する。   The task registration unit 16 registers the task newly generated by the task generation unit 15 together with the event information, and updates the task stored in the task DB 23 via the information storage unit 17.

ここで、タスク予測、タスク関連付けおよびタスク新規登録処理の流れを図8のフローチャートを参照して説明する。図8に示すように、イベント情報抽出部12で抽出された新規のイベント情報の登録があると判断した場合には(ステップS11のYes)、イベント情報(文書ID、イベントID、イベント属性、イベント要素)を読み込み、バッファに記憶する(ステップS12)。次に、既存タスクの各タスクのイベント属性ごとのイベント要素との適合処理を実行し(ステップS13)、適合するイベント要素がある場合には(ステップS14のYes)、イベントリスト22のイベント要素に適合情報を付与しバッファに記憶する(ステップS15)。続いて、イベント要素間の適合要素数に応じてイベント情報適合性を判定する(ステップS16)。例えば、全てのイベント要素のうち、適合要素がどれだけあったかを数値化し、例えばTF−IDF指標を用いて評価判定する方法などがある。なお、適合するイベント要素がない場合には(ステップS14のNo)、そのままステップS16に進む。ステップS16の適合性判定で、既存タスクに関連があると判定された場合には(ステップS17のYes)、文書IDを対象となるタスクに追加する(ステップS18)。一方、ステップS16の適合性判定で既存タスクに関連がないと判定された場合には(ステップS17のNo)、新規のタスクを生成し(ステップS19)、新規のタスクの各イベント要素を該電子化文書のイベント要素で登録し、記憶する(ステップS20)。そして、上述のように新規タスク生成記憶、既存タスクへの文書ID追加が生じた場合には、タスクDB23のタスクを更新するとともに、タスクDB23のタスクに更新フラグを付与する(ステップS21)。このようにすることで、タスク出力の際に、ユーザに更新情報を知らせることができる。以上のようなステップS12〜S21の処理は、登録イベントがなくなるまで(ステップS22のNo)、繰り返される。   Here, the flow of task prediction, task association, and task new registration processing will be described with reference to the flowchart of FIG. As shown in FIG. 8, when it is determined that there is registration of new event information extracted by the event information extraction unit 12 (Yes in step S11), event information (document ID, event ID, event attribute, event Element) is read and stored in the buffer (step S12). Next, the matching process with the event element for each event attribute of each task of the existing task is executed (step S13), and if there is a matching event element (Yes in step S14), the event element of the event list 22 includes the matching event element. The matching information is given and stored in the buffer (step S15). Subsequently, event information compatibility is determined according to the number of matching elements between event elements (step S16). For example, there is a method of quantifying the number of matching elements among all event elements, and evaluating and judging using, for example, a TF-IDF index. If there is no matching event element (No in step S14), the process proceeds to step S16. If it is determined in the suitability determination in step S16 that the existing task is related (Yes in step S17), the document ID is added to the target task (step S18). On the other hand, when it is determined in the suitability determination in step S16 that the existing task is not related (No in step S17), a new task is generated (step S19), and each event element of the new task is assigned to the electronic element. Registered and stored in the event element of the document (step S20). Then, as described above, when a new task is generated and stored and a document ID is added to an existing task, the task in the task DB 23 is updated and an update flag is assigned to the task in the task DB 23 (step S21). By doing so, the update information can be notified to the user at the time of task output. The processes in steps S12 to S21 as described above are repeated until there are no registered events (No in step S22).

図9は、タスク関連付け処理の一例を示す模式図である。図9に示すタスクDB23内のタスクリストには、タスクIDが付された各タスクに関連づけられたイベント情報(文書ID、イベントID、イベント属性、イベント要素)が記憶されている。ここでは、図3に示した電子化文書(文書ID001)のイベント情報が新規にイベント登録された場合について詳述する。図3に示した電子化文書(文書ID001)のイベント情報が新規にイベント登録された場合には、各タスクのイベント属性ごとにそれぞれの要素と適合処理を実施する。図9に示すイベント情報は、図7に示したイベント情報とは異なり、詳細要素をまとめ、イベント要素がないWho属性にはイベント要素が無いことを表現している。   FIG. 9 is a schematic diagram illustrating an example of task association processing. The task list in the task DB 23 shown in FIG. 9 stores event information (document ID, event ID, event attribute, event element) associated with each task with a task ID. Here, a detailed description will be given of a case where event information of the electronic document (document ID 001) shown in FIG. 3 is newly registered. When the event information of the digitized document (document ID 001) shown in FIG. 3 is newly registered as an event, matching processing is performed with each element for each event attribute of each task. The event information shown in FIG. 9 is different from the event information shown in FIG. 7 in that detailed elements are grouped and the Who attribute having no event element expresses that there is no event element.

対象となる電子化文書のイベント情報と、タスクDB23のタスクリストに格納されている既存の各タスクのイベント情報との適合性の判断は以下の通りである。   The determination of the compatibility between the event information of the electronic document to be processed and the event information of each existing task stored in the task list of the task DB 23 is as follows.

具体的には、まず、タスクリストのタスクID001のイベント情報の、述語属性の要素と、新規イベント情報の述語属性の要素の適合を判定する。図9に示すように、タスクID001においては「なる」が一致するので、述語属性に適合情報を付与する。同様に、タスクID001のイベント情報の、What属性の要素と、新規イベント情報のWhat属性の要素の適合を判定する。「事業所LAN」が一致するのでWhat属性に適合情報を付与する。同様に、タスクID001のイベント情報の、Who属性の要素と、新規イベント情報のWho属性の要素の適合を判定する。イベント要素が無いことで一致するのでWho属性に適合情報を付与する。同様に、タスクID001のイベント情報の、How属性の要素と、新規イベント情報のHow属性の要素の適合を判定する。「不通」が一致するのでHow属性に適合情報を付与する。同様に、タスクID001のイベント情報の、Why属性の要素と、新規イベント情報のWhy属性の要素の適合を判定する。「電気設備法廷点検に伴なうネットワークの停止」が一致するのでWhy属性に適合情報を付与する。同様にタスクID001のイベント情報の、When属性の要素と、新規イベント情報のwhen属性の要素の適合を判定する。ここでは要素が一致しないので、適合しないと判断し、何も付与しない。また、続けてタスクID001のイベント情報の、Where属性の要素と、新規イベント情報のWhere属性の要素の適合を判定する。「横浜事業所全区間」が一致するのでWhere属性に適合情報を付与する。タスクID001のイベント情報はないので、新規イベント情報のWhom属性は、適合しないと判断し、何も付与しない。そして、新規イベント情報と、タスクID001のイベント情報の、属性毎の適合の度合いを判断し、新規イベント情報とタスクID001のイベント情報の適合の度合いが高いことから、この新規イベント情報をもつ文書ID001は、既存タスクID001に関連があると判断する。関連があると判断すると、タスク予測候補としてタスクID001の文書IDの項に、図3に示す電子化文書の文書ID001(図9中、網掛けで示す)を登録し、各イベント情報も、既存タスクID001に無く、新規イベント情報にあったwhen属性の要素「6月24日(土)」とWhom属性「××システムズ(株)、045−111−2222」情報(図9中、網掛けで示す)を加えて記憶し、タスクID001の情報を更新する。その際、更新フラグを付与しても良い。   Specifically, first, it is determined whether or not the predicate attribute element of the event information of the task ID 001 in the task list matches the predicate attribute element of the new event information. As shown in FIG. 9, since “is” matches in the task ID 001, the matching information is given to the predicate attribute. Similarly, it is determined whether the What attribute element of the task ID 001 event information matches the What attribute element of the new event information. Since the “office LAN” matches, the conformance information is added to the What attribute. Similarly, it is determined whether the Who attribute element of the event information of the task ID 001 matches the Who attribute element of the new event information. Since there is no event element, the matching information is given to the Who attribute. Similarly, it is determined whether the element of the event attribute of task ID 001 matches the element of the How attribute and the element of the How attribute of the new event information. Since “not connected” matches, the matching information is given to the How attribute. Similarly, it is determined whether the Why attribute element of the event information of the task ID 001 matches the Why attribute element of the new event information. Since “stop of network due to electrical equipment court inspection” coincides, conformity information is given to the Why attribute. Similarly, it is determined whether or not the attribute of the “When” attribute of the event information of the task ID 001 matches the element of the “when” attribute of new event information. Here, since the elements do not match, it is determined that they do not match and nothing is given. Further, it is determined whether the Where attribute element of the event information of the task ID 001 matches the Where attribute element of the new event information. Since “all sections of the Yokohama office” match, the conformance information is given to the Where attribute. Since there is no event information of the task ID 001, it is determined that the Whom attribute of the new event information does not match, and nothing is given. Then, the degree of matching between the new event information and the event information of the task ID 001 for each attribute is determined, and the degree of matching between the new event information and the event information of the task ID 001 is high. Therefore, the document ID 001 having the new event information Is determined to be related to the existing task ID 001. If it is determined that there is a relationship, the document ID 001 (indicated by shading in FIG. 9) of the digitized document shown in FIG. 3 is registered in the document ID section of the task ID 001 as a task prediction candidate, and each event information is also existing What attribute element “June 24 (Sat)” and Who attribute “XX Systems, Inc., 045-111-2222” information (not shown in FIG. 9) The information of the task ID 001 is updated. At that time, an update flag may be added.

次に、タスクリストのタスクID002のイベント情報の、述語属性の要素と、新規イベント情報の述語属性の要素の適合を判定する。図9に示すように、タスクID002においては要素が一致しないので、適合しないと判断し、何も付与しない。続けてタスクID002のイベント情報の、What属性の要素と、新規イベント情報のWhat属性の要素の適合を判定する。要素が一致しないので、適合しないと判断し、何も付与しない。同様にWho属性、when属性、Where属性、Why属性、How属性、Whom属性の要素の適合を判定する。どれも要素が一致しないので、この新規イベント情報をもつ文書ID001は、既存タスクID002には関連がないと判断する。   Next, it is determined whether the predicate attribute element of the event information of task ID 002 in the task list matches the predicate attribute element of the new event information. As shown in FIG. 9, since the elements do not match in the task ID 002, it is determined that they do not match and nothing is given. Subsequently, it is determined whether or not the What attribute element of the event information of the task ID 002 matches the What attribute element of the new event information. Since the elements do not match, it is determined that they do not match and nothing is given. Similarly, the matching of the elements of the Who attribute, the where attribute, the Where attribute, the Why attribute, the How attribute, and the Who attribute is determined. Since none of the elements match, it is determined that the document ID 001 having this new event information is not related to the existing task ID 002.

同様に、タスクリストのタスクID003のイベント情報の、述語属性の要素と、新規イベント情報の述語属性の要素の適合を判定する。図9に示すように、タスクID003においてはどれも要素が一致しないので、この新規イベント情報をもつ文書ID001は、既存タスクID003には関連がないと判断する。   Similarly, the predicate attribute element of the event information of task ID 003 in the task list is matched with the predicate attribute element of the new event information. As shown in FIG. 9, since no element matches in task ID 003, it is determined that document ID 001 having this new event information is not related to existing task ID 003.

このようにして、タスクリストにある全ての既存タスクに対し、この適合性判断をし、適合の度合いが高いタスクには関連があると判断し、タスク予測候補として該当タスクの文書IDの項に、図3の文書の文書ID001を登録し、必要情報を加えて記憶し、該当タスクの情報を更新する。   In this way, this suitability determination is performed on all existing tasks in the task list, and it is determined that there is a relationship with a task having a high degree of conformity. The document ID 001 of the document in FIG. 3 is registered, necessary information is added and stored, and the information of the corresponding task is updated.

新規登録文書全てに対し、既存タスクへのタスク予測及び関連付けが終了すると、表示部107で、新規登録文書ごとに、タスク予測結果を表示させ、ユーザが入力部108などでタスクを選択、決定させても良い。もちろん、予測結果を全て自動的にタスクに関連づけても良い。   When task prediction and association to existing tasks are completed for all newly registered documents, the task prediction result is displayed for each newly registered document on the display unit 107, and the user selects and determines a task using the input unit 108 or the like. May be. Of course, all the prediction results may be automatically associated with the task.

一方、図10はタスク新規登録処理の一例を示す模式図である。図10に示すタスクDB23内のタスクリストには、タスクIDが付された各タスクに関連づけられたイベント情報(文書ID、イベントID、イベント属性、イベント要素)が記憶されている。ここでは、新規の電子化文書(文書ID002)のイベント情報が新規にイベント登録された場合について詳述する。   On the other hand, FIG. 10 is a schematic diagram showing an example of a task new registration process. The task list in the task DB 23 shown in FIG. 10 stores event information (document ID, event ID, event attribute, event element) associated with each task with a task ID. Here, a case where event information of a new electronic document (document ID 002) is newly registered will be described in detail.

対象となる電子化文書のイベント情報と、タスクDB23のタスクリストに格納されている既存の各タスクのイベント情報との適合性の判断は以下の通りである。   Judgment of compatibility between the event information of the target electronic document and the event information of each existing task stored in the task list of the task DB 23 is as follows.

具体的には、まず、タスクリストのタスクID001のイベント情報の、述語属性の要素と、新規イベント情報の述語属性の要素の適合を判定する。図10に示すように、要素が一致しないので、適合しないと判断し、何も付与しない。次にWhat属性の要素と、新規イベント情報のWhat属性の要素の適合を判定する。要素が一致しないので、適合しないと判断し、何も付与しない。同様にWho属性、when属性、Where属性、Why属性、How属性、Whom属性の要素の適合を判定する。どれも要素が一致しないので、この新規イベント情報をもつ文書ID002は、既存タスクID002には関連がないと判断する。   Specifically, first, it is determined whether or not the predicate attribute element of the event information of the task ID 001 in the task list matches the predicate attribute element of the new event information. As shown in FIG. 10, since the elements do not match, it is determined that they do not match, and nothing is given. Next, it is determined whether the What attribute element matches the What attribute element of the new event information. Since the elements do not match, it is determined that they do not match and nothing is given. Similarly, the matching of the elements of the Who attribute, the where attribute, the Where attribute, the Why attribute, the How attribute, and the Who attribute is determined. Since none of the elements match, it is determined that the document ID 002 having this new event information is not related to the existing task ID 002.

次に、タスクリストのタスクID002のイベント情報の、述語属性の要素と、新規イベント情報の述語属性の要素の適合を判定する。要素が一致しないので、適合しないと判断し、何も付与しない。続けてタスクID002のイベント情報の、What属性の要素と、新規イベント情報のWhat属性の要素の適合を判定する。要素が一致しないので、適合しないと判断し、何も付与しない。同様にWho属性、when属性、Where属性、Why属性、How属性、Whom属性の要素の適合を判定する。どれも要素が一致しないので、この新規イベント情報をもつ文書ID002は、既存タスクID002には関連がないと判断する。同様に、既存タスクID003についても適合性判定をし、関連がないと判断する。   Next, it is determined whether the predicate attribute element of the event information of task ID 002 in the task list matches the predicate attribute element of the new event information. Since the elements do not match, it is determined that they do not match and nothing is given. Subsequently, it is determined whether or not the What attribute element of the event information of the task ID 002 matches the What attribute element of the new event information. Since the elements do not match, it is determined that they do not match and nothing is given. Similarly, the matching of the elements of the Who attribute, the where attribute, the Where attribute, the Why attribute, the How attribute, and the Who attribute is determined. Since none of the elements match, it is determined that the document ID 002 having this new event information is not related to the existing task ID 002. Similarly, the compatibility determination is performed for the existing task ID 003 and it is determined that there is no relation.

このようにタスクリストにある全ての既存タスクに対し、この適合性判断をし、どの既存タスクにも関連がないと予測した場合には、新規タスクを生成する。具体的には、例えば既存タスクと競合しないIDを用意し(図10においては、新規タスクID004)、タスクのイベント属性の要素に、新規イベント情報の要素をそのまま入れる。そして、その新規タスクに関連がある文書として新規タスクの文書IDの項に、この新規文書の文書ID002を登録し、タスクに記憶し、タスクを更新する。新規タスク生成がある場合は、新規登録フラグを立てておくことで、出力部は、タスクが更新された場合、新規登録情報をユーザに配信するよう設計することができる。   Thus, this suitability determination is performed for all existing tasks in the task list, and if it is predicted that there is no relation to any existing task, a new task is generated. Specifically, for example, an ID that does not conflict with an existing task is prepared (in FIG. 10, a new task ID 004), and the element of the new event information is entered as it is in the event attribute element of the task. Then, the document ID 002 of the new document is registered in the section of the document ID of the new task as a document related to the new task, stored in the task, and the task is updated. When there is a new task generation, by setting a new registration flag, the output unit can be designed to deliver new registration information to the user when the task is updated.

このように本実施の形態によれば、アクセスした電子化文書中からイベント情報を抽出し、既存のタスクとの関連の有無を予測し、既存のタスクと関連があると判断すると、既存のタスクと関連付け、既存タスクの登録文書の更新を行うことにより、文書がどの既存タスクとも関連しないと予測でき、その場合にもユーザが文書の中身を読むことなく、手間やコストをかけずに非常に容易に新規タスクを生成し、そのタスクのイベント情報を補完し、該文書を新規タスクに関連付けすることが可能になるため、ユーザの労力が従来より大幅に軽減され、業務効率の向上に寄与することができる。   As described above, according to the present embodiment, when event information is extracted from the accessed electronic document, the presence / absence of the association with the existing task is predicted, and the existing task is determined to be related. And update the registered document of the existing task, it can be predicted that the document is not related to any existing task, and even in this case, the user does not read the contents of the document, and without much effort and cost Since it is possible to easily generate a new task, complement the event information of the task, and associate the document with the new task, the user's labor is greatly reduced compared to the conventional one, which contributes to the improvement of business efficiency. be able to.

また、イベント情報が、文書中の互いに関連しあう5W1H+述語関連情報であり、機械可読なデータ形式をとることで、機械やアプリケーションを問わず、精度の高い適合性判断が可能となり、汎用性が高く性能の良い文書処理方法、文書処理装置が実現できる。   In addition, the event information is 5W1H + predicate-related information that is related to each other in the document. By taking a machine-readable data format, it is possible to determine the suitability with high accuracy regardless of the machine or application, and versatility. A high-performance document processing method and document processing apparatus can be realized.

さらに、文書から抽出したイベント情報とタスクのもつイベント情報とによりタスクの適合性を判断し、適合するタスクを予測するため、ユーザが手作業で実施する場合に比べ、客観的で精度の高い既存タスクへの関連づけが実現できる。   Furthermore, since the suitability of a task is judged based on the event information extracted from the document and the event information of the task, and the task to be predicted is predicted, the existing objective and high accuracy compared to the case where the user performs manually. Association with tasks can be realized.

また、新規タスクを生成する際に、新規タスクに必要な情報を、ユーザが入力する必要がなく、自動的に取得することができるため、ユーザの手間やコストを削減できる。   In addition, when a new task is generated, information necessary for the new task does not need to be input by the user and can be automatically acquired, so that the labor and cost of the user can be reduced.

[第2の実施の形態]
次に、本発明の第2の実施の形態を図11に基づいて説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described with reference to FIG. The same parts as those in the first embodiment described above are denoted by the same reference numerals, and description thereof is also omitted.

第1の実施の形態においては文書処理の対象が電子化文書である場合について説明したが、本実施の形態は、新規登録文書が紙文書である場合について説明するものである。本実施の形態は文書処理装置としてMFP(Multi Function Peripheral)を適用した例である。   In the first embodiment, the case where the document processing target is an electronic document has been described. However, in the present embodiment, the case where the newly registered document is a paper document will be described. The present embodiment is an example in which an MFP (Multi Function Peripheral) is applied as a document processing apparatus.

図11は、本発明の第2の実施の形態にかかる文書処理装置50の概略構成を示すブロック図である。図11に示すように、文書処理装置50は、紙文書を光学的に読み取る画像読取手段であるスキャナ60を備えている。また、図11に示すように、文書処理装置50は、文書処理プログラムに従うことにより、イベント情報抽出部12と、タスク予測部13と、タスク関連付け部14と、タスク生成部15と、タスク登録部16と、情報記憶部17と、読み取り走査手段として機能する読み取り走査部51と、文字認識手段として機能する文字認識部52と、を備える。   FIG. 11 is a block diagram showing a schematic configuration of a document processing apparatus 50 according to the second embodiment of the present invention. As shown in FIG. 11, the document processing apparatus 50 includes a scanner 60 that is an image reading unit that optically reads a paper document. Also, as shown in FIG. 11, the document processing device 50 follows the document processing program, so that the event information extraction unit 12, the task prediction unit 13, the task association unit 14, the task generation unit 15, and the task registration unit 16, an information storage unit 17, a reading scanning unit 51 that functions as a reading scanning unit, and a character recognition unit 52 that functions as a character recognition unit.

また、文書処理装置1は、文書処理プログラムに従うことにより、記憶部であるHDD104に、イメージ記憶部61と、テキスト列記憶部62と、イベント情報を格納するイベントリスト22と、タスクを格納するタスクDB23と、を形成する。   Further, the document processing apparatus 1 follows the document processing program to store an image storage unit 61, a text string storage unit 62, an event list 22 for storing event information, and a task for storing tasks in the HDD 104 serving as a storage unit. DB23 is formed.

次に、第1の実施の形態で説明した部分と異なる部分について説明する。   Next, a different part from the part demonstrated in 1st Embodiment is demonstrated.

読み取り走査部51は、スキャナ60を介して紙文書を読み取って、紙文書のイメージデータをイメージ記憶部61に格納する。読み取り走査部51は、読み取った紙文書のイメージデータに対して、文書IDを振る。   The reading scanning unit 51 reads a paper document via the scanner 60 and stores the image data of the paper document in the image storage unit 61. The reading scanning unit 51 assigns a document ID to the image data of the read paper document.

文字認識部52は、読み取り走査部51で読み取った紙文書のイメージデータに対してOCRなどを用いて紙文書のイメージデータ中のテキスト部分を取得して、テキスト列記憶部62に格納する。図12は、テキスト列記憶部62に格納されたテキストの一例である。ここでの処理は、図4に示したイベント抽出処理におけるステップS2に該当する。   The character recognition unit 52 acquires the text portion in the image data of the paper document by using the OCR or the like for the image data of the paper document read by the reading scanning unit 51 and stores it in the text string storage unit 62. FIG. 12 is an example of text stored in the text string storage unit 62. This process corresponds to step S2 in the event extraction process shown in FIG.

そして、イベント情報抽出部12は、テキスト列記憶部62に格納されたテキストを読み込み、テキスト内で取得でき得るイベント情報を全て抽出して、イベントリスト22に格納する。   Then, the event information extraction unit 12 reads the text stored in the text string storage unit 62, extracts all event information that can be acquired in the text, and stores it in the event list 22.

続く統語構造取得処理(図4に示したステップS3)以降の処理は、第1の実施の形態と同じであるため、説明を省略する。   The subsequent syntactic structure acquisition process (step S3 shown in FIG. 4) and subsequent processes are the same as those in the first embodiment, and thus the description thereof is omitted.

このように本実施の形態によれば、アクセスした紙文書中からイベント情報を抽出し、既存のタスクとの関連の有無を予測し、既存のタスクと関連があると判断すると、既存のタスクと関連付け、既存タスクの登録文書の更新を行うことにより、文書がどの既存タスクとも関連しないと予測でき、その場合にもユーザが文書の中身を読むことなく、手間やコストをかけずに非常に容易に新規タスクを生成し、そのタスクのイベント情報を補完し、該文書を新規タスクに関連付けすることが可能になるため、ユーザの労力が従来より大幅に軽減され、業務効率の向上に寄与することができる。   As described above, according to the present embodiment, when event information is extracted from an accessed paper document, the presence / absence of association with an existing task is predicted, and when it is determined that the association is associated with an existing task, By updating the registered document of the association and existing task, it can be predicted that the document is not related to any existing task, and even in that case, it is very easy without the user reading the contents of the document and without trouble and cost It is possible to generate a new task at the same time, complement the event information of the task, and associate the document with the new task. This greatly reduces the user's labor and contributes to the improvement of business efficiency. Can do.

本発明の第1の実施の形態にかかる文書処理装置のモジュール構成図である。It is a module block diagram of the document processing apparatus concerning the 1st Embodiment of this invention. 文書処理装置の概略構成を示すブロック図である。It is a block diagram which shows schematic structure of a document processing apparatus. 電子文書の一例を示す模式図である。It is a schematic diagram which shows an example of an electronic document. イベント情報の抽出処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the extraction process of event information. 図3の文書例のテキストからの統語構造抽出例を示す模式図である。It is a schematic diagram which shows the example of syntactic structure extraction from the text of the example document of FIG. 知識辞書の記載の一例を示す模式図である。It is a schematic diagram which shows an example of the description of a knowledge dictionary. イベント情報の抽出例を示す模式図である。It is a schematic diagram which shows the example of extraction of event information. タスク予測、タスク関連付けおよびタスク新規登録処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a task prediction, task correlation, and a task new registration process. タスク関連付け処理の一例を示す模式図である。It is a schematic diagram which shows an example of a task correlation process. タスク新規登録処理の一例を示す模式図である。It is a schematic diagram which shows an example of a task new registration process. 本発明の第2の実施の形態にかかる文書処理装置の概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the document processing apparatus concerning the 2nd Embodiment of this invention. テキストの一例を示す模式図である。It is a schematic diagram which shows an example of a text.

符号の説明Explanation of symbols

1 文書処理装置
11 文書アクセス手段
12 イベント情報抽出手段
13 タスク予測手段
13a タスク適合性判断手段
14 タスク関連付け手段
15 タスク生成手段
16 タスク登録手段
23 タスク格納手段
51 読み取り走査手段
52 文字認識手段
60 画像読取手段
104 記憶部
DESCRIPTION OF SYMBOLS 1 Document processing apparatus 11 Document access means 12 Event information extraction means 13 Task prediction means 13a Task suitability judgment means 14 Task association means 15 Task generation means 16 Task registration means 23 Task storage means 51 Reading scanning means 52 Character recognition means 60 Image reading Means 104 Storage Unit

Claims (19)

テキスト文書を処理する文書処理装置において、
前記テキスト文書からイベントを表すイベント情報を抽出するイベント情報抽出手段と、
既存のタスクのイベント情報を格納するタスク格納手段と、
前記イベント情報抽出手段で抽出された前記イベント情報について、前記タスク格納手段に格納されている既存のタスクのイベント情報を用いて既存のタスクとの関連を予測するタスク予測手段と、
前記タスク予測手段で既存のタスクと関連があると予測された前記イベント情報を有している前記テキスト文書を、該当する既存のタスクと関連付け、前記タスク格納手段に格納されているタスクを更新するタスク関連付け手段と、
を備えることを特徴とする文書処理装置。
In a document processing apparatus that processes a text document,
Event information extracting means for extracting event information representing an event from the text document;
Task storage means for storing event information of existing tasks;
For the event information extracted by the event information extraction unit, a task prediction unit that predicts an association with an existing task using event information of an existing task stored in the task storage unit;
Associating the text document having the event information predicted to be related to an existing task by the task prediction unit with the corresponding existing task, and updating the task stored in the task storage unit Task association means;
A document processing apparatus comprising:
前記タスク予測手段で既存のタスクと関連がないと予測された場合、前記テキスト文書のイベント情報を用いて新規にタスクを生成するタスク生成手段と、
前記タスク生成手段により新規に生成されたタスクを、前記テキスト文書のイベント情報と共に前記タスク格納手段に登録するタスク登録手段と、
を備えることを特徴とする請求項1記載の文書処理装置。
When it is predicted that the task prediction means is not related to an existing task, task generation means for newly generating a task using event information of the text document;
A task registration unit for registering a task newly generated by the task generation unit in the task storage unit together with event information of the text document;
The document processing apparatus according to claim 1, further comprising:
前記タスク生成手段は、既存のタスクと関連がないと予測された前記イベント情報を有している前記テキスト文書から取得したイベント情報の語句を用いて新規タスク名および新規タスクのイベント情報を生成する、
ことを特徴とする請求項2記載の文書処理装置。
The task generation unit generates a new task name and event information of a new task using a phrase of the event information acquired from the text document having the event information predicted to be unrelated to an existing task. ,
The document processing apparatus according to claim 2.
前記タスク登録手段は、前記タスク生成手段により新規に生成されたタスクに対して、新規登録フラグを立てる、
ことを特徴とする請求項2記載の文書処理装置。
The task registration unit sets a new registration flag for the task newly generated by the task generation unit.
The document processing apparatus according to claim 2.
前記イベント情報抽出手段は、前記テキスト文書を文法の観点から分解した構造の関係性を明示した統合構造を用いて前記イベント情報を抽出する、
ことを特徴とする請求項1ないし4のいずれか一記載の文書処理装置。
The event information extraction means extracts the event information using an integrated structure that clearly shows the relationship of the structure obtained by decomposing the text document from the viewpoint of grammar.
The document processing apparatus according to claim 1, wherein the document processing apparatus includes:
前記イベント情報抽出手段は、機械可読なデータ形式であって、前記テキスト文書中の互いに関連しあう5W1Hおよび述語関連情報を、前記イベント情報として抽出する、
ことを特徴とする請求項5記載の文書処理装置。
The event information extraction means is a machine-readable data format, and extracts 5W1H and predicate-related information that are related to each other in the text document as the event information.
The document processing apparatus according to claim 5.
前記タスク予測手段は、前記テキスト文書のイベント情報について、前記タスク格納手段に格納されている既存のタスクのイベント情報を用いてタスクの適合性を判断するタスク適合性判断手段を備え、
前記タスク予測手段は、前記タスク適合性判断手段による適合性判断に基づいて、既存のタスクとの関連を予測する、
ことを特徴とする請求項1ないし6のいずれか一記載の文書処理装置。
The task prediction means includes task suitability determination means for determining the suitability of a task using event information of an existing task stored in the task storage means for event information of the text document,
The task prediction means predicts an association with an existing task based on the suitability determination by the task suitability determination means;
The document processing apparatus according to any one of claims 1 to 6, wherein the document processing apparatus includes:
電子化文書にアクセスする文書アクセス手段を備え、
前記イベント情報抽出手段は、前記電子化文書中のテキスト文書を読み込む、
ことを特徴とする請求項1ないし7のいずれか一記載の文書処理装置。
A document access means for accessing a digitized document;
The event information extraction means reads a text document in the electronic document.
8. A document processing apparatus according to claim 1, wherein
画像読取手段を介して紙文書を読み取る読み取り走査手段と、
前記読み取り走査手段で読み取った紙文書のイメージデータ中のテキスト文書を取得する文字認識手段と、
を備え、
前記イベント情報抽出手段は、前記イメージデータ中のテキスト文書を読み込む、
ことを特徴とする請求項1ないし7のいずれか一記載の文書処理装置。
Reading scanning means for reading a paper document through the image reading means;
Character recognition means for obtaining a text document in image data of a paper document read by the reading scanning means;
With
The event information extraction means reads a text document in the image data.
8. A document processing apparatus according to claim 1, wherein
テキスト文書を処理する文書処理をコンピュータに実行させるプログラムであって、
前記テキスト文書からイベントを表すイベント情報を抽出するイベント情報抽出機能と、
既存のタスクのイベント情報を記憶部に格納するタスク格納機能と、
前記イベント情報抽出機能で抽出された前記イベント情報について、前記タスク格納機能で前記記憶部に格納された既存のタスクのイベント情報を用いて既存のタスクとの関連を予測するタスク予測機能と、
前記タスク予測機能で既存のタスクと関連があると予測された前記イベント情報を有している前記テキスト文書を、該当する既存のタスクと関連付け、前記タスク格納機能により前記記憶部に格納されたタスクを更新するタスク関連付け機能と、
を前記コンピュータに実行させることを特徴とするプログラム。
A program for causing a computer to execute document processing for processing a text document,
An event information extraction function for extracting event information representing an event from the text document;
A task storage function for storing event information of an existing task in a storage unit;
For the event information extracted by the event information extraction function, a task prediction function that predicts an association with an existing task using event information of an existing task stored in the storage unit by the task storage function;
The text document having the event information predicted to be related to an existing task by the task prediction function is associated with the corresponding existing task, and the task stored in the storage unit by the task storage function Task association function to update
That causes the computer to execute the program.
前記タスク予測機能で既存のタスクと関連がないと予測された場合、前記テキスト文書のイベント情報を用いて新規にタスクを生成するタスク生成機能と、
前記タスク生成機能により新規に生成されたタスクを、前記テキスト文書のイベント情報と共に前記記憶部に登録するタスク登録機能と、
を前記コンピュータに実行させることを特徴とする請求項10記載のプログラム。
When it is predicted that the task prediction function is not related to an existing task, a task generation function for newly generating a task using event information of the text document;
A task registration function for registering a task newly generated by the task generation function in the storage unit together with event information of the text document;
The program according to claim 10, wherein the computer is executed.
前記タスク生成機能は、既存のタスクと関連がないと予測された前記イベント情報を有している前記テキスト文書から取得したイベント情報の語句を用いて新規タスク名および新規タスクのイベント情報を生成する、
ことを特徴とする請求項11記載のプログラム。
The task generation function generates a new task name and event information of a new task by using a phrase of the event information acquired from the text document having the event information predicted not to be related to an existing task. ,
12. The program according to claim 11, wherein:
前記タスク登録機能は、前記タスク生成機能により新規に生成されたタスクに対して、新規登録フラグを立てる、
ことを特徴とする請求項11記載のプログラム。
The task registration function sets a new registration flag for a task newly generated by the task generation function.
12. The program according to claim 11, wherein:
前記イベント情報抽出機能は、前記テキスト文書を文法の観点から分解した構造の関係性を明示した統合構造を用いて前記イベント情報を抽出する、
ことを特徴とする請求項10ないし13のいずれか一記載のプログラム。
The event information extraction function extracts the event information using an integrated structure that clearly shows the relationship of the structure obtained by decomposing the text document from the viewpoint of grammar.
The program according to any one of claims 10 to 13, characterized in that:
前記イベント情報抽出機能は、機械可読なデータ形式であって、前記テキスト文書中の互いに関連しあう5W1Hおよび述語関連情報を、前記イベント情報として抽出する、
ことを特徴とする請求項14記載のプログラム。
The event information extraction function is a machine-readable data format, and extracts 5W1H and predicate-related information that are related to each other in the text document as the event information.
15. The program according to claim 14, wherein:
前記タスク予測機能は、前記テキスト文書のイベント情報について、前記記憶部に格納されている既存のタスクのイベント情報を用いてタスクの適合性を判断するタスク適合性判断機能を含み、
前記タスク予測機能は、前記タスク適合性判断機能による適合性判断に基づいて、既存のタスクとの関連を予測する、
ことを特徴とする請求項10ないし15のいずれか一記載のプログラム。
The task prediction function includes a task suitability determination function that determines task suitability using event information of an existing task stored in the storage unit for event information of the text document,
The task prediction function predicts an association with an existing task based on the suitability determination by the task suitability determination function.
The program according to any one of claims 10 to 15, characterized in that:
電子化文書にアクセスする文書アクセス機能を前記コンピュータに更に実行させ、
前記イベント情報抽出機能は、前記電子化文書中のテキスト文書を読み込む、
ことを特徴とする請求項10ないし16のいずれか一記載のプログラム。
Causing the computer to further execute a document access function for accessing the digitized document;
The event information extraction function reads a text document in the digitized document.
The program according to any one of claims 10 to 16, wherein:
画像読取手段を介して紙文書を読み取る読み取り走査機能と、
前記読み取り走査機能で読み取った紙文書のイメージデータ中のテキスト文書を取得する文字認識機能と、
を前記コンピュータに更に実行させ、
前記イベント情報抽出機能は、前記イメージデータ中のテキスト文書を読み込む、
ことを特徴とする請求項10ないし16のいずれか一記載のプログラム。
A reading scanning function for reading a paper document via an image reading means;
A character recognition function for obtaining a text document in image data of a paper document read by the reading scanning function;
Is further executed by the computer,
The event information extraction function reads a text document in the image data.
The program according to any one of claims 10 to 16, wherein:
テキスト文書を処理する文書処理する文書処理装置における文書処理方法であって、
前記テキスト文書からイベントを表すイベント情報を抽出するイベント情報抽出工程と、
既存のタスクのイベント情報を記憶部に格納するタスク格納工程と、
前記イベント情報抽出工程で抽出された前記イベント情報について、前記タスク格納工程で前記記憶部に格納された既存のタスクのイベント情報を用いて既存のタスクとの関連を予測するタスク予測工程と、
前記タスク予測工程で既存のタスクと関連があると予測された前記イベント情報を有している前記テキスト文書を、該当する既存のタスクと関連付け、前記タスク格納工程で前記記憶部に格納されたタスクを更新するタスク関連付け工程と、
を含むことを特徴とする文書処理方法。
A document processing method in a document processing apparatus for processing a text document,
An event information extraction step of extracting event information representing an event from the text document;
A task storage step of storing event information of an existing task in a storage unit;
For the event information extracted in the event information extraction step, a task prediction step of predicting an association with an existing task using event information of the existing task stored in the storage unit in the task storage step,
The text document having the event information predicted to be related to the existing task in the task prediction step is associated with the corresponding existing task, and the task stored in the storage unit in the task storage step Task association process to update
A document processing method comprising:
JP2007240125A 2007-09-14 2007-09-14 Document processor, program, and document processing method Pending JP2009070299A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007240125A JP2009070299A (en) 2007-09-14 2007-09-14 Document processor, program, and document processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007240125A JP2009070299A (en) 2007-09-14 2007-09-14 Document processor, program, and document processing method

Publications (1)

Publication Number Publication Date
JP2009070299A true JP2009070299A (en) 2009-04-02

Family

ID=40606451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007240125A Pending JP2009070299A (en) 2007-09-14 2007-09-14 Document processor, program, and document processing method

Country Status (1)

Country Link
JP (1) JP2009070299A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014061190A1 (en) * 2012-10-17 2014-04-24 日本電気株式会社 Event processing device, event processing method, and event processing program
JP2015212909A (en) * 2014-05-07 2015-11-26 富士ゼロックス株式会社 Information processor and information processing program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014061190A1 (en) * 2012-10-17 2014-04-24 日本電気株式会社 Event processing device, event processing method, and event processing program
JP2015212909A (en) * 2014-05-07 2015-11-26 富士ゼロックス株式会社 Information processor and information processing program

Similar Documents

Publication Publication Date Title
US10169337B2 (en) Converting data into natural language form
US8250455B2 (en) Assisting document creation
JP5106155B2 (en) Document processing apparatus, method and program
US10552467B2 (en) System and method for language sensitive contextual searching
US9639522B2 (en) Methods and apparatus related to determining edit rules for rewriting phrases
US20080189273A1 (en) System and method for utilizing advanced search and highlighting techniques for isolating subsets of relevant content data
US20100198802A1 (en) System and method for optimizing search objects submitted to a data resource
CN113544689A (en) Generating and providing additional content for a source view of a document
US20120179709A1 (en) Apparatus, method and program product for searching document
JP5266975B2 (en) Personal search system, information processing apparatus, personal search method, program, and recording medium
CN113362072B (en) Wind control data processing method and device, electronic equipment and storage medium
WO2014203573A1 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
Broughton A faceted classification as the basis of a faceted terminology: conversion of a classified structure to thesaurus format in the Bliss Bibliographic Classification
JP2006343925A (en) Related-word dictionary creating device, related-word dictionary creating method, and computer program
JP2021114234A (en) Information processor, information processing system, and information processing program
JP2009070299A (en) Document processor, program, and document processing method
JP2010108268A (en) Document processing apparatus
US20060136438A1 (en) Process server array for processing documents and document components and a method related thereto
JP2010003104A (en) Development support apparatus, method, and program
JP2010250389A (en) Information retrieval system, method and program, and index generation system, method, and program
JP2009104475A (en) Similar document retrieval device, and similar document retrieval method and program
JP7265199B2 (en) Support device, support method, program, and support system
WO2021049485A1 (en) Legal analyzer and legal analysis method
JP2020113048A (en) Information processing apparatus and program
JP2004206468A (en) Document management system and document management program