JP2009251870A - Document processing apparatus, program, and document processing method - Google Patents
Document processing apparatus, program, and document processing method Download PDFInfo
- Publication number
- JP2009251870A JP2009251870A JP2008098135A JP2008098135A JP2009251870A JP 2009251870 A JP2009251870 A JP 2009251870A JP 2008098135 A JP2008098135 A JP 2008098135A JP 2008098135 A JP2008098135 A JP 2008098135A JP 2009251870 A JP2009251870 A JP 2009251870A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- unit
- document
- input
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、文書処理装置、プログラム、および文書処理方法に関する。 The present invention relates to a document processing apparatus, a program, and a document processing method.
従来、ユーザは、PC(Personal Computer)や携帯電話などの情報処理装置において文書データを作成し、作成した文書データを情報処理装置に記憶させていた。ここで、文書データには、主題が異なる文書データや、主題が共通する文書データが含まれる。したがって、ユーザは、ある主題に関する新たな文書データを作成する際、当該主題に関する以前に作成した文書データの参照を所望する場合がある。 Conventionally, a user creates document data in an information processing apparatus such as a PC (Personal Computer) or a mobile phone, and stores the created document data in the information processing apparatus. Here, the document data includes document data having different themes and document data having a common theme. Therefore, when creating new document data related to a certain subject, the user may desire to refer to previously created document data related to the subject.
このような場合、ユーザは、例えば以下の方法により以前に作成した文書データを参照することができた。
(1)新たな文書データの作成ウィンドウと異なるウィンドウに以前に作成した文書データを表示する。
(2)以前に作成した文書データを、当該文書データに関して文章などを追加する「追加」や、受信した文書データに対する「返信」などの命令に対し、新たな文書データの前や後に自動挿入する。
In such a case, the user can refer to the document data created previously by, for example, the following method.
(1) Display previously created document data in a window different from the new document data creation window.
(2) Automatically inserts previously created document data before or after new document data in response to commands such as “add” to add text etc. to the document data and “reply” to received document data .
また、例えば特許文献1には、蓄積されている議事録から、ある項目に関係する議事内容を抽出して文書を生成する文書生成方法が記載されている。特許文献1には、かかる文書生成方法により、ユーザの意図に沿った体系的な閲覧を可能とする文書を生成できると記載されている。
Further, for example,
しかし、情報処理装置に記憶されている以前の文書データから従来の文書生成方法を利用して文書を生成しても、上記(1)または(2)に記載の方法を利用しなければ、以前に作成した文書データを新たな文書データの作成と同時にユーザが参照することはできなかった。 However, even if a document is generated from the previous document data stored in the information processing apparatus using the conventional document generation method, the method described in (1) or (2) above is not used. The user cannot refer to the document data created at the same time as the creation of new document data.
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、ユーザによる新たな文書データの作成時に、以前の文書データに関する情報をユーザに提示することが可能な、新規かつ改良された文書処理装置、プログラム、および文書処理方法を提供することにある。 Accordingly, the present invention has been made in view of the above problems, and an object of the present invention is to present information related to previous document data to the user when the user creates new document data. Another object of the present invention is to provide a new and improved document processing apparatus, program, and document processing method.
上記課題を解決するために、本発明のある観点によれば、1または2以上の文書データを記憶している文書記憶部と、新たな文書データに関する文字列が入力される入力部と、前記文書記憶部に記憶されている前記1または2以上の文書データのうちで、前記入力部に入力された文字列の少なくとも一部を含む文書データを検索する検索部と、前記検索部により検索された文書データの要約を作成する要約部と、前記新たな文書データの入力画面、および前記要約部により作成された要約を示す画面を含む表示画面を生成する表示画面生成部と、を備える文書処理装置が提供される。 In order to solve the above problem, according to an aspect of the present invention, a document storage unit storing one or more document data, an input unit for inputting a character string related to new document data, A search unit for searching for document data including at least a part of a character string input to the input unit among the one or more document data stored in the document storage unit, and the search unit Document processing comprising: a summarizing unit that creates a summary of the document data, and a display screen generating unit that generates a display screen including the new document data input screen and a screen showing the summary created by the summarizing unit An apparatus is provided.
かかる構成においては、新たな文書データに関する以前の文書データの要約を示す画面と新たな文書データの入力画面を含む表示画面が表示画面生成部により生成される。その結果、例えば、ユーザは上記表示画面を介し、以前の文書データを要約しつつ、以前の文書データの要約を活用して新たな文書データを作成することが可能となる。 In such a configuration, the display screen generation unit generates a display screen including a screen showing a summary of previous document data regarding the new document data and an input screen for new document data. As a result, for example, the user can create new document data using the summary of the previous document data while summarizing the previous document data via the display screen.
前記文書記憶部は、前記1または2以上の文書データの各々に、前記1または2以上の文書データの各々の作成日時を対応付けて記憶しており、前記要約部は、作成日時の新しい文書データに基づく要約量が、作成日時の古い文書データに基づく要約量より多くなるように前記要約を作成してもよい。ここで、作成日時が新しい文書データほど、これから作成される新たな文書データとの関連性が強いとも考えられる。したがって、要約における作成日時の新しい文書データに基づく要約量を、古い文書データより多くすることにより、新たな文書データの作成に重要と考えられる内容に重きをおくことができる。なお、要約量は、要約の分量を示している。 The document storage unit stores each of the one or more document data in association with the creation date of each of the one or more document data, and the summary unit stores the new document with the creation date and time. The summary may be created so that the summary amount based on the data is larger than the summary amount based on the document data with the old creation date and time. Here, it can be considered that document data with a new creation date / time has a stronger relationship with new document data to be created. Therefore, by making the summary amount based on the new document data of the creation date and time in the summary larger than that of the old document data, it is possible to place emphasis on the content that is considered to be important for creating new document data. The summary amount indicates the amount of summary.
前記検索部により検索された文書データのうちで、前記新しい文書データは前記古い文書データの次に作成されており、前記要約部は、前記新しい文書データに基づく要約量が、前記古い文書データに基づく要約量の2倍より多くなるように前記要約を作成してもよい。かかる構成においては、検索部により検索された文書データのうちで作成日時が最新である文書データの要約量を、要約に含まれる要約量の総数の半分以上確保することができる。 Among the document data searched by the search unit, the new document data is created next to the old document data, and the summarization unit has a summary amount based on the new document data in the old document data. The summary may be created to be greater than twice the summary amount based on it. In such a configuration, it is possible to secure more than half of the total amount of summaries included in the summaries of the document data with the latest creation date among the document data searched by the search unit.
前記要約部は、前記検索部により検索された文書データのうちで、作成日時が最も新しい文書データの最終段落を、前記作成日時が最も新しい文書データの他の段落より前記要約の作成の際に優先してもよい。ここで、文書データの最終段落は、当該文書データのまとめや総論など、当該文書データの内容を端的に示している場合がある。そこで、上記のように作成日時が最も新しい文書データの最終段落を優先することにより、ユーザによる新たな文書データの作成に対する要約の貢献度の向上を図ることができる。 The summarizing unit, when creating the summary from the other paragraphs of the document data with the latest creation date, the final paragraph of the document data with the newest creation date among the document data searched by the search unit You may give priority. Here, the last paragraph of the document data may simply indicate the contents of the document data, such as a summary or general description of the document data. Therefore, by giving priority to the last paragraph of the document data with the latest creation date and time as described above, the contribution of the summary to the creation of new document data by the user can be improved.
前記文書処理装置は、所定の文字パターンと検索パターンとを対応付けて記憶しているパターン記憶部と、前記入力部に入力された新たな文書データに関する文字列が前記パターン記憶部に記憶されている文字パターンに合致するか否かを検出するパターン検出部と、をさらに備えてもよい。さらに、前記新たな文書データに関する文字列に合致する文字パターンが前記パターン検出部により検出された場合、前記検索部は、前記文書記憶部に記憶されている前記1または2以上の文書データのうちで、前記文字パターンに対応付けられている検索パターンに合致する文書データを検索してもよい。かかる構成においては、パターン検出部および検索部が協働し、入力部に入力された新たな文書データに関する文字列に基づき、自動的に、かつ適切な文書データを検索することができる。 In the document processing apparatus, a pattern storage unit that stores a predetermined character pattern and a search pattern in association with each other, and a character string related to new document data input to the input unit is stored in the pattern storage unit. And a pattern detection unit for detecting whether or not the character pattern matches. Further, when a character pattern that matches a character string related to the new document data is detected by the pattern detection unit, the search unit includes the one or more document data stored in the document storage unit. Thus, document data matching the search pattern associated with the character pattern may be searched. In such a configuration, the pattern detection unit and the search unit cooperate to search automatically and appropriate document data based on a character string related to new document data input to the input unit.
このとき、前記検索部は、前記文書記憶部に記憶されている1または2以上の前記文書データのうち、前記文字パターンに対応付けられている前記検索パターンに合致する前記文書データのタイトルを有する前記文書データを検索してもよい。要約作成の対象となる文書データを検索する際に、文書データのタイトルのみから検索パターンに合致する文書データを検索することにより、文書データの検索処理を高速化することができる。 At this time, the search unit has a title of the document data that matches the search pattern associated with the character pattern among the one or more document data stored in the document storage unit. The document data may be searched. When searching for document data to be summarized, a document data search process can be speeded up by searching for document data that matches the search pattern only from the document data title.
また、上記課題を解決するために、本発明の別の観点によれば、1または2以上の文書データを記憶している文書記憶部、および新たな文書データに関する文字列が入力される入力部を備える文書処理装置に設けられるコンピュータを、前記文書記憶部に記憶されている前記1または2以上の文書データのうちで、前記入力部に入力された文字列の少なくとも一部を含む文書データを検索する検索部と、前記検索部により検索された文書データの要約を作成する要約部と、前記新たな文書データの入力画面、および前記要約部により作成された要約を示す画面を含む表示画面を生成する表示画面生成部と、として機能させるためのプログラムが提供される。 In order to solve the above problems, according to another aspect of the present invention, a document storage unit storing one or more document data, and an input unit for inputting a character string related to new document data A computer provided in a document processing apparatus comprising: document data including at least a part of a character string input to the input unit among the one or more document data stored in the document storage unit A display screen including a search unit for searching, a summary unit for creating a summary of document data searched by the search unit, an input screen for the new document data, and a screen showing a summary created by the summary unit A display screen generation unit to be generated and a program for functioning as a display screen generation unit are provided.
かかるプログラムは、例えばCPU、ROMまたはRAMなどを含むコンピュータのハードウェア資源に、上記のような検索部、要約部および表示画面生成部の機能を実行させることができる。すなわち、当該プログラムを用いるコンピュータを、上述の検索部、要約部および表示画面生成部として機能させることが可能である。 Such a program can cause the hardware resources of a computer including, for example, a CPU, a ROM, or a RAM to execute the functions of the search unit, the summary unit, and the display screen generation unit as described above. That is, it is possible to cause a computer using the program to function as the above-described search unit, summary unit, and display screen generation unit.
また、上記課題を解決するために、本発明の別の観点によれば、新たな文書データに関する文字列が入力される入力ステップと、1または2以上の文書データを記憶している記憶媒体から、前記入力部に入力された文字列の少なくとも一部を含む文書データを検索する検索ステップと、検索された文書データの要約を作成する作成ステップと、前記新たな文書データの入力画面、および前記作成ステップにおいて作成された要約を示す画面を含む表示画面を生成するステップと、を含む文書処理方法が提供される。 In order to solve the above problem, according to another aspect of the present invention, an input step for inputting a character string relating to new document data and a storage medium storing one or more document data are provided. A search step for searching for document data including at least a part of the character string input to the input unit, a creation step for creating a summary of the searched document data, an input screen for the new document data, and the Generating a display screen including a screen showing the summary created in the creating step.
また、上記課題を解決するために、本発明の別の観点によれば、1または2以上の文書データを記憶している文書記憶部と、新たな文書データに関する文字列が入力される入力部と、前記文書記憶部に記憶されている前記1または2以上の文書データのうちで、前記入力部に入力された文字列の少なくとも一部を含む文書データを検索する検索部と、前記検索部により検索された文書データの要約を作成する要約部と、前記要約部により作成された要約を、前記新たな文書データの入力画面を表示する表示装置へ出力する出力部と、を備える文書処理装置が提供される。 In order to solve the above problem, according to another aspect of the present invention, a document storage unit storing one or more document data and an input unit for inputting a character string related to new document data A search unit for searching for document data including at least a part of a character string input to the input unit among the one or more document data stored in the document storage unit, and the search unit A document processing apparatus comprising: a summarizing unit that creates a summary of document data retrieved by the step; and an output unit that outputs the summary created by the summarizing unit to a display device that displays an input screen for the new document data Is provided.
以上説明したように本発明にかかる文書処理装置、プログラム、および文書処理方法によれば、ユーザによる新たな文書データの作成時に、以前の文書データに関する情報をユーザに提示することができる。 As described above, according to the document processing apparatus, program, and document processing method of the present invention, information related to previous document data can be presented to the user when the user creates new document data.
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Exemplary embodiments of the present invention will be described below in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.
<文書処理装置の構成>
まず、図1〜図5を参照し、本実施形態にかかる文書処理装置1について説明する。
<Configuration of document processing apparatus>
First, the
図1は、本実施形態にかかる文書処理装置1の構成を示した機能ブロック図である。図1に示したように、文書処理装置1は、文書作成補助装置100および文書作成装置200を備える。さらに、文書作成補助装置100は、入出力部110と、パターン検出部120と、検索部130と、要約部140と、パターン記憶部150と、文書記憶部160と、を備える。また、文書作成装置200は、文書入力部210と、文書出力部220と、を備える。なお、図1においては文書作成補助装置100および文書作成装置200が分離構成される例を示しているが、文書作成補助装置100および文書作成装置200は一体構成されてもよい。
FIG. 1 is a functional block diagram showing the configuration of the
文書作成装置200は、ユーザが文書データを作成する際に利用する装置である。かかる文書作成装置200は、例えば、PC、家庭用映像処理装置(DVDレコーダ、ビデオデッキなど)、携帯電話、PHS(Personal Handyphone System)、携帯用音楽再生装置、携帯用映像処理装置、PDA(Personal Digital Assistants)、家庭用ゲーム機器、携帯用ゲーム機器、家電機器などの情報処理装置であってもよい。
The
文書入力部210は、ユーザにより文書データが入力され、ユーザにより入力された文書データを文書出力部220および文書作成補助装置100に出力する。当該文書入力部210は、例えば、タッチパネル、ボタン、スイッチ、レバー、ダイヤルや、リモートコントローラが発生する赤外線信号用の受光部などからなる操作手段を備えてもよい。文書作成装置200のユーザは、かかる文書入力部210を介して文書データの入力操作を行なうことができる。
The
文書出力部220は、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Display)装置などの表示部としての機能と、表示部に表示させる表示画面を生成する表示画面生成部としての機能を包含する。詳細については図4を参照して後述するが、本実施形態にかかる文書出力部220は、新たな文書データの作成画面と、以前に作成され、かつ、新たな文書データに関連する文書データの要約を示す画面を含む表示画面を生成し、表示することができる。
The
以上、文書作成装置200の構成について概略的に説明した。続いて、文書作成補助装置100の構成について説明する。
The configuration of the
文書作成補助装置100の入出力部110は、文書作成装置200とのインターフェースであって、各種データを入出力する入力部、および出力部としての機能を有する。各種データとしては、例えば、文書データ、文書データの要約、文書データのタイトルなどの任意のデータがあげられる。
The input /
パターン検出部120は、入出力部110から文書データのタイトルが入力され、パターン記憶部150に記憶されているパターンのうちで、入出力部110から入力されたタイトルに該当するパターンがあるか否かを検出する。ここで、図2を参照し、パターン記憶部150に記憶されているパターンリストについて具体的に説明する。
The
図2は、パターン記憶部150に記憶されているパターンリストの具体例を示した説明図である。図2に示したように、パターン記憶部150は、マッチパターン151と、検索パターン152の組を複数記憶している。
FIG. 2 is an explanatory diagram showing a specific example of the pattern list stored in the
例えば、「(.*)¥s*その¥d+」という正規表現で表されているマッチパターン151には、「$1%」という検索パターン152が対応付けてパターン記憶部150に記憶されている。ここで、マッチパターン151の「(.*)」という部分は任意の文字列を示し、「¥s*」という部分は0個以上のスペースを示し、「その」という部分は「その」という文字列を示し、「¥d+」という部分は1字以上の数字を示す。
For example, the
したがって、例えば、「看板製作 その2」という文字列のうち、「看板製作」は「(.*)」という部分に対応し、スペースは「¥s*」という部分に対応し、「その」という文字列は「その」という部分に対応し、「2」という数字は「¥d+」という部分に対応する。すなわち、「看板製作 その2」という文字列は、「(.*)¥s*その¥d+」というマッチパターン151に該当する。
Therefore, for example, in the character string “signboard production part 2”, “signboard production” corresponds to the part “(. *)”, The space corresponds to the part “¥ s *”, and “that”. The character string corresponds to the part “that”, and the number “2” corresponds to the part “¥ d +”. That is, the character string “signboard production 2” corresponds to the
また、「$1%」という検索パターン152の「$1」という部分は、マッチパターン151の「(.*)」という部分に対応する文字列を示し、「%」という部分は任意の文字列を示す。
The part “$ 1” of the
例えば、上述したように「(.*)¥s*その¥d+」というマッチパターン151に該当する「看板製作 その2」という文字列のうちで、「看板製作」という文字列が検索パターン152の「$1」という部分に対応する。したがって、「看板製作 その2」という文字列の検索パターンは、「看板製作%」となる。
For example, as described above, among the character strings “signboard production part 2” corresponding to the
同様に、図2においては、「第¥d+回¥s*(.*)」というマッチパターン151に「%$1」という検索パターン152が対応付けられ、「(.*)¥s*¥(¥d+¥)というマッチパターン151に「$1(%)」という検索パターン152が対応付けられ、「(.*)¥s*第¥d+話)というマッチパターン151に「$1%」という検索パターン152が対応付けられている例を示している。
Similarly, in FIG. 2, the
なお、このようなパターンリストを記憶しているパターン記憶部150は、EEPROM(Electrically Erasable Programmable Read−Only Memory)、EPROM(Erasable Programmable Read Only Memory)などの不揮発性メモリや、ハードディスクおよび円盤型磁性体ディスクなどの磁気ディスクや、CD−R(Compact Disc Recordable)/RW(ReWritable)、DVD−R(Digital Versatile Disc Recordable)/RW/+R/+RW/RAM(Ramdom Access Memory)およびBD(Blu−Ray Disc(登録商標))―R/BD−REなどの光ディスクや、MO(Magneto−Optical)ディスクなどの記憶媒体であってもよい。
Note that the
ここで図1を参照して文書作成補助装置100の構成の説明に戻ると、パターン検出部120は、入出力部110から入力されたタイトルに該当するマッチパターン151をパターン記憶部150から検索する。そして、パターン検出部120は、パターン記憶部150から検索したマッチパターン151に対応付けられている検索パターン152に所定の文字列を挿入して検索対象として追加する。
Returning to the description of the configuration of the document
例えば、入出力部110から「看板製作 その2」という文字列が入力された場合、パターン検出部120により、「看板製作 その2」という文字列に該当するパターンとして、「(.*)¥s*その¥d+」というマッチングパターン151が検索される。そして、パターン検出部120は、「(.*)¥s*その¥d+」というマッチングパターン151に対応付けられている「$1%」という検索パターン152に「看板製作」という文字列を挿入し、検索対象として追加する。
For example, when the character string “signboard production part 2” is input from the input /
検索部130は、パターン検出部120により特定された検索パターンに合致するタイトルを有する文書データを文書記憶部160から検索する。ここで、図3を参照し、文書記憶部160に記憶されている文書データについて具体的に説明する。
The
図3は、文書記憶部160に記憶されている文書データの具体例を示した説明図である。図3に示したように、文書記憶部160には、作成日時161と、タイトル162と、本文163の組が複数記憶されている。
FIG. 3 is an explanatory diagram showing a specific example of document data stored in the
例えば、図3には、タイトル162が「帰ってきた」である文書データの作成日時161が「09/01 09:00:00」であり、本文163が「帰京した。旅行記の続きは・・・」である例を示している。同様に、図3には、タイトル162が「東北旅行記(4)」である文書データ、「東北旅行記(3)」である文書データ、「看板製作 その1」である文書データ、および「看板製作 その2」である文書データが記録されている例を示している。
For example, in FIG. 3, the
なお、このような文書データを記憶している文書記憶部160は、パターン記憶部150と同様に、EEPROM、EPROMなどの不揮発性メモリや、ハードディスクおよび円盤型磁性体ディスクなどの磁気ディスクや、CD−R/RW、DVD−R/RW/+R/+RW/RAMおよびBD(Blu−Ray Disc(登録商標))―R/BD−REなどの光ディスクや、MOディスクなどの記憶媒体であってもよい。また、図1においてはパターン記憶部150および文書記憶部160が分離構成される例を示しているが、パターン記憶部150および文書記憶部160は一体構成されてもよい。また、文書記憶部160に記憶されている文書データは、文書作成装置200のユーザにより作成された文書データであっても、他のユーザにより作成された文書データであっても、文書作成装置200のユーザにより作成された文書データおよび他のユーザにより作成された文書データを含んでもよい。
Note that the
ここで図1を参照して文書作成補助装置100の構成の説明に戻ると、検索部130は、パターン検出部120により特定された検索パターンに合致するタイトル162を有する文書データを文書記憶部160から検索する。
Returning to the description of the configuration of the document
例えば、パターン検出部120により「看板製作%」という検索パターンが特定された場合、文書記憶部160に記憶されている文書データのうちで、タイトル162が「看板製作 その1」である文書データと、「看板製作 その2」である文書データが検索される。
For example, when the search pattern “signboard production%” is specified by the
要約部140は、検索部130により検索された文書データの要約を作成する。例えば、要約部140は、要約に含まれる各文書データの要約量が、各文書データの重要度の比になるように要約を作成する。要約量とは、要約の分量を示し、例えば文字数や行数などにより表される。例えば、要約の行数が10行と規定されており、1行に16文字が表示されるとする。このとき、検索部130により重要度の比が1:2である2つの文書データが検索された場合、要約部140は、一方の文書データからの行数が3.3行(10×1/3行)、他方の文書データからの行数が6.7行(10×2/3行)程度になるよう要約を作成する。
The
ここで、作成日時が新しい文書データほど、これから作成される新たな文書データとの関連性が強いとも考えられる。そこで、続きを作成するための要約を最適化するため、重要度は作成日時が新しい文書データほど高く設定されてもよい。例えば、検索部130により検索された文書データのうち、最も作成日時が古い文書データを1としたとき、古い方の文書データから数えた順番をNとすると、各文書データの重要度は2Nで表すようにしてもよい。例えば、要約に含める文書データが4つ存在する場合、作成日時の古い順番に、各文書データの要約は、それぞれ2/(21+22+23+24)、4/(21+22+23+24)、8/(21+22+23+24)、16/(21+22+23+24)程度だけ表示されることになる。
Here, it can be considered that document data with a new creation date / time has a stronger relationship with new document data to be created. Therefore, in order to optimize the summary for creating a continuation, the importance may be set higher for document data with a new creation date. For example, of the document data searched by the
したがって、かかる構成においては、検索部130により検索された文書データのうちで作成日時が最新である文書データの文字数を、要約に含まれる文字数の総数の半分以上確保することができる。その結果、ユーザが新たな文書データを作成する際の要約の貢献度を向上させることができる。なお、上記構成によれば、例えば図3に示した文書データ「看板製作 その1」が事後的に更新された場合、「看板製作 その2」の重要度は「看板製作 その1」より低くなる。これは、直近に作成した文書データの内容が、新たな文書データを作成する際の貢献度が非常に高いと考えることによる。
Therefore, in such a configuration, the number of characters of the document data with the latest creation date among the document data searched by the
また、要約部140は、各文書データの要約を作成日時の新しい順に作成し、各文書データの要約を結合させることにより全文書データの要約を作成する。各文書データの要約は、厳密には、上記の方法により各文書データに割当てられた文字数を下回る場合もあれば、上回る場合もある。その結果、作成された各要約の文字数の総和が規定量を超えるか、全ての文書データの要約の作成が終了したら、要約部140は文書データごとの要約を作成日時の古い順に結合させて全文書データの要約を作成する。なお、文書データごとの要約の作成方法については、図6を参照して後述する。
The summarizing
要約部140により作成された要約は、入出力部110を介し、文書作成装置200へ出力される。文書作成装置200の文書出力部220は、文書作成補助装置100から入力される要約に基づき、新たな文書データの作成画面、および要約を示す画面を含む表示画面を生成し、表示する。このようにして文書出力部220に表示される表示画面は、例えば図5A〜図5Cになり、各画面の詳細については後述する。
The summary created by the
以上、本実施形態にかかる文書作成補助装置100および文書作成装置200を含む文書処理装置1の構成について説明した。続いて、図4を参照し、本実施形態にかかる文書処理装置1において実行される文書処理方法について説明する。
The configuration of the
<文書処理方法>
図4は、本実施形態にかかる文書処理装置1において実行される文書処理方法の流れを示したフローチャートである。なお、図4においては、本実施形態の要点を明確にするため、入力の妥当性のチェック、サニタイジング(入力データから特定の文字列を抽出し、他の文字列に置き換える処理)、および表記のゆらぎ対策などの処理に関する記載は省略している。
<Document processing method>
FIG. 4 is a flowchart showing the flow of the document processing method executed in the
まず、図4に示したように、文書入力部210へユーザにより新たな文書データのタイトルが入力される(S100)。文書データのタイトル入力画面222は、例えば、図5Aに示すように、タイトル入力枠231、およびOKボタン232を含んで構成される。
First, as shown in FIG. 4, the user inputs a new document data title to the document input unit 210 (S100). The document data
タイトル入力画面222において、タイトル入力枠231に文字列が入力され、OKボタン232が選択されると、タイトル入力枠231に入力された文字列が文書作成補助装置100のパターン検出部120へ出力される。そして、後述する処理により、入力された文字列から検索パターンをパターン検出部120が特定し、特定された検索パターンに合致するタイトルを有する文書データを検索部130が文書記憶部150から検索し、検索部130により検索された文書データから要約部140が要約を作成する。
When a character string is input to the
例えば、ステップS100において、文書出力部220が図5Aに示したタイトル入力画面222を表示し、タイトル入力枠231にタイトルが入力される。ここでは、タイトル入力枠231に「看板製作 その3」が入力されたとする。
For example, in step S100, the
次いで、ステップS102〜S106では、パターン検出部120が、パターン記憶部150に記憶されているマッチパターン151を取り出し、各マッチパターン151と入力されたタイトルが合致するか否かを調べる。そして、パターン検出部120は、入力されたタイトルに合致するマッチパターン151に対応付けられている検索パターン152を記録する。例えば、「看板製作 その3」は図2に示した「(.*)¥s*その¥d+」というマッチパターン151に合致するため、「$1%」という検索パターン152に「看板製作」を当てはめた「看板製作%」が記録される。
Next, in steps S102 to S106, the
さらに、検索部130は、S102〜S106で記録された検索パターンの少なくとも1以上にタイトルが合致する文書データを文書記憶部160から検索する(S108)。例えば、「看板製作%」という検索パターンには、図3に示した「看板製作 その1」および「看板製作 その2」が合致する。なお、ステップS102〜S106において記録された検索パターンが無い場合には、合致する文書データが無いものとして扱われる。
Further, the
その後、検索部130により1以上の文書データが検索された場合(S110)、要約部140は、検索された文書データを作成日時の古い順にソートする(S112)。例えば、要約部140は、作成日時に基づいて「看板製作 その1」、「看板製作 その2」の順に検索部130により検索された文書データをソートする。
Thereafter, when one or more document data are retrieved by the retrieval unit 130 (S110), the
次いで、要約部140は、S112においてソートした文書データを自動要約する(S114)。自動翻訳の方法としては、例えば以下の方法を利用することができる。
Next, the summarizing
まず、要約部140は、ある文書データを構成する各文にスコアを算出する。例えば、事前に形態素ごとにスコアが付されており、要約部140は、各文の形態素解析を行い、各文を構成する形態素のスコアの総和を各文のスコアとして算出する。具体的には、「以上」や「まとめ」などの形態素のように、該形態素を含んでいる文が総括的な内容を示している可能性が高い場合には、該形態素に高いスコアが付されていてもよい。
First, the summarizing
そして、要約部140は、各文のスコアと、文書データの重要度を乗算し、乗算値の高い文を各文の要約として抽出してもよい。この場合、基本的には、乗算値は各文のスコアに比例するため、文書データの重要度を乗算する意義は無いようにも思われる。しかし、文書データの最終段落は、当該文書データのまとめや総論など、当該文書データの内容を端的に示している場合がある。そこで、作成日時が最も新しい文書データの最終段落の重要度のみを例えば「1」加算することにより、文書データの重要度を乗算する意義が生じる。
Then, the summarizing
例えば、検索部130により検索された文書データの数が2つであれば、作成日時が最も新しい文書データ中の最終段落の重要度と他の段落の重要度の比が4:5となり、最終段落の重要度が他の段落の1.25倍となる。一方、検索部130により検索された文書データの数が10であれば、作成日時が最も新しい文書データの最終段落の重要度と他の段落の重要度の比が1025:1024となり、最終段落の重要度が他の段落とほぼ同一になってしまう。しかし、長く続く文書であれば作成日時が最も新しい文書データの最終段落のみを強調しても必ずしも効を奏さず、より有効な要約作成に支障は無いと考えられる。
For example, if the number of document data searched by the
このように、各文書データの要約が作成されると、要約部140は、例えば各文書データの要約を結合して要約を作成する。以下、図6を用いて、要約の作成処理について説明する。なお、図6は、要約部140により要約が作成される流れを示した説明図である。図6においては、「看板製作 その1 サロン用看板を作ることにした。・・・」という文書データ163aと、「看板製作 その2 図案を板にどうやって転写するかで悩む。・・・」という文書データ163bとから要約165が作成される例を示している。
Thus, when the summary of each document data is created, the
文書データ163aは「300×600T9のメルク・・・購入した。・・・カットする。」という文章164aを含み、文書データ163bは「図案を板に転写する。・・・転写した。・・・なぞって完成」という文書164bを含む。要約部140は、例えば図6に示したように、文書データ「看板製作 その1」163aの抜粋部分として文章164aを抽出し、文書データ「看板製作 その2」163bの抜粋部分として文章164bを抽出し、文章164aおよび文章164bを結合させて要約165を作成することができる。
The
ここで、文書データ163aおよび164aから抜粋された文章163b、164bは、上述したように、要約部140によって、要約165に含まれる各文書データの文字数が、各文書データの重要度の比になるように作成される。また、要約部140は、文書データごとの要約を作成日時の古い順に結合させて全文書データの要約を作成する。
Here, in the
さらに、文書出力部220は、例えば図5Cに示したように要約部140により作成された要約を示す要約表示画面235を新たな文書データの入力画面233と併せて表示する(S116)。図5Cは、要約部140により要約が作成された場合に文書出力部220に表示される文書データの作成画面224の一例を示した説明図である。図5Cに示した文書データの作成画面224は、タイトル入力枠231と、本文入力画面233と、作成ボタン234に加え、要約表示画面235を含む。
Further, for example, as shown in FIG. 5C, the
ユーザは、新たな文書データの本文を入力する際、要約表示画面235を参照することにより、前回までの要約の内容を活用することができる。また、本実施形態にかかる要約表示画面235は、本文入力画面233および要約表示画面235を同一のウィンドウで表示することができるため、複数のウィンドウに各々表示する場合に比べてユーザの利便性が向上される。
The user can utilize the contents of the summary up to the previous time by referring to the
一方、検索部130により1以上の文書データが検索されなかった場合(S110)、要約部140は要約を作成することができない。したがって、文書出力部220は、例えば図5Bに示したように要約表示画面235を含まない文書データの作成画面224を表示する(S118)。
On the other hand, when one or more pieces of document data are not searched by the search unit 130 (S110), the
図5Bは、要約部140により要約が作成されなかった場合に文書出力部220に表示される文書データの作成画面224を示した説明図である。図5Bに示した文書データの作成画面224は、タイトル入力枠231と、本文入力画面233と、作成ボタン234を含む。本文入力画面233は、新たな文書データの本文が入力される入力画面として機能する。作成ボタン234が選択されると、タイトル入力枠231に入力されているタイトル、および本文入力画面233に入力されている本文が確定される。確定されたタイトルおよび本文は、確定日時と一致する作成日時と対応付けて、文書作成装置200が内蔵する記憶媒体、あるいは文書作成補助装置100の文書記憶部160に記録される。
FIG. 5B is an explanatory diagram showing a document
なお、ステップS118は、入力された文字列から検索パターンをパターン検出部120が特定できなかった場合にも行うようにしてもよい。
Note that step S118 may also be performed when the
以上、本実施形態にかかる画像処理方法について説明した。本実施形態によれば、新たな文書データに関する以前の文書データの要約を示す要約表示画面235と新たな文書データの入力画面233を含む文書データの作成画面224が文書出力部220により生成される。その結果、例えば、ユーザは上記文書データの作成画面224を介し、以前の文書データの要約を参照しつつ、以前の文書データの要約を活用して新たな文書データを作成することが可能となる。
The image processing method according to the present embodiment has been described above. According to the present embodiment, the
なお、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 In addition, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to the example which concerns. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.
例えば、本明細書の文書処理装置1の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、文書処理装置1の処理における各ステップは、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)を含んでもよい。
For example, each step in the processing of the
また、文書作成補助装置100および文書作成装置200に内蔵されるCPU、ROMおよびRAMなどのハードウェアを、上述した文書作成補助装置100および文書作成装置200の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。また、図1の機能ブロック図で示したそれぞれの機能ブロックをハードウェアで構成することで、一連の処理をハードウェアで実現することもできる。
Further, hardware such as CPU, ROM, and RAM incorporated in the document
1 文書処理装置
100 文書作成補助装置
110 入出力部
120 パターン検出部
130 検索部
140 要約部
150 パターン記憶部
160 文書記憶部
200 文書作成装置
210 文書入力部
220 文書出力部
DESCRIPTION OF
Claims (9)
新たな文書データに関する文字列が入力される入力部と;
前記文書記憶部に記憶されている1または2以上の前記文書データのうちで、前記入力部に入力された文字列の少なくとも一部を含む文書データを検索する検索部と;
前記検索部により検索された文書データの要約を作成する要約部と;
前記新たな文書データの入力画面、および前記要約部により作成された要約を示す画面を含む表示画面を生成する表示画面生成部と;
を備える、文書処理装置。 A document storage unit storing one or more document data;
An input unit for inputting a character string related to new document data;
A search unit for searching for document data including at least a part of a character string input to the input unit among the one or more document data stored in the document storage unit;
A summary unit for creating a summary of the document data retrieved by the retrieval unit;
A display screen generation unit for generating a display screen including the new document data input screen and a screen showing a summary created by the summary unit;
A document processing apparatus.
前記要約部は、作成日時の新しい前記文書データに基づく要約量が、作成日時の古い前記文書データに基づく要約量より多くなるように前記要約を作成する、請求項1に記載の文書処理装置。 The document storage unit stores the creation date and time of each of the one or more document data in association with each of the one or more document data,
The document processing apparatus according to claim 1, wherein the summary unit creates the summary so that a summary amount based on the document data with a new creation date and time is larger than a summary amount based on the document data with a new creation date and time.
前記要約部は、前記新しい文書データに基づく要約量が、前記古い文書データに基づく要約量の2倍より多くなるように前記要約を作成する、請求項2に記載の文書処理装置。 Of the document data searched by the search unit, the new document data is created next to the old document data,
The document processing apparatus according to claim 2, wherein the summary unit creates the summary such that a summary amount based on the new document data is greater than twice a summary amount based on the old document data.
所定の文字パターンと検索パターンとを対応付けて記憶しているパターン記憶部と;
前記入力部に入力された新たな前記文書データに関する文字列と、前記パターン記憶部に記憶されている前記文字パターンが合致するか否かを検出するパターン検出部と;
をさらに備え、
前記新たな文書データに関する文字列に合致する前記文字パターンが前記パターン検出部により検出された場合、前記検索部は、前記文書記憶部に記憶されている1または2以上の前記文書データのうち、前記文字パターンに対応付けられている前記検索パターンに合致する前記文書データを検索する、請求項1に記載の文書処理装置。 The document processing apparatus includes:
A pattern storage unit that stores predetermined character patterns and search patterns in association with each other;
A pattern detection unit for detecting whether or not the character string relating to the new document data input to the input unit matches the character pattern stored in the pattern storage unit;
Further comprising
When the character pattern that matches the character string related to the new document data is detected by the pattern detection unit, the search unit includes one or more of the document data stored in the document storage unit, The document processing apparatus according to claim 1, wherein the document data that matches the search pattern associated with the character pattern is searched.
前記文書記憶部に記憶されている1または2以上の前記文書データのうちで、前記入力部に入力された文字列の少なくとも一部を含む前記文書データを検索する検索部と;
前記検索部により検索された前記文書データの要約を作成する要約部と;
前記新たな文書データの入力画面、および前記要約部により作成された前記要約を示す画面を含む表示画面を生成する表示画面生成部と;
として機能させるための、プログラム。 A computer provided in a document processing apparatus including a document storage unit storing one or more document data and an input unit for inputting a character string related to new document data;
A search unit for searching for the document data including at least a part of the character string input to the input unit among the one or more document data stored in the document storage unit;
A summary unit that creates a summary of the document data retrieved by the retrieval unit;
A display screen generation unit that generates a display screen including the new document data input screen and a screen showing the summary created by the summary unit;
Program to function as
1または2以上の文書データを記憶している記憶媒体から、前記入力部に入力された文字列の少なくとも一部を含む文書データを検索する検索ステップと;
検索された前記文書データの要約を作成する作成ステップと;
前記新たな文書データの入力画面、および前記作成ステップにおいて作成された前記要約を示す画面を含む表示画面を生成するステップと;
を含む、文書処理方法。 An input step in which a character string relating to new document data is input;
A retrieval step of retrieving document data including at least a part of a character string input to the input unit from a storage medium storing one or more document data;
Creating a summary of the retrieved document data;
Generating a display screen including the new document data input screen and a screen showing the summary created in the creating step;
Document processing method.
新たな文書データに関する文字列が入力される入力部と;
前記文書記憶部に記憶されている1または2以上の前記文書データのうち、前記入力部に入力された文字列の少なくとも一部を含む前記文書データを検索する検索部と;
前記検索部により検索された前記文書データの要約を作成する要約部と;
前記要約部により作成された前記要約を、前記新たな文書データの入力画面を表示する表示装置へ出力する出力部と;
を備える、文書処理装置。
A document storage unit storing one or more document data;
An input unit for inputting a character string related to new document data;
A search unit for searching for the document data including at least a part of a character string input to the input unit among the one or more document data stored in the document storage unit;
A summary unit that creates a summary of the document data retrieved by the retrieval unit;
An output unit that outputs the summary created by the summary unit to a display device that displays an input screen for the new document data;
A document processing apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008098135A JP2009251870A (en) | 2008-04-04 | 2008-04-04 | Document processing apparatus, program, and document processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008098135A JP2009251870A (en) | 2008-04-04 | 2008-04-04 | Document processing apparatus, program, and document processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009251870A true JP2009251870A (en) | 2009-10-29 |
Family
ID=41312531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008098135A Withdrawn JP2009251870A (en) | 2008-04-04 | 2008-04-04 | Document processing apparatus, program, and document processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009251870A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015032281A (en) * | 2013-08-07 | 2015-02-16 | 富士ゼロックス株式会社 | Document management device and document management program |
-
2008
- 2008-04-04 JP JP2008098135A patent/JP2009251870A/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015032281A (en) * | 2013-08-07 | 2015-02-16 | 富士ゼロックス株式会社 | Document management device and document management program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929603B2 (en) | Context-based text auto completion | |
JP4977589B2 (en) | Specific expression extraction device, specific expression extraction method, and program | |
US20190034399A1 (en) | Systems and methods for automatically creating tables using auto-generated templates | |
US20040267715A1 (en) | Processing TOC-less media content | |
US20120323905A1 (en) | Ranking data utilizing attributes associated with semantic sub-keys | |
JP6505421B2 (en) | Information extraction support device, method and program | |
US7801722B2 (en) | Techniques for customization of phonetic schemes | |
JP2014504412A (en) | User interface for presenting media content | |
US20120317141A1 (en) | System and method for ordering of semantic sub-keys | |
US20070277118A1 (en) | Providing suggestion lists for phonetic input | |
WO2010061535A1 (en) | Information search device, information search method, and storage medium containing program | |
JP2009251870A (en) | Document processing apparatus, program, and document processing method | |
JP2008083979A (en) | Electronic part search system and electronic part search program | |
JP4715476B2 (en) | Table of contents data search control device and table of contents data search control program | |
JP5257189B2 (en) | Search result output program, search result output device, and search result output method | |
JP5152857B2 (en) | Electronic device, display control method, and program | |
JP7092992B2 (en) | Document management program, document management device and document management method | |
JP5609718B2 (en) | Input support program, input support device, and input support method | |
JP2019008477A (en) | Discrimination program, discrimination device and discrimination method | |
JP5803481B2 (en) | Information processing apparatus and information processing program | |
JP5225331B2 (en) | Data extraction apparatus and method | |
TWI399652B (en) | Systems and methods for comments aggregation and carryover in word pages | |
AU2013200005B2 (en) | Method and apparatus for analyzing abbreviations in a document | |
JP5262190B2 (en) | Input completion device and input completion program | |
JP7443667B2 (en) | Search device, dictionary search program, dictionary search method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110607 |