JP2012146047A - Editing support apparatus, editing support method and editing support program - Google Patents

Editing support apparatus, editing support method and editing support program Download PDF

Info

Publication number
JP2012146047A
JP2012146047A JP2011002746A JP2011002746A JP2012146047A JP 2012146047 A JP2012146047 A JP 2012146047A JP 2011002746 A JP2011002746 A JP 2011002746A JP 2011002746 A JP2011002746 A JP 2011002746A JP 2012146047 A JP2012146047 A JP 2012146047A
Authority
JP
Japan
Prior art keywords
page data
keyword
unit
registered
key sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011002746A
Other languages
Japanese (ja)
Inventor
Toshihiko Otake
俊彦 大竹
Kazumi Sawayanagi
一美 澤柳
Hideyuki Matsuda
英之 松田
Kazumasa Takahashi
一誠 高橋
Masayuki Kawamoto
将之 河本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2011002746A priority Critical patent/JP2012146047A/en
Publication of JP2012146047A publication Critical patent/JP2012146047A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To generate document data which are matched between a plurality of pages.SOLUTION: A PC includes a key sentence receiving unit 11 which receives a key sentence, a page data generation unit 17 which generates page data on the basis of the key sentence, a keyword extraction unit 25 which extracts as a keyword a character string conformed to a predetermined condition from the page data, a keyword setting unit 27 which sets one or more registration keywords selected from at least one extracted keyword, a determination unit 31 which determines matching of a plurality of page data generated by the page data generation unit 17 on the basis of whether each of the one or more registration keywords appears in new page data generated by the page data generation unit after the registration keywords are set, and a warning unit 37 which raises a warning in the case where the determination unit 31 determines mismatching.

Description

この発明は、編集支援装置、編集支援方法および編集支援プログラムに関し、文書の作成を支援する編集支援装置、その編集支援装置で実行される編集支援方法および編集支援プログラムに関する。   The present invention relates to an editing support apparatus, an editing support method, and an editing support program, and more particularly to an editing support apparatus that supports creation of a document, an editing support method and an editing support program executed by the editing support apparatus.

文書を作成する際に、これまでに蓄積された文書を参考にしながら作成する場合がある。参考とするための文書を蓄積された多くの文書のうちから抽出する技術としては、キーワードを入力してデータベース等を検索する技術が知られている。例えば、特開平10−40403号公報には、文書ではなく図形を検索する技術であるが、編集途中の図形に対して、編集指示入力部により図形変換指示が入力された場合、図形変換知識管理部は、その選択された図形データを利用者の要求条件として図形変換知識記憶部を検索し、変換候補図形表示部により検索結果を候補図形として提示し、図形変換部は候補図形から利用者が選択し確定した変換後の図形データを取り出して変換前の図形データと合成するようにした図形編集装置が記載されている。   When creating a document, it may be created with reference to the documents accumulated so far. As a technique for extracting a document for reference from many stored documents, a technique for searching a database or the like by inputting a keyword is known. For example, Japanese Patent Laid-Open No. 10-40403 discloses a technique for searching for a graphic instead of a document. When a graphic conversion instruction is input to the graphic being edited by the editing instruction input unit, graphic conversion knowledge management is performed. The search unit searches the graphic conversion knowledge storage unit using the selected graphic data as a requirement of the user, and presents the search result as a candidate graphic by the conversion candidate graphic display unit. A graphic editing apparatus is described in which selected graphic data after conversion is extracted and combined with graphic data before conversion.

しかしながら、複数ページの文書を作成する際には、文書の作成途中で記載する内容が変化し、記載しなければならない事項が記載されなかったり、内容の展開が主題からそれたものになってしまったりすることがある。通常は、文書の完成後または作成途中で見直す作業によって、文書が完成する。しかしながら、見直し作業をしなければならず、見直しの結果によっては、文書を途中から作成し直さなければならないといった問題がある。
特開平10−40403号公報
However, when creating a multi-page document, the contents to be described change during the document creation, and the matters that must be described are not described, or the expansion of the contents is different from the subject matter. May be frustrated. Normally, a document is completed by a review operation after completion of the document or in the middle of creation. However, there is a problem that a review work must be performed, and depending on the result of the review, the document must be recreated from the middle.
Japanese Patent Laid-Open No. 10-40403

この発明は上述した問題を解決するためになされたもので、この発明の目的の1つは、複数のページ間で整合した文書データを生成することが可能な編集支援装置を提供することである。   The present invention has been made to solve the above-described problems, and one of the objects of the present invention is to provide an editing support apparatus capable of generating document data that is consistent among a plurality of pages. .

この発明の他の目的は、複数のページ間で整合した文書データを生成することが可能な編集支援方法を提供することである。   Another object of the present invention is to provide an editing support method capable of generating document data that is consistent among a plurality of pages.

この発明のさらに他の目的は、複数のページ間で整合した文書データを生成することが可能な編集支援プログラムを提供することである。   Still another object of the present invention is to provide an editing support program capable of generating document data that is consistent among a plurality of pages.

上述した問題を達成するためにこの発明のある局面によれば、編集支援装置は、外部から入力されるキーセンテンスを受け付けるキーセンテンス受付手段と、受け付けられたキーセンテンスに基づいてページデータを生成するページデータ生成手段と、ページデータ生成手段により生成されるページデータから所定の条件に適合する文字列をキーワードとして抽出するキーワード抽出手段と、キーワード抽出手段により抽出された少なくとも1つのキーワードのうちから選択された1以上を登録キーワードに設定するキーワード設定手段と、登録キーワードが設定された後に、ページデータ生成手段により生成される新たなページデータにおいて、1以上の登録キーワードそれぞれが出現したか否かに基づいて、ページデータ生成手段により生成される複数のページデータの整合性を判定する判定手段と、判定手段により不整合と判定される場合、警告する警告手段と、を備える。   In order to achieve the above-described problem, according to one aspect of the present invention, an editing support apparatus generates key data based on a key sentence receiving unit that receives a key sentence input from the outside, and the received key sentence. Selection from page data generation means, keyword extraction means for extracting a character string that meets a predetermined condition from page data generated by the page data generation means, and at least one keyword extracted by the keyword extraction means Whether or not each of the one or more registered keywords appears in the new page data generated by the page data generating unit after the registered keyword is set and the keyword setting means for setting one or more of the registered keywords as registered keywords Based on the page data generation means Comprising determining means for determining consistency of the plurality of page data is performed, if it is determined that inconsistency determination means, warning means for warning a.

この局面に従えば、キーセンテンスに基づいてページデータが生成され、ページデータからキーワードが抽出され、抽出された少なくとも1つのキーワードのうちから選択された1以上が登録キーワードに設定される。そして、登録キーワードが設定された後に、キーセンテンスに基づいて生成される新たなページデータにおいて、1以上の登録キーワードそれぞれが出現したか否かに基づいて文書データの整合性が判定され、不整合と判定される場合、警告される。このため、過去に生成されたページデータに含まれるキーワードと同じキーワードをこれらか生成されるページデータに含めることができる。その結果、複数のページ間で整合した文書データを生成することが可能な編集支援装置を提供することができる。   According to this aspect, page data is generated based on the key sentence, keywords are extracted from the page data, and one or more selected from the extracted at least one keyword is set as a registered keyword. After the registered keyword is set, the consistency of the document data is determined based on whether or not one or more registered keywords appear in the new page data generated based on the key sentence. If it is determined, it is warned. For this reason, the same keyword as the keyword included in the page data generated in the past can be included in the generated page data. As a result, it is possible to provide an editing support apparatus capable of generating document data that is consistent among a plurality of pages.

好ましくは、判定手段は、ページデータ生成手段により生成される新たなページデータを構成する所定単位の文字列群ごとに、1以上の登録キーワードそれぞれが含まれるか否かを判断する単位別判断手段と、1以上の登録キーワードごとに、該登録キーワードを含まない文字列群が連続する回数をしきい値と比較する比較手段と、を含む。   Preferably, the determination unit determines whether each of one or more registered keywords is included for each character string group of a predetermined unit constituting new page data generated by the page data generation unit. And a comparison unit that compares the number of consecutive character string groups not including the registered keyword with a threshold value for each of the one or more registered keywords.

この局面に従えば、生成される新たなページデータを構成する所定単位の文字列群ごとに、1以上の登録キーワードそれぞれが含まれるか否かが判断され、1以上の登録キーワードごとに、該登録キーワードを含まない文字列群が連続する回数がしきい値と比較される。このため、登録キーワードが所定単位の文字列群で連続して含まれる回数に基づいて、整合性を判断することができるので、複数のページ間の整合を容易に判断することができる。   According to this aspect, it is determined whether or not each of one or more registered keywords is included for each character string group of a predetermined unit constituting new page data to be generated. The number of consecutive character strings that do not include the registered keyword is compared with a threshold value. For this reason, the consistency can be determined based on the number of times that the registered keyword is continuously included in the character string group of a predetermined unit, so that the alignment between a plurality of pages can be easily determined.

好ましくは、1以上の登録キーワードそれぞれに重要度を設定する重要度設定手段を、さらに備え、比較手段が比較するしきい値は、重要度に対して予め定められた値である。   Preferably, an importance level setting unit that sets an importance level for each of the one or more registered keywords is further provided, and the threshold value that the comparison unit compares is a value that is predetermined for the importance level.

好ましくは、判定手段は、登録キーワードが設定された後に、ページデータ生成手段により生成される1以上の新たなページデータにおいて、1以上の登録キーワードそれぞれが出現したか否かに基づいて、ページデータ生成手段により生成される複数のページデータの整合性を判定する。   Preferably, the determining means determines the page data based on whether or not each of the one or more registered keywords appears in the one or more new page data generated by the page data generating means after the registered keyword is set. The consistency of a plurality of page data generated by the generating means is determined.

この局面に従えば、1以上の新たなページデータを、それらより前のページデータと整合させることができる。   According to this aspect, one or more new page data can be matched with previous page data.

好ましくは、ページデータ生成手段は、キーセンテンス受付手段により受け付けられたキーセンテンスから1以上の検索ワードを抽出する検索ワード抽出手段と、抽出された1以上の検索ワードが抽出されると、検索ワードを用いてデータベースを検索し、1以上のコンテンツを取得するコンテンツ取得手段と、コンテンツ取得手段により取得された1以上のコンテンツのうちから少なくとも1つをページデータに選択する選択手段と、を含む。   Preferably, the page data generating means extracts search word extracting means for extracting one or more search words from the key sentence received by the key sentence receiving means, and when the extracted one or more search words are extracted, the search word A content acquisition unit that searches the database using the URL and acquires one or more contents, and a selection unit that selects at least one of the one or more contents acquired by the content acquisition unit as page data.

好ましくは、キーセンテンス受付手段は、音声が入力される音声入力手段と、入力された音声を音声認識する音声認識手段と、を含む。   Preferably, the key sentence receiving means includes a voice input means for inputting a voice and a voice recognition means for recognizing the input voice.

この局面に従えば、ユーザは、音声でキーセンテンスを入力することができる。   According to this aspect, the user can input a key sentence by voice.

この発明の他の局面によれば、編集支援方法は、外部から入力されるキーセンテンスを受け付けるステップと、受け付けられたキーセンテンスに基づいてページデータを生成するステップと、生成されるページデータから所定の条件に適合する文字列をキーワードとして抽出するステップと、抽出された少なくとも1つのキーワードのうちから選択された1以上を登録キーワードに設定するステップと、登録キーワードが設定された後に、ページデータを生成するステップにおいて生成される新たなページデータにおいて、1以上の登録キーワードそれぞれが出現したか否かに基づいて、ページデータを生成するステップにおいて生成される複数のページデータの整合性を判定するステップと、判定するステップにおいて不整合と判定される場合、警告するステップと、を含む。   According to another aspect of the present invention, an editing support method includes a step of receiving a key sentence input from the outside, a step of generating page data based on the received key sentence, and a predetermined amount from the generated page data. A step of extracting a character string that satisfies the above condition as a keyword, a step of setting one or more selected from at least one extracted keyword as a registered keyword, and page data after setting the registered keyword A step of determining the consistency of the plurality of page data generated in the step of generating the page data based on whether or not each of the one or more registered keywords appears in the new page data generated in the step of generating Is determined to be inconsistent in the determining step Including case, a step of warning, the.

この局面に従えば、複数のページ間で整合した文書データを生成することが可能な編集支援方法を提供することができる。   According to this aspect, it is possible to provide an editing support method capable of generating document data that is consistent among a plurality of pages.

この発明のさらに他の局面に従えば、編集支援プログラムは、外部から入力されるキーセンテンスを受け付けるステップと、受け付けられたキーセンテンスに基づいてページデータを生成するステップと、生成されるページデータから所定の条件に適合する文字列をキーワードとして抽出するステップと、抽出された少なくとも1つのキーワードのうちから選択された1以上を登録キーワードに設定するステップと、登録キーワードが設定された後に、ページデータを生成するステップにおいて生成される新たなページデータにおいて、1以上の登録キーワードそれぞれが出現したか否かに基づいて、ページデータを生成するステップにおいて生成される複数のページデータの整合性を判定するステップと、判定するステップにおいて不整合と判定される場合、警告するステップと、をコンピュータに実行させる。   According to still another aspect of the present invention, an editing support program receives a key sentence input from the outside, a step of generating page data based on the received key sentence, and a generated page data A step of extracting a character string matching a predetermined condition as a keyword, a step of setting one or more selected from the extracted at least one keyword as a registered keyword, and page data after the registered keyword is set The consistency of a plurality of page data generated in the step of generating page data is determined based on whether one or more registered keywords appear in the new page data generated in the step of generating Inconsistency between step and judgment step If it is determined to execute the steps of warning to the computer.

この局面に従えば、複数のページ間で整合した文書データを生成することが可能な編集支援プログラムを提供することができる。   According to this aspect, it is possible to provide an editing support program that can generate document data that is consistent among a plurality of pages.

本発明の実施の形態における情報処理システムの一例を示す図である。It is a figure which shows an example of the information processing system in embodiment of this invention. PCのハードウエア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of PC. PCが備えるCPUが有する機能の概要の一例を示すブロック図である。It is a block diagram which shows an example of the outline | summary of the function which CPU with which PC is provided. 重要度設定画面の一例を示す図である。It is a figure which shows an example of an importance setting screen. ページデータの一例を示す図である。It is a figure which shows an example of page data. ページデータ中における文別に登録キーワードごとの有無を示すテーブルである。It is a table which shows the presence or absence for every registration keyword according to the sentence in page data. 編集支援処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of an edit assistance process. 整合性判断処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of a consistency judgment process.

以下、本発明の実施の形態について図面を参照して説明する。以下の説明では同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰り返さない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following description, the same parts are denoted by the same reference numerals. Their names and functions are also the same. Therefore, detailed description thereof will not be repeated.

図1は、本発明の実施の形態における情報処理システムの一例を示す図である。図1を参照して、情報処理システム1は、編集支援装置として機能するパーソナルコンピュータ(PC)100と、ファイルサーバ201と、複合機(Multi Function Peripheral)(以下、「MFP」という)221と、を含む。PC100、ファイルサーバ201、MFP221は、ネットワーク2にそれぞれ接続される。MFP221は、HDDを備えており、ファイルサーバとしての機能を有する。また、MFP221は、スキャナ機能、プリンタ機能、コピー機能、ファクシミリ機能等の複数の機能を備える。   FIG. 1 is a diagram illustrating an example of an information processing system according to an embodiment of the present invention. Referring to FIG. 1, an information processing system 1 includes a personal computer (PC) 100 that functions as an editing support device, a file server 201, a multi function peripheral (hereinafter referred to as “MFP”) 221, including. The PC 100, the file server 201, and the MFP 221 are connected to the network 2, respectively. The MFP 221 includes an HDD and functions as a file server. The MFP 221 includes a plurality of functions such as a scanner function, a printer function, a copy function, and a facsimile function.

MFP221およびファイルサーバ201には、複数のコンテンツが記憶される。例えば、ファイルサーバ201が複数人で共有される場合、複数人がファイルサーバ201に記憶させた複数のコンテンツが記憶される。ファイルサーバ201は、検索エンジンを備えており、PC100からファイルサーバ201にキーワードを送信すれば、ファイルサーバ201においてファイルサーバ201に記憶された複数のコンテンツのうちからキーワードを含むコンテンツが抽出され、抽出された複数のコンテンツがPC100に送信される。ファイルサーバ201が送信する複数のコンテンツは、ファイルサーバ201において予め定められた優先順位で並び替えられている。   The MFP 221 and the file server 201 store a plurality of contents. For example, when the file server 201 is shared by a plurality of people, a plurality of contents stored in the file server 201 by the plurality of people are stored. The file server 201 includes a search engine, and when a keyword is transmitted from the PC 100 to the file server 201, content including the keyword is extracted from the plurality of contents stored in the file server 201 in the file server 201 and extracted. The plurality of contents thus transmitted are transmitted to the PC 100. The plurality of contents transmitted by the file server 201 are rearranged in a predetermined priority order in the file server 201.

ネットワーク2は、ローカルエリアネットワーク(LAN)であり、接続形態は有線または無線を問わない。ネットワーク2は、ゲートウェイを介してインターネット3に接続されており、PC100は、インターネット3に接続された検索サーバ211と通信可能である。なお、ネットワーク2は、LANに限らず、ワイドエリアネットワーク(WAN)、公衆交換電話網(PSTN)等であってもよい。   The network 2 is a local area network (LAN), and the connection form may be wired or wireless. The network 2 is connected to the Internet 3 via a gateway, and the PC 100 can communicate with a search server 211 connected to the Internet 3. The network 2 is not limited to a LAN, and may be a wide area network (WAN), a public switched telephone network (PSTN), or the like.

検索サーバ211は、検索エンジンを備えており、インターネット3上に公開されたコンテンツを検索し、検索結果を出力するサービスを提供する。検索サーバ211は、検索により抽出したコンテンツを、検索サーバ211において予め定められた優先順位で並び替えて、出力する。PC100は、検索サーバ211にキーワードを送信し、検索サーバ211から検索結果として抽出された複数のコンテンツを受信する。   The search server 211 includes a search engine, and provides a service for searching for contents published on the Internet 3 and outputting search results. The search server 211 rearranges the content extracted by the search in the priority order predetermined in the search server 211 and outputs the result. The PC 100 transmits a keyword to the search server 211 and receives a plurality of contents extracted as search results from the search server 211.

図2は、PCのハードウエア構成の一例を示すブロック図である。図2を参照して、PC100は、それぞれがバス120に接続されたCPU101と、CPU101が実行するプログラム等を記憶するためのROM(Read Only Memory)103と、CPU101の作業領域として用いられるRAM105と、大容量記憶装置としてのHDD107と、メモリカード108が装着されるカードインターフェース(I/F)109と、PC100をインターネットに接続するための通信I/F111と、ユーザとのインターフェースとなるユーザインターフェース113と、マイクロホン121が接続された外部I/F119と、を含む。   FIG. 2 is a block diagram illustrating an example of a hardware configuration of the PC. Referring to FIG. 2, a PC 100 includes a CPU 101 connected to a bus 120, a ROM (Read Only Memory) 103 for storing a program executed by the CPU 101, and a RAM 105 used as a work area of the CPU 101. The HDD 107 serving as a mass storage device, a card interface (I / F) 109 to which a memory card 108 is mounted, a communication I / F 111 for connecting the PC 100 to the Internet, and a user interface 113 serving as an interface with the user. And an external I / F 119 to which a microphone 121 is connected.

ユーザインターフェース113は、キーボードとマウスなどのポインティングデバイスを含む操作部115と、画像を表示する液晶表示装置等からなる表示部117とを含む。   The user interface 113 includes an operation unit 115 including a keyboard and a pointing device such as a mouse, and a display unit 117 including a liquid crystal display device that displays an image.

CPU101は、PC100の全体を制御する。また、CPU101は、ROM103に記憶されたプログラムを実行する。また、CPU101は、カードI/F109を介してメモリカード108に記憶されたプログラムをRAM105にロードし、実行するようにしてもよい。   The CPU 101 controls the entire PC 100. Further, the CPU 101 executes a program stored in the ROM 103. Further, the CPU 101 may load a program stored in the memory card 108 via the card I / F 109 into the RAM 105 and execute it.

さらに、CPU101がインターネット3に接続されたコンピュータからプログラムをダウンロードしてHDD107に記憶して、または、インターネット3に接続されたコンピュータがプログラムをHDD107に書込みするようにして、CPU101で実行するようにしてもよい。ここでいうプログラムは、CPU101により直接実行可能なプログラムだけでなく、ソースプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。   Further, the CPU 101 downloads a program from a computer connected to the Internet 3 and stores it in the HDD 107, or the computer connected to the Internet 3 writes the program to the HDD 107 and executes it on the CPU 101. Also good. The program here includes not only a program that can be directly executed by the CPU 101 but also a source program, a compressed program, an encrypted program, and the like.

マイクロホン121は、PC100のユーザが発生する音声を集音し、集音した音声を、外部I/F119に出力する。外部I/F119は、マイクロホン121から入力される音声を、CPU101に出力する。   The microphone 121 collects sound generated by the user of the PC 100 and outputs the collected sound to the external I / F 119. The external I / F 119 outputs the sound input from the microphone 121 to the CPU 101.

なお、CPU101が実行するためのプログラムを記憶する記録媒体としては、メモリカード108に限られず、フレキシブルディスク、カセットテープ、光ディスク(CD−ROM(Compact Disc−Read Only Memory)/MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード、光カード、マスクROM、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable and Programmable ROM)などの半導体メモリ等の媒体でもよい。   A recording medium for storing a program to be executed by the CPU 101 is not limited to the memory card 108, but a flexible disk, a cassette tape, an optical disk (CD-ROM (Compact Disc-Read Only Memory) / MO (Magnetic Optical Disc)). / MD (Mini Disc) / DVD (Digital Versatile Disc), IC card, optical card, mask ROM, EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable and Programmable ROM), and other semiconductor memories.

本実施の形態におけるPC100は、編集支援装置として機能する。PC100は、インターネット上に公開されたコンテンツ、ファイルサーバ201またはMFP221に記憶されたコンテンツのうちからPC100のユーザが所望するコンテンツを収集する。ここでは、PC100のユーザがプレゼンテーション用の資料を作成するためのコンテンツを収集する場合を例に説明する。この場合、プレゼンテーションの主題があり、収集するコンテンツは、その主題に関連するコンテンツとなる。   The PC 100 in the present embodiment functions as an editing support apparatus. The PC 100 collects content desired by the user of the PC 100 from content published on the Internet and content stored in the file server 201 or the MFP 221. Here, a case where the user of the PC 100 collects contents for creating presentation materials will be described as an example. In this case, there is a theme of the presentation, and the contents to be collected are contents related to the theme.

図3は、PCが備えるCPUが有する機能の概要の一例を示すブロック図である。図3に示す機能は、CPU101がROM103またはメモリカード108に記憶された編集支援プログラムを実行することにより、CPU101に形成される。   FIG. 3 is a block diagram illustrating an example of an overview of functions of a CPU included in the PC. The functions shown in FIG. 3 are formed in the CPU 101 when the CPU 101 executes an editing support program stored in the ROM 103 or the memory card 108.

図3を参照して、CPU101は、外部から入力されるキーセンテンスを受け付けるキーセンテンス受付部11と、キーセンテンスに基づいてページデータを生成するページデータ生成部17と、ページデータからキーワードを抽出するキーワード抽出部25と、登録キーワードを設定するキーワード設定部27と、登録キーワードに重要度を設定する重要度設定部29と、文書の整合性を判定する判定部31と、警告部37と、を含む。   Referring to FIG. 3, CPU 101 extracts a key sentence from key data, a key sentence receiving unit 11 that receives a key sentence input from the outside, a page data generating unit 17 that generates page data based on the key sentence, and a keyword from the page data. A keyword extraction unit 25; a keyword setting unit 27 that sets a registered keyword; an importance setting unit 29 that sets an importance level for a registered keyword; a determination unit 31 that determines document consistency; and a warning unit 37. Including.

キーセンテンス受付部11は、ユーザにより入力されるキーセンテンスを受け付ける。キーセンテンス受付部11は、受け付けたキーセンテンスをページデータ生成部17に出力する。キーセンテンスは、1以上の単語を含む文である。キーセンテンス受付部11は、ユーザが、操作部115が有するキーボードまたはマウスでキーセンテンスを入力する場合、操作部115に入力されたキーセンテンスを受け付ける。ユーザが、マイクロホン121に音声でキーセンテンスを入力する場合、マイクロホン121に入力される音声を音声認識することによって、キーセンテンスを受け付ける。具体的には、キーセンテンス受付部11は、音声入力部13と、音声認識部15とを含む。音声入力部13は、外部I/F119を介してマイクロホン121と接続される。マイクロホン121は、ユーザが発生した音声を集音し、アナログの音声データを外部I/F119に出力する。外部I/F119は、マイクロホン121から入力される音声データをCPU101に出力する、音声入力部13は、外部I/F119が出力する音声データが入力され、入力された音声データを音声認識部15に出力する。音声認識部15は、音声入力部13から入力される音声データを解析し、音声認識することによって、音声データを文字情報に変換する。キーセンテンス受付部11は、音声認識部15によって音声データから変換された文字情報をキーセンテンスとして受け付ける。   The key sentence receiving unit 11 receives a key sentence input by the user. The key sentence reception unit 11 outputs the received key sentence to the page data generation unit 17. A key sentence is a sentence including one or more words. When the user inputs a key sentence with the keyboard or mouse of the operation unit 115, the key sentence reception unit 11 receives the key sentence input to the operation unit 115. When the user inputs a key sentence to the microphone 121 by voice, the key sentence is received by recognizing the voice input to the microphone 121. Specifically, the key sentence reception unit 11 includes a voice input unit 13 and a voice recognition unit 15. The audio input unit 13 is connected to the microphone 121 via the external I / F 119. The microphone 121 collects sound generated by the user and outputs analog sound data to the external I / F 119. The external I / F 119 outputs audio data input from the microphone 121 to the CPU 101, and the audio input unit 13 receives audio data output from the external I / F 119 and inputs the input audio data to the audio recognition unit 15. Output. The voice recognition unit 15 analyzes the voice data input from the voice input unit 13 and recognizes the voice, thereby converting the voice data into character information. The key sentence receiving unit 11 receives character information converted from the voice data by the voice recognition unit 15 as a key sentence.

ページデータ生成部17は、キーセンテンスから検索ワードを抽出する検索ワード抽出部19と、コンテンツを取得するコンテンツ取得部21と、取得されたコンテンツのうちから少なくとも1つを選択する選択部23と、を含む。   The page data generation unit 17 includes a search word extraction unit 19 that extracts a search word from a key sentence, a content acquisition unit 21 that acquires content, a selection unit 23 that selects at least one of the acquired content, including.

検索ワード抽出部19は、キーセンテンス受付部11から入力されるキーセンテンスを1以上の単語に分割し、1以上の単語のうちから予め登録された単語を検索ワードとして抽出する。検索ワード抽出部19は、抽出された1以上の検索ワードをコンテンツ取得部21に出力する。例えば、キーセンテンス「今後クラウドは普及する」が入力される場合、予め登録された単語である「クラウド」および「普及」を検索ワードとして抽出する。   The search word extraction unit 19 divides the key sentence input from the key sentence reception unit 11 into one or more words, and extracts a pre-registered word from the one or more words as a search word. The search word extraction unit 19 outputs the extracted one or more search words to the content acquisition unit 21. For example, when the key sentence “cloud will spread in the future” is input, the words “cloud” and “spread” which are registered in advance are extracted as search words.

コンテンツ取得部21は、検索ワードを用いて検索し、1以上のコンテンツを取得し、取得された1以上のコンテンツを選択部23に出力する。具体的には、検索ワードを含む検索要求を通信I/F111を介して検索サーバ211に送信する。検索サーバ211は、検索要求を受信すると、インターネット3上に公開された膨大な量のコンテンツのうちから検索用キーワードを含む1以上のコンテンツを抽出し、1以上のコンテンツを予め定められた優先順位で並び換えて、PC100に返信する。コンテンツ取得部21は、通信I/F111が検索サーバ211から検索結果である1以上のコンテンツを受信すると、通信I/F111から1以上のコンテンツを取得する。また、コンテンツ取得部21は、検索サーバ211から受信された1以上のコンテンツを、画像を含むコンテンツを画像を含まないコンテンツよりも優先順位を高くして、並び替える。画像を含むコンテンツは、画像を含まないコンテンツよりも発表用の資料として利用価値が高いからである。   The content acquisition unit 21 searches using the search word, acquires one or more contents, and outputs the acquired one or more contents to the selection unit 23. Specifically, a search request including a search word is transmitted to the search server 211 via the communication I / F 111. When the search server 211 receives the search request, the search server 211 extracts one or more contents including the search keyword from the enormous amount of contents disclosed on the Internet 3, and sets the one or more contents to a predetermined priority order. The data is rearranged and returned to the PC 100. When the communication I / F 111 receives one or more contents as search results from the search server 211, the content acquisition unit 21 acquires one or more contents from the communication I / F 111. In addition, the content acquisition unit 21 rearranges the one or more contents received from the search server 211 with the priority order higher than the contents not including the contents including the images. This is because content including images has a higher utility value as material for presentation than content not including images.

また、コンテンツ取得部21は、検索ワードを含む検索要求をMFP221に送信するようにしてもよい。MFP221は、検索要求を受信すると、それが備えるHDDに記憶された複数のコンテンツのうちから検索用キーワードを含む1以上のコンテンツを抽出し、抽出された1以上のコンテンツをMFP221によって予め定められた優先順位で並び換えて、PC100に返信する。コンテンツ取得部21は、通信I/F111がMFP221から検索結果である1以上のコンテンツを受信すると、通信I/F111から1以上のコンテンツを取得する。   Further, the content acquisition unit 21 may transmit a search request including a search word to the MFP 221. Upon receiving the search request, the MFP 221 extracts one or more contents including a search keyword from a plurality of contents stored in the HDD included in the MFP 221, and the extracted one or more contents are predetermined by the MFP 221. The messages are rearranged in the priority order and returned to the PC 100. When the communication I / F 111 receives one or more contents as search results from the MFP 221, the content acquisition unit 21 acquires one or more contents from the communication I / F 111.

さらに、コンテンツ取得部21は、検索ワードを含む検索要求をMFP221および検索サーバ211に送信するようにしてもよい。コンテンツ取得部21は、通信I/F111がMFP221および検索サーバ211それぞれから検索結果である1以上のコンテンツを受信すると、通信I/F111から1以上のコンテンツを取得する。   Further, the content acquisition unit 21 may transmit a search request including a search word to the MFP 221 and the search server 211. When the communication I / F 111 receives one or more contents as search results from the MFP 221 and the search server 211, the content acquisition unit 21 acquires one or more contents from the communication I / F 111.

選択部23は、コンテンツ取得部21から入力される1以上のコンテンツのうち上位3つのコンテンツを表示部117に選択可能に表示する。具体的には、選択部23は、上位3つのコンテンツそれぞれの画像を合成した画像であって、1以上のコンテンツそれぞれに対応する画像を選択可能な選択画像を生成し、生成した選択画像を表示部117に表示する。選択画像のサイズが、表示部117の表示可能なサイズよりも大きい場合には、選択画像を縮小して表示してもよいし、スクロール可能に表示してもよい。   The selection unit 23 displays the top three contents among the one or more contents input from the content acquisition unit 21 so as to be selectable on the display unit 117. Specifically, the selection unit 23 generates a selection image that is an image obtained by combining the images of the top three contents and can select an image corresponding to each of the one or more contents, and displays the generated selection image Displayed on the unit 117. When the size of the selected image is larger than the displayable size of the display unit 117, the selected image may be displayed in a reduced size or may be displayed in a scrollable manner.

選択部23は、ユーザが表示部117に表示された選択画像に含まれるコンテンツの画像を指示する操作を操作部115に入力すれば、指示された画像に対応するコンテンツをページデータとして選択し、ページデータをキーワード抽出部25および判定部31に出力する。コンテンツの選択は、コンテンツの全体の選択であっても良いし、部分的な選択であってもよい。コンテンツが部分的に選択される場合、選択部23は、コンテンツの選択された部分を切り出し、切り出した部分をページデータとして選択する。   When the user inputs an operation to instruct the image of the content included in the selected image displayed on the display unit 117 to the operation unit 115, the selection unit 23 selects the content corresponding to the instructed image as page data, The page data is output to the keyword extraction unit 25 and the determination unit 31. The selection of content may be a selection of the entire content or a partial selection. When the content is partially selected, the selection unit 23 cuts out the selected portion of the content and selects the cut-out portion as page data.

また、ページデータ生成部17は、ユーザが操作部115に入力する文字列を、ページデータに付加する、または、ユーザにより入力された文字列を組み合わせてページデータを生成するようにしてもよい。   Further, the page data generation unit 17 may add a character string input to the operation unit 115 by the user to the page data, or generate page data by combining the character string input by the user.

ページデータ生成部17は、選択部23によって選択されたページデータ、または、ユーザにより入力された文字列からなるページデータを、後述する判定部31から文書が整合していると判断されることを条件に、そのページデータをHDD107に記憶されている文書データに追加して記憶する。これにより、HDD107にページデータを含む文書データが記憶される。ページデータ生成部17は、選択部23によって選択されたページデータが文書データの第1ページの場合には、第1ページのページデータを含む文書データを生成し、生成した文書データをHDD107に記憶する。   The page data generation unit 17 determines that the page data selected by the selection unit 23 or the page data composed of a character string input by the user is determined by the determination unit 31 described later that the document is consistent. As a condition, the page data is added to the document data stored in the HDD 107 and stored. As a result, document data including page data is stored in the HDD 107. When the page data selected by the selection unit 23 is the first page of the document data, the page data generation unit 17 generates document data including the page data of the first page and stores the generated document data in the HDD 107. To do.

キーワード抽出部25は、ページデータ生成部17から入力されるページデータからキーワードを抽出する。ページデータが画像データの場合、ページデータをOCR(Optical Character Reader)処理して得られる文字列からキーワードを抽出する。具体的には、ページデータに含まれる文字列を1以上の単語に分割し、1以上の単語のうちから予め定められた条件に適合する単語をキーワードとして抽出する。キーワード抽出部25は、抽出された1以上のキーワードをキーワード設定部27に出力する。キーワードを抽出する条件は、ページデータ中に所定数以上含まれる単語、ページデータ中で表題に用いられている単語等である。また、キーワード抽出部25は、ページデータ生成部17においてページデータを検索する際に用いた検索ワードをページデータ生成部17から取得し、検索ワードをキーワードに設定するようにしてもよい。さらに、単語と、その単語から予測される単語とを関連付けた予測キーワードデータベースをHDD107に記憶しておき、ページデータから抽出されたキーワードから予測キーワードデータベースを検索して予測される単語を抽出し、抽出された単語をキーワードとしてキーワード設定部27に出力するようにしてもよい。   The keyword extraction unit 25 extracts keywords from the page data input from the page data generation unit 17. When the page data is image data, a keyword is extracted from a character string obtained by performing OCR (Optical Character Reader) processing on the page data. Specifically, a character string included in page data is divided into one or more words, and a word that meets a predetermined condition is extracted as a keyword from the one or more words. The keyword extraction unit 25 outputs the extracted one or more keywords to the keyword setting unit 27. The conditions for extracting a keyword are words included in a predetermined number or more in the page data, words used as titles in the page data, and the like. Further, the keyword extraction unit 25 may acquire a search word used when the page data generation unit 17 searches for page data from the page data generation unit 17 and set the search word as a keyword. Further, a prediction keyword database that associates a word with a word predicted from the word is stored in the HDD 107, the prediction keyword database is searched from the keywords extracted from the page data, and the predicted word is extracted. You may make it output the extracted word to the keyword setting part 27 as a keyword.

キーワード設定部27は、キーワード抽出部25から入力される1以上のキーワードを、登録キーワードに設定する。キーワード設定部27は、1以上の登録キーワードを判定部31および重要度設定部29に出力する。なお、RAM105の予め定められた領域に、キーワード抽出部25から入力される1以上のキーワードを記憶するようにし、重要度設定部29および判定部31がRAM105に記憶された登録キーワードを読み出すようにしてもよい。   The keyword setting unit 27 sets one or more keywords input from the keyword extraction unit 25 as registered keywords. The keyword setting unit 27 outputs one or more registered keywords to the determination unit 31 and the importance setting unit 29. One or more keywords input from the keyword extraction unit 25 are stored in a predetermined area of the RAM 105, and the importance setting unit 29 and the determination unit 31 read out the registered keywords stored in the RAM 105. May be.

重要度設定部29は、キーワード設定部27から入力される1以上の登録キーワードごとに重要度を設定する。重要度設定部29は、表示部117に登録キーワードに重要度を設定するための重要度設定画面を表示し、ユーザが操作部115に入力する重要度を、登録キーワードに対応して設定する。重要度設定画面は、1以上の登録キーワードをリスト表示する画面であり、1以上の登録キーワードそれぞれに対応して重要度を設定するための領域を含む。重要度設定画面にリスト表示された1以上の登録キーワードを選択する操作と、重要度を入力する操作とを受け付けると、選択された登録キーワードに対応して入力された重要度を設定する。重要度設定部29は、登録キーワードに設定された重要度を判定部31に出力する。   The importance level setting unit 29 sets the importance level for each of one or more registered keywords input from the keyword setting unit 27. The importance level setting unit 29 displays an importance level setting screen for setting the importance level for the registered keyword on the display unit 117, and sets the importance level input by the user to the operation unit 115 in accordance with the registered keyword. The importance setting screen is a screen for displaying a list of one or more registered keywords, and includes an area for setting the importance corresponding to each of the one or more registered keywords. When an operation for selecting one or more registered keywords displayed in a list on the importance level setting screen and an operation for inputting the importance level are accepted, the importance level corresponding to the selected registered keyword is set. The importance level setting unit 29 outputs the importance level set for the registered keyword to the determination unit 31.

図4は、重要度設定画面の一例を示す図である。重要度設定画面ここでは、3つの登録キーワード303,305,307と、3つの登録キーワードそれぞれの右側に重要度を設定する領域303A,305A,307Aとを含む。登録キーワード303は「KM」が設定され、領域303Aに「重要度1」が設定され、登録キーワード305は「高画質」が設定され、領域305Aに「重要度3」が設定され、登録キーワード307は「他社」が設定され、領域307Aに「重要度2」が設定される。重要度は、登録キーワードの程度を示し、重要度が高いほど重要なキーワードであることを示す。ここでは、重要度1、重要度2、重要度3の順に重要度が高い。   FIG. 4 is a diagram illustrating an example of the importance setting screen. Importance Level Setting Screen Here, three registered keywords 303, 305, and 307 and areas 303A, 305A, and 307A for setting importance levels on the right side of the three registered keywords are included. “KM” is set for the registered keyword 303, “importance 1” is set for the area 303A, “high quality” is set for the registered keyword 305, “importance 3” is set for the area 305A, and the registered keyword 307 is set. “Other company” is set, and “importance 2” is set in the area 307A. The importance indicates the degree of the registered keyword, and the higher the importance, the more important the keyword. Here, the importance is higher in the order of importance 1, importance 2, and importance 3.

図3に戻って、判定部31は、ページデータ生成部17からページデータが入力され、キーワード設定部27から登録キーワードが入力され、重要度設定部29から登録キーワードごとの重要度が入力される。判定部31は、ページデータにおける登録キーワードの出現回数に基づいて、複数のページデータで構成される文書の整合性を判定する。具体的には、判定部31は、単位別判断部33と、比較部35とを含む。単位別判断部33は、ページデータ生成部17から入力される第Nページのページデータを構成する複数の所定単位の文字列群ごとに、該文字列郡がキーワード設定部27から入力される1以上の登録キーワードを含むか否か判断する。所定単位は、予め定められた単位であり、文字数によって定めてもよいし、行数によって定めてもよいし、文の数によって定めてもよい。ここでは、所定単位を1文とする場合を例に説明し、以下、ページデータを構成する複数の所定単位の文字列群を、複数の文という。   Returning to FIG. 3, the determination unit 31 receives page data from the page data generation unit 17, a registration keyword from the keyword setting unit 27, and an importance level for each registered keyword from the importance level setting unit 29. . The determination unit 31 determines the consistency of a document composed of a plurality of page data based on the number of appearances of the registered keyword in the page data. Specifically, the determination unit 31 includes a unit-specific determination unit 33 and a comparison unit 35. The unit determining unit 33 receives the character string group from the keyword setting unit 27 for each of a plurality of character units of a predetermined unit constituting the page data of the Nth page input from the page data generating unit 17. It is determined whether or not the above registered keyword is included. The predetermined unit is a predetermined unit, and may be determined by the number of characters, the number of lines, or the number of sentences. Here, a case where the predetermined unit is one sentence will be described as an example. Hereinafter, a plurality of predetermined unit character string groups constituting the page data are referred to as a plurality of sentences.

単位別判断部33にキーワード設定部27から入力される登録キーワードは、キーワード抽出部25によって第(N−1)ページのページデータから抽出されたキーワードに含まれる。ただし、Nは2以上の整数である。なお、単位別判断部33が有無を判断する登録キーワードは、処理対象とする第Nページのページデータより1つ前の第(N−1)ページのページデータからキーワード抽出部25によって抽出されたキーワードとするようにしたが、文書の最初の第1ページのページデータからキーワード抽出部25によって抽出されたキーワードとするようにしてもよいし、第(N−1)ページより前の(N−1)ページのページデータのすべてからキーワード抽出部25によって抽出されたキーワードとするようにしてもよい。単位別判断部33は、所定単位の複数の文字列群別に、1以上の登録キーワードごとの有無を比較部35に出力する。また、登録キーワードを抽出する範囲は、ページデータ単位とするのではなく、ユーザが指定した範囲とするようにしてもよい。例えば、文書データが複数の章で構成される場合、ユーザが指定した章を登録キーワードを抽出する範囲としてもよい。また、後述する整合性の判断する対象となるページデータが含まれる章よりも1以上前の章のうちから予め定められた章、例えば、直前の章、第1章等を、登録キーワードを抽出する範囲としてもよい。   The registered keyword input from the keyword setting unit 27 to the unit-specific determination unit 33 is included in the keyword extracted from the page data of the (N−1) th page by the keyword extraction unit 25. However, N is an integer of 2 or more. The registered keywords for which the unit-specific determination unit 33 determines the presence / absence are extracted by the keyword extraction unit 25 from the page data of the (N-1) th page before the page data of the Nth page to be processed. Although it is set as a keyword, it may be set as a keyword extracted by the keyword extraction unit 25 from page data of the first first page of the document, or (N−) before the (N−1) th page. 1) The keyword extracted by the keyword extracting unit 25 from all the page data of the page may be used. The unit determining unit 33 outputs the presence / absence of one or more registered keywords to the comparing unit 35 for each of a plurality of character string groups of a predetermined unit. Further, the range for extracting the registered keyword may be a range designated by the user, instead of a page data unit. For example, when the document data is composed of a plurality of chapters, the chapter specified by the user may be used as a range for extracting registered keywords. In addition, registered keywords are extracted from chapters that are determined in advance from chapters including one or more chapters including page data to be checked for consistency, which will be described later, for example, the immediately preceding chapter, the first chapter, and the like. It is good also as a range to do.

比較部35は、単位別判断部33から所定単位の複数の文字列群別に、1以上の登録キーワードごとの有無が入力され、重要度設定部29から1以上の登録キーワードそれぞれに対応する重要度が入力される。比較部35は、単位別判断部33から入力される所定単位の複数の文字列群別の1以上の登録キーワードごとの有無に基づいて、1以上の登録キーワードごとに、該登録キーワードを含まない文字列群が連続する回数の最大値を算出し、算出された値を、予め定められたしきい値と比較する。しきい値は、重要度に対応して予め定められた値である。比較部35は、登録キーワードを含まない文字列群が連続する回数の最大値がしきい値以上ならば文書データが整合していないと判断し、しきい値より小さければ文書データが整合していると判断する。比較部35は、文書データが整合していないと判断する場合、警告部37に警告指示を出力する。警告指示は、文書データが整合していないと判断した登録キーワードと重要度との組を含む。   The comparison unit 35 receives the presence / absence of one or more registered keywords for each of a plurality of character string groups of a predetermined unit from the unit-specific determination unit 33, and the importance level corresponding to each of the one or more registered keywords from the importance level setting unit 29 Is entered. The comparison unit 35 does not include the registered keyword for each of the one or more registered keywords based on the presence / absence of the one or more registered keywords for each of the plurality of character string groups of the predetermined unit input from the unit-specific determination unit 33. A maximum value of the number of consecutive character string groups is calculated, and the calculated value is compared with a predetermined threshold value. The threshold value is a predetermined value corresponding to the importance. The comparison unit 35 determines that the document data does not match if the maximum number of consecutive character string groups that do not include the registered keyword is greater than or equal to the threshold, and if the value is less than the threshold, the document data matches. Judge that When the comparison unit 35 determines that the document data is not consistent, the comparison unit 35 outputs a warning instruction to the warning unit 37. The warning instruction includes a set of a registered keyword and importance determined that the document data is not consistent.

比較部35が、登録キーワードを含まない文字列群が連続する回数の最大値を算出する範囲は、処理対象とするページデータ単位としてもよいし、ユーザが指定した範囲としてもよい。特に、文書データが複数の章で構成される場合は、比較部35は、ページデータが生成されるごとに、そのページデータが含まれる章と同じ章のすべてのページデータを範囲として登録キーワードを含まない文字列群が連続する回数の最大値を算出する。このため、ユーザが文書データを生成している途中で、整合しているか否かを判断することができる。なお、以下の説明では、比較部35が、登録キーワードを含まない文字列群が連続する回数の最大値を算出する範囲は、処理対象とするページデータ単位として説明する。この場合には、ユーザが文書データを生成している途中で、ページデータを生成するごとに、ページデータが前のページデータと整合しているか否かを判断することができる。   The range in which the comparison unit 35 calculates the maximum value of the number of consecutive character string groups that do not include the registered keyword may be a page data unit to be processed or a range specified by the user. In particular, when the document data is composed of a plurality of chapters, each time the page data is generated, the comparison unit 35 sets a registered keyword as a range for all the page data of the same chapter as the chapter including the page data. The maximum value of the number of consecutive character string groups not included is calculated. Therefore, it is possible to determine whether or not the user is in the middle of generating the document data. In the following description, the range in which the comparison unit 35 calculates the maximum number of consecutive character string groups that do not include a registered keyword will be described as a page data unit to be processed. In this case, it is possible to determine whether the page data is consistent with the previous page data each time the page data is generated while the user is generating the document data.

重要度が「重要度3」に対して、しきい値は、複数の文字列群の数と同じ値である。換言すれば、そのページデータ中に含まれてなければ文書データに整合しないと判断し、ページデータ中に1つでも含まれていれば文書データに整合していると判断する。重要度が「重要度2」に対して、しきい値は「4」である。換言すれば、そのページデータ中で連続する4つ以上の文字列群に登録キーワードが含まれていない場合に、文書データに整合していないと判断し、登録キーワードを含まない文字列群が連続する数が3以下ならば文書データに整合していると判断する。重要度が「重要度1」に対して、しきい値は「1」である。換言すれば、そのページデータ中のすべての文字列群に登録キーワードが含まれていない場合に、文書データに整合していないと判断し、すべての文字列群に登録キーワードが含まれていれば文書データに整合していると判断する。   For the importance level “importance level 3”, the threshold value is the same as the number of character string groups. In other words, if it is not included in the page data, it is determined that it is not consistent with the document data, and if even one is included in the page data, it is determined that it is consistent with the document data. The threshold is “4” for the importance “importance 2”. In other words, when the registered keyword is not included in four or more consecutive character string groups in the page data, it is determined that the document data does not match, and the character string group that does not include the registered keyword is continuous. If the number to be performed is 3 or less, it is determined that the document data is consistent. The threshold is “1” for the importance “importance 1”. In other words, if the registered keyword is not included in all character strings in the page data, it is determined that the document data is not consistent, and if the registered keyword is included in all character strings. Judged to be consistent with the document data.

警告部37は、比較部35から警告指示が入力されると、文書データが整合していないことをユーザに通知する。具体的には、表示部117にメッセージを表示する。メッセージは、警告指示に含まれる登録キーワードと重要度とを含む。また、メッセージを音声合成して音声で通知するようにしてもよい。   When a warning instruction is input from the comparison unit 35, the warning unit 37 notifies the user that the document data is not consistent. Specifically, a message is displayed on the display unit 117. The message includes the registered keyword and importance included in the warning instruction. Further, the message may be synthesized by voice and notified by voice.

図5は、ページデータの一例を示す図である。図5を参照して、ページデータは、それぞれが「KM機は」で始まる第1文〜第4文の4つの文を含む。   FIG. 5 is a diagram illustrating an example of page data. Referring to FIG. 5, the page data includes four sentences, the first sentence to the fourth sentence, each starting with “KM machine is”.

図6は、ページデータ中における文別に登録キーワードごとの有無を示すテーブルである。図6を参照して、テーブルは、図5に示したページデータ中における4つの文別に3つの登録キーワードごとの有無を示す。より詳細には、テーブルは、第1〜第4文ごとに、登録キーワード「KM」、「高画質」および「他社」それぞれが含まれる場合に「0」を、含まれない場合に「1」を示す。最大値のレコードは、登録キーワード「KM」、「高画質」および「他社」ごとに、登録キーワードを含まない文が連続する回数の最大値を示している。図5に示すページデータにおいて、登録キーワード「KM」を含まない文が連続する回数の最大値は「0」であり、登録キーワード「高画質」を含まない文が連続する回数の最大値は「3」であり、登録キーワード「他社」を含まない文が連続する回数の最大値は「4」である。登録キーワード「KM」、「高画質」および「他社」それぞれに対する重要度は、「重要度1」、「重要度3」および「重要度2」である。登録キーワード「KM」を含まない文が連続する回数の最大値「0」は「重要度1」に対するしきい値「1」より小さく、登録キーワード「高画質」を含まない文が連続する回数の最大値「3」は「重要度3」に対するしきい値「4」より小さい。したがって、登録キーワード「KM」および「高画質」に対しては、文書データは整合していると判断される。一方、登録キーワード「他社」を含まない文が連続する回数の最大値「4」は重要度「重要度2」に対するしきい値「3」より大きい。したがって、登録キーワード「他社」に対しては、文書データは整合していないと判断され、登録キーワード「他社」と重要度「重要度2」とを含むメッセージ、例えば「重要度2のキーワード「他社」が使われていません。」を表示部117が表示される。   FIG. 6 is a table showing the presence / absence of each registered keyword for each sentence in the page data. Referring to FIG. 6, the table shows the presence / absence of each of the three registered keywords for each of four sentences in the page data shown in FIG. More specifically, the table includes “0” when the registered keywords “KM”, “high image quality”, and “other company” are included for each of the first to fourth sentences, and “1” when the registered keywords are not included. Indicates. The record of the maximum value indicates the maximum value of the number of consecutive sentences that do not include the registered keyword for each of the registered keywords “KM”, “high image quality”, and “other company”. In the page data shown in FIG. 5, the maximum number of consecutive sentences without the registered keyword “KM” is “0”, and the maximum number of consecutive sentences without the registered keyword “high quality” is “0”. 3 ”, and the maximum number of consecutive sentences without the registered keyword“ other company ”is“ 4 ”. The importance levels for the registered keywords “KM”, “high image quality”, and “other companies” are “importance 1”, “importance 3”, and “importance 2”, respectively. The maximum value “0” of the number of consecutive sentences that do not include the registered keyword “KM” is smaller than the threshold value “1” for the “importance 1”, and the number of consecutive sentences that do not include the registered keyword “high quality”. The maximum value “3” is smaller than the threshold value “4” for “importance 3”. Therefore, it is determined that the document data is consistent with the registered keywords “KM” and “high image quality”. On the other hand, the maximum value “4” of the number of consecutive sentences not including the registered keyword “other company” is larger than the threshold “3” for the importance “importance 2”. Accordingly, it is determined that the document data is not consistent with the registered keyword “other company”, and a message including the registered keyword “other company” and the importance “importance 2”, for example, the “importance 2 keyword“ other company ” "Is not used. "Is displayed on the display unit 117.

図7は、編集支援処理の流れの一例を示すフローチャートである。編集支援処理は、CPU101がROM103またはメモリカード108に記憶された編集支援プログラムを実行することにより、CPU101により実行される処理である。図7を参照して、CPU101は、変数Nを初期化するために、変数Nに「1」を設定する(ステップS01)。変数Nは、処理対象とするページデータのページ番号を特定するための値である。   FIG. 7 is a flowchart illustrating an example of the flow of editing support processing. The editing support process is a process executed by the CPU 101 when the CPU 101 executes an editing support program stored in the ROM 103 or the memory card 108. Referring to FIG. 7, CPU 101 sets “1” in variable N in order to initialize variable N (step S01). The variable N is a value for specifying the page number of the page data to be processed.

次のステップS02においては、キーセンテンスを受け付けたか否かを判断する(ステップS02)。キーセンテンスを受け付けたならば処理をステップS03に進めるが、そうでなければ処理をステップS09に進める。ステップS09においては、本文を受け付けたか否かを判断する。ページデータの文字列を構成する本文を受け付けたならば処理をステップS10に進めるが、そうでなければ処理をステップS19に進める。ステップS10においては、本文として受け付けられた文字列を第Nページのページデータに設定し、処理をステップS11に進める。   In the next step S02, it is determined whether or not a key sentence has been accepted (step S02). If the key sentence is accepted, the process proceeds to step S03; otherwise, the process proceeds to step S09. In step S09, it is determined whether a text has been accepted. If the text constituting the character string of the page data is accepted, the process proceeds to step S10. If not, the process proceeds to step S19. In step S10, the character string accepted as the text is set as page data of the Nth page, and the process proceeds to step S11.

ステップS03においては、キーセンテンスから検索ワードを抽出する。キーセンテンスは、1以上の単語を含む文であり、その文から検索ワードとして予め登録された単語に該当するものを抽出する。   In step S03, a search word is extracted from the key sentence. The key sentence is a sentence including one or more words, and a sentence corresponding to a word registered in advance as a search word is extracted from the sentence.

ステップS04においては、ステップS03において抽出された検索ワードで検索し、コンテンツを取得する。具体的には、検索ワードを含む検索要求を通信I/F111を介して検索サーバ211に送信する。検索サーバ211は、検索要求を受信すると、インターネット3上に公開された膨大な量のコンテンツのうちから検索ワードを含む1以上のコンテンツを抽出し、1以上のコンテンツを予め定められた優先順位で並び換えて、PC100に返信する。そして、通信I/F111が検索サーバ211から検索結果である1以上のコンテンツを受信すると、通信I/F111から1以上のコンテンツを取得する。なお、検索ワードを含む検索要求をファイルサーバ201またはMFP221に送信するようにしてもよい。この場合は、ファイルサーバ201またはMFP221から送信されるコンテンツを取得する。   In step S04, the search word extracted in step S03 is searched for content. Specifically, a search request including a search word is transmitted to the search server 211 via the communication I / F 111. When the search server 211 receives the search request, the search server 211 extracts one or more contents including the search word from the enormous amount of contents disclosed on the Internet 3, and the one or more contents are determined in a predetermined priority order. Rearrange and return to PC100. When the communication I / F 111 receives one or more contents as search results from the search server 211, the communication I / F 111 acquires one or more contents from the communication I / F 111. Note that a search request including a search word may be transmitted to the file server 201 or the MFP 221. In this case, the content transmitted from the file server 201 or the MFP 221 is acquired.

次のステップS05においては、検索サーバ211から取得されたコンテンツの優先順位が上位から3つのコンテンツを抽出する。そして、3つのコンテンツを1画面で表示する(ステップS06)。次のステップS07においては、3つのコンテンツのいずれかを選択する操作を受け付けたか否かを判断する。3つのコンテンツのいずれかを選択する操作を受け付けたならば、処理をステップS08に進めるが、そうでなければ処理をステップS02に戻す。   In the next step S05, the three contents with the highest priority of the contents acquired from the search server 211 are extracted. Then, the three contents are displayed on one screen (step S06). In the next step S07, it is determined whether or not an operation for selecting one of the three contents has been accepted. If an operation for selecting any of the three contents is accepted, the process proceeds to step S08; otherwise, the process returns to step S02.

処理がステップS08に進む場合、ステップS02において受け付けられたキーセンテンスに基づいて抽出された3つのコンテンツのうちから1つがユーザにより選択される。ステップS08においては、ステップS07において選択されたコンテンツを第Nページのページデータに設定し、処理をステップS11に進める。   When the process proceeds to step S08, one of the three contents extracted based on the key sentence accepted in step S02 is selected by the user. In step S08, the content selected in step S07 is set as the page data of the Nth page, and the process proceeds to step S11.

ステップS11においては、第Nページのページデータからキーワードを抽出する。第Nページのページデータが予めキーワードとして定められた単語を複数含む場合には、複数のキーワードを抽出する。次のステップS12においては、変数Nが「2」以上か否かを判断する。変数Nが2以上ならば処理をステップS13に進めるが、そうでなければ処理をステップS15に進める。換言すれば、処理対象とするページデータが第1ページならばステップS13〜ステップS14の処理を実行しないが、処理対象とするページデータが第2ページ以降ならばステップS13〜ステップS14の処理を実行する。   In step S11, keywords are extracted from the page data of the Nth page. When the page data of the Nth page includes a plurality of words defined as keywords in advance, a plurality of keywords are extracted. In the next step S12, it is determined whether or not the variable N is “2” or more. If variable N is 2 or greater, the process proceeds to step S13; otherwise, the process proceeds to step S15. In other words, if the page data to be processed is the first page, the processing of steps S13 to S14 is not executed, but if the page data to be processed is the second page or later, the processing of steps S13 to S14 is executed. To do.

まず、変数Nが「1」で処理対象とするページデータが第1ページの場合の処理を説明する。ステップS15において、ステップS11において抽出されたキーワードを登録キーワードに設定する。次ぎに、重要度設定指示を受け付けたか否かを判断する(ステップS16)。重要度設定指示を受け付けたならば処理をステップS17に進めるが、そうでなければステップS17をスキップして、処理をステップS18に進める。ステップS17においては、図4に示した重要度設定画面を表示部117に表示し、ユーザが操作部115に入力する操作に従って、登録キーワードに対応する重要度を設定する。なお、ステップS16において、重要度設定指示を受け付けない場合は、登録キーワードに対応する重要度を、デフォルトの値に設定し、処理をステップS18に進める。ここでは、重要度のデフォルトの値を「重要度2」としている。   First, a process when the variable N is “1” and the page data to be processed is the first page will be described. In step S15, the keyword extracted in step S11 is set as a registered keyword. Next, it is determined whether or not an importance setting instruction has been received (step S16). If an importance setting instruction is accepted, the process proceeds to step S17. If not, step S17 is skipped and the process proceeds to step S18. In step S <b> 17, the importance level setting screen shown in FIG. 4 is displayed on the display unit 117, and the importance level corresponding to the registered keyword is set according to the operation input to the operation unit 115 by the user. If no importance setting instruction is accepted in step S16, the importance corresponding to the registered keyword is set to a default value, and the process proceeds to step S18. Here, the default value of importance is “importance 2”.

ステップS18においては、変数Nをそれに1を加算した値に設定し、処理をステップS19に進める。ステップS19においては、終了指示を受け付けたか否かを判断する。終了指示を受け付けたならば処理をステップS20に進めるが、そうでなければ処理をステップS02に戻す。操作部115が備える終了指示が予め割り当てられたキーをユーザが押下すると、終了指示を受け付ける。   In step S18, the variable N is set to a value obtained by adding 1 to the variable N, and the process proceeds to step S19. In step S19, it is determined whether an end instruction has been accepted. If an end instruction is accepted, the process proceeds to step S20. If not, the process returns to step S02. When the user presses a key to which an end instruction provided in operation unit 115 is assigned in advance, the end instruction is accepted.

次に、ステップS12において、処理対象となるページデータが第2ページ以降と判断された場合の処理について説明する。処理がステップS12に進む場合、第(N−1)ページのページデータを処理対象として、ステップS15〜ステップS17が実行され、登録キーワードと重要度とが設定されている。ステップS12およびステップS13の処理は、第(N−1)ページのページデータに基づいて設定された登録キーワードと重要度とを用いる。   Next, a process when it is determined in step S12 that the page data to be processed is the second page or later will be described. When the process proceeds to step S12, step S15 to step S17 are executed with the page data of the (N-1) th page as the processing target, and the registered keyword and importance are set. The process of step S12 and step S13 uses the registered keyword and importance set based on the page data of the (N-1) th page.

ステップS12において、変数Nが2以上と判断される場合は、ステップS13において、整合性判断処理を実行し、処理をステップS14に進める。整合性判断処理の詳細は後述するが、処理対象となる第Nページのページデータに含まれるキーワードに基づいて、第Nページのページデータが、前のページページデータと整合しているか否かを判断する処理である。   If it is determined in step S12 that the variable N is 2 or more, a consistency determination process is executed in step S13, and the process proceeds to step S14. Although details of the consistency determination process will be described later, whether or not the page data of the Nth page is consistent with the previous page page data based on the keyword included in the page data of the Nth page to be processed. It is a process to judge.

ステップS14においては、ステップS13において実行された整合性判断処理の結果によって処理を分岐させる。整合性判断処理の結果が、整合していることを示す場合は処理をステップS15に進め、整合していないことを示す場合は処理をステップS21に進める。ステップS22においては、警告して処理をステップS02に戻す。警告の具体例は、整合していないと判断された登録キーワードと重要度とを含むメッセージを表示部117に表示する。   In step S14, the process branches depending on the result of the consistency determination process executed in step S13. If the result of the consistency determination process indicates that it is consistent, the process proceeds to step S15, and if it indicates that it is not consistent, the process proceeds to step S21. In step S22, a warning is given and the process returns to step S02. As a specific example of the warning, a message including the registered keyword determined to be inconsistent and the importance is displayed on the display unit 117.

図8は、整合性判断処理の流れの一例を示すフローチャートである。整合性判断処理は、図7のステップS13において実行される処理であり、第Nページのページデータを処理対象とする。図8を参照して、CPU101は、第(N−1)ページのページデータから抽出された登録キーワードのうちから1つを選択する(ステップS31)。そして、変数M、Cを初期化するために、変数Mに「1」を設定し、変数Cに「0」を設定する(ステップS32)。変数Mは、処理対象とする第Nページのページデータに含まれる文の番号を示す値である。変数Cは、登録キーワードが含まれない文が連続する数をカウントするための変数である。   FIG. 8 is a flowchart illustrating an example of the flow of consistency determination processing. The consistency determination process is a process executed in step S13 of FIG. 7, and the page data of the Nth page is a processing target. Referring to FIG. 8, CPU 101 selects one of the registered keywords extracted from the page data of the (N−1) th page (step S31). Then, in order to initialize the variables M and C, “1” is set to the variable M, and “0” is set to the variable C (step S32). The variable M is a value indicating the number of a sentence included in the page data of the Nth page to be processed. The variable C is a variable for counting the number of consecutive sentences that do not include the registered keyword.

ステップS33においては、第M文に登録キーワードが含まれるか否かを判断する。第M文に登録キーワードが含まれるならば処理をステップS34に進め、そうでなければ処理をステップS35に進める。ステップS34においては、変数Cに「0」を設定し、処理をステップS36に進める。一方、ステップS35においては、変数Cをそれに「1」を加算した値に設定し、処理をステップS36に進める。   In step S33, it is determined whether or not a registered keyword is included in the Mth sentence. If the registered keyword is included in the Mth sentence, the process proceeds to step S34; otherwise, the process proceeds to step S35. In step S34, "0" is set to variable C, and the process proceeds to step S36. On the other hand, in step S35, the variable C is set to a value obtained by adding “1” thereto, and the process proceeds to step S36.

ステップS36においては、処理対象とする第Nページのページデータ中に、いまだ選択されていない文が存在するか否かを判断する。未処理の文が存在するならば処理をステップS37に進めるが、そうでなければ処理をステップS38に進める。ステップS37においは、変数Mをそれに「1」を加算した値に設定し、処理をステップS33に戻す。   In step S36, it is determined whether there is a sentence that has not yet been selected in the page data of the Nth page to be processed. If there is an unprocessed sentence, the process proceeds to step S37; otherwise, the process proceeds to step S38. In step S37, the variable M is set to a value obtained by adding “1” thereto, and the process returns to step S33.

ステップS38においては、登録キーワードに対応する重要度を取得する。そして、取得された重要度に対応して予め定められたしきい値を取得する(ステップS39)。次のステップS40においては、変数Cがしきい値以上か否かを判断する。変数Cがしきい値以上ならば処理をステップS41に進めるが、そうでなければ処理をステップS42に進める。ステップS41においては、返り値に「不整合」を設定し、処理を編集支援処理に戻す。   In step S38, the importance corresponding to the registered keyword is acquired. Then, a predetermined threshold corresponding to the acquired importance is acquired (step S39). In the next step S40, it is determined whether or not the variable C is equal to or greater than a threshold value. If variable C is equal to or greater than the threshold value, the process proceeds to step S41; otherwise, the process proceeds to step S42. In step S41, “unmatched” is set as the return value, and the process returns to the editing support process.

ステップS42においては、登録キーワードのうちに、処理対象としていない登録キーワードが存在するか否かを判断する。未処理の登録キーワードが存在しなければ処理をステップS44に進めるが、存在すれば処理をステップS43に進める。ステップS43においては、次の登録キーワードを選択し、処理をステップS32に戻す。一方、ステップS44においては、返り値に「整合」を設定し、処理を編集支援処理に戻す。   In step S42, it is determined whether there is a registered keyword that is not a processing target among the registered keywords. If there is no unprocessed registered keyword, the process proceeds to step S44, but if present, the process proceeds to step S43. In step S43, the next registered keyword is selected, and the process returns to step S32. On the other hand, in step S44, “match” is set as the return value, and the process returns to the editing support process.

以上説明したように、本実施の形態におけるPCは、編集支援装置として機能し、ユーザが入力したキーセンテンスに基づいてページデータを生成し、生成された1以上のページデータを含む文書データを生成し、HDD107に記憶する。キーセンテンスに基づいてインターネットなどを検索して得られるコンテンツをページデータに設定するので、文書データを容易に生成することができる。また、文書データを生成する過程において、生成されたページデータからキーワードを抽出して登録キーワードに設定する。そして、次にキーセンテンスに基づいて生成される新たなページデータにおいて、登録キーワードが出現したか否かに基づいて文書データの整合性を判定し、不整合と判定される場合、警告する。このため、過去に生成されたページデータに含まれるキーワードと同じキーワードをこれらか生成されるページデータに含めることができる。その結果、文書データに含まれる複数のページ間を整合させることができる。   As described above, the PC according to the present embodiment functions as an editing support device, generates page data based on a key sentence input by a user, and generates document data including one or more generated page data. And stored in the HDD 107. Since the content obtained by searching the Internet or the like based on the key sentence is set as page data, document data can be easily generated. Further, in the process of generating document data, keywords are extracted from the generated page data and set as registered keywords. Next, in the new page data generated based on the key sentence, the consistency of the document data is determined based on whether or not the registered keyword appears, and a warning is given if it is determined as inconsistent. For this reason, the same keyword as the keyword included in the page data generated in the past can be included in the generated page data. As a result, a plurality of pages included in the document data can be matched.

さらに、生成される新たなページデータを構成する複数の文(所定単位の文字列群)ごとに、登録キーワードが含まれるか否かを判断し、登録キーワードを含まない文が連続する回数をしきい値と比較することによって、整合性を判断する。このため、複数のページ間の整合を容易に判断することができる。   Further, it is determined whether or not a registered keyword is included for each of a plurality of sentences (a character string group of a predetermined unit) constituting the new page data to be generated, and the number of consecutive sentences not including the registered keyword is determined. Consistency is judged by comparing with a threshold value. For this reason, it is possible to easily determine matching between a plurality of pages.

さらに、登録キーワードに重要度を設定し、登録キーワードを含まないページが連続する数が、重要度に対して予め定められたしきい値以上ならば整合していないと判断する。このため、整合しているか否かを容易に判断することができる。   Further, the importance level is set for the registered keyword, and if the number of consecutive pages that do not include the registered keyword is equal to or greater than a predetermined threshold with respect to the importance level, it is determined that there is no match. For this reason, it can be easily determined whether or not they are consistent.

さらに、登録キーワードが設定された後に、生成される1以上の新たなページデータにおいて、1以上の登録キーワードそれぞれが出現したか否かに基づいて、複数のページデータからなる文書データの整合性を判定する。たとえば、文書データが複数の章で構成される場合、登録キーワードを抽出する章を、新たに生成されるページデータが属する章より前の章のうちからユーザが選択する場合、ユーザが選択した章とこれから生成する章とを整合させることができる。また、登録キーワードを抽出する章を、新たに生成されるページデータが属する章の直前の章、または最初の第1章に自動的に設定するようにしてもよい。   Furthermore, after the registration keyword is set, the consistency of the document data composed of a plurality of page data is determined based on whether or not each of the one or more registration keywords appears in the one or more new page data to be generated. judge. For example, when the document data is composed of a plurality of chapters, when the user selects a chapter from which a registered keyword is extracted from chapters before the newly generated page data belongs, the chapter selected by the user is selected. And the chapter to be generated can be matched. Also, the chapter from which the registered keyword is extracted may be automatically set to the chapter immediately before the chapter to which the newly generated page data belongs or the first chapter.

さらに、新たなページデータが生成される場合、新たなページデータよりも1つ前に生成されたページデータから抽出されたキーワードで登録キーワードを更新し、新たなページデータにおいて、登録キーワードが出現したか否かに基づいて、文書データの整合性を判定するようにしてもよい。この場合、ページデータを1つ前のページデータを整合させることができ、総合的に、文書データ全体を整合させることができる。   Further, when new page data is generated, the registered keyword is updated with a keyword extracted from the page data generated immediately before the new page data, and the registered keyword appears in the new page data. Whether or not the document data is consistent may be determined based on whether or not it is. In this case, the page data can be matched with the previous page data, and the entire document data can be matched comprehensively.

なお、上述した実施の形態においては、編集支援装置の一例としてPC100を説明したが、図7および図8に記載した処理をPC100に実行させる編集支援方法またはその編集支援方法をPC100を制御するCPU101に実行させるための編集支援プログラムとして発明を捉えることができるのは言うまでもない。   In the above-described embodiment, the PC 100 has been described as an example of the editing support apparatus. However, the CPU 101 that controls the PC 100 for the editing support method that causes the PC 100 to execute the processes described in FIGS. It goes without saying that the invention can be understood as an editing support program for causing the computer to execute the program.

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。   The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

<付記>
(1) 前記キーワード設定手段は、前記ページデータ生成手段により生成される新たなページデータが生成される場合、前記新たなページデータよりも1つ前に生成されたページデータから抽出されたキーワードで、前記登録キーワードを更新し、
前記判定手段は、前記ページデータ生成手段により生成される新たなページデータにおいて、前記1以上の登録キーワードそれぞれが出現したか否かに基づいて、前記ページデータ生成手段により生成される複数のページデータの整合性を判定する、請求項1〜3のいずれかに記載の編集支援装置。
<Appendix>
(1) When the new page data generated by the page data generation unit is generated, the keyword setting unit is a keyword extracted from the page data generated immediately before the new page data. , Update the registered keyword,
The determination means includes a plurality of page data generated by the page data generation means based on whether or not each of the one or more registered keywords appears in new page data generated by the page data generation means. The editing support apparatus according to any one of claims 1 to 3, wherein the consistency is determined.

この局面に従えば、1以上の新たなページデータを、それらより前のページデータと整合させることができる。   According to this aspect, one or more new page data can be matched with previous page data.

1 情報処理システム、2 ネットワーク、3 インターネット、11 キーセンテンス受付部、13 音声入力部、15 音声認識部、17 ページデータ生成部、19 検索ワード抽出部、21 コンテンツ取得部、23 選択部、25 キーワード抽出部、27 キーワード設定部、29 重要度設定部、31 判定部、33 単位別判別部、35 比較部、37 警告部、100 PC、101 CPU、103 ROM、105 RAM、107 HDD、108 メモリカード、109 カードI/F、111 通信I/F、113 ユーザインターフェース、115 操作部、117 表示部、119 外部I/F、120 バス、121 マイクロホン、201 ファイルサーバ、211 検索サーバ。   DESCRIPTION OF SYMBOLS 1 Information processing system 2 Network 3 Internet 11 Key sentence reception part 13 Voice input part 15 Voice recognition part 17 Page data generation part 19 Search word extraction part 21 Content acquisition part 23 Selection part 25 Keyword Extraction unit, 27 Keyword setting unit, 29 Importance setting unit, 31 Determination unit, 33 Unit-specific determination unit, 35 Comparison unit, 37 Warning unit, 100 PC, 101 CPU, 103 ROM, 105 RAM, 107 HDD, 108 Memory card , 109 card I / F, 111 communication I / F, 113 user interface, 115 operation unit, 117 display unit, 119 external I / F, 120 bus, 121 microphone, 201 file server, 211 search server.

Claims (8)

外部から入力されるキーセンテンスを受け付けるキーセンテンス受付手段と、
前記受け付けられたキーセンテンスに基づいてページデータを生成するページデータ生成手段と、
前記ページデータ生成手段により生成されるページデータから所定の条件に適合する文字列をキーワードとして抽出するキーワード抽出手段と、
前記キーワード抽出手段により抽出された少なくとも1つのキーワードのうちから選択された1以上を登録キーワードに設定するキーワード設定手段と、
前記登録キーワードが設定された後に、前記ページデータ生成手段により生成される新たなページデータにおいて、前記1以上の登録キーワードそれぞれが出現したか否かに基づいて、前記ページデータ生成手段により生成される複数のページデータの整合性を判定する判定手段と、
前記判定手段により不整合と判定される場合、警告する警告手段と、を備えた編集支援装置。
A key sentence receiving means for receiving a key sentence input from the outside;
Page data generating means for generating page data based on the accepted key sentence;
Keyword extracting means for extracting a character string that meets a predetermined condition from the page data generated by the page data generating means as a keyword;
Keyword setting means for setting one or more selected from at least one keyword extracted by the keyword extracting means as registered keywords;
After the registration keyword is set, the page data generation unit generates the page data based on whether or not each of the one or more registration keywords appears in new page data generated by the page data generation unit. Determining means for determining the consistency of a plurality of page data;
An editing support apparatus comprising: a warning unit that warns when the determination unit determines that inconsistency occurs.
前記判定手段は、前記ページデータ生成手段により生成される新たなページデータを構成する所定単位の文字列群ごとに、前記1以上の登録キーワードそれぞれが含まれるか否かを判断する単位別判断手段と、
前記1以上の登録キーワードごとに、該登録キーワードを含まない文字列群が連続する回数をしきい値と比較する比較手段と、を含む請求項1に記載の編集支援装置。
The determination unit determines whether or not each of the one or more registered keywords is included for each character string group of a predetermined unit constituting new page data generated by the page data generation unit. When,
The editing support apparatus according to claim 1, further comprising: a comparison unit that compares, for each of the one or more registered keywords, the number of consecutive character string groups that do not include the registered keyword with a threshold value.
前記1以上の登録キーワードそれぞれに重要度を設定する重要度設定手段を、さらに備え、
前記比較手段が比較するしきい値は、前記重要度に対して予め定められた値である、請求項2に記載の編集支援装置。
An importance setting means for setting the importance for each of the one or more registered keywords,
The editing support apparatus according to claim 2, wherein the threshold value to be compared by the comparison unit is a value predetermined for the importance.
前記判定手段は、前記登録キーワードが設定された後に、前記ページデータ生成手段により生成される1以上の新たなページデータにおいて、前記1以上の登録キーワードそれぞれが出現したか否かに基づいて、前記ページデータ生成手段により生成される複数のページデータの整合性を判定する、請求項1〜3のいずれかに記載の編集支援装置。   The determination means, based on whether each of the one or more registered keywords appears in one or more new page data generated by the page data generation means after the registration keyword is set, The editing support apparatus according to claim 1, wherein consistency of a plurality of page data generated by the page data generation unit is determined. 前記ページデータ生成手段は、前記キーセンテンス受付手段により受け付けられたキーセンテンスから1以上の検索ワードを抽出する検索ワード抽出手段と、
前記抽出された1以上の検索ワードが抽出されると、前記検索ワードを用いてデータベースを検索し、1以上のコンテンツを取得するコンテンツ取得手段と、
前記コンテンツ取得手段により取得された1以上のコンテンツのうちから少なくとも1つをページデータに選択する選択手段と、を含む、請求項1〜4のいずれかに記載の編集支援装置。
The page data generation means includes search word extraction means for extracting one or more search words from the key sentence received by the key sentence reception means;
When the extracted one or more search words are extracted, a content acquisition unit that searches a database using the search words and acquires one or more contents;
The editing support apparatus according to claim 1, further comprising selection means for selecting at least one of the one or more contents acquired by the content acquisition means as page data.
前記キーセンテンス受付手段は、
音声が入力される音声入力手段と、
前記入力された音声を音声認識する音声認識手段と、を含む、請求項1〜5のいずれかに記載の編集支援装置。
The key sentence receiving means is:
Voice input means for inputting voice;
The editing support apparatus according to claim 1, further comprising: a voice recognition unit that recognizes the input voice.
外部から入力されるキーセンテンスを受け付けるステップと、
前記受け付けられたキーセンテンスに基づいてページデータを生成するステップと、
前記生成されるページデータから所定の条件に適合する文字列をキーワードとして抽出するステップと、
前記抽出された少なくとも1つのキーワードのうちから選択された1以上を登録キーワードに設定するステップと、
前記登録キーワードが設定された後に、前記ページデータを生成するステップにおいて生成される新たなページデータにおいて、前記1以上の登録キーワードそれぞれが出現したか否かに基づいて、前記ページデータを生成するステップにおいて生成される複数のページデータの整合性を判定するステップと、
前記判定するステップにおいて不整合と判定される場合、警告するステップと、を含む編集支援方法。
A step of accepting an externally input key sentence;
Generating page data based on the accepted key sentence;
Extracting a character string that meets a predetermined condition from the generated page data as a keyword;
Setting one or more selected from the extracted at least one keyword as a registered keyword;
The step of generating the page data based on whether or not each of the one or more registered keywords appears in the new page data generated in the step of generating the page data after the registration keyword is set. Determining the consistency of a plurality of page data generated in
An editing support method, comprising: a warning step when it is determined inconsistent in the determining step.
外部から入力されるキーセンテンスを受け付けるステップと、
前記受け付けられたキーセンテンスに基づいてページデータを生成するステップと、
前記生成されるページデータから所定の条件に適合する文字列をキーワードとして抽出するステップと、
前記抽出された少なくとも1つのキーワードのうちから選択された1以上を登録キーワードに設定するステップと、
前記登録キーワードが設定された後に、前記ページデータを生成するステップにおいて生成される新たなページデータにおいて、前記1以上の登録キーワードそれぞれが出現したか否かに基づいて、前記ページデータを生成するステップにおいて生成される複数のページデータの整合性を判定するステップと、
前記判定するステップにおいて不整合と判定される場合、警告するステップと、をコンピュータに実行させる編集支援プログラム。
A step of accepting an externally input key sentence;
Generating page data based on the accepted key sentence;
Extracting a character string that meets a predetermined condition from the generated page data as a keyword;
Setting one or more selected from the extracted at least one keyword as a registered keyword;
The step of generating the page data based on whether or not each of the one or more registered keywords appears in the new page data generated in the step of generating the page data after the registration keyword is set. Determining the consistency of a plurality of page data generated in
An editing support program for causing a computer to execute a warning step when it is determined that there is an inconsistency in the determining step.
JP2011002746A 2011-01-11 2011-01-11 Editing support apparatus, editing support method and editing support program Pending JP2012146047A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011002746A JP2012146047A (en) 2011-01-11 2011-01-11 Editing support apparatus, editing support method and editing support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011002746A JP2012146047A (en) 2011-01-11 2011-01-11 Editing support apparatus, editing support method and editing support program

Publications (1)

Publication Number Publication Date
JP2012146047A true JP2012146047A (en) 2012-08-02

Family

ID=46789562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011002746A Pending JP2012146047A (en) 2011-01-11 2011-01-11 Editing support apparatus, editing support method and editing support program

Country Status (1)

Country Link
JP (1) JP2012146047A (en)

Similar Documents

Publication Publication Date Title
CN106688035B (en) Speech synthesis device and speech synthesis method
US7386793B2 (en) Apparatus, method and program for supporting a review
JP2008192055A (en) Content search method and content search apparatus
US8850359B2 (en) Image processor and image processing method
US20110231430A1 (en) Content collecting apparatus, content collecting method, and non-transitory computer-readable recording medium encoded with content collecting program
CN112860642A (en) Court trial data processing method, server and terminal
JP2006350477A (en) File management device, its control method, computer program, and computer readable storage medium
JP4289038B2 (en) Image reading apparatus, data management apparatus, keyword addition program, and data management program
JP2007114942A (en) Metadata generation apparatus and metadata generation method
JP2006072744A (en) Document processor, control method therefor, program and storage medium
JP2011065255A (en) Data processing apparatus, data name generation method and computer program
KR102643902B1 (en) Apparatus for managing minutes and method thereof
JP2012133619A (en) Document edition device, document edition method and document edition program
JP2012146047A (en) Editing support apparatus, editing support method and editing support program
JP2005258592A (en) Format conversion device and file search device
JP7259403B2 (en) Information processing device and program
US20140156593A1 (en) Information processing apparatus, information processing method, and program
US20220075930A1 (en) Document search system and document search method
JP4344207B2 (en) Document search device, document search method, document search program, and recording medium
JP2008017050A (en) Conferenecing system and conferencing method
JP2001147922A (en) Device and method for managing document and storage medium
JP2008269085A (en) Information recommendation device and information recommendation system
JP2007026263A (en) Character recognition device and computer program
JP2024015704A (en) Search device, search method, computer program and model generation device
JP2013084215A (en) Information processing device, expert retrieval method and expert retrieval method program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20130417