JP2005301432A - Latest information providing method, system, and program - Google Patents
Latest information providing method, system, and program Download PDFInfo
- Publication number
- JP2005301432A JP2005301432A JP2004113357A JP2004113357A JP2005301432A JP 2005301432 A JP2005301432 A JP 2005301432A JP 2004113357 A JP2004113357 A JP 2004113357A JP 2004113357 A JP2004113357 A JP 2004113357A JP 2005301432 A JP2005301432 A JP 2005301432A
- Authority
- JP
- Japan
- Prior art keywords
- category
- document information
- keyword
- period
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、最新情報提供方法及びシステム及びプログラムに係り、特に、インターネット等のネットワークに接続された1つ以上の情報提供サーバで公開されている文書情報から最新情報を取得し、収集した文書情報からカテゴリ毎にキーワードを抽出して表示する
最新情報提供方法及びシステム及びプログラムに関する。
The present invention relates to a latest information providing method, system, and program, and in particular, obtains and collects latest information from document information published on one or more information providing servers connected to a network such as the Internet. The present invention relates to a latest information providing method, system, and program for extracting and displaying keywords for each category.
詳しくは、利用者により選択されたキーワードを含む文書をキーワードに付随するカテゴリおよび時間情報により限定して表示することが可能な最新情報提供方法及びシステム及びプログラムに関する。 More specifically, the present invention relates to a latest information providing method, system, and program capable of displaying a document including a keyword selected by a user in a limited manner by category and time information associated with the keyword.
近年、インターネットなどのコンピュータネットワークの発達に伴い、大量の電子化された文書情報が次々と蓄積され続けている。そのため、現在から数時間あるいは数日の間に作成・更新された文書情報は、現在の世間の話題や関心事、新しい出来事などのタイムリーな情報を含んでいる可能性が高い。従って、作成・更新時刻の新しい文書情報を数多く収集して解析すれば、最新の話題や出来事を把握することが可能となる。 In recent years, with the development of computer networks such as the Internet, a large amount of electronic document information has been accumulated one after another. Therefore, the document information created / updated for several hours or days from now is likely to contain timely information such as current public topics, interests, and new events. Therefore, by collecting and analyzing a lot of new document information with creation / update times, it becomes possible to grasp the latest topics and events.
従来、複数の情報提供サーバから発信された情報を、話題毎のカテゴリで分類し、その話題の時間遷移を提示・検索する情報潮流検索方法が提案されている(例えば、特許文献1参照)。この情報潮流検索方法では、ある期間において発信された文書集合から類似した記事同士を集めカテゴリに割り当てられるという処理を行っている。そのため、カテゴリを割り当てられた文書を提示することはできるが、カテゴリを割り当てられなかった文書を提示することができない。また、類似する記事が複数発信されてからしかカテゴリが割り当てられないため、話題となる情報が初めて発信されてから時間が経過した後でしか話題を提示することができない
前述のように従来の技術では、カテゴリを割り当てられた文書情報しか提供できず、カテゴリを割り当てるほど文書数がない時点において、これから話題になる可能性がある最新の情報をいち早く提供することができない。 As described above, the conventional technology can only provide document information to which a category is assigned, and at the time when there are not enough documents to assign a category, it is not possible to provide the latest information that may become a topic in the future. .
本発明は、上記の点に鑑みなされたもので、最新かつ、カテゴリが限定された精度の高い文書情報を提供することが可能な最新情報提供方法及びシステム及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and an object thereof is to provide a latest information providing method, system, and program capable of providing the latest and highly accurate document information with limited categories. .
図1は、本発明の原理を説明するための図である。 FIG. 1 is a diagram for explaining the principle of the present invention.
本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供方法において、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップ(ステップ1)と、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップ(ステップ2)と、
表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップ(ステップ3)と、
検索した文書情報を並べたリストを表示手段に表示する表示ステップ(ステップ4)と、からなる。
The present invention provides a latest information providing method for presenting keywords by category extracted from the latest information.
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step (step 1) for storing in the keyword storage means in association with the designated period;
A keyword search step (step 2) of searching for a keyword corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period is document information. A document information retrieval step (step 3) for retrieving from the storage means;
A display step (step 4) for displaying on the display means a list in which the retrieved document information is arranged.
また、本発明の最新情報提供方法において、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に行う。 In the latest information providing method of the present invention, the document information is collected, the collected document information is classified into a predefined category, and the category and the time information of the document information are stored in the document information storage unit. The information collection step is performed before the keyword extraction step.
本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供方法において、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップと、
文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を表示手段に表示する表示ステップとからなる。
The present invention provides a latest information providing method for presenting keywords by category extracted from the latest information.
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. A document information search step for searching from the information storage means;
It includes a display step of displaying a list in which the document information searched in the document information search step is arranged in descending order of the category matching degree, or displaying the document information having the highest category matching degree on the display means.
また、本発明の最新情報提供方法は、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に行い、
文書情報収集ステップにおいて、
収集した文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
カテゴリ一致度が閾値以上のカテゴリを、文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを文書情報の時間情報と共に、文書情報蓄積手段に蓄積するステップと、を行う。
Also, the latest information providing method of the present invention collects document information, classifies the collected document information into a predefined category, and stores the category and time information of the document information in a document information storage unit. Perform the information gathering step before the keyword extraction step,
In the document information collection step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of document information;
The step of accumulating the determined category and the category matching degree for the category together with the time information of the document information in the document information accumulating unit is performed.
また、上記のキーワード検索ステップにおいて、
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、表示手段に表示するステップと、を行う。
In the above keyword search step,
Searching a keyword set corresponding to a plurality of periods;
Displaying a category-specific keyword set on a display means for each period;
When one period is selected from a plurality of periods, a step of obtaining a category-specific keyword set corresponding to the selected period and displaying it on the display means is performed.
また、上記のキーワード検索ステップにおいて、
期間が入力されると、該期間に対応するキーワード集合をキーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に表示手段に表示するステップと、を行う。
In the above keyword search step,
When a period is inputted, a keyword set corresponding to the period is searched from the keyword storage means;
Displaying the retrieved keyword set on the display means by category.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供装置100であって、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段103から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段106に蓄積するキーワード抽出手段105と、
キーワード記憶手段106に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段200に表示するキーワード検索手段107と、
表示手段200に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段103から検索する文書情報検索手段108と、
検索した文書情報を並べたリストを表示手段に表示する表示制御手段110と、を有する。
The present invention is a latest
A document information set is acquired by specifying a period from the document
A
When one keyword is selected from the keywords displayed on the
Display control means 110 for displaying a list of searched document information on the display means.
また、本発明の最新情報提供装置100は、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段103に蓄積する文書情報収集手段を更に有する。
The latest
本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供装置であって、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出手段と、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索手段と、
表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索手段と、
文書情報検索手段で検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を表示手段に表示する表示制御手段と、を有する。
The present invention is a latest information providing apparatus for presenting keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Keyword extracting means for storing in the keyword storage means in association with the specified period;
A keyword search means for searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. Document information search means for searching from the information storage means;
Display control means for displaying a list in which the document information searched by the document information search means is arranged in descending order of category matching degree, or displaying document information having the highest category matching degree on the display means.
また、上記の最新情報提供装置は、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集手段を、更に有し、
文書情報収集手段は、
収集した文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出する手段と、
カテゴリ一致度が閾値以上のカテゴリを、文書情報のカテゴリに決定する手段と、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを文書情報の時間情報と共に、文書情報蓄積手段に蓄積する手段と、を有する。
The latest information providing apparatus collects document information, classifies the collected document information into a predefined category, and stores the category and time information of the document information in a document information storage unit. A collecting means;
Document information collection means
When classifying the collected document information into predefined categories,
Means for calculating the category match for each category;
Means for determining a category having a category matching degree equal to or higher than a threshold as a category of document information;
Means for storing the determined category and the category matching degree for the category together with the time information of the document information in the document information storage means.
また、本発明のキーワード検索手段は、
複数の期間に対応したキーワード集合を検索する手段と、
期間毎にカテゴリ別キーワード集合を表示手段に表示する手段と、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、表示手段に表示する手段と、を有する。
The keyword search means of the present invention includes:
Means for searching a keyword set corresponding to a plurality of periods;
Means for displaying a category-specific keyword set on a display means for each period;
When one period is selected from a plurality of periods, a category-specific keyword set corresponding to the selected period is acquired and displayed on the display means.
また、本発明のキーワード検索手段は、
期間が入力されると、該期間に対応するキーワード集合をキーワード記憶手段から検索する手段と、
検索されたキーワード集合をカテゴリ別に表示手段に表示する手段と、を有する。
The keyword search means of the present invention includes:
When a period is input, means for retrieving a keyword set corresponding to the period from the keyword storage means;
Means for displaying the retrieved keyword set on a display means by category.
本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供プログラムであって、
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップと、
検索した文書情報を並べたリストを表示手段に表示する表示ステップと、
を実行させる。
The present invention is a latest information providing program for presenting keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period is document information. A document information search step for searching from the storage means;
A display step of displaying a list of searched document information on a display means;
Is executed.
また、上記の最新情報提供プログラムは、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に実行させる。 The latest information providing program collects document information, classifies the collected document information into predefined categories, and stores the category information and time information of the document information in the document information storage unit. The collecting step is executed before the keyword extracting step.
本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供プログラムであって、
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップと、
文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を表示手段に表示する表示ステップと、を実行させる。
The present invention is a latest information providing program for presenting keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. A document information search step for searching from the information storage means;
A display step of displaying a list in which the document information searched in the document information search step is arranged in descending order of the category matching degree, or displaying the document information having the highest category matching degree on the display unit.
また、上記の最新情報提供プログラムは、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に実行させ、
文書情報収集ステップにおいて、
収集した文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
カテゴリ一致度が閾値以上のカテゴリを、文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを文書情報の時間情報と共に、文書情報蓄積手段に蓄積するステップと、を実行させる。
The latest information providing program collects document information, classifies the collected document information into predefined categories, and stores the category information and time information of the document information in the document information storage unit. Let the collection step run before the keyword extraction step,
In the document information collection step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of document information;
Storing the determined category and the category matching degree for the category together with the time information of the document information in the document information storage unit.
また、本発明のキーワード検索ステップにおいて、
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、表示手段に表示するステップと、を実行させる。
In the keyword search step of the present invention,
Searching a keyword set corresponding to a plurality of periods;
Displaying a category-specific keyword set on a display means for each period;
When one period is selected from a plurality of periods, a category-specific keyword set corresponding to the selected period is acquired and displayed on the display means.
また、本発明のキーワード検索ステップにおいて、
期間が入力されると、該期間に対応するキーワード集合をキーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に表示手段に表示するステップと、を実行させる。
In the keyword search step of the present invention,
When a period is inputted, a keyword set corresponding to the period is searched from the keyword storage means;
Displaying the retrieved keyword set on the display means by category.
上述のように、本発明では、最新の情報から抽出したカテゴリ別のキーワードを提示する際に、ユーザが興味のあるキーワードを選択すると、最新かつカテゴリが限定された精度の高い文書情報を提供することが可能となる。 As described above, in the present invention, when presenting a keyword for each category extracted from the latest information, when the user selects a keyword of interest, the latest and highly accurate document information with a limited category is provided. It becomes possible.
さらに、表示する期間を選択あるいは、入力することで、期間に対応したカテゴリ別キーワードを表示し、キーワードの中から1つのキーワードを選択すると、表示した期間において最新であった過去の文書情報を精度よく提供することができる。 Furthermore, by selecting or inputting the period to be displayed, keywords for each category corresponding to the period are displayed, and when one keyword is selected from the keywords, the past document information that was the latest in the displayed period is accurately displayed. Can be provided well.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1の実施の形態]
図3は、本発明の第1の実施の形態における最新情報提供システムの構成を示す。
[First embodiment]
FIG. 3 shows the configuration of the latest information providing system in the first embodiment of the present invention.
同図に示す最新情報提供システムは、文書情報収集部101、カテゴリ分類部102、文書情報蓄積部103、カテゴリ情報蓄積部104、キーワード抽出部105、キーワード蓄積部106、キーワード検索部107、文書情報検索部108、提供情報生成処理部109、表示部110、入力部111を有する最新情報提供装置100と、出力装置200、入力装置300から構成される。
The latest information providing system shown in FIG. 1 includes a document
文書情報収集部101は、インターネット等のネットワークに接続された1つ以上の情報提供サーバ(図示せず)から、新しく生成された文書情報や更新された文書情報を収集し、作成日時や更新日時などの時間情報を取得し、文書情報蓄積部103に記録する。
The document
カテゴリ分類部102は、文書情報収集部101で収集した文書情報を、予め決められたカテゴリに自動分類を行い、文書情報のカテゴリを文書情報蓄積部103に記録する。
The
カテゴリ情報蓄積部104は、カテゴリ分類部102でカテゴリの自動分類を行う際に利用する学習済みパラメータやカテゴリの名前を蓄積しておく。
The category
キーワード抽出部105は、一定周期で時間情報の期間を指定して、文書情報蓄積部103から指定した期間に一致する文書情報集合を取得し、取得された文書情報集合から、カテゴリ毎に各カテゴリを特徴付けるキーワードを抽出し、指定された期間と対応付けてキーワード蓄積部106に蓄積する。
The
キーワード検索部107は、期間を入力とし、入力された期間に対応するキーワードをキーワード蓄積部106から検索し、検索結果としてカテゴリ別キーワード集合を出力する。
The
文書情報検索部108は、キーワード、期間、カテゴリを入力とし、入力されたキーワードを含む文書情報で、かつ期間とカテゴリが一致する文書情報を検索し、検索結果として文書情報集合を出力する。
The document
提供情報生成処理部109は、定期的に最新期間のカテゴリ別キーワード集合を生成する。また、表示部110に表示データを送り、表示を指示し、入力部111からユーザ入力を受け付け、ユーザ入力に応じた処理を行う。表示部110に表示を指示するデータは、カテゴリ別キーワード集合、文書情報のリスト及び文書情報である。
The provided information
表示部110は、提供情報生成部109から表示を指示されたデータの出力装置200への表示を制御する。
The
入力部111は、入力装置300から得られたユーザからの入力を制御し、ユーザ入力を、提供情報生成処理部109に通知する。
The
次に、図4を用いて上記の構成における動作を説明する。 Next, the operation in the above configuration will be described with reference to FIG.
図4は、本発明の第1の実施の形態における最新情報提供処理のフローチャートである。 FIG. 4 is a flowchart of the latest information providing process in the first embodiment of the present invention.
ステップ101) 文書情報収集部101は、情報提供サーバや文書情報の保存先に応じて、収集を行う周期を定めた収集スケジュールを持ち、スケジュールに従い情報提供サーバ(図示せず)に接続し、公開されている文書情報の中から、新しく作成された文書情報や更新された文書情報を収集し、時間情報を取得する。
Step 101) The document
なお、収集の際に、作成日時や更新日時などの文書情報の属性が取得できる場合は、取得した作成日時あるいは更新日時が前回収集した時刻よりも新しい文書情報のみを収集し、作成日時あるいは更新日時を文書情報の時間情報とする。文書情報の作成日時や更新日時などの属性が取得できない場合は、前回収集した文書情報と比較し、内容に変化があった場合に今回収集した日時を時間情報とする。また、文書情報中に日時を示す文字情報、例えば、「DATE」、「LastUpdate」、「更新日時」などがあるか調べ、ある場合はその文字周辺の日時を抽出し、時間情報としてもよい。このようにして収集された文書情報や、文書情報の時間情報と共に、文書情報蓄積部103に蓄積する。
If document information attributes such as creation date and update date can be acquired at the time of collection, only the document information whose acquired creation date or update date is newer than the last collection time is collected, and the creation date or update date is updated. Let the date and time be the time information of the document information. When attributes such as the creation date and update date and time of document information cannot be acquired, the date and time collected this time are used as time information when there is a change in the contents compared with the previously collected document information. Further, it is checked whether there is character information indicating the date / time in the document information, for example, “DATE”, “LastUpdate”, “update date / time”, and if there is, the date / time around the character may be extracted and used as time information. The document information collected in this way and the time information of the document information are stored in the document
ステップ102) 次に、カテゴリ分類部102は、文書情報収集部101で収集した文書情報を、予め決められたカテゴリに自動分類を行う。文書情報の自動カテゴリ分類技術は、文献「Ueda, N. and Saito, K., “Parametric mixture models for multi-topic text," Neural Information Processing Systems 15(NIPS15),2002」に記載された従来技術を利用するものとする。
Step 102) Next, the
以下に、上記の従来技術の処理概要を簡単に説明する。まず、カテゴリが既知の文書情報集合を機械に学習させ、学習させた機械を用いて未知の文書情報がどのカテゴリに属するかを予測する。この予測処理が自動カテゴリ分類処理に該当する。 Below, the outline of the processing of the above-described prior art will be briefly described. First, a machine learns a set of document information with a known category, and a category to which unknown document information belongs is predicted using the learned machine. This prediction process corresponds to the automatic category classification process.
カテゴリ分類する各文書情報を、全文書情報集合中に出現した単語の頻度ベクトルで表す。文書情報集合に出現する単語集合W={w1,…,wv}、単語wiが文書情報Dn中に出現した回数をXn,iとすると、文書情報Dnの単語の頻度ベクトルは以下のように表すことができる。 Each document information to be classified into categories is represented by a frequency vector of words that appear in the entire document information set. If the word set W = {w 1 ,..., W v } appearing in the document information set and the number of times the word w i appears in the document information D n is X n, i , the word frequency vector of the document information D n Can be expressed as:
Xn=(Xn,1,…,Xn,v)
ここで、vは、文書情報中に出現した単語の総数である。
Xn = ( Xn, 1 , ..., Xn, v )
Here, v is the total number of words that appear in the document information.
カテゴリの総数をLとし、文書情報Dnが属するカテゴリを示すカテゴリベクトルを
Yn=(Yn,1,…,Yn,L)
で表すこととする。ここで、Yn,kは、文書情報Dnが第Kカテゴリに属するとき1の値、属さない時0の値をとる。また、各文書は少なくとも1つのカテゴリに属する。
The total number of categories is L, and the category vector indicating the category to which the document information D n belongs is Y n = (Y n, 1 ,..., Y n, L ).
It shall be expressed as Here, Y n, k takes a value of 1 when the document information D n belongs to the Kth category, and takes a value of 0 when it does not belong. Each document belongs to at least one category.
まず、カテゴリが既知の文書情報集合D={(Xn,Yn)}(N=1〜N)からXnのカテゴリがYnとなるように機械に学習させる。 First, the category is known document information set D = {(X n, Y n)} (N = 1~N) category X n is to learn the machine such that Y n from.
学習によって得られるパラメータはカテゴリ蓄積部104に蓄積しておく。
Parameters obtained by learning are stored in the
次に、この機械を用いてカテゴリが未知の文書情報D*に対してX*からY*を求める。予測で計算されるカテゴリベクトルY*=(Y*,1,…,Y*,L)のY*,kが、文書情報D*が、第Kカテゴリに属するかどうかを示す。 Next, using this machine, Y * is obtained from X * for document information D * whose category is unknown. Y *, k of the category vector Y * = (Y *, 1 ,..., Y *, L ) calculated by prediction indicates whether the document information D * belongs to the Kth category.
ステップ103) 上記で説明したカテゴリ分類技術を用い、文書情報蓄積部103から取得した文書集合の各文書情報について、カテゴリベクトルY*を計算し、文書情報が属するカテゴリを決定し、図5に示すように文書情報蓄積部103に蓄積する。
Step 103) Using the category classification technique described above, the category vector Y * is calculated for each piece of document information of the document set acquired from the document
ステップ104) キーワード抽出部105は、一定の周期で文書情報蓄積部103から時間情報の期間を指定し、指定した期間に一致する文書情報集合を取得し、取得された文書情報集合から、カテゴリ毎に各カテゴリを特徴付けるキーワードを抽出する。ここで、「期間」とは、開始時刻から始まり、終了時刻までを指すものとし、一定の周期毎に指定する期間は連続的に重なりのないように指定する例を説明する。
Step 104) The
キーワード抽出部105が処理を行う一定の周期と文書情報蓄積部103から文書情報を取得する際に指定する期間を同じ時間長とし、文書情報収集部101が文書情報の収集を行う最短の周期以上の時間長とする。例えば、最短30分周期で文書情報収集部101がネットワーク上の情報配信サーバ(図示せず)から文書情報を収集できる場合、キーワード抽出部105は、30分の周期で処理を開始し、『45分前の時刻から15分前の時刻まで』、といったように30分の時間長となる期間を指定する。ここで、期間の終了時刻を15分前の時刻としたのは、文書情報収集部101及びカテゴリ分類部102の処理に要する時間が最長15分であり、文書情報蓄積部103に蓄積されている最新の情報は、15分前の時刻情報を持つ文書情報であるためである。
The fixed period in which the
このように、文書情報収集部101及びカテゴリ分類部102で処理に要する十分な時間T0を予め測定しておき、キーワード抽出部105で、文書情報を収集する期間を指定する際には、終了時刻を現在の時刻よりT0時間前の時刻に設定するようにする。
As described above, when the document
上記のように最短の30分周期でキーワード抽出処理を行うと、最新の情報をできるだけ早くユーザに提供することが可能となる。しかし、ある程度情報をまとめてから提示したい場合は、より長い期間(例えば、1日)を設定してもよい。 If the keyword extraction process is performed in the shortest 30-minute cycle as described above, the latest information can be provided to the user as soon as possible. However, if the information is to be presented after being collected to some extent, a longer period (for example, one day) may be set.
カテゴリを特徴付けるキーワードの選択方法としては、tf−idf値を利用する方法がある。 As a method for selecting a keyword that characterizes a category, there is a method that uses a tf-idf value.
tf(term frequency)は、あるテキストにおける語の出現回数を表し、idf(inverse document frequency)は、df(document frequency:語が出現するテキストの数)の逆数で、語t、テキスト数Nの場合、次のように定義される。 tf (term frequency) represents the number of occurrences of a word in a certain text, and idf (inverse document frequency) is the inverse of df (document frequency: the number of texts in which the word appears). Is defined as follows.
idf(t)=log(N/df(t))
if-idf値は、前述のtfとidfの積をとったものであり、次のように定義され、値が大きいほど、特定のテキストにおいてのみ出現回数が多いという特性を持つ。
idf (t) = log (N / df (t))
The if-idf value is a product of the above-described tf and idf, and is defined as follows. The larger the value, the more frequently it appears in a specific text.
tf-idf(t)=tf(t)*idf(t)=tf(t)・log(N/df(t))
上記の説明において、テキストをカテゴリに置き換えてit-idf値を算出し、値の大きい上位P個の語を抽出すると、特定のカテゴリにおいてのみ出現回数の多い語(=キーワード)が抽出できる。
tf-idf (t) = tf (t) * idf (t) = tf (t) ・ log (N / df (t))
In the above description, it is possible to extract words (= keywords) having a high appearance frequency only in a specific category by calculating the it-idf value by replacing the text with the category and extracting the top P words having the largest value.
ステップ105) 抽出した複数のキーワードは、文書情報蓄積部103から文書情報を取得する際に指定した期間と共に、図6に示すようにキーワード蓄積部106に蓄積する。例えば、「2004/2/20 10:00:00〜10:29:59」という期間を指定して文書情報を取得する場合、文書IDが「00000001」と「0000002」の2文書が取得できる。取得した文書からキーワード「ヘリ墜落」701を抽出したとすると、キーワード「ヘリ墜落」と開始時刻「2004/02/20 10:00:00」702、及び終了時刻「2004/02/20 10:29:59」703とを対応させてキーワード蓄積部106に蓄積する。
Step 105) The plurality of extracted keywords are stored in the
ステップ106) 提供情報生成処理部109は、定期的にキーワード検索部107に対して最新の期間を指定してキーワード検索を依頼し、キーワード検索部107から検索結果のカテゴリ別キーワード集合を受け取る。
Step 106) The provided information
ステップ107) 受け取ったカテゴリ別キーワード集合と期間とを表示部110に送り、表示部110は、提供情報生成処理部109から受け取ったカテゴリ別キーワード集合と期間を出力装置200に表示する。
Step 107) The received category keyword set and period are sent to the
キーワード検索部107に指定した最新の期間は、キーワード抽出部105が文書情報蓄積部103から文書情報を取得する際に指定した最新の期間とする。最新の期間は、キーワード抽出部105から提供情報生成部109に通知するように構成する。図7にカテゴリ別キーワード集合の表示例を示す。表示される内容としては、カテゴリ別キーワード集合の期間201、カテゴリの名前202、それぞれのカテゴリに属するキーワード集合203である。ここで、期間201は、「2004/2/20 10:00:00-10:30:00」と記載しているが、キーワード蓄積部106に蓄積されている期間の終了時刻は、「2004/2/20/ 10:29:59」であり、ユーザに読み易い表示を行うために、終了時刻を「10:15:00」と記載している。
The latest period specified in the
ステップ108) 次に、ユーザが出力装置200に表示されたキーワードの1つを入力装置300から選択する。
Step 108) Next, the user selects one of the keywords displayed on the
ステップ109) 入力部111は、ユーザにより選択されたキーワードに対応する、期間、カテゴリを取得し、キーワードと共に、提供情報生成処理部109に通知する。
Step 109) The
ステップ110) キーワード、期間、カテゴリを通知された提供情報生成処理部109は、文書情報検索部108に、キーワード、期間、カテゴリを入力し、検索を依頼する。文書情報検索部108は、入力されたキーワード含む文書情報で、かつ期間とカテゴリが一致する文書情報を検索し、検索結果として文書情報と時間情報の集合を最新情報生成処理部109に送る。
Step 110) The provided information
ステップ111) 検索結果を受け取った最新情報生成処理部109は、文書情報からタイトル及びキーワードを含む規定文字数以内の文を抽出し、時間情報の新しい順から並べたリストを生成し、表示部110に表示を指示し、表示部110は、出力装置200にリストを表示する。
Step 111) Upon receiving the search result, the latest information
[第2の実施の形態]
本実施の形態では、文書情報蓄積部103にカテゴリ一致度を蓄積し、カテゴリ一致度に基づいてユーザに提供する文書リストや文書情報を制御することについて説明する。
[Second Embodiment]
In the present embodiment, a description will be given of accumulating the category matching degree in the document
システム構成は、前述の第1の実施の形態における図3に示すシステム構成と同様である。 The system configuration is the same as the system configuration shown in FIG. 3 in the first embodiment described above.
図8は、本発明の第2の実施の形態における最新情報提供処理のフローチャートである。以下では、図4に示した第1の実施の形態と異なる処理のみについて説明する。そのため、図4と同様の処理を行う場合には、図4におけるステップ番号を付与し、その説明を省略する。 FIG. 8 is a flowchart of the latest information providing process in the second embodiment of the present invention. In the following, only processing different from the first embodiment shown in FIG. 4 will be described. Therefore, when the same processing as that in FIG. 4 is performed, the step numbers in FIG. 4 are given and the description thereof is omitted.
ステップ202) 前述の第1の実施の形態におけるステップ102では自動分類とは、カテゴリが未知の文書情報D*に対してX*からY*を求める処理であることを説明した。ステップ102では、予測で計算されるカテゴリベクトルY*=(Y*,1,…,Y*,L)は、文書情報D*が、第Kカテゴリに属するとき1の値、属さないとき0の値をとるように出力したが、本実施の形態では、文書情報D*が、第Kカテゴリに属する割合(=カテゴリ一致度)を次のベクトルで出力する。
Step 202) In
Zn=(Zn,1,…,Zn,L)
ここで、Zn,kは、文書情報Dnの第Kカテゴリへのカテゴリ一致度を表し、Zn,k(k=1〜L)を全て加算すると、1となる。Zn,kの値が大きいほど第Kカテゴリに属する割合が高くなる。
Z n = (Z n, 1 , ..., Z n, L )
Here, Z n, k represents the degree of matching of the document information D n with the Kth category, and becomes 1 when all of Z n, k (k = 1 to L) are added. The larger the value of Zn , k, the higher the proportion belonging to the Kth category.
このカテゴリ一致度から、予め閾値を設定しておき、カテゴリ一致度が閾値以上のカテゴリを選択する。 A threshold is set in advance from this category matching degree, and a category having a category matching degree equal to or higher than the threshold is selected.
ステップ203) カテゴリ分類部102は、ステップ202で選択したカテゴリとカテゴリ一致度を、図9に示すように文書情報蓄積部103に蓄積する。
Step 203) The
文書情報蓄積部103の第1の実施の形態における構成例である図5では、各文書情報に対応して自動分類されたカテゴリ501を蓄積しており、第2の実施の形態における構成例である図9では、カテゴリだけでなく、カテゴリ毎のカテゴリ一致度601を蓄積している点において異なる。
In FIG. 5, which is a configuration example of the document
ステップ210) また、最新情報生成処理部109は、ユーザがキーワードを選択した際に入力部111からキーワード、期間、カテゴリを通知されると、文書情報検索部108に、キーワード、期間、カテゴリを入力し検索を依頼する。文書情報検索部108は、入力されたキーワードを含む文書情報で、かつ、期間とカテゴリが一致する文書情報を検索し、検索結果として文書情報、時間情報、カテゴリ一致度の集合を出力し、最新情報生成処理部109に送る。
Step 210) When the user selects a keyword, the latest information
ステップ211) 次に、最新情報生成処理部109は、文書情報のカテゴリ一致度を、高い順から並べたリストを生成して表示部110に表示を指示し、表示部110は出力装置200に文書情報を表示する。
Step 211) Next, the latest information
また、前述の第1の実施の形態のステップ111と同様に、文書情報の時間情報を新しい順から並べたリストを生成して表示することも可能である。 Further, similarly to step 111 of the first embodiment described above, it is also possible to generate and display a list in which time information of document information is arranged in the new order.
[第3の実施の形態]
本実施の形態では、提供情報生成蓄積部109において、複数の期間に対応するカテゴリ別キーワード集合を生成し、ユーザの指示に応じて表示する期間を変更する例を説明する。
[Third Embodiment]
In the present embodiment, an example will be described in which the provided information generation and
図10は、本発明の第3の実施の形態における最新情報提供処理のフローチャートである。同図において、図4のフローチャートと同一の処理を行う部分については、図4のステップ番号と同番号を付与し、その説明を省略する。 FIG. 10 is a flowchart of the latest information providing process in the third embodiment of the present invention. In the figure, the same number as the step number in FIG. 4 is assigned to the same processing as the flowchart in FIG.
ステップ301) 提供情報処理部109は、複数の連続した期間毎に、キーワード検索部107に期間を指定してキーワード検索を依頼し、キーワード検索部107から検索結果のカテゴリ別キーワード集合を受け取る。
Step 301) The provided
ステップ302) 受け取った複数期間のカテゴリ別キーワード集合を表示部110に送り、表示部110は、提供情報生成処理部109から受け取った複数期間のカテゴリ別キーワード集合を期間毎に出力装置200に表示する。初期表示の期間として最新の期間を指定してカテゴリ別キーワードの表示を行う。
Step 302) The received keyword set for each category for a plurality of periods is sent to the
図9は、本発明の第3の実施の形態におけるカテゴリ別キーワード集合の表示例であり、複数期間のカテゴリ別キーワード集合の表示例を示す。表示される内容としては、表示しているカテゴリ別キーワード集合の期間201、カテゴリの名前202、それぞれのカテゴリに属するキーワード集合203、期間選択用ボタン204等である。期間選択用ボタン204は、ユーザが複数の期間を選択するために使用される。
FIG. 9 is a display example of a category-specific keyword set in the third embodiment of the present invention, and shows a display example of a category-specific keyword set for a plurality of periods. The displayed contents are a period 201 of the displayed keyword set by category, a
ステップ303) 次に、ユーザが出力装置200に表示されたキーワードの1つを入力装置300を介して選択する。
Step 303) Next, the user selects one of the keywords displayed on the
ステップ304) 入力部111は、表示されている期間及びユーザにより選択されたキーワードに対応するカテゴリを取得し、キーワードと共に提供情報生成処理部109に通知する。
Step 304) The
ステップ110) キーワード、期間、カテゴリを通知された提供情報生成処理部109は、文書情報検索部108にキーワード、期間、カテゴリを入力し、検索を依頼し、検索結果として、入力されたキーワードを含む文書情報で、かつ期間とカテゴリが一致する文書情報と時間情報の集合を取得する。
Step 110) The provided information
ステップ111) 検索結果を受け取った提供情報生成処理部109は、文書情報からタイトル及びキーワードを含む規定文字数以内の文を抽出し、時間情報の新しい順から並べたリストを生成し、表示部110に表示を指示し、表示部110は、出力装置200にリストを表示する。
Step 111) Upon receiving the search result, the provided information
なお、ここで、文書情報蓄積部103にカテゴリ一致度が含まれる場合には、前述の第2の実施の形態のステップ210,211のように、カテゴリ一致度の高い順に並べたリストや、カテゴリ一致度の最も高い文書情報を表示することも可能である。
Here, when the category information is included in the document
ステップ305) 次に、ユーザが出力装置200に表示された期間選択用ボタン204の1つを選択する。
Step 305) Next, the user selects one of the period selection buttons 204 displayed on the
ステップ306) 入力部111は、選択された期間を取得し、提供情報生成処理部109に通知する。
Step 306) The
ステップ307) 期間を通知された提供情報生成処理部109は、キーワード検索部107に期間を指定してキーワード検索を依頼し、キーワード検索部107から検索結果のカテゴリ別キーワード集合を受け取る。受け取ったカテゴリ別キーワード集合と期間とを表示部110に送り、表示部110は、提供情報生成処理部109から受け取ったカテゴリ別キーワード集合と期間を出力装置200に表示する。
Step 307) The provided information
図10のフローチャートでは、複数の期間別キーワード集合を予め表示部110に送り、表示期間の変更を表示部110で処理したが、表示する1つの期間のカテゴリ別キーワード集合のみを表示部110に送り、表示するように処理してもよい。このように処理する場合、ユーザにより期間が選択された際に、入力部111から提供情報生成処理部109に選択された期間を通知し、提供情報生成処理部109は、通知された期間に対応するカテゴリ別キーワード集合を表示部110に送り、表示を指示する。
In the flowchart of FIG. 10, a plurality of keyword sets by period are sent to the
また、ユーザが期間を直接入力して、表示するカテゴリ別キーワード集合を変更させる場合について以下に説明する。 A case where the user directly inputs the period and changes the category-specific keyword set to be displayed will be described below.
ユーザが入力装置300から期間を入力すると、入力部111は、入力された期間を提供情報生成処理部109に通知する。期間を通知された提供情報生成処理部109は、キーワード検索部107に期間を入力として与える。キーワード検索部107は、期間を入力として、期間に対応するキーワード集合を検索し、提供情報生成処理部109に送る。キーワード集合を受け取った提供情報生成処理部109は、カテゴリ別キーワード集合と期間を表示部110に送り、表示部110は、カテゴリ別キーワード集合と期間を出力装置200に表示する。
When the user inputs a period from the
表示されたカテゴリ別キーワード集合から、ユーザがキーワードを選択すると、表示された期間において最新であり、選択されたキーワードを含む過去の文書情報のリストを表示することができる。あるいは、表示された期間において最新であり、選択されたキーワードを含むカテゴリ一致度が最も高い過去の文書情報を表示することができる。 When the user selects a keyword from the displayed category-specific keyword set, a list of past document information that is the latest in the displayed period and includes the selected keyword can be displayed. Alternatively, it is possible to display the past document information that is the latest in the displayed period and has the highest category matching degree including the selected keyword.
以下、本発明の実施例を図面と共に説明する。 Embodiments of the present invention will be described below with reference to the drawings.
本実施例では、前述の図3に示す最新情報提供装置100を最新情報提供サーバとして利用する例を示す。
In this embodiment, an example in which the latest
図12は、本発明の一実施例の最新情報提供システムの構成を示す。 FIG. 12 shows the configuration of the latest information providing system according to an embodiment of the present invention.
同図に示すシステムは、最新情報提供サーバ1000とクライアント端末2000、情報提供サーバ3000,4000から構成され、これらがネットワーク介して接続されている構成である。
The system shown in the figure includes a latest
最新情報提供サーバ1000と前述の最新情報提供装置100は、ほぼ図3の構成と同様であるが、提供情報生成処理部109と文書情報収集部101は、通信インタフェース部112と接続される。クライアント装置2000は、通信インタフェース部113、表示部110、入力部111、出力装置200、入力装置300を有する。
The latest
なお、図12において、図3と同一構成要素には同一符号を付し、その説明を省略する。 In FIG. 12, the same components as those in FIG. 3 are denoted by the same reference numerals, and the description thereof is omitted.
提供情報生成処理部109は、通信インタフェース112とクライアント端末2000の通信インタフェース部113を介して表示部110及び入力部111と、メッセージ通信を行う。最新情報提供サーバ1000の提供情報生成処理部109からクライアント端末2000の表示部110に送信されるメッセージは表示するデータを指定した表示指示メッセージである。表示するデータは1つの期間に対応するカテゴリ別キーワード集合あるいは、複数期間に対応するカテゴリ別キーワード集合、文書情報リスト、文書情報である。
The provided information
また、クライアント端末2000の入力部111が、提供情報生成処理部109に送信するメッセージは、ユーザがクライアント端末2000の入力装置300を介して選択したキーワードと対応する期間、及びカテゴリを通知するメッセージ、ユーザが選択あるいは、入力した期間を通知するメッセージである。
In addition, the message transmitted from the
本実施例における処理の流れは、図4のステップ107,109,111の処理、及び、図8のステップ211の処理、図10のステップ302,304、306,307の処理において、最新情報提供サーバ1000の通信インタフェース部112と、クライアント端末2000の通信インタフェース部113を介して、メッセージ通信するよう変更した処理と同様であるため、詳細な説明は省略する。
The processing flow in this embodiment is the latest information providing server in the processing in
また、本発明は、上記の実施の形態における図4、図8、図10に示すフローチャートをプログラムとして構築し、最新情報提供装置として利用されるコンピュータにインストールする、または、ネットワーク介してインストールし、当該コンピュータのCPU等の制御手段により実行することも可能である。 Further, the present invention constructs the flowcharts shown in FIG. 4, FIG. 8, and FIG. 10 in the above embodiment as a program and installs it on a computer used as the latest information providing apparatus or installs it via a network. It can also be executed by a control means such as a CPU of the computer.
また、構築されたプログラムを最新情報提供装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスクやCD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際に、コンピュータにインストールすることも可能である。 In addition, when the present invention is implemented by storing the constructed program in a hard disk device connected to a computer used as the latest information providing device, a portable storage medium such as a flexible disk or a CD-ROM, It can also be installed on a computer.
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments and examples, and various modifications and applications can be made within the scope of the claims.
本発明は、情報提供サーバから提供される電子化された大量の文書から最新の情報を取得して提供するシステムに適用可能である。 The present invention can be applied to a system that acquires and provides the latest information from a large amount of digitized documents provided from an information providing server.
100 最新情報提供装置
101 文書情報収集部
102 カテゴリ分類部
103 文書情報蓄積部、文書情報蓄積手段
104 カテゴリ情報蓄積部
105 キーワード抽出部
106 キーワード蓄積部、キーワード記憶手段
107 キーワード検索部、キーワード検索手段
108 文書情報検索部、文書情報検索手段
109 提供情報生成処理部
110 表示部、表示制御手段
111 入力部
112 通信インタフェース部
113 通信インタフェース部
200 出力装置、表示手段
201 表示中の期間
202 カテゴリの名前
203 キーワード集合
300 入力装置、入力手段
501 文書情報蓄積部のカテゴリ
601 文書情報蓄積部のカテゴリとカテゴリ一致度
1000 最新情報提供サーバ
2000 クライアント端末
3000,4000 情報提供サーバ
100 latest
Claims (18)
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出された該キーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
検索した前記文書情報を並べたリストを前記表示手段に表示する表示ステップと、
からなることを特徴とする最新情報提供方法。 In the latest information provision method that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from a document information storage unit in which time information of the category and document information is stored, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Is a keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period A document information search step for searching from the document information storage means;
A display step of displaying on the display means a list in which the retrieved document information is arranged;
The latest information providing method characterized by comprising.
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
前記文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を前記表示手段に表示する表示ステップとからなることを特徴とする最新情報提供方法。 In the latest information provision method that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display unit, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are obtained. A document information search step for searching from the document information storage means;
And displaying a list in which the document information searched in the document information search step is arranged in descending order of the category matching degree, or displaying the document information having the highest category matching degree on the display means. The latest information provision method.
前記文書情報収集ステップにおいて、
収集した前記文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
前記カテゴリ一致度が閾値以上のカテゴリを、前記文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを前記文書情報の時間情報と共に、前記文書情報蓄積手段に蓄積するステップと、を行う請求項3記載の最新情報提供方法。 Collecting document information, classifying the collected document information into predefined categories, and storing the category and time information of the document information in the document information storage means; Done before,
In the document information collecting step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of the document information;
The latest information providing method according to claim 3, wherein the determined category and the category matching degree for the category are stored together with the time information of the document information in the document information storage unit.
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を前記表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、前記表示手段に表示するステップと、を行う請求項1または、3記載の最新情報提供方法。 In the keyword search step,
Searching a keyword set corresponding to a plurality of periods;
Displaying the category-specific keyword set on the display means for each period;
The latest information provision according to claim 1 or 3, wherein when one period is selected from a plurality of periods, a keyword set classified by category corresponding to the selected period is acquired and displayed on the display means. Method.
期間が入力されると、該期間に対応するキーワード集合を前記キーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に前記表示手段に表示するステップと、を行う請求項1または、3記載の最新情報提供方法。 In the keyword search step,
When a period is input, searching the keyword storage means for a keyword set corresponding to the period;
The latest information providing method according to claim 1 or 3, wherein the retrieved keyword set is displayed on the display means by category.
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出手段と、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索手段と、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索手段と、
検索した前記文書情報を並べたリストを前記表示手段に表示する表示制御手段と、
を有することを特徴とする最新情報提供装置。 A latest information providing device that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Keyword extracting means for storing in the keyword storage means in association with the specified period;
Keyword search means for searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period Document information search means for searching from the document information storage means;
Display control means for displaying a list of the searched document information on the display means;
A latest information providing apparatus characterized by comprising:
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出手段と、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索手段と、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索手段と、
前記文書情報検索手段で検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を前記表示手段に表示する表示制御手段と、を有することを特徴とする最新情報提供装置。 A latest information providing device that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Keyword extracting means for storing in the keyword storage means in association with the specified period;
Keyword search means for searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display unit, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are obtained. Document information search means for searching from the document information storage means;
Display control means for displaying a list in which document information searched by the document information search means is arranged in descending order of category matching degree or displaying document information having the highest category matching degree on the display means. The latest information providing device characterized by this.
前記文書情報収集手段は、
収集した前記文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出する手段と、
前記カテゴリ一致度が閾値以上のカテゴリを、前記文書情報のカテゴリに決定する手段と、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを前記文書情報の時間情報と共に、前記文書情報蓄積手段に蓄積する手段と、を有する請求項9記載の最新情報提供装置。 Document information collecting means for collecting document information, classifying the collected document information into a predefined category, and storing the category and time information of the document information in the document information storage means;
The document information collecting means includes
When classifying the collected document information into predefined categories,
Means for calculating the category match for each category;
Means for determining a category having a category matching degree equal to or higher than a threshold as a category of the document information;
The latest information providing apparatus according to claim 9, further comprising: a unit that accumulates the determined category and the category matching degree for the category together with the time information of the document information in the document information accumulation unit.
複数の期間に対応したキーワード集合を検索する手段と、
期間毎にカテゴリ別キーワード集合を前記表示手段に表示する手段と、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、前記表示手段に表示する手段と、を有する請求項7または、9記載の最新情報提供装置。 The keyword search means
Means for searching a keyword set corresponding to a plurality of periods;
Means for displaying a category-specific keyword set on the display means for each period;
10. The latest information provision according to claim 7 or 9, further comprising means for acquiring a keyword set classified by category corresponding to the selected period and displaying it on the display means when one period is selected from a plurality of periods. apparatus.
期間が入力されると、該期間に対応するキーワード集合を前記キーワード記憶手段から検索する手段と、
検索されたキーワード集合をカテゴリ別に前記表示手段に表示する手段と、を有する請求項7または、9記載の最新情報提供装置。 The keyword search means
When a period is input, means for retrieving a keyword set corresponding to the period from the keyword storage means;
10. The latest information providing apparatus according to claim 7 or 9, further comprising: means for displaying the retrieved keyword set by category on the display means.
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
検索した前記文書情報を並べたリストを前記表示手段に表示する表示ステップと、
を実行させることを特徴とする最新情報提供プログラム。 A latest information providing program that presents keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period A document information search step for searching from the document information storage means;
A display step of displaying on the display means a list in which the retrieved document information is arranged;
The latest information provision program characterized by having executed.
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
前記文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を前記表示手段に表示する表示ステップと、を実行させることを特徴とする最新情報提供プログラム。 A latest information providing program that presents keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display unit, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are obtained. A document information search step for searching from the document information storage means;
Displaying a list in which the document information searched in the document information search step is arranged in descending order of category matching degree, or displaying the document information having the highest category matching degree on the display unit. The latest information providing program characterized by this.
前記文書情報収集ステップにおいて、
収集した前記文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
前記カテゴリ一致度が閾値以上のカテゴリを、前記文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを前記文書情報の時間情報と共に、前記文書情報蓄積手段に蓄積するステップと、を実行させる請求項15記載の最新情報提供プログラム。 Collecting document information, classifying the collected document information into predefined categories, and storing the category and time information of the document information in the document information storage means; Run before,
In the document information collecting step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of the document information;
The latest information providing program according to claim 15, wherein the step of storing the determined category and the category matching degree for the category together with the time information of the document information in the document information storage unit is executed.
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を前記表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、前記表示手段に表示するステップと、を実行させる請求項13または、15記載の最新情報提供プログラム。 In the keyword search step,
Searching a keyword set corresponding to a plurality of periods;
Displaying the category-specific keyword set on the display means for each period;
16. The latest information according to claim 13 or 15, wherein, when one period is selected from a plurality of periods, the step of acquiring a category-specific keyword set corresponding to the selected period and displaying it on the display means is performed. Offer program.
期間が入力されると、該期間に対応するキーワード集合を前記キーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に前記表示手段に表示するステップと、を実行させる請求項13または、15記載の最新情報提供プログラム。 In the keyword search step,
When a period is input, searching the keyword storage means for a keyword set corresponding to the period;
The latest information providing program according to claim 13 or 15, wherein a step of displaying the retrieved keyword set on the display means by category is executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004113357A JP2005301432A (en) | 2004-04-07 | 2004-04-07 | Latest information providing method, system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004113357A JP2005301432A (en) | 2004-04-07 | 2004-04-07 | Latest information providing method, system, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005301432A true JP2005301432A (en) | 2005-10-27 |
Family
ID=35332928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004113357A Pending JP2005301432A (en) | 2004-04-07 | 2004-04-07 | Latest information providing method, system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005301432A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010009546A (en) * | 2008-06-30 | 2010-01-14 | Equos Research Co Ltd | Information processor and retrieval device |
KR101271180B1 (en) | 2011-04-19 | 2013-06-04 | 김용덕 | Method for providing social network service through contents search of the message |
JPWO2012039146A1 (en) * | 2010-09-24 | 2014-02-03 | コニカミノルタ株式会社 | Inspection reservation server and inspection reservation system |
JP2014132458A (en) * | 2013-01-04 | 2014-07-17 | Naver Corp | Hot topic keyword related document provision system for mobile terminal apparatus, method and computer readable recording medium |
JP2014222448A (en) * | 2013-05-14 | 2014-11-27 | 株式会社図書館流通センター | Book extraction device, book extraction method, and book extracting program |
JP2018010533A (en) * | 2016-07-14 | 2018-01-18 | Necパーソナルコンピュータ株式会社 | Information processing device, information processing method and program |
-
2004
- 2004-04-07 JP JP2004113357A patent/JP2005301432A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010009546A (en) * | 2008-06-30 | 2010-01-14 | Equos Research Co Ltd | Information processor and retrieval device |
JPWO2012039146A1 (en) * | 2010-09-24 | 2014-02-03 | コニカミノルタ株式会社 | Inspection reservation server and inspection reservation system |
KR101271180B1 (en) | 2011-04-19 | 2013-06-04 | 김용덕 | Method for providing social network service through contents search of the message |
JP2014132458A (en) * | 2013-01-04 | 2014-07-17 | Naver Corp | Hot topic keyword related document provision system for mobile terminal apparatus, method and computer readable recording medium |
JP2014222448A (en) * | 2013-05-14 | 2014-11-27 | 株式会社図書館流通センター | Book extraction device, book extraction method, and book extracting program |
JP2018010533A (en) * | 2016-07-14 | 2018-01-18 | Necパーソナルコンピュータ株式会社 | Information processing device, information processing method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10002189B2 (en) | Method and apparatus for searching using an active ontology | |
JP5224868B2 (en) | Information recommendation device and information recommendation method | |
CN105069103B (en) | Method and system for APP search engine to utilize user comments | |
JP4757016B2 (en) | Document classification program, document classification apparatus, and document classification method | |
US20070016581A1 (en) | Category setting support method and apparatus | |
JP4896268B2 (en) | Information retrieval method and apparatus reflecting information value | |
JP2020135891A (en) | Methods, apparatus, devices and media for providing search suggestions | |
JP4453437B2 (en) | Search keyword ranking method, apparatus and program | |
CN114254158B (en) | Video generation method and device, and neural network training method and device | |
CN110175264A (en) | Construction method, server and the computer readable storage medium of video user portrait | |
JP5228584B2 (en) | Interest information identification system, interest information identification method, and interest information identification program | |
JP2007256992A (en) | Content specifying method and device | |
JP5266975B2 (en) | Personal search system, information processing apparatus, personal search method, program, and recording medium | |
JP4891638B2 (en) | How to classify target data into categories | |
JP2005301432A (en) | Latest information providing method, system, and program | |
JP2006302024A (en) | Relevant document display method and program | |
JP2004070405A (en) | Rumor information extraction device for web page | |
JP2000057090A (en) | Method and device for presenting information by utilizing other group taste information and recording medium recording information presenting program | |
JP2000331020A (en) | Method and device for information reference and storage medium with information reference program stored | |
US20050144179A1 (en) | Method and apparatus for document-analysis, and computer product | |
JP2005267095A (en) | Information display method and device, and information display program | |
JP2010003134A (en) | Server, method, and program for recommending retrieval keyword | |
JP2010282402A (en) | Retrieval system | |
JP2004102818A (en) | Retrieval support method and retrieval support device | |
JP4860439B2 (en) | Automatic question generation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081209 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090116 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090421 |