JP2005301432A - Latest information providing method, system, and program - Google Patents

Latest information providing method, system, and program Download PDF

Info

Publication number
JP2005301432A
JP2005301432A JP2004113357A JP2004113357A JP2005301432A JP 2005301432 A JP2005301432 A JP 2005301432A JP 2004113357 A JP2004113357 A JP 2004113357A JP 2004113357 A JP2004113357 A JP 2004113357A JP 2005301432 A JP2005301432 A JP 2005301432A
Authority
JP
Japan
Prior art keywords
category
document information
keyword
period
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004113357A
Other languages
Japanese (ja)
Inventor
Harumi Kawashima
晴美 川島
Jidai Ohashi
二大 大橋
Yoshihide Sato
吉秀 佐藤
Masakatsu Okubo
雅且 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004113357A priority Critical patent/JP2005301432A/en
Publication of JP2005301432A publication Critical patent/JP2005301432A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide the latest highly precise document information limited in category. <P>SOLUTION: In this method, a set of document information is acquired with designation of a period from a document information storage means storing a category and time information about document information, and a keyword is extracted from the acquired set of document information for each category. The extracted keyword is associated with the designated period to be accumulated in a keyword storage means. A keyword corresponding to the latest period is searched from the accumulated keywords to be displayed in a display means for each category. When one keyword is selected, the period and category of the keyword are acquired, and the document information including the keyword and having matching period and category with the acquired period and category is searched from a document information accumulation means, and then, a list of the document information is displayed. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、最新情報提供方法及びシステム及びプログラムに係り、特に、インターネット等のネットワークに接続された1つ以上の情報提供サーバで公開されている文書情報から最新情報を取得し、収集した文書情報からカテゴリ毎にキーワードを抽出して表示する
最新情報提供方法及びシステム及びプログラムに関する。
The present invention relates to a latest information providing method, system, and program, and in particular, obtains and collects latest information from document information published on one or more information providing servers connected to a network such as the Internet. The present invention relates to a latest information providing method, system, and program for extracting and displaying keywords for each category.

詳しくは、利用者により選択されたキーワードを含む文書をキーワードに付随するカテゴリおよび時間情報により限定して表示することが可能な最新情報提供方法及びシステム及びプログラムに関する。   More specifically, the present invention relates to a latest information providing method, system, and program capable of displaying a document including a keyword selected by a user in a limited manner by category and time information associated with the keyword.

近年、インターネットなどのコンピュータネットワークの発達に伴い、大量の電子化された文書情報が次々と蓄積され続けている。そのため、現在から数時間あるいは数日の間に作成・更新された文書情報は、現在の世間の話題や関心事、新しい出来事などのタイムリーな情報を含んでいる可能性が高い。従って、作成・更新時刻の新しい文書情報を数多く収集して解析すれば、最新の話題や出来事を把握することが可能となる。   In recent years, with the development of computer networks such as the Internet, a large amount of electronic document information has been accumulated one after another. Therefore, the document information created / updated for several hours or days from now is likely to contain timely information such as current public topics, interests, and new events. Therefore, by collecting and analyzing a lot of new document information with creation / update times, it becomes possible to grasp the latest topics and events.

従来、複数の情報提供サーバから発信された情報を、話題毎のカテゴリで分類し、その話題の時間遷移を提示・検索する情報潮流検索方法が提案されている(例えば、特許文献1参照)。この情報潮流検索方法では、ある期間において発信された文書集合から類似した記事同士を集めカテゴリに割り当てられるという処理を行っている。そのため、カテゴリを割り当てられた文書を提示することはできるが、カテゴリを割り当てられなかった文書を提示することができない。また、類似する記事が複数発信されてからしかカテゴリが割り当てられないため、話題となる情報が初めて発信されてから時間が経過した後でしか話題を提示することができない
特開2000−242652
Conventionally, an information flow search method has been proposed in which information transmitted from a plurality of information providing servers is classified into categories for each topic, and the time transition of the topic is presented and searched (for example, see Patent Document 1). In this information flow search method, processing is performed in which similar articles are collected from a document set transmitted in a certain period and assigned to a category. Therefore, although a document to which a category is assigned can be presented, a document to which a category has not been assigned cannot be presented. In addition, since a category is assigned only after a plurality of similar articles are sent out, the topic can be presented only after a lapse of time since the topic information was first sent out.
JP 2000-242652 A

前述のように従来の技術では、カテゴリを割り当てられた文書情報しか提供できず、カテゴリを割り当てるほど文書数がない時点において、これから話題になる可能性がある最新の情報をいち早く提供することができない。   As described above, the conventional technology can only provide document information to which a category is assigned, and at the time when there are not enough documents to assign a category, it is not possible to provide the latest information that may become a topic in the future. .

本発明は、上記の点に鑑みなされたもので、最新かつ、カテゴリが限定された精度の高い文書情報を提供することが可能な最新情報提供方法及びシステム及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and an object thereof is to provide a latest information providing method, system, and program capable of providing the latest and highly accurate document information with limited categories. .

図1は、本発明の原理を説明するための図である。   FIG. 1 is a diagram for explaining the principle of the present invention.

本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供方法において、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップ(ステップ1)と、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップ(ステップ2)と、
表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップ(ステップ3)と、
検索した文書情報を並べたリストを表示手段に表示する表示ステップ(ステップ4)と、からなる。
The present invention provides a latest information providing method for presenting keywords by category extracted from the latest information.
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step (step 1) for storing in the keyword storage means in association with the designated period;
A keyword search step (step 2) of searching for a keyword corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period is document information. A document information retrieval step (step 3) for retrieving from the storage means;
A display step (step 4) for displaying on the display means a list in which the retrieved document information is arranged.

また、本発明の最新情報提供方法において、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に行う。   In the latest information providing method of the present invention, the document information is collected, the collected document information is classified into a predefined category, and the category and the time information of the document information are stored in the document information storage unit. The information collection step is performed before the keyword extraction step.

本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供方法において、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップと、
文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を表示手段に表示する表示ステップとからなる。
The present invention provides a latest information providing method for presenting keywords by category extracted from the latest information.
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. A document information search step for searching from the information storage means;
It includes a display step of displaying a list in which the document information searched in the document information search step is arranged in descending order of the category matching degree, or displaying the document information having the highest category matching degree on the display means.

また、本発明の最新情報提供方法は、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に行い、
文書情報収集ステップにおいて、
収集した文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
カテゴリ一致度が閾値以上のカテゴリを、文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを文書情報の時間情報と共に、文書情報蓄積手段に蓄積するステップと、を行う。
Also, the latest information providing method of the present invention collects document information, classifies the collected document information into a predefined category, and stores the category and time information of the document information in a document information storage unit. Perform the information gathering step before the keyword extraction step,
In the document information collection step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of document information;
The step of accumulating the determined category and the category matching degree for the category together with the time information of the document information in the document information accumulating unit is performed.

また、上記のキーワード検索ステップにおいて、
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、表示手段に表示するステップと、を行う。
In the above keyword search step,
Searching a keyword set corresponding to a plurality of periods;
Displaying a category-specific keyword set on a display means for each period;
When one period is selected from a plurality of periods, a step of obtaining a category-specific keyword set corresponding to the selected period and displaying it on the display means is performed.

また、上記のキーワード検索ステップにおいて、
期間が入力されると、該期間に対応するキーワード集合をキーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に表示手段に表示するステップと、を行う。
In the above keyword search step,
When a period is inputted, a keyword set corresponding to the period is searched from the keyword storage means;
Displaying the retrieved keyword set on the display means by category.

図2は、本発明の原理構成図である。   FIG. 2 is a principle configuration diagram of the present invention.

本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供装置100であって、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段103から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段106に蓄積するキーワード抽出手段105と、
キーワード記憶手段106に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段200に表示するキーワード検索手段107と、
表示手段200に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段103から検索する文書情報検索手段108と、
検索した文書情報を並べたリストを表示手段に表示する表示制御手段110と、を有する。
The present invention is a latest information providing apparatus 100 that presents keywords for each category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit 103 in which the time information of the category and document information is stored, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Is extracted in the keyword storage means 106 in association with the specified period,
A keyword search unit 107 that searches a keyword corresponding to the latest period from the keywords stored in the keyword storage unit 106 and displays the keyword on the display unit 200 by category;
When one keyword is selected from the keywords displayed on the display unit 200, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. Document information search means 108 for searching from the information storage means 103;
Display control means 110 for displaying a list of searched document information on the display means.

また、本発明の最新情報提供装置100は、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段103に蓄積する文書情報収集手段を更に有する。   The latest information providing apparatus 100 of the present invention collects document information, classifies the collected document information into predefined categories, and accumulates the categories and time information of the document information in the document information storage unit 103. And a document information collecting means.

本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供装置であって、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出手段と、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索手段と、
表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索手段と、
文書情報検索手段で検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を表示手段に表示する表示制御手段と、を有する。
The present invention is a latest information providing apparatus for presenting keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Keyword extracting means for storing in the keyword storage means in association with the specified period;
A keyword search means for searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. Document information search means for searching from the information storage means;
Display control means for displaying a list in which the document information searched by the document information search means is arranged in descending order of category matching degree, or displaying document information having the highest category matching degree on the display means.

また、上記の最新情報提供装置は、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集手段を、更に有し、
文書情報収集手段は、
収集した文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出する手段と、
カテゴリ一致度が閾値以上のカテゴリを、文書情報のカテゴリに決定する手段と、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを文書情報の時間情報と共に、文書情報蓄積手段に蓄積する手段と、を有する。
The latest information providing apparatus collects document information, classifies the collected document information into a predefined category, and stores the category and time information of the document information in a document information storage unit. A collecting means;
Document information collection means
When classifying the collected document information into predefined categories,
Means for calculating the category match for each category;
Means for determining a category having a category matching degree equal to or higher than a threshold as a category of document information;
Means for storing the determined category and the category matching degree for the category together with the time information of the document information in the document information storage means.

また、本発明のキーワード検索手段は、
複数の期間に対応したキーワード集合を検索する手段と、
期間毎にカテゴリ別キーワード集合を表示手段に表示する手段と、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、表示手段に表示する手段と、を有する。
The keyword search means of the present invention includes:
Means for searching a keyword set corresponding to a plurality of periods;
Means for displaying a category-specific keyword set on a display means for each period;
When one period is selected from a plurality of periods, a category-specific keyword set corresponding to the selected period is acquired and displayed on the display means.

また、本発明のキーワード検索手段は、
期間が入力されると、該期間に対応するキーワード集合をキーワード記憶手段から検索する手段と、
検索されたキーワード集合をカテゴリ別に表示手段に表示する手段と、を有する。
The keyword search means of the present invention includes:
When a period is input, means for retrieving a keyword set corresponding to the period from the keyword storage means;
Means for displaying the retrieved keyword set on a display means by category.

本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供プログラムであって、
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップと、
検索した文書情報を並べたリストを表示手段に表示する表示ステップと、
を実行させる。
The present invention is a latest information providing program for presenting keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period is document information. A document information search step for searching from the storage means;
A display step of displaying a list of searched document information on a display means;
Is executed.

また、上記の最新情報提供プログラムは、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に実行させる。   The latest information providing program collects document information, classifies the collected document information into predefined categories, and stores the category information and time information of the document information in the document information storage unit. The collecting step is executed before the keyword extracting step.

本発明は、最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供プログラムであって、
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
キーワード記憶手段に蓄積されたキーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を文書情報蓄積手段から検索する文書情報検索ステップと、
文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を表示手段に表示する表示ステップと、を実行させる。
The present invention is a latest information providing program for presenting keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are documented. A document information search step for searching from the information storage means;
A display step of displaying a list in which the document information searched in the document information search step is arranged in descending order of the category matching degree, or displaying the document information having the highest category matching degree on the display unit.

また、上記の最新情報提供プログラムは、文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを文書情報蓄積手段に蓄積する文書情報収集ステップを、キーワード抽出ステップの前に実行させ、
文書情報収集ステップにおいて、
収集した文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
カテゴリ一致度が閾値以上のカテゴリを、文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを文書情報の時間情報と共に、文書情報蓄積手段に蓄積するステップと、を実行させる。
The latest information providing program collects document information, classifies the collected document information into predefined categories, and stores the category information and time information of the document information in the document information storage unit. Let the collection step run before the keyword extraction step,
In the document information collection step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of document information;
Storing the determined category and the category matching degree for the category together with the time information of the document information in the document information storage unit.

また、本発明のキーワード検索ステップにおいて、
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、表示手段に表示するステップと、を実行させる。
In the keyword search step of the present invention,
Searching a keyword set corresponding to a plurality of periods;
Displaying a category-specific keyword set on a display means for each period;
When one period is selected from a plurality of periods, a category-specific keyword set corresponding to the selected period is acquired and displayed on the display means.

また、本発明のキーワード検索ステップにおいて、
期間が入力されると、該期間に対応するキーワード集合をキーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に表示手段に表示するステップと、を実行させる。
In the keyword search step of the present invention,
When a period is inputted, a keyword set corresponding to the period is searched from the keyword storage means;
Displaying the retrieved keyword set on the display means by category.

上述のように、本発明では、最新の情報から抽出したカテゴリ別のキーワードを提示する際に、ユーザが興味のあるキーワードを選択すると、最新かつカテゴリが限定された精度の高い文書情報を提供することが可能となる。   As described above, in the present invention, when presenting a keyword for each category extracted from the latest information, when the user selects a keyword of interest, the latest and highly accurate document information with a limited category is provided. It becomes possible.

さらに、表示する期間を選択あるいは、入力することで、期間に対応したカテゴリ別キーワードを表示し、キーワードの中から1つのキーワードを選択すると、表示した期間において最新であった過去の文書情報を精度よく提供することができる。   Furthermore, by selecting or inputting the period to be displayed, keywords for each category corresponding to the period are displayed, and when one keyword is selected from the keywords, the past document information that was the latest in the displayed period is accurately displayed. Can be provided well.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[第1の実施の形態]
図3は、本発明の第1の実施の形態における最新情報提供システムの構成を示す。
[First embodiment]
FIG. 3 shows the configuration of the latest information providing system in the first embodiment of the present invention.

同図に示す最新情報提供システムは、文書情報収集部101、カテゴリ分類部102、文書情報蓄積部103、カテゴリ情報蓄積部104、キーワード抽出部105、キーワード蓄積部106、キーワード検索部107、文書情報検索部108、提供情報生成処理部109、表示部110、入力部111を有する最新情報提供装置100と、出力装置200、入力装置300から構成される。   The latest information providing system shown in FIG. 1 includes a document information collection unit 101, a category classification unit 102, a document information storage unit 103, a category information storage unit 104, a keyword extraction unit 105, a keyword storage unit 106, a keyword search unit 107, and document information. The latest information providing apparatus 100 includes a search unit 108, a provided information generation processing unit 109, a display unit 110, and an input unit 111, an output device 200, and an input device 300.

文書情報収集部101は、インターネット等のネットワークに接続された1つ以上の情報提供サーバ(図示せず)から、新しく生成された文書情報や更新された文書情報を収集し、作成日時や更新日時などの時間情報を取得し、文書情報蓄積部103に記録する。   The document information collection unit 101 collects newly generated document information and updated document information from one or more information providing servers (not shown) connected to a network such as the Internet, and creates the creation date and the update date and time. Such time information is acquired and recorded in the document information storage unit 103.

カテゴリ分類部102は、文書情報収集部101で収集した文書情報を、予め決められたカテゴリに自動分類を行い、文書情報のカテゴリを文書情報蓄積部103に記録する。   The category classification unit 102 automatically classifies the document information collected by the document information collection unit 101 into predetermined categories, and records the document information category in the document information storage unit 103.

カテゴリ情報蓄積部104は、カテゴリ分類部102でカテゴリの自動分類を行う際に利用する学習済みパラメータやカテゴリの名前を蓄積しておく。   The category information storage unit 104 stores learned parameters and category names used when the category classification unit 102 performs automatic classification of categories.

キーワード抽出部105は、一定周期で時間情報の期間を指定して、文書情報蓄積部103から指定した期間に一致する文書情報集合を取得し、取得された文書情報集合から、カテゴリ毎に各カテゴリを特徴付けるキーワードを抽出し、指定された期間と対応付けてキーワード蓄積部106に蓄積する。   The keyword extraction unit 105 designates a period of time information at a fixed period, acquires a document information set that matches the specified period from the document information storage unit 103, and extracts each category for each category from the acquired document information set. Are extracted and stored in the keyword storage unit 106 in association with the designated period.

キーワード検索部107は、期間を入力とし、入力された期間に対応するキーワードをキーワード蓄積部106から検索し、検索結果としてカテゴリ別キーワード集合を出力する。   The keyword search unit 107 receives a period, searches the keyword storage unit 106 for a keyword corresponding to the input period, and outputs a category-specific keyword set as a search result.

文書情報検索部108は、キーワード、期間、カテゴリを入力とし、入力されたキーワードを含む文書情報で、かつ期間とカテゴリが一致する文書情報を検索し、検索結果として文書情報集合を出力する。   The document information search unit 108 receives a keyword, a period, and a category, searches for document information that includes the input keyword and that matches the period and the category, and outputs a document information set as a search result.

提供情報生成処理部109は、定期的に最新期間のカテゴリ別キーワード集合を生成する。また、表示部110に表示データを送り、表示を指示し、入力部111からユーザ入力を受け付け、ユーザ入力に応じた処理を行う。表示部110に表示を指示するデータは、カテゴリ別キーワード集合、文書情報のリスト及び文書情報である。   The provided information generation processing unit 109 periodically generates a category-specific keyword set for the latest period. Further, display data is sent to the display unit 110, display is instructed, user input is received from the input unit 111, and processing corresponding to the user input is performed. Data instructing the display unit 110 to display is a category-specific keyword set, a list of document information, and document information.

表示部110は、提供情報生成部109から表示を指示されたデータの出力装置200への表示を制御する。   The display unit 110 controls the display on the output device 200 of the data instructed to be displayed from the provision information generation unit 109.

入力部111は、入力装置300から得られたユーザからの入力を制御し、ユーザ入力を、提供情報生成処理部109に通知する。   The input unit 111 controls an input from the user obtained from the input device 300 and notifies the provided information generation processing unit 109 of the user input.

次に、図4を用いて上記の構成における動作を説明する。   Next, the operation in the above configuration will be described with reference to FIG.

図4は、本発明の第1の実施の形態における最新情報提供処理のフローチャートである。   FIG. 4 is a flowchart of the latest information providing process in the first embodiment of the present invention.

ステップ101) 文書情報収集部101は、情報提供サーバや文書情報の保存先に応じて、収集を行う周期を定めた収集スケジュールを持ち、スケジュールに従い情報提供サーバ(図示せず)に接続し、公開されている文書情報の中から、新しく作成された文書情報や更新された文書情報を収集し、時間情報を取得する。   Step 101) The document information collection unit 101 has a collection schedule in which a collection cycle is determined according to the information providing server and the storage destination of the document information, and connects to the information providing server (not shown) according to the schedule and makes it public. Newly created document information or updated document information is collected from the document information that has been created, and time information is acquired.

なお、収集の際に、作成日時や更新日時などの文書情報の属性が取得できる場合は、取得した作成日時あるいは更新日時が前回収集した時刻よりも新しい文書情報のみを収集し、作成日時あるいは更新日時を文書情報の時間情報とする。文書情報の作成日時や更新日時などの属性が取得できない場合は、前回収集した文書情報と比較し、内容に変化があった場合に今回収集した日時を時間情報とする。また、文書情報中に日時を示す文字情報、例えば、「DATE」、「LastUpdate」、「更新日時」などがあるか調べ、ある場合はその文字周辺の日時を抽出し、時間情報としてもよい。このようにして収集された文書情報や、文書情報の時間情報と共に、文書情報蓄積部103に蓄積する。   If document information attributes such as creation date and update date can be acquired at the time of collection, only the document information whose acquired creation date or update date is newer than the last collection time is collected, and the creation date or update date is updated. Let the date and time be the time information of the document information. When attributes such as the creation date and update date and time of document information cannot be acquired, the date and time collected this time are used as time information when there is a change in the contents compared with the previously collected document information. Further, it is checked whether there is character information indicating the date / time in the document information, for example, “DATE”, “LastUpdate”, “update date / time”, and if there is, the date / time around the character may be extracted and used as time information. The document information collected in this way and the time information of the document information are stored in the document information storage unit 103.

ステップ102) 次に、カテゴリ分類部102は、文書情報収集部101で収集した文書情報を、予め決められたカテゴリに自動分類を行う。文書情報の自動カテゴリ分類技術は、文献「Ueda, N. and Saito, K., “Parametric mixture models for multi-topic text," Neural Information Processing Systems 15(NIPS15),2002」に記載された従来技術を利用するものとする。   Step 102) Next, the category classification unit 102 automatically classifies the document information collected by the document information collection unit 101 into predetermined categories. The automatic categorization technology for document information is based on the conventional technology described in the literature “Ueda, N. and Saito, K.,“ Parametric mixture models for multi-topic text, ”Neural Information Processing Systems 15 (NIPS15), 2002”. Shall be used.

以下に、上記の従来技術の処理概要を簡単に説明する。まず、カテゴリが既知の文書情報集合を機械に学習させ、学習させた機械を用いて未知の文書情報がどのカテゴリに属するかを予測する。この予測処理が自動カテゴリ分類処理に該当する。   Below, the outline of the processing of the above-described prior art will be briefly described. First, a machine learns a set of document information with a known category, and a category to which unknown document information belongs is predicted using the learned machine. This prediction process corresponds to the automatic category classification process.

カテゴリ分類する各文書情報を、全文書情報集合中に出現した単語の頻度ベクトルで表す。文書情報集合に出現する単語集合W={w,…,w}、単語wが文書情報D中に出現した回数をXn,iとすると、文書情報Dの単語の頻度ベクトルは以下のように表すことができる。 Each document information to be classified into categories is represented by a frequency vector of words that appear in the entire document information set. If the word set W = {w 1 ,..., W v } appearing in the document information set and the number of times the word w i appears in the document information D n is X n, i , the word frequency vector of the document information D n Can be expressed as:

=(Xn,1,…,Xn,v
ここで、vは、文書情報中に出現した単語の総数である。
Xn = ( Xn, 1 , ..., Xn, v )
Here, v is the total number of words that appear in the document information.

カテゴリの総数をLとし、文書情報Dが属するカテゴリを示すカテゴリベクトルを
=(Yn,1,…,Yn,L
で表すこととする。ここで、Yn,kは、文書情報Dが第Kカテゴリに属するとき1の値、属さない時0の値をとる。また、各文書は少なくとも1つのカテゴリに属する。
The total number of categories is L, and the category vector indicating the category to which the document information D n belongs is Y n = (Y n, 1 ,..., Y n, L ).
It shall be expressed as Here, Y n, k takes a value of 1 when the document information D n belongs to the Kth category, and takes a value of 0 when it does not belong. Each document belongs to at least one category.

まず、カテゴリが既知の文書情報集合D={(X,Y)}(N=1〜N)からXのカテゴリがYとなるように機械に学習させる。 First, the category is known document information set D = {(X n, Y n)} (N = 1~N) category X n is to learn the machine such that Y n from.

学習によって得られるパラメータはカテゴリ蓄積部104に蓄積しておく。   Parameters obtained by learning are stored in the category storage unit 104.

次に、この機械を用いてカテゴリが未知の文書情報Dに対してXからYを求める。予測で計算されるカテゴリベクトルY=(Y*,1,…,Y*,L)のY*,kが、文書情報Dが、第Kカテゴリに属するかどうかを示す。 Next, using this machine, Y * is obtained from X * for document information D * whose category is unknown. Y *, k of the category vector Y * = (Y *, 1 ,..., Y *, L ) calculated by prediction indicates whether the document information D * belongs to the Kth category.

ステップ103) 上記で説明したカテゴリ分類技術を用い、文書情報蓄積部103から取得した文書集合の各文書情報について、カテゴリベクトルYを計算し、文書情報が属するカテゴリを決定し、図5に示すように文書情報蓄積部103に蓄積する。 Step 103) Using the category classification technique described above, the category vector Y * is calculated for each piece of document information of the document set acquired from the document information storage unit 103 to determine the category to which the document information belongs, as shown in FIG. The document information is stored in the document information storage unit 103 as described above.

ステップ104) キーワード抽出部105は、一定の周期で文書情報蓄積部103から時間情報の期間を指定し、指定した期間に一致する文書情報集合を取得し、取得された文書情報集合から、カテゴリ毎に各カテゴリを特徴付けるキーワードを抽出する。ここで、「期間」とは、開始時刻から始まり、終了時刻までを指すものとし、一定の周期毎に指定する期間は連続的に重なりのないように指定する例を説明する。   Step 104) The keyword extracting unit 105 designates a period of time information from the document information accumulating unit 103 in a certain cycle, obtains a document information set that matches the designated period, and from the obtained document information set, for each category. The keywords that characterize each category are extracted. Here, the “period” refers to the period from the start time to the end time, and an example is described in which the periods specified at regular intervals are specified so as not to overlap.

キーワード抽出部105が処理を行う一定の周期と文書情報蓄積部103から文書情報を取得する際に指定する期間を同じ時間長とし、文書情報収集部101が文書情報の収集を行う最短の周期以上の時間長とする。例えば、最短30分周期で文書情報収集部101がネットワーク上の情報配信サーバ(図示せず)から文書情報を収集できる場合、キーワード抽出部105は、30分の周期で処理を開始し、『45分前の時刻から15分前の時刻まで』、といったように30分の時間長となる期間を指定する。ここで、期間の終了時刻を15分前の時刻としたのは、文書情報収集部101及びカテゴリ分類部102の処理に要する時間が最長15分であり、文書情報蓄積部103に蓄積されている最新の情報は、15分前の時刻情報を持つ文書情報であるためである。   The fixed period in which the keyword extraction unit 105 performs processing and the period specified when the document information is acquired from the document information storage unit 103 have the same time length, and the minimum period in which the document information collection unit 101 collects the document information is longer than The length of time. For example, if the document information collection unit 101 can collect document information from an information distribution server (not shown) on the network with a minimum cycle of 30 minutes, the keyword extraction unit 105 starts processing at a cycle of 30 minutes, A period of 30 minutes in length is specified, such as “from time before minutes to time before 15 minutes”. Here, the end time of the period is set to 15 minutes before the time required for processing by the document information collection unit 101 and the category classification unit 102 is 15 minutes at the longest, and is stored in the document information storage unit 103. This is because the latest information is document information having time information of 15 minutes ago.

このように、文書情報収集部101及びカテゴリ分類部102で処理に要する十分な時間Tを予め測定しておき、キーワード抽出部105で、文書情報を収集する期間を指定する際には、終了時刻を現在の時刻よりT時間前の時刻に設定するようにする。 As described above, when the document information collection unit 101 and the category classification unit 102 measure a sufficient time T 0 required for processing in advance, and the keyword extraction unit 105 specifies the period for collecting the document information, the process ends. The time is set to a time T 0 hours before the current time.

上記のように最短の30分周期でキーワード抽出処理を行うと、最新の情報をできるだけ早くユーザに提供することが可能となる。しかし、ある程度情報をまとめてから提示したい場合は、より長い期間(例えば、1日)を設定してもよい。   If the keyword extraction process is performed in the shortest 30-minute cycle as described above, the latest information can be provided to the user as soon as possible. However, if the information is to be presented after being collected to some extent, a longer period (for example, one day) may be set.

カテゴリを特徴付けるキーワードの選択方法としては、tf−idf値を利用する方法がある。   As a method for selecting a keyword that characterizes a category, there is a method that uses a tf-idf value.

tf(term frequency)は、あるテキストにおける語の出現回数を表し、idf(inverse document frequency)は、df(document frequency:語が出現するテキストの数)の逆数で、語t、テキスト数Nの場合、次のように定義される。   tf (term frequency) represents the number of occurrences of a word in a certain text, and idf (inverse document frequency) is the inverse of df (document frequency: the number of texts in which the word appears). Is defined as follows.

idf(t)=log(N/df(t))
if-idf値は、前述のtfとidfの積をとったものであり、次のように定義され、値が大きいほど、特定のテキストにおいてのみ出現回数が多いという特性を持つ。
idf (t) = log (N / df (t))
The if-idf value is a product of the above-described tf and idf, and is defined as follows. The larger the value, the more frequently it appears in a specific text.

tf-idf(t)=tf(t)*idf(t)=tf(t)・log(N/df(t))
上記の説明において、テキストをカテゴリに置き換えてit-idf値を算出し、値の大きい上位P個の語を抽出すると、特定のカテゴリにおいてのみ出現回数の多い語(=キーワード)が抽出できる。
tf-idf (t) = tf (t) * idf (t) = tf (t) ・ log (N / df (t))
In the above description, it is possible to extract words (= keywords) having a high appearance frequency only in a specific category by calculating the it-idf value by replacing the text with the category and extracting the top P words having the largest value.

ステップ105) 抽出した複数のキーワードは、文書情報蓄積部103から文書情報を取得する際に指定した期間と共に、図6に示すようにキーワード蓄積部106に蓄積する。例えば、「2004/2/20 10:00:00〜10:29:59」という期間を指定して文書情報を取得する場合、文書IDが「00000001」と「0000002」の2文書が取得できる。取得した文書からキーワード「ヘリ墜落」701を抽出したとすると、キーワード「ヘリ墜落」と開始時刻「2004/02/20 10:00:00」702、及び終了時刻「2004/02/20 10:29:59」703とを対応させてキーワード蓄積部106に蓄積する。   Step 105) The plurality of extracted keywords are stored in the keyword storage unit 106 as shown in FIG. 6 together with the period specified when the document information is acquired from the document information storage unit 103. For example, when document information is acquired by specifying a period of “2004/2/20 10: 00: 0-10: 29: 59”, two documents with document IDs “00000001” and “0000002” can be acquired. Assuming that the keyword “heli crash” 701 is extracted from the acquired document, the keyword “heli crash”, the start time “2004/02/20 10:00:00” 702, and the end time “2004/02/20 10:29” : 59 "703 is stored in the keyword storage unit 106 in association with each other.

ステップ106) 提供情報生成処理部109は、定期的にキーワード検索部107に対して最新の期間を指定してキーワード検索を依頼し、キーワード検索部107から検索結果のカテゴリ別キーワード集合を受け取る。   Step 106) The provided information generation processing unit 109 periodically requests the keyword search unit 107 for a keyword search by specifying the latest period, and receives a keyword set classified by category from the keyword search unit 107.

ステップ107) 受け取ったカテゴリ別キーワード集合と期間とを表示部110に送り、表示部110は、提供情報生成処理部109から受け取ったカテゴリ別キーワード集合と期間を出力装置200に表示する。   Step 107) The received category keyword set and period are sent to the display unit 110, and the display unit 110 displays the category keyword set and period received from the provision information generation processing unit 109 on the output device 200.

キーワード検索部107に指定した最新の期間は、キーワード抽出部105が文書情報蓄積部103から文書情報を取得する際に指定した最新の期間とする。最新の期間は、キーワード抽出部105から提供情報生成部109に通知するように構成する。図7にカテゴリ別キーワード集合の表示例を示す。表示される内容としては、カテゴリ別キーワード集合の期間201、カテゴリの名前202、それぞれのカテゴリに属するキーワード集合203である。ここで、期間201は、「2004/2/20 10:00:00-10:30:00」と記載しているが、キーワード蓄積部106に蓄積されている期間の終了時刻は、「2004/2/20/ 10:29:59」であり、ユーザに読み易い表示を行うために、終了時刻を「10:15:00」と記載している。   The latest period specified in the keyword search unit 107 is the latest period specified when the keyword extraction unit 105 acquires document information from the document information storage unit 103. The latest period is notified from the keyword extraction unit 105 to the provision information generation unit 109. FIG. 7 shows a display example of the category keyword set. The displayed contents are a keyword set period 201 for each category, a category name 202, and a keyword set 203 belonging to each category. Here, the period 201 is described as “2004/2/20 10: 00: 00-10: 30”, but the end time of the period stored in the keyword storage unit 106 is “2004 / 2/20/10: 29: 59 ”, and the end time is described as“ 10:15:00 ”in order to provide a user-friendly display.

ステップ108) 次に、ユーザが出力装置200に表示されたキーワードの1つを入力装置300から選択する。   Step 108) Next, the user selects one of the keywords displayed on the output device 200 from the input device 300.

ステップ109) 入力部111は、ユーザにより選択されたキーワードに対応する、期間、カテゴリを取得し、キーワードと共に、提供情報生成処理部109に通知する。   Step 109) The input unit 111 acquires a period and a category corresponding to the keyword selected by the user, and notifies the provided information generation processing unit 109 together with the keyword.

ステップ110) キーワード、期間、カテゴリを通知された提供情報生成処理部109は、文書情報検索部108に、キーワード、期間、カテゴリを入力し、検索を依頼する。文書情報検索部108は、入力されたキーワード含む文書情報で、かつ期間とカテゴリが一致する文書情報を検索し、検索結果として文書情報と時間情報の集合を最新情報生成処理部109に送る。   Step 110) The provided information generation processing unit 109 notified of the keyword, period, and category inputs the keyword, period, and category to the document information search unit 108 and requests the search. The document information search unit 108 searches for document information that includes the input keyword and has the same period and category, and sends a set of document information and time information to the latest information generation processing unit 109 as a search result.

ステップ111) 検索結果を受け取った最新情報生成処理部109は、文書情報からタイトル及びキーワードを含む規定文字数以内の文を抽出し、時間情報の新しい順から並べたリストを生成し、表示部110に表示を指示し、表示部110は、出力装置200にリストを表示する。   Step 111) Upon receiving the search result, the latest information generation processing unit 109 extracts sentences within the specified number of characters including the title and keyword from the document information, generates a list arranged in the new order of the time information, and displays it on the display unit 110. Display is instructed, and the display unit 110 displays a list on the output device 200.

[第2の実施の形態]
本実施の形態では、文書情報蓄積部103にカテゴリ一致度を蓄積し、カテゴリ一致度に基づいてユーザに提供する文書リストや文書情報を制御することについて説明する。
[Second Embodiment]
In the present embodiment, a description will be given of accumulating the category matching degree in the document information accumulating unit 103 and controlling the document list and document information provided to the user based on the category matching degree.

システム構成は、前述の第1の実施の形態における図3に示すシステム構成と同様である。   The system configuration is the same as the system configuration shown in FIG. 3 in the first embodiment described above.

図8は、本発明の第2の実施の形態における最新情報提供処理のフローチャートである。以下では、図4に示した第1の実施の形態と異なる処理のみについて説明する。そのため、図4と同様の処理を行う場合には、図4におけるステップ番号を付与し、その説明を省略する。   FIG. 8 is a flowchart of the latest information providing process in the second embodiment of the present invention. In the following, only processing different from the first embodiment shown in FIG. 4 will be described. Therefore, when the same processing as that in FIG. 4 is performed, the step numbers in FIG. 4 are given and the description thereof is omitted.

ステップ202) 前述の第1の実施の形態におけるステップ102では自動分類とは、カテゴリが未知の文書情報Dに対してXからYを求める処理であることを説明した。ステップ102では、予測で計算されるカテゴリベクトルY=(Y*,1,…,Y*,L)は、文書情報Dが、第Kカテゴリに属するとき1の値、属さないとき0の値をとるように出力したが、本実施の形態では、文書情報Dが、第Kカテゴリに属する割合(=カテゴリ一致度)を次のベクトルで出力する。 Step 202) In step 102 in the first embodiment described above, automatic classification has been described as processing for obtaining Y * from X * for document information D * whose category is unknown. In step 102, the category vector Y * = (Y *, 1 ,..., Y *, L ) calculated by prediction is 1 when the document information D * belongs to the Kth category, and 0 when it does not belong. In this embodiment, the ratio of document information D * belonging to the Kth category (= category matching degree) is output as the following vector.

=(Zn,1,…,Zn,L
ここで、Zn,kは、文書情報Dの第Kカテゴリへのカテゴリ一致度を表し、Zn,k(k=1〜L)を全て加算すると、1となる。Zn,kの値が大きいほど第Kカテゴリに属する割合が高くなる。
Z n = (Z n, 1 , ..., Z n, L )
Here, Z n, k represents the degree of matching of the document information D n with the Kth category, and becomes 1 when all of Z n, k (k = 1 to L) are added. The larger the value of Zn , k, the higher the proportion belonging to the Kth category.

このカテゴリ一致度から、予め閾値を設定しておき、カテゴリ一致度が閾値以上のカテゴリを選択する。   A threshold is set in advance from this category matching degree, and a category having a category matching degree equal to or higher than the threshold is selected.

ステップ203) カテゴリ分類部102は、ステップ202で選択したカテゴリとカテゴリ一致度を、図9に示すように文書情報蓄積部103に蓄積する。   Step 203) The category classification unit 102 stores the category selected in step 202 and the category matching degree in the document information storage unit 103 as shown in FIG.

文書情報蓄積部103の第1の実施の形態における構成例である図5では、各文書情報に対応して自動分類されたカテゴリ501を蓄積しており、第2の実施の形態における構成例である図9では、カテゴリだけでなく、カテゴリ毎のカテゴリ一致度601を蓄積している点において異なる。   In FIG. 5, which is a configuration example of the document information storage unit 103 in the first embodiment, categories 501 that are automatically classified corresponding to each document information are stored, and in the configuration example in the second embodiment. FIG. 9 differs in that not only the category but also the category matching degree 601 for each category is accumulated.

ステップ210) また、最新情報生成処理部109は、ユーザがキーワードを選択した際に入力部111からキーワード、期間、カテゴリを通知されると、文書情報検索部108に、キーワード、期間、カテゴリを入力し検索を依頼する。文書情報検索部108は、入力されたキーワードを含む文書情報で、かつ、期間とカテゴリが一致する文書情報を検索し、検索結果として文書情報、時間情報、カテゴリ一致度の集合を出力し、最新情報生成処理部109に送る。   Step 210) When the user selects a keyword, the latest information generation processing unit 109 receives the keyword, period, and category from the input unit 111, and inputs the keyword, period, and category to the document information search unit 108. Then request a search. The document information search unit 108 searches for document information that includes the input keyword and whose period and category match, outputs a set of document information, time information, and category matching degree as a search result. The information is sent to the information generation processing unit 109.

ステップ211) 次に、最新情報生成処理部109は、文書情報のカテゴリ一致度を、高い順から並べたリストを生成して表示部110に表示を指示し、表示部110は出力装置200に文書情報を表示する。   Step 211) Next, the latest information generation processing unit 109 generates a list in which the category matching degrees of the document information are arranged in descending order, and instructs the display unit 110 to display the document information. Display information.

また、前述の第1の実施の形態のステップ111と同様に、文書情報の時間情報を新しい順から並べたリストを生成して表示することも可能である。   Further, similarly to step 111 of the first embodiment described above, it is also possible to generate and display a list in which time information of document information is arranged in the new order.

[第3の実施の形態]
本実施の形態では、提供情報生成蓄積部109において、複数の期間に対応するカテゴリ別キーワード集合を生成し、ユーザの指示に応じて表示する期間を変更する例を説明する。
[Third Embodiment]
In the present embodiment, an example will be described in which the provided information generation and accumulation unit 109 generates a category-specific keyword set corresponding to a plurality of periods and changes the period to be displayed according to a user instruction.

図10は、本発明の第3の実施の形態における最新情報提供処理のフローチャートである。同図において、図4のフローチャートと同一の処理を行う部分については、図4のステップ番号と同番号を付与し、その説明を省略する。   FIG. 10 is a flowchart of the latest information providing process in the third embodiment of the present invention. In the figure, the same number as the step number in FIG. 4 is assigned to the same processing as the flowchart in FIG.

ステップ301) 提供情報処理部109は、複数の連続した期間毎に、キーワード検索部107に期間を指定してキーワード検索を依頼し、キーワード検索部107から検索結果のカテゴリ別キーワード集合を受け取る。   Step 301) The provided information processing unit 109 requests the keyword search unit 107 to perform a keyword search for each of a plurality of consecutive periods, and receives a keyword set classified by category as a search result from the keyword search unit 107.

ステップ302) 受け取った複数期間のカテゴリ別キーワード集合を表示部110に送り、表示部110は、提供情報生成処理部109から受け取った複数期間のカテゴリ別キーワード集合を期間毎に出力装置200に表示する。初期表示の期間として最新の期間を指定してカテゴリ別キーワードの表示を行う。   Step 302) The received keyword set for each category for a plurality of periods is sent to the display unit 110, and the display unit 110 displays the keyword set for each category for a plurality of periods received from the provision information generation processing unit 109 on the output device 200 for each period. . Specify the latest period as the initial display period and display keywords by category.

図9は、本発明の第3の実施の形態におけるカテゴリ別キーワード集合の表示例であり、複数期間のカテゴリ別キーワード集合の表示例を示す。表示される内容としては、表示しているカテゴリ別キーワード集合の期間201、カテゴリの名前202、それぞれのカテゴリに属するキーワード集合203、期間選択用ボタン204等である。期間選択用ボタン204は、ユーザが複数の期間を選択するために使用される。   FIG. 9 is a display example of a category-specific keyword set in the third embodiment of the present invention, and shows a display example of a category-specific keyword set for a plurality of periods. The displayed contents are a period 201 of the displayed keyword set by category, a category name 202, a keyword set 203 belonging to each category, a period selection button 204, and the like. The period selection button 204 is used for the user to select a plurality of periods.

ステップ303) 次に、ユーザが出力装置200に表示されたキーワードの1つを入力装置300を介して選択する。   Step 303) Next, the user selects one of the keywords displayed on the output device 200 via the input device 300.

ステップ304) 入力部111は、表示されている期間及びユーザにより選択されたキーワードに対応するカテゴリを取得し、キーワードと共に提供情報生成処理部109に通知する。   Step 304) The input unit 111 acquires the category corresponding to the displayed period and the keyword selected by the user, and notifies the provided information generation processing unit 109 together with the keyword.

ステップ110) キーワード、期間、カテゴリを通知された提供情報生成処理部109は、文書情報検索部108にキーワード、期間、カテゴリを入力し、検索を依頼し、検索結果として、入力されたキーワードを含む文書情報で、かつ期間とカテゴリが一致する文書情報と時間情報の集合を取得する。   Step 110) The provided information generation processing unit 109 notified of the keyword, period, and category inputs the keyword, period, and category to the document information search unit 108, requests a search, and includes the input keyword as a search result. A set of document information and time information that is document information and whose period and category match is acquired.

ステップ111) 検索結果を受け取った提供情報生成処理部109は、文書情報からタイトル及びキーワードを含む規定文字数以内の文を抽出し、時間情報の新しい順から並べたリストを生成し、表示部110に表示を指示し、表示部110は、出力装置200にリストを表示する。   Step 111) Upon receiving the search result, the provided information generation processing unit 109 extracts sentences within the specified number of characters including the title and keyword from the document information, generates a list arranged in the new order of the time information, and displays it on the display unit 110. Display is instructed, and the display unit 110 displays a list on the output device 200.

なお、ここで、文書情報蓄積部103にカテゴリ一致度が含まれる場合には、前述の第2の実施の形態のステップ210,211のように、カテゴリ一致度の高い順に並べたリストや、カテゴリ一致度の最も高い文書情報を表示することも可能である。   Here, when the category information is included in the document information storage unit 103, as in steps 210 and 211 of the second embodiment described above, a list arranged in descending order of the category match or categories It is also possible to display document information having the highest degree of coincidence.

ステップ305) 次に、ユーザが出力装置200に表示された期間選択用ボタン204の1つを選択する。   Step 305) Next, the user selects one of the period selection buttons 204 displayed on the output device 200.

ステップ306) 入力部111は、選択された期間を取得し、提供情報生成処理部109に通知する。   Step 306) The input unit 111 acquires the selected period and notifies the provided information generation processing unit 109 of the selected period.

ステップ307) 期間を通知された提供情報生成処理部109は、キーワード検索部107に期間を指定してキーワード検索を依頼し、キーワード検索部107から検索結果のカテゴリ別キーワード集合を受け取る。受け取ったカテゴリ別キーワード集合と期間とを表示部110に送り、表示部110は、提供情報生成処理部109から受け取ったカテゴリ別キーワード集合と期間を出力装置200に表示する。   Step 307) The provided information generation processing unit 109 notified of the period requests the keyword search unit 107 to perform a keyword search by specifying the period, and receives a keyword set classified by category from the keyword search unit 107. The received category keyword set and period are sent to the display unit 110, and the display unit 110 displays the category keyword set and period received from the provision information generation processing unit 109 on the output device 200.

図10のフローチャートでは、複数の期間別キーワード集合を予め表示部110に送り、表示期間の変更を表示部110で処理したが、表示する1つの期間のカテゴリ別キーワード集合のみを表示部110に送り、表示するように処理してもよい。このように処理する場合、ユーザにより期間が選択された際に、入力部111から提供情報生成処理部109に選択された期間を通知し、提供情報生成処理部109は、通知された期間に対応するカテゴリ別キーワード集合を表示部110に送り、表示を指示する。   In the flowchart of FIG. 10, a plurality of keyword sets by period are sent to the display unit 110 in advance, and the change of the display period is processed by the display unit 110, but only the keyword set by category for one period to be displayed is sent to the display unit 110. , You may process so that it may display. When processing is performed in this way, when a period is selected by the user, the provided information generation processing unit 109 is notified of the selected period from the input unit 111, and the provided information generation processing unit 109 corresponds to the notified period. The keyword set for each category to be sent is sent to the display unit 110 to instruct display.

また、ユーザが期間を直接入力して、表示するカテゴリ別キーワード集合を変更させる場合について以下に説明する。   A case where the user directly inputs the period and changes the category-specific keyword set to be displayed will be described below.

ユーザが入力装置300から期間を入力すると、入力部111は、入力された期間を提供情報生成処理部109に通知する。期間を通知された提供情報生成処理部109は、キーワード検索部107に期間を入力として与える。キーワード検索部107は、期間を入力として、期間に対応するキーワード集合を検索し、提供情報生成処理部109に送る。キーワード集合を受け取った提供情報生成処理部109は、カテゴリ別キーワード集合と期間を表示部110に送り、表示部110は、カテゴリ別キーワード集合と期間を出力装置200に表示する。   When the user inputs a period from the input device 300, the input unit 111 notifies the provided information generation processing unit 109 of the input period. The provided information generation processing unit 109 notified of the period provides the keyword search unit 107 with the period as an input. The keyword search unit 107 receives a period as an input, searches for a keyword set corresponding to the period, and sends the keyword set to the provision information generation processing unit 109. The provided information generation processing unit 109 that has received the keyword set sends the keyword set by category and the period to the display unit 110, and the display unit 110 displays the keyword set by category and the period on the output device 200.

表示されたカテゴリ別キーワード集合から、ユーザがキーワードを選択すると、表示された期間において最新であり、選択されたキーワードを含む過去の文書情報のリストを表示することができる。あるいは、表示された期間において最新であり、選択されたキーワードを含むカテゴリ一致度が最も高い過去の文書情報を表示することができる。   When the user selects a keyword from the displayed category-specific keyword set, a list of past document information that is the latest in the displayed period and includes the selected keyword can be displayed. Alternatively, it is possible to display the past document information that is the latest in the displayed period and has the highest category matching degree including the selected keyword.

以下、本発明の実施例を図面と共に説明する。   Embodiments of the present invention will be described below with reference to the drawings.

本実施例では、前述の図3に示す最新情報提供装置100を最新情報提供サーバとして利用する例を示す。   In this embodiment, an example in which the latest information providing apparatus 100 shown in FIG. 3 is used as the latest information providing server will be described.

図12は、本発明の一実施例の最新情報提供システムの構成を示す。   FIG. 12 shows the configuration of the latest information providing system according to an embodiment of the present invention.

同図に示すシステムは、最新情報提供サーバ1000とクライアント端末2000、情報提供サーバ3000,4000から構成され、これらがネットワーク介して接続されている構成である。   The system shown in the figure includes a latest information providing server 1000, a client terminal 2000, and information providing servers 3000 and 4000, which are connected via a network.

最新情報提供サーバ1000と前述の最新情報提供装置100は、ほぼ図3の構成と同様であるが、提供情報生成処理部109と文書情報収集部101は、通信インタフェース部112と接続される。クライアント装置2000は、通信インタフェース部113、表示部110、入力部111、出力装置200、入力装置300を有する。   The latest information providing server 1000 and the above-described latest information providing apparatus 100 are almost the same as those in FIG. 3, but the provided information generation processing unit 109 and the document information collecting unit 101 are connected to the communication interface unit 112. The client device 2000 includes a communication interface unit 113, a display unit 110, an input unit 111, an output device 200, and an input device 300.

なお、図12において、図3と同一構成要素には同一符号を付し、その説明を省略する。   In FIG. 12, the same components as those in FIG. 3 are denoted by the same reference numerals, and the description thereof is omitted.

提供情報生成処理部109は、通信インタフェース112とクライアント端末2000の通信インタフェース部113を介して表示部110及び入力部111と、メッセージ通信を行う。最新情報提供サーバ1000の提供情報生成処理部109からクライアント端末2000の表示部110に送信されるメッセージは表示するデータを指定した表示指示メッセージである。表示するデータは1つの期間に対応するカテゴリ別キーワード集合あるいは、複数期間に対応するカテゴリ別キーワード集合、文書情報リスト、文書情報である。   The provided information generation processing unit 109 performs message communication with the display unit 110 and the input unit 111 via the communication interface 112 and the communication interface unit 113 of the client terminal 2000. The message transmitted from the provision information generation processing unit 109 of the latest information provision server 1000 to the display unit 110 of the client terminal 2000 is a display instruction message designating data to be displayed. The displayed data is a category-specific keyword set corresponding to one period, or a category-specific keyword set corresponding to a plurality of periods, a document information list, and document information.

また、クライアント端末2000の入力部111が、提供情報生成処理部109に送信するメッセージは、ユーザがクライアント端末2000の入力装置300を介して選択したキーワードと対応する期間、及びカテゴリを通知するメッセージ、ユーザが選択あるいは、入力した期間を通知するメッセージである。   In addition, the message transmitted from the input unit 111 of the client terminal 2000 to the provided information generation processing unit 109 is a message that notifies the period and category corresponding to the keyword selected by the user via the input device 300 of the client terminal 2000, This is a message notifying the period selected or input by the user.

本実施例における処理の流れは、図4のステップ107,109,111の処理、及び、図8のステップ211の処理、図10のステップ302,304、306,307の処理において、最新情報提供サーバ1000の通信インタフェース部112と、クライアント端末2000の通信インタフェース部113を介して、メッセージ通信するよう変更した処理と同様であるため、詳細な説明は省略する。   The processing flow in this embodiment is the latest information providing server in the processing in steps 107, 109, and 111 in FIG. 4, the processing in step 211 in FIG. 8, and the processing in steps 302, 304, 306, and 307 in FIG. Since it is the same as the process which changed so that message communication may be performed via the communication interface part 112 of 1000 and the communication interface part 113 of the client terminal 2000, detailed description is abbreviate | omitted.

また、本発明は、上記の実施の形態における図4、図8、図10に示すフローチャートをプログラムとして構築し、最新情報提供装置として利用されるコンピュータにインストールする、または、ネットワーク介してインストールし、当該コンピュータのCPU等の制御手段により実行することも可能である。   Further, the present invention constructs the flowcharts shown in FIG. 4, FIG. 8, and FIG. 10 in the above embodiment as a program and installs it on a computer used as the latest information providing apparatus or installs it via a network. It can also be executed by a control means such as a CPU of the computer.

また、構築されたプログラムを最新情報提供装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスクやCD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際に、コンピュータにインストールすることも可能である。   In addition, when the present invention is implemented by storing the constructed program in a hard disk device connected to a computer used as the latest information providing device, a portable storage medium such as a flexible disk or a CD-ROM, It can also be installed on a computer.

なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments and examples, and various modifications and applications can be made within the scope of the claims.

本発明は、情報提供サーバから提供される電子化された大量の文書から最新の情報を取得して提供するシステムに適用可能である。   The present invention can be applied to a system that acquires and provides the latest information from a large amount of digitized documents provided from an information providing server.

本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の第1の実施の形態における最新情報提供システムの構成図である。It is a block diagram of the newest information provision system in the 1st Embodiment of this invention. 本発明の第1の実施の形態における最新情報提供処理のフローチャートである。It is a flowchart of the newest information provision process in the 1st Embodiment of this invention. 本発明の第1の実施の形態における文書情報蓄積部の例を示す図である。It is a figure which shows the example of the document information storage part in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるキーワード蓄積部の一例を示す図である。It is a figure which shows an example of the keyword storage part in the 1st Embodiment of this invention. 本発明の第1の実施の形態におけるカテゴリ別キーワード集合の表示例である。It is a display example of the keyword set classified by category in the 1st Embodiment of this invention. 本発明の第2の実施の形態における最新情報提供処理のフローチャートである。It is a flowchart of the newest information provision process in the 2nd Embodiment of this invention. 本発明の第2の実施の形態における文書情報蓄積部の例を示す図である。It is a figure which shows the example of the document information storage part in the 2nd Embodiment of this invention. 本発明の第3の実施の形態における最新情報提供処理のフローチャートである。It is a flowchart of the newest information provision process in the 3rd Embodiment of this invention. 本発明の第3の実施の形態におけるカテゴリ別キーワード集合の表示例である。It is a display example of the keyword set classified by category in the 3rd Embodiment of this invention. 本発明の一実施例の最新情報提供システムの構成例を示す図である。It is a figure which shows the structural example of the latest information provision system of one Example of this invention.

符号の説明Explanation of symbols

100 最新情報提供装置
101 文書情報収集部
102 カテゴリ分類部
103 文書情報蓄積部、文書情報蓄積手段
104 カテゴリ情報蓄積部
105 キーワード抽出部
106 キーワード蓄積部、キーワード記憶手段
107 キーワード検索部、キーワード検索手段
108 文書情報検索部、文書情報検索手段
109 提供情報生成処理部
110 表示部、表示制御手段
111 入力部
112 通信インタフェース部
113 通信インタフェース部
200 出力装置、表示手段
201 表示中の期間
202 カテゴリの名前
203 キーワード集合
300 入力装置、入力手段
501 文書情報蓄積部のカテゴリ
601 文書情報蓄積部のカテゴリとカテゴリ一致度
1000 最新情報提供サーバ
2000 クライアント端末
3000,4000 情報提供サーバ
100 latest information providing apparatus 101 document information collecting unit 102 category classification unit 103 document information storage unit, document information storage unit 104 category information storage unit 105 keyword extraction unit 106 keyword storage unit, keyword storage unit 107 keyword search unit, keyword search unit 108 Document information retrieval unit, document information retrieval unit 109 Provided information generation processing unit 110 Display unit, display control unit 111 Input unit 112 Communication interface unit 113 Communication interface unit 200 Output device, display unit 201 Display period 202 Category name 203 Keyword Set 300 Input device, input means 501 Document information storage unit category 601 Document information storage unit category and category matching degree 1000 Latest information providing server 2000 Client terminal 3000, 4000 Information providing server

Claims (18)

最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供方法において、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出された該キーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
検索した前記文書情報を並べたリストを前記表示手段に表示する表示ステップと、
からなることを特徴とする最新情報提供方法。
In the latest information provision method that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from a document information storage unit in which time information of the category and document information is stored, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Is a keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period A document information search step for searching from the document information storage means;
A display step of displaying on the display means a list in which the retrieved document information is arranged;
The latest information providing method characterized by comprising.
文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを前記文書情報蓄積手段に蓄積する文書情報収集ステップを、前記キーワード抽出ステップの前に行う請求項1記載の最新情報提供方法。   Collecting document information, classifying the collected document information into predefined categories, and storing the category and time information of the document information in the document information storage means; The latest information providing method according to claim 1, which is performed before. 最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供方法において、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
前記文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を前記表示手段に表示する表示ステップとからなることを特徴とする最新情報提供方法。
In the latest information provision method that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display unit, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are obtained. A document information search step for searching from the document information storage means;
And displaying a list in which the document information searched in the document information search step is arranged in descending order of the category matching degree, or displaying the document information having the highest category matching degree on the display means. The latest information provision method.
文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを前記文書情報蓄積手段に蓄積する文書情報収集ステップを、前記キーワード抽出ステップの前に行い、
前記文書情報収集ステップにおいて、
収集した前記文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
前記カテゴリ一致度が閾値以上のカテゴリを、前記文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを前記文書情報の時間情報と共に、前記文書情報蓄積手段に蓄積するステップと、を行う請求項3記載の最新情報提供方法。
Collecting document information, classifying the collected document information into predefined categories, and storing the category and time information of the document information in the document information storage means; Done before,
In the document information collecting step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of the document information;
The latest information providing method according to claim 3, wherein the determined category and the category matching degree for the category are stored together with the time information of the document information in the document information storage unit.
前記キーワード検索ステップにおいて、
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を前記表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、前記表示手段に表示するステップと、を行う請求項1または、3記載の最新情報提供方法。
In the keyword search step,
Searching a keyword set corresponding to a plurality of periods;
Displaying the category-specific keyword set on the display means for each period;
The latest information provision according to claim 1 or 3, wherein when one period is selected from a plurality of periods, a keyword set classified by category corresponding to the selected period is acquired and displayed on the display means. Method.
前記キーワード検索ステップにおいて、
期間が入力されると、該期間に対応するキーワード集合を前記キーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に前記表示手段に表示するステップと、を行う請求項1または、3記載の最新情報提供方法。
In the keyword search step,
When a period is input, searching the keyword storage means for a keyword set corresponding to the period;
The latest information providing method according to claim 1 or 3, wherein the retrieved keyword set is displayed on the display means by category.
最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供装置であって、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出手段と、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索手段と、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索手段と、
検索した前記文書情報を並べたリストを前記表示手段に表示する表示制御手段と、
を有することを特徴とする最新情報提供装置。
A latest information providing device that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Keyword extracting means for storing in the keyword storage means in association with the specified period;
Keyword search means for searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period Document information search means for searching from the document information storage means;
Display control means for displaying a list of the searched document information on the display means;
A latest information providing apparatus characterized by comprising:
文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを前記文書情報蓄積手段に蓄積する文書情報収集手段を更に有する請求項7記載の最新情報提供装置。   8. The document information collecting means for collecting the document information, classifying the collected document information into a predefined category, and storing the category and the time information of the document information in the document information storing means. Latest information provider. 最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供装置であって、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出手段と、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索手段と、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索手段と、
前記文書情報検索手段で検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を前記表示手段に表示する表示制御手段と、を有することを特徴とする最新情報提供装置。
A latest information providing device that presents keywords by category extracted from the latest information,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. Keyword extracting means for storing in the keyword storage means in association with the specified period;
Keyword search means for searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on the display means by category;
When one keyword is selected from the keywords displayed on the display unit, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are obtained. Document information search means for searching from the document information storage means;
Display control means for displaying a list in which document information searched by the document information search means is arranged in descending order of category matching degree or displaying document information having the highest category matching degree on the display means. The latest information providing device characterized by this.
文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを前記文書情報蓄積手段に蓄積する文書情報収集手段を、更に有し、
前記文書情報収集手段は、
収集した前記文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出する手段と、
前記カテゴリ一致度が閾値以上のカテゴリを、前記文書情報のカテゴリに決定する手段と、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを前記文書情報の時間情報と共に、前記文書情報蓄積手段に蓄積する手段と、を有する請求項9記載の最新情報提供装置。
Document information collecting means for collecting document information, classifying the collected document information into a predefined category, and storing the category and time information of the document information in the document information storage means;
The document information collecting means includes
When classifying the collected document information into predefined categories,
Means for calculating the category match for each category;
Means for determining a category having a category matching degree equal to or higher than a threshold as a category of the document information;
The latest information providing apparatus according to claim 9, further comprising: a unit that accumulates the determined category and the category matching degree for the category together with the time information of the document information in the document information accumulation unit.
前記キーワード検索手段は、
複数の期間に対応したキーワード集合を検索する手段と、
期間毎にカテゴリ別キーワード集合を前記表示手段に表示する手段と、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、前記表示手段に表示する手段と、を有する請求項7または、9記載の最新情報提供装置。
The keyword search means
Means for searching a keyword set corresponding to a plurality of periods;
Means for displaying a category-specific keyword set on the display means for each period;
10. The latest information provision according to claim 7 or 9, further comprising means for acquiring a keyword set classified by category corresponding to the selected period and displaying it on the display means when one period is selected from a plurality of periods. apparatus.
前記キーワード検索手段は、
期間が入力されると、該期間に対応するキーワード集合を前記キーワード記憶手段から検索する手段と、
検索されたキーワード集合をカテゴリ別に前記表示手段に表示する手段と、を有する請求項7または、9記載の最新情報提供装置。
The keyword search means
When a period is input, means for retrieving a keyword set corresponding to the period from the keyword storage means;
10. The latest information providing apparatus according to claim 7 or 9, further comprising: means for displaying the retrieved keyword set by category on the display means.
最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供プログラムであって、
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、該キーワードの期間及びカテゴリを取得し、該キーワードを含む文書情報で、かつ、取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
検索した前記文書情報を並べたリストを前記表示手段に表示する表示ステップと、
を実行させることを特徴とする最新情報提供プログラム。
A latest information providing program that presents keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display means, the period and category of the keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period A document information search step for searching from the document information storage means;
A display step of displaying on the display means a list in which the retrieved document information is arranged;
The latest information provision program characterized by having executed.
文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを前記文書情報蓄積手段に蓄積する文書情報収集ステップを、前記キーワード抽出ステップの前に実行させる請求項13記載の最新情報提供プログラム。   Collecting document information, classifying the collected document information into predefined categories, and storing the category and time information of the document information in the document information storage means; 14. The latest information providing program according to claim 13, which is executed before. 最新の情報から抽出したカテゴリ別のキーワードを提示する最新情報提供プログラムであって、
コンピュータに、
カテゴリと文書情報の時間情報が記憶されている文書情報蓄積手段から期間を指定して文書情報集合を取得し、取得した該文書情報集合からカテゴリ別にキーワードを抽出し、カテゴリ別に抽出されたキーワードを、指定した期間と対応付けてキーワード記憶手段に蓄積するキーワード抽出ステップと、
前記キーワード記憶手段に蓄積された前記キーワードから最新の期間に対応したキーワードを検索し、カテゴリ別に表示手段に表示するキーワード検索ステップと、
前記表示手段に表示されたキーワードから1つのキーワードが選択されると、選択された該キーワードの期間及びカテゴリを取得し、キーワードを含む文書情報で、かつ取得した期間とカテゴリが一致する文書情報を前記文書情報蓄積手段から検索する文書情報検索ステップと、
前記文書情報検索ステップで検索された文書情報をカテゴリ一致度の高い順に並べたリストを表示する、または、該カテゴリ一致度の最も高い文書情報を前記表示手段に表示する表示ステップと、を実行させることを特徴とする最新情報提供プログラム。
A latest information providing program that presents keywords by category extracted from the latest information,
On the computer,
A document information set is acquired by specifying a period from the document information storage unit storing the time information of the category and document information, keywords are extracted from the acquired document information set by category, and the keywords extracted by category are extracted. A keyword extraction step for storing in the keyword storage means in association with the specified period;
A keyword search step of searching for keywords corresponding to the latest period from the keywords stored in the keyword storage means, and displaying them on a display means by category;
When one keyword is selected from the keywords displayed on the display unit, the period and category of the selected keyword are acquired, and the document information including the keyword and the document information whose category matches the acquired period are obtained. A document information search step for searching from the document information storage means;
Displaying a list in which the document information searched in the document information search step is arranged in descending order of category matching degree, or displaying the document information having the highest category matching degree on the display unit. The latest information providing program characterized by this.
文書情報を収集し、収集した文書情報を予め定義されたカテゴリに分類し、該カテゴリと該文書情報の時間情報とを前記文書情報蓄積手段に蓄積する文書情報収集ステップを、前記キーワード抽出ステップの前に実行させ、
前記文書情報収集ステップにおいて、
収集した前記文書情報を予め定義されたカテゴリに分類する際に、
各カテゴリのカテゴリ一致度を算出するステップと、
前記カテゴリ一致度が閾値以上のカテゴリを、前記文書情報のカテゴリに決定するステップと、
決定したカテゴリと該カテゴリに対するカテゴリ一致度とを前記文書情報の時間情報と共に、前記文書情報蓄積手段に蓄積するステップと、を実行させる請求項15記載の最新情報提供プログラム。
Collecting document information, classifying the collected document information into predefined categories, and storing the category and time information of the document information in the document information storage means; Run before,
In the document information collecting step,
When classifying the collected document information into predefined categories,
Calculating a category match for each category;
Determining a category having a category matching degree equal to or higher than a threshold as a category of the document information;
The latest information providing program according to claim 15, wherein the step of storing the determined category and the category matching degree for the category together with the time information of the document information in the document information storage unit is executed.
前記キーワード検索ステップにおいて、
複数の期間に対応したキーワード集合を検索するステップと、
期間毎にカテゴリ別キーワード集合を前記表示手段に表示するステップと、
複数の期間から1つの期間が選択されると、選択された期間に対応するカテゴリ別キーワード集合を取得し、前記表示手段に表示するステップと、を実行させる請求項13または、15記載の最新情報提供プログラム。
In the keyword search step,
Searching a keyword set corresponding to a plurality of periods;
Displaying the category-specific keyword set on the display means for each period;
16. The latest information according to claim 13 or 15, wherein, when one period is selected from a plurality of periods, the step of acquiring a category-specific keyword set corresponding to the selected period and displaying it on the display means is performed. Offer program.
前記キーワード検索ステップにおいて、
期間が入力されると、該期間に対応するキーワード集合を前記キーワード記憶手段から検索するステップと、
検索されたキーワード集合をカテゴリ別に前記表示手段に表示するステップと、を実行させる請求項13または、15記載の最新情報提供プログラム。
In the keyword search step,
When a period is input, searching the keyword storage means for a keyword set corresponding to the period;
The latest information providing program according to claim 13 or 15, wherein a step of displaying the retrieved keyword set on the display means by category is executed.
JP2004113357A 2004-04-07 2004-04-07 Latest information providing method, system, and program Pending JP2005301432A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004113357A JP2005301432A (en) 2004-04-07 2004-04-07 Latest information providing method, system, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004113357A JP2005301432A (en) 2004-04-07 2004-04-07 Latest information providing method, system, and program

Publications (1)

Publication Number Publication Date
JP2005301432A true JP2005301432A (en) 2005-10-27

Family

ID=35332928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004113357A Pending JP2005301432A (en) 2004-04-07 2004-04-07 Latest information providing method, system, and program

Country Status (1)

Country Link
JP (1) JP2005301432A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009546A (en) * 2008-06-30 2010-01-14 Equos Research Co Ltd Information processor and retrieval device
KR101271180B1 (en) 2011-04-19 2013-06-04 김용덕 Method for providing social network service through contents search of the message
JPWO2012039146A1 (en) * 2010-09-24 2014-02-03 コニカミノルタ株式会社 Inspection reservation server and inspection reservation system
JP2014132458A (en) * 2013-01-04 2014-07-17 Naver Corp Hot topic keyword related document provision system for mobile terminal apparatus, method and computer readable recording medium
JP2014222448A (en) * 2013-05-14 2014-11-27 株式会社図書館流通センター Book extraction device, book extraction method, and book extracting program
JP2018010533A (en) * 2016-07-14 2018-01-18 Necパーソナルコンピュータ株式会社 Information processing device, information processing method and program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009546A (en) * 2008-06-30 2010-01-14 Equos Research Co Ltd Information processor and retrieval device
JPWO2012039146A1 (en) * 2010-09-24 2014-02-03 コニカミノルタ株式会社 Inspection reservation server and inspection reservation system
KR101271180B1 (en) 2011-04-19 2013-06-04 김용덕 Method for providing social network service through contents search of the message
JP2014132458A (en) * 2013-01-04 2014-07-17 Naver Corp Hot topic keyword related document provision system for mobile terminal apparatus, method and computer readable recording medium
JP2014222448A (en) * 2013-05-14 2014-11-27 株式会社図書館流通センター Book extraction device, book extraction method, and book extracting program
JP2018010533A (en) * 2016-07-14 2018-01-18 Necパーソナルコンピュータ株式会社 Information processing device, information processing method and program

Similar Documents

Publication Publication Date Title
US10002189B2 (en) Method and apparatus for searching using an active ontology
JP5224868B2 (en) Information recommendation device and information recommendation method
CN105069103B (en) Method and system for APP search engine to utilize user comments
JP4757016B2 (en) Document classification program, document classification apparatus, and document classification method
US20070016581A1 (en) Category setting support method and apparatus
JP4896268B2 (en) Information retrieval method and apparatus reflecting information value
JP2020135891A (en) Methods, apparatus, devices and media for providing search suggestions
JP4453437B2 (en) Search keyword ranking method, apparatus and program
CN114254158B (en) Video generation method and device, and neural network training method and device
CN110175264A (en) Construction method, server and the computer readable storage medium of video user portrait
JP5228584B2 (en) Interest information identification system, interest information identification method, and interest information identification program
JP2007256992A (en) Content specifying method and device
JP5266975B2 (en) Personal search system, information processing apparatus, personal search method, program, and recording medium
JP4891638B2 (en) How to classify target data into categories
JP2005301432A (en) Latest information providing method, system, and program
JP2006302024A (en) Relevant document display method and program
JP2004070405A (en) Rumor information extraction device for web page
JP2000057090A (en) Method and device for presenting information by utilizing other group taste information and recording medium recording information presenting program
JP2000331020A (en) Method and device for information reference and storage medium with information reference program stored
US20050144179A1 (en) Method and apparatus for document-analysis, and computer product
JP2005267095A (en) Information display method and device, and information display program
JP2010003134A (en) Server, method, and program for recommending retrieval keyword
JP2010282402A (en) Retrieval system
JP2004102818A (en) Retrieval support method and retrieval support device
JP4860439B2 (en) Automatic question generation system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090421